擬凸関数

凸解析変分法という数学の分野において、擬凸関数とは、局所最小値を求めることに関して凸関数のように振る舞う関数であるが、実際には凸である必要はない関数である。非公式には、微分可能関数は、正の方向微分を持つ任意の方向において増加する場合、擬凸関数である。この性質は、近傍点だけでなく、関数の定義域全体で成立する必要がある。

正式な定義

有限次元ユークリッド空間の(空でない)凸開集合上に定義された微分可能関数を考える。この関数は、以下の性質が成り立つとき擬凸関数と呼ばれる: [ 1 ]f:XRnR{\displaystyle f:X\subseteq \mathbb {R} ^{n}\rightarrow \mathbb {R} }X{\displaystyle X}Rn{\displaystyle \mathbb {R} ^{n}}

すべての人のために×yX:f×y×0fyf×{\displaystyle x,y\in X:\quad \nabla f(x)\cdot (y-x)\geq 0\Rightarrow f(y)\geq f(x).}

同様に:

すべての人のためにx,yX:f(y)<f(x)f(x)(yx)<0.{\displaystyle x,y\in X:\quad f(y)<f(x)\Rightarrow \nabla f(x)\cdot (y-x)<0.}

ここで、の勾配次のように定義されます。f{\displaystyle \nabla f}f{\displaystyle f}f=(fx1,,fxn).{\displaystyle \nabla f=\left({\frac {\partial f}{\partial x_{1}}},\dots ,{\frac {\partial f}{\partial x_{n}}}\right).}

この定義は、ベクトル によって与えられた方向におけるの方向微分によっても表すことができることに注意されたい。これは、 が微分可能であるため、この方向微分は次のように与えられるからである。 f{\displaystyle f}v=yx{\displaystyle v=y-x}f{\displaystyle f}

fv(x)=f(x)v=f(x)(yx).{\displaystyle {\frac {\partial f}{\partial v}}(x)=\nabla f(x)\cdot v=\nabla f(x)\cdot (y-x).}

プロパティ

他のタイプの「凸性」との関係

全ての凸関数は擬凸関数ですが、その逆は成り立ちません。例えば、 は擬凸関数ですが凸関数ではありません。同様に、全ての擬凸関数は準凸関数ですが、その逆は成り立ちません。なぜなら、 は準凸関数ですが擬凸関数ではないからです。これは、図式的に次のように要約できます。 f(x)=x+x3{\displaystyle f(x)=x+x^{3}}f(x)=x3{\displaystyle f(x)=x^{3}}

凸擬凸準凸{\displaystyle \Rightarrow }{\displaystyle \Rightarrow }
関数 x^3(準凸関数だが擬凸関数ではない)と x^3 + x(擬凸関数であり、したがって準凸関数である)。どちらも凸関数ではない。
関数 x^3(準凸関数だが擬凸関数ではない)と x^3 + x(擬凸関数であり、したがって準凸関数である)。どちらも凸関数ではない。

が擬凸でないことを確認するには、 におけるその微分を考えます。が擬凸で あれば、次の式が得られます。f(x)=x3{\displaystyle f(x)=x^{3}}x=0{\displaystyle x=0}f(0)=0{\displaystyle f^{\prime }(0)=0}f(x)=x3{\displaystyle f(x)=x^{3}}

f(0)(y0)=00f(y)f(0),yR.{\displaystyle f^{\prime }(0)(y-0)=0\geq 0\Rightarrow f(y)\geq f(0),\quad \forall \,y\in \mathbb {R} .}

特に、 については真となるはずです。しかし、次の式のように、そうではありません。 y=1{\displaystyle y=-1}f(1)=(1)3=1<f(0)=0{\displaystyle f(-1)=(-1)^{3}=-1<f(0)=0}

十分な最適性条件

任意の微分可能関数に対して、フェルマーの定理の最適性の必要条件が成り立ちます。これは、領域でが局所的最小値を持つ場合、 はの停留点である必要があります(つまり、)。 f{\displaystyle f}x{\displaystyle x^{*}}x{\displaystyle x^{*}}f{\displaystyle f}f(x)=0{\displaystyle \nabla f(x^{*})=0}

擬凸性は最適化の分野で大きな関心を集めています。なぜなら、任意の擬凸関数に対して逆のことが成り立つからです。つまり、[ 2 ]が擬凸関数の停留点である場合、 は で大域的最小値を持ちます。また、この結果は(局所的だけでなく)大域的最小値を保証することにも注意してください。 x{\displaystyle x^{*}}f{\displaystyle f}f{\displaystyle f}x{\displaystyle x^{*}}

この最後の結果は凸関数にも当てはまりますが、準凸関数には当てはまりません。例えば、準凸関数を考えてみましょう。

f(x)=exx2+1+1ex.{\displaystyle f(x)={\frac {e^{x}}{x^{2}+1}}+{\frac {1}{e^{x}}}.}

この関数は擬凸関数ではありませんが、準凸関数です。また、 はの臨界点であり、 のとき、 となります。しかし、は において大域的最小値(局所的最小値さえも)を持ちません。 x=0{\displaystyle x=0}f{\displaystyle f}f(0)=0{\displaystyle f^{\prime }(0)=0}f{\displaystyle f}x=0{\displaystyle x=0}

最小値ではない臨界点を持つ準凸関数の例。
擬凸関数ではない準凸関数の例。この関数は に臨界点を持つが、これは最小値ではない。x=0{\displaystyle x=0}

最後に、擬凸関数には臨界点が存在しない場合があることに注意してください。例えば、擬凸関数 を考えてみましょう。この関数の導関数は常に正です。 f(x)=x3+x{\displaystyle f(x)=x^{3}+x}f(x)=3x2+1>0,xR{\displaystyle f^{\prime }(x)=3x^{2}+1>0,\,\forall \,x\in \mathbb {R} }

擬凸関数だが凸関数ではない関数の例は次の通りである。図は、 の場合のこの関数を示している。この例は、2つの変数に一般化できる。 f(x)=x2x2+k,k>0.{\displaystyle f(x)={\frac {x^{2}}{x^{2}+k}},\,k>0.}k=0.2{\displaystyle k=0.2}

f(x)=x2+y2x2+y2+k,k>0.{\displaystyle f(x)={\frac {x^{2}+y^{2}}{x^{2}+y^{2}+k}},\,k>0.}
凸ではない擬似凸関数: x^2 / (x^2+0.2)
凸ではない擬似凸関数。

前の例を修正すると、凸関数でも擬似凸関数でもないが、準凸関数が得られます。

f(x)=|x|p|x|p+k,k>0,p(0,1).{\displaystyle f(x)={\frac {|x|^{p}}{|x|^{p}+k}},\,k>0,\,p\in (0,1).}

図は、 の場合のこの関数を示しています。見てわかるように、この関数は凹面であるため凸関数ではなく、 で微分不可能であるため擬凸関数でもありません。 k=0.5,p=0.6{\displaystyle k=0.5,p=0.6}x=0{\displaystyle x=0}

凸関数でも擬似凸関数でもない準凸関数: {{!}}x{{!}}^0.6 / ( {{!}}x{{!}}^0.6 + 0.5 )
凸関数でも擬似凸関数でもない準凸関数。

微分不可能な関数への一般化

擬凸性の概念は、次のように微分不可能な関数に一般化することができる。[ 3 ]任意の関数が与えられたとき、上ディニ導関数を次のように定義することができる。 f:XR{\displaystyle f:X\rightarrow \mathbb {R} }f{\displaystyle f}

f+(x,u)=lim suph0+f(x+hu)f(x)h;{\displaystyle f^{+}(x,u)=\limsup _{h\to 0^{+}}{\frac {f(x+hu)-f(x)}{h}};}

ここで、u は任意の単位ベクトルである。上ディニ微分が正となる任意の方向において関数が増加する場合、その関数は擬凸関数と呼ばれる。より正確には、これは以下のように劣微分 によって特徴付けられる。 f{\displaystyle \partial f}

すべて に対して:が となる場合、すべて に対して となります。x,yX{\displaystyle x,y\in X}xf(x){\displaystyle x^{*}\in \partial f(x)}x,yx0{\displaystyle \langle x^{*},y-x\rangle \geq 0}f(x)f(z){\displaystyle f(x)\leq f(z)}z[x,y]{\displaystyle z\in [x,y]}

ここで、 はxyに隣接する線分を表します。 [x,y]{\displaystyle [x,y]}

擬凹関数とは、その負の部分が擬凸となる関数のことである。擬似線型関数とは、擬似凸関数かつ擬似凹関数である。 [ 4 ]例えば、線形分数計画問題は目的関数線形不等式制約を持つ単体法ジョージ・B・ダンツィグによるの変種によって解くことができる。 [ 5 ] [ 6 ] [ 7 ]

ベクトル値関数 が与えられた場合、より一般的な概念として-擬似凸性[ 8 ] [ 9 ]と-擬似線形性があります。ここで、古典的な擬似凸性と擬似線形性は の場合に当てはまります。 η{\displaystyle \eta }η{\displaystyle \eta }η{\displaystyle \eta }η(x,y)=yx{\displaystyle \eta (x,y)=y-x}

参照

注記

  1. ^マンガサリアン 1965
  2. ^マンガサリアン 1965
  3. ^フロウダス&パルダロス 2001
  4. ^ラプサック 1991
  5. ^ 第5章:クレイヴン、BD(1988年)分数計画法、シグマ応用数学シリーズ第4巻、ベルリン:ヘルダーマン出版社、145ページ、ISBN 3-88538-404-3. MR  0949209 .
  6. ^ Kruk, Serge; Wolkowicz, Henry (1999). 「擬似線形計画法」. SIAM Review . 41 (4): 795– 805. Bibcode : 1999SIAMR..41..795K . doi : 10.1137/S0036144598335259 . JSTOR 2653207. MR 1723002 .  
  7. ^ Mathis, Frank H .; Mathis, Lenora Jane (1995). 「病院経営のための非線形計画アルゴリズム」. SIAM Review . 37 ( 2): 230– 234. doi : 10.1137/1037046 . JSTOR 2132826. MR 1343214. S2CID 120626738 .   
  8. ^アンサリ、カムルル・ハサン、ラリタ、CS、メタ、モニカ (2013).一般化凸性、非滑らかな変分不等式、そして非滑らかな最適化. CRC Press. p. 107. ISBN 9781439868218. 2019年7月15日閲覧
  9. ^ Mishra, Shashi K.; Giorgi, Giorgio (2008). Invexity and Optimization . Springer Science & Business Media. p. 39. ISBN 9783540785613. 2019年7月15日閲覧

参考文献