Mathematical approximation
数学において、指数付き族x 1 , ..., x nの滑らかな最大値は、最大関数への滑らかな近似であり、あらゆる に対して関数 が滑らかで、族が として最大関数 に収束するようなパラメトリック関数族を意味します。滑らかな最小値の概念も同様に定義されます。多くの場合、1つの族が両方を近似します。パラメーターが正の無限大に近づくにつれて最大値、パラメーターが負の無限大に近づくにつれて最小値です。記号では、 は として、 は として近似します。この用語は、必ずしもパラメーター化された族の一部である必要はなく、最大値と同様に動作する特定の滑らかな関数に対して緩く使用されることもできます。










例
ボルツマン演算子
様々なパラメータ値における(−x, x)対xのSmoothmax。=0.5では非常に滑らかで、=8ではよりシャープになる。
パラメータ の大きな正の値に対して、次の定式は最大値関数の滑らかで微分可能な近似式となります。パラメータ の絶対値が大きい負の値に対しては、最小値を近似します。


次のプロパティがあります。
として
入力の算術平均である
として
の勾配はソフトマックスと密接に関係しており、次のように与えられる。

![{\displaystyle \nabla_{x_{i}}{\mathcal{S}}_{\alpha}(x_{1},\ldots,x_{n})={\frac{e^{\alphax_{i}}}{\sum_{j=1}^{n}e^{\alphax_{j}}}}[1+\alpha(x_{i}-{\mathcal{S}}_{\alpha}(x_{1},\ldots,x_{n}))].}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
これにより、ソフトマックス関数は、勾配降下法を使用する最適化手法に役立ちます。
この演算子はボルツマン分布にちなんでボルツマン演算子と呼ばれることもあります[1]。
対数和指数
もう1つの滑らかな最大値はLogSumExpです。

がすべて非負の場合、これを正規化して、ドメインと値域を持つ関数を生成することもできます。




この項は、1 つを除くすべてのゼロ指数をキャンセルすることによって、すべてがゼロであるという事実を修正します。




メロウマックス
メロウマックス演算子[1]は次のように定義される。

これは非拡大演算子である。 のときは最大値のように振る舞う。 のときは算術平均のように振る舞う。 のときは最小値のように振る舞う。この演算子は、準算術平均の特定の具体例として見ることができる。また、情報理論の原理から、KL情報量によって定義されるコスト関数を用いて方策を正規化する方法として導出することもできる。この演算子は、電力工学などの他の分野でも利用されてきた。[2]

LogSumExpとMellowmaxの接続
LogSumExpとMellowmaxは定数 だけ異なる同じ関数です。LogSumExpは常に真の最大値よりも大きく、n個の引数すべてが等しい場合に真の最大値との差は最大で 、1つを除くすべての引数が の場合は真の最大値と正確に等しくなります。同様に、Mellowmaxは常に真の最大値よりも小さく、1つを除くすべての引数が の場合は真の最大値との差は最大で 、n個の引数すべてが等しい場合は真の最大値と正確に等しくなります。





pノルム
もう一つの滑らかな最大値はpノルムです。

これは として収束します。


pノルムの利点は、ノルムであることです。したがって、スケール不変(同次)であり、三角不等式 を満たします。

滑らかな最大単位
次の二項演算子は平滑最大単位(SMU)と呼ばれます。[3]

ここではパラメータです。 なので、となります。




参照
参考文献
- ^ ab Asadi, Kavosh; Littman, Michael L. (2017). 「強化学習のための代替ソフトマックス演算子」. PMLR . 70 : 243–252 . arXiv : 1612.05628 . 2023年1月6日閲覧。
- ^ Safak, Aysel (1993年2月). 「相関する複数の対数正規成分のべき乗和の統計的分析」. IEEE Transactions on Vehicular Technology . 42 (1): {58–61. doi :10.1109/25.192387.
- ^ Biswas, Koushik; Kumar, Sandeep; Banerjee, Shilpak; Ashish Kumar Pandey (2021). 「SMU: スムージング最大値法を用いた深層ネットワークの滑らかな活性化関数」. arXiv : 2111.04682 [cs.LG].
https://www.johndcook.com/soft_maximum.pdf
M. Lange、D. Zühlke、O. Holz、T. Villmann、「勾配ベース学習ベクトル量子化におけるlpノルムとその滑らかな近似の応用」、Proc. ESANN、2014年4月、pp. 271-276。(https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2014-153.pdf)