コンパクトな準ニュートン表現

Matrix decomposition

準ニュートン法のコンパクト表現は行列分解であり、勾配に基づく最適化アルゴリズムや非線形システムの解法に典型的に用いられます。この分解では、非線形システムの直接ヘッセ行列および／または逆ヘッセ行列、あるいはヤコビ行列に対して低ランク表現が用いられます。そのため、コンパクト表現は大規模な問題や制約付き最適化によく用いられます。

密なヘッセ近似のコンパクト行列分解 — 稠密ヘッセ近似（左）のコンパクト表現（右）は、初期行列（通常は対角行列）と低ランク分解を組み合わせたものである。メモリ使用量（網掛け部分）が小さく、効率的な行列計算を可能にする。

意味

非線形目的関数の逆ヘッセ行列または直接ヘッセ行列に対する準ニュートン行列のコンパクト表現は、階数1または階数2の再帰的な行列更新のシーケンスを、初期行列の階数または階数更新として表現する。 ^[1]^[2] これは準ニュートン更新から導出されるため、定義において反復回数と勾配の差を用いる。特に、またはに対して、長方形行列と正方対称システムはのに依存し、準ニュートン表現を定義する。 $H_{k}$ $B_{k}$ $f(x):\mathbb {R} ^{n}\to \mathbb {R}$ $k$ $2k$ $\nabla f(x_{k})=g_{k}$ $\{s_{i-1}=x_{i}-x_{i-1},y_{i-1}=g_{i}-g_{i-1}\}_{i=1}^{k}$ $r=k$ $r=2k$ $n\times r$ $U_{k},J_{k}$ $r\times r$ $M_{k},N_{k}$ $s_{i},y_{i}$

H_{k}=H_{0}+U_{k}M_{k}^{-1}U_{k}^{T},\quad {\text{ and }}\quad B_{k}=B_{0}+J_{k}N_{k}^{-1}J_{k}^{T}

アプリケーション

特殊な行列分解のため、このコンパクトな表現は最先端の最適化ソフトウェアに実装されています。^[3]^[4]^[5]^[6] メモリ制限技術と組み合わせると、勾配を伴う制約付き最適化の一般的な手法となります。^{[7]行列ベクトル}積、求解、固有値分解などの線形代数演算を効率的に実行できます。直線探索法や信頼領域法と組み合わせることができ、この表現は多くの準ニュートン更新のために開発されています。たとえば、直接準ニュートンヘッセ行列と任意のベクトルとの行列ベクトル積は次のようになります。 $g\in \mathbb {R} ^{n}$

{\begin{aligned}p_{k}^{(0)}&=J_{k}^{T}g\\{\text{solve}}\quad N_{k}p_{k}^{(1)}&=p_{k}^{(0)}\quad \quad {\text{(}}N_{k}{\text{ is small)}}\\p_{k}^{(2)}&=J_{k}p_{k}^{(1)}\\p_{k}^{(3)}&=H_{0}g\\p_{k}^{\phantom {(4)}}&=p_{k}^{(2)}+p_{k}^{(3)}\end{aligned}}

背景

GMRES法の文脈において、ウォーカー^[8]はハウスホルダー変換（恒等行列と階数1）の積がコンパクトな行列式として表現できることを示した。これにより、恒等行列と階数1の積の明示的な行列式が導出された。^[7] 具体的には、およびのとき、階数1 の更新の積から恒等行列への積はである。BFGS 更新は、の積で表現でき、コンパクトな行列式を持つ。したがって、 BFGS再帰はこれらのブロック行列表現を利用できる。 $k$ ${\textstyle S_{k}={\begin{bmatrix}s_{0}&s_{1}&\ldots s_{k-1}\end{bmatrix}},}$ $~Y_{k}={\begin{bmatrix}y_{0}&y_{1}&\ldots y_{k-1}\end{bmatrix}},$ $~(R_{k})_{ij}=s_{i-1}^{T}y_{j-1},$ $~\rho _{i-1}=1/s_{i-1}^{T}y_{i-1}$ ${\textstyle ~V_{i}=I-\rho _{i-1}y_{i-1}s_{i-1}^{T}}$ $1\leq i\leq j\leq k$ $k$ $\prod _{i=1}^{k}V_{i-1}=\left(I-\rho _{0}y_{0}s_{0}^{T}\right)\cdots \left(I-\rho _{k-1}y_{k-1}s_{k-1}^{T}\right)=I-Y_{k}R_{k}^{-1}S_{k}^{T}$ $V_{i}$

{\begin{aligned}H_{k}&=V_{k-1}H_{k-1}V_{k-1}^{T}+\rho _{k-1}s_{k-1}s_{k-1}^{T}\\&=\left(V_{k-1}\cdots V_{1}V_{0})H_{0}(V_{0}^{T}V_{1}^{T}\cdots V_{k-1}^{T}\right)+\\&{\phantom {=}}\rho _{0}\left(V_{k-1}\cdots V_{1}\right)s_{0}s_{0}^{T}\left(V_{1}^{T}\cdots V_{k-1}^{T}\right)+\\&{\phantom {=}}\quad \vdots \\&{\phantom {=}}\rho _{k-2}V_{k-1}s_{k-2}s_{k-2}^{T}V_{k-1}^{T}+\\&{\phantom {=}}\rho _{k-1}s_{k-1}s_{k-1}^{T}\end{aligned}}

1

再帰的準ニュートン更新

準ニュートン更新のパラメトリック族には、最もよく知られている公式の多くが含まれています。[ 9 ^]任意のベクトルとに対して、逆ヘッセ推定値と直接ヘッセ推定値に対する一般的な再帰更新公式は、 $v_{k}$ $c_{k}$ $v_{k}^{T}y_{k}\neq 0$ $c_{k}^{T}s_{k}\neq 0$

H_{k+1}=H_{k}+{\frac {(s_{k}-H_{k}y_{k})v_{k}^{T}+v_{k}(s_{k}-H_{k}y_{k})^{T}}{v_{k}^{T}y_{k}}}-{\frac {(s_{k}-H_{k}y_{k})^{T}y_{k}}{(v_{k}^{T}y_{k})^{2}}}v_{k}v_{k}^{T}

2

B_{k+1}=B_{k}+{\frac {(y_{k}-B_{k}s_{k})c_{k}^{T}+c_{k}(y_{k}-B_{k}s_{k})^{T}}{c_{k}^{T}s_{k}}}-{\frac {(y_{k}-B_{k}s_{k})^{T}s_{k}}{(c_{k}^{T}s_{k})^{2}}}c_{k}c_{k}^{T}

3

パラメータベクトルとよく知られた方法の特定の選択を行うことで回復される $v_{k}$ $c_{k}$

表1: ベクトルと $v_{k}$ $c_{k}$
$v_{k}$	${\text{method}}$	$c_{k}$	${\text{method}}$
$s_{k}$	BFGS	$s_{k}$	PSB（パウエル対称ブロイデン）
$y_{k}$	${\text{Greenstadt's}}$	$y_{k}$	DFP
$s_{k}-H_{k}y_{k}$	SR1	$y_{k}-B_{k}s_{k}$	SR1
		$P_{k}^{\text{S}}s_{k}$ ^[10]	MSS（多点対称セカント）

コンパクトな表現

再帰式の更新ベクトルを行列に集めて定義する。

$S_{k}={\begin{bmatrix}s_{0}&s_{1}&\ldots &s_{k-1}\end{bmatrix}},$ $Y_{k}={\begin{bmatrix}y_{0}&y_{1}&\ldots &y_{k-1}\end{bmatrix}},$ $V_{k}={\begin{bmatrix}v_{0}&v_{1}&\ldots &v_{k-1}\end{bmatrix}},$ $C_{k}={\begin{bmatrix}c_{0}&c_{1}&\ldots &c_{k-1}\end{bmatrix}},$

上三角

${\big (}R_{k}{\big )}_{ij}:={\big (}R_{k}^{\text{SY}}{\big )}_{ij}=s_{i-1}^{T}y_{j-1},\quad {\big (}R_{k}^{\text{VY}}{\big )}_{ij}=v_{i-1}^{T}y_{j-1},\quad {\big (}R_{k}^{\text{CS}}{\big )}_{ij}=c_{i-1}^{T}s_{j-1},\quad \quad {\text{ for }}1\leq i\leq j\leq k$

下三角

${\big (}L_{k}{\big )}_{ij}:={\big (}L_{k}^{\text{SY}}{\big )}_{ij}=s_{i-1}^{T}y_{j-1},\quad {\big (}L_{k}^{\text{VY}}{\big )}_{ij}=v_{i-1}^{T}y_{j-1},\quad {\big (}L_{k}^{\text{CS}}{\big )}_{ij}=c_{i-1}^{T}s_{j-1},\quad \quad {\text{ for }}1\leq j<i\leq k$

対角線

$(D_{k})_{ij}:={\big (}D_{k}^{\text{SY}}{\big )}_{ij}=s_{i-1}^{T}y_{j-1},\quad \quad {\text{ for }}1\leq i=j\leq k$

これらの定義を用いて、（２）と（３）の一般的なランク２更新（表１のよく知られた準ニュートン更新を含む）のコンパクトな表現がBrustで開発された：^[11]

$H_{k}=H_{0}+U_{k}M_{k}^{-1}U_{k}^{T},$

4

$U_{k}={\begin{bmatrix}V_{k}&S_{k}-H_{0}Y_{k}\end{bmatrix}}$

$M_{k}={\begin{bmatrix}0_{k\times k}&R_{k}^{\text{VY}}\\{\big (}R_{k}^{\text{VY}}{\big )}^{T}&R_{k}+R_{k}^{T}-(D_{k}+Y_{k}^{T}H_{0}Y_{k})\end{bmatrix}}$

そして直接ヘッセ行列の式は

$B_{k}=B_{0}+J_{k}N_{k}^{-1}J_{k}^{T},$

5

$J_{k}={\begin{bmatrix}C_{k}&Y_{k}-B_{0}S_{k}\end{bmatrix}}$

$N_{k}={\begin{bmatrix}0_{k\times k}&R_{k}^{\text{CS}}\\{\big (}R_{k}^{\text{CS}}{\big )}^{T}&R_{k}+R_{k}^{T}-(D_{k}+S_{k}^{T}B_{0}S_{k})\end{bmatrix}}$

例えば、（４）の表現が（１）のBFGS再帰の簡潔な式である場合。 $V_{k}=S_{k}$

具体的な表現

（２）と（３）のコンパクトな表現が開発される前に、ほとんどの既知の更新に対して同等の表現が発見されていた（表１参照）。

BFGS

SR1表現とともに、BFGS（ブロイデン・フレッチャー・ゴールドファーブ・シャノ）コンパクト表現は、最初に知られたコンパクト式であった。^[7]特に、逆表現は次のように与えられる。

$H_{k}=H_{0}+U_{k}M_{k}^{-1}U_{k}^{T},\quad U_{k}={\begin{bmatrix}S_{k}&H_{0}Y_{k}\end{bmatrix}},\quad M_{k}^{-1}=\left[{\begin{smallmatrix}R_{k}^{-T}(D_{k}+Y_{k}^{T}H_{0}Y_{k})R_{k}^{-1}&-R_{k}^{-T}\\-R_{k}^{-1}&0\end{smallmatrix}}\right]$ 直接ヘッセ行列の近似は、逆ヘッセ行列にシャーマン・モリソン・ウッドベリー恒等式を適用することによって求めることができます。

$B_{k}=B_{0}+J_{k}N_{k}^{-1}J_{k}^{T},\quad J_{k}={\begin{bmatrix}B_{0}S_{k}&Y_{k}\end{bmatrix}},\quad N_{k}=\left[{\begin{smallmatrix}S^{T}B_{0}S_{k}&L_{k}\\L_{k}^{T}&-D_{k}\end{smallmatrix}}\right]$

SR1

SR1（対称ランク1）コンパクト表現は^[7]で初めて提案されました。上記の定義とを用いると、逆ヘッセ行列式は次のように表されます。 $D_{k},L_{k}$ $R_{k}$

$H_{k}=H_{0}+U_{k}M_{k}^{-1}U_{k}^{T},\quad U_{k}=S_{k}-H_{0}Y_{k},\quad M_{k}=R_{k}+R_{k}^{T}-D_{k}-Y_{k}^{T}H_{0}Y_{k}$

直接ヘッセ行列はシャーマン・モリソン・ウッドベリー恒等式によって得られ、次の形をとる。

$B_{k}=B_{0}+J_{k}N_{k}^{-1}J_{k}^{T},\quad J_{k}=Y_{k}-B_{0}S_{k},\quad N_{k}=D_{k}+L_{k}+L_{k}^{T}-S_{k}^{T}B_{0}S_{k}$

写本

多点対称正割法（MSS法）は、複数の正割方程式を満たすことを目的とする手法である。再帰更新式は、もともとブルダコフによって開発された。^{[12]直接ヘッセ行列のコンパクト表現は}^[13]で導出された。

$B_{k}=B_{0}+J_{k}N_{k}^{-1}J_{k}^{T},\quad J_{k}={\begin{bmatrix}S_{k}&Y_{k}-B_{0}S_{k}\end{bmatrix}},\quad N_{k}=\left[{\begin{smallmatrix}W_{k}(S_{k}^{T}B_{0}S_{k}-(R_{k}-D_{k}+R_{k}^{T}))W_{k}&W_{k}\\W_{k}&0\end{smallmatrix}}\right]^{-1},\quad W_{k}=(S_{k}^{T}S_{k})^{-1}$

MSS行列の別の同等なコンパクト表現は、を用いて書き直すことによって導出される。^[14] 逆表現は、シャーマン・モリソン・ウッドベリー恒等式を適用することによって得られる。 $J_{k}$ $J_{k}={\begin{bmatrix}S_{k}&B_{0}Y_{k}\end{bmatrix}}$

DFP

DFP（Davidon Fletcher Powell）更新はBFGS式の双対（つまり、 BFGS更新で、とを入れ替えたもの）であるため、DFPのコンパクトな表現はBFGSの表現からすぐに得ることができる。^[15] $H_{k}\leftrightarrow B_{k}$ $H_{0}\leftrightarrow B_{0}$ $y_{k}\leftrightarrow s_{k}$

PSB

PSB（Powell-Symmetric-Broyden）コンパクト表現は、直接ヘッセ行列近似のために開発された。^[16]これは、（5）に代入することと等価である。 $C_{k}=S_{k}$

$B_{k}=B_{0}+J_{k}N_{k}^{-1}J_{k}^{T},\quad J_{k}={\begin{bmatrix}S_{k}&Y_{k}-B_{0}S_{k}\end{bmatrix}},\quad N_{k}=\left[{\begin{smallmatrix}0&R_{k}^{\text{SS}}\\(R_{k}^{\text{SS}})^{T}&R_{k}+R_{k}^{T}-(D_{k}+S_{k}^{T}B_{0}S_{k})\end{smallmatrix}}\right]$

構造化BFGS

目的関数が2つの部分に分解できる構造化最適化問題において、の勾配とヘッセ行列は既知であるがの勾配のみが既知である場合、構造化BFGS式が存在する。これらの手法の簡潔な表現は、( 5 )の一般形を持ち、具体的な値はおよびである。^[17] $f(x)={\widehat {k}}(x)+{\widehat {u}}(x)$ ${\widehat {k}}(x)$ ${\widehat {u}}(x)$ $J_{k}$ $N_{k}$

BFGSの減少

BFGSの縮約コンパクト表現（RCR）は、線形等式制約最適化のためのもので、は劣決定である。RCRは行列に加えて、の零空間への射影も格納する。 ${\text{ minimize }}f(x){\text{ subject to: }}Ax=b$ $A$ $S_{k},Y_{k}$ $y_{i}$ $A$

$Z_{k}={\begin{bmatrix}z_{0}&z_{1}&\cdots z_{k-1}\end{bmatrix}},\quad z_{i}=Py_{i},\quad P=I-A(A^{T}A)^{-1}A^{T},\quad 0\leq i\leq k-1$

BFGS行列のコンパクト表現（単位行列の倍数）に対して、逆KKT行列の（1,1）ブロックはコンパクト表現を持つ^[18] $B_{k}$ $B_{0}$

$K_{k}={\begin{bmatrix}B_{k}&A^{T}\\A&0\end{bmatrix}},\quad B_{0}={\frac {1}{\gamma _{k}}}I,\quad H_{0}=\gamma _{k}I,\quad \gamma _{k}>0$

${\big (}K_{k}^{-1}{\big )}_{11}=H_{0}+U_{k}M_{k}^{-1}U_{k}^{T},\quad U_{k}={\begin{bmatrix}A^{T}&S_{k}&Z_{k}\end{bmatrix}},\quad M_{k}=\left[{\begin{smallmatrix}-AA^{T}/\gamma _{k}&\\&G_{k}\end{smallmatrix}}\right],\quad G_{k}=\left[{\begin{smallmatrix}R_{k}^{-T}(D_{k}+Y_{k}^{T}H_{0}Y_{k})R_{k}^{-1}&-H_{0}R_{k}^{-T}\\-H_{0}R_{k}^{-1}&0\end{smallmatrix}}\right]^{-1}$

限られたメモリ

{\displaystyle m=7} — メモリ制限更新戦略におけるパターン。メモリパラメータがの場合、最初の反復処理で行列が埋められます（例えば、コンパクト表現の場合は上三角行列）。メモリ制限手法では、最も古い情報を破棄し、最後に新しい列を追加します。 $m=7$ $k\leq m$ $R_{k}={\text{triu}}(S_{k}^{T}Y_{k})$ $k>m$

コンパクト表現の最も一般的な用途は、メモリ制限の設定です。ここで、はメモリパラメータを表し、典型的な値は付近です（例、^[18]^[7]を参照）。次に、すべてのベクトルの履歴を保存する代わりに、これを最新のベクトルと、場合によってはまたはに制限します。さらに、通常、初期化は、およびとして、恒等式の適応倍数として選択されます。メモリ制限法は、多くの変数（つまり、が大きくなる可能性がある）を伴う大規模な問題でよく使用されます。このような大規模問題では、メモリ制限行列および（場合によっては）が高くて非常に細いものになります。 $m\ll n$ $m\in [5,12]$ $m$ $\{(s_{i},y_{i}\}_{i=k-m}^{k-1}$ $\{v_{i}\}_{i=k-m}^{k-1}$ $\{c_{i}\}_{i=k-m}^{k-1}$ $H_{k}^{(0)}=\gamma _{k}I$ $\gamma _{k}=y_{k-1}^{T}s_{k-1}/y_{k-1}^{T}y_{k-1}$ $B_{k}^{(0)}={\frac {1}{\gamma _{k}}}I$ $n$ $S_{k}\in \mathbb {R} ^{n\times m}$ $Y_{k}\in \mathbb {R} ^{n\times m}$ $V_{k},C_{k}$ $S_{k}={\begin{bmatrix}s_{k-l-1}&\ldots &s_{k-1}\end{bmatrix}}$ $Y_{k}={\begin{bmatrix}y_{k-l-1}&\ldots &y_{k-1}\end{bmatrix}}$

実装

オープンソース実装には以下が含まれます。

ACM TOMSアルゴリズム1030はL-SR1ソルバーを実装している^[19]^[20]
Rのoptim汎用最適化ルーチンは L-BFGS-B メソッドを使用します。
SciPyの最適化モジュールの minimize メソッドには、L-BFGS-B を使用するオプションも含まれています。
一次情報付きIPOPT

非オープンソース実装には以下が含まれます。

Artelys Knitro 非線形計画法（NLP）ソルバーはコンパクトな準ニュートン行列を使用する^[3]
L-BFGS-B（ACM TOMSアルゴリズム778）^[21]

引用文献

^ Nocedal, J.; Wright, SJ (2006). 数値最適化. Springer Series in Operations Research and Financial Engineering. Springer New York, NY. doi :10.1007/978-0-387-40065-5. ISBN 978-0-387-30303-1。
^ Brust, JJ (2018). 大規模準ニュートン信頼領域法：高精度ソルバー、稠密初期化、および拡張（博士論文）. カリフォルニア大学マーセド校.
^ ab Byrd, RH; Nocedal, J; Waltz, RA (2006). 「KNITRO: 非線形最適化のための統合パッケージ」.大規模非線形最適化. 非凸最適化とその応用. 第83巻. Di Pillo, G., Roma, M. (編) 大規模非線形最適化. 非凸最適化とその応用. 第83巻. Springer, Boston, MA. pp. 35– 59. doi :10.1007/0-387-30065-1_4. ISBN 978-0-387-30063-4。{{cite book}}: CS1 maint: location (link)
^ Zhu, C.; Byrd, RH; Lu, P.; Nocedal, J. (1997). 「アルゴリズム778: L-BFGS-B: 大規模境界制約最適化のためのFortranサブルーチン」. ACM Transactions on Mathematical Software . 23 (4): 550– 560. doi :10.1145/279232.279236.
^ Brust, J.; Burdakov, O.; Erway, J.; Marcia, R. (2022). 「アルゴリズム1030: SC-SR1: メモリ制限SR1信頼領域法のためのMATLABソフトウェア」. ACM Transactions on Mathematical Software . 48 (4): 1– 33. doi :10.1145/3550269.
^ Wächter, A.; Biegler, LT (2006). 「大規模非線形計画法のための内点フィルタ直線探索アルゴリズムの実装について」.数学プログラミング. 106 : 25–57 . doi :10.1007/s10107-004-0559-y.
^ abcde Byrd, RH; Nocedal, J.; Schnabel, RB (1994). 「準ニュートン行列の表現と限定メモリ法におけるその利用」.数理計画. 63 (4): 129– 156. doi :10.1007/BF01582063. S2CID 5581219.
^ Walker, HF (1988). 「ハウスホルダー変換を用いたGMRES法の実装」. SIAM Journal on Scientific and Statistical Computing . 9 (1): 152– 163. doi :10.1137/0909010.
^ Dennis, Jr, JE; Moré, JJ (1977). 「準ニュートン法、その動機と理論」(PDF) . SIAM Review . 19 (1): 46– 89. doi :10.1137/1019005. hdl : 1813/6056 .{{cite journal}}: CS1 maint: multiple names: authors list (link)
^ $S_{k+1}={\begin{bmatrix}s_{0}&\ldots &s_{k}\end{bmatrix}},~P_{k}^{\text{S}}=I-S_{k+1}(S_{k+1}^{T}S_{k+1})^{-1}S_{k+1}^{T}$
^ Brust, JJ (2024). 「データフィッティングのための有用なコンパクト表現」. arXiv : 2403.12206 [math.OC].
^ Burdakov, OP (1983). 「対称ヤコビ行列を持つ方程式系に対するセカント型法」.数値関数解析と最適化. 6 (2): 1– 18. doi :10.1080/01630568308816160.
^ Burdakov, OP; Martínez, JM; Pilotta, EA (2002). 「境界制約付き最適化のためのメモリ制限型マルチポイント対称セカント法」Annals of Operations Research . 117 ( 1–4 ): 51–70 . doi :10.1023/A:1021561204463.
^ Brust, JJ; Erway, JB; Marcia, RF (2024). 「多点対称正割行列を用いた形状変化信頼領域法」.最適化手法とソフトウェア. 39 (5): 990– 1007. arXiv : 2209.12057 . doi :10.1080/10556788.2023.2296441.
^ Erway, JB; Jain, V.; Marcia, RF (2013).シフト型メモリ制限DFPシステム. 2013年Asilomar Conference on Signals, Systems and Computers. IEEE. pp. 1033– 1037.
^ Kanzow, C.; Steck, D. (2023). 「大規模非凸最小化のための限定メモリ準ニュートン法の正則化」.数理計画計算. 15 (3): 417– 444. arXiv : 1911.04584 . doi : 10.1007/s12532-023-00238-4 .
^ Brust, J. J; Di, Z.; Leyffer, S.; Petra, CG (2021). 「構造化BFGS行列のコンパクト表現」.計算最適化とその応用. 80 (1): 55– 88. arXiv : 2208.00057 . doi :10.1007/s10589-021-00297-0.
^ ab Brust, J. J; Marcia, RF; Petra, CG; Saunders, MA (2022). 「縮小コンパクト表現を用いた線形等式制約による大規模最適化」. SIAM Journal on Scientific Computing . 44 (1): A103 – A127 . arXiv : 2101.11048 . Bibcode :2022SJSC...44A.103B. doi :10.1137/21M1393819.
^ 「ACMアルゴリズム集」calgo.acm.org。
^ "TOMS Alg. 1030". calgo.acm.org/1030.zip .
^ Zhu, C.; Byrd, Richard H.; Lu, Peihuang; Nocedal, Jorge (1997). 「L-BFGS-B: アルゴリズム778: L-BFGS-B, FORTRANルーチンによる大規模境界制約最適化」. ACM Transactions on Mathematical Software . 23 (4): 550– 560. doi : 10.1145/279232.279236 . S2CID 207228122.

[nw-1] Nocedal, J.; Wright, SJ (2006). 数値最適化. Springer Series in Operations Research and Financial Engineering. Springer New York, NY. doi :10.1007/978-0-387-40065-5. ISBN 978-0-387-30303-1。

[compthes-2] Brust, JJ (2018). 大規模準ニュートン信頼領域法：高精度ソルバー、稠密初期化、および拡張（博士論文）. カリフォルニア大学マーセド校.

[knitro-3] Byrd, RH; Nocedal, J; Waltz, RA (2006). 「KNITRO: 非線形最適化のための統合パッケージ」.大規模非線形最適化. 非凸最適化とその応用. 第83巻. Di Pillo, G., Roma, M. (編) 大規模非線形最適化. 非凸最適化とその応用. 第83巻. Springer, Boston, MA. pp. 35– 59. doi :10.1007/0-387-30065-1_4. ISBN 978-0-387-30063-4。{{cite book}}: CS1 maint: location (link)

[lbfgsb-4] Zhu, C.; Byrd, RH; Lu, P.; Nocedal, J. (1997). 「アルゴリズム778: L-BFGS-B: 大規模境界制約最適化のためのFortranサブルーチン」. ACM Transactions on Mathematical Software . 23 (4): 550– 560. doi :10.1145/279232.279236.

[scsr1-5] Brust, J.; Burdakov, O.; Erway, J.; Marcia, R. (2022). 「アルゴリズム1030: SC-SR1: メモリ制限SR1信頼領域法のためのMATLABソフトウェア」. ACM Transactions on Mathematical Software . 48 (4): 1– 33. doi :10.1145/3550269.

[ipopt-6] Wächter, A.; Biegler, LT (2006). 「大規模非線形計画法のための内点フィルタ直線探索アルゴリズムの実装について」.数学プログラミング. 106 : 25–57 . doi :10.1007/s10107-004-0559-y.

[compact-7] Byrd, RH; Nocedal, J.; Schnabel, RB (1994). 「準ニュートン行列の表現と限定メモリ法におけるその利用」.数理計画. 63 (4): 129– 156. doi :10.1007/BF01582063. S2CID 5581219.

[8] Walker, HF (1988). 「ハウスホルダー変換を用いたGMRES法の実装」. SIAM Journal on Scientific and Statistical Computing . 9 (1): 152– 163. doi :10.1137/0909010.

[9] Dennis, Jr, JE; Moré, JJ (1977). 「準ニュートン法、その動機と理論」(PDF) . SIAM Review . 19 (1): 46– 89. doi :10.1137/1019005. hdl : 1813/6056 .{{cite journal}}: CS1 maint: multiple names: authors list (link)

[10] $S_{k+1}={\begin{bmatrix}s_{0}&\ldots &s_{k}\end{bmatrix}},~P_{k}^{\text{S}}=I-S_{k+1}(S_{k+1}^{T}S_{k+1})^{-1}S_{k+1}^{T}$

[brust24-11] Brust, JJ (2024). 「データフィッティングのための有用なコンパクト表現」. arXiv : 2403.12206 [math.OC].

[mssoriginal-12] Burdakov, OP (1983). 「対称ヤコビ行列を持つ方程式系に対するセカント型法」.数値関数解析と最適化. 6 (2): 1– 18. doi :10.1080/01630568308816160.

[msscompact-13] Burdakov, OP; Martínez, JM; Pilotta, EA (2002). 「境界制約付き最適化のためのメモリ制限型マルチポイント対称セカント法」Annals of Operations Research . 117 ( 1–4 ): 51–70 . doi :10.1023/A:1021561204463.

[scmss-14] Brust, JJ; Erway, JB; Marcia, RF (2024). 「多点対称正割行列を用いた形状変化信頼領域法」.最適化手法とソフトウェア. 39 (5): 990– 1007. arXiv : 2209.12057 . doi :10.1080/10556788.2023.2296441.

[15] Erway, JB; Jain, V.; Marcia, RF (2013).シフト型メモリ制限DFPシステム. 2013年Asilomar Conference on Signals, Systems and Computers. IEEE. pp. 1033– 1037.

[16] Kanzow, C.; Steck, D. (2023). 「大規模非凸最小化のための限定メモリ準ニュートン法の正則化」.数理計画計算. 15 (3): 417– 444. arXiv : 1911.04584 . doi : 10.1007/s12532-023-00238-4 .

[17] Brust, J. J; Di, Z.; Leyffer, S.; Petra, CG (2021). 「構造化BFGS行列のコンパクト表現」.計算最適化とその応用. 80 (1): 55– 88. arXiv : 2208.00057 . doi :10.1007/s10589-021-00297-0.

[rcr-18] Brust, J. J; Marcia, RF; Petra, CG; Saunders, MA (2022). 「縮小コンパクト表現を用いた線形等式制約による大規模最適化」. SIAM Journal on Scientific Computing . 44 (1): A103 – A127 . arXiv : 2101.11048 . Bibcode :2022SJSC...44A.103B. doi :10.1137/21M1393819.

[19] 「ACMアルゴリズム集」calgo.acm.org。

[20] "TOMS Alg. 1030". calgo.acm.org/1030.zip .

[algo778-21] Zhu, C.; Byrd, Richard H.; Lu, Peihuang; Nocedal, Jorge (1997). 「L-BFGS-B: アルゴリズム778: L-BFGS-B, FORTRANルーチンによる大規模境界制約最適化」. ACM Transactions on Mathematical Software . 23 (4): 550– 560. doi : 10.1145/279232.279236 . S2CID 207228122.