宮武勇登 (大阪大学)
常微分方程式の初期値問題を陰的な数値解法で数値計算する場合
誤差は時間発展に伴い(通常)増加する傾向
(実際の計算の誤差を知るのは困難だが...)
(非)線形ソルバの収束の閾値、
時間発展に伴って変更できると効率的?
しかし
当時は構造保存数値解法に強い関心
踏み込んで考察することはなかった
(閾値は十分小さくしないと構造保存性が失われる)
さらに、「確率95%で誤差はこれくらい」というようなことがいえればベター
(精度保証とは似て非なる...イメージ)
様々なことに役立てたい
「これよりは良い!悪い!」というより、「だいたいこれくらい!」
UQ: Uncertainty Quantification
精度がすごく良いわけでもすごく悪いわけでもない計算が主なターゲット
「超高精度な計算は必要ないが,ラフ過ぎてもダメ」というシチュエーションは案外多い
例:PDEの計算,画像処理,逆問題,...
実際の計算の精度について,一定の信頼度を保って定量的評価ができれば有用
例えば逆問題の場合...
(従来型の)数値解析
数値計算のUQ
計算前に定性的評価
計算後に定量的評価
関数解析など
確率・統計
いつ評価?
主要な道具
【私見】 数値解析の一トピックとみなしてもよい気がします
常微分方程式
確率的手法
その他のトピック
Probabilistic Numerics
A free electronic version
for personal use only is available
昨年出版!
確率的でない(陽には用いない)手法
様々な動機で様々な手法が開発されていて
それぞれに利点と(大きな)欠点がある
計算の過程で確率を扱う
あとで比較したりはしますが,基本的に独立した内容です
特に微分方程式の数値計算に関連するUQの研究は...
日本では...
確率的手法
確率的でない(陽には用いない)手法
(数式が煩雑になるのでアルゴリズムの詳細は示しません)
基本的な考え方
どのように実現するか
例えば,各時刻で修正された分布(フィルタ分布)の
平均:数値解
分散:誤差の定量化
とみなす
状態空間モデル
一期先予測:
フィルタ:
(非線形モデルの場合に,線形化した行列を用いて予測・フィルタを行う手法を「拡張カルマンフィルタ」という)
\(p(\bm{x}_j\mid \bm{y}_{1:j-1})\)
\(p(\bm{x}_j\mid \bm{y}_{1:j})\)
\(\bm{x}_0 \sim \mathrm{N} (\bm{x}_{0\mid 0},V_{0\mid 0})\) : given に対して
\(\bm{x}_j \mid \bm{y}_{1:j} \sim \mathrm{N} (\bm{x}_{j\mid j},V_{j\mid j})\)
\(\bm{x}_j \mid \bm{y}_{1:j-1} \sim \mathrm{N} (\bm{x}_{j\mid j-1},V_{j\mid j-1})\)
を交互に計算
\(\bm{x}_{j\mid j-1} = F_j \bm{x}_{j-1\mid j-1}\)
\(V_{j\mid j-1} = F_j V_{j-1\mid j-1} F_j^\top + G_j Q_j G_j^\top\)
\( K_t = V_{j\mid j-1} H_j^\top (H_j V_{j\mid j-1} H_j^\top + R_j)^{-1}\)
\(\bm{x}_{j\mid j} = \bm{x}_{j\mid j-1}+K_j (\bm{y}_j - H_j \bm{x}_{j\mid j-1})\)
\(V_{j\mid j} = V_{j\mid j-1}- K_j H_j V_{j\mid j-1}\)
システムモデル
観測モデル
\(\sim \mathrm N (\bm{0},Q_j)\)
\(\sim \mathrm N (\bm{0},R_j)\)
システムモデル
観測モデル
SDE: \( \mathrm d \mathbf{X}(t)=F\mathbf{X}(t) \mathrm dt +L \mathrm d \mathbf{\omega}_t\) を離散化して
観測は常に \(\mathbf{y}_j = \bm{0}\) であるとする
拡張カルマンフィルタにおける線形化の例
\( H = E_1\), \( H = E_1 - \nabla \bm{f} (E_0 \mathbf{x}_{j\mid j-1}) E_0\)
\( \displaystyle \frac{\mathrm d\bm{x}}{\mathrm dt} = \bm{f}(\bm{x}), \quad \bm{x}(0) = \bm{x}_0 \in \mathbb{R}^d\)
相当の \(d\nu\) 次元ベクトル
\(\bm{x}^\prime \) 相当
\(\bm{x} \) 相当
システムモデル
観測モデル
SDE: \( \mathrm d \mathbf{X}(t)=F\mathbf{X}(t) \mathrm dt +L \mathrm d \mathbf{\omega}_t\) を離散化して
観測は常に \(\mathbf{y}_j = \bm{0}\) であるとする
\(\bm{x}^\prime \) 相当
\(\bm{x} \) 相当
残差の計算により \(\bm{f}\) の情報を取り込む
FitzHugh—Nagumo model
EK1(\(\nu=1\))
EK1(\(\nu=2\))
EK1(\(\nu=3\))
\(V\)
\(R\)
確率的手法
確率的でない(陽には用いない)手法
決定論的解法 + 各時間ステップごとに摂動を加える (Conrad et al., 2016)
\( \displaystyle \frac{\mathrm dx}{\mathrm dt} = f(x), \quad x(0) = x_0 \in \mathbb{R}^d\)
決定論的解法の 刻み幅 をランダムに選ぶ (Abdulle, Garegnani, 2020)
\( \Psi_h:\mathbb{R}^d\to \mathbb{R}^d\): Runge–Kutta法などの通常の一段解法 として
摂動
randomized step size
各 \(t_n\) において分布が生成される
(実際の計算では複数のサンプルによるヒストグラム)
仮定
定理
(Lie, Stuart, Sullivan 2019; Conrad et al., 2017)
仮定
局所誤差 \(\approx \mathrm{O}(h^{q+1})\)
標準偏差 \(\approx \mathrm{O}(h^{p+1/2})\)
Lorenz system
Lorenz system
\(x\)
たとえば,正規分布の場合,\(\mathrm{N}(\mathbb{0},\Sigma h^{2q+1})\) とするれば良さそうだが,
適切な \(\Sigma\) はどう選択するのか?
randomized step size
(Abdulle, Garegnani, 2020)
確率的手法
確率的でない(陽には用いない)手法
背景の(超簡略版)問題設定
最尤推定の定式化
Ideal
Reality (use approx. sol.)
観測オペレータ
観測 at \(t=t_n\)
※観測オペレータの推定
Akita, M., Furihata, 2022
Ideal
Reality (use approx. sol.)
\(\hat{\theta}_{\mathrm{ML}}\)
\(\hat{\theta}_{\mathrm{QML}}\)
バイアス: \( \mathrm{E}_{\theta} [\hat{\theta}_{\mathrm{QML}}] - \theta \neq 0\)
最小二乗誤差(mean squared error): \( \mathrm{E}_{\theta} \big[\|\hat{\theta}_{\mathrm{ML}}-\theta\|^2\big] \) vs \( \mathrm{E}_{\theta} \big[\|\hat{\theta}_{\mathrm{QML}}-\theta\|^2\big] \)
MLE
Runge–Kutta
中点則
【考察】
数値計算の精度によって,
推定の性能は大きく異りうる
仮定:真のパラメータ \(\theta^*\) は既知
実際には,例えば \(\theta\) の推定と(以下の)離散化誤差の定量化を交互に繰り返す
※ 複数の変数を同時に扱う場合は \( \mathrm{N} (0,\Sigma_n)\)
\( r_n^2 := (y_n - \widehat{x}_n)^2 \sim (\gamma^2 + \sigma_n^2)\chi_1^2\)
残差 \(=\) \((\) データ - 数値解 \()^2\) \(\sim\) \(\chi^2\)-分布 (自由度1)
(Matsuda, M., SIAM/ASA UQ, 2021)
観測 と 数値解 から「各時刻での誤差」を推定
以下の目的:
\( \xi_n = \hat{x}_n - x(t_n) \sim \mathrm{N} (0,\sigma_n^2)\)
【気持ち】 \(\sigma_n\) が誤差のスケールを反映してほしい
観測ノイズがガウシアン \( y_n \sim \mathrm{N}(x(t_n),\gamma^2)\) ならば(かつ,簡単のため 観測オペレータ \(H=\mathrm{id.}\) ならば)
データと数値解を比べるモデル → \(\sigma_1^2,\dots,\sigma_N^2\) を推定
FitzHugh–Nagumoモデル
\(V\) の誤差について
正則化
(Matsuda, M., arXiv, 2021)
【私見】
【何が難しいのか】