Middelværdier på mangfoldigheder
Pernille E.H. Hansen
University of Copenhagen
Indhold
- Motivation
- Statistik på mangfoldigheder
- Fréchet middelværdien
- Diffusionsmiddelværdien
Middelværdi på \( \mathbb{R}^n \)
-
Eksisterer entydigt hvis \(\mathbb{E}[|Y|]<\infty \)
- Store tals lov $$ \mu_N \overset{a.s.}{\to} \mu$$
- Den centrale grænseværdisætning $$\sqrt{N}(\mu_N-\mu) \to \mathcal{N}(0,\Sigma)$$
\(X_1 ,...,X_N\overset{\text{iid}}{\sim} X \in M \rightarrow \)
\( Y :\Omega \to \mathbb{R}^n\rightarrow \)
Ikke lineære rum?
Mål:
- Udvikle statistiske begreber og metoder for ikke lineært data
- Beskrive deres opførsel (eksistens, entydighed, konsistens, osv.)
Medicinsk billedanalyse
Alzheimer's Ændringer i
Corpus Callosum (CC)
Hypotese: (AD) kan blive opdaget fra form på (CC).
Mangfoldigheder
En topologisk mangfoldighed \(M\) af dimension \( n\) er et topologisk rum der opfylder
- \( M\) er Hausdorff
- \( M \) er 2. countable
- \( M \) er lokalt homeomorf til \( \mathbb{R}^n\)
En glat mangfoldighed er udstryret med et atlas \( (U_\alpha,\varphi_\alpha )\) med glatte transitions afbildninger.
Mangfoldigheder
Til ethvert punkt \( x\in M \) findes et tangetrum \(T_xM\cong \mathbb{R}^n \).
En Riemannsk metrik er en samling af indre produkter \(\langle v,w\rangle_x \) hvor
$$ x \mapsto \langle v,w \rangle_x$$
er glat for alle \( v,w\in T_xM \)
Den nedarvede metrik på \( M \) er da
$$ dist(x,y) = \inf \{ L(\gamma) | \gamma(0)=x,\gamma(1)=y \} $$
Længden af en kurve \( \gamma:[0,1] \to M \)$$L(\gamma) = \int^1_0 || \gamma'(t) ||_{\gamma(t)}dt$$
Geodæter er lokalt længdeminimerende kurver.
Mangfoldigheder
For sandsynlighedsrum \( (\Omega, \mathcal{B}, P) \) kan vi betragte stokastiske variabel \( X: \Omega \to M \)
Afbildningen \(p_X: M\to [0,1] \) er en tæthed for \( X\) mht. volumemålet \( dM\) hvis
$$ P(x\in B) = \int_B p_X(y) d M(y)$$
for alle \( B\in \mathcal{B}(M) \).
For \( f:M \to \mathbb{R}^n \) er \(f(X):\Omega \to \mathbb{R}^n\) er reel stok. variabel, med middelværdi
$$ \mathbb{E}[f(X)] = \int f(y) p_X(y) dM(y)$$
Mangfoldigheder
Fréchet middelværdien
Middelværdien \( \mathbb{E}[X] \) af \( X: \Omega \to \mathbb{R}^n \) opfylder
Definition:
Det Riemannske center af en stok. variabel \( X:\Omega \to M\) er
Hvis \( M = \{ \mu \} \), siger vi at \( \mu\) er Fréchet middelværdien af \( X \).
Eksistens og entydighed
- Eksistens er ikke garanteret
- Entydighed er bestemt heller ikke!
Sætning [Karcher & Kendall]
Der eksisterer en entydig Karcher middelværdi i \( B = B(y,r) \subset M\), hvis \( X:\Omega \to M \) kun har masse i \( B\) og B opfylder:
- Entydige geodæter
- Begrænset krumning og radius
Estimator
For \( X_1,...,X_N\overset{\text{iid}}{\sim} X\) defineres den empiriske Fréchet funktionen
$$ F_N(y) = \frac{1}{N} \sum_{i=1}^N dist(y,X_i)^2$$
og dermed de empiriske Fréchet middelværdier
$$ E_N = \arg\min_{y\in M} F_N(y) $$
Den generaliserede centrale grænseværdisætning
På \( \mathbb{R}^m \)
smeary:
CLT \( \Rightarrow\) 0-smeary
CLT:
For \( X_1,...,X_N\overset{iid}{\sim} X \) på \( \mathbb{R}^m \) med \( \mathbb{E}[X] = \mu \) og \( \mu_N = \frac{1}{N} \sum_{i=1}^N X_i \)
På en Riemannsk mangfoldighed \( M \)
smeary
smeary
*Stephan Huckemann & Benjamin Eltzner (2018)
For \(Y_1,...Y_N \overset{iid}{\sim} Y \) på \(M \) og \(\phi: U\to \mathbb{R}^{m} \) kort med \( \mu \in U \) definerer vi $$ X_n = \phi(Y_n) - \phi(\mu) \in \mathbb{R}^m $$
Eksisterer der \( k\geq 0 \) så \( M_N \) er \( k \)-smeary?
- (Entydighed):
- (Konvergens):
- (Taylorrække): Der eksisterer
For \( X: \Omega \to M \), antag
er
smeary
med
og
På en Riemannsk mangfoldighed \( M \)
The Fréchet means
Entydig Fréchet m. \( \mu \)
og 0-smeary (CLT)
Entydig Fréchet m. \( \mu \)
og 2-smeary
Uendeligt mange m.
*Stephan Huckemann & Benjamin Eltzner (2018)
under polskifte
Magnetiske nordpolspositioner
Hvorfor opstår smearieness?
- Masse på cut locus?
- Modeksempel på 5-sfæren
- Krumningen?
- Topologien?
Mange definitioner af smearieness:
Topologisk, geometrisk, "finite sample"
Diffusions-middelværdier
Varmelednings-funktionen
En funktion $$ p:M \times M \times (0,\infty) \to (0,\infty) $$ er en varmeledningsfunktion på \( M\) hvis den opfylder
Begrænsninger
1) Eksistens
- Stochastisk komplet
- \(M\) kompakt
2) Lukket form
- Euclidiske rum
- Sfærerne
- Hyperbolske rum
Brownian motion på mangfoldigheder
For \( X_1,...,X_N \overset{iid}{\sim} X \in M \)
$$ \mu = \arg\max_{y\in M} \frac{1}{N} \ln(p(y,X_i,t))$$
mest sandsynlighed start af \( (B_t)\)
En Brownian motion på \( M \) er en Markov process \( (B_t )\) med tæthed \( p(x,y,t) \)
Diffusions \(t\)-middelværdier
Fix \(t>0\). Diffusions \(t\)-middelværdier \(E_t(X)\) af en stoc. variabel \(X: \Omega \to M\) er de værdier der minimerer log-likelihood funktionen,
$$ L_t(y) = \mathbb{E}[-\ln(p(y,X,t)]$$
Altså,
$$ E_t(X) = \arg\min_{y\in M} \mathbb{E}[-\ln(p(y,X,t)]$$
På \(\mathbb{R}^m\)?
Varmeledningsfunktionen på \(\mathbb{R}^n\) for ethvert \(t>0\) er
For \( X:\Omega \to \mathbb{R}^m \), har vi
Sfærerne
Betragt \(X: \Omega \to \mathcal{S}^m \):
For \(m\geq 2\), \(t>0\) og \(\alpha\in [0,1/2]\), hvad er diffusions \(t\)-middelværdierne?
Varmeledningsfunktionen på \(\mathcal{S}^m\) for \( m\geq 2\) og \(t>0\) er
For \(m\geq 2\) og \(t>\Lambda_{t,m}\) hvor
eksisterer \(\alpha_m(t)\) så
Fréchet middelværdierne
- \(\alpha = 0\): Entydig
- \( \alpha>0\): Uendelig mange
Diffusion \(t\)-middelværdierne
- \( \alpha \leq \alpha_m(t) \): Entydig diffusions \(t\)-middelværdi
- \( \alpha > \alpha_m(t)\) : Uendeligt mange
Derudover, \(\alpha_{m}(t) \to 1/2\) når \(t\to \infty\)
Estimator
For \( X_1,...,X_N\overset{\text{iid}}{\sim} X\) defineres den empiriske Diffusions \(t\)-funktion
$$ L_{t,N}(y) = \frac{1}{N} \sum_{i=1}^N -\ln(p(y,X_i,t))$$
og dermed de empiriske Diffusions \(t\)-middelværdier
$$ E_{t,N} = \arg\min_{y\in M} L_{t,N}(y) $$
Tilstrækkelige betingelser fra Fréchet estimatoren medfører også at \( E_{t,N} \) er en konsistent estimator!
- (Entydighed):
- (Konvergens):
- (Taylorrække): Der eksisterer
For \(t>0\) og \( X: \Omega \to M \), antag
er
smeary
med
og
For \(m\geq 2\) og \(t>\Lambda_{t,m}\) hvor
eksisterer \(\alpha_m(t)\) så
Diffusion \(t\)-middelværdierne
- \( \alpha \leq \alpha_m(t) \): Entydig diffusions \(t\)-middelværdi
- \( \alpha > \alpha_m(t)\) : Uendeligt mange
- \( \alpha < \alpha_m(t) \): 0-smeariness
- \( \alpha = \alpha_m(t)\) : 2-smearieness
under polskifte
Magnetiske nordpolspositioner
Tak for jeres opmærksomed!
Middelværdier på mangfoldigheder
By pernilleehh
Middelværdier på mangfoldigheder
- 196