Momentproblemet.
Momentproblemet.
Momentproblemet.
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Momentproblemet</strong>.<br />
Lad i dette afsnit X betegne en stokastisk variabel med momenter af enhver orden. Momentfølgen<br />
(E[X n ])n≥1 er derfor en vel defineret reel talfølge bestemt ved fordelingen, og<br />
spørgsmålet om, den omvendt bestemmer fordelingen, er kendt under navnet <strong>Momentproblemet</strong>.<br />
Korollar 1 i afsnittet Separation af endelige Borel mål viser, at dette gælder for<br />
begrænsede stokastiske variable, og som det fremgår af det udleverede fordelingskatalog<br />
gælder det for alle de kendte fordelingstyper med momenter af enhver orden pånær lognormalfordelingen.<br />
Et sådant eksempel på en vigtig fordelingstype, hvor momentfølgen<br />
ikke bestemmer fordelingen entydigt, gør det naturligvis interessant at vide, hvornår det er<br />
tilfældet. Problemet, der er blevet studeret i næsten 100 år, er stadig uløst i den forstand, at<br />
man endnu ikke er i stand til at formulere en generel nødvendig og tilstrækkelig betingelse<br />
på momentfølgen, som sikrer, at den bestemmer fordelingen. Men flg. simple tilstrækkelige<br />
betingelse er ofte brugbar.<br />
En stokastisk variabel X siges at opfylde (∗), hvis E[e ρ|X| ] < ∞ for et ρ > 0.<br />
(∗) holder klart, hvis X er begrænset, dvs. hvis P(|X| ≤ M) = 1 for et M ∈ R+, og som<br />
det fremgår af fordelingskatalogets punkt (H), er den opfyldt for en stor del af de kendte<br />
fordelingstyper. (∗) medfører klart eksistens af momenter af enhver orden, og da<br />
E[e r|X| ] =<br />
∞<br />
∑ r<br />
n=0<br />
n · E[|X| n ]/n! for alle r > 0<br />
ifølge monoton konvergens, giver potensrækketeori , at (∗) er ækvivalent med, at<br />
limsup(E[|X|<br />
n<br />
n ]/n!) 1/n < ∞ dvs. ∃ c ∈ R+ : E[|X| n ] ≤ c n · n! n ≥ 1.<br />
Begrundelsen for at (∗) er interessant ligger, som allerede indikeret, gemt i flg. resultat.<br />
Mp 1 Antag at X opfylder (∗). Momentfølgen (E[X n ])n≥1 bestemmer da fordelingen for X.<br />
Bevis. (∗) betyder specielt, at<br />
lim n ρ n · E[|X| n ]/n! = 0,<br />
og iIfølge Kf 9 kan ϕX derfor rækkeudvikles omkring ethvert punkt a med en konvergensradius,<br />
som er mindst ρ. Heraf kan resultatet nu vises, for ved først at rækkeudvikle omkring<br />
0 ses, da ϕX(0) = 1, at (E[X n ])n≥1 bestemmer ϕX og dermed alle dens afledede i intervallet<br />
] − ρ,ρ [. Ved fornyet rækkeudvikling omkring punkter tæt ved ρ og −ρ ses derfor, at dette<br />
også gælder i intervallet ] − 2ρ,2ρ [. Sådan fortsættes og momentfølgen bestemmer derfor<br />
ϕX og dermed ifølge Entydighedssætningen fordelingsmålet PX. ♦<br />
(∗) er en betingelse på de absolutte momenter, men der gælder flg. resultat.<br />
Mp 2 Lad X og Y være stokastiske variable med momenter af enhver orden, så at E[X k ] =<br />
E[Y k ] for alle k ≥ 1. Da holder (∗) for X, hvis og kun hvis (∗) holder for Y ; og i givet fald<br />
er X og Y derfor identisk fordelte.<br />
139
Bevis. Antag at X opfylder (∗), dvs. ∃c ∈ R+ : E[|X| n ] ≤ cn · n! n ≥ 1. Ifølge Cauchy-<br />
Schwarz’s gælder derfor<br />
E[|Y | n <br />
] ≤ E[Y 2n <br />
] = E[X 2n <br />
] ≤ c2n ·(2n)! = c n · (2n)!,<br />
og da (2n)! ≤ 2 n · n! for alle n ses, at Y også opfylder (∗). ♦<br />
Lad fortsat X betegne en given stokastisk variabel. Da<br />
e aX ∨ e −aX ≤ e a|X| ≤ e aX + e −aX for alle a > 0,<br />
følger det umiddelbart, at hvis R(LX) := {t ∈ R|E[e tX ] < ∞}, så gælder biimplikationen<br />
X opfylder (∗) ⇔ R(LX) indeholder et åbent interval omkring 0.<br />
R(LX) er altid et interval indeholdende 0, men kan bestå af 0 alene eller have 0 som enten<br />
venstre eller højre endepunkt. Definer<br />
MX(t) := E[e tX ] for t ∈ R(LX).<br />
MX(·) kaldes ofte den momentfrembringende funktion. Begrundelsen for dette er klar ud<br />
fra det ovenstående, for indeholder R(LX) et åbent interval af formen ] − ε,ε [, så har X<br />
momenter af enhver orden og<br />
MX(t) =<br />
∞ E[X<br />
∑<br />
n=1<br />
n ]<br />
·t<br />
n!<br />
n<br />
for |t| < ε.<br />
Ifølge potensrækketeori er t ↦→ MX(t) derfor uendelig ofte differentiabel i 0 med<br />
Alt i alt viser dette<br />
M (n)<br />
X (0) = E[X n ] n ≥ 1.<br />
Mp 3 Lad X og Y være stokastiske variable. Fordelingen for X er entydig bestemt ved MX,<br />
hvis denne er endelig i et åbent interval omkring 0, og X og Y er identisk fordelte, hvis<br />
MX(t) = MY(t) < ∞ for alle t i et åbent interval omkring 0.<br />
Bemærkning. Da momenterne er bestemt som afledede i punktet 0, kan man forholdsvis<br />
nemt vise, at det er nok, at R(LX) og R(LY) begge indeholder et åbent interval omkring 0,<br />
og MX(tn) = MY(tn) for en følge (tn)n≥1, som konvergerer mod 0.<br />
Et såkaldt ’målskifte’ argument viser, at Mp 3 gælder uændret for ethvert interval, dvs.<br />
Mp 3a Stokastiske variable X og Y er identisk fordelte, hvis MX(t) = MY(t) < ∞ for alle t i<br />
et åbent interval.<br />
’Bevis’. Antag MX(t) = MY(t) < ∞ for alle t ∈]λ1,λ2[, hvor λ1 < λ2. Lad for et λ0 ∈<br />
]λ1,λ2[ QX og QY betegne sandsynlighedsmålene på (Ω,F) givet ved<br />
QX := a · e λ0X dP og QY := a · e λ0Y dP, hvor a −1 = E[e λ0X ] = E[e λ0Y ],<br />
140
og lad M Q<br />
X<br />
og MQ<br />
Y betegne de momentfrembringende funktioner for X under QX og Y under<br />
QY . Reglerne for integration med hensyn til afledte mål viser, at M Q<br />
X<br />
og MQ<br />
Y<br />
er endelige<br />
og ens i intervallet ]λ1 − λ0,λ2 − λ0[. Da dette interval indeholder 0, følger af Mp 2 at<br />
QX ◦ X −1 = QY ◦Y −1 . Specielt er<br />
E[ f(X) · e λ0X ] = a −1 · E QX [ f(X)] = a −1 · E QY [ f(Y)] = E[ f(Y) · e λ0Y ]<br />
og dermed E[ f(X)] = E[ f(Y)] for alle kontinuerte funktioner f med kompakt støtte, hvilket<br />
kun er muligt, hvis X og Y har samme fordeling. ♦<br />
141
Den flerdimensionale normalfordeling.<br />
Som en simpel konsekvens af entydighedssætningen og regneregler for karakteristiske funktioner<br />
genfinder vi flg. vel kendte egenskab ved klassen af en-dimensionale normalfordelinger.<br />
Hvis X1,...,Xn er uafhængige normalfordelte stokastiske variable, er ∑ n i=1 aiXi igen normalfordelt<br />
for ethvert valg af reelle konstanter a1,...an.<br />
Med udgangspunkt heri indføres flg. flerdimensionale fordelingsklasse.<br />
Definition. En n-dimensional stokastisk vektor X siges at være n-dimensional normalfordelt,<br />
hvis<br />
t · X =<br />
er normalfordelt for alle t = (t1,...,tn) ∈ R n .<br />
n<br />
∑ ti Xi<br />
i=1<br />
Vælges t som en passende enhedsvektor ses, at alle koordinatvariable i en flerdimensional<br />
normalfordeling X er en-dimensionale normalfordelinger, dvs. de har både middelværdi og<br />
varians. Middelværdivektoren og kovariansmatricen<br />
μX := (E[X1],...,E[Xn]) og σ X := {Cov(Xi,Xj)}1≤i, j≤n<br />
er derfor vel definerede, og som i det en-dimensionale tilfælde er en n-dimensional normalfordeling<br />
bestemt ved sin tilhørende middelværdivektor og kovariansmatrice. Der gælder<br />
nemlig flg. resultat.<br />
N 1 Hvis X og Y er n-dimensional normalfordelt med μX = μY og σ X = σ Y , så er ϕX = ϕY ,<br />
dvs. X og Y er identiske fordelte.<br />
Bevis. Lad t ∈ R n være givet. Da t · X og t ·Y begge er normalfordelte stokastiske variable,<br />
er de identisk fordelte, da<br />
og<br />
Dvs. for t ∈ R n er<br />
E[t · X] = t · μX = t · μY = E[t ·Y]<br />
Var(t · X) = ∑ ti σ (i, j)t<br />
X<br />
j = ∑ ti σ (i, j)t<br />
Y<br />
j = Var(t ·Y).<br />
1≤i, j≤n<br />
1≤i, j≤n<br />
ϕX(t) = E[exp(i(t · X))] = E[exp(i(t ·Y))] = ϕY(t),<br />
hvilket ifølge Entydighedssætningen for karakteristiske funktioner betyder, at X ∼ Y . ♦<br />
Det har altså mening, at tale om den n-dimensionale normalfordeling med middelværdi vektor<br />
μ og kovariansmatrice σ, og vi vil i denne forbindelse skrive<br />
X ∼ Nn(μ,σ),<br />
hvis X er n-dimensional normalfordelt med μX = μ og σ X = σ.<br />
142
Flg. vigtige egenskaber ved flerdimensionale normalfordelinger er nu åbenbare. Som det er<br />
sædvane bruges ’samme’ notation for den lineære afbildning og den tilhørende matrice udregnet<br />
i hht. den kanoniske basis. Kovariansmatrice formlen forudsætter, at vektorerne i R n<br />
opfattes som søjlevektorer.<br />
N 2 Klassen af flerdimensionale normalfordelinger er stabil under affine transformationer,<br />
dvs. hvis X ∼ Nn(μ,σ) og T : R n → R m lineær, så er<br />
Y := y+T(X) ∼ Nm(y+T(μ), T · σ · T t )<br />
for ethvert y ∈ R m . Specielt er Y ∼ Nm(y,T · T t ), hvis X ∼ Nn(0,In).<br />
Bevis. Da enhver linearkombination af koordinaterne i Y er en affin linearkombination af<br />
koordinaterne i X, er Y m-dimensionalt normalfordelt. Resten følger nu ved beregning af<br />
den tilhørende middelværdivektor og kovariansmatrice. ♦<br />
Entydighedssætningen for karakteristiske funktioner viser sammen med N 1 og N 2 umiddelbart<br />
flg. karakterisation af den n-dimensionale normalfordeling.<br />
N 3<br />
<br />
X ∼ Nn(μ,σ) ⇔ ϕX(t) = exp i(t · μ) − 1/2 ·t · σ ·t t<br />
t ∈ R n .<br />
Dette gør det let at vise, at uafhængighed og ukorellerethed er det samme for simultant<br />
normal fordelte variable. For ved gentagen anvendelse af Kf 6, dvs. ækvivalensen mellem<br />
uafhængighed og faktorisering af den karakteristiske funktion, ses flg. resultat at holde. Detaljerne<br />
overlades til læseren.<br />
N 4 Hvis Z er en flerdimensional normalfordelt stokastisk vektor, er vilkårlige marginaler<br />
(Zn1 ,...Znk ) og (Zm1 ,...Zml ) uafhængige hvis og kun hvis<br />
Cov(Zni ,Zm j ) = 0 for alle i = 1,...,k og j = 1,...,l.<br />
Hvis X ∼ Nn(μ 1 ,σ 1 ) og Y ∼ Nm(μ 2 ,σ 2 ) er uafhængige, er (X,Y) ∼ Nn+m(μ,σ), hvor<br />
<br />
σ 0<br />
μ = (μ , μ ) og σ = 1<br />
1 2 0 σ .<br />
2<br />
Korollar X = (X1,...Xn) ∼ Nn(0,I n ) hvis og kun hvis X1,...Xn er uafhængige N(0,1)-fordelte<br />
stokastiske variable. ( I n betegner her n × n enhedsmatricen.)<br />
Ikke alle men dog de vigtigste flerdimensionale normalfordelinger er absolut kontinuerte.<br />
Mere præcist gælder.<br />
N 5 X ∼ Nn(μ,σ) er absolut kontinuert, hvis og kun hvis σ er invertibel, og i givet fald er en<br />
tæthed givet ved<br />
1<br />
x ↦→ <br />
(2π) n <br />
exp<br />
detσ<br />
− 1<br />
2 ∑ (xi − μi)σ<br />
1≤i, j≤n<br />
−1 <br />
(i, j)(x j − μ j) x ∈ R n .<br />
143
Bevis. Hvis σ ikke er invertibel, findes der et t ∈ R n \ {0}, så at<br />
Var(t · X) = t · σ ·t t = 0.<br />
Der findes derfor en konstant c ∈ R, så t · X = c P-n.o. D.v.s.<br />
P(X ∈ A(t,c)) = 1, hvor A(t,c) = {x ∈ R n |t · x = c},<br />
hvilket er uforeneligt med absolut kontinuitet, da ethvert ægte affint underrum i R n har<br />
Lebesgue mål 0.<br />
Hvis omvendt σ er invertibel, kan den ifølge vel kendt teori skrives på formen<br />
og ifølge N 2 gælder derfor<br />
σ = T · I n · T t<br />
for T : R n → R n lineær bijektion,<br />
X ∼ μ + T(U) hvor U ∼ Nn(0,I n ).<br />
Resten følger nu som tidligere vist af den lineære transformationssætning, for da koordinatvariablene<br />
U1,...,Un i U er uafhængige N(0,1)-variable, har U tæthed<br />
x ↦→ (2π) −n/2 exp(−x 2 /2) = (2π) −n/2 exp(− 1<br />
2<br />
n<br />
∑<br />
i=1<br />
x 2 i<br />
). ♦<br />
Lad mig slutte med uden bevis at nævne flg. resultat angående betingede fordelinger. (Se<br />
afsnittet om betingede middelværdier for ikke forklaret notation.) Vi betragter kun det to -<br />
dimensionale tilfælde, men der gælder et helt tilsvarende udsagn i højere dimensioner.<br />
N 6 Lad (X,Y) være to -dimensionalt normalt fordelt, så at Y ikke er konstant. Da gælder<br />
for alle y ∈ R, at under det betingede mål givet Y = y, er<br />
X ∼ N(μX + σX,Y/σ 2 Y ·(y − μY),σ 2 X − σ 2 X,Y/σ 2 Y),<br />
hvor μX, μY, σ 2 X og σ 2 Y er middelværdi og varians for X og Y , og σX,Y er kovariansen mellem<br />
dem.<br />
144
Maksimal Uligheder.<br />
Ottaviani’s Ulighed.<br />
Lad X1,...,Xn betegne uafhængige stokastiske variable. Sæt<br />
Da gælder for alle reelle tal x og y<br />
Mn = max<br />
1≤ j≤n |S j| hvor Sk = X1 + ···+Xk 1 ≤ k ≤ n.<br />
P(Mn > x+y) · min<br />
1≤ j≤n P(|Sn − S j| ≤ y) ≤ P(|Sn| > x),<br />
Bevis. Da uligheden er triviel, hvis enten x eller y er negativ, lader vi x,y ≥ 0 være givet. Sæt<br />
D1 = {|S1| > x+y} og D j = {|S j| > x+y, |S1| ≤ x+y,...,|S j−1| ≤ x+y} j ≥ 2.<br />
Da D j’erne er disjunkte og {Mn > x+y} = n j=1 D j, er<br />
P(Mn > x+y) =<br />
For ethvert j fås endvidere af trekantsuligheden at<br />
n<br />
∑ P(D j).<br />
j=1<br />
{|S j| > x+y} ⊆ {|Sn|+|Sn − S j| > x+y} ⊆ {|Sn| > x} ∪ {|Sn − S j| > y}.<br />
Heraf følger, da (X1,...,Xj) og dermed D j og |Sn − S j| er uafhængige, at<br />
P(Mn > x+y) ≤<br />
≤<br />
hvoraf resultatet følger, da<br />
Korollar 1 For alle p > 0 er<br />
n <br />
∑ P({|Sn| > x} ∩ D j)+P({|Sn − S j| > y} ∩ D j)<br />
j=1<br />
<br />
n <br />
∑ P({|Sn| > x} ∩ D j)+P(|Sn − S j| > y) · P(D j)<br />
j=1<br />
<br />
≤ P(|Sn| > x)+ max<br />
1≤ j≤n P(|Sn − S j| > y) · P(Mn > x+y),<br />
1 − max<br />
1≤ j≤n P(|Sn − S j| > y) = min<br />
1≤ j≤n P(|Sn − S j| ≤ y).<br />
E[M p n] ≤ 2 p+1 (1+2 p+1 ) · max<br />
1≤ j≤n E[|S j| p ].<br />
Bevis. Lad p > 0 være givet og antag uden tab af generalitet, at<br />
mn := max<br />
1≤ j≤n E[|S j| p ] < ∞.<br />
145
For τ := (2 p+1 · mn) 1/p gælder ifølge Markov’s Ulighed<br />
P(|Sn − S j| > τ) ≤ E[|Sn − S j| p ]/τ p ≤ 2 p−1 (E[|Sn| p ]+E[|S j| p )/τ p ≤ 2 p · mn/τ p = 1/2<br />
og dermed<br />
Dvs.<br />
min<br />
1≤ j≤n P(|Sn − S j| ≤ τ) ≥ 1 − 1/2 = 1/2.<br />
P(Mn > x) = P(Mn > (x − τ)+τ) ≤ 2 · P(|Sn| > x − τ) = 2 · P(|Sn|+τ > x)<br />
for alle x > 0 og ved integration derfor<br />
E[M p n ] ≤ 2 · E[(|Sn|+τ) p ] ≤ 2 p · E[|Sn| p + τ p ] ≤ 2 p+1 (1+2 p+1 ) · mn. ♦<br />
Hvis Xi’erne yderligere alle har middelværdi 0, og S j og Sn − S j for 1 ≤ j ≤ n derfor er<br />
uafhængige og centrerede variable, viser uligheden<br />
E[|Sn − S j| p ] ≤ E[|Sn − S j + S j| p ] = E[|Sn| p ] for 1 ≤ j ≤ n og p ≥ 1<br />
og et tilsvarende argument, at der gælder<br />
Korollar 2 Hvis E[Xi] = 0 for alle i ≥ 1 er<br />
E[M p n ] ≤ 3 · 2p · E[|Sn| p ] for p ≥ 1.<br />
Det er værd at bemærke, at konstanterne i Korollar 1 og 2 kun afhænger af p. De angivne<br />
værdier er på ingen måde optimale, dvs. mindst mulige.<br />
Ottaviani’s Ulighed gælder for alle sæt af uafhængige stokastiske variable, men er variablene<br />
yderligere symmetriske, dvs. X ∼ −X, gælder med samme notation flg. mere præcise resultat.<br />
Lévy’s Ulighed.<br />
Lad X1,...,Xn betegne uafhængige symmetriske stokastiske variable. Da er<br />
P(Mn > t) ≤ 2 · P(|Sn| > t) for alle t > 0,<br />
og dermed E[M p n] ≤ 2 · E[|Sn| p ] for alle p > 0.<br />
Bevis. Lad t > 0 være givet. Sæt igen<br />
D1 = {|S1| > t} og D j = {|S j| > x,|S1| ≤ t,...,|S j−1| ≤ t} j ≥ 2.<br />
Da D j’erne er disjunkte gælder som ovenfor<br />
P(Mn > t) =<br />
≤<br />
n<br />
∑ P(|S j| > t,Dj) =<br />
j=1<br />
n<br />
∑ P(|Sn + S<br />
j=1<br />
j n | > 2t,Dj)<br />
n<br />
n<br />
∑ P(|Sn| > t,Dj)+ ∑ P(|S<br />
j=1<br />
j=1<br />
j n | > t,Dj),<br />
146
hvor<br />
S j n := X1 + ···+Xj −(Xj+1 + ···+Xn).<br />
Men da Xi’erne er symmetriske og uafhængige, er<br />
og dermed specielt<br />
Indsættes dette ovenfor fås<br />
(X1,...,Xn) ∼ (X1,...,Xj,−Xj+1,...,−Xn) for alle j,<br />
P(|Sn| > t,Dj) = P(|S j n | > t,Dj) for alle j.<br />
P(Mn > t) ≤ 2<br />
n<br />
∑ P(|Sn| > t,Dj) ≤ 2 · P(|Sn| > t). ♦<br />
j=1<br />
147
De store tals love I.<br />
Betegnelsen De store tals love dækker over et utal af resultater angående den asymptotiske<br />
opførsel af empiriske gennemsnit, dvs. variable af formen<br />
1<br />
n<br />
n<br />
∑ Xi eller mere generelt<br />
i=1<br />
1<br />
n<br />
n<br />
∑<br />
i=1<br />
(Xi − μi),<br />
med henblik på konvergens P-n.o. eller i sandsynlighed for n → ∞. (Xn)n≥1 er her en følge<br />
af stokastiske variable og (μn)n≥1 en reel talfølge. Der findes tilsvarende resultater for<br />
stokastiske vektorer (X n)n≥1 og vektorer (μ n)n≥1. Hvis Xi’erne har endelig middelværdi,<br />
vælges μi normalt som middelværdien E[Xi], og der er i denne situation dermed tale om<br />
normerede centrerede partialsummer.<br />
Resultaterne opdeles i to kategorier, idet der skelnes mellem stærke og svage love. En stærk<br />
lov er her et udsagn, der sikrer konvergens P-n.o. i modsætning til en svag lov, som vedrører<br />
konvergens i sandsynlighed. Da konvergens n.o. som bekendt medfører konvergens<br />
i sandsynlighed, giver enhver stærk lov anledning til en tilsvarende svag lov. Det absolut<br />
vigtigste resultat indenfor emnet, hvis historie går helt tilbage til Bernouilli brødrene i<br />
begyndelsen af 1700 tallet, er flg. klassiske stærke lov ofte omtalt som en af sandsynlighedsteoriens<br />
tre perler.<br />
LLN 1 Kolmogorov’s Store tals lov.<br />
Hvis (Xn)n≥1 er en følge af uafhængige identisk fordelte stokastiske variable med endelig<br />
middelværdi μ, konvergerer<br />
1<br />
n<br />
n<br />
∑ Xi → μ P-n.o. og i L<br />
i=1<br />
1 (P).<br />
Da E[Xn] = μ for alle n ≥ 1 kan påstanden ækvivalent formuleres som<br />
1<br />
n<br />
n<br />
∑<br />
i=1<br />
(Xi − E[Xi]) → 0 P-n.o. og i L 1 (P).<br />
Resultatet spiller en meget vigtig rolle i sandsynlighedsteorien, da det dukker naturligt op i<br />
mange sammenhænge. Men det er også af en mere fundamental betydning for den moderne<br />
sandsynlighedsteori, dvs. Kolmogorov-modellen. For kunne et sådant resultat ikke vises,<br />
ville modellen simpelt hen være ubrugelig. Endvidere fremhæver det betydningen af det<br />
indførte middelværdibegreb, for som resultatet viser, konvergerer den empiriske middelværdi<br />
mod den teoretiske, hvis denne eksisterer, uanset hvilken fordeling der end er tale om.<br />
I bestræbelserne på at bevise sætningen er der udviklet mange særdeles værdifulde teknikker,<br />
som udover at tjene deres oprindelige formål har muliggjort mange udvidelser af resultatet.<br />
Vi skal i det følgende beskæftige os med en lille del af denne omfattende teori, men det er<br />
vigtigt hele tiden at have ovenstående hovedresultat i tankerne.<br />
148
Flg. spørgsmål fra den reelle analyse er tydeligvis af interesse :<br />
Hvornår er limn 1 n<br />
i=1<br />
n<br />
∑<br />
ai = 0 for en given reel talfølge (an)n≥1 ?,<br />
dvs. hvornår konvergerer an → 0 i Cecaro middel ? Som bekendt gælder det, hvis an → 0 i<br />
sædvanlig forstand, men yderligere to resultater er af interesse i denne forbindelse. ( Se Appendiks<br />
F for en nøjagtig formulering og et bevis.) Først og fremmest det såkaldte Kronecker<br />
Lemma, dvs. implikationen<br />
∞<br />
∑ an/bn konvergent i R ⇒ lim<br />
n<br />
n=1<br />
hvor 0 < bn < bn+1 ↑ ∞. Tilfældet bn ≡ n er specielt interessant.<br />
1<br />
bn<br />
n<br />
∑ ai = 0,<br />
i=1<br />
Desuden vises, at hvis an’erne enten er opad eller nedad begrænsede, så er<br />
lim n<br />
1<br />
n<br />
n<br />
∑<br />
i=1<br />
ai = 0 hvis lim n<br />
1<br />
[λ n [λ<br />
]<br />
n ]<br />
∑ ai = 0 for ethvert λ > 1.<br />
i=1<br />
Til senere brug bemærkes, at det her er nok, at konvergensen holder for ethvert af de tællelig<br />
mange λ’er af formen 1+k −1 for k ≥ 1.<br />
Med baggrund i dette åbner der sig derfor to mulige bevismetoder for ovenstående sætning.<br />
Enten kan den omformuleres til et spørgsmål om konvergens i R P-n.o. af den uendelige<br />
række<br />
∞<br />
eller også kan man først studere<br />
∑<br />
n=1<br />
1<br />
n<br />
(Xn − μ)/n,<br />
n<br />
∑<br />
i=1<br />
(Xi − μ)<br />
langs med hurtigt voksende delfølger af formen ([λ n ])n≥1 for λ > 1, og dernæst herudfra<br />
forhåbentligt deducere den ønskede konvergens for hele følgen.<br />
Tilfældet, hvor Xi’erne er uafhængige, er af speciel interesse. I denne forbindelse er det næste<br />
resultat, som viser, at n.o.-konvergens og konvergens i sandsynlighed er sammenfaldende for<br />
summer af uafhængige variable, meget vigtigt.<br />
LLN 2 n.o.-konvergens af summer af uafhængige variable.<br />
Lad (Zn)n≥1 betegne en følge af uafhængige variable. Da gælder<br />
∞<br />
∑ Zn er summabel P-n.o. ⇔<br />
n=1<br />
hvor ’summabel P-n.o.’ betyder at<br />
∞<br />
∑ Zn konvergent i sandsynlighed,<br />
n=1<br />
∞<br />
∑ Zn(ω) er konvergent i R for P-n.a. ω.<br />
n=1<br />
149
Korollar For uafhængige stokastiske variable (Zn)n≥1 gælder for alle p > 0<br />
∞<br />
∑ Zn konvergent i L<br />
n=1<br />
p (P) ⇒<br />
∞<br />
∑ Zn er summabel P-n.o.<br />
n=1<br />
Korollaret, der er interessant, fordi konvergens i L p ofte er simpelt at eftervise, er en umiddelbar<br />
konsekvens af sætningen, da konvergens i L p medfører konvergens i sandsynlighed.<br />
Herudfra deduceres uden problemer flg. stærke lov.<br />
LLN 3 De store tals lov (L2-udgave). Lad (Xn)n≥1 betegne en følge af uafhængige kvadratisk integrable stokastiske variable. Da<br />
gælder<br />
∞<br />
∑<br />
n=1<br />
Var(Xn)/n 2 < ∞ ⇒ 1<br />
n<br />
n<br />
∑<br />
i=1<br />
(Xi − E[Xi]) → 0 P-n.o. og i L 2 (P).<br />
Bevis. Uafhængigheden bevirker, at (Xn − E[Xn])n≥1 udgør en orthogonal følge i L 2 , og da<br />
fås af Pythagoras, mere præcist Lemma 14, at<br />
∞<br />
∑ Var(Xn)/n<br />
n=1<br />
2 < ∞ ⇒<br />
Xn − E[Xn] 2 2 = Var(Xn) for alle n ≥ 1<br />
∞<br />
∑<br />
n=1<br />
(Xn − E[Xn])/n konvergerer i L 2 (P).<br />
Konvergensen P-n.o. følger nu af ovenstående korollar samt Kroneckers Lemma, og da<br />
E[<br />
<br />
1<br />
n<br />
n<br />
∑<br />
i=1<br />
(Xi − μi)<br />
2<br />
] = 1<br />
n 2<br />
n<br />
∑<br />
i=1<br />
Var(Xi)<br />
følger konvergensen i L 2 ligeledes af Kronecker Lemmaet. ♦<br />
Bemærkning. Da beviset udnytter begrebet orthogonalitet, er det på ingen måde klart, at<br />
resultatet kan generaliseres til eksponenter α = 2. Men vi skal senere se, at det dog i et vist<br />
omfang er muligt.<br />
Bevis for LLN 2. Sæt for n ≥ 1 Sn = ∑ n i=1 Zi og lad S betegne grænsevariablen, dvs. Sn → S<br />
i sandsynlighed. Der findes derfor en delfølge (nk)k≥1, så at Snk → S n.o. for k → ∞. Definer<br />
for k ≥ 1<br />
Mk := max |Sl − Snk−1<br />
nk−1 0 og k ≥ 1<br />
P(Mk > 2ε) ·(1 − max P(|Snk<br />
nk−1 ε)) ≤ P(|Snk − Snk−1 | > ε).<br />
Da |Snk − Snk−1 | → 0 P-n.o. er<br />
#{k ≥ 1||Snk (ω) − Snk−1 (ω)| > ε } < ∞<br />
150
for P-n.a. ω, og da |Snk − Snk−1 |’erne er uafhængige, følger derfor af Det andet Borel - Cantelli<br />
Lemma at<br />
∞<br />
Heraf følger, at<br />
∞<br />
∑<br />
k=1<br />
∑ P(|Snk<br />
k=1<br />
− Snk−1 | > ε) < ∞.<br />
P(Mk > 2ε) < ∞ og dermed P(limsup {Mk > 2ε}) = 0,<br />
k<br />
for da Sn → S i sandsynlighed giver trekantsuligheden, at<br />
og dermed<br />
1 − max P(|Snk<br />
nk−1 ε) ≥ 1 − 2 · sup P(|S − Sl| > ε/2) →k→∞ 1<br />
l>nk−1<br />
P(Mk > 2ε) ≤ 2P(|Snk − Snk−1 | > ε) for k stor.<br />
Betragtes de tællelig mange ε på formen 1/n for n ≥ 1 viser, det første Borel - Cantelli<br />
Lemma derfor, at for P-n.a. ω er<br />
#{k |Mk(ω) ≥ 2/n} < ∞ for alle n ≥ 1,<br />
dvs. netop at Mk → 0 P-n.o. For n.a. ω gælder altså at<br />
Snk (ω) → S(ω) og Mk(ω) → 0 for k → ∞.<br />
Men heraf følger at liml Sl(ω) = S(ω), for med k(l) bestemt ved n k(l)−1 < l ≤ n k(l) gælder<br />
for alle l uligheden<br />
|Sl(ω) − S(ω)| ≤ |Sl(ω) − Sn k(l)−1 (ω)|+|Sn k(l)−1 (ω) − S(ω)|<br />
≤ M k(l)(ω)+|Sn k(l)−1 (ω) − S(ω)|<br />
og dermed konvergensen, da k(l) → ∞ for l → ∞. ♦<br />
Bevis for LLN 1. Lad (Xn)n≥1 betegne en følge af uafhængige identisk fordelte stokastiske<br />
variable med endelig middelværdi μ. Vi skal vise, at<br />
1<br />
n<br />
n<br />
∑ Xi → μ P-n.o.<br />
i=1<br />
Som netop vist, findes der et relevant resultat i det kvadratisk integrable tilfælde. Men da vi<br />
her kun forudsætter integrabilitet, får vi brug for den såkaldte trunkeringsteknik, som består<br />
i at skrive de enkelte variable som en sum af to i hht. flg. ide:<br />
Xn = X ′<br />
n + ˜Xn hvor X ′<br />
n := Xn · 1 [−an,an ](Xn) og ˜Xn := Xn − X ′<br />
n = Xn · 1 {|Xn|>an}<br />
for et passende valg af positive reelle tal an. Da Xn’erne er forudsat integrable er an = n et<br />
godt valg, idet der da gælder<br />
∞<br />
∑ P( ˜Xn = 0) =<br />
n=1<br />
∞<br />
∑ P(|Xn| > n) =<br />
n=1<br />
151<br />
∞<br />
∑ P(|X1| > n) < ∞.<br />
n=1
Ved brug af Det første Borel-Cantelli Lemma fås derfor at<br />
og dermed<br />
og da<br />
P(∃n ≥ 1 : ˜Xi = 0 i ≥ n) = 1<br />
1<br />
n<br />
n<br />
∑<br />
i=1<br />
n 1<br />
˜Xi<br />
n ∑ → 0 P-n.o.,<br />
i=1<br />
Xi = 1<br />
n<br />
n<br />
∑<br />
i=1<br />
X ′ 1<br />
i +<br />
n<br />
n<br />
∑ ˜Xi,<br />
i=1<br />
mangler vi kun at vise, at første led konvergerer P-n.o. mod μ. Hertil bemærkes, at<br />
Var(X ′<br />
n ) ≤ E[X ′ 2<br />
n ] = E[X 2 n · 1 [−n,n](Xn)] = E[X 2 1 · 1 [−n,n](X1)] = E[X 2 1 ,|X1| ≤ n]<br />
og at der findes en konstant C ∈ R+, så at<br />
∞<br />
∑ E[X<br />
n=1<br />
2 1,|X1| ≤ n]/n 2 = E[X 2 1 · ∑ 1/n<br />
n,n≥|X1|∨1<br />
2 ] ≤ C · E[|X1|] < ∞.<br />
Ifølge LLN 3 gælder derfor, at<br />
1<br />
n<br />
n<br />
∑<br />
i=1<br />
X ′ 1<br />
i −<br />
n<br />
n<br />
∑<br />
i=1<br />
E[X ′ 1<br />
i ] =<br />
n<br />
n<br />
∑<br />
i=1<br />
(X ′<br />
i<br />
hvoraf påstanden følger, da Lebesgue’s Sætning viser, at<br />
og dermed også 1<br />
n<br />
n<br />
∑<br />
i=1<br />
′<br />
− E[X i ]) → 0 P-n.o.,<br />
E[X ′<br />
n ] = E[X1 · 1 [−n,n](X1)] →n→∞ μ<br />
E[X ′<br />
i] →n→∞ μ.<br />
L 1 -konvergensen følger ved at kombinere konvergensen P-n.o. med Sætning 5, da<br />
{Xn |n ≥ 1} og dermed { 1 n<br />
n ∑ Xi |n ≥ 1}<br />
i=1<br />
er uniformt integrable. ♦<br />
Trunkeringsteknikken kan på lignende vis bruges til at vise flg. generalisation af Komogorov’s<br />
Store tals lov. Bemærk at den ændrede integrabilitetsantagelse afspejler sig i valget af<br />
trunkeringskonstant.<br />
152
LLN 4 Marcinkiewicz-Zygmond’s Store tals lov.<br />
Lad 1 ≤ q < 2 være givet og lad (Yn)n≥1 betegne en følge af uafhængige identisk fordelte<br />
variable med endelig q’te moment. Idet μ betegner den fælles middelværdi, gælder da<br />
1<br />
n 1/q<br />
n<br />
∑<br />
i=1<br />
(Yi − μ) → 0 P-n.o. og i L q .<br />
Bevis. Da q = 1 allerede er klaret, betragter vi et 1 < q < 2, og ved at se på Yn − μ i stedet<br />
for Yn, kan vi antage, at den fælles middelværdi er lig 0. Skriv<br />
hvor<br />
Ifølge Kronecker Lemma vil<br />
n<br />
−1/q<br />
n ∑<br />
j=1<br />
Yj = Y ′<br />
j +Y ” j = (Y ′<br />
j − E[Y ′<br />
j])+Y ” j + E[Y ′<br />
j]<br />
Y ′<br />
j = Yj · 1 {|Yj|< j 1/q } og Y ” j = Yj · 1 {|Yj|≥i 1/q } .<br />
Yj → 0 P-n.o. hvis<br />
∞<br />
∑<br />
j=1<br />
Yj/ j 1/q er P-summabel.<br />
Det er derfor nok at vise, at flg. tre rækker hver for sig konvergerer P-n.o.<br />
∞<br />
∑ (Y<br />
j=1<br />
′<br />
j − E[Y ′<br />
j]) · j −1/q ,<br />
∞<br />
∑ Y<br />
j=1<br />
” j · j −1/q og<br />
∞<br />
∑ E[Y<br />
j=1<br />
′<br />
j] · j −1/q .<br />
Leddene i den første sum er uafhængige, centrerede og har endelig varians. Ifølge korollaret<br />
til LLN 2 og Pythagoras er rækken derfor P-summabel, hvis summen af varianserne er<br />
endelig, dvs. hvis<br />
∞<br />
∑ E[(Y<br />
j=1<br />
′ ′<br />
j − E[Y j ])2 ] · j −2/q ∞<br />
≤ ∑ E[Y<br />
j=1<br />
′ 2<br />
j ] · j −2/q < ∞.<br />
Men dette gælder, da der findes en konstant rq > 0 kun afhængig af q, så at<br />
og dermed<br />
∑ j<br />
j: j>x<br />
−2/q ≤ rq x −(2/q−1)<br />
for alle x > 0<br />
∞<br />
∑ E[Y<br />
j=1<br />
′ 2<br />
j ] · j −2/q = E[Y 2 1 ∑<br />
j: j>|Y1| q<br />
j −2/q ] ≤ rq E[Y 2 1 · |Y1| −q(2/q−1) ] = rq E[|Y1| q ].<br />
Konvergensen af række nr. to følger som ovenfor af Borel-Cantelli Lemmaet, for da E[|Y1| q ]<br />
er endelig, er<br />
∞<br />
∑ P(Y<br />
j=1<br />
′′<br />
j = 0) =<br />
∞<br />
∑ P(|Yj| ≥ j<br />
j=1<br />
1/q ) =<br />
153<br />
∞<br />
∑ P(|Y1|<br />
j=1<br />
q ≥ j) < ∞.
Hvad angår den sidste række bemærkes først, at da Yj’erne har middelværdi 0 er<br />
dvs. vi skal vise, at<br />
E[Y ′<br />
j ] = −E[Y ” j ] = −E[Yj · 1 {|Yj|≥ j 1/q } ] = −E[Yj · 1 {|Yj| q ≥ j}],<br />
∞<br />
∑ E[|Y1| · 1 {|Y1|<br />
j=1<br />
q≥ j}] · j −1/q < ∞.<br />
Men dette følger af, at der findes endnu en konstant ˜rq kun afhængig af q, så at<br />
og dermed<br />
∑ j<br />
1≤ j≤x<br />
−1/q ≤ ˜rq x −(1/q−1)<br />
for alle x > 0<br />
∞<br />
∑ E[|Y1| · 1 {|Y1|<br />
j=1<br />
q≥ j}] · j −1/q = E[|Y1| · ∑<br />
1≤ j≤|Y1| q<br />
j −1/q ] ≤ ˜rq E[|Y1| · |Y1| −q(1/q−1) ].<br />
Dvs. den betragtede sum er mindre end ˜rq · E[|Y1| q ] og derfor endelig. n.o.-konvergensen er<br />
hermed vist. Beviset for konvergensen i L q udsættes til senere. ♦<br />
I beviset for ovenstående L 2 -udgave af de store tals lov gjorde vi brug af implikationen<br />
uafhængighed ⇒ ukorrellerethed dvs. orthogonalitet<br />
I det næste resultat tages i stedet udgangspunkt i ukorrellerethed.<br />
LLN 5 De store tals lov (L2-udgave, supplement).<br />
Lad (Xn)n≥1 betegne en følge af ukorrellerede kvadratisk integrable stokastiske variable så<br />
at<br />
∞<br />
∑ Var(Xn)/n<br />
n=1<br />
2 < ∞<br />
Sæt for n ≥ 1 ˆXn = 1 n<br />
n<br />
∑<br />
i=1<br />
(Xi − E[Xi]). Da gælder<br />
1) ˆXn → 0 i sandsynlighed og L 2 (P).<br />
2) ˆX [λ n ] → 0 P-n.o. for λ > 1.<br />
3) ˆXn → 0 P-n.o. hvis sup n (Xn(ω) − E[Xn]) < ∞ eller infn(Xn(ω) − E[Xn]) > −∞<br />
for P-n.a. ω.<br />
Betingelsen i 3) er specielt opfyldt, hvis Xn’erne er ikke negative og sup n E[Xn] < ∞.<br />
Bevis. For nemheds skyld skrives μn i stedet for E[Xn]. Da (Xn − μn)n≥1 pr. antagelse er<br />
parvis orthogonale i L 2 (P) fås for ethvert n ≥ 1 af Pythagoras, at<br />
E[ ˆX 2 1<br />
n ] =<br />
n2 n<br />
∑ E[(Xj − μ j)<br />
j=1<br />
2 ] = 1<br />
n2 154<br />
n<br />
∑<br />
j=1<br />
Var(Xj) →n→∞ 0,
hvor konvergensen følger af antagelsen og Kronecker Lemmaet. Dvs. ˆXn → 0 i L 2 (P) og<br />
dermed også i sandsynlighed.<br />
For ethvert λ > 1 har vi tilsvarende, da [λ n ] ≤ λ n ≤ 2[λ n ], at<br />
=<br />
<br />
∞<br />
∑<br />
j=1<br />
∞<br />
∑ E[ ˆX<br />
n=1<br />
2<br />
[λ n ∞ 1<br />
] ] = ∑<br />
n=1 [λ n ] 2<br />
[λ n ]<br />
∑<br />
j=1<br />
Var(Xj)<br />
∞<br />
∑<br />
n:[λ n ]≥ j<br />
1<br />
[λ n ] 2<br />
<br />
≤ C λ<br />
Var(Xj)<br />
∞<br />
∑<br />
j=1<br />
Var(Xj)/ j 2 < ∞,<br />
hvor C λ er en konstant kun afhængig af λ. Dvs. for ethvert λ > 1 er<br />
E[<br />
∞<br />
∑<br />
n=1<br />
ˆX 2<br />
[λ n ] ] < ∞ og dermed<br />
∞<br />
∑ ˆX<br />
n=1<br />
2<br />
[λ n ] < ∞ P-n.o.,<br />
hvoraf 2) let følger, da leddene i en konvergent række går mod 0.<br />
Ifølge 2) er<br />
hvor<br />
P( ˆX νk(n) → 0 for alle k ≥ 1) = 1,<br />
νk(n) = [(1+k −1 ) n ] for alle n,k ≥ 1.<br />
Kombineres dette med antagelserne gælder derfor for P-n.a. ω, at<br />
samt<br />
lim n<br />
ˆX νk(n)(ω) = 0 for alle k ≥ 1<br />
−∞ < inf(Xj(ω)<br />
− μ j) eller sup(Xj(ω)<br />
− μ j) < ∞,<br />
j<br />
og derfor som tidligere nævnt, se , at limn ˆXn = 0 P-n.o. ♦<br />
Ved at udnytte LLN 5 punkt 3) kan man, se Hoffmann sektionerne 4.11 og 4.12, vise, at Kolmogorov’s<br />
store tals lov stadig gælder, selvom uafhængighed erstattes med parvis uafhængighed.<br />
Men da denne generalisation yderst sjældent er interessant, vil vi lade den ligge.<br />
Lad mig til slut uden bevis nævne flg. supplement til LLN 5. Notationen er som ovenfor.<br />
Rademacher - Mensov’s Store tals lov.<br />
Lad (Xn)n≥1 betegne en følge af ukorrellerede kvadratisk integrable stokastiske variable. Da<br />
gælder<br />
dvs. specielt<br />
∞<br />
∑ log<br />
n=1<br />
2 n ·Var(Xn) < ∞ ⇒<br />
∞<br />
∑<br />
n=1<br />
j<br />
(Xn − E[Xn]) summabel P-n.o.<br />
∞ log<br />
∑<br />
n=1<br />
2 n<br />
n2 ·Var(Xn) < ∞ ⇒ ˆXn → 0 P-n.o.<br />
155
De store tals love II.<br />
Som allerede nævnt adskiller eksponenten 2 sig fra andre eksponenter. Men som vi nu<br />
skal se, kan man i det uafhængige tilfælde ved hjælp af den såkaldte symmetriseringsteknik<br />
alligevel vise lignende resultater for alle eksponenter α > 0.<br />
En væsentlig brik i teorien er flg. resultat normalt kaldet Khinchine’s Ulighed:<br />
LLN 6 Khinchine’s Ulighed.<br />
Lad (εi)i≥1 betegne en følge af uafhængige Bernoulli variable, dvs.<br />
P(εi = −1) = P(εi = 1) = 1/2 for alle i ≥ 1<br />
Da findes der for α > 0 positive konstanter cα og Cα kun afhængig af α, så at<br />
cα ·(<br />
n<br />
∑ b<br />
j=1<br />
2 j )α/2 ≤ E[|<br />
for alle n ≥ 1 og alle reelle talfølger (b j) j≥1.<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
α ] ≤ Cα ·(<br />
n<br />
∑ b<br />
j=1<br />
2 j )α/2<br />
Bevis del I. Ifølge Jensen’s ulighed er α ↦→ E[|∑ n j=1 b j · ε j| α ] 1/α voksende for ethvert n ≥ 1<br />
og alle reelle talfølger (bn)n≥1, og da<br />
ses, at<br />
og<br />
E[|<br />
(<br />
E[|<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
α ] ≤ E[|<br />
n<br />
∑ b<br />
j=1<br />
2 j )α/2 = E[|<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
2 2 n<br />
] = E[ ∑ b j · ε j ] =<br />
j=1<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
2 ] α/2 = (<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
2 ] α/2 ≤ E[|<br />
n<br />
∑ b<br />
j=1<br />
2 j<br />
n<br />
∑ b<br />
j=1<br />
2 j ) α/2<br />
for α ≤ 2<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
α ] for α ≥ 2.<br />
1 kan altså bruges som Cα for 0 < α ≤ 2 og som cα for α ≥ 2, og følgen (b j) j≥1 =<br />
(1,0,...,0,...) viser, at begge konstanter er optimale. ♦<br />
De resterende tilfælde er tæt forbundne, for er Cα bestemt for α > 2, gælder ifølge Cauchy-<br />
Schwarz’s Ulighed for 0 < α < 2, at<br />
E[|<br />
n<br />
∑ b<br />
j=1<br />
2 j = E[|<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
4−α ] 1/2 · E[|<br />
som efter forkortning viser, at<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
2 ] = E[|<br />
(<br />
n<br />
∑<br />
j=1<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
2−α/2 · |<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
α ] 1/2 ≤ C 1/2<br />
4−α ·(<br />
b 2 j )α/4 ≤ C −1/2<br />
4−α · E[|<br />
156<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
α/2 ] ≤<br />
n<br />
∑ b<br />
j=1<br />
2 j )1−α/4 · E[|<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
α ] 1/2 .<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
α ] 1/2 ,
D.v.s.C −1<br />
4−α kan bruges som cα i intervallet 0 < α < 2. Bestemmelsen af Cα for α > 2 er<br />
mere kompliceret, specielt er bestemmelsen af den optimale værdi, dvs. den mindst mulige,<br />
yderst vanskeligt. Hoffmann viser i sektion 4.30, at Cα = 2 α/2 · α · Γ(α/2) kan bruges.<br />
Denne konstant er ikke optimal ligesom den, vi nu vil bestemme ved brug af teorien om<br />
betingede middelværdier.<br />
Bevis del II. Lad α > 2 og n ≥ 1 være givet og lad U1,...,Un betegne uafhængige N(0,1)fordelte<br />
stokastiske variable. Definer<br />
n<br />
Bi := σ({Ui > 0}) i = 1,...,n og B := σ( Bi).<br />
i=1<br />
Ifølge regneregler for betingede middelværdier gælder for ethvert i, da Ui’erne er symmetriske<br />
og P(Ui > 0) derfor lig 1/2 for alle i, at<br />
hvor<br />
D.v.s.<br />
E[Ui |B] = E[Ui |Bi] = ρ ·(1 {Ui>0} − 1 {Ui≤0}) P-n.o.,<br />
ρ = 2 · E[Ui |Ui > 0] = −2 · E[Ui |Ui ≤ 0] = 2/π.<br />
E[U1 |B]/ρ,...,E[Un |B]/ρ er uafhængige Bernoulli variable,<br />
og for ethvert valg af konstanter b1,...,bn gælder derfor<br />
D.v.s.<br />
ρ α · E[|<br />
≤ E[|<br />
n<br />
∑ b j · ε j|<br />
j=1<br />
α ] = E[|<br />
n<br />
∑ b j · Xj|<br />
j=1<br />
α ] = E[|N(0,<br />
n<br />
∑ b j · E[Uj |B]|<br />
j=1<br />
α ] = E[|E[<br />
n<br />
∑ b<br />
j=1<br />
2 j )|α ] = (<br />
n<br />
∑ b j ·Uj |B]|<br />
j=1<br />
α ]<br />
n<br />
∑ b<br />
j=1<br />
2 j )α/2 · E[|N(0,1)| α ].<br />
Cα := ρ −α · E[|N(0,1)| α ] = π (α−1)/2 · Γ((α + 1)/2)<br />
er en mulig konstant. ♦<br />
Flg. to korollarer er nu umiddelbare konsekvenser af Khinchine’s Ulighed.<br />
Korollar 1 Lad Z1,...,Zn betegne uafhængige symmetriske stokastiske variable. Da gælder<br />
for ethvert α > 0<br />
E[|<br />
n<br />
∑ Zk|<br />
k=1<br />
α n<br />
] ≤ Cα · E[( ∑ |Zk|<br />
k=1<br />
2 ) α/2 n<br />
β(α)<br />
] ≤ Cα · n ∑ E[|Zk|<br />
k=1<br />
α ],<br />
hvor Cα er konstanten fra Khinchine’s ulighed, og β(α) = (α/2 − 1) + , dvs. β(α) = 0 for<br />
0 < α ≤ 2 og β(α) = α/2 − 1 for α > 2.<br />
Bevis. Lad α > 0 være givet og lad ε1,...,εn betegne uafhængige Bernoulli variable, så at<br />
157
(Z1,...,Zn) og (ε1,...,εn) er uafhængige. εiZi’erne er da uafhængige, og da Zi ∼ εiZi, da Zi<br />
er symmetrisk, er<br />
(Z1,...,Zn) ∼ (ε1Z1,...,εnZn).<br />
Sættes<br />
Hα(a1,...,an) = E[|<br />
n<br />
∑<br />
k=1<br />
εk ak| α ] for a1,...,an ∈ R<br />
følger ved brug af Fubini’s Sætning, nærmere bestemt Ua 5, at<br />
E[|<br />
n<br />
∑<br />
k=1<br />
Zk| α ] = E[|<br />
n<br />
∑<br />
k=1<br />
εkZk| α ] = E[Hα(Z1,...,Zn)].<br />
Men ifølge Khinchine’s Ulighed er Hα(a1,...,an) ≤ Cα ·(<br />
E[|<br />
n<br />
∑ Zk|<br />
k=1<br />
α n<br />
] ≤ Cα · E[( ∑ |Zk|<br />
k=1<br />
2 ) α/2 ].<br />
n<br />
∑ a<br />
k=1<br />
2 k )α/2 og derfor<br />
Den sidste ulighed følger nu ved for 0 < α ≤ 2 at udnytte, at x ↦→ x α/2 er subadditiv og<br />
voksende på R+, og for α > 2 at benytte flg. konsekvens af Jensen’s Ulighed<br />
(<br />
n<br />
∑<br />
k=1<br />
|xk|) α n<br />
α−1<br />
≤ n ∑ |xk|<br />
k=1<br />
α<br />
x1,...,xn ∈ R. ♦<br />
Bemærkning. Nærlæses Korollar 1 ses, at antagelsen om Zi’erne kan svækkes til, at de 2 n<br />
stokastiske vektorer (±Z1,...,±Zn) har samme fordeling dvs.<br />
Man udtrykker ofte dette ved at sige, at<br />
(Z1,...,Zn) ∼ (±Z1,...,±Zn).<br />
Z = (Z1,...,Zn) er symmetrisk i R n .<br />
Ved brug af Korollar 2 til Ua 5 kan vi nu udvide ovenstående ulighed til generelle uafhængige<br />
variable. Konstanterne Cα og β(α) er de samme som i Korollar 1.<br />
Korollar 2 Lad Z1,...,Zn betegne uafhængige stokastiske variable med endelig middelværdi<br />
μk for k = 1,...,n. Da gælder for ethvert α > 0<br />
E[|<br />
n<br />
∑<br />
k=1<br />
∑<br />
k=1<br />
(Zk − μk)| α ] ≤ 2 α n<br />
β(α)<br />
·Cα · n<br />
E[|Zk − μk| α ].<br />
Bevis. Da uligheden er triviel for α ≤ 1, idet x ↦→ x α er voksende og subadditiv på R+,<br />
betragtes et α > 1. Lad Y1,...,Yn være en uafhængig kopi af Z1,...,Zn, dvs.<br />
(Y1,...,Yn) og (Z1,...,Zn) er uafhængige og identisk fordelte.<br />
158
Da Z1 −Y1,...,Zn −Yn derfor er uafhængige og symmetriske, fås af Korollar 1<br />
E[|<br />
n<br />
∑<br />
k=1<br />
Men da Zk ∼ Yk for alle k ≥ 1 og dermed<br />
(Zk −Yk)| α n<br />
β(α)<br />
] ≤ Cα · n ∑<br />
k=1<br />
E[|Zk −Yk| α ].<br />
E[|Zk −Yk| α ] ≤ 2 α−1 ·(E[|Zk − μk| α ]+E[|Yk − μk| α ]) = 2 α · E[|Zk − μk| α ],<br />
følger påstanden af det ovenfor nævnte korollar til Ua 5, idet<br />
E[|<br />
n<br />
∑<br />
k=1<br />
(Zk −Yk)| α ] = E[|<br />
n<br />
∑<br />
k=1<br />
(Zk − μk) −<br />
n<br />
∑<br />
k=1<br />
(Yk − μk)| α ] ≥ E[|<br />
n<br />
∑<br />
k=1<br />
(Zk − μk)| α ],<br />
n<br />
da α > 1 og ∑ (Yk − μk) har middelværdi 0. ♦<br />
k=1<br />
For at kunne udvide de store tals lov til et generelt α > 0 udledes først flg. Lα-konvergens resultat for summer af uafhængige stokastiske variable. Da resultatet er en simpel konsekvens<br />
af Korollar 2, formuleres det som endnu et korollar. Cα og β(α) er som ovenfor.<br />
Korollar 3 Lad (Xn)n≥1 betegne uafhængige stokastiske variable med endelig middelværdi<br />
μn for n ≥ 1. Da gælder for ethvert 0 < α ≤ 2, at<br />
og for alle α > 0, at<br />
∞<br />
∑ E[|Xn − μn|<br />
n=1<br />
α ] < ∞ ⇒<br />
∞<br />
∑<br />
n=1<br />
(Xn − μn) eksisterer i L α ,<br />
∞<br />
∑ E[|Xn − μn|<br />
n=1<br />
α ]/n α−β(α) < ∞ ⇒ 1 n<br />
n ∑ (Xk − μk) → 0 i L<br />
k=1<br />
α .<br />
Bevis. Hvad angår det første resultat, er det nok at vise, at afsnitsfølgen er en Cauchy følge<br />
i L α . Men dette følger af antagelsen og Korollar 2, idet denne viser, at for 0 < α ≤ 2 er<br />
E[|<br />
m<br />
∑<br />
k=n<br />
(Xk − μk)| α ] ≤ 2 α Cα<br />
m<br />
∑<br />
k=n<br />
E[|Xk − μk| α ]<br />
for alle 1 ≤ n ≤ m. Ifølge Korollar 2 gælder endvidere for alle n ≥ 1, at<br />
E[| 1<br />
n<br />
n<br />
∑(Xk<br />
− μk)|<br />
k=1<br />
α ] ≤ 2α Cα<br />
n α · n<br />
∑<br />
k=1<br />
β(α) n<br />
E[|Xk − μk| α ] = 2α Cα<br />
n α−β(α)<br />
n<br />
∑ E[|Xk − μk|<br />
k=1<br />
α ],<br />
hvoraf det andet resultat umiddelbart fås ved brug af Kronecker’s lemma. ♦<br />
Vi kan nu formulere og bevise en generel L α -version af de store tals lov. For α < 2 er der<br />
tale om en direkte oversættelse af L 2 -udgaven, hvorimod momentbetingelsen er en anden<br />
for α > 2.<br />
159
LLN 7 De store tals lov (L α -udgave).<br />
Lad (Xn)n≥1 betegne en følge af uafhængige stokastiske variable med endelig middelværdi<br />
μn for n ≥ 1. Da gælder for α ≤ 2<br />
og for α > 2<br />
∞<br />
∑<br />
n=1<br />
∞<br />
∑ E[|Xn − μn|<br />
n=1<br />
α ]/n α < ∞ ⇒ 1<br />
n<br />
n<br />
∑<br />
i=1<br />
E[|Xn − μn| α ]/n (1+α/2) < ∞ ⇒ 1<br />
n<br />
Bevis. Lad α ≤ 2 være givet. Ifølge Korollar 3 punkt 1 har vi<br />
∞<br />
∑ E[|Xn − μn|<br />
n=1<br />
α ]/n α < ∞ ⇒<br />
∞<br />
∑<br />
n=1<br />
(Xi − μi) → 0 P-n.o. og i L α (P).<br />
n<br />
∑<br />
i=1<br />
(Xi − μi) → 0 P-n.o. og i L α (P).<br />
(Xn − μn)/n konvergent i L α .<br />
Rækken konvergerer derfor også P-n.o. ifølge korollaret LLN 2, og Kronecker Lemmaet<br />
giver derfor umiddelbart, at<br />
ˆXn := 1<br />
n<br />
n<br />
∑<br />
k=1<br />
(Xk − μk) → 0 P-n.o.<br />
Anden del i Korollar 3 sikrer, at ˆXn → 0 i L α , og tilfældet α ≤ 2 er dermed klaret.<br />
Betragt dernæst et α > 2. L α -konvergensen af ( ˆXn)n≥1 følger igen af Korollar 3. Hvad angår<br />
konvergensen P-n.o. udnyttes som i beviset for LLN 2, at det er nok at vise, at ˆX2 n → 0 og<br />
Mn → 0 P-n.o., hvor<br />
Mn := max<br />
2n
Men ifølge Korollaret til Ottaviani’s Ulighed er dette tilfældet, hvis<br />
∞<br />
∑<br />
n=1<br />
og dermed ifølge Korollar 2 hvis<br />
1<br />
· E[|<br />
2nα ∞ 2<br />
∑<br />
n=1<br />
n(α/2−1)<br />
2nα Men dette er netop antagelsen, da<br />
∞<br />
∑<br />
n=1<br />
1<br />
2 n(α/2+1)<br />
2n+1 ∑<br />
j=2n (Xj − μ j)|<br />
+1<br />
α ] < ∞,<br />
2n+1 ∑<br />
j=2n E[|Xj − μ j|<br />
+1<br />
α ] < ∞.<br />
2n+1 ∑<br />
j=2n E[|Xj − μ j|<br />
+1<br />
α ∞<br />
1+α/2<br />
] ≤ 2 ∑ E[|Xj − μ j|<br />
j=1<br />
α ]/ j 1+α/2 < ∞. ♦<br />
Symmetrisering sikrer også den postulerede men ikke viste L q -konvergens i Marcinkiewicz-<br />
Zygmond’s Store tals lov.<br />
Thi lad for 1 < q < 2 situationen være som i LLN 4. Først reduceres til det symmetriske<br />
tilfælde. For hvis ( ˜Yj) j≥1 er en uafhængig kopi af (Yj) j≥1, dvs.<br />
(Yj) j≥1 og ( ˜Yj) j≥1 uafhængige og (Yj) j≥1 ∼ ( ˜Yj) j≥1<br />
og dermed Yj ∼ ˜Yj j ≥ 1 og ˜Yj’erne uafhængige, fås af korollaret til Ua 5, at<br />
da q > 1 og<br />
E[| 1<br />
n 1/q<br />
n<br />
∑<br />
j=1<br />
Yj| q ] ≤ E[| 1<br />
n 1/q<br />
n<br />
∑ Yj −<br />
j=1<br />
1<br />
n1/q E[ 1<br />
n 1/q<br />
n<br />
∑ ˜Yj|<br />
j=1<br />
q ] = E[| 1<br />
n1/q n<br />
∑ ˜Y ] = 0.<br />
j=1<br />
n<br />
∑<br />
j=1<br />
(Yj − ˜Yj)| q ],<br />
Da (Yj − ˜Yj) j≥1’erne er uafhængige, symmetriske og identisk fordelte, er det derfor, hvad<br />
konvergens i q-middel angår, nok at betragte det symmetriske tilfælde. Vi vil derfor i det<br />
videre forløb yderligere antage, at Yi’erne er symmetriske.<br />
Betragt for et givet k ≥ 1 opsplitningen<br />
Yi = Y ′ ′′<br />
k,i +Y k,i<br />
hvor Y ′<br />
k,i := Yi · 1 {|Yi|≤k} og Y ′′<br />
k,i := Yi · 1 {|Yi|>k}.<br />
De to følger (Y ′<br />
k,i )i≥1 og (Y ′′<br />
k,i )i≥1 består begge af uafhængige, symmetriske og identisk<br />
fordelte stokastiske variable. Ifølge Korollar 2 ovenfor findes der derfor en konstant C kun<br />
afhængig af q, så at<br />
E[| 1<br />
n 1/q<br />
n<br />
∑<br />
j=1<br />
Y ′′<br />
k, j |q ] ≤ C · E[|Y ′′<br />
k,1 |q ] = C · E[|Y1| q , |Y1| > k],<br />
161
og<br />
supE[|<br />
n<br />
1<br />
n1/q n<br />
∑<br />
j=1<br />
Y ′′<br />
k, j |q ]<br />
kan dermed gøres så lille som ønsket ved at vælge k stor nok. L q -konvergensen vil derfor<br />
være vist, hvis vi for givet k kan vise, at<br />
lim n E[| 1<br />
n 1/q<br />
n<br />
∑<br />
j=1<br />
Y ′<br />
k, j |q ] = lim n E[| 1<br />
n 1/q<br />
n<br />
∑ Yj · 1 {|Yj|≤k}|<br />
j=1<br />
q ] = 0.<br />
Men da q < 2 er det nok at vise konvergens i L 2 , hvilket følger af Pythagoras, for da summanderne<br />
for ethvert k ≥ 1 er uafhængige centrede kvadratisk integrable variable, gælder<br />
E[| 1<br />
n 1/q<br />
n<br />
∑ Yj · 1 {|Yj|
Fordelingskonvergens.<br />
Lad i det følgende (S,d) betegne et separabelt metrisk rum. Læseren anbefales her at tænke<br />
på R n n ≥ 1 eller mere generelt delmængder heraf udstyret med den euklidiske metrik. Lad<br />
endvidere (Xn)n≥1 og X betegne stokastiske funktioner med værdier i S, dvs.(F,B(S))målelige<br />
funktioner fra Ω ind i S, hvor (Ω,F,P) er et sandsynlighedsfelt, hvorpå alle omtalte<br />
variable tænkes defineret. I analogi med det reelle tilfælde indføres flg. konvergensbegreb.<br />
Definition. Xn → X i sandsynlighed hvis limn P(d(Xn,X) > ε) = 0 for ε > 0.<br />
Bemærkning. Separabiliteten af S sikrer at B(S × S) = B(S) ⊗B(S), og da (x,y) ↦→ d(x,y)<br />
er kontinuiert, er d(Xn,X) dermed en reel stokastisk variabel for ethvert n ≥ 1. Mængderne<br />
{d(Xn,X) > ε} er derfor hændelser og kan som sådan tilordnes en sandsynlighed.<br />
Hvis S = R er betingelsen for konvergens i sandsynlighed den vel kendte<br />
lim n P(|Xn − X| > ε) = 0 for alle ε > 0,<br />
hvilket, som vist i Lemma 12, er ækvivalent med at limn E[|Xn − X| ∧ 1] = 0. Denne ækvivalens<br />
generaliserer uden ændringer til det almene tilfælde, idet<br />
Xn → X i sandsynlighed ⇔ d(Xn,X) → 0 i sandsynlighed ⇔ lim n E[d(Xn,X) ∧ 1] = 0.<br />
Ved brug heraf fås som i det reelle tilfælde.<br />
Fk 1 Xn → X i sandsynlighed ⇒ Xnk → X P-n.o. for en delfølge (nk)k≥1.<br />
Bevis. Da d(Xn,X) → 0 i sandsynlighed i R findes der ifølge Proposition 6 en delfølge<br />
(nk)k≥1, så at d(Xnk ,X) ∧ 1 → 0 P-n.o., men dette siger netop, at Xnk → X P-n.o. ♦<br />
En anden vigtig konsekvens er følgende.<br />
Fk 2 Lad (T,δ) betegne endnu et separabelt metrisk rum og lad f : S → T være en kontinuert<br />
funktion. Da gælder<br />
Xn → X i sandsynlighed ⇒ f(Xn) → f(X) i sandsynlighed<br />
Bevis. Vi skal vise limn E[δ( f(Xn), f(X)) ∧ 1] = 0. Antag at det ikke gælder, dvs. antag<br />
Men dette fører til en modstrid, da<br />
∃r > 0 ∃(nk)k≥1 : E[δ( f(Xnk ), f(X)) ∧ 1] > r for alle k.<br />
Xnk → X i s.s. ⇒ ∃(kl)l≥1 Xnk l → X P-n.o. ⇒ f(Xnk l ) → f(X) P-n.o.<br />
⇒ δ( f(Xnk l ), f(X))) ∧ 1 → 0 P-n.o. ⇒ E[δ( f(Xnk l ), f(X))) ∧ 1] → 0. ♦<br />
Kontinuiteten udnyttes i implikation nummer to, og da det her er nok, at f er kontinuert i<br />
X(ω) for n.a. ω, behøver f blot at være kontinuert PX-n.o. Vi har derfor flg. skærpelse.<br />
Fk 2a Lad (T,δ) betegne endnu et separabelt metrisk rum og lad f : S → T være en Borel<br />
funktion, som er kontinuert PX-n.o. Da gælder<br />
Xn → X i sandsynlighed ⇒ f(Xn) → f(X) i sandsynlighed<br />
163
Specialtilfældet T = S og δ en metrik, der er ækvivalent med d, viser, idet den identiske<br />
afbildning er kontinuert både som afbildning<br />
(S,d) → (S,δ) og (S,δ) → (S,d),<br />
at konvergens i sandsynlighed ikke afhænger af den eksplicit valgte metrik, blot vi holder os<br />
indenfor klassen af ækvivalente metrikker. Dette udnyttes f.eks. i følgende bevis.<br />
Fk 3 Idet S × S udstyres med en produktmetrik gælder<br />
Xn → X og Yn → Y i sandsynlighed ⇔ (Xn,Yn) → (X,Y) i sandsynlighed.<br />
Bevis. ⇐ følger af Fk 2, da projektionsafbildningerne er kontinuerte, og ⇒ fås, da<br />
d1((x1,y1),(x2,y2)) := d(x1,y1)+d(x2,y2)<br />
er en produktmetrik, umiddelbart af uligheden<br />
˜<br />
d((Xn,Y1),(X,Y)) ∧ 1 ≤ d(Xn,X) ∧ 1+d(Yn,Y) ∧ 1. ♦<br />
Sætning 5 og Fk 2 viser tilsammen, at der for alle f ∈ bC(S) gælder<br />
Xn → X i sandsynlighed ⇒ f(Xn) → f(X) i sandsynlighed<br />
⇒ f(Xn) → f(X) i L 1 <br />
(P) ⇒ E[ f(Xn)] →n→∞ E[ f(X)] = f dPX.<br />
Med udgangspunkt heri indføres den såkaldte konvergens i fordeling i hht. flg. definition.<br />
Definition. En følge (Xn)n≥1 af stokastiske funktioner med værdier i S siges at konvergere i<br />
fordeling mod μ, et Borel sandsynlighedsmål på S, hvis<br />
<br />
E[ f(Xn)] →n→∞ f dμ for alle f ∈ bC(S).<br />
Dette betegnes i givet fald Xn ∼ → μ. Hvis μ = PX for en stokastisk funktion X med værdier<br />
i S skrives også Xn ∼ → X, og man taler om konvergens i fordeling mod X. I følge den lille<br />
transformationssætning gælder altså, at<br />
Xn ∼ → X ⇔ E[ f(Xn)] →n→∞ E[ f(X)] for alle f ∈ bC(S).<br />
Ovenstående overvejelser kan derfor formuleres som implikationen.<br />
Fk 4 Xn → X i sandsynlighed ⇒ Xn ∼ → X.<br />
Grænsemålet for en konvergent følge er entydigt bestemt, dvs.<br />
For ifølge Sætning 8 har vi<br />
Xn ∼ → μ og Xn ∼ <br />
→ ν ⇒<br />
Xn ∼ → μ og Xn ∼ → ν ⇒ μ = ν.<br />
<br />
f dμ =<br />
164<br />
f dν f ∈ bC(S) ⇒ μ = ν.
Derimod kan vi sagtens have, at Xn ∼ → X og Xn ∼ → Y , selv om X og Y er vidt forskellige. Men<br />
deres fordeling er ens, idet der gælder<br />
Xn ∼ → X og Xn ∼ → Y ⇒ PX = PY.<br />
Konvergens i fordeling er derfor udelukkende en egenskab ved fordelingsmålene opfattet<br />
som Borel sandsynlighedsmål på S, idet<br />
Xn ∼ → X ⇔ PXn<br />
w<br />
→ PX,<br />
hvor for Borel sandsynlighedsmål (μn)n≥1 og μ på S μn w → μ (μn konvergerer svagt imod μ),<br />
hvis og kun hvis <br />
f dμn →n→∞<br />
<br />
f dμ for alle f ∈ bC(S).<br />
Som følge heraf har det endog mening at tale om konvergens i fordeling for variable, der<br />
ikke nødvendigvis er definerede på samme rum. Dette skal vi dog ikke udnytte her, men det<br />
er vigtigt i mange sammenhænge.<br />
Før vi ser nærmere på dette nye konvergens begreb knyttes et par kommentarer til definitionen.<br />
Da kontinuitet i metriske rum svarer til følgekontinuitet, bevares C(S) og dermed konvergens<br />
i fordeling under overgang til en ækvivalent metrik. Endvidere ses ved opsplitning i<br />
positiv og negativ del, at det er nok at eftervise definitionsbetingelsen for f ∈ bC(S)+, og da<br />
f ∧ n ↑ f og f ∧ n ∈ bC(S)+ for f ∈ C(S)+<br />
fås af Monoton konvergens, at<br />
Xn ∼ → μ (X ) ⇒ liminf<br />
n<br />
E[ f(Xn)]<br />
<br />
≥ f dμ (E[ f(X)]) for alle f ∈ C(S)+.<br />
Denne implikation kan også vendes om, idet der gælder.<br />
Fk 5<br />
Xn ∼ → μ ⇔ liminf<br />
n<br />
E[ f(Xn)]<br />
<br />
≥<br />
f dμ for alle f ∈ bC(S)+.<br />
Bevis. Vi mangler kun at vise ⇐, og som bemærket er det nok at se på ikke-negative funktioner.<br />
Lad derfor f ∈ bC(S)+ med 0 ≤ f ≤ M været givet. Da<br />
liminf<br />
n<br />
E[(M − f)(Xn)] = M − limsup E[ f(Xn)]<br />
n<br />
fås af antagelsen brugt på f og M − f , som begge er elementer i bC(S)+, at<br />
liminf<br />
n<br />
E[ f(Xn)]<br />
<br />
≥<br />
hvilket alt i alt viser, at<br />
<br />
f dμ og M − limsup E[ f(Xn)] ≥ M −<br />
n<br />
<br />
limE[ f(Xn)] =<br />
n<br />
165<br />
f dμ. ♦<br />
f dμ,
Ligesom i Fk 2a kan resultaterne udvides til funktioner, som kun er kontinuerte n.o. Der<br />
gælder f.eks.<br />
Fk 5a<br />
Xn ∼ → μ ⇔ E[ f(Xn)] →n→∞<br />
for ethvert f ∈ bM(S), som er kontinuert μ-n.o.<br />
Bevis. Kun ⇒ kræver et bevis. Ved opsplitning i positiv og negativ del og dernæst at se på f<br />
og M − f , hvor 0 ≤ f ≤ M, indses som ovenfor, at det er nok at vise<br />
<br />
liminf E[ f(Xn)] ≥ f dμ<br />
n<br />
for et givet f ∈ bM(S)+, som er kontinuert μ-n.o. Definer for g ∈ bM(B(S))+ og k ≥ 1<br />
<br />
f dμ<br />
gk(x) := inf(k<br />
∧ g(y)+k · d(x,y)) x ∈ S.<br />
y∈S<br />
Ved brug af flg. tre uligheder, hvor x, ˜x ∈ S, k ≥ 1 og r > 0,<br />
1)<br />
2)<br />
3)<br />
gk(x) ≤ k ∧ g(x)+k · d(x,x) = k ∧ g(x) ≤ g(x)<br />
gk(x) = inf (k ∧ g(y)+k · d(x,y)) ∧ inf (k ∧ g(y)+k · d(x,y))<br />
y∈b(x,r) y/∈b(x,r)<br />
≥ inf k ∧ g(y) ∧ inf k · d(x,y) ≥ k ∧ inf g(y) ∧ kr<br />
y∈b(x,r) y/∈b(x,r) y∈b(x,r)<br />
|gk(x) − gk( ˜x)| ≤ sup |k ∧ g(y)+k · d(x,y) − k ∧ g(y) − k · d( ˜x,y)|<br />
y∈S<br />
ses, at (gk)k≥1 ⊆ C(S)+ og at<br />
= k · sup |d(x,y) − d( ˜x,y)| ≤ k · d(x, ˜x)<br />
y∈S<br />
0 ≤ gk ≤ gk+1 ≤ g k ≥ 1 samt gk(x) ↑ g(x), hvis g er kontinuert i x.<br />
Da f pr. antagelse er kontinuert μ-n.o., konvergerer fk ↑ f μ-n.o., hvor fk’erne er konstrueret<br />
ud fra f , som netop beskrevet. Heraf følger derfor ved brug af Monoton konvergens, at<br />
<br />
liminf E[ f(Xn)] ≥ sup liminf E[ fk(Xn)] = sup<br />
n<br />
k n<br />
k<br />
fk dμ = f dμ. ♦<br />
Læseren opfordres til at reformulere Fk 5 og Fk 5a svarende til at Xn ∼ → X i stedet for Xn ∼ → μ.<br />
166
Kriterier for konvergens i fordeling.<br />
Portmanteau Sætning I.<br />
Lad (S,d) betegne et separabelt metrisk rum og μ et Borel sandsynlighedsmål på S samt<br />
(Xn)n≥1 en følge af stokastiske funktioner med værdier i S. Idet<br />
Lip(S,d) := { f ∈ C(S)|∃M > 0 : | f(x) − f(y)| ≤ M d(x,y) x,y ∈ S}.<br />
er flg. udsagn ækvivalente.<br />
1) Xn ∼ → μ<br />
<br />
2) gdμ ≤ liminf<br />
n<br />
E[g(Xn)] for alle g ∈ bLip(S,d)+<br />
S<br />
3) μ(G) ≤ liminfn P(Xn ∈ G) for alle G ⊆ S åben<br />
4) μ(F) ≥ limsup n P(Xn ∈ F) for alle F ⊆ S lukket.<br />
Bemærk at modsat C(S) afhænger Lip(S,d) eksplicit af metrikken d.<br />
Bevis. Da 1) ⇒ 2) er indeholdt i definitionen, og ækvivalensen mellem 3) og 4) følger ved<br />
overgang til komplementær mængden, vises kun 2) ⇒ 3) ⇒ 1). Antag 2) og lad G være en<br />
given åben delmængde af S. Definer for k ≥ 1<br />
gk(x) = (k · d(x,G c )) ∧ 1 for x ∈ S.<br />
Konstruktionen viser, at gk ↑ 1G, og ved brug af trekantsuligheden ses for k ≥ 1, at<br />
|gk(x) − gk(y)| ≤ k · |d(x,G c ) − d(x,G c )| ≤ k · d(x,y) x,y ∈ S<br />
og dermed gk ∈ bLip(S,d)+. Ifølge 2) og Monoton konvergens gælder derfor<br />
<br />
μ(G) = sup gk dμ ≤ sup liminf<br />
k S<br />
k<br />
n<br />
E[gk(Xn)] ≤ liminf<br />
n<br />
E[1G(Xn)] ≤ liminf<br />
n<br />
P(Xn ∈ G).<br />
Antag 3). Som vist i Fk 5 er det nok at vise, at for givet f ∈ bC(S)+ er<br />
<br />
f dμ ≤ liminf E[ f(Xn)].<br />
n<br />
Men for ethvert n har vi<br />
E[ f(Xn)] =<br />
∞<br />
og tilsvarende <br />
0<br />
S<br />
P( f(Xn) > t)dt =<br />
f dμ =<br />
∞<br />
og da { f > t} er åben fås af Fatou’s lemma, at<br />
∞<br />
0<br />
μ( f > t)dt ≤<br />
∞<br />
0<br />
liminf<br />
n<br />
0<br />
∞<br />
0<br />
μ( f > t)dt,<br />
P( f(Xn) > t)dt ≤ liminf<br />
n<br />
167<br />
P(Xn ∈ { f > t})dt<br />
∞<br />
0<br />
P( f(Xn) > t)dt,
hvilket er den ønskede ulighed. ♦<br />
Til enhver Borel mængde B tilordnes mængderne<br />
B ◦ := {x ∈ B|∃ε > 0 : b(x,ε) ⊆ B} og B := {x ∈ S|∀ε > 0 : b(x,ε) ∩ B = /0}.<br />
( Hoffmann bruger betegnelserne int(B) og cl(B)) Dvs. B ◦ ⊆ B ⊆ B og<br />
B ◦ = B ⇔ B åben og B = B ⇔ B lukket.<br />
B ◦ kaldes det indre af B og er den største åbne mængde indeholdt i B, og B kaldes aflukningen<br />
af B og er den mindste lukkede mængde, der indeholder B. bd(B) := B\B ◦ kaldes tilsvarende<br />
randen af B. Ækvivalensen mellem 1), 3) og 4) kan derfor formuleres på flg. måde.<br />
Korollar. Xn ∼ → μ hvis og kun hvis<br />
μ(B ◦ ) ≤ liminf<br />
n<br />
P(Xn ∈ B) ≤ limsup P(Xn ∈ B) ≤ μ(B) for alle B ∈ B(S).<br />
n<br />
Dvs. specielt: Xn ∼ → μ ⇒ limn P(Xn ∈ B) = μ(B) hvis μ(bd(B)) = 0.<br />
Læseren opfordres igen til selv at formulere udsagnene i tilfældet Xn ∼ → X.<br />
Benyttes korollaret i tilfældet S = R på mængder af formen B = (−∞,x], fås, da B ◦ =(−∞,x[<br />
og B = B, at<br />
Xn ∼ → μ ⇒ μ((−∞,x[) ≤ liminf<br />
n<br />
og dermed, da μ({x}) = μ((−∞,x]) − μ((−∞,x[),<br />
Fn(x) ≤ limsup Fn(x) ≤ μ((−∞,x])<br />
n<br />
Xn ∼ → μ ⇒ lim n Fn(x) = μ((−∞,x]) hvis μ({x}) = 0.<br />
Fn er her fordelingsfunktionen for Xn. Dette giver anledning til flg. karakterisation af fordelingskonvergens<br />
på R.<br />
Konvergens i fordeling i R.<br />
Lad (Xn)n≥1 betegne en følge af stokastiske variable og lad μ betegne et Borel sandsynlighedsmål<br />
på R. Idet Fn er fordelingsfunktionen for Xn og Fμ funktionen x ↦→ μ((−∞,x])<br />
er flg. punkter ækvivalente<br />
a) Xn ∼ → μ<br />
b) Fμ(x−) ≤ liminfn Fn(x) ≤ limsup n Fn(x) ≤ Fμ(x) x ∈ R<br />
c) limn Fn(x) = Fμ(x) hvis Fμ(x−) = Fμ(x) dvs. hvis μ({x}) = 0<br />
d) limn Fn(x) = Fμ(x) for x ∈D hvor D er tæt i R<br />
e) liminfn P(a < Xn < b) ≥ μ(]a,b[) for alle −∞ < a < b < ∞.<br />
Dvs. hvis X er en stokastisk variabel med fordelingsfunktion F, er flg. punkter ækvivalente<br />
a1) Xn ∼ → X<br />
168
1) F(x−) ≤ liminfn Fn(x) ≤ limsup n Fn(x) ≤ F(x) x ∈ R<br />
c1) limn Fn(x) = Fμ(x) hvis F(x−) = F(x) dvs. hvis P(X = x) = 0<br />
d1) limn Fn(x) = F(x) for x ∈D hvor D er tæt i R<br />
e1) liminfn P(a < Xn < b) ≥ P(a < X < b) for alle −∞ < a < b < ∞.<br />
Bevis. Da sidste del er en umiddelbar oversættelse, vises kun første del. Her mangler vi kun<br />
at vise, at d) ⇒ e) ⇒ a). Lad derfor a < b betegne givne reelle tal. Da D er tæt i R, findes der<br />
følger (ak)k≥1 og (bk)k≥1 af elementer i D, så at<br />
For alle n,k ≥ 1 gælder derfor<br />
D.v.s.<br />
a < ak < bk < b og ak ↓ a og bk ↑ b.<br />
P(a < Xn < b) ≥ P(ak < Xn ≤ bk) = Fn(bk) − Fn(ak) →n→∞ Fμ(bk) − Fμ(ak).<br />
liminf<br />
n<br />
P(a < Xn < b) ≥ sup(Fμ(bk)<br />
− Fμ(ak)) = μ(]a,b[)<br />
k<br />
og dermed d) ⇒ e). For at vise den manglende implikation lader vi G ⊆ R betegne en begrænset<br />
åben mængde. Som vist i Appendiks F findes der højst tællelig mange parvis disjunkte<br />
intervaller (]ai,bi[)i≥1, så at G = <br />
i≥1]ai,bi[. Under antagelse af e) gælder derfor<br />
≤ liminf<br />
n<br />
μ(G) = sup<br />
k<br />
∑ j≥1<br />
∑<br />
1≤ j≤k<br />
μ(]aj,bj[) ≤ sup<br />
k<br />
∑<br />
1≤ j≤k<br />
liminf<br />
n<br />
P(a j < Xn < b j)<br />
P(a j < Xn < b j) ≤ liminf<br />
n<br />
P(Xn ∈ <br />
]a j,bj[) ≤ liminf<br />
n<br />
j≥1<br />
P(Xn ∈ G).<br />
Lad dernæst G betegne en vikårlig åben mængde. Da<br />
fås af det netop viste<br />
liminf<br />
n<br />
P(Xn ∈ G) ≥ sup<br />
k<br />
Gk := G∩ ] − k,k[ ↑ G for k → ∞<br />
liminf<br />
n<br />
P(Xn ∈ Gk) ≥ supμ(Gk)<br />
= μ(G).<br />
k<br />
Implikationen e) ⇒a) følger nu af Portmanteau sætningen. ♦<br />
Det er værd at bemærke, at hvis Fμ er kontinuert, dvs. hvis μ({x}) ≡ 0, gælder endvidere, se<br />
Appendiks F,<br />
Xn ∼ → μ ⇒ sup |Fn(x) − Fμ(x)| →n→∞ 0,<br />
x∈R<br />
dvs. Fn’erne konvergerer i dette tilfælde uniformt imod Fμ.<br />
169
Regneregler for konvergens i fordeling.<br />
Portmanteau Sætning II.<br />
Lad (S,d) og (T δ) betegne separable metriske rum og lad (Xn)n≥1 og X hhv. (Yn)n≥1 og Y<br />
betegne stokastiske funktioner med værdier i S hhv. T . Da gælder<br />
1) Xn ∼ → X ⇒ f(Xn) ∼ → f(X) for Borel funktioner f : S → T , som kontinuerte PX-n.o.<br />
2) Xn ∼ → X og X degenereret ⇒ Xn → X i sandsynlighed.<br />
3) Xn ∼ → X, Yn ∼ → Y og Y degenereret ⇒ (Xn,Yn) ∼ → (X,Y).<br />
4) Xn ∼ → X, Yn ∼ → Y og Xn og Yn uafhængige n ≥ 1 ⇒ (Xn,Yn) ∼ → PX ⊗ PY .<br />
En ækvivalent og ofte mere anvendelig formulering af 1) og 3) lyder som flg. μ er her et<br />
Borel sandsynlighedsmål på S.<br />
1)’ Xn ∼ → μ ⇒ f(Xn) ∼ → μ ◦ f −1 for Borel funktioner f : S → T , som er kontinuerte μ-n.o.<br />
3)’ Xn ∼ → μ, Yn ∼ → Y og Y degenereret ⇒ (Xn,Yn) ∼ → μ ⊗ PY .<br />
Bevis. For ethvert g ∈ bC(T) er sammensætningen g ◦ f Borel målelig og kontinuert PX-n.o.<br />
Ifølge Fk 5a gælder derfor<br />
<br />
E[g( f(Xn))] = E[g ◦ f(Xn)] →n→∞ g ◦ f dPX = gdPf(X), hvilket viser 1). I 2) antages P(X = a) = 1. Da x ↦→ d(x,a) ∧ 1 ∈ bC(S) fås<br />
E[d(Xn,X) ∧ 1] = E[d(Xn,a) ∧ 1] →n→∞ E[d(X,a) ∧ 1] = d(a,a) ∧ 1 = 0,<br />
dvs. 2) er også vist. I 3) antages P(Y = a) = 1. Definer<br />
˜<br />
d1((x1,y1),(x2,y2)) := d(x1,x2) ∧ 1+δ(y1,y2) ∧ 1 x1,x2 ∈ S, y1,y2 ∈ T.<br />
d1<br />
˜ er da en produktmetrik og for et vilkårligt element g ∈ Lip(S × T, d)+ ˜ gælder<br />
|E[g(Xn,Yn)] − E[g(X,Y)]| = |E[g(Xn,Yn)] − E[g(X,a)]|<br />
≤ E[|g(Xn,Yn) − g(Xn,a)|]+|E[g(Xn,a)] − E[g(X,a)]|<br />
≤ M · E[δ(Yn,a) ∧ 1]+|E[g(Xn,a)] − E[g(X,a)]| →n→∞ 0<br />
da x ↦→ g(x,a) ∈ bC(S) og Yn → a i sandsynlighed. Påstanden følger derfor af den første<br />
Portmanteu sætning.<br />
Det generelle bevis for 4) gennemgås ikke, men det vigtige specialtilfælde, hvor S = R n og<br />
T = R m , behandles senere i forbindelse med Kontinuitetssætningen.<br />
Det er værd at understrege, at 3) ikke gælder generelt. Dvs. vedrørende konvergens i fordeling<br />
kan vi ikke som i tilfældet med konvergens n.o. eller konvergens i sandsynlighed udlede<br />
konvergens af vektoren ud fra konvergens af marginalerne. Et simpelt eksempel, der viser<br />
dette, er beskrevet i flg. situation.<br />
Lad X betegne en U(−1,1)-fordelt stokastisk variabel, dvs. X ∼ −X, og sæt for alle n ≥ 1<br />
Xn = Yn = X og Y = −X.<br />
170
Da gælder oplagt Xn ∼ → X og Yn ∼ → Y . Hvis 3) derfor var sand uden restriktioner, ville<br />
(Xn,Yn) ∼ → (X,Y) og dermed ifølge 2), da (x,y) ↦→ x+y er kontinuert,<br />
dvs. PX = δ0, hvilket oplagt ikke er rigtigt.<br />
2X = Xn +Yn ∼ → X +Y = 0,<br />
171
Kontinuitetssætningen for karakteristiske funktioner.<br />
Fra reel analyse vides, at en følge (xk)k≥1 i R n er konvergent, hvis og kun hvis<br />
(xk)k≥1 er begrænset, og L((xk)k≥1) indeholder højst et punkt,<br />
hvor jævnfør Appendiks B L((xk)k≥1) betegner mængden af limespunkter, dvs.<br />
L((xk)k≥1) := {x ∈ R n |∃(kl)l≥1 delfølge : xkl → x}.<br />
Resultatet bygger på, at en begrænset mængde B ⊆ R n er prekompakt, dvs.<br />
(xk)k≥1 ⊆ B ⇒ L((xk)k≥1) = /0.<br />
Dette generaliserer uændret til et vilkårligt metrisk rum (S,d), idet der gælder<br />
En punktfølge (xn)n≥1 i S er konvergent, hvis og kun hvis mængden {xn |n ≥ 1} er prekompakt,<br />
og L((xn)n≥1) indeholder højst et punkt.<br />
Bevis. Kun hvis delen er allerede vist i Appendiks B. Da (xn)n≥1 er prekompakt, indeholder<br />
L((xn)n≥1) et punkt {x}, og vi vil nu vise, at xn → x. Antag at dette ikke gælder, dvs.<br />
∃r > 0 ∃(nl)n≥1 delfølge : xnl<br />
/∈ b(x,r) for alle l ≥ 1.<br />
Ifølge antagelsen er (xnl )l≥1 også prekompakt og har derfor mindst et limespunkt ˜x. Men<br />
da L((xnl )l≥1) ⊆ L((xn)n≥1) må der gælde ˜x = x, hvilket er umuligt, da d(x,xkl ) > r for alle<br />
l ≥ 1. Påstanden er hermed vist. ♦<br />
Med baggrund heri indføres nu et prekompakthedsbegreb svarende til konvergens i fordeling<br />
for stokastiske funktioner med værdier i et polsk rum (S,d). Men da vi i dette kursus kun<br />
ser på S = R n , vil vi i det følgende udelukkende koncentrere os om dette tilfælde. Begrebets<br />
betydning og konsekvenser overføres dog uændret til ethvert polsk rum.<br />
Definition. En familie af sandsynlighedsmål {μi |i ∈ I} på (Rn ,B(Rn )) siges at være stram<br />
(tight), hvis<br />
∀ε > 0, ∃K ⊆ R n kompakt : sup μi(K<br />
i∈I<br />
c ) < ε,<br />
og en familie af n-dimensionale stokastiske vektorer (X i)i∈I siges at være stram, hvis mængden<br />
af fordelingsmål {PX i |i ∈ I} udgør en stram familie, dvs. hvis<br />
∀ε > 0, ∃K ⊆ R n kompakt : sup<br />
i∈I<br />
P(X i /∈ K) < ε.<br />
Da kompakthed i R n er det samme som at være lukket og begrænset, er dette ækvivalent med<br />
∀ε > 0, ∃r > 0 : P(X i > r) < ε for alle i ∈ I,<br />
hvor x 2 := ∑ n j=1 x2 j for x ∈ Rn . Markov’s ulighed sikrer derfor flg. kriterium.<br />
Stramhed i R n . Momentbetingelse. En familie (X i)i∈I af n-dimensionale stokastiske vektorer<br />
er stram, hvis der findes et α > 0 så at<br />
supE[X<br />
i<br />
i∈I<br />
α ] < ∞.<br />
172
Definitionen viser umiddelbart, at stramhed ligesom begrænsethed og mere generelt prekompakthed<br />
er stabil under endelig foreningsmængdedannelse, samt at delmængder af stramme<br />
mængder igen er stramme, og ikke overraskende gælder tillige flg. udsagn.<br />
Eksempler på stramhed. Enhver endelig mængde af sandsynlighedsmål er stram, og ligeledes<br />
er enhver følge af stokastiske funktioner (X k)k≥1, som konvergerer i fordeling, stram.<br />
Bevis. Hvad angår endelige mængder, er det nok at vise, at alle etpunkts mængder er<br />
stramme. For R n -tilfældet er dette en umiddelbar konsekvens af, at R n er voksende foreningsmængde<br />
af kompakte mængder, f.eks. b(0,k). Det generelle bevis, der udnytter en i<br />
polske rum gældende alternativ karakterisation af kompakthed, kan findes i afsnittet "Mål på<br />
metriske rum".<br />
Anden del vises kun i R n -situationen. Antag derfor at (X k)k≥1 konvergerer i fordeling imod<br />
et Borel sandsynlighedsmål μ på R n . Som vist i korollaret til Portmanteau Sætning I gæder<br />
derfor<br />
lim k P(X k > r) = μ(R n \ b(0,r)) r > 0<br />
hvis μ(bd(b(0,r))) = 0, dvs. alle pånær tællelig mange r, da<br />
Lad ε > 0 være givet og vælg r1 så at<br />
Der findes derfor et k0 så at<br />
bd(b(0,r1)) ∩ bd(b(0,r2)) = /0 hvis r1 = r2.<br />
lim k P(X k > r1) = μ(R n \ b(0,r1)) < ε/2.<br />
P(X k > r1) < ε for k ≥ k0.<br />
Men da den endelige mængde {X k |,1 ≤ k ≤ k0} er stram, kan vi vælge et r2, så at<br />
og for r := r1 ∨ r2 gælder derfor<br />
P(X k > r2) < ε for 1 ≤ k ≤ k0,<br />
sup<br />
k<br />
P(X k > r) < ε. ♦<br />
Som allerede udnyttet i det netop gennemførte bevis, sikrer stramhed af enhver endelig familie<br />
af mål eller stokastiske vektorer, at en følge (X k)k≥1 er stram, hvis man kan vise, at<br />
∀ε > 0, ∃K ⊆ R n kompakt : limsup P(Xk /∈ K) ≤ ε.<br />
k<br />
eller ækvivalent<br />
∀ε > 0, ∃r > 0 : limsup P(X k > r) ≤ ε.<br />
k<br />
Dette udnyttes f.eks. i beviset for flg. ækvivalente beskrivelse af stramhed.<br />
Stramhed i Rn . En følge (Xk)k≥1 af n-dimensionale stokastiske vektorer er stram hvis og<br />
kun hvis<br />
∀ε > 0, ∃a > 0 : liminf E[e<br />
k<br />
−a2 ·X k2 ] > 1 − ε.<br />
173
Bevis. Lad ε > 0 være givet. Vælg a > 0, så at<br />
liminf E[e<br />
k<br />
−a2 ·X k2 ] > 1 − ε/2 eller ækvivalent limsup(1<br />
− E[e<br />
k<br />
−a2 ·Xk2 ]) < ε/2.<br />
Da x ↦→ 1 − e−a2x2 er voksende på R+ fås af Markov’s ulighed at<br />
P(X k > 1/a) = P(1 − e −a2 ·X k 2<br />
for alle k ≥ 1, og da 1 − e −1 > 1/2 har vi derfor<br />
> 1 − e −1 ) ≤ 1 − E[e−a2 ·X k 2<br />
]<br />
1 − e −1<br />
limsup P(Xk > 1/a) < 2ε/2 = ε,<br />
k<br />
hvilket, som nævnt, medfører stramhed. Kun-hvis-delen overlades til læseren. ♦<br />
Det næste resultat viser, at stramhed er det kompakthedsbegreb for fordelingskonvergens i<br />
R n , som vi har antydet. Der gælder et tilsvarende resultat i ethvert polsk rum, men den generelle<br />
sætning, der er kendt under navnet Prokhorov’s Sætning, er noget mere kompliceret.<br />
Helly-Bray’s Sætning.<br />
Enhver stram følge (Xk)k≥1 af n-dimensionale stokastiske vektorer har mindst et limespunkt,<br />
dvs. der findes en delfølge (kl)l≥1 og et Borel sandsynlighedsmål μ på Rn ∼<br />
, så at Xkl → μ.<br />
En følge af n-dimensionale stokastiske vektorer (Xk)k≥1 konvergerer derfor i fordeling, hvis<br />
og kun hvis den er stram og har højst et limespunkt.<br />
Første del vises kun i tilfældet n = 1. Tilfældet n > 1 klares på ’næsten’ samme måde, men<br />
er dog mere kompliceret, både hvad angår opskrivning og indhold.<br />
Bevis. Lad Fk betegne fordelingsfunktionen for Xk. Ifølge Helly’s Lemma (se Appendiks F)<br />
eksisterer der da en delfølge (kl)l≥1 og en højrekontinuert voksende funktion F : R → R, så<br />
at<br />
0 ≤ F ≤ 1 og limFkl (x) = F(x) for alle x ∈ CF,<br />
l<br />
hvor CF betegner mængden af kontinuitetspunkter for F. Da stramhed af (Xk)k≥1 i R kan<br />
formuleres som<br />
ses, da CF er tæt i R, at<br />
∀ε > 0, ∃r > 0 : supFk(−r)<br />
≤ ε og inf<br />
k<br />
k Fk(r) ≥ 1 − ε<br />
lim F(x) = 0 og lim F(x) = 1.<br />
x→−∞ x→∞<br />
Lebesgue-Stieltjes målet λF hørende til F er derfor et sandsynlighedsmål, da<br />
λF(R) = lim<br />
r→∞ λF(] − r,r]) = lim<br />
r→∞ (F(r) − F(−r)) = 1,<br />
∼<br />
og vi vil nu vise, at Xkl → λF. Men da F(x) = λF(] − ∞,x]) for alle x ∈ R er dette en umiddelbar<br />
konsekvens af resultatet angående fordelingskonvergens i R.<br />
Hvad angår anden del, mangler vi kun at vise hvis-delen. Lad derfor μ betegne et limespunkt.<br />
174
Stramheden sikrer eksistensen af et sådant. Antag nu at (Xk)k≥1 ikke konvergerer i fordeling<br />
mod μ. Pr. definition af konvergens i fordeling findes der altså en funktion f ∈ bC(Rn ), et<br />
ε > 0 og en delfølge (kl)l≥1, så at<br />
<br />
|E[ f(X kl )] −<br />
f dμ | > ε for alle l ≥ 1.<br />
Da følgen (X kl )l≥1 også er stram, har den derfor et limespunkt. Men da dette ligeledes er et<br />
limespunkt for hele følgen, må det ifølge entydigheden være μ, hvilket tydeligvis er umuligt<br />
i hht. valget af (kl)l≥1. ♦<br />
Korollar. En stram følge af n-dimensionale stokastiske vektorer (X k)k≥1 konvergerer i fordeling,<br />
hvis limk ϕX k (t) eksisterer for alle t ∈ R n .<br />
Bevis. Ifølge Helly-Bray’s Sætning er det nok at vise, at der højst er et limespunkt. Antag<br />
derfor at μ og ν er limespunkter, d.v.s. der findes delfølger (k(l))l≥1 og (k(m))m≥1, så at<br />
Da<br />
X k(l)<br />
∼<br />
∼<br />
→ μ og Xk(m) → ν.<br />
t ↦→ cos(t · a) og t ↦→ sin(t · a)<br />
er kontinuerte og begrænsede for ethvert a ∈ Rn , betyder dette, at<br />
<br />
e it·a <br />
μ(da) = limϕX (t) = limϕX (t) = limϕX (t) =<br />
k(l) k<br />
l k m k(m)<br />
e it·a ν(da)<br />
for alle t ∈ R n , dvs. ˆμ = ˆν. Ifølge Entydighedssætningen for karakteristiske funktioner er μ<br />
og ν derfor identiske, dvs., der er højst et limespunkt. ♦<br />
Afsnittets hovedsætning viser, at fordelingskonvergens i R n er ækvivalent med punktvis konvergens<br />
af de tilhørende karakteristiske funktioner. Der gælder nemlig flg. resultat.<br />
Kontinuitetssætningen for karakteristiske funktioner.<br />
Lad (Xk)k≥1 betegne n-dimensionale stokastiske vektorer, så at limk ϕX (t) = γ(t) for alle<br />
k<br />
t ∈ Rn , hvor γ : Rn → C er kontinuert i 0. Da findes der et Borel sandsynlighedsmål μ på<br />
Rn ∼<br />
, så at Xk → μ, og μ er karakteriseret ved, at ˆμ(t) = γ(t) for alle t ∈ Rn .<br />
Bevis. Da den ligheden ˆμ = γ er åbenbar, udestår der set i lyset af ovenstående korollar kun<br />
at vise implikationen<br />
γ kontinuert i 0 ⇒ (X k)k≥1 stram.<br />
Ifølge Kf 1 er |γ(t)| ≤ γ(0) = 1 for alle t ∈ R n . Dvs. hvis U1,...,Un er uafhængige N(0,2)fordelte<br />
stokastiske variable og U := (U1,...,Un), sikrer γ’s kontinuitet i punktet 0, at der til<br />
et givent ε findes et a > 0, så at<br />
|E[γ(aU)]| > 1 − ε,<br />
thi for an → 0 konvergerer γ(anU) mod γ(0) = 1 P-n.o. domineret af 1. Men da<br />
ϕU(t) =<br />
n<br />
∏ϕUi i=1<br />
(ti)<br />
n<br />
= ∏exp(−t i=1<br />
2 i ) = e −t2<br />
175<br />
for alle t ∈ R n ,
fås af antagelserne, Lebesgue’s Sætning samt Kf 4, at<br />
E[γ(aU)] = lim k E[ϕX k (aU)] = lim k E[ϕU(aX k)] = lim k E[e −a2 ·X k 2<br />
].<br />
D.v.s. liminfk E[e −a2 ·X k 2<br />
] > 1 − ε, og som ovenfor vist, er (X k)k≥1 er derfor stram. ♦<br />
Korollar 1 Lad (X k)k≥1 og X betegne n-dimensionale stokastiske vektorer og μ et Borel<br />
sandsynlighedsmål på R n . Da gælder<br />
og tilsvarende<br />
Specielt ses at X k<br />
X k<br />
X k<br />
∼<br />
→ X ⇔ lim k ϕX k (t) = ϕX(t) for alle t ∈ R n ,<br />
∼<br />
→ μ ⇔ lim k ϕX k (t) = ˆμ(t) for alle t ∈ R n .<br />
∼<br />
→ X i R n ⇔ t · X k<br />
∼<br />
→ t · X i R for alle t ∈ R n .<br />
Bevis. Første del er klar, da ϕX og ˆμ er kontinuerte overalt specielt i 0. Anden del ses ved at<br />
bemærke, at<br />
ϕY(t) = ϕZ(1) hvor Z = t ·Y<br />
for enhver n-dimensional stokastisk vektor Y og ethvert t ∈ R n .<br />
Korollar 2 Lad Xog (X k)k≥1 samt Y og (Y k)k≥1 betegne hhv. n og m-dimensionale stokastiske<br />
vektorer, så at X k og Y k er uafhængige for alle k. Da gælder<br />
Bevis. Da<br />
X k<br />
for alle (t,s) ∈ R n × R m = R n+m og<br />
∼<br />
∼<br />
→ X og Y k → Y ⇒ (Xk,Y k) ∼ → PX ⊗ PY.<br />
ϕ (Xk,Y k)(t,s) = ϕX k (t) · ϕY k (s) →k→∞ ϕX(t) · ϕY(s)<br />
(t,s) ↦→ ϕX(t) · ϕY(s)<br />
er kontinuert, sikrer Kontinuitetssætningen, at ((X n,Y n))n≥1 konvergerer i fordeling. Identifikationen<br />
af grænsemålet følger dernæst af Entydighedssætningen, da<br />
(t,s) ↦→ ϕX(t) · ϕY(s)<br />
ifølge Kf 5 er den Fouriertransformerede for sandsynlighedsmålet PX ⊗ PY . ♦<br />
176
Den Centrale Grænseværdisætning.<br />
Kontinuitetssætningen er det ideelle værktøj til at undersøge flg. konvergensproblem ofte<br />
omtalt som et CLT-problem (Central Limit Theorem).<br />
Givet en følge af uafhængige stokastiske variable (Xn)n≥1, findes der da to reelle talfølger<br />
(an)n≥1 ⊆ (0,∞) og (bn)n≥1 ⊆ R, så at<br />
<br />
n 1<br />
∼<br />
∑ Xk − bn → μ,<br />
an k=1<br />
hvor μ er et sandsynlighedsmål, som ikke er koncentreret i et punkt, dvs. ikke-degenereret.<br />
Udtrykt ved hjælp af Kontinuitetssætningen er dette ækvivalent med at spørge om eksistensen<br />
af (an)n≥1 ⊆ (0,∞) og (bn)n≥1 ⊆ R, så at<br />
lim n e it bn/an ·<br />
n<br />
∏<br />
k=1<br />
ϕXk (t/an) →n ψ(t) t ∈ R,<br />
hvor ψ er en karakteristisk funktion for ikke degenereret fordeling. Formuleret på denne<br />
sidste måde, er det naturligt også at lade ϕXk ’erne variere med n, dvs. i stedet for at tage udgangspunkt<br />
i en følge af uafhængige stokastiske variable, starter vi med et såkaldt uafhængigt<br />
trekantsskema (Xn j)1≤ j≤n, dvs.<br />
X11<br />
X21, X22<br />
······<br />
Xn1, Xn2, ..., Xnn<br />
·········<br />
hvor Xn1, Xn2, ..., Xnn er uafhængige for alle n ≥ 1. En følge af uafhængige variable (Xn)n≥1<br />
kan opfattes som et uafhængigt trekantsskema (Xn j)1≤ j≤n ved fastsættelsen<br />
Xn j = Xj for alle 1 ≤ j ≤ n.<br />
Problemet er nu, om der findes konstanter (an)n≥1 ⊆ (0,∞) og (bn)n≥1 ⊆ R eller retterere<br />
(mnk)1≤k≤n ⊆ R så at<br />
1<br />
an<br />
<br />
n n<br />
∑ Xnk − ∑ mnk<br />
k=1 k=1<br />
<br />
= 1<br />
<br />
n<br />
∑ (Xnk − mnk)<br />
an k=1<br />
konvergerer i fordeling mod en ikke degeneret fordeling, eller ækvivalent om<br />
n<br />
∏ ϕXnk−mnk<br />
k=1<br />
(t/an) = exp(− it<br />
an<br />
n<br />
∑<br />
k=1<br />
n<br />
mnk) · ∏<br />
k=1<br />
ϕXnk (t/an) → ψ(t)<br />
for alle t ∈ R, hvor ψ er den karakteristiske funktion for en ikke degenereret fordeling.<br />
177
For at udelukke at et enkelt led Znk = (Xnk − mnk)/an i summen er alt dominerende, restrikterer<br />
man sig normalt til situationer, hvor den såkaldte uan-betingelse, dvs.<br />
lim n max<br />
1≤k≤n P(|Znk | ≥ ε) = 0 for alle ε > 0,<br />
er opfyldt. Uan-betingelsen bevirker, at kun helt specielle fordelingsfordelinger kan fremkomme<br />
som grænseværdi på ovennævnte måde. Dette gælder f.eks. poisson og normale<br />
fordelinger, men derimod ikke binomial og uniforme fordelinger. Helt præcist er de eneste<br />
mulige grænsefordelinger under uan-betingelsen de såkaldte uendelig delelige fordelinger,<br />
hvor en stokastisk variabel X siges at have en uendelig delelig fordeling, hvis der for ethvert<br />
naturligt tal n findes stokastiske variable X1,...,Xn, som er uafhængige og identisk fordelte,<br />
så at<br />
X ∼ X1 + ···+Xn.<br />
Uan-betingelsen og endog det stærkere limn P(max1≤k≤n |Znk | ≥ ε) = 0 for alle ε > 0 er<br />
specielt opfyldt, hvis<br />
n<br />
∑ P(|Znk | ≥ ε) →n→∞ 0 for alle ε > 0.<br />
k=1<br />
Denne såkaldte Raikov-betingelse er tæt knyttet til de normale CLT-resultater, dvs. udsagn<br />
som sikrer, at grænsefordelingen eksisterer og er en normal fordeling. Vi skal udelukkende<br />
beskæftige os med denne uden sammenligning historisk vigtigste type, idet vi skal omtale tre<br />
normale CLT-resultater samt diskutere relationerne mellem dem. Udgangspunktet er i alle tre<br />
situationer et uafhængigt trekantsskema, hvor de indgående variable alle har endeligt andet<br />
moment, og konstanterne (man bruger her normalt betegnelsen sn i stedet for an) vælges i<br />
hht. flg. opskrift<br />
mnk := E[Xnk] 1 ≤ k ≤ n og sn :=<br />
<br />
n<br />
∑ Var(Xnk) n ≥ 1.<br />
k=1<br />
CLT 1 Den Centrale Grænseværdisætning, klassisk udgave.<br />
Lad (Xn)n≥1 betegne en iid-følge, hvor den fælles fordeling har endelig middelværdi μ og<br />
varians σ 2 > 0. Da konvergerer<br />
Un := 1<br />
√ nσ 2<br />
n<br />
∑<br />
j=1<br />
(Xj − μ) ∼ → N(0,1).<br />
Bevis. Lad ϕ betegne den karakteristiske funktion for X1 − μ. Regnereglerne for karakteristiske<br />
funktioner viser, at for alle t ∈ R og n ≥ 1 er<br />
ϕUn (t) = ϕ(t/√nσ 2 ) n <br />
= 1 − n(1 − ϕ(t/√nσ 2 n ))<br />
.<br />
n<br />
Men da E[X1 − μ] = 0 og Var(X1 − μ) = σ 2 fås af et vist Taylorudviklings resultat for karakteristiske<br />
funktioner, at n(1 − ϕ(t/ √ nσ 2 ) → t 2 /2 og dermed, se Appendiks G,<br />
ϕUn (t) →n→∞ e −t2 /2<br />
t ∈ R.<br />
Det ønskede resultat følger nu umiddelbart af Kontinuitetssætningen. ♦<br />
178
CLT 2 Lyapounov’s Sætning.<br />
Lad {Xn j |1 ≤ j ≤ n} betegne et uafhængigt trekantsskema, så at Xn j’erne har endelig første<br />
og andet moment. Sæt<br />
μn j = E[Xn j], σ 2 n j = Var(Xn j) og sn :=<br />
<br />
σ 2 n1 + ···+σ 2 nn<br />
for n ≥ 1 og antag, at sn > 0 for alle n. Hvis Lyapounov’s betingelse er opfyldt, dvs. hvis<br />
konvergerer<br />
∃α > 2 : lim<br />
Un := 1<br />
1<br />
n→∞ sα n<br />
n<br />
∑ E[|Xn j − μn j|<br />
j=1<br />
α ] = 0,<br />
n<br />
∑(Xn<br />
j − μn j)<br />
sn j=1<br />
∼ → N(0,1).<br />
Lyapounov’s betingelse er specielt opfyldt, hvis sn →n→∞ ∞ og Xn j − μn j’erne er uniformt<br />
begrænsede af en konstant M. For i denne situation gælder<br />
1<br />
s 3 n<br />
n<br />
∑ E[|Xn j − μn j|<br />
j=1<br />
3 ] ≤ M<br />
s3 n<br />
n<br />
∑ E[|Xn j − μn j|<br />
j=1<br />
2 ] = M<br />
→n→∞ 0.<br />
sn<br />
I beviset kan vi uden tab af generalitet antage, at Lyapounov’s betingelse er opfyldt for et α<br />
i intervallet ]2,3]. For betragt for givet n ≥ 1 produktrummet<br />
Ω × En, hvor En := {1,...,n},<br />
udstyret med produkt σ-algebraen F × 2En . Definer<br />
μn(A) :=<br />
<br />
Zn<br />
E[1A(·, j) · j 2<br />
<br />
] A ∈ F × 2 En ,<br />
n<br />
∑<br />
j=1<br />
hvor Zn j := Xn j − μn j for alle n og j. μn er da et sandsynlighedsmål, og ifølge korollaret til<br />
Jensen’s ulighed gælder derfor for ethvert δ ≥ 1, at<br />
<br />
1<br />
Zn<br />
E[ j <br />
<br />
·<br />
<br />
<br />
<br />
<br />
hvor<br />
<br />
≤ (<br />
s 3 n<br />
f δ dμn) 1/δ ≤<br />
n<br />
∑ E[|Zn j|<br />
j=1<br />
3 ] =<br />
n<br />
∑<br />
j=1<br />
<br />
<br />
E[ <br />
<br />
<br />
<br />
f(ω, j) := <br />
<br />
Zn j<br />
sn<br />
<br />
<br />
<br />
<br />
n<br />
∑<br />
j=1<br />
δ<br />
Zn j(ω)<br />
sn<br />
<br />
<br />
· <br />
<br />
Zn j<br />
sn<br />
sn<br />
sn<br />
<br />
2 1/δ<br />
<br />
<br />
<br />
]<br />
Zn j<br />
sn<br />
=<br />
<br />
2<br />
<br />
<br />
] =<br />
<br />
1<br />
s 2+δ<br />
n<br />
f dμn<br />
<br />
<br />
<br />
for alle (ω, j) ∈ Ω × En.<br />
n<br />
∑ E[|Zn j|<br />
j=1<br />
2+δ 1/δ ] ,<br />
Bevis for Lyapounov’s Sætning. Lad fortsat notationen Zn j = Xn j − μn j for 1 ≤ j ≤ n være<br />
gældende. Ifølge Kontinuitetssætningen er det nok at vise, at<br />
ϕUn (t) = ϕ ∑ n j=1 Zn j (t/sn) =<br />
n<br />
∏ ϕZn j<br />
j=1<br />
(t/sn) →n→∞ e −t2 /2<br />
for alle t ∈ R.<br />
179
Lad t ∈ R være givet. Da s 2 n = ∑n j=1 σ 2 n j er<br />
|ϕUn (t) − e−t2 /2 | = |<br />
n<br />
∏ ϕZn j<br />
j=1<br />
(t/sn) −<br />
n<br />
∏ exp(−t<br />
j=1<br />
2 σ 2 n j /2s2n )|,<br />
og benyttes nu at for ethvert sæt af komplekse tal a1,...,an og b1,...,bn med længde højst<br />
1 er<br />
fås<br />
≤<br />
|<br />
n<br />
∏<br />
j=1<br />
a j −<br />
n<br />
n−1<br />
∏ b j| ≤ |(an − bn) · ∏<br />
j=1<br />
j=1<br />
n−1 n−1<br />
≤ |an − bn|+| ∏ a j − ∏ b j| ≤ ··· ≤<br />
j=1 j=1<br />
|ϕUn (t) − e−t2 /2 | ≤<br />
n<br />
∑ |ϕZn j<br />
j=1<br />
(t/sn) − 1+ t2 σ<br />
2<br />
2 n j<br />
s2 |+<br />
n<br />
Da E[Zn j] = 0 og Var(Zn j) = σ 2 n j<br />
n−1 n−1<br />
a j|+|bn ·( ∏ a j − ∏ b j)|<br />
j=1 j=1<br />
n<br />
∑ |a j − b j|,<br />
j=1<br />
n<br />
∑ |ϕZn j<br />
j=1<br />
(t/sn) − exp(−t 2 σ 2 n j /2s2n )|<br />
n<br />
∑ |exp(−<br />
j=1<br />
t2<br />
2<br />
σ 2 n j<br />
s 2 n<br />
) − 1+ t2<br />
2<br />
σ 2 n j<br />
< ∞ viser en tidligere formuleret konsekvens af Kf 8, at<br />
|ϕZn j (t/sn) − 1+ t2<br />
2<br />
σ 2 n j<br />
s 2 n<br />
| ≤ |t| α E[|Zn j| α ]<br />
sα ,<br />
n<br />
og da endvidere |e −x − 1+x| ≤ x 2 for x ≥ 0, har vi alt i alt<br />
|ϕUn (t) − e−t2 /2 α<br />
| ≤ |t| n E[|Zn j|<br />
∑<br />
j=1<br />
α ]<br />
sα +<br />
n<br />
t4<br />
4<br />
Her går det første led imod 0 pr. antagelse, og da<br />
n<br />
∑<br />
j=1<br />
<br />
σ 2 2<br />
n j<br />
s 2 n<br />
σ<br />
≤ max<br />
1≤ j≤n<br />
2 n j<br />
s2 n<br />
mangler vi kun at vise, at limn max1≤ j≤n σ 2 n j /s2 n<br />
samt Lyapounov’s betingelse, idet<br />
σ<br />
max<br />
1≤ j≤n<br />
2 n j<br />
s2 n<br />
= max<br />
1≤ j≤n E[<br />
Xn j − μn j<br />
sn<br />
n σ<br />
∑<br />
j=1<br />
2 n j<br />
s2 n<br />
<br />
2<br />
1<br />
] ≤<br />
sα n<br />
180<br />
n<br />
∑<br />
j=1<br />
<br />
σ 2 2<br />
n j<br />
s 2 n<br />
σ<br />
= max<br />
1≤ j≤n<br />
2 n j<br />
s2 n<br />
= 0. Men dette følger af Jensen’s ulighed<br />
.<br />
s 2 n<br />
n<br />
∑ E[|Xn j − μn j|<br />
j=1<br />
α 2/α ] . ♦<br />
|.
CLT 3 Lindeberg’s Sætning.<br />
Lad {Xn j |1 ≤ j ≤ n} betegne et uafhængigt trekantsskema, så at Xn j’erne har endelig første<br />
og andet moment. Sæt<br />
μn j = E[Xn j], σ 2 n j = Var(Xn j) og sn :=<br />
<br />
σ 2 n1 + ···+σ 2 nn<br />
for n ≥ 1 og antag, at sn > 0 for alle n. Hvis Lindeberg’s betingelse er opfyldt, dvs. hvis<br />
konvergerer<br />
lim<br />
n→∞ s−2 n<br />
n <br />
∑ (Xn j − μn j)<br />
j=1 {|Xn j−μn j|>εsn}<br />
2 dP = 0 for alle ε > 0<br />
Un := 1<br />
n<br />
∑(Xn<br />
j − μn j)<br />
sn j=1<br />
∼ → N(0,1).<br />
Bevis. Ifølge Kontinuitetssætningen er det nok at vise, at for ethvert t ∈ R gælder<br />
ϕUn (t) =<br />
n<br />
∏ ϕ ˜Xn j<br />
j=1<br />
(t) →n→∞ e −t2 /2<br />
,<br />
hvor ˜Xn j = (Xn j − μn j)/sn. Lad t ∈ R være givet. Ved at bruge en allerede benyttet vurdering<br />
af afstanden mellem to produkter af komplekse tal, hvis faktorer har længde højst 1, fås, da<br />
∑ n j=1 E[ ˜X 2 n j ] = 1 for alle n, at<br />
|ϕUn (t) − e−t2 /2 | = |<br />
n<br />
∏ ϕ ˜Xn j<br />
j=1<br />
(t) −<br />
n<br />
∏<br />
j=1<br />
− t2<br />
e 2 ·E[ ˜X 2 n j ] | ≤<br />
Uligheden |e −x − 1+x| ≤ x 2 for x ≥ 0 viser, at for alle j og n er<br />
dvs.<br />
n<br />
t2<br />
∑ |ϕ ˜Xn<br />
(t) − e− 2<br />
j<br />
j=1<br />
·E[ ˜X 2 n j ] |.<br />
t2<br />
|ϕ ˜Xn<br />
(t) − e− 2<br />
j ·E[ ˜X 2 n j ] t2<br />
| ≤ |ϕ ˜Xn<br />
(t) − 1+<br />
j 2 · E[ ˜X 2 n j ]|+<br />
<br />
t2 2 · E[ ˜X 2 n j ]<br />
2<br />
,<br />
|ϕUn (t) − e−t2 /2 | ≤<br />
n<br />
t2<br />
∑ |ϕ ˜Xn<br />
(t) − 1+<br />
j<br />
j=1<br />
2 · E[ ˜X 2 t4<br />
n j ]|+<br />
4<br />
n<br />
∑ E[ ˜X<br />
j=1<br />
2 n j ]2 ,<br />
og vi skal derfor blot vise, at de to summer konvergerer mod 0 hver for sig.<br />
Hvad angår den sidste, har vi da ∑ n j=1 E[ ˜X 2 n j ] = 1, at for ethvert ε > 0 og n ≥ 1 er<br />
n<br />
∑ E[ ˜X<br />
j=1<br />
2 n j ]2 ≤ max<br />
1≤ j≤n E[ ˜X 2 n j ] ≤ ε2 +<br />
n<br />
∑ E[ ˜X<br />
j=1<br />
2 n j , | ˜Xn j| > ε],<br />
hvilket sammen med Lindeberg’s betingelse viser den ønskede konvergens. I forbindelse<br />
med den første sum benyttes uligheden (se Kf 8)<br />
|e iy − 1 − iy+y 2 /2| ≤ y 2 ∧ |y| 3 /6 y ∈ R.<br />
181
Da ˜Xn j’erne har middelværdi 0, fås heraf for alle 1 ≤ j ≤ n og ε > 0, at<br />
dvs.<br />
|ϕ ˜Xn j (t) − 1+t2 /2 · E[ ˜X 2 n j ]| = |E[eit ˜Xn j − 1 − it ˜Xn j +t 2 /2 · ˜X 2 n j ]|<br />
|<br />
≤ t 3 /6 · E[| ˜Xn j| 3 , | ˜Xn j| ≤ ε]+t 2 · E[ ˜X 2 n j , | ˜Xn j| > ε]<br />
≤ ε ·t 3 /6 · E[ ˜X 2 n j ]+t2 · E[ ˜X 2 n j , | ˜Xn j| > ε],<br />
n<br />
∑ E[e<br />
j=1<br />
it ˜Xn j 2<br />
− 1+t /2 · ˜X 2 n j ]| ≤ ε ·t3 n<br />
/6+ ∑ E[ ˜X<br />
j=1<br />
2 n j , | ˜Xn j| > ε],<br />
hvilket igen via Lindeberg’s betingelse viser den ønskede konvergens. D.v.s.<br />
|ϕUn (t) − e−t2 /2 | ≤<br />
n<br />
t2<br />
∑ |ϕ ˜Xn<br />
(t) − 1+<br />
j<br />
j=1<br />
2 · E[ ˜X 2 n j ]| →n→∞ 0,<br />
og Lindeberg’s Sætning er dermed vist. ♦<br />
CLT 3a Lyapounov’s betingelse medfører Lindeberg’s betingelse.<br />
Bevis. Lad ε > 0 være givet. For alle 1 ≤ j ≤ n og α > 2 har vi, at<br />
s −2<br />
<br />
n<br />
(Xn j − μn j)<br />
{|Xn j−μn j|>εsn}<br />
2 <br />
dP =<br />
{ |Xn j−μn j |<br />
sn<br />
>ε}<br />
(Xn j − μn j) 2<br />
≤ ε 2−α<br />
<br />
|Xn j − μn j| α<br />
sα dP ≤ ε<br />
n<br />
2−α · s −α<br />
n · E[|Xn j − μn j| α ],<br />
og dermed for alle ε > 0, n ≥ 1 og α > 2<br />
<br />
s −2<br />
n<br />
n<br />
∑<br />
j=1<br />
{|Xn j−μn j|>εsn}<br />
(Xn j − μn j) 2 dP ≤ ε 2−α · s −α<br />
n<br />
CLT 3b Lindeberg’s betingelse er opfyldt i iid-tilfældet.<br />
s 2 n<br />
dP<br />
n<br />
∑ E[|Xn j − μn j|<br />
j=1<br />
α ]. ♦<br />
Lad μ og σ 2 > 0 betegne den fælles middelværdi og varians. Da s 2 n = n · σ 2 fås dermed for<br />
ethvert ε > 0<br />
s −2<br />
n<br />
n<br />
∑<br />
j=1<br />
<br />
(Xn j − μn j)<br />
{|Xn j−μn j|>εsn}<br />
2 dP = σ −2<br />
<br />
{|X1−μ|> √ (X1 − μ)<br />
n·ε·σ}<br />
2 dP,<br />
som ifølge Lebesgue’s Sætning konvergerer mod 0 for n → ∞. ♦<br />
Regnereglerne for konvergens i fordeling viser, at for stokastiske variable (Xn)n≥1 og (Yn)n≥1<br />
gælder for ethvert σ 2 ∈ [0,∞), at<br />
Xn ∼ → N(0,σ 2 ) og Yn → 0 s.s. ⇒ Xn +Yn ∼ → N(0,σ 2 ).<br />
Denne ide kan ved at opsplitte givne variable i en ’lille’ og en ’stor’ del udnyttes til at bevise<br />
normale CLT-sætninger under svagere integrabilitetsbetingelser end de ovenfor anvendte.<br />
Opsplitningen sker normalt ved hjælp af en Borel funktion q : R → R, idet vi skriver<br />
Xn j = q(Xn j)+(Xn j − q(Xn j)),<br />
182
hvor så første del spiller rollen som den ’lille’ del og den anden den ’store’ del. Et eksempel<br />
på et sådant resultat er følgende.<br />
CLT 4 En normal CLT-sætning uden eksistens af momenter.<br />
Lad {Xn j |1 ≤ j ≤ n} betegne et uafhængigt trekantsskema og q : R → R en Borel funktion,<br />
så at mn j = E[q(Xn j)] og σ 2 n j = Var(q(Xn j)) eksisterer og er endelige for alle 1 ≤ j ≤ n.<br />
Antag endvidere at<br />
i)<br />
ii)<br />
iii)<br />
lim<br />
n→∞<br />
for et 0 ≤ σ 2 < ∞. Da konvergerer<br />
Bevis. For ethvert n er<br />
n<br />
∑<br />
j=1<br />
n<br />
∑ mn j = 0 og lim<br />
n→∞<br />
j=1<br />
x − q(x)<br />
q(0) = 0 = lim<br />
x→0 x2 n<br />
∑ σ<br />
j=1<br />
2 2<br />
n j = σ<br />
<br />
n <br />
lim ∑ (1+q(Xn j)<br />
n→∞<br />
j=1 {|Xn j|>ε}<br />
2 <br />
)dP = 0 ∀ε > 0<br />
Un :=<br />
(Xn j − mn j) =<br />
n<br />
∑<br />
j=1<br />
n<br />
∑<br />
j=1<br />
(Xn j − mn j) ∼ → N(0,σ 2 ).<br />
(Xn j − q(Xn j))+<br />
n<br />
∑<br />
j=1<br />
(q(Xn j) − mn j),<br />
og som ovenfor bemærket er det derfor nok at eftervise flg. to påstande<br />
A)<br />
n<br />
∑<br />
j=1<br />
(q(Xn j) − mn j) ∼ → N(0,σ 2 ) og B)<br />
Vi viser først A). Hvis σ 2 = 0 ses, at<br />
dvs.<br />
E[(<br />
n<br />
∑<br />
j=1<br />
n<br />
∑<br />
j=1<br />
n<br />
∑<br />
j=1<br />
(q(Xn j) − mn j)) 2 ] =<br />
(Xn j − q(Xn j)) → 0 i sandsynlighed.<br />
n<br />
∑ σ<br />
j=1<br />
2 n j → 0,<br />
(q(Xn j) − mn j) → 0 i L 2 (P)<br />
og derfor også konvergens i fordeling mod δ0 = N(0,0). Hvis derimod σ 2 > 0, skriver vi for<br />
n så stor at s2 n = ∑nj=1 σ 2 n j > 0,<br />
n<br />
∑(q(Xn<br />
j) − mn j) = σ ·<br />
j=1<br />
sn<br />
σ<br />
183<br />
· 1<br />
sn<br />
n<br />
∑<br />
j=1<br />
(q(Xn j) − mn j),
hvoraf A) følger, hvis<br />
n 1<br />
∑ sn j=1<br />
(q(Xn j) − mn j) ∼ → N(0,1).<br />
Dette vises ved at eftervise, at det uafhængige trekantsskema {q(Xn j)}1≤ j≤n opfylder Lindeberg’s<br />
betingelse holder. Lad ε > 0 være givet. Da<br />
1<br />
s 2 n<br />
≤ 2<br />
s 2 n<br />
er det ifølge i) nok at vise, at<br />
lim<br />
n→∞<br />
n <br />
∑<br />
(q(Xn j) − mn j)<br />
j=1 {|q(Xn j)−mn j|>ε·sn}<br />
2 dP<br />
n <br />
∑<br />
q(Xn j)<br />
j=1 {|q(Xn j)−mn j|>ε·sn}<br />
2 dP+ 2<br />
s2 n<br />
n<br />
∑ m<br />
j=1<br />
2 n j<br />
n <br />
∑<br />
j=1 {|q(Xn j)−mn j|>ε·σ 2 q(Xn j)<br />
/2}<br />
2 dP = 0.<br />
Men for n stor og dermed ifølge i) sup 1≤ j≤n |mn j| lille er for alle 1 ≤ j ≤ n<br />
{|q(Xn j) − mn j| > ε · σ 2 /2} ⊆ {|q(Xn j)| > ε · σ 2 /4} ⊆ {|Xn j| > ˜ε},<br />
hvor ˜ε > 0 er valgt i hht. ii), så at |q(x)| > ε ·σ 2 /4 ⇒ |x| > ˜ε. Påstanden og dermed A) følger<br />
nu umiddelbart af iii).<br />
Hvad angår B) skrives for alle ε > 0 og alle n<br />
n<br />
∑<br />
j=1<br />
(Xn j − q(Xn j)) =<br />
n<br />
∑<br />
j=1<br />
(Xn j − q(Xn j)) · 1 {|Xn j|≤ε} +<br />
n<br />
∑<br />
j=1<br />
Da limn ∑ n j=1 P(|Xn j| > ε) = 0 for ethvert ε > 0 ifølge iii) konvergerer<br />
n<br />
∑<br />
j=1<br />
(Xn j − q(Xn j)) · 1 {|Xn j|>ε}<br />
(Xn j − q(Xn j)) · 1 {|Xn j|>ε} →n→∞ 0 i sandsynlighed,<br />
for ethvert ε > 0. Et argument baseret på trekantsuligheden i en metrik, der svarer til konvergens<br />
i sandsynlighed, sikrer derfor, at det er nok at vise, at<br />
limsup E[|<br />
n<br />
n<br />
∑<br />
j=1<br />
(Xn j − q(Xn j)) · 1 {|Xn j|≤ε}|] → 0 for ε → 0.<br />
For ε > 0 så lille, at |q(x) > |x|/2 for 0 < |x| ≤ ε (her benyttes ii)) gælder nu<br />
|<br />
n<br />
∑<br />
j=1<br />
(Xn j − q(Xn j)) · 1 {|Xn j|≤ε}| ≤<br />
n<br />
≤ Mε ∑<br />
j=1<br />
n |Xn j − q(Xn j)|<br />
∑<br />
j=1 q(Xn j) 2<br />
· q(Xn j) 2 · 1 {0
D.v.s. for alle n er<br />
domineret af<br />
Mε ·<br />
E[|<br />
n<br />
∑<br />
j=1<br />
(Xn j − q(Xn j)) · 1 {|Xn j|≤ε}|]<br />
n<br />
∑ E[q(Xn j)<br />
j=1<br />
2 n<br />
] = Mε · ∑<br />
j=1<br />
som ifølge i) konvergerer mod Mε · σ 2 for n → ∞. Men da<br />
|x − q(x)|<br />
sup<br />
0
Betingede middelværdier.<br />
Som optakt til emnet betingede middelværdier vender vi kort tilbage til begrebet σ-algebraer.<br />
Allerede ved introduktionen af et sandsynlighedsfelt (Ω,F,P), omtaltes elementerne<br />
i hændelsessystemet F , som de mængder vi var interesseret i og derfor ’kendte’. Dette<br />
synspunkt er udgangspunktet for den måde, vi i det følgende skal betragte σ-algebraer eller<br />
rettere del σ-algebraer i et givent måleligt rum (Ω,F). Pr. definition er en del σ-algebra B<br />
i F en σ-algebra i Ω, hvis elementer alle ligger i F , dvs.B ⊆ F . En sådan del σ-algebra<br />
B tænkes at modellere en informationsmængde i den forstand, at elementerne i B er<br />
de mængder, vi kender, dvs. vi kan afgøre, om de indtræffer eller ej; og en variabel X siges<br />
derfor at være observerbar på baggrund af informationsmængden B, hvis den er B-målelig.<br />
Stabilitetskravene til en σ-algebra passer godt til informationssynspunktet, thi kender vi en<br />
hændelse A, så kender vi jo også A c , og kender vi Ai for ethvert i, så er det nærliggende at<br />
sige, at vi også kender ∞ i=1 Ai, thi denne indtræffer jo præcist, hvis mindst en af Ai’erne<br />
indtræffer. I dette ’informationssprog’ opfattes σ-algebraen {/0,Ω} som svarende til ingen<br />
information i modsætning til σ-algebraen F , som tolkes som fuld information.<br />
Ofte vil informationsmængden være givet ved, at vi kender værdierne af en eller flere stokastiske<br />
variable X1,...,Xn, dvs. vi kan afgøre, om hændelserne<br />
{(X1,...,Xn) ∈ A} A ∈ B(R n )<br />
indtræffer eller ej. Dette svarer til, at informationsmængden er σ-algebraen frembragt at<br />
Xi’erne, dvs. σ(X1,...,Xn). Denne er klart en del σ-algebra i F , da Xi’erne er stokastiske<br />
variable. Dens størrelse afhænger af, hvor komplicerede X1,...,Xn er, og som vist i Faktoriseringssætningen<br />
(se Øvelse 8), er enhver variabel, som er observerbar kendt på basis<br />
af denne information, dvs. σ(X1,...,Xn)-målelig, en funktion af (X1,...,Xn), og dermed på<br />
formen<br />
ϕ(X1,...,Xn) hvor ϕ : R n → R er Borel målelig.<br />
Begrebet betinget middelværdi af en variabel X indføres nu som en formalisering af det<br />
’bedste skøn’ over X på basis af en given informationsmængde B. Antag først at B er på<br />
formen σ(A1,...,An), hvor A1,...,An udgør en målelig partition af Ω, dvs. Ai’erne ligger<br />
i F , er parvis disjunkte og udfylder Ω. Da enhver reel B-målelig variabel er på formen<br />
∑i αi · 1Ai<br />
, er angivelsen af det bedste skøn over en variabel X givet B derfor ækvivalent<br />
med en beregningsformel for αi’erne. En sådan opskrift afhænger naturligvis af, hvordan<br />
vendingen ’bedste skøn’ tolkes, men i forlængelse af forståelsen af begrebet middelværdi<br />
som en form for midling af værdierne forekommer det nærliggende at vedtage, at αi’erne<br />
skal bestemmes ved formlen<br />
α X i := 1<br />
P(Ai)<br />
<br />
Ai<br />
X dP hvis P(Ai) > 0, og α X i := 0 ellers.<br />
Den foreslåede beregningsformel kræver en vis integrabilitet af X, og vi vil her nøjes med at<br />
betragte variable X i L1 (P). Thi i så fald er ∑i αX i · 1Ai en vel defineret B-målelig variabel,<br />
som ligger i L1 (P) og opfylder (husk at ethvert A ∈ B er en foreningsmængde af visse af<br />
Ai’erne) <br />
X dP =<br />
A<br />
α X i · 1Ai dP for alle A ∈ B.<br />
A ∑ i<br />
186
Dette giver nu anledning til flg. generelle eksistens - / entydighedsspørgsmål:<br />
Givet en del σ-algebra B og en variabel X ∈ L 1 (P) findes der da en variabel XB i L 1 (P,B) :=<br />
{Y ∈ L 1 (P)|Y er B målelig}, som opfylder<br />
<br />
A<br />
<br />
X dP = XB dP for alle A ∈ B,<br />
A<br />
og i hvor høj grad er en sådan entydigt bestemt ?<br />
Det sidste er det letteste, for hvis XB og ˜XB er elementer i L 1 (P,B), der begge opfylder<br />
integralbetingelsen, så er {XB = ˜XB} ifølge Proposition 5 en P-nulmængde, dvs.<br />
XB = ˜XB P-n.o.<br />
Denne entydighed op til P-nulmængder betyder, at det har mening at bruge notationen<br />
E[X |B] om enhver variabel, der opfylder ovenstående krav, og at kalde den en betinget<br />
middelværdi af X givet B. Dvs. en betinget middelværdi af en variabel X er observerbar<br />
mht. den betragtede informations σ-algebra, og dens integral m.h.t. P over ethvert element i<br />
informationsmængden er lig integralet af X over den samme mængde.<br />
For at vise eksistensen betragtes først kvadratisk integrable variable. Da underrummet<br />
L 2 (P,B) = {Y ∈ L 2 (P)|Y er B målelig}<br />
i L 2 (P) er lukket under konvergens i kvadratisk middel, findes der ifølge Projektionssætningen<br />
til ethvert X ∈ L 2 (P) et PBX ∈ L 2 (P,B), så at<br />
X − PBX ∈ L 2 (P,B) ⊥ ;<br />
specielt er X − PBX og 1A derfor orthogonale for alle A ∈ B, dvs.<br />
<br />
X dP = XB dP for alle A ∈ B.<br />
A<br />
A<br />
PBX er altså en betinget middelværdi af X givet B, og der gælder yderligere.<br />
Lemma BM 1 For alle X, Y ∈ L 2 (P) er<br />
PBX − PBY = PB(X −Y) P-n.o. og E[|PBX|] ≤ E[|X|].<br />
Bevis. Første del følger umiddelbart af, at L2 (P,B) ⊥ er stabil under addition. Hvad angår<br />
anden del indføres for et givet X i L2 (P) betegnelsen A+ = {PBX ≥ 0}. Dvs. A+ og Ac +<br />
ligger i B, da PBX er B-målelig, og der gælder derfor<br />
<br />
=<br />
A+<br />
<br />
E[|PBX|] =<br />
A+<br />
<br />
PBX dP −<br />
Ac PBX dP<br />
+<br />
<br />
X dP −<br />
Ac <br />
X dP ≤<br />
+<br />
|X|dP−<br />
A+<br />
Ac |X|dP = E[|X|].<br />
+<br />
♦<br />
187
Eksistensen af den betingede middelværdi for variable i L 1 (P) er nu let. For lad X ∈ L 1 (P)<br />
være givet. Vælg nu en følge (Xn)n≥1 ⊆ L 2 (P), så at Xn → X i L 1 (P).<br />
Xn := X · 1 {|X|≤n} for n ≥ 1<br />
kan f.eks. bruges. Ifølge Lemma BM 1 har vi for alle m,n ≥ 1<br />
E[|PBXn − PBXm |] = E[|PB(Xn − Xm)|] ≤ E[|Xn − Xm|]<br />
dvs. (PBXn)n≥1 er en Cauchy-følge i L1 (P,B), og den konvergerer derfor ifølge Sætning 6 i<br />
P-middel mod et element XB i L1 (P,B). Denne grænseværdi er en betinget middelværdi af<br />
X givet B, for benyttes implikationen<br />
Zn → Z i L 1 <br />
(P) ⇒ Zn dP →<br />
A<br />
Z dP for alle A ∈ F,<br />
som skyldes uligheden<br />
<br />
| Zn dP −<br />
A<br />
Z dP| ≤ |Zn − Z|dP for alle n ≥ 1,<br />
på følgerne (Xn)n≥1 og (PBXn)n≥1 og hændelser A ∈ B fås<br />
<br />
X dP = lim<br />
A<br />
n<br />
Xn dP = lim<br />
A<br />
n<br />
PBXn dP =<br />
A<br />
A<br />
A<br />
<br />
XB dP.<br />
A<br />
Eksistens og entydighed af betingede middelværdier er hermed vist, dvs.<br />
Proposition Bm 1 For enhver del σ-algebra B i F findes der til enhver vaiabel X ∈ L1 (P)<br />
et element E[X |B] ∈ L1 (P,B), så at<br />
<br />
X dP = E[X |B]dP for alle A ∈ B.<br />
A<br />
A<br />
E[X |B] er herved entydigt bestemt P-n.o., dvs. op til P-nulmængder findes der netop en<br />
variabel Y , som opfylder<br />
a) Y er B-målelig og integrabel.<br />
b) E[X,A] = E[Y,A] for alle A ∈ B.<br />
Vi vil nu for en vilkårlig del σ-algebra B i F nærmere studere afbildningen<br />
L 1 (P) ∋ X ↦→ E[X |B] ∈ L 1 (P,B).<br />
Afbildningen, der kaldes betinget middelværdi dannelse m.h.t.B, har en række vigtige egenskaber,<br />
hvoraf de fleste er angivet nedenfor. Som følge af den manglende punktvise entydighed<br />
skal alle udsagn, som f.eks. ligheds - eller ulighedstegn, involverende betingede middelværdier<br />
forstås som værende gældende P-n.o.<br />
Sektionerne 6.8-10 i Hoffmann indeholder endnu flere, men de er alle simple konsekvenser<br />
af de nedenstående. Det bør dog understreges, at Hoffmann betragter variable i L(P), hvor<br />
vi her kun ser på elementer i L 1 (P). Men igen er udvidelsen ikke vanskelig.<br />
188
Som en hjælp til forståelsen bemærkes, at hvis B er den trivielle σ-algebra {/0,Ω}, er afbildningen<br />
X ↦→ E[X |B] præcis middelværdiafbildningen X ↦→ E[X]. For da en variabel i<br />
denne situation er B-målelig, hvis og kun hvis den er konstant, er E[X |B] = E[X] for alle<br />
X ∈ L 1 (P). (tænk over dette)<br />
Betinget middelværdi dannelse bevarer middelværdi og er lineær og voksende (eller rettere<br />
P-lineær og P-voksende), dvs. for X,Y ∈ L 1 (P) og a ∈ R gælder<br />
Bm 0 E[E[X |B]] = E[X].<br />
Bm 1 E[X +Y |B] = E[X |B]+E[Y |B] og E[aX |B] = a · E[X |B] P-n.o.<br />
Bm 2 P(X ≥ Y) = 1 ⇒ P(E[X |B] ≥ E[Y |B]) = 1 og tilsvarende med >.<br />
Bevis. Hvis P(X ≥ Y) = 1 er ligheden P(E[X |B] ≥ E[Y |B]) = 1 en umiddelbar konsekvens<br />
af Proposition 5, da<br />
<br />
<br />
E[X |B]dP = X dP ≥ Y dP = E[Y |B]dP<br />
A<br />
A<br />
for alle A ∈ B. Men da de to yderpunkter er ens for A = {E[X |B] = E[Y |B]}, viser<br />
implikationen<br />
<br />
<br />
X dP = Y dP ⇒ P(B ∩ {X > Y }) = 0 B ∈ B,<br />
at<br />
B∩{X>Y }<br />
B∩{X>Y }<br />
P(X > Y) = 1 ⇒ P(E[X |B] > E[Y |B]) = 1. ♦<br />
Endvidere bevarer afbildningen ’konstanter’ idet<br />
Bm 3 X = c P-n.o. ⇒ E[X |B] = c P-n.o. for ethvert c ∈ R.<br />
Kombineres Bm 2 og 3 fås for X ∈ L 1 (P):<br />
Bm 4 P(X ∈ I) = 1 ⇒ P(E[X |B] ∈ I) = 1 for ethvert interval I ⊆ R.<br />
Bevis. Lineariteten sikrer, at det er nok at vise implikationerne<br />
P(X ≤ b) h.h.v.P(X < b) = 1 ⇒ P(E[X |B] ≤ b) h.h.v.P(E[X |B] < b) = 1<br />
for alle b ∈ R. Men disse følger umiddelbart af Bm 2 og 3. ♦<br />
Bm 2 og 4 sikrer flg. variant af Jensen’s ulighed for betingede middelværdier.<br />
Bm 5 Lad ϕ : R → R være en Borel funktion, som er konveks på et åbent interval I ⊆ R. Lad<br />
X ∈ L 1 (P) være givet, så at P(X ∈ I) = 1 og ϕ(X) ∈ L 1 (P), da er<br />
ϕ(E[X |B]) ≤ E[ϕ(X)|B] P-n.o.<br />
Bevis. Da ϕ er konveks på det åbne interval I, eksisterer der, som vist i Appendiks C, en<br />
følge (ln)n≥1 af affine funktioner, så at<br />
ln ≤ ϕ på I og ϕ(x) = supln(x)<br />
for alle x ∈ I,<br />
n<br />
189<br />
A<br />
A
dvs. specielt ϕ(X) ≥ ln(X) P−n.o. for alle n ≥ 1, da P(X ∈ I) = 1. Da NP er stabil under<br />
tællelig forening, gælder derfor ifølge Bm 1, 2 og 3, at<br />
E[ϕ(X)|B] ≥ sup<br />
n<br />
E[ln(X)|B] = sup<br />
n<br />
Men ifølge Bm 4 er P(E[X |B] ∈ I) = 1 og dermed<br />
sup<br />
n<br />
ln(E[X |B]) P-n.o.<br />
ln(E[X |B]) = ϕ(E[X |B]) P-n.o. ♦<br />
Det overlades til læseren at udvide resultatet til vilkårlige intervaller. Bruges Bm 5 på funktionerne<br />
x ↦→ |x| p for p ≥ 1 fås<br />
E[X |B] ∈ L p (P) hvis X ∈ L p (P) og E[X |B]p ≤ Xp dvs.<br />
Bm 6 X ↦→ E[X |B] er en lineær kontraktion i L p (P) for ethvert p ≥ 1.<br />
Bm 2 og 6 medfører flg. konvergensresultater for variable (Xn)n≥1 og X i L 1 (P).<br />
Bm 7 Xn ↑ (↓)X P-n.o. ⇒ E[Xn |B] ↑ (↓)E[X |B] P-n.o. og i P-middel.<br />
Bevis. Antag Xn ↑ X P-n.o. og dermed Xn → X i P-middel. Af Bm 2 og 6 fås derfor<br />
E[Xn |B] ↑ supE[Xn<br />
|B] ≤ E[X |B] P-n.o.<br />
n<br />
samt E[Xn |B] → E[X |B] i P-middel, specielt er der konvergens i sandsynlighed, hvorfor<br />
supE[Xn<br />
|B] = E[X |B] P-n.o. ♦<br />
n<br />
Bm 8 Hvis Xn ≥ 0 og X ≤ liminfn Xn P-n.o., er<br />
E[X |B] ≤ liminf<br />
n<br />
E[Xn |B] P-n.o.<br />
Specielt er E[liminfn Xn |B] ≤ liminfn E[Xn |B] P-n.o. hvis liminfn Xn ∈ L 1 (P).<br />
Bevis. Definer Yn := infk≥n Xk for n ≥ 1. Da<br />
X ∧Yn ↑ X ∧ liminf<br />
n<br />
Xn = X P-n.o. og Yn, X ∧Yn ∈ L 1 (P) for alle n,<br />
fås af Bm 2 og 7, at E[Yn |B] ≤ infk≥n E[Xk |B] P-n.o. og derfor<br />
E[X |B] = sup<br />
n<br />
E[X ∧Yn |B] ≤ sup<br />
n<br />
E[Yn |B] ≤ liminf<br />
n<br />
E[Xn |B] P- n.o. ♦<br />
Bm 9 Hvis Xn → X P-n.o. og |Xn| ≤ Y P-n.o. for et Y ∈ L 1 (P) konvergerer<br />
E[Xn |B] → E[X |B] P-n.o. og i P-middel.<br />
Bevis. Da Xn → X i P-middel sikrer Bm 6 middelkonvergensen, og konvergensen P-n.o. fås<br />
ved at bruge Bm 8 på følgerne (Y −Xn)n≥1 og (Y +Xn)n≥1. Detaljerne overlades til læseren.♦<br />
190
De to næste resultater viser, at B-målelige variable behandles som ’konstanter’.<br />
Bm 10 E[U |B] = U P-n.o. for ethvert U ∈ L 1 (P,B); og for X ∈ L 1 (P) og B-målelige variable<br />
U1 og U2 gælder<br />
P(U1 ≤ X ≤ U2) = 1 ⇒ P(U1 ≤ E[X |B] ≤ U2) = 1.<br />
Bevis. Første er del er umiddelbar og overlades til læseren. Da<br />
for ethvert n ≥ 1 fås af Bm 2, at<br />
P(X ∧ n ≤ U2 ∧ n) = 1 og |U2 ∧ n| ≤ n+|X| ∈ L 1 (P)<br />
E[X ∧ n|B] ≤ E[U2 ∧ n|B] = U2 ∧ n ≤ U2 P-n.o.<br />
Lader vi nu n → ∞ fås ved brug af Bm 7, at P(E[X |B] ≤ U2) = 1. Den anden halvdel følger<br />
tilsvarende. ♦<br />
Bm 11 E[U · X |B] = U · E[X |B] P-n.o., for U B-målelig og X, U · X ∈ L 1 (P).<br />
Bevis. Antag at U og X opfylder antagelserne. Ifølge Lemma 6 findes der er en følge<br />
(Un)n≥1 ⊆ S(B), så at Un → U og |Un| ≤ |U| og dermed<br />
Af Bm 9 følger derfor, at<br />
Un · X → U · X P-n.o. og |Un · X| ≤ |U · X| P-n.o.<br />
E[Un · X |B] → E[U · X |B] P-n.o.,<br />
dvs., hvis påstanden er vist for simple funktioner, fås<br />
E[U · X |B] = lim n (Un · E[X |B]) = U · E[X |B] P-n.o.<br />
Det er derfor nok at se på ’simple’ U og dermed via linearitet nok at se på U af formen 1A for<br />
et A ∈ B. Men her er påstanden en umiddelbar konsekvens af, at der for alle B ∈ B gælder<br />
<br />
<br />
<br />
1A · E[X |B]dP =<br />
B<br />
E[X |B]dP =<br />
B∩A<br />
X dP =<br />
B∩A<br />
1A · X dP. ♦<br />
B<br />
De næste fire egenskaber er af en lidt anden natur. De tre første omhandler betingning med<br />
uafhængig information, og den sidste er reglen om successiv betingning. X er her stadigvæk<br />
et element i L 1 (P) og B1 endnu en del σ-algebra i F . Bemærk at Bm 12 er specialtilfældet<br />
af Bm 13 svarende til B = {/0,Ω}.<br />
Bm 12 E[X |B] = E[X] P-n.o. hvis X og B er uafhængige.<br />
Bm 13 E[X |σ(B ∪B1)] = E[X |B] P-n.o. hvis (X,B) og B1 er uafhængige.<br />
Bm 14 E[H(X,Y)|B] = ˜H(Y) P-n.o. hvis X og B er uafhængige og Y ∈ M(B) og ˜H(y) :=<br />
E[H(X,y)], hvor H : R 2 → R er begrænset og Borel målelig.<br />
Bm 15 E[E[X |B]|B1] = E[X |B1] P-n.o. hvis B1 ⊆ B.<br />
191
Bevis. Bm 12 og 15 overlades til læseren. I Bm 14 viser et linearitetsargument, at det er nok<br />
at se på ikke-negative H. Da måleligheden og integrabiliteten følger af Tonelli’s sætning,<br />
mangler vi kun at vise, at for givet B ∈ B er<br />
<br />
˜H(Y)dP = H(X,Y)dP.<br />
A<br />
Men lader vi Z betegne den stokastiske variabel 1A fås ved gentagen brug af den lille transformationssætning<br />
og Tonelli’s sætning, at<br />
<br />
<br />
˜H(Y)dP = ˜H(Y) · 1A dP = ˜H(y) · zPY,Z(dydz)<br />
<br />
=<br />
<br />
{<br />
A<br />
A<br />
<br />
H(x,y) · zPX(dx)}P (Y,Z)(dydz) = H(x,y) · zPX ⊗ P (Y,Z)(dxdydz)<br />
<br />
<br />
<br />
= H(x,y) · zP (X,Y,Z)(dxdydz) = H(X,Y) · 1A dP =<br />
A<br />
H(X,Y)dP<br />
Hvad angår Bm 13, viser et nyt linearitetsargument, at vi kan og vil antage, at X er ikkenegativ.<br />
Da både måleligheden og integrabiliteten igen er oplagt, mangler vi kun at vise,<br />
at <br />
X dP = E[X |B]dP for alle C ∈ σ(B ∪B1).<br />
C<br />
C<br />
Men da begge sider er endelige mål på σ(B ∪B1) med samme masse E[X], behøver vi kun<br />
at vise ligheden for C af formen A ∩ B, hvor A ∈ B og B ∈ B1, idet mængden af disse er<br />
stabil under endelig gennemsnit og frembringer σ(B ∪ B1). Men for A ∈ B og B ∈ B1<br />
gælder ifølge den antagede uafhængighed, at<br />
<br />
<br />
<br />
E[X |B]dP = E[X |B] · 1A · 1B dP = P(B) E[X |B]·1A dP<br />
A∩B<br />
<br />
= P(B)<br />
<br />
<br />
X · 1A dP = X · 1A · 1B dP =<br />
A∩B<br />
X dP. ♦<br />
Ifølge Bm 4 og 6 afbilder enhver betinget middelværdi mængder af formen<br />
{X ∈ L 1 (P)|P(|X| ≤ M) = 1} og {X ∈ L 1 (P)|E[|X|] ≤ M} hvor 0 < M < ∞<br />
ind i sig selv. Øvelse 17 medfører derfor flg. vigtige egenskab, hvor (Bn)n≥1 er del σ-algebraer<br />
i E og H en delmængde af L 1 (P).<br />
Bm 16 H uniformt integrabel ⇒ {E[X |Bn]|X ∈ H , n ≥ 1} unif. integrabel.<br />
Tilfældet hvor H består af en enkelt variabel, er specielt vigtigt, dvs.<br />
Bm 16’ {E[X |Bn]|n ≥ 1} er uniformt integrabel for alle X ∈ L 1 (P).<br />
Bevis. Lad X ∈ L 1 (P) være givet. Da {|E[X |Bn]| ≥ K} ∈ Bn for alle n og K fås af regnere-<br />
glerne for betingede middelværdier, at<br />
<br />
|E[X |Bn]|dP ≤<br />
{|E[X |Bn ]|≥K}<br />
<br />
192<br />
{|E[X |Bn ]|≥K}<br />
E[|X||Bn]dP
=<br />
|X|dP ≤<br />
|X|dP<br />
{|E[X |Bn]|≥K}<br />
{E[|X||Bn]≥K}<br />
hvilket giver det ønskede, da {|X|} er uniformt integrabel og<br />
P({E[|X||Bn] ≥ K}) ≤ E[E[|X||Bn]]/K ≤ E[|X|]/K →K→∞ 0. ♦<br />
Bm 16 kan vises på nøjagtig samme måde.<br />
Lad os til slut se nærmere på tilfældet, hvor B = σ(Y) for en målelig variabel Y med værdier<br />
i et måleligt rum (E,E ). Her skrives normalt E[·|Y] i stedet for E[·|σ(Y)]. Ifølge faktoriseringssætningen<br />
findes der til ethvert X i L 1 (P) en funktion ϕ ∈ M(E ), generelt afhængig<br />
af både X, Y og P, så at<br />
E[X |Y] = ϕ(Y),<br />
og da <br />
ϕ dPY =<br />
B<br />
<br />
{Y ∈B}<br />
<br />
ϕ(Y)dP =<br />
{Y ∈B}<br />
<br />
X dP = x · 1B(y)P (X,Y)(dxdy)<br />
for alle B ∈ E , ses dels, at ϕ er entydigt bestemt PY -n.o., samt at den kun afhænger af den<br />
simultane fordeling, dvs. der gælder<br />
Bm 17a Lad X og Z betegne elementer i L 1 (P), så at (X,Y) ∼ (Z,Y) og ϕ et element i M(E ).<br />
Da er<br />
E[X |Y] = ϕ(Y) P-n.o. ⇔ E[Z |Y] = ϕ(Y) P-n.o..<br />
Helt tilsvarende ses<br />
Bm 17b Lad X betegne et element i L 1 (P) og Z og Y målelige variable med værdier i et<br />
måleligt rum (E,E ), så at (X,Y) ∼ (X,Z). Da gælder for ψ ∈ M(E ) at<br />
E[X |Y] = ψ(Y) P-n.o. ⇔ E[X |Z] = ψ(Z) P-n.o..<br />
Men hvordan bestemmer man et ϕ, der passer til et givent X ∈ L 1 (P) ? Hoffmann behandler<br />
problemet i sektion 6.11, som blandt andet indeholder flg. resultat.<br />
Bm 18 Lad (X,Y) betegne en absolut kontinuert 2-dimensional stokastisk vektor med tæthed<br />
(x,y) ↦→ f(x,y) m.h.t. det plane Lebesgue mål. Definer<br />
<br />
f2(y) :=<br />
R<br />
f(u,y)du og f X|Y(x|y) := f(x,y)<br />
f2(y) · 1 { f2>0}(y) for x,y ∈ R.<br />
Da gælder for enhver begrænset Borel funktion ψ : R2 → R, at<br />
<br />
E[ψ(X,Y)|Y] = ˜ψ(Y) P-n.o., hvor ˜ψ(y) := ψ(x,y) · fX|Y(x|y)dx y ∈ R.<br />
Da f2 er en tæthed for Y , er PY( f2 > 0) = 1. Resultatet gælder uændret for ubegrænsede ψ,<br />
hvis blot E[|ψ(X,Y)|] < ∞, dog skal ˜ψ(y) sættes lig 0 på mængden<br />
<br />
{y ∈ R|<br />
R<br />
|ψ(x,y)| · f X|Y(x|y)dx = ∞}.<br />
193<br />
R
Denne er igen en PY -nulmængde, idet<br />
<br />
<br />
{ |ψ(x,y)| · fX|Y(x|y)dx}PY(dy) =<br />
R<br />
=<br />
R<br />
<br />
R<br />
<br />
{<br />
R<br />
R<br />
<br />
{<br />
R<br />
|ψ(x,y)| · f X|Y(x|y)dx} f2(y)dy<br />
<br />
|ψ(x,y)| · 1 { f2>0}(y) · f(x,y)dx}dy =<br />
R2 |ψ(x,y)|P (X,Y)(dxdy)<br />
= E[|ψ(X,Y)|] < ∞.<br />
Bevis for Bm 18. Lad ψ ∈ bM(B(R 2 )) og B ∈ B(R) være givet. Ifølge Fubini’s Sætning<br />
gælder da<br />
E[ ˜ψ(Y),Y −1 <br />
(B)] =<br />
<br />
=<br />
B<br />
B<br />
<br />
˜ψ(y)PY(dy) =<br />
B<br />
<br />
{ ψ(x,y) · fX|Y(x|y)dx} · f2(y)dy<br />
R<br />
<br />
<br />
{ ψ(x,y) · f(x,y)dx}dy =<br />
R<br />
R2 ψ(x,y) · 1B(y) · f(x,y)λ2(dxdy)<br />
= E[ψ(X,Y), Y −1 (B)]. ♦<br />
En anden situation, hvor problemet umiddelbart lader sig løse, omtales i flg. resultat. Beviset<br />
overlades til læseren.<br />
Bm 19 Lad Y betegne en diskret stokastisk variabel, og lad (yn)n≥1 være en nummerering af<br />
den højst tællelige mængde Sp(Y), dvs.<br />
P(Y = yn) > 0 for alle n og ∑ P(Y = yn) = 1.<br />
n≥1<br />
Da gælder for enhver stokastisk variabel X og enhver Borel funktion ψ : R 2 → R, at hvis<br />
E[|ψ(X,Y)|] < ∞, så er<br />
E[ψ(X,Y)|Y] = ˜ψ(Y) P-n.o.,<br />
hvor ˜ψ(·) := ∑n≥1 an · 1 {yn}(·) og<br />
an =<br />
<br />
1<br />
ψ(X,yn)dP n ≥ 1.<br />
P(Y = yn) {Y=yn}<br />
Bm 18 og 19 knytter tæt an til, hvad der normalt kaldes en regulær betinget fordeling af X<br />
givet Y . Det er ikke et emne, vi skal gøre meget ud af, men da det indgår i behandlingen af<br />
den flerdimensionale normalfordeling, vil jeg ganske kort indføre nogle vigtige begreber og<br />
definitioner.<br />
Notation {P(A|y)|A ∈ B(R n ), y ∈ R m } kaldes en Markov kerne på B(R n ) × R m , hvis<br />
a) A ↦→ P(A|y) er et Borel sandsynlighedsmål på R n for alle y ∈ R m .<br />
b) y ↦→ P(A|y) er en Borel funktion på R m for alle A ∈ B(R n ).<br />
Lad X og Y betegne h.h.v. en n og en m-dimensional stokastisk vektor. En Markov kerne<br />
194
{PX |Y(A|y)|A ∈ B(Rn ), y ∈ Rm } på B(Rn ) × Rm kaldes en regulær betinget fordeling for<br />
X givet Y , hvis<br />
<br />
P(X ∈ A, Y ∈ B) = PX |Y(A|y)PY(dy)<br />
for alle A ∈ B(R n ) og B ∈ B(R m ). Sandsynlighedsmålet<br />
B<br />
A ↦→ P X |Y(A|y)<br />
kaldes den betingede fordeling for X givet Y = y og er det absolut kontinuert med tæthed<br />
x ↦→ f X |Y(x|y), kaldes denne en betinget tæthed for X givet Y = y.<br />
Øvelse 20. Udnyt Proposition 2 og sektionsegenskaber ved produktmålelige mængder til at<br />
vise at for alle A ∈ B(Rn+m ) = B(Rn ) ×B(Rm ) er<br />
<br />
P((X,Y) ∈ A) =<br />
Rm PX |Y(A(y)|y)PY(dy) <br />
Resultatet i Øvelse 20 viser, at hvis Z := φ(X,Y) for en k-dimensional Borel funktion φ så<br />
gælder for alle A ∈ B(R k og B ∈ B(R m , at<br />
P(Z ∈ A,Y ∈ B) = P((X,Y) ∈ φ −1 (A) ∩ R n × B) =<br />
<br />
Rm PX |Y((φ −1 (A) ∩ R n <br />
× B)(y)|y)PY(dy) =<br />
B<br />
P X |Y((φ(·,y) −1 (A)|y)PY(dy).<br />
Dvs. den betingede fordeling for Z givet Y = y er billedmålet af den betingede fordeling for<br />
X givet Y = y svarende til den målelige afbildning<br />
x ↦→ φ(x,y).<br />
Betingede fordelinger er et teoretisk vanskeligt begreb. Men for en - eller flerdimensionale<br />
stokastiske vektorer X og Y eksisterer der altid en regulær betinget fordeling for X givet Y ,<br />
og da B(R n ) er separabel, er P X |Y(·|·) entydigt bestemt i en sådan grad, at det har mening<br />
at tale om ’den betingede fordeling’ for X givet Y . De betingede fordelinger for X givet Y = y<br />
er nemlig entydigt bestemte for PY -n.a. y. Skønt der således både er eksistens og entydighed,<br />
er den eksplicitte beregning ofte vanskelig (se dog nedenstående øvelse), men i anvendelsessituationer<br />
er de betingede fordelinger heldigvis ofte givet ud fra sammenhængen.<br />
Kendskab til en betinget fordeling for X givet Y gør det muligt at generalisere resultaterne<br />
Bm 14, 18 og 19. For er f en begrænset Borel funktion på Rn × Rm , så er<br />
<br />
E[ f(X,Y)|Y] = ˜f(Y) P-n.o. hvor ˜f : y ↦→<br />
Rn f(x,y)P X |Y(dx|y),<br />
dvs. ˜f(y) er middelværdien af f(X,y) udregnet i den betingede fordeling af X givet Y = y.<br />
Formlen vises ved først at reducere til produktfunktioner, dvs. funktioner af formen<br />
(x,y) ↦→ f1(x) · f2(y),<br />
hvor f1 og f2 er Borel funktioner på R n h.h.v. R m . Standardbeviset sikrer dernæst, at det er<br />
nok at se på<br />
195
f1 = 1A og f2 = 1B for A ∈ B(R n ) og B ∈ B(R m ),<br />
men her svarer ligheden præcis til ovenstående definitionsligning. Resultatet udvider på<br />
sædvanlig vis til visse ubegrænsede f , specielt ikke-negative f .<br />
Øvelse 21. Lad X og Y være givne n og m dimensionale stokastiske vektorer og μ et vilkårligt<br />
givet Borel sandsynlighedsmål på R n . Vis nu flg. påstande.<br />
I) Hvis (X,Y) er absolut kontinuert m.h.t. λn+m med tæthed (x,y) ↦→ f(x,y), er<br />
⎧<br />
⎨<br />
PX|Y(A|y) :=<br />
⎩<br />
<br />
A f X|Y(x|y)λn(dx) A ∈ B(R n ), y ∈ { f2 > 0}<br />
μ(A) A ∈ B(R n ), y /∈ { f2 > 0}<br />
en regulær betinget fordeling for X givet Y . y ↦→ f2(y) er her en tæthed for Y og<br />
f X|Y(x|y) := f(x,y)/ f2(y) · 1 { f2>0}(y) for x ∈ R n , y ∈ R m .<br />
II) Hvis Y er diskret og Sp(Y) := {y ∈ R m |P(Y = y) > 0}, er<br />
P X|Y(A|y) :=<br />
en regulær betinget fordeling for X givet Y .<br />
III) Hvis X og Y er uafhængige, er<br />
P(X ∈ A|Y = y) A ∈ B(R n ), y ∈ Sp(Y)<br />
μ(A) A ∈ B(R n ), y /∈ Sp(Y)<br />
P X|Y(A|y) := PX(A) for A ∈ B(R n ), y ∈ R m<br />
en regulær betinget fordeling for X givet Y . <br />
Punkt III) viser, at når X og Y er uafhængige, afhænger de betingede mål for X givet Y = y<br />
ikke af y. Dette karakteriserer uafhængighed, idet flg. udsagn er ækvivalente. μ er her et<br />
sandsynlighedsmål på R n .<br />
1) X og Y er uafhængige<br />
2) P X|Y(A|y) := μ(A) for A ∈ B(R n ) og y ∈ R m er en regulær betinget fordeling for X givet<br />
Y .<br />
Øvelse 22. Eftervis 1) ⇔ 2) og vis endvidere, at μ i givet fald er fordelingsmålet for X. <br />
Øvelse 23. Lad (X,Y) være todimensionalt normalt fordelt. Vis at den betingede fordeling<br />
for X givet Y = y er en normalfordeling og bestem dens parametre.<br />
Vink: Vis at der findes et α, så at X −αY og Y er uafhængige, og udnyt dernæst bemærkningen<br />
efter Øvelse 20, idet X = (X − αY)+αY . <br />
196
Martingaler.<br />
I dette kapitel betragtes modeller for systemer, der udvikler sig i tiden. Tiden modelleres<br />
diskret, dvs. ved en tidsparametermængde T ⊆ Z, normalt et interval. Til ethvert tidspunkt<br />
n i T knytter der sig en variabel Xn og en del σ-algebra Fn i F . Vi skal tænke på Fn som<br />
den informationsmængde, der er til stede til tid n, og på Xn som en variabel, der beskriver<br />
tilstanden til tid n. Flg. krav forekommer derfor naturlige.<br />
a) Fn ⊆ Fm hvis n ≤ m for tidspunkter n og m i T , dvs. informationsmængden vokser med<br />
tiden.<br />
b) Xn er målelig m.h.t.Fn, dvs. tilstanden til tid n kan observeres på baggrund af den information,<br />
der er til stede til tid n.<br />
Med udgangspunkt heri siges en parametriseret familie (Fn)n∈T af del σ-algebraer i F at<br />
udgøre et T -filter, hvis Fn ⊆ Fm for n ≤ m, n,m ∈ T ; og b) udtrykkes ofte kort ved at sige,<br />
at processen (Xn)n∈T er tilpasset filtret (Fn)n∈T .<br />
Vi vil kun se på tilfældet, hvor T = N0 := {0,1,...}, men herved dækkes også tilfældet<br />
(Xn,Fn)n≥k, idet denne kan opfattes som ( ˜Xn, ˜<br />
Fn)n≥0, hvor<br />
˜Xn = Xn+k og ˜<br />
Fn = Fn+k n ≥ 0.<br />
Tilfældet, hvor T er et endeligt interval [k,l], er ligeledes dækket, for forlænges konstant ud<br />
over højre endepunkt kan (Xn,Fn) n∈[k,l] beskrives ved ( ˜Xn, Fn)n≥0, ˜ hvor<br />
˜Xn = Xn+k, ˜<br />
Fn = Fn+k n ≤ l − k og ˜Xn = Xl, ˜<br />
Fn = Fl n > l − k.<br />
T = N0 omfatter altså alle situationer, hvor tidsmængden har et endeligt begyndelsespunkt,<br />
og der udestår derfor i princippet kun to tilfælde nemlig, T = Z eller T = −N0. Men T = Z<br />
er ikke interessant i en martingal sammenhæng, og det godt nok meget interessante tilfælde<br />
T = −N0 overlades på grund af manglende tid til et senere kursus.<br />
Til ethvert filter (Fn)n≥0 tilknyttes de såkaldte stoptider defineret på flg. vis.<br />
Definition τ : Ω → N0 ∪ {∞} er en stoptid (mere præcist en (Fn)n≥0-stoptid), hvis<br />
{τ > n} ∈ Fn n ≥ 0.<br />
Bemærk at målelighedskravet ækvivalent kan formuleres som<br />
{τ ≤ n} ∈ Fn n ≥ 0 eller {τ = n} ∈ Fn n ≥ 0.<br />
τ siges at være en endelig stoptid, hvis P(τ < ∞) = 1, og τ siges at være en begrænset stoptid,<br />
hvis P(τ ≤ M) = 1 for et reelt tal M. Til enhver stoptid τ tilordnes σ-algebraen (overvej)<br />
Fτ := {F ∈ F∞ |F ∩ {τ = n} ∈ Fn n ≥ 0},<br />
hvor F∞ := σ( <br />
nFn), dvs.F∞ er den mindste σ-algebra, der indeholder alle Fn’erne. Fτ<br />
er altså en del σ-algebra i F∞ og omtales som informationsmængden, der er til stede til tid<br />
τ.<br />
197
Inden vi starter på den egentlige teori uddrages en række mere eller mindre åbenbare konsekvenser<br />
af de indførte defintioner på en stoptid τ og den tilhørende σ-algebra Fτ.<br />
Ma 1 τ er Fτ-målelig, og en F∞-målelig stokastisk variabel X er Fτ-målelig, hvis og kun<br />
hvis X · 1 {τ=n} er Fn-målelig for alle n ≥ 0.<br />
Bevis. Den første påstand følger af identiten<br />
<br />
{τ = n} hvis n = k<br />
{τ = k} ∩ {τ = n} =<br />
/0 hvis n = k.<br />
for n, k ∈ N0 ∪ {∞}, og den anden af identiteten<br />
{X ∈ B} ∩ {τ = n} = {X · 1 {τ=n} ∈ B} ∩ {τ = n}.<br />
for n ≥ 0 og B ∈ B(R), som, hvis 0 /∈ B, specielt giver<br />
{X · 1 {τ=n} ∈ B} = {X ∈ B} ∩ {τ = n} ∈ Fn. ♦<br />
De vigtigste stoptider er de såkaldte First Hitting Times defineret ved (her og overalt i det<br />
følgende sættes inf /0 til at være ∞ )<br />
τA(ω) := inf{n ≥ 0|Xn(ω) ∈ A} ω ∈ Ω,<br />
hvor A ∈ B(R) og (Xn)n≥0 er en tilpasset reel proces. Stoptidsegenskaben følger af ligheden<br />
{τA > n} =<br />
n<br />
{Xk ∈ A} c =<br />
k=0<br />
n<br />
{Xk ∈ A c } n ≥ 0.<br />
Dette generaliserer, se Hoffmann sektion 7.2, til de såkaldte Ocurrence Time τF defineret<br />
ved<br />
τF(ω) := inf{n ≥ 0|ω ∈ Fn} ω ∈ Ω,<br />
hvor F := (Fn)n≥0 er en følge af hændelser, så at Fn ∈ Fn for alle n ≥ 0. Bemærk at ovenstående<br />
Hitting Time svarer til Fn = {Xn ∈ A} for n ≥ 0. Igen følger stoptidsegenskaben let,<br />
idet<br />
{τF > n} =<br />
n<br />
k=0<br />
F c<br />
k<br />
k=0<br />
for n ≥ 0.<br />
Da stoptider kun antager heltallige værdier ses let, at enhver stoptid τ er en Ocurrence Time,<br />
idet τ = τF, hvor Fn = {τ ≤ n} for alle n ≥ 1.<br />
Definitionen viser, at for ethvert k ∈ N0 ∪ {∞} er den konstante variabel τ(ω) :≡ k en stoptid.<br />
Ligeledes ses at mængden af (Fn)n≥0-stoptider er stabil under endelig sum og endelig<br />
punktvis max og min dannelse, dvs.<br />
Ma 2 τ1, τ2 stoptider ⇒ τ1 + τ2, τ1 ∨ τ2 og τ1 ∧ τ2 stoptider.<br />
Bevis. Følger af lighederne<br />
{τ1 ∨ τ2 ≤ n} = {τ1 ≤ n} ∩ {τ2 ≤ n} og {τ1 ∧ τ2 > n} = {τ1 > n} ∩ {τ2 > n}<br />
198
samt<br />
{τ1 + τ2 = n} =<br />
n<br />
{τ1 = k} ∩ {τ2 = n − k} ♦<br />
Argumenterne for ∨ og ∧ udvider uden videre til tællig mange stoptider, dvs.<br />
k=1<br />
og derfor tilsvarende for en uendelig sum, da<br />
(τi)i≥1 stoptider ⇒ supτi<br />
og infτi<br />
stoptider,<br />
i i<br />
∞<br />
∑ τi = sup<br />
i=1 n<br />
Det næste resultat viser, at stoptids σ-algebraerne generaliserer de givne informations σalgebraer<br />
Fn.<br />
n<br />
∑<br />
i=1<br />
Ma 3 Fτ = Fk, hvis τ ≡ k for et k ∈ N0 ∪ {∞} og for stoptider τ1 og τ2 er<br />
{τ1 ≤ τ2} ∈ Fτ1∧τ2 = Fτ1 ∩Fτ2 , dvs. specielt τ1 ≤ τ2 ⇒ Fτ1<br />
Bevis. Den første påstand overlades til læseren. For B ∈ Fτ1∧τ2 og n ≥ 0 er<br />
1B · 1 {τ1=n} =<br />
τi.<br />
n<br />
∑ 1B · 1 {τ1∧τ2=k} · 1 {τ1=n}<br />
k=0<br />
⊆ Fτ2 .<br />
Fn-målelig, hvilket ifølge Ma 1 viser, at B ∈ Fτ1 og tilsvarende B ∈ Fτ2 . Hvis omvendt<br />
B ∈ Fτ1 ∩Fτ2 viser lighederne for n ≥ 0<br />
1B · 1 {τ1∧τ2=n} = 1B · 1 {τ1=n} · 1 {τ2>n} + 1B · 1 {τ2=n} · 1 {τ1>n} + 1B · 1 {τ1=n} · 1 {τ2=n}<br />
at B ∈ Fτ1∧τ2 . D.v.s. Fτ1∧τ2 = Fτ1 ∩Fτ2 . Resten følger tilsvarende af lighederne<br />
1 {τ1≤τ2} · 1 {τ1∧τ2=n} = 1 {τ1≤τ2} · 1 {τ1=n} = 1 {n≤τ2} · 1 {τ1=n} = 1 {n−1
Ifølge Lemma 5 er X∞ målelig m.h.t.F∞, hvis (Xn)n≥0 er tilpasset. Herefter kan vi uden<br />
problemer definere Xτ for en vilkårlig stoptid τ ved fastsættelsen<br />
Xτ :=<br />
∞<br />
∑ Xn · 1 {τ=n} + X∞ · 1 {τ=∞}.<br />
n=0<br />
Der er tydeligvis tale om en udvidelse af den allerede indførte definition for stoptider med<br />
udelukkende endelige værdier. Endvidere gælder flg. alternative beskrivelse. (Sammenlign<br />
med sektion 7.4 i Hoffmann’s bog.)<br />
<br />
limn Xτ(ω)∧n(ω) hvis denne eksisterer i R<br />
Xτ(ω) :=<br />
0 ellers,<br />
specielt er |Xτ| ≤ liminfn |Xτ∧n|. Xτ er altså ’∞-variablen’ hørende til (Xτ∧n)n≥0 defineret i<br />
hht. Lemma 5. Dette viser derfor flg. udsagn.<br />
Ma 4 Xτ er Fτ-målelig for enhver tilpasset proces (Xn)n≥0.<br />
Bevis. Som allerede vist er Xτ∧n målelig m.h.t. til Fτ∧n for alle n og dermed også Fτ-målelig<br />
for alle n. Påstanden følger derfor umiddelbart af Lemma 5. ♦<br />
Bemærk at med de indførte definitioner gælder for ethvert A ∈ B(R), at<br />
XτA ∈ A på {τA < ∞},<br />
hvor (Xn)n≥n er en tilpasset reel proces og τA den tilhørende Hitting Time til A.<br />
Vi får brug for endnu tre hjælperesultater.<br />
Ma 5 For vilkårlig X ∈ L 1 (P) og stoptid τ gælder for ethvert k ∈ N0 ∪ {∞}<br />
E[X |Fτ] · 1 {τ=k} = E[X |Fk] · 1 {τ=k}.<br />
Bevis. Lad k være givet. Da begge sider ifølge Ma 1 er Fk-målelige, og de ligeledes oplagt<br />
er integrable, er det nok at vise, at de har samme integral over ethvert B ∈ Fk. Men dette<br />
følger af definitionen på betinget middelværdi, da<br />
B ∩ {τ = k} ∈ Fτ ∩Fk for alle B ∈ Fk. ♦<br />
Ma 6 For enhver stoptid τ er Fτ = σ( <br />
nFτ∧n).<br />
Bevis. Inklusionen ⊇ er åbenbar, da Fτ∧n ⊆Fτ for alle n ≥ 0, og den anden fås af identiteten<br />
B =<br />
∞<br />
B ∩ {τ = n} ∪ B ∩ {τ = ∞},<br />
n=0<br />
idet B ∩ {τ = n} ∈ Fτ ∩Fn = Fτ∧n for alle n og alle B ∈ Fτ og<br />
F∞ = B := {B ∈ F∞ |B ∩ {τ = ∞} ∈ σ( <br />
Fτ∧n)}.<br />
200<br />
n
B er nemlig en σ-algebra, som indeholder ethvert Fn, thi for n ≥ 0 og B ∈ Fn er<br />
B ∩ {τ = ∞} =<br />
∞<br />
B ∩ {τ ≥ k} og B ∩ {τ ≥ k} ∈ Fτ∧k for k ≥ n. ♦<br />
k=n<br />
Ma 7 Lad (Xn)n≥0 betegne en tilpasset proces og τ en stoptid, så at Xτ er P-integrabel,<br />
dvs. element i L 1 (P). Da er for enhver stoptid σ<br />
E[Xτ |Fσ] = E[Xτ |Fτ∧σ].<br />
Bevis. Ifølge Ma 3 og Ma 4 er {σ < τ} og Xτ · 1 {τ≤σ} begge Fτ∧σ-målelige. Egenskaber<br />
ved betingede middelværdier viser derfor, at E[Xτ |Fσ] er lig<br />
Xτ · 1 {τ≤σ} + E[Xτ · 1 {σ
Endvidere viser Jensen’s ulighed for betingede middelværdier flg. resultat. Bemærk at da<br />
konvekse funktioner er kontinuerte, er de specielt Borel målelige.<br />
Ma 8 For enhver en reel konveks funktion ϕ : R → R gælder<br />
(Xn,Fn)n≥0 martingal og ϕ(Xn) ∈ L 1 (P) n ≥ 0 ⇒ (ϕ(Xn),Fn)n≥0 submartingal.<br />
Beviset, der beror på at<br />
E[ϕ(Xn+1)|Fn] ≥ ϕ(E[Xn+1 |Fn]) = ϕ(Xn),<br />
afslører, at hvis ϕ er konveks og voksende, så er konklusionen den samme for enhver submartingal<br />
(Xn,Fn)n≥0. Læseren opfordres til at formulere tilsvarende udsagn angående<br />
transformation af supermartingaler med konkave funktioner.<br />
Som det ses, betragtes her kun sub- og supermartingaler bestående af integrable variable,<br />
dvs. elementer i L 1 (P). Det har derfor mening at tale om den tilhørende middelværdifunktion<br />
n ↦→ E[Xn], og det ses let, at denne er voksende for submartingaler, aftagende for supermartingaler<br />
og konstant for martingaler. Ligeledes har det mening at undersøge, om processen er<br />
begrænset i L 1 , dvs. om<br />
supE[|Xn|]<br />
< ∞.<br />
n<br />
Lighederne |x| = 2x + − x = 2x − + x viser i denne sammenhæng, at<br />
E[|Xn|] = 2 · E[X + n ] − E[Xn] ≤ 2 · E[X + n ] − E[X0] n ≥ 0,<br />
hvis (Xn,Fn)n≥0 er en submartingal, og tilsvarende<br />
E[|Xn|] = 2 · E[X − n ]+E[Xn] ≤ 2 · E[X − n ]+E[X0] n ≥ 0,<br />
hvis (Xn,Fn)n≥0 er en supermartingal. Dvs.<br />
og tilsvarende<br />
En submartingal (Xn,Fn)n≥0 er begrænset i L 1 ⇔ supE[X<br />
n<br />
+ n ] < ∞,<br />
en supermartingal (Xn,Fn)n≥0 er begrænset i L 1 ⇔ supE[X<br />
n<br />
− n ] < ∞,<br />
Specielt er enhver ikke-positiv submartingal hhv. enhver ikke-negativ supermartingal begrænset<br />
i L 1 .<br />
I forbindelse med teorien om uafhængige stokastiske variable findes der mange eksempler på<br />
martingaler. Følgende er specielt vigtige. Se Hoffmann sektion 7.6 for yderligere eksempler.<br />
Ma 9 Lad (Xn)n≥0 betegne en følge af uafhængige integrable stokastiske variable. Definer<br />
Sn :=<br />
n<br />
n<br />
∑ Xj, Pn := ∏ Xj og Fn := σ(X0,...,Xn) n ≥ 0.<br />
j=0<br />
j=0<br />
202
Da gælder.<br />
1) (Sn,Fn)n≥0 er en martingal, hvis E[Xn] = 0 for alle n, en submartingal, hvis E[Xn] ≥ 0<br />
for alle n og en supermartingal, hvis E[Xn] ≤ 0 for alle n.<br />
Hvis yderligere Xn’erne alle har middelværdi 0 og endelig varians, er<br />
(S 2 n −<br />
n<br />
∑<br />
j=0<br />
Var(Xj),Fn)n≥0 også en martingal.<br />
2) (Pn,Fn)n≥0 er en martingal, hvis E[Xn] = 1 for alle n. Hvis Xn’erne yderligere er ikke negative,<br />
er (Pn,Fn)n≥0 en submartingal hhv. en supermartingal, hvis E[Xn] ≥ 1 hhv. E[Xn] ≤ 1<br />
for alle n.<br />
Bemærkning. Da det kun udnyttes, at Sn og Pn er Fn-målelige, samt at Xn er uafhængig af<br />
Fn−1, gælder resultatet for ethvert filter med denne egenskab.<br />
En anden vigtig type er de såkaldte Lévy martingaler, dvs. processer på formen<br />
(E[X |Gn],Gn)n≥0,<br />
hvor (Gn)n≥0 er et filter og X et vilkårligt element i L 1 (P). Ifølge Bm 16’ er variablene i<br />
en Lévy martingal uniformt integrable, og vi skal senere se, at enhver unifomt integrabel<br />
martingal omvendt også er en Lévy martingal.<br />
Lad mig også nævne den såkaldte Doob dekomposition. Lad (Xn,Fn)n≥0 være en tilpasset<br />
integrabel proces, dvs. Xn ∈ L 1 (P,Fn) for n ≥ 0. For n ≥ 1 er<br />
Xn = X0 +<br />
n<br />
∑<br />
k=1<br />
ΔXk = X0 +<br />
n<br />
∑<br />
k=1<br />
E[ΔXk |Fk−1]+<br />
n<br />
∑<br />
k=1<br />
(ΔXk − E[ΔXk |Fk−1]),<br />
dvs. dekompositionen Xn = X0 + An + Mn for n ≥ 0, hvor A0 = M0 ≡ 0 og<br />
An =<br />
n<br />
∑ E[ΔXk |Fk−1] og Mn =<br />
k=1<br />
n<br />
∑<br />
k=1<br />
(ΔXk − E[ΔXk |Fk−1])<br />
for n ≥ 1. Processerne (An)n≥0 og (Mn)n≥0 er begge (Fn)n≥0-tilpassede og integrable, og<br />
ved nærmere eftersyn ses, at<br />
dvs.<br />
(Mn,Fn)n≥0 er en martingal og (An)n≥0 en såkaldt (Fn)−predictabel proces,<br />
A0 er F0-målelig og An er Fn−1-målelig for alle n ≥ 1.<br />
Hvis (Xn,Fn)n≥0 er en submartingal og derfor E[ΔXn |Fn−1] ≥ 0 for alle n ≥ 1, er (An)n≥0<br />
en voksende proces, dvs. 0 ≤ An ≤ An+1 P-n.o. for n ≥ 0.<br />
Overvejelserne kan sammenfattes i flg. udsagn:<br />
Doob’s Dekompositionssætning.<br />
Enhver (Fn)n≥0-tilpasset integrabel proces (Xn)n≥0 kan skrives på formen<br />
Xn = Mn + An n ≥ 1 X0 = M0,<br />
203
hvor (Mn,Fn)n≥0 er en martingal og (An)n≥0 en (Fn)-predictabel proces. Fremstillingen er<br />
P-entydig, dvs. P(Mn = ˜Mn) = P(An = Ãn) = 1 for n ≥ 0 for enhver lignende repræsentation<br />
Xn = ˜Mn + Ãn n ≥ 1 X0 = ˜M0,<br />
Hvis (Xn,Fn)n≥0 er en sub - hhv. en supermartingal, er (An)n≥0 hhv.(−An)n≥0 en voksende<br />
integrabel proces.<br />
Lignende overvejelser viser, at hvis (Xn,Fn)n≥0 er en martingal og (Vn)n≥1 en predictabel<br />
proces, hvor Vn er begrænset for alle n, så er<br />
E[Vk · ΔXk |Fk−1] = Vk · E[ΔXk |Fk−1] = 0 for alle k ≥ 1.<br />
Dette giver derfor anledning til flg. resultat.<br />
Martingal Transforms.<br />
Lad (Xn,Fn)n≥0 betegne en martingal og (Vn)n≥0 en (Fn)-predictabel proces, hvor Vn er<br />
begrænset for alle n ≥ 0. Da er (V • Xn,Fn)n≥0 en martingal, hvor<br />
V • Xn := V0 · X0 +<br />
n<br />
∑<br />
k=1<br />
Vk · ΔXk n ≥ 0.<br />
Hvis (Xn,Fn)n≥0 en sub - / supermartingal, er (V •Xn,Fn)n≥0 en proces af samme type, hvis<br />
Vn’erne yderligere er ikke-negative. Processer af typen (V • Xn) omtales i litteraturen under<br />
navnet martingal transforms.<br />
Martingalerne har mange interessante egenskaber, og vi skal i det følgende gennemgå nedenstående<br />
fundamentale resultater. Beviserne er samlet i de efterfølgende afsnit.<br />
Sætning Ma 1. Optional Sampling. (skrabet udgave)<br />
Lad (Xn,Fn)n≥0 betegne en martingal. Den standsede proces (Xτ∧n,Fn)n≥0 er da en martingal<br />
for enhver stoptid τ, og for ethvert par af begrænsede stoptider 0 ≤ σ ≤ τ er Xτ og<br />
Xσ elementer i L 1 (P) og<br />
E[X0] = E[Xσ] = E[Xτ] samt E[Xτ |Fσ] = Xσ P -n.o.<br />
Der gælder tilsvarende resultater for sub - / supermartingaler med = erstattet af det relevante<br />
ulighedstegn. Ifølge Bm 5 og 16 kan første del præciceres som følger.<br />
Korollar Lad (Xn,Fn)n≥0 betegne en sub - / supermartingal, der er begrænset i L 1 (P), da<br />
er (Xτ∧n,Fn)n≥0 for enhver stoptid τ en proces af samme type. For martingaler bevares<br />
uniform integrabilitet ligeledes ved standsning.<br />
Sætning Ma 2. Maksimaluligheder.<br />
Lad (Xn,Fn)n≥0 betegne en submartingal og lad λ > 0 være givet. Da gælder for alle n ≥ 1<br />
λ · P( min<br />
0≤k≤n Xk < −λ) ≤ E[X + n ] − E[X0]<br />
λ · P( max<br />
0≤k≤n Xk > λ) ≤ E[Xn, max<br />
0≤k≤n Xk > λ] ≤ E[X + n ],<br />
204
hvilket ved addition viser, at for alle n ≥ 1 og λ > 0 er<br />
λ · P( max<br />
0≤k≤n |Xk| > λ) ≤ 3 · max<br />
0≤k≤n E[|Xk|].<br />
Den sidste ulighed gælder også for supermartingaler. Lader vi n → ∞ fås derfor<br />
λ · P(sup<br />
k<br />
hvilket leder til flg. korollar.<br />
|Xk| > λ) ≤ 3 · supE[|Xk|]<br />
for λ > 0,<br />
k<br />
Korollar. For enhver L 1 -begrænset sub - eller supermartingal (Xn,Fn)n≥0, specielt enhver<br />
ikke-negativ supermartingal, er<br />
P(sup<br />
k<br />
|Xk| < ∞) = 1.<br />
Ved integration og anvendelse af Fubini’s Sætning kan maksimalulighederne omdannes til<br />
momentuligheder. Et vigtigt eksempel er den såkaldte Doob’s Ulighed. Tilfældet p = 2 er<br />
specielt vigtigt.<br />
Korollar. Doob’s Ulighed.<br />
Lad (Xn,Fn)n≥0 betegne en martingal eller ikke-negativ submartingal. Da gælder for ethvert<br />
p > 1 med tilhørende konjugerede tal q = p/(p − 1), at<br />
og dermed<br />
max<br />
0≤k≤n |Xk|p ≤ q · Xn p for alle n ≥ 0<br />
E[sup |Xn|<br />
n<br />
p ] ≤ q p · sup E[|Xn|<br />
n<br />
p ].<br />
Sætning Ma 3. Opkrydsningsuligheder.<br />
Lad (Xn,Fn)n≥0 betegne en supermartingal. Da gælder<br />
(s − r) · E[U n r,s] ≤ E[(Xn − r) − ] ≤ E[X − n ]+|r|<br />
for alle n ≥ 1 og alle reelle tal r < s, hvor U n r,s er antallet af opkrydsninger over [r,s] i<br />
tidsintervallet [0,n]. Ved brug af Monoton konvergens fås derfor, at<br />
(s − r) · E[sup U<br />
n<br />
n r,s ] ≤ sup E[X<br />
n<br />
− n ]+|r|.<br />
Det totale antal opkrydsninger over [r,s], dvs. Ur,s := sup n U n r,s, er derfor endelig P-n.o., hvis<br />
sup k E[X − k ] < ∞, dvs. hvis processen er begrænset i L1 .<br />
Sætning Ma 4. Martingalkonvergenssætninger.<br />
Lad (Xn,Fn)n≥0 betegne en sub- eller supermartingal. Da eksisterer limn Xn(ω) i R for Pn.a.<br />
ω hvis sup k E[|Xk|] < ∞, og grænsefunktionen er P-integrabel. Udtrykt ved hjælp af X∞<br />
kan dette formuleres som<br />
sup<br />
k<br />
E[|Xk|] < ∞ ⇒ Xn → X∞ P-n.o. og X∞ ∈ L 1 (P).<br />
205
Enhver ikke-negativ supermartingal specielt enhver ikke-negativ martingal konvergerer derfor<br />
P-n.o. Kombineres med Sætning 6 fås endvidere.<br />
Korollar For enhver uniformt integrabel sub- eller supermartingal (Xn,Fn)n≥0 gælder<br />
X∞ ∈ L 1 (P) og Xn → X∞ P-n.o. og i P-middel.<br />
Det er nærliggende at undersøge sammenhængen mellem Xn og E[X∞ |Fn], dvs. undersøge<br />
om martingal- h.h.v. sub- eller supermartingalegenskaben udvider til ’tidspunkt ∞’. Resultatet,<br />
der formuleres som endnu et korollar konvergenssætningen, omtaler kun martingaler<br />
og submartingaler, men der gælder selvfølgeligt et tilsvarende resultat for supermartingaler.<br />
Korollar For enhver submartingal (Xn,Fn)n≥0 gælder<br />
{X + n |n ≥ 1} er uniformt integrabel ⇒ Xn ≤ E[X∞ |Fn] P-n.o. for n ≥ 0,<br />
og hvis (Xn,Fn)n≥0 er en martingal gælder tilsvarende<br />
{Xn |n ≥ 1} er uniformt integrabel ⇒ Xn = E[X∞ |Fn] P-n.o. for n ≥ 0.<br />
Bemærk at sidste del sammen med Bm 16 viser, at mængden af Lévy martingaler er identisk<br />
med mængden af uniformt integrable martingaler.<br />
Det er relevant eksplicit at formulere yderligere to konsekvenser af martingalkonvergenssætningen.<br />
Lévy’s Sætning<br />
For ethvert X ∈ L 1 (P) og ethvert filter (Gn)n≥0 med G∞ := σ( <br />
nGn) konvergerer<br />
E[X |Gn] → E[X |G∞] P-n.o. og i L 1 (P).<br />
D.v.s. E[X |Gn] → X P-n.o. og i L 1 , hvis X er G∞-målelig. Endvidere gælder for enhver (Gn)stoptid<br />
τ, at hvis Xn = E[X |Gn] for n ≥ 0, så er<br />
Xτ = E[X |Gτ] P-n.o.<br />
L p -konvergens. (p > 1)<br />
For enhver martingal (Mn,Fn)n≥0 og ethvert p > 1 gælder :<br />
supE[|Mn|<br />
n<br />
p ] < ∞ ⇔ limMn eksisterer P-n.o. og i L<br />
n p (P).<br />
Sætning Ma 5. Optional Sampling.<br />
Lad (Xn,Fn)n≥0 betegne en martingal og lad σ ≤ τ betegne to stoptider, hvor τ er optional<br />
for (Xn)n≥0. Da er Xτ og Xσ elementer i L 1 (P) og<br />
E[X0] = E[Xσ] = E[Xτ] samt E[Xτ |Fσ] = Xσ P -n.o.<br />
Der gælder et tilsvarende resultat for sub- og supermartingaler med = erstattet af det relevante<br />
ulighedstegn. Optionalitetskravet kan her svækkes lidt, idet det for en submartingal er<br />
nok, at τ er optional for processen (X + n )n≥0, og tilsvarende for en supermartingal nok at τ er<br />
optional for (X − n )n≥0. Specielt har vi derfor flg. korollar.<br />
Korollar Lad (Xn,Fn)n≥0 betegne en ikke-negativ supermartingal. Da er Xτ ∈ L 1 (P) for<br />
enhver stoptid τ, og for ethvert par af stoptider σ ≤ τ gælder<br />
E[X∞] ≤ E[Xτ] ≤ E[Xσ] ≤ E[X0] samt E[Xτ |Fσ] ≤ Xσ P -n.o.<br />
206
Sætning Ma 1 og Ma 2.<br />
Bevis for ætning Ma 1 (submartingal tilfældet). Lad τ betegne en stoptid. Da<br />
|Xτ∧n| ≤<br />
n<br />
n−1<br />
∑ |Xk| og Xτ∧n = ∑ 1 {τ=k}Xk + 1 {τ≥n}Xn<br />
k=0<br />
k=0<br />
er Xτ∧n integrabel og Fn-målelig for alle n ≥ 0. Ligeledes gælder for ethvert n ifølge regnereglerne<br />
for betingede middelværdier, da<br />
at<br />
1 {τ≤n}Xτ = 1 {τ≤n}Xτ∧n og {τ > n} er Fn-målelige,<br />
E[X τ∧(n+1) |Fn] = E[1 {τ≤n}Xτ + 1 {τ>n}Xn+1 |Fn] =<br />
1 {τ≤n}Xτ + 1 {τ>n} · E[Xn+1 |Fn] ≥ 1 {τ≤n}Xτ + 1 {τ>n}Xn = Xτ∧n.<br />
Dette viser den første påstand. Lad dernæst σ og τ betegne to begrænsede stoptider, så at<br />
σ ≤ τ. Der findes altså et helt tal m ≥ 1, så at P(σ ≤ τ ≤ m) = 1. Integrabiliteten af Xτ og<br />
Xσ følger som ovenfor, og ifølge det netop viste er<br />
E[Xτ |Fn] = E[Xτ∧m |Fn] ≥ Xτ∧n P-n.o.<br />
for alle 0 ≤ n ≤ m. Men heraf fås ifølge Ma 5, at<br />
E[Xτ |Fσ] =<br />
m<br />
m<br />
∑ E[Xτ |Fn] · 1 {σ=n} ≥ ∑ Xτ∧n · 1 {σ=n} = Xτ∧σ = Xσ P-n.o..<br />
n=0<br />
n=0<br />
Uligheden E[Xσ] ≤ E[Xτ] følger herefter umiddelbart ved at tage middelværdi på begge sider,<br />
og ved et passende valg af begrænsede stoptider indeholder denne som et specialtilfælde også<br />
uligheden E[X0] ≤ E[Xσ]. ♦<br />
Som en umiddelbar konsekvens ses at for enhver stoptid τ og ethvert n ≥ 0 er<br />
i martingaltilfældet og<br />
Xτ∧n = E[Xn |Fτ∧n]<br />
X + τ∧n ≤ E[X+ n |Fτ∧n]<br />
i submartingaltilfældet. Dette viser ved brug af Bm 16 umiddelbart den formulerede præcisering<br />
af første del af sætningen.<br />
Som en første anvendelse af den viste skrabede udgave af Optional Sampling vises Sætning<br />
Ma 2. Lad derfor (Xn,Fn)n≥0 betegne en submartingal og lad λ > 0 være givet. Definer,<br />
idet inf /0 := ∞,<br />
τ λ := inf{n ≥ 0|Xn > λ} og σ λ := inf{n ≥ 0|Xn < −λ}.<br />
Da (Xn)n≥0 er tilpasset, er τ λ og σ λ stoptider, og for alle n gælder<br />
{ max<br />
0≤k≤n Xk > λ} = {τ λ ≤ n} = {Xτ λ ∧n > λ} ∩ {τ λ ≤ n}<br />
207
og tilsvarende<br />
{ min<br />
0≤k≤n Xk < −λ} = {σ λ ≤ n} = {−Xσ λ ∧n > λ} ∩ {σ λ ≤ n}.<br />
Ifølge den ovenfor viste ’skrabede udgave’ af Optional Sampling gælder derfor for alle n, da<br />
{τ λ ≤ n} ∈ Fτ λ ∧n og tilsvarende {σ λ > n} = {σ λ ≤ n} c ∈ Fσ λ ∧n, at<br />
og tilsvarende<br />
λ · P( max<br />
0≤k≤n Xk<br />
<br />
> λ) = λ · P(τλ ≤ n) = λ dP ≤<br />
{τλ ≤n}<br />
Xτλ ∧n dP<br />
{τλ ≤n}<br />
≤ E[Xτ λ ∧n, τ λ ≤ n] ≤ E[Xn, τ λ ≤ n] ≤ E[X + n ,τ λ ≤ n] ≤ E[X + n ].<br />
λ · P( min<br />
0≤k≤n Xk < −λ) = λ · P(σ λ ≤ n) =<br />
<br />
<br />
λ dP ≤ −Xσλ ∧n dP<br />
{σλ ≤n}<br />
{σλ ≤n}<br />
≤ E[−Xσ λ ∧n, σ λ ≤ n] = E[Xσ λ ∧n, σ λ > n] − E[Xσ λ ∧n]<br />
≤ E[Xn, σ λ > n] − E[Xσ λ ∧n] ≤ E[X + n<br />
] − E[X0].<br />
Da absolutværdien af en martingal er en submartingal, gælder specielt.<br />
Doob’s Ulighed.<br />
Lad (Xn,Fn)n≥0 betegne en martingal. Da gælder for alle λ > 0 og n ≥ 0<br />
λ · P( max<br />
0≤k≤n |Xk| > λ) ≤ E[|Xn|, max<br />
0≤k≤n |Xk| > λ ]<br />
og dermed (se nedenstående momentulighed) for alle p > 1<br />
max<br />
0≤k≤n |Xk|p ≤ p/(p − 1) · Xn p n ≥ 0.<br />
Momentulighed.<br />
Lad X og Y betegne ikke-negative stokastiske variable. Hvis<br />
er<br />
P(X > λ) ≤ E[Y/λ, X > λ ] for alle λ > 0,<br />
E[X p ] 1/p ≤ p/(p − 1) · E[Y p ] 1/p<br />
for alle p > 1.<br />
Bevisskitse. Integrationsformlen for ikke negative integranter viser sammen med Tonelli’s<br />
Sætning at ∞<br />
P(X > λ) · pλ p−1 dλ = E[X p ]<br />
og ∞<br />
0<br />
0<br />
E[Y/λ, X > λ ] · pλ p−1 dλ = p<br />
p − 1 E[X p−1 ·Y ].<br />
Hvoraf uligheden følger ved brug af Hölder’s Ulighed.<br />
208
Sætning Ma 3 og Ma 4.<br />
Bevis for Sætning Ma 3. Lad (Xn,Fn)n≥0 betegne en supermartingal og r < s reelle tal. Da<br />
(Xn)n≥0 er tilpasset, definerer<br />
τ1 := inf{n ≥ 0|Xn < r} og σ1 := inf{n ≥ τ1 |Xn > s}<br />
τk := inf{n ≥ σk−1 |Xn < r} og σk := inf{n ≥ τk |Xn > s} k > 1<br />
stoptider, så at τ1 ≤ σ1 ≤ τ2 ≤ σ2 ≤ ···. Bemærk at σk ≥ k samt at Xτk < r på {τk < ∞} og<br />
tilsvarende Xσk > s på {σk < ∞} og dermed da τk ≤ σk<br />
Xσk − Xτk > s − r på {σk < ∞}.<br />
Herudfra defineres for ethvert n ≥ 1 antallet af opkrydsninger U n r,s over intervallet [r,s] i<br />
tidsrummet {0,1,...n} som<br />
U n r,s := sup{k |σk ≤ n} =<br />
n<br />
∑ 1 {σk≤n},<br />
k=1<br />
hvor sidste lighedstegnet skyldes at σn+1 > n. For ethvert n, k ≥ 1 er<br />
dvs.<br />
og dermed<br />
+<br />
n<br />
∑<br />
k=1<br />
n<br />
1 {τk≤n} = 1 {σk≤n} + 1 {τk≤n
Korollar Lad (Xn,Fn)n≥0 betegne en sub- eller en supermartingal, som er begrænset i<br />
L 1 (P), dvs. sup n E[|Xn|] < ∞. Da er<br />
P(−∞ < liminf<br />
n<br />
dvs. limn Xn(ω) eksisterer i R for P-n.a. ω.<br />
Xn = limsup Xn < ∞) = 1,<br />
n<br />
Bevis. Den simple sammenhæng mellem sub - og supermartingaler viser, at vi uden tab af<br />
generalitet kan antage, at (Xn,Fn)n≥0 er en supermartingal. Da<br />
sup<br />
n<br />
E[|Xn|] < ∞ ⇒ P(sup|Xn|<br />
< ∞) = 1<br />
n<br />
ifølge maksimalulighederne, udestår kun at vise, at lighedstegnet holder P-n.o. Men gælder<br />
dette ikke, eksisterer der, da R er separabel, reelle tal r < s, så at<br />
0 < P(liminf<br />
n<br />
Xn < r < s < limsup<br />
n<br />
Xn) ≤ P(supU<br />
n<br />
n r,s = ∞),<br />
hvilket strider mod Sætning Ma 3, da E[sup nU n r,s ] = supn E[U n r,s ] < ∞. ♦<br />
Bemærkning. Da E[|Xn|] = E[Xn] ≤ E[X0] for en ikke-negativ supermartingal (Xn,Fn)n≥0<br />
er en sådan altid konvergent P-n.o.<br />
Med X∞ defineret på sædvanlig vis, kan det viste formuleres som.<br />
Martingal Konvergenssætningen.<br />
For enhver sub- eller supermartingal (Xn,Fn)n≥0 gælder<br />
sup<br />
k<br />
E[|Xk|] < ∞ ⇒ Xn → X∞ P-n.o. og X∞ ∈ L 1 (P).<br />
Hvis {Xn |n ≥ 0} er uniformt integrabel, er der yderligere konvergens i L 1 (P).<br />
Integrabiliteten følger af Fatou’s Lemma, idet<br />
E[|X∞|] ≤ liminf<br />
n<br />
E[|Xn|] ≤ supE[|Xn|]<br />
< ∞,<br />
n<br />
og konvergensen i L 1 (P) følger dernæst af Sætning 6. Det sidste punkt kan præciseres yderligere.<br />
Korollar For enhver martingal (Xn,Fn)n≥0 gælder<br />
{Xn |n ≥ 0} uniformt integrabel ⇒ Xn = E[X∞ |Fn] P-n.o. n ≥ 0,<br />
og hvis (Xn,Fn)n≥0 er en submartingal gælder<br />
{X + n |n ≥ 0} uniformt integrabel ⇒ Xn ≤ E[X∞ |Fn] P-n.o. n ≥ 0,<br />
Bevis. Da betinget middelværdi er en kontraktion i L 1 (P), har vi<br />
Xk → X∞ i L 1 (P) ⇒ E[Xk |Fn] →k→∞ E[X∞ |Fn] i L 1 (P)<br />
210
for alle n, hvoraf martingaltilfældet umiddelbart følger, da<br />
Xn = E[Xk |Fn] P-n.o. for k ≥ n.<br />
Betragt dernæst submartingaltilfældet. Antagelsen sikrer at sup k E[|Xk|] < ∞ og dermed<br />
Xn → X∞ P-n.o. For ethvert m ≥ 0 konvergerer derfor<br />
Xn ∨(−m) → X∞ ∨(−m) P-n.o.,<br />
og også i L 1 (P), idet {Xn ∨(−m)|n ≥ 0} er uniformt integrabel, da<br />
|Xn ∨(−m)| ≤ X + n<br />
+ m for alle n, m ≥ 0.<br />
Ved fornyet brug af, at betingede middelværdier er kontraktioner i L 1 (P), fås derfor<br />
E[Xk ∨(−m)|Fn] →k→∞ E[X∞ ∨(−m)|Fn] i L 1 (P)<br />
for alle n ≥ 0, og dermed Xn ≤ E[X∞ ∨(−m)|Fn] P-n.o. for alle m ≥ 0, da<br />
Xn ≤ Xn ∨(−m) ≤ E[Xk ∨(−m)|Fn] P-n.o.<br />
for alle n ≤ k. Det ønskede resultat følger nu ved grænseovergang, idet<br />
E[X∞ |Fn] = inf<br />
m≥0 E[X∞ ∨(−m)|Fn] P-n.o.<br />
for ethvert n ≥ 0 ifølge Bm 7. ♦<br />
Konvergenssætningen giver anledning til et par interessante korollarer.<br />
Lévy’s Sætning<br />
For ethvert X ∈ L 1 (P) og ethvert filter (Gn)n≥0 konvergerer<br />
E[X |Gn] → E[X |G∞] P-n.o. og i L 1 (P).<br />
Specielt gælder for enhver (Gn)-stoptid τ, at hvis Xn = E[X |Gn] for n ≥ 0, så er<br />
Xτ = E[X |Gτ] P-n.o.<br />
Bevis. Lad X ∈ L 1 (P) og (Gn)n≥0 være givet. (E[X |Gn],Gn)n≥0 er da en uniform integrabel<br />
martingal, og ifølge martingalkonvergenssætningen findes der derfor et element ˜X ∈ L 1 (P),<br />
som er G∞-målelig, så at<br />
E[X |Gn] → ˜X P-n.o. og i L 1 (P) og E[X |Gn] = E[ ˜X |Gn] P-n.o. n ≥ 0.<br />
For alle n ≥ 0 og alle B ∈ Gn gælder dermed<br />
<br />
<br />
X dP = E[X |Gn]dP =<br />
B<br />
B<br />
B<br />
<br />
E[ ˜X |Gn]dP =<br />
B<br />
˜X dP.<br />
Men ifølge det andet korollar til Proposition 5 viser dette, da <br />
nGn er en algebra, som frembringer<br />
G∞, netop ligheden<br />
˜X = E[X |G∞] P-n.o.<br />
211
og dermed sætningens første del. Da X∞ = E[X |G∞] P-n.o. ifølge det netop viste, fås af<br />
Ma 5, at<br />
Xτ = ∑ Xk · 1 {τ=k} = ∑ E[X |Gk] · 1 {τ=k} = E[X |Gτ]. ♦<br />
k∈N0 ∪{∞}<br />
k∈N0 ∪{∞}<br />
Bemærkning. Da enhver betinget middelværdi er en kontraktion i L 1 (P) kan Levý’s Sætning<br />
suppleres med implikationen<br />
Xn → X i L 1 (P) ⇒ E[Xn |Gn] → E[X |G∞] i L 1 (P).<br />
og der er konvergens P-n.o. og i L 1 (P), hvis Xn → X P-n.o. og sup n |Xn| ∈ L 1 (P).<br />
L p -konvergens. (p > 1)<br />
For enhver martingal (Mn,Fn)n≥0 og ethvert p > 1 gælder :<br />
supE[|Mn|<br />
n<br />
p ] < ∞ ⇔ limMn eksisterer P-n.o. og i L<br />
n p (P).<br />
Bevis. Implikationen ⇐ er en umiddelbar konsekvens af definitionen på L p -konvergens.<br />
Men hvis sup n E[|Mn| p ] < ∞ er {Mn |n ≥ 0} uniformt integrabel, og ifølge martingal konvergenssætningen<br />
findes der derfor et M ∈ L 1 (P,F∞), så at<br />
Ifølge Fatou’s Lemma gælder derfor<br />
dvs. M ∈ L p (P), og da<br />
Mn = E[M |Fn] og Mn → M P-n.o.<br />
E[|M| p ] ≤ liminf<br />
n<br />
E[|Mn| p ] ≤ supE[|Mn|<br />
n<br />
p ] < ∞,<br />
|Mn| p ≤ E[|M| p |Fn] P-n.o. for alle n ≥ 0<br />
ifølge Jensen’s ulighed for betingede middelværdier, har vi alt i alt, at limn Mn eksisterer Pn.o.<br />
og {|Mn| p |n ≥ 0} er uniformt integrabel. L p (P)-konvergensen følger derfor af korollaret<br />
til Sætning 6. ♦<br />
Det netop formulerede resultat gælder generelt ikke for p = 1, men hvis den betragtede<br />
martingal er afsnitsfølgen hørende til en sum af uafhængige centrerede variable, kan man<br />
ved hjælp af korollaret til Ottavianis ulighed vise flg. resultat. Sammenlign med LLN 2.<br />
L 1 -konvergens for summer af uafhængige variable.<br />
For enhver følge (Xi)i≥1 af uafhængige integrable stokastiske variable med tilhørende afsnitssummer<br />
Sn := ∑ n i=1 Xi for n ≥ 1 gælder<br />
lim Sn eksisterer P-n.o. og i L<br />
n 1 (P) ⇔ supE[|Sn|]<br />
< ∞ og limE[Sn] eksisterer.<br />
n<br />
n<br />
Biimplikationen gælder uændret, hvis hvis højresiden erstattes af<br />
supnE[|Sn|] < ∞ og (Sn)n≥1 konvergent i fordeling.<br />
212
Bevis. Kun ⇐ kræver et bevis, og da |E[Sn]| ≤ E[|Sn|] for alle n ses, at under højresidens<br />
antagelser er supn E[|Sn − E[Sn]|] < ∞, og<br />
<br />
(Sn − E[Sn])n =<br />
<br />
n<br />
∑ (Xi − E[Xi])<br />
i=1<br />
dermed en L 1 -begrænset martingal. Ifølge martingalkonvergenssætningen gælder derfor, at<br />
og da<br />
E[sup<br />
n<br />
lim n (Sn − E[Sn]) eksisterer P -n.o.,<br />
|Sn − E[Sn]|] ≤ 6 · supE[|Sn<br />
− E[Sn]|] < ∞<br />
n<br />
ifølge korollar 2 til Ottaviani’s ulighed, er der også konvergens i L 1 (P). Addition af den<br />
konvergente følge (E[Sn])n≥1 giver derfor umiddelbart det første resultat.<br />
Hvis sup n E[|Sn|] < ∞ i stedet suppleres med den anden antagelse, konvergerer<br />
De to funktionsfølger<br />
(Sn)n≥1 og (Sn − E[Sn])n≥1 begge i fordeling.<br />
(ϕSn (t))n≥1 og (e −iE[Sn]t · ϕSn (t))n≥1<br />
konvergerer derfor begge mod en karakteristisk funktion. Men da enhver sådan er kontinuert<br />
og 1 i 0 følger ved division, at<br />
lim n e iE[Sn]t eksisterer for alle t ∈ R.<br />
Men da vi endvidere pr. antagelse ved, at (E[Sn])n≥1 er en begrænset følge, viser et simpelt<br />
delfølge argument, at limn E[Sn] eksisterer i R. Resultatet følger derfor af det ovenstående.♦<br />
Bemærkning. Betragtes den deterministiske og dermed uafhængige følge Xi :≡ (−1) i for<br />
i ≥ 1 ses, at konvergens ikke følger ud fra en antagelse om blot sup n E[|Sn|] < ∞.<br />
213<br />
n
Optionalitet.<br />
Lad i dette afsnit (Fn)n≥0 betegne et filter i F , og lad det være underforstået at udtryk<br />
som tilpassethed og stoptidsegenskab altid er m.h.t.(Fn)n≥0. Endvidere betegner (Yn)n≥0 en<br />
given tilpasset reel proces.<br />
Notation. En stoptid τ siges at være optional for (Yn)n≥0, hvis {Yτ∧n |n ≥ 0} er uniformt<br />
integrabel.<br />
Da den indførte definition af Yτ bevirker, at |Yτ| ≤ liminfn |Yτ∧n| P-n.o., og dermed ifølge<br />
Fatou’s Lemma, at<br />
E[|Yτ|] ≤ liminf<br />
n<br />
E[|Yτ∧n|] ≤ supE[|Yτ∧n|],<br />
n<br />
ses, at integrabilitet af Yτ er en nødvendig betingelse for optionalitet. D.v.s. vi har implkationen<br />
τ optional for (Yn)n≥0 ⇒ Yτ ∈ L 1 (P).<br />
Betingelsen er dog generel ikke tilstrækkelig, og vi vil nedenfor undersøge, hvad der yderligere<br />
skal til. Men inden udnyttes de tidligere viste kriterier for uniform integrabilitet, se<br />
f.eks. øvelsene 16 og 17, Lemma 10 med korollarer, Sætning 6 og Proposition 11, til at liste<br />
en række tilstrækkelige betingelser, som hver især sikrer optionalitet.<br />
Kriterier for optionalitet.<br />
En stoptid τ er optional for (Yn)n≥0 i hver af de følgende fire situationer.<br />
a) Der findes et Y ∈ L 1 (P), så at |Yτ∧n| ≤ Y P-n.o. for alle n ≥ 0, eller ækvivalent hvis<br />
sup n |Yτ∧n| ∈ L 1 (P).<br />
b) For ethvert ε > 0 findes der elementer Mε og (Zε,n)n≥1 i L 1 (P)+, så at<br />
E[Zε,n] ≤ ε og |Yτ∧n| ≤ Mε + Zε,n P-n.o. for alle n ≥ 0.<br />
c) Der findes et α > 1, så at sup n E[|Yτ∧n| α ] < ∞.<br />
d) limnYτ∧n eksisterer i L 1 (P).<br />
Bemærk at Bm 16 og 16" også kan bruges til at vise optionalitet.<br />
a) er opfyldt i flg. to specialtilfælde.<br />
a1) τ begrænset stoptid og Yn’erne integrable; thi er M en konstant, der dominerer τ, gælder<br />
her<br />
|Yτ∧n| ≤<br />
M<br />
∑ |Yk| ∈ L<br />
k=0<br />
1 (P) for alle n ≥ 0.<br />
a2) E[τ] og E[|Y0|] endelige samt |Yn −Yn−1| ≤ M < ∞ P-n.o. for alle n ≥ 1; thi her gælder<br />
Opskrivningerne<br />
τ∧n<br />
|Yτ∧n| ≤ |Y0|+ ∑ |Yk −Yk−1| ≤ |Y0|+M · τ.<br />
k=1<br />
Yτ∧σ∧n = 1 {σ>τ}Yτ∧n + 1 {σ≤τ}Yσ∧n, Y (τ∨σ)∧n = 1 {σ
og dermed |Yτ∧σ∧n|∨|Y (τ∨σ)∧n| ≤ |Yτ∧n|+|Yσ∧n| viser, at mængden af optionale stoptider er<br />
stabil under max og min, dvs.<br />
τ og σ optionale for (Yn)n≥0 ⇒ τ ∧ σ og τ ∨ σ optionale for (Yn)n≥0.<br />
Som allerede nævnt er integrabilitet af Yτ nødvendig for optionalitet af τ, og vi vil nu se<br />
undersøge på, hvad der yderligere skal til. Ligheden<br />
Yτ∧n = 1 {τ>n}Yn + 1 {τ≤n}Yτ<br />
viser, da {τ > n} og {τ ≤ n} er disjunkte, at τ er optional, hvis og kun hvis mængderne<br />
{1 {τ≤n}Yτ | n ≥ 0} og {1 {τ>n}Yn |n ≥ 0}<br />
begge er uniformt integrable. Den første klares let, for da 1 {τ≤n}|Yτ| ↑ 1 {τn}Yτ∧n,<br />
at det netop er opfyldt, hvis {1 {σ≤n}Yσ |n ≥ 0} er uniformt integrabel, dvs. hvis<br />
E[|Yσ|,σ < ∞] < ∞.<br />
Men som allerede bemærket er denne egenskab også nødvendig, og vi har derfor vist.<br />
Opt. 2 Hvis τ er optional for (Yn)n≥0, så gælder for enhver stoptid σ ≤ τ, at<br />
σ er optional for (Yn)n≥0 ⇔ E[|Yσ|,σ < ∞] < ∞.<br />
215
Sætning Ma 5.<br />
Bevis for Sætning Ma 5. Lad (Xn,Fn)n≥0 være en submartingal og 0 ≤ σ ≤ τ stoptider, hvor<br />
τ antages optional for (X + n )n≥0, dvs. {X + τ∧n |n ≥ 0} er uniformt integrabel. Da σ ∧ n ≤ τ ∧ n<br />
viser den ’skrabede udgave’ af Optional Sampling at<br />
Xσ∧n ≤ E[Xτ∧n |Fσ∧n] og dermed X + σ∧n ≤ E[X+ τ∧n |Fσ∧n]<br />
for n ≥ 0, og ifølge Bm 16 er {X + σ∧n |n ≥ 0} derfor uniformt integrabel, dvs. σ er også optional<br />
for (X + n )n≥0. Benyttes martingal konvergenssætningen på de to submartingaler<br />
(Xσ∧n,Fn)n≥0 og (Xτ∧n,Fn)n≥0<br />
fås derfor, at Xσ og Xτ er elementer i L 1 (P) og<br />
Xσ∧n →n→∞ Xσ og Xτ∧n →n→∞ Xτ P-n.o.<br />
Korollaret til martingal konvergenssætningen viser endvidere, at<br />
Xτ∧n ≤ E[Xτ |Fn] P-n.o.<br />
og dermed ifølge den skrabede udgave af Optional Sampling<br />
Xσ∧n ≤ E[Xτ∧n |Fσ∧n] ≤ E[E[Xτ |Fn]|Fσ∧n] = E[Xτ |Fσ∧n].<br />
Som allerede nævnt konvergerer venstresiden her P-n.o. mod Xσ, og da<br />
ifølge Lévy’s Sætning og Ma 6 ses at<br />
E[Xτ |Fσ∧n] →n→∞ E[Xτ |Fσ] P-n.o.,<br />
Xσ ≤ E[Xτ |Fσ] P-n.o.<br />
og dermed også uligheden E[Xσ] ≤ E[Xτ]. ♦<br />
I martingaltilfældet gælder tilsvarende formler blot med lighedstegn overalt. Som en konsekvens<br />
af Ma 7 og det viste resultat har vi flg. korollar.<br />
Korollar. Lad (Xn,Fn)n≥0 være en martingal og τ en stoptid, som er optional for (Xn)n≥0.<br />
Da er<br />
Xσ∧τ = E[Xτ |Fσ] P-n.o.<br />
for enhver stoptid σ, dvs. {Xσ |σ stoptid, σ ≤ τ} er uniformt integrabel.<br />
Hvis (Xn,Fn)n≥0 er en submartingal og τ optional for (X + n )n≥0, gælder tilsvarende<br />
Xσ∧τ ≤ E[Xτ |Fσ] P-n.o.<br />
for enhver stoptid σ, og mængden {X + σ |σ stoptid, σ ≤ τ} er derfor uniformt integrabel.<br />
216
Appendiks F. Resultater fra reel analyse.<br />
I forbindelse med gennemgangen af stoffet får vi brug for nogle få specielle resultater fra reel<br />
analyse. Da de normalt ikke vil være gennemgået i et indledende kursus i reel analyse, og<br />
de ikke naturligt passer ind i teksten, har jeg valgt at samle dem i dette appendiks. Vi starter<br />
med to resultater omhandlende funktionskonvergens dernæst lidt rækketeori for til sidst at<br />
omtale en vigtig egenskab ved den reelle akse.<br />
Weierstrass - Bernstein’s Sætning<br />
Til ethvert f ∈ C(R) findes der en følge af polynomier (Pn)n≥1 så at Pn(x) → f(x) uniformt<br />
for x ∈ [0,1].<br />
Bevis. Lad f ∈ C(R) være givet. Definer for alle n ≥ 1 og x ∈ R<br />
Pn f(x) :=<br />
Bemærk at for alle n ≥ 1 og x ∈ [0,1] er<br />
hvor S x n ∼ bi(n,x), hvor bi(n,0) := δ0. Da<br />
n <br />
n<br />
∑ f(k/n) ·<br />
k<br />
k=0<br />
Pn f(x) = E[ f(S x n /n)]<br />
<br />
· x k ·(1 − x) n−k .<br />
E[S x n /n] = x og Var(Sx x(1 − x)<br />
n /n) = ≤<br />
n<br />
1<br />
4n<br />
fås ved brug af Chebychev’s ulighed, at for alle n ≥ 1, x ∈ [0,1] og ε > 0 er<br />
P(|S x n/n − x| > ε) ≤ (4nε 2 ) −1 .<br />
Dvs. for x ∈ [0,1] har vi for alle n ≥ 1 og ε > 0<br />
hvor<br />
|Pn f(x) − f(x)| = |E[ f(S x n/n) − f(x)]| ≤ E[| f(S x n/n) − f(x)|]<br />
= E[| f(S x n /n) − f(x)|,|Sx n /n − x| > ε ]+E[| f(Sx n /n) − f(x)|,|Sx n /n − x| ≤ ε ]<br />
≤ Mf · P(|S x n/n − x| > ε)+Vf(ε) ≤ M<br />
+Vf(ε),<br />
4nε2 Mf = sup | f(t)| og Vf(ε) = sup{| f(u) − f(v)||u,v ∈ [0,1], |u − v| ≤ ε}.<br />
t∈[0,1]<br />
Men da f er kontinuert og dermed begrænset og uniformt kontinuert på [0,1], dvs.<br />
Mf < ∞ og Vf(ε) →ε→0 0,<br />
følger umiddelbart, at Pn f(x) → f(x) uniformt for x ∈ [0,1]. ♦<br />
217
Helly’s Lemma<br />
Lad (Fn)n≥1 betegne en følge af fordelingsfunktioner. Der findes da en delfølge (σ(n))n≥1<br />
og en højrekontinuert voksende funktion F : R → R, så at 0 ≤ F ≤ 1 og<br />
F σ(n)(x) → F(x) for alle x ∈ CF,<br />
hvor CF betegner mænden af kontinuitetspunkter for F. Dvs. F σ(n) → F punktvis, hvis F er<br />
kontinuert.<br />
Bevis. Da mængden af rationale tal er tællelig, kan vi, da fordelingsfunktioner kun antager<br />
værdier i [0,1], ved successiv udtynding vælge en delfølge (σ(n))n≥1, så at<br />
Definitionen viser umiddelbart, at<br />
for vilkårlige rationale tal r1 < r2. Definer<br />
G(r) := lim n F σ(n)(r) eksisterer for alle r ∈ Q.<br />
0 ≤ G(r1) ≤ G(r2) ≤ 1<br />
F(x) := inf G(r) x ∈ R.<br />
r>x,r∈Q<br />
Ifølge simpel reel analyse er F ikke-aftagende og højrekontinuert samt opfylder uligheden<br />
0 ≤ F ≤ 1. Betragt et x ∈ R. For alle m ≥ 1 og rationale tal r, så at x − 1/m < r < x, har vi<br />
F(x − 1/m) ≤ G(r) = limFσ(n)(r) ≤ liminf<br />
n n<br />
Fσ(n)(x), og dermed F(x−) = supm F(x − 1/m) ≤ liminfn Fσ(n)(x). Tilsvarende gælder for alle rationale<br />
tal r > x, at<br />
limsup Fσ(n)(x) ≤ limFσ(n)(r) = G(r)<br />
n<br />
n<br />
og dermed limsup n F σ(n)(x) ≤ F(x), da F(x) = infr>x,r∈Q G(r) pr. definition. Alt i alt er<br />
F(x−) ≤ liminf<br />
k<br />
Fσ(n)(x) ≤ limsup Fσ(n)(x) ≤ F(x)<br />
n<br />
for alle x ∈ R, hvilket viser den sidste påstand. ♦<br />
I forlængelse af den sidste bemærkning er det værd at nævne flg. resultat.<br />
Hvis (Fn)n≥1 og F er fordelingsfunktioner, og F er kontinuert, gælder<br />
Fn(x) → F(x) for alle x ∈ R ⇒ supx∈R|Fn(x) − F(x)| → 0,<br />
dvs. punktvis konvergens medfører uniform konvergens.<br />
218
Kronecker’s Lemma<br />
Lad (an)n≥1 og (bn)n≥1 betegne reelle talfølger, så at 0 < bn < bn+1 ↑ ∞. Da gælder<br />
∞<br />
∑ an/bn konvergent i R ⇒<br />
n=1<br />
1<br />
bn<br />
n<br />
∑ ai → 0.<br />
i=1<br />
Navnet Kronecker’s Lemma refererer normalt til specialtilfældet bn = n.<br />
Bevis. Sæt<br />
Dvs. rn → 0 og<br />
og dermed for alle n > m ≥ 1<br />
∞<br />
rn = ∑<br />
i=n<br />
ai/bi n ≥ 1.<br />
an = bn(rn − rn+1) = bn−1rn − bnrn+1 + rn(bn − bn−1)<br />
n m<br />
∑ ai = ∑ ai +<br />
n<br />
∑ (bi−1ri − biri+1)+<br />
n<br />
∑<br />
i=1 i=1 i=m+1<br />
i=m+1<br />
=<br />
m<br />
∑ ai +(bmrm+1 − bnrn+1)+<br />
n<br />
∑<br />
i=1<br />
i=m+1<br />
Ved brug af trekantsuligheden fås derfor for n > m ≥ 1<br />
| 1<br />
bn<br />
n<br />
∑ ai | ≤<br />
i=1<br />
1<br />
bn<br />
(<br />
m<br />
∑<br />
i=1<br />
≤ 1<br />
bn<br />
ri(bi − bi−1)<br />
ri(bi − bi−1).<br />
|ai|+sup |ri|((bm + bn)+(bn − bm)))<br />
i>m<br />
m<br />
∑<br />
i=1<br />
|ai|+2sup |ri|.<br />
i>m<br />
For givet ε > 0 bestemmes først m, så at sidste led er mindre end ε/2, og for m fast går første<br />
led mod 0, da bn → ∞. ♦<br />
Vi får yderligere brug for flg. resultat.<br />
Hvis en reel talfølge (an)n≥1 er enten opad eller nedad begrænset, dvs. hvis<br />
så er<br />
hvor<br />
lim n<br />
n<br />
supan<br />
< ∞ eller inf<br />
n<br />
n an > −∞,<br />
1<br />
n ∑ ai = 0 hvis lim<br />
n<br />
i=1<br />
νk(n)<br />
1<br />
νk(n) ∑ ai = 0 for alle k ≥ 1,<br />
i=1<br />
νk(n) := [(1+1/k) n ] for n, k ≥ 1.<br />
Bevis. Antag at an’erne er nedad begrænset. Ved addition med en ikke-negativ konstant M<br />
ses, at vi kan antage, at an’erne er ikke-negative, samt at det nu gælder om at vise konvergens<br />
219
mod M ud fra en antagelse om konvergens mod M. Men dette følger umiddelbart. For lader<br />
vi for ethvert n ≥ 2 og ethvert k νk(ln) være valgt så at<br />
gælder åbenbart<br />
og<br />
1<br />
n<br />
1<br />
n<br />
n<br />
n<br />
∑ ai ≤<br />
i=1<br />
1<br />
νk(ln)<br />
∑ ai ≥<br />
i=1<br />
for alle k og derfor<br />
1<br />
νk(ln + 1)<br />
νk(ln) ≤ n < νk(ln + 1),<br />
νk(ln+1)<br />
∑ ai ≤<br />
i=1<br />
1+1/k<br />
νk(ln + 1)<br />
νk(ln)<br />
∑ ai ≥<br />
i=1<br />
(1+1/k)−1<br />
νk(ln)<br />
1<br />
n<br />
n<br />
∑ ai → M. ♦<br />
i=1<br />
νk(ln+1)<br />
∑ ai → (1+1/k) · M<br />
i=1<br />
νk(ln)<br />
∑ ai → (1+1/k)<br />
i=1<br />
−1 · M,<br />
I forbindelse med det netop viste resultat er det værd at minde om, at for enhver reel, flerdimensional<br />
eller kompleks talfølge (an)n≥1 gælder den vel kendte implikation<br />
an → a ⇒ 1<br />
n<br />
n<br />
∑ ai → a,<br />
i=1<br />
dvs. konvergens i sædvanlig forstand medfører konvergens i Cecaro 1-middel.<br />
Åbne mængder i R<br />
Enhver åben delmængde af den reelle akse er en højst tællelig disjunkt forening af åbne intervaller.<br />
Bevis. Lad G ⊆ R betegne en ikke-tom åben mængde. Idet inf /0 og sup /0 sættes til hhv. ∞<br />
og −∞ defineres for ethvert x ∈ G<br />
xh := inf{y|y > x, y /∈ G} og xv := sup{y|y < x, y /∈ G}.<br />
Da G er åben, og Q er tæt i R, ses let at flg. betingelser er opfyldte for alle x ∈ G:<br />
samt<br />
a) −∞ ≤ xv < x < xh ≤ ∞. b) (xv,xh) ⊆ G. c) Q ∩ G ∩(xv,xh) = /0<br />
d) (xv,xh) ∩(˜xv, ˜xh) = /0 ⇒ (xv,xh) = ( ˜xv, ˜xh) for vilkårlige x, ˜x ∈ G.<br />
Specielt findes der altså for alle x ∈ G et ˜x ∈ Q ∩ G, så at (xv,xh) = ( ˜xv, ˜xh).<br />
Lader vi derfor (x(n))n≥1 betegne en nummerering af Q ∩ G har vi<br />
G = <br />
(xv,xh) =<br />
x∈G<br />
∞<br />
(x(n)v,x(n)h),<br />
n=1<br />
220
og intervallerne er enten sammenfaldende eller disjunkte. Ved udtynding følger derfor, at G<br />
kan skrives som en højst tællelig disjunkt forening af åbne intervaller. ♦<br />
Det er på sin plads at understrege, at resultatet kun gælder i dimension 1. Et ’tilsvarende’<br />
resultat i højere dimensioner, som benyttes i beviset for Transformationssætningen, er flg.<br />
Enhver åben mængde G ⊆ R n kan skrives som en højst tællelig disjunkt foreningsmængde af<br />
’halvåbne’ kasser, dvs. mængder på formen<br />
hvor −∞ < ai < bi < ∞ for i = 1,...,n.<br />
n<br />
∏ ]ai,bi]<br />
i=1<br />
221
Appendiks G.<br />
Fra indledende reel analyse er det velkendt, at for reelle tal (an)n≥1 og a gælder implikationen<br />
an →n→∞ a ⇒ (1+ an<br />
n )n →n→∞ e a .<br />
Men i forbindelse med beviset for den klassiske udgave af Den centrale Grænseværdisætning<br />
udnyttedes, at resultatet også gælder for komplekse tal. Et argument herfor går som følger.<br />
Lad (an)n≥1 og a betegne komplekse tal, så at an →n→∞ a. Ifølge definitionen på konvergens<br />
af komplekse tal har vi derfor<br />
|an| →n→∞ |a|, ℜan →n→∞ ℜa og ℑan →n→∞ ℑa.<br />
Da an/n → 0 gælder derfor fra et vist trin at regne, at<br />
og dermed<br />
1+ an<br />
n<br />
= |1+ an<br />
n | · ei arctanθn hvor θn = ℑan/n<br />
1+ℜan/n ,<br />
(1+ an<br />
n )n = |1+ an<br />
n |n · e in arctanθn .<br />
x ↦→ arctanx betegner her hoveddeterminationen af tan −1 . Da denne er differentiabel i 0 med<br />
differentialkvotient 1 og θn →n→∞ 0, fås derfor, at<br />
n arctanθn = n · θn · arctanθn<br />
θn<br />
Tilsvarende fås ved brug af ovenstående reelle udgave, at<br />
Dvs. alt i alt<br />
|1+ an<br />
n |n = ((1+ℜan/n) 2 +(ℑan/n) 2 ) n/2 <br />
= 1+<br />
=<br />
ℑan arctanθn<br />
· →n→∞ ℑa.<br />
1+ℜan/n θn<br />
<br />
1+ |an| 2 n1/2 <br />
/n+2ℜan<br />
→n→∞ e<br />
n<br />
2ℜa = e ℜa .<br />
|an| 2<br />
n1/2<br />
2ℜan<br />
+ =<br />
n2 n<br />
lim n (1+ an<br />
n )n = lim n |1+ an<br />
n |n · lim n e inarctanθn = e ℜa · e iℑa = e a .<br />
222
INDHOLDSFORTEGNELSE<br />
<strong>Momentproblemet</strong> 139<br />
Den flerdimensionale normalfordeling 142<br />
Maksimal Uligheder 145<br />
De store tals love I 148<br />
De store tals love II 156<br />
Fordelingskonvergens 163<br />
Kriterier for konvergens i fordeling 167<br />
Regneregler for konvergens i fordeling 170<br />
Kontinuitetetssætningen for karakteristiske funktioner 172<br />
Den Centrale Grænseværdisætning 177<br />
Betingede middelværdier 186<br />
Martingaler 197<br />
Appendiks F 217<br />
Appendiks G 222<br />
223