06.08.2013 Views

Momentproblemet.

Momentproblemet.

Momentproblemet.

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Momentproblemet</strong>.<br />

Lad i dette afsnit X betegne en stokastisk variabel med momenter af enhver orden. Momentfølgen<br />

(E[X n ])n≥1 er derfor en vel defineret reel talfølge bestemt ved fordelingen, og<br />

spørgsmålet om, den omvendt bestemmer fordelingen, er kendt under navnet <strong>Momentproblemet</strong>.<br />

Korollar 1 i afsnittet Separation af endelige Borel mål viser, at dette gælder for<br />

begrænsede stokastiske variable, og som det fremgår af det udleverede fordelingskatalog<br />

gælder det for alle de kendte fordelingstyper med momenter af enhver orden pånær lognormalfordelingen.<br />

Et sådant eksempel på en vigtig fordelingstype, hvor momentfølgen<br />

ikke bestemmer fordelingen entydigt, gør det naturligvis interessant at vide, hvornår det er<br />

tilfældet. Problemet, der er blevet studeret i næsten 100 år, er stadig uløst i den forstand, at<br />

man endnu ikke er i stand til at formulere en generel nødvendig og tilstrækkelig betingelse<br />

på momentfølgen, som sikrer, at den bestemmer fordelingen. Men flg. simple tilstrækkelige<br />

betingelse er ofte brugbar.<br />

En stokastisk variabel X siges at opfylde (∗), hvis E[e ρ|X| ] < ∞ for et ρ > 0.<br />

(∗) holder klart, hvis X er begrænset, dvs. hvis P(|X| ≤ M) = 1 for et M ∈ R+, og som<br />

det fremgår af fordelingskatalogets punkt (H), er den opfyldt for en stor del af de kendte<br />

fordelingstyper. (∗) medfører klart eksistens af momenter af enhver orden, og da<br />

E[e r|X| ] =<br />

∞<br />

∑ r<br />

n=0<br />

n · E[|X| n ]/n! for alle r > 0<br />

ifølge monoton konvergens, giver potensrækketeori , at (∗) er ækvivalent med, at<br />

limsup(E[|X|<br />

n<br />

n ]/n!) 1/n < ∞ dvs. ∃ c ∈ R+ : E[|X| n ] ≤ c n · n! n ≥ 1.<br />

Begrundelsen for at (∗) er interessant ligger, som allerede indikeret, gemt i flg. resultat.<br />

Mp 1 Antag at X opfylder (∗). Momentfølgen (E[X n ])n≥1 bestemmer da fordelingen for X.<br />

Bevis. (∗) betyder specielt, at<br />

lim n ρ n · E[|X| n ]/n! = 0,<br />

og iIfølge Kf 9 kan ϕX derfor rækkeudvikles omkring ethvert punkt a med en konvergensradius,<br />

som er mindst ρ. Heraf kan resultatet nu vises, for ved først at rækkeudvikle omkring<br />

0 ses, da ϕX(0) = 1, at (E[X n ])n≥1 bestemmer ϕX og dermed alle dens afledede i intervallet<br />

] − ρ,ρ [. Ved fornyet rækkeudvikling omkring punkter tæt ved ρ og −ρ ses derfor, at dette<br />

også gælder i intervallet ] − 2ρ,2ρ [. Sådan fortsættes og momentfølgen bestemmer derfor<br />

ϕX og dermed ifølge Entydighedssætningen fordelingsmålet PX. ♦<br />

(∗) er en betingelse på de absolutte momenter, men der gælder flg. resultat.<br />

Mp 2 Lad X og Y være stokastiske variable med momenter af enhver orden, så at E[X k ] =<br />

E[Y k ] for alle k ≥ 1. Da holder (∗) for X, hvis og kun hvis (∗) holder for Y ; og i givet fald<br />

er X og Y derfor identisk fordelte.<br />

139


Bevis. Antag at X opfylder (∗), dvs. ∃c ∈ R+ : E[|X| n ] ≤ cn · n! n ≥ 1. Ifølge Cauchy-<br />

Schwarz’s gælder derfor<br />

E[|Y | n <br />

] ≤ E[Y 2n <br />

] = E[X 2n <br />

] ≤ c2n ·(2n)! = c n · (2n)!,<br />

og da (2n)! ≤ 2 n · n! for alle n ses, at Y også opfylder (∗). ♦<br />

Lad fortsat X betegne en given stokastisk variabel. Da<br />

e aX ∨ e −aX ≤ e a|X| ≤ e aX + e −aX for alle a > 0,<br />

følger det umiddelbart, at hvis R(LX) := {t ∈ R|E[e tX ] < ∞}, så gælder biimplikationen<br />

X opfylder (∗) ⇔ R(LX) indeholder et åbent interval omkring 0.<br />

R(LX) er altid et interval indeholdende 0, men kan bestå af 0 alene eller have 0 som enten<br />

venstre eller højre endepunkt. Definer<br />

MX(t) := E[e tX ] for t ∈ R(LX).<br />

MX(·) kaldes ofte den momentfrembringende funktion. Begrundelsen for dette er klar ud<br />

fra det ovenstående, for indeholder R(LX) et åbent interval af formen ] − ε,ε [, så har X<br />

momenter af enhver orden og<br />

MX(t) =<br />

∞ E[X<br />

∑<br />

n=1<br />

n ]<br />

·t<br />

n!<br />

n<br />

for |t| < ε.<br />

Ifølge potensrækketeori er t ↦→ MX(t) derfor uendelig ofte differentiabel i 0 med<br />

Alt i alt viser dette<br />

M (n)<br />

X (0) = E[X n ] n ≥ 1.<br />

Mp 3 Lad X og Y være stokastiske variable. Fordelingen for X er entydig bestemt ved MX,<br />

hvis denne er endelig i et åbent interval omkring 0, og X og Y er identisk fordelte, hvis<br />

MX(t) = MY(t) < ∞ for alle t i et åbent interval omkring 0.<br />

Bemærkning. Da momenterne er bestemt som afledede i punktet 0, kan man forholdsvis<br />

nemt vise, at det er nok, at R(LX) og R(LY) begge indeholder et åbent interval omkring 0,<br />

og MX(tn) = MY(tn) for en følge (tn)n≥1, som konvergerer mod 0.<br />

Et såkaldt ’målskifte’ argument viser, at Mp 3 gælder uændret for ethvert interval, dvs.<br />

Mp 3a Stokastiske variable X og Y er identisk fordelte, hvis MX(t) = MY(t) < ∞ for alle t i<br />

et åbent interval.<br />

’Bevis’. Antag MX(t) = MY(t) < ∞ for alle t ∈]λ1,λ2[, hvor λ1 < λ2. Lad for et λ0 ∈<br />

]λ1,λ2[ QX og QY betegne sandsynlighedsmålene på (Ω,F) givet ved<br />

QX := a · e λ0X dP og QY := a · e λ0Y dP, hvor a −1 = E[e λ0X ] = E[e λ0Y ],<br />

140


og lad M Q<br />

X<br />

og MQ<br />

Y betegne de momentfrembringende funktioner for X under QX og Y under<br />

QY . Reglerne for integration med hensyn til afledte mål viser, at M Q<br />

X<br />

og MQ<br />

Y<br />

er endelige<br />

og ens i intervallet ]λ1 − λ0,λ2 − λ0[. Da dette interval indeholder 0, følger af Mp 2 at<br />

QX ◦ X −1 = QY ◦Y −1 . Specielt er<br />

E[ f(X) · e λ0X ] = a −1 · E QX [ f(X)] = a −1 · E QY [ f(Y)] = E[ f(Y) · e λ0Y ]<br />

og dermed E[ f(X)] = E[ f(Y)] for alle kontinuerte funktioner f med kompakt støtte, hvilket<br />

kun er muligt, hvis X og Y har samme fordeling. ♦<br />

141


Den flerdimensionale normalfordeling.<br />

Som en simpel konsekvens af entydighedssætningen og regneregler for karakteristiske funktioner<br />

genfinder vi flg. vel kendte egenskab ved klassen af en-dimensionale normalfordelinger.<br />

Hvis X1,...,Xn er uafhængige normalfordelte stokastiske variable, er ∑ n i=1 aiXi igen normalfordelt<br />

for ethvert valg af reelle konstanter a1,...an.<br />

Med udgangspunkt heri indføres flg. flerdimensionale fordelingsklasse.<br />

Definition. En n-dimensional stokastisk vektor X siges at være n-dimensional normalfordelt,<br />

hvis<br />

t · X =<br />

er normalfordelt for alle t = (t1,...,tn) ∈ R n .<br />

n<br />

∑ ti Xi<br />

i=1<br />

Vælges t som en passende enhedsvektor ses, at alle koordinatvariable i en flerdimensional<br />

normalfordeling X er en-dimensionale normalfordelinger, dvs. de har både middelværdi og<br />

varians. Middelværdivektoren og kovariansmatricen<br />

μX := (E[X1],...,E[Xn]) og σ X := {Cov(Xi,Xj)}1≤i, j≤n<br />

er derfor vel definerede, og som i det en-dimensionale tilfælde er en n-dimensional normalfordeling<br />

bestemt ved sin tilhørende middelværdivektor og kovariansmatrice. Der gælder<br />

nemlig flg. resultat.<br />

N 1 Hvis X og Y er n-dimensional normalfordelt med μX = μY og σ X = σ Y , så er ϕX = ϕY ,<br />

dvs. X og Y er identiske fordelte.<br />

Bevis. Lad t ∈ R n være givet. Da t · X og t ·Y begge er normalfordelte stokastiske variable,<br />

er de identisk fordelte, da<br />

og<br />

Dvs. for t ∈ R n er<br />

E[t · X] = t · μX = t · μY = E[t ·Y]<br />

Var(t · X) = ∑ ti σ (i, j)t<br />

X<br />

j = ∑ ti σ (i, j)t<br />

Y<br />

j = Var(t ·Y).<br />

1≤i, j≤n<br />

1≤i, j≤n<br />

ϕX(t) = E[exp(i(t · X))] = E[exp(i(t ·Y))] = ϕY(t),<br />

hvilket ifølge Entydighedssætningen for karakteristiske funktioner betyder, at X ∼ Y . ♦<br />

Det har altså mening, at tale om den n-dimensionale normalfordeling med middelværdi vektor<br />

μ og kovariansmatrice σ, og vi vil i denne forbindelse skrive<br />

X ∼ Nn(μ,σ),<br />

hvis X er n-dimensional normalfordelt med μX = μ og σ X = σ.<br />

142


Flg. vigtige egenskaber ved flerdimensionale normalfordelinger er nu åbenbare. Som det er<br />

sædvane bruges ’samme’ notation for den lineære afbildning og den tilhørende matrice udregnet<br />

i hht. den kanoniske basis. Kovariansmatrice formlen forudsætter, at vektorerne i R n<br />

opfattes som søjlevektorer.<br />

N 2 Klassen af flerdimensionale normalfordelinger er stabil under affine transformationer,<br />

dvs. hvis X ∼ Nn(μ,σ) og T : R n → R m lineær, så er<br />

Y := y+T(X) ∼ Nm(y+T(μ), T · σ · T t )<br />

for ethvert y ∈ R m . Specielt er Y ∼ Nm(y,T · T t ), hvis X ∼ Nn(0,In).<br />

Bevis. Da enhver linearkombination af koordinaterne i Y er en affin linearkombination af<br />

koordinaterne i X, er Y m-dimensionalt normalfordelt. Resten følger nu ved beregning af<br />

den tilhørende middelværdivektor og kovariansmatrice. ♦<br />

Entydighedssætningen for karakteristiske funktioner viser sammen med N 1 og N 2 umiddelbart<br />

flg. karakterisation af den n-dimensionale normalfordeling.<br />

N 3<br />

<br />

X ∼ Nn(μ,σ) ⇔ ϕX(t) = exp i(t · μ) − 1/2 ·t · σ ·t t<br />

t ∈ R n .<br />

Dette gør det let at vise, at uafhængighed og ukorellerethed er det samme for simultant<br />

normal fordelte variable. For ved gentagen anvendelse af Kf 6, dvs. ækvivalensen mellem<br />

uafhængighed og faktorisering af den karakteristiske funktion, ses flg. resultat at holde. Detaljerne<br />

overlades til læseren.<br />

N 4 Hvis Z er en flerdimensional normalfordelt stokastisk vektor, er vilkårlige marginaler<br />

(Zn1 ,...Znk ) og (Zm1 ,...Zml ) uafhængige hvis og kun hvis<br />

Cov(Zni ,Zm j ) = 0 for alle i = 1,...,k og j = 1,...,l.<br />

Hvis X ∼ Nn(μ 1 ,σ 1 ) og Y ∼ Nm(μ 2 ,σ 2 ) er uafhængige, er (X,Y) ∼ Nn+m(μ,σ), hvor<br />

<br />

σ 0<br />

μ = (μ , μ ) og σ = 1<br />

1 2 0 σ .<br />

2<br />

Korollar X = (X1,...Xn) ∼ Nn(0,I n ) hvis og kun hvis X1,...Xn er uafhængige N(0,1)-fordelte<br />

stokastiske variable. ( I n betegner her n × n enhedsmatricen.)<br />

Ikke alle men dog de vigtigste flerdimensionale normalfordelinger er absolut kontinuerte.<br />

Mere præcist gælder.<br />

N 5 X ∼ Nn(μ,σ) er absolut kontinuert, hvis og kun hvis σ er invertibel, og i givet fald er en<br />

tæthed givet ved<br />

1<br />

x ↦→ <br />

(2π) n <br />

exp<br />

detσ<br />

− 1<br />

2 ∑ (xi − μi)σ<br />

1≤i, j≤n<br />

−1 <br />

(i, j)(x j − μ j) x ∈ R n .<br />

143


Bevis. Hvis σ ikke er invertibel, findes der et t ∈ R n \ {0}, så at<br />

Var(t · X) = t · σ ·t t = 0.<br />

Der findes derfor en konstant c ∈ R, så t · X = c P-n.o. D.v.s.<br />

P(X ∈ A(t,c)) = 1, hvor A(t,c) = {x ∈ R n |t · x = c},<br />

hvilket er uforeneligt med absolut kontinuitet, da ethvert ægte affint underrum i R n har<br />

Lebesgue mål 0.<br />

Hvis omvendt σ er invertibel, kan den ifølge vel kendt teori skrives på formen<br />

og ifølge N 2 gælder derfor<br />

σ = T · I n · T t<br />

for T : R n → R n lineær bijektion,<br />

X ∼ μ + T(U) hvor U ∼ Nn(0,I n ).<br />

Resten følger nu som tidligere vist af den lineære transformationssætning, for da koordinatvariablene<br />

U1,...,Un i U er uafhængige N(0,1)-variable, har U tæthed<br />

x ↦→ (2π) −n/2 exp(−x 2 /2) = (2π) −n/2 exp(− 1<br />

2<br />

n<br />

∑<br />

i=1<br />

x 2 i<br />

). ♦<br />

Lad mig slutte med uden bevis at nævne flg. resultat angående betingede fordelinger. (Se<br />

afsnittet om betingede middelværdier for ikke forklaret notation.) Vi betragter kun det to -<br />

dimensionale tilfælde, men der gælder et helt tilsvarende udsagn i højere dimensioner.<br />

N 6 Lad (X,Y) være to -dimensionalt normalt fordelt, så at Y ikke er konstant. Da gælder<br />

for alle y ∈ R, at under det betingede mål givet Y = y, er<br />

X ∼ N(μX + σX,Y/σ 2 Y ·(y − μY),σ 2 X − σ 2 X,Y/σ 2 Y),<br />

hvor μX, μY, σ 2 X og σ 2 Y er middelværdi og varians for X og Y , og σX,Y er kovariansen mellem<br />

dem.<br />

144


Maksimal Uligheder.<br />

Ottaviani’s Ulighed.<br />

Lad X1,...,Xn betegne uafhængige stokastiske variable. Sæt<br />

Da gælder for alle reelle tal x og y<br />

Mn = max<br />

1≤ j≤n |S j| hvor Sk = X1 + ···+Xk 1 ≤ k ≤ n.<br />

P(Mn > x+y) · min<br />

1≤ j≤n P(|Sn − S j| ≤ y) ≤ P(|Sn| > x),<br />

Bevis. Da uligheden er triviel, hvis enten x eller y er negativ, lader vi x,y ≥ 0 være givet. Sæt<br />

D1 = {|S1| > x+y} og D j = {|S j| > x+y, |S1| ≤ x+y,...,|S j−1| ≤ x+y} j ≥ 2.<br />

Da D j’erne er disjunkte og {Mn > x+y} = n j=1 D j, er<br />

P(Mn > x+y) =<br />

For ethvert j fås endvidere af trekantsuligheden at<br />

n<br />

∑ P(D j).<br />

j=1<br />

{|S j| > x+y} ⊆ {|Sn|+|Sn − S j| > x+y} ⊆ {|Sn| > x} ∪ {|Sn − S j| > y}.<br />

Heraf følger, da (X1,...,Xj) og dermed D j og |Sn − S j| er uafhængige, at<br />

P(Mn > x+y) ≤<br />

≤<br />

hvoraf resultatet følger, da<br />

Korollar 1 For alle p > 0 er<br />

n <br />

∑ P({|Sn| > x} ∩ D j)+P({|Sn − S j| > y} ∩ D j)<br />

j=1<br />

<br />

n <br />

∑ P({|Sn| > x} ∩ D j)+P(|Sn − S j| > y) · P(D j)<br />

j=1<br />

<br />

≤ P(|Sn| > x)+ max<br />

1≤ j≤n P(|Sn − S j| > y) · P(Mn > x+y),<br />

1 − max<br />

1≤ j≤n P(|Sn − S j| > y) = min<br />

1≤ j≤n P(|Sn − S j| ≤ y).<br />

E[M p n] ≤ 2 p+1 (1+2 p+1 ) · max<br />

1≤ j≤n E[|S j| p ].<br />

Bevis. Lad p > 0 være givet og antag uden tab af generalitet, at<br />

mn := max<br />

1≤ j≤n E[|S j| p ] < ∞.<br />

145


For τ := (2 p+1 · mn) 1/p gælder ifølge Markov’s Ulighed<br />

P(|Sn − S j| > τ) ≤ E[|Sn − S j| p ]/τ p ≤ 2 p−1 (E[|Sn| p ]+E[|S j| p )/τ p ≤ 2 p · mn/τ p = 1/2<br />

og dermed<br />

Dvs.<br />

min<br />

1≤ j≤n P(|Sn − S j| ≤ τ) ≥ 1 − 1/2 = 1/2.<br />

P(Mn > x) = P(Mn > (x − τ)+τ) ≤ 2 · P(|Sn| > x − τ) = 2 · P(|Sn|+τ > x)<br />

for alle x > 0 og ved integration derfor<br />

E[M p n ] ≤ 2 · E[(|Sn|+τ) p ] ≤ 2 p · E[|Sn| p + τ p ] ≤ 2 p+1 (1+2 p+1 ) · mn. ♦<br />

Hvis Xi’erne yderligere alle har middelværdi 0, og S j og Sn − S j for 1 ≤ j ≤ n derfor er<br />

uafhængige og centrerede variable, viser uligheden<br />

E[|Sn − S j| p ] ≤ E[|Sn − S j + S j| p ] = E[|Sn| p ] for 1 ≤ j ≤ n og p ≥ 1<br />

og et tilsvarende argument, at der gælder<br />

Korollar 2 Hvis E[Xi] = 0 for alle i ≥ 1 er<br />

E[M p n ] ≤ 3 · 2p · E[|Sn| p ] for p ≥ 1.<br />

Det er værd at bemærke, at konstanterne i Korollar 1 og 2 kun afhænger af p. De angivne<br />

værdier er på ingen måde optimale, dvs. mindst mulige.<br />

Ottaviani’s Ulighed gælder for alle sæt af uafhængige stokastiske variable, men er variablene<br />

yderligere symmetriske, dvs. X ∼ −X, gælder med samme notation flg. mere præcise resultat.<br />

Lévy’s Ulighed.<br />

Lad X1,...,Xn betegne uafhængige symmetriske stokastiske variable. Da er<br />

P(Mn > t) ≤ 2 · P(|Sn| > t) for alle t > 0,<br />

og dermed E[M p n] ≤ 2 · E[|Sn| p ] for alle p > 0.<br />

Bevis. Lad t > 0 være givet. Sæt igen<br />

D1 = {|S1| > t} og D j = {|S j| > x,|S1| ≤ t,...,|S j−1| ≤ t} j ≥ 2.<br />

Da D j’erne er disjunkte gælder som ovenfor<br />

P(Mn > t) =<br />

≤<br />

n<br />

∑ P(|S j| > t,Dj) =<br />

j=1<br />

n<br />

∑ P(|Sn + S<br />

j=1<br />

j n | > 2t,Dj)<br />

n<br />

n<br />

∑ P(|Sn| > t,Dj)+ ∑ P(|S<br />

j=1<br />

j=1<br />

j n | > t,Dj),<br />

146


hvor<br />

S j n := X1 + ···+Xj −(Xj+1 + ···+Xn).<br />

Men da Xi’erne er symmetriske og uafhængige, er<br />

og dermed specielt<br />

Indsættes dette ovenfor fås<br />

(X1,...,Xn) ∼ (X1,...,Xj,−Xj+1,...,−Xn) for alle j,<br />

P(|Sn| > t,Dj) = P(|S j n | > t,Dj) for alle j.<br />

P(Mn > t) ≤ 2<br />

n<br />

∑ P(|Sn| > t,Dj) ≤ 2 · P(|Sn| > t). ♦<br />

j=1<br />

147


De store tals love I.<br />

Betegnelsen De store tals love dækker over et utal af resultater angående den asymptotiske<br />

opførsel af empiriske gennemsnit, dvs. variable af formen<br />

1<br />

n<br />

n<br />

∑ Xi eller mere generelt<br />

i=1<br />

1<br />

n<br />

n<br />

∑<br />

i=1<br />

(Xi − μi),<br />

med henblik på konvergens P-n.o. eller i sandsynlighed for n → ∞. (Xn)n≥1 er her en følge<br />

af stokastiske variable og (μn)n≥1 en reel talfølge. Der findes tilsvarende resultater for<br />

stokastiske vektorer (X n)n≥1 og vektorer (μ n)n≥1. Hvis Xi’erne har endelig middelværdi,<br />

vælges μi normalt som middelværdien E[Xi], og der er i denne situation dermed tale om<br />

normerede centrerede partialsummer.<br />

Resultaterne opdeles i to kategorier, idet der skelnes mellem stærke og svage love. En stærk<br />

lov er her et udsagn, der sikrer konvergens P-n.o. i modsætning til en svag lov, som vedrører<br />

konvergens i sandsynlighed. Da konvergens n.o. som bekendt medfører konvergens<br />

i sandsynlighed, giver enhver stærk lov anledning til en tilsvarende svag lov. Det absolut<br />

vigtigste resultat indenfor emnet, hvis historie går helt tilbage til Bernouilli brødrene i<br />

begyndelsen af 1700 tallet, er flg. klassiske stærke lov ofte omtalt som en af sandsynlighedsteoriens<br />

tre perler.<br />

LLN 1 Kolmogorov’s Store tals lov.<br />

Hvis (Xn)n≥1 er en følge af uafhængige identisk fordelte stokastiske variable med endelig<br />

middelværdi μ, konvergerer<br />

1<br />

n<br />

n<br />

∑ Xi → μ P-n.o. og i L<br />

i=1<br />

1 (P).<br />

Da E[Xn] = μ for alle n ≥ 1 kan påstanden ækvivalent formuleres som<br />

1<br />

n<br />

n<br />

∑<br />

i=1<br />

(Xi − E[Xi]) → 0 P-n.o. og i L 1 (P).<br />

Resultatet spiller en meget vigtig rolle i sandsynlighedsteorien, da det dukker naturligt op i<br />

mange sammenhænge. Men det er også af en mere fundamental betydning for den moderne<br />

sandsynlighedsteori, dvs. Kolmogorov-modellen. For kunne et sådant resultat ikke vises,<br />

ville modellen simpelt hen være ubrugelig. Endvidere fremhæver det betydningen af det<br />

indførte middelværdibegreb, for som resultatet viser, konvergerer den empiriske middelværdi<br />

mod den teoretiske, hvis denne eksisterer, uanset hvilken fordeling der end er tale om.<br />

I bestræbelserne på at bevise sætningen er der udviklet mange særdeles værdifulde teknikker,<br />

som udover at tjene deres oprindelige formål har muliggjort mange udvidelser af resultatet.<br />

Vi skal i det følgende beskæftige os med en lille del af denne omfattende teori, men det er<br />

vigtigt hele tiden at have ovenstående hovedresultat i tankerne.<br />

148


Flg. spørgsmål fra den reelle analyse er tydeligvis af interesse :<br />

Hvornår er limn 1 n<br />

i=1<br />

n<br />

∑<br />

ai = 0 for en given reel talfølge (an)n≥1 ?,<br />

dvs. hvornår konvergerer an → 0 i Cecaro middel ? Som bekendt gælder det, hvis an → 0 i<br />

sædvanlig forstand, men yderligere to resultater er af interesse i denne forbindelse. ( Se Appendiks<br />

F for en nøjagtig formulering og et bevis.) Først og fremmest det såkaldte Kronecker<br />

Lemma, dvs. implikationen<br />

∞<br />

∑ an/bn konvergent i R ⇒ lim<br />

n<br />

n=1<br />

hvor 0 < bn < bn+1 ↑ ∞. Tilfældet bn ≡ n er specielt interessant.<br />

1<br />

bn<br />

n<br />

∑ ai = 0,<br />

i=1<br />

Desuden vises, at hvis an’erne enten er opad eller nedad begrænsede, så er<br />

lim n<br />

1<br />

n<br />

n<br />

∑<br />

i=1<br />

ai = 0 hvis lim n<br />

1<br />

[λ n [λ<br />

]<br />

n ]<br />

∑ ai = 0 for ethvert λ > 1.<br />

i=1<br />

Til senere brug bemærkes, at det her er nok, at konvergensen holder for ethvert af de tællelig<br />

mange λ’er af formen 1+k −1 for k ≥ 1.<br />

Med baggrund i dette åbner der sig derfor to mulige bevismetoder for ovenstående sætning.<br />

Enten kan den omformuleres til et spørgsmål om konvergens i R P-n.o. af den uendelige<br />

række<br />

∞<br />

eller også kan man først studere<br />

∑<br />

n=1<br />

1<br />

n<br />

(Xn − μ)/n,<br />

n<br />

∑<br />

i=1<br />

(Xi − μ)<br />

langs med hurtigt voksende delfølger af formen ([λ n ])n≥1 for λ > 1, og dernæst herudfra<br />

forhåbentligt deducere den ønskede konvergens for hele følgen.<br />

Tilfældet, hvor Xi’erne er uafhængige, er af speciel interesse. I denne forbindelse er det næste<br />

resultat, som viser, at n.o.-konvergens og konvergens i sandsynlighed er sammenfaldende for<br />

summer af uafhængige variable, meget vigtigt.<br />

LLN 2 n.o.-konvergens af summer af uafhængige variable.<br />

Lad (Zn)n≥1 betegne en følge af uafhængige variable. Da gælder<br />

∞<br />

∑ Zn er summabel P-n.o. ⇔<br />

n=1<br />

hvor ’summabel P-n.o.’ betyder at<br />

∞<br />

∑ Zn konvergent i sandsynlighed,<br />

n=1<br />

∞<br />

∑ Zn(ω) er konvergent i R for P-n.a. ω.<br />

n=1<br />

149


Korollar For uafhængige stokastiske variable (Zn)n≥1 gælder for alle p > 0<br />

∞<br />

∑ Zn konvergent i L<br />

n=1<br />

p (P) ⇒<br />

∞<br />

∑ Zn er summabel P-n.o.<br />

n=1<br />

Korollaret, der er interessant, fordi konvergens i L p ofte er simpelt at eftervise, er en umiddelbar<br />

konsekvens af sætningen, da konvergens i L p medfører konvergens i sandsynlighed.<br />

Herudfra deduceres uden problemer flg. stærke lov.<br />

LLN 3 De store tals lov (L2-udgave). Lad (Xn)n≥1 betegne en følge af uafhængige kvadratisk integrable stokastiske variable. Da<br />

gælder<br />

∞<br />

∑<br />

n=1<br />

Var(Xn)/n 2 < ∞ ⇒ 1<br />

n<br />

n<br />

∑<br />

i=1<br />

(Xi − E[Xi]) → 0 P-n.o. og i L 2 (P).<br />

Bevis. Uafhængigheden bevirker, at (Xn − E[Xn])n≥1 udgør en orthogonal følge i L 2 , og da<br />

fås af Pythagoras, mere præcist Lemma 14, at<br />

∞<br />

∑ Var(Xn)/n<br />

n=1<br />

2 < ∞ ⇒<br />

Xn − E[Xn] 2 2 = Var(Xn) for alle n ≥ 1<br />

∞<br />

∑<br />

n=1<br />

(Xn − E[Xn])/n konvergerer i L 2 (P).<br />

Konvergensen P-n.o. følger nu af ovenstående korollar samt Kroneckers Lemma, og da<br />

E[<br />

<br />

1<br />

n<br />

n<br />

∑<br />

i=1<br />

(Xi − μi)<br />

2<br />

] = 1<br />

n 2<br />

n<br />

∑<br />

i=1<br />

Var(Xi)<br />

følger konvergensen i L 2 ligeledes af Kronecker Lemmaet. ♦<br />

Bemærkning. Da beviset udnytter begrebet orthogonalitet, er det på ingen måde klart, at<br />

resultatet kan generaliseres til eksponenter α = 2. Men vi skal senere se, at det dog i et vist<br />

omfang er muligt.<br />

Bevis for LLN 2. Sæt for n ≥ 1 Sn = ∑ n i=1 Zi og lad S betegne grænsevariablen, dvs. Sn → S<br />

i sandsynlighed. Der findes derfor en delfølge (nk)k≥1, så at Snk → S n.o. for k → ∞. Definer<br />

for k ≥ 1<br />

Mk := max |Sl − Snk−1<br />

nk−1 0 og k ≥ 1<br />

P(Mk > 2ε) ·(1 − max P(|Snk<br />

nk−1 ε)) ≤ P(|Snk − Snk−1 | > ε).<br />

Da |Snk − Snk−1 | → 0 P-n.o. er<br />

#{k ≥ 1||Snk (ω) − Snk−1 (ω)| > ε } < ∞<br />

150


for P-n.a. ω, og da |Snk − Snk−1 |’erne er uafhængige, følger derfor af Det andet Borel - Cantelli<br />

Lemma at<br />

∞<br />

Heraf følger, at<br />

∞<br />

∑<br />

k=1<br />

∑ P(|Snk<br />

k=1<br />

− Snk−1 | > ε) < ∞.<br />

P(Mk > 2ε) < ∞ og dermed P(limsup {Mk > 2ε}) = 0,<br />

k<br />

for da Sn → S i sandsynlighed giver trekantsuligheden, at<br />

og dermed<br />

1 − max P(|Snk<br />

nk−1 ε) ≥ 1 − 2 · sup P(|S − Sl| > ε/2) →k→∞ 1<br />

l>nk−1<br />

P(Mk > 2ε) ≤ 2P(|Snk − Snk−1 | > ε) for k stor.<br />

Betragtes de tællelig mange ε på formen 1/n for n ≥ 1 viser, det første Borel - Cantelli<br />

Lemma derfor, at for P-n.a. ω er<br />

#{k |Mk(ω) ≥ 2/n} < ∞ for alle n ≥ 1,<br />

dvs. netop at Mk → 0 P-n.o. For n.a. ω gælder altså at<br />

Snk (ω) → S(ω) og Mk(ω) → 0 for k → ∞.<br />

Men heraf følger at liml Sl(ω) = S(ω), for med k(l) bestemt ved n k(l)−1 < l ≤ n k(l) gælder<br />

for alle l uligheden<br />

|Sl(ω) − S(ω)| ≤ |Sl(ω) − Sn k(l)−1 (ω)|+|Sn k(l)−1 (ω) − S(ω)|<br />

≤ M k(l)(ω)+|Sn k(l)−1 (ω) − S(ω)|<br />

og dermed konvergensen, da k(l) → ∞ for l → ∞. ♦<br />

Bevis for LLN 1. Lad (Xn)n≥1 betegne en følge af uafhængige identisk fordelte stokastiske<br />

variable med endelig middelværdi μ. Vi skal vise, at<br />

1<br />

n<br />

n<br />

∑ Xi → μ P-n.o.<br />

i=1<br />

Som netop vist, findes der et relevant resultat i det kvadratisk integrable tilfælde. Men da vi<br />

her kun forudsætter integrabilitet, får vi brug for den såkaldte trunkeringsteknik, som består<br />

i at skrive de enkelte variable som en sum af to i hht. flg. ide:<br />

Xn = X ′<br />

n + ˜Xn hvor X ′<br />

n := Xn · 1 [−an,an ](Xn) og ˜Xn := Xn − X ′<br />

n = Xn · 1 {|Xn|>an}<br />

for et passende valg af positive reelle tal an. Da Xn’erne er forudsat integrable er an = n et<br />

godt valg, idet der da gælder<br />

∞<br />

∑ P( ˜Xn = 0) =<br />

n=1<br />

∞<br />

∑ P(|Xn| > n) =<br />

n=1<br />

151<br />

∞<br />

∑ P(|X1| > n) < ∞.<br />

n=1


Ved brug af Det første Borel-Cantelli Lemma fås derfor at<br />

og dermed<br />

og da<br />

P(∃n ≥ 1 : ˜Xi = 0 i ≥ n) = 1<br />

1<br />

n<br />

n<br />

∑<br />

i=1<br />

n 1<br />

˜Xi<br />

n ∑ → 0 P-n.o.,<br />

i=1<br />

Xi = 1<br />

n<br />

n<br />

∑<br />

i=1<br />

X ′ 1<br />

i +<br />

n<br />

n<br />

∑ ˜Xi,<br />

i=1<br />

mangler vi kun at vise, at første led konvergerer P-n.o. mod μ. Hertil bemærkes, at<br />

Var(X ′<br />

n ) ≤ E[X ′ 2<br />

n ] = E[X 2 n · 1 [−n,n](Xn)] = E[X 2 1 · 1 [−n,n](X1)] = E[X 2 1 ,|X1| ≤ n]<br />

og at der findes en konstant C ∈ R+, så at<br />

∞<br />

∑ E[X<br />

n=1<br />

2 1,|X1| ≤ n]/n 2 = E[X 2 1 · ∑ 1/n<br />

n,n≥|X1|∨1<br />

2 ] ≤ C · E[|X1|] < ∞.<br />

Ifølge LLN 3 gælder derfor, at<br />

1<br />

n<br />

n<br />

∑<br />

i=1<br />

X ′ 1<br />

i −<br />

n<br />

n<br />

∑<br />

i=1<br />

E[X ′ 1<br />

i ] =<br />

n<br />

n<br />

∑<br />

i=1<br />

(X ′<br />

i<br />

hvoraf påstanden følger, da Lebesgue’s Sætning viser, at<br />

og dermed også 1<br />

n<br />

n<br />

∑<br />

i=1<br />

′<br />

− E[X i ]) → 0 P-n.o.,<br />

E[X ′<br />

n ] = E[X1 · 1 [−n,n](X1)] →n→∞ μ<br />

E[X ′<br />

i] →n→∞ μ.<br />

L 1 -konvergensen følger ved at kombinere konvergensen P-n.o. med Sætning 5, da<br />

{Xn |n ≥ 1} og dermed { 1 n<br />

n ∑ Xi |n ≥ 1}<br />

i=1<br />

er uniformt integrable. ♦<br />

Trunkeringsteknikken kan på lignende vis bruges til at vise flg. generalisation af Komogorov’s<br />

Store tals lov. Bemærk at den ændrede integrabilitetsantagelse afspejler sig i valget af<br />

trunkeringskonstant.<br />

152


LLN 4 Marcinkiewicz-Zygmond’s Store tals lov.<br />

Lad 1 ≤ q < 2 være givet og lad (Yn)n≥1 betegne en følge af uafhængige identisk fordelte<br />

variable med endelig q’te moment. Idet μ betegner den fælles middelværdi, gælder da<br />

1<br />

n 1/q<br />

n<br />

∑<br />

i=1<br />

(Yi − μ) → 0 P-n.o. og i L q .<br />

Bevis. Da q = 1 allerede er klaret, betragter vi et 1 < q < 2, og ved at se på Yn − μ i stedet<br />

for Yn, kan vi antage, at den fælles middelværdi er lig 0. Skriv<br />

hvor<br />

Ifølge Kronecker Lemma vil<br />

n<br />

−1/q<br />

n ∑<br />

j=1<br />

Yj = Y ′<br />

j +Y ” j = (Y ′<br />

j − E[Y ′<br />

j])+Y ” j + E[Y ′<br />

j]<br />

Y ′<br />

j = Yj · 1 {|Yj|< j 1/q } og Y ” j = Yj · 1 {|Yj|≥i 1/q } .<br />

Yj → 0 P-n.o. hvis<br />

∞<br />

∑<br />

j=1<br />

Yj/ j 1/q er P-summabel.<br />

Det er derfor nok at vise, at flg. tre rækker hver for sig konvergerer P-n.o.<br />

∞<br />

∑ (Y<br />

j=1<br />

′<br />

j − E[Y ′<br />

j]) · j −1/q ,<br />

∞<br />

∑ Y<br />

j=1<br />

” j · j −1/q og<br />

∞<br />

∑ E[Y<br />

j=1<br />

′<br />

j] · j −1/q .<br />

Leddene i den første sum er uafhængige, centrerede og har endelig varians. Ifølge korollaret<br />

til LLN 2 og Pythagoras er rækken derfor P-summabel, hvis summen af varianserne er<br />

endelig, dvs. hvis<br />

∞<br />

∑ E[(Y<br />

j=1<br />

′ ′<br />

j − E[Y j ])2 ] · j −2/q ∞<br />

≤ ∑ E[Y<br />

j=1<br />

′ 2<br />

j ] · j −2/q < ∞.<br />

Men dette gælder, da der findes en konstant rq > 0 kun afhængig af q, så at<br />

og dermed<br />

∑ j<br />

j: j>x<br />

−2/q ≤ rq x −(2/q−1)<br />

for alle x > 0<br />

∞<br />

∑ E[Y<br />

j=1<br />

′ 2<br />

j ] · j −2/q = E[Y 2 1 ∑<br />

j: j>|Y1| q<br />

j −2/q ] ≤ rq E[Y 2 1 · |Y1| −q(2/q−1) ] = rq E[|Y1| q ].<br />

Konvergensen af række nr. to følger som ovenfor af Borel-Cantelli Lemmaet, for da E[|Y1| q ]<br />

er endelig, er<br />

∞<br />

∑ P(Y<br />

j=1<br />

′′<br />

j = 0) =<br />

∞<br />

∑ P(|Yj| ≥ j<br />

j=1<br />

1/q ) =<br />

153<br />

∞<br />

∑ P(|Y1|<br />

j=1<br />

q ≥ j) < ∞.


Hvad angår den sidste række bemærkes først, at da Yj’erne har middelværdi 0 er<br />

dvs. vi skal vise, at<br />

E[Y ′<br />

j ] = −E[Y ” j ] = −E[Yj · 1 {|Yj|≥ j 1/q } ] = −E[Yj · 1 {|Yj| q ≥ j}],<br />

∞<br />

∑ E[|Y1| · 1 {|Y1|<br />

j=1<br />

q≥ j}] · j −1/q < ∞.<br />

Men dette følger af, at der findes endnu en konstant ˜rq kun afhængig af q, så at<br />

og dermed<br />

∑ j<br />

1≤ j≤x<br />

−1/q ≤ ˜rq x −(1/q−1)<br />

for alle x > 0<br />

∞<br />

∑ E[|Y1| · 1 {|Y1|<br />

j=1<br />

q≥ j}] · j −1/q = E[|Y1| · ∑<br />

1≤ j≤|Y1| q<br />

j −1/q ] ≤ ˜rq E[|Y1| · |Y1| −q(1/q−1) ].<br />

Dvs. den betragtede sum er mindre end ˜rq · E[|Y1| q ] og derfor endelig. n.o.-konvergensen er<br />

hermed vist. Beviset for konvergensen i L q udsættes til senere. ♦<br />

I beviset for ovenstående L 2 -udgave af de store tals lov gjorde vi brug af implikationen<br />

uafhængighed ⇒ ukorrellerethed dvs. orthogonalitet<br />

I det næste resultat tages i stedet udgangspunkt i ukorrellerethed.<br />

LLN 5 De store tals lov (L2-udgave, supplement).<br />

Lad (Xn)n≥1 betegne en følge af ukorrellerede kvadratisk integrable stokastiske variable så<br />

at<br />

∞<br />

∑ Var(Xn)/n<br />

n=1<br />

2 < ∞<br />

Sæt for n ≥ 1 ˆXn = 1 n<br />

n<br />

∑<br />

i=1<br />

(Xi − E[Xi]). Da gælder<br />

1) ˆXn → 0 i sandsynlighed og L 2 (P).<br />

2) ˆX [λ n ] → 0 P-n.o. for λ > 1.<br />

3) ˆXn → 0 P-n.o. hvis sup n (Xn(ω) − E[Xn]) < ∞ eller infn(Xn(ω) − E[Xn]) > −∞<br />

for P-n.a. ω.<br />

Betingelsen i 3) er specielt opfyldt, hvis Xn’erne er ikke negative og sup n E[Xn] < ∞.<br />

Bevis. For nemheds skyld skrives μn i stedet for E[Xn]. Da (Xn − μn)n≥1 pr. antagelse er<br />

parvis orthogonale i L 2 (P) fås for ethvert n ≥ 1 af Pythagoras, at<br />

E[ ˆX 2 1<br />

n ] =<br />

n2 n<br />

∑ E[(Xj − μ j)<br />

j=1<br />

2 ] = 1<br />

n2 154<br />

n<br />

∑<br />

j=1<br />

Var(Xj) →n→∞ 0,


hvor konvergensen følger af antagelsen og Kronecker Lemmaet. Dvs. ˆXn → 0 i L 2 (P) og<br />

dermed også i sandsynlighed.<br />

For ethvert λ > 1 har vi tilsvarende, da [λ n ] ≤ λ n ≤ 2[λ n ], at<br />

=<br />

<br />

∞<br />

∑<br />

j=1<br />

∞<br />

∑ E[ ˆX<br />

n=1<br />

2<br />

[λ n ∞ 1<br />

] ] = ∑<br />

n=1 [λ n ] 2<br />

[λ n ]<br />

∑<br />

j=1<br />

Var(Xj)<br />

∞<br />

∑<br />

n:[λ n ]≥ j<br />

1<br />

[λ n ] 2<br />

<br />

≤ C λ<br />

Var(Xj)<br />

∞<br />

∑<br />

j=1<br />

Var(Xj)/ j 2 < ∞,<br />

hvor C λ er en konstant kun afhængig af λ. Dvs. for ethvert λ > 1 er<br />

E[<br />

∞<br />

∑<br />

n=1<br />

ˆX 2<br />

[λ n ] ] < ∞ og dermed<br />

∞<br />

∑ ˆX<br />

n=1<br />

2<br />

[λ n ] < ∞ P-n.o.,<br />

hvoraf 2) let følger, da leddene i en konvergent række går mod 0.<br />

Ifølge 2) er<br />

hvor<br />

P( ˆX νk(n) → 0 for alle k ≥ 1) = 1,<br />

νk(n) = [(1+k −1 ) n ] for alle n,k ≥ 1.<br />

Kombineres dette med antagelserne gælder derfor for P-n.a. ω, at<br />

samt<br />

lim n<br />

ˆX νk(n)(ω) = 0 for alle k ≥ 1<br />

−∞ < inf(Xj(ω)<br />

− μ j) eller sup(Xj(ω)<br />

− μ j) < ∞,<br />

j<br />

og derfor som tidligere nævnt, se , at limn ˆXn = 0 P-n.o. ♦<br />

Ved at udnytte LLN 5 punkt 3) kan man, se Hoffmann sektionerne 4.11 og 4.12, vise, at Kolmogorov’s<br />

store tals lov stadig gælder, selvom uafhængighed erstattes med parvis uafhængighed.<br />

Men da denne generalisation yderst sjældent er interessant, vil vi lade den ligge.<br />

Lad mig til slut uden bevis nævne flg. supplement til LLN 5. Notationen er som ovenfor.<br />

Rademacher - Mensov’s Store tals lov.<br />

Lad (Xn)n≥1 betegne en følge af ukorrellerede kvadratisk integrable stokastiske variable. Da<br />

gælder<br />

dvs. specielt<br />

∞<br />

∑ log<br />

n=1<br />

2 n ·Var(Xn) < ∞ ⇒<br />

∞<br />

∑<br />

n=1<br />

j<br />

(Xn − E[Xn]) summabel P-n.o.<br />

∞ log<br />

∑<br />

n=1<br />

2 n<br />

n2 ·Var(Xn) < ∞ ⇒ ˆXn → 0 P-n.o.<br />

155


De store tals love II.<br />

Som allerede nævnt adskiller eksponenten 2 sig fra andre eksponenter. Men som vi nu<br />

skal se, kan man i det uafhængige tilfælde ved hjælp af den såkaldte symmetriseringsteknik<br />

alligevel vise lignende resultater for alle eksponenter α > 0.<br />

En væsentlig brik i teorien er flg. resultat normalt kaldet Khinchine’s Ulighed:<br />

LLN 6 Khinchine’s Ulighed.<br />

Lad (εi)i≥1 betegne en følge af uafhængige Bernoulli variable, dvs.<br />

P(εi = −1) = P(εi = 1) = 1/2 for alle i ≥ 1<br />

Da findes der for α > 0 positive konstanter cα og Cα kun afhængig af α, så at<br />

cα ·(<br />

n<br />

∑ b<br />

j=1<br />

2 j )α/2 ≤ E[|<br />

for alle n ≥ 1 og alle reelle talfølger (b j) j≥1.<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

α ] ≤ Cα ·(<br />

n<br />

∑ b<br />

j=1<br />

2 j )α/2<br />

Bevis del I. Ifølge Jensen’s ulighed er α ↦→ E[|∑ n j=1 b j · ε j| α ] 1/α voksende for ethvert n ≥ 1<br />

og alle reelle talfølger (bn)n≥1, og da<br />

ses, at<br />

og<br />

E[|<br />

(<br />

E[|<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

α ] ≤ E[|<br />

n<br />

∑ b<br />

j=1<br />

2 j )α/2 = E[|<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

2 2 n<br />

] = E[ ∑ b j · ε j ] =<br />

j=1<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

2 ] α/2 = (<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

2 ] α/2 ≤ E[|<br />

n<br />

∑ b<br />

j=1<br />

2 j<br />

n<br />

∑ b<br />

j=1<br />

2 j ) α/2<br />

for α ≤ 2<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

α ] for α ≥ 2.<br />

1 kan altså bruges som Cα for 0 < α ≤ 2 og som cα for α ≥ 2, og følgen (b j) j≥1 =<br />

(1,0,...,0,...) viser, at begge konstanter er optimale. ♦<br />

De resterende tilfælde er tæt forbundne, for er Cα bestemt for α > 2, gælder ifølge Cauchy-<br />

Schwarz’s Ulighed for 0 < α < 2, at<br />

E[|<br />

n<br />

∑ b<br />

j=1<br />

2 j = E[|<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

4−α ] 1/2 · E[|<br />

som efter forkortning viser, at<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

2 ] = E[|<br />

(<br />

n<br />

∑<br />

j=1<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

2−α/2 · |<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

α ] 1/2 ≤ C 1/2<br />

4−α ·(<br />

b 2 j )α/4 ≤ C −1/2<br />

4−α · E[|<br />

156<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

α/2 ] ≤<br />

n<br />

∑ b<br />

j=1<br />

2 j )1−α/4 · E[|<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

α ] 1/2 .<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

α ] 1/2 ,


D.v.s.C −1<br />

4−α kan bruges som cα i intervallet 0 < α < 2. Bestemmelsen af Cα for α > 2 er<br />

mere kompliceret, specielt er bestemmelsen af den optimale værdi, dvs. den mindst mulige,<br />

yderst vanskeligt. Hoffmann viser i sektion 4.30, at Cα = 2 α/2 · α · Γ(α/2) kan bruges.<br />

Denne konstant er ikke optimal ligesom den, vi nu vil bestemme ved brug af teorien om<br />

betingede middelværdier.<br />

Bevis del II. Lad α > 2 og n ≥ 1 være givet og lad U1,...,Un betegne uafhængige N(0,1)fordelte<br />

stokastiske variable. Definer<br />

n<br />

Bi := σ({Ui > 0}) i = 1,...,n og B := σ( Bi).<br />

i=1<br />

Ifølge regneregler for betingede middelværdier gælder for ethvert i, da Ui’erne er symmetriske<br />

og P(Ui > 0) derfor lig 1/2 for alle i, at<br />

hvor<br />

D.v.s.<br />

E[Ui |B] = E[Ui |Bi] = ρ ·(1 {Ui>0} − 1 {Ui≤0}) P-n.o.,<br />

ρ = 2 · E[Ui |Ui > 0] = −2 · E[Ui |Ui ≤ 0] = 2/π.<br />

E[U1 |B]/ρ,...,E[Un |B]/ρ er uafhængige Bernoulli variable,<br />

og for ethvert valg af konstanter b1,...,bn gælder derfor<br />

D.v.s.<br />

ρ α · E[|<br />

≤ E[|<br />

n<br />

∑ b j · ε j|<br />

j=1<br />

α ] = E[|<br />

n<br />

∑ b j · Xj|<br />

j=1<br />

α ] = E[|N(0,<br />

n<br />

∑ b j · E[Uj |B]|<br />

j=1<br />

α ] = E[|E[<br />

n<br />

∑ b<br />

j=1<br />

2 j )|α ] = (<br />

n<br />

∑ b j ·Uj |B]|<br />

j=1<br />

α ]<br />

n<br />

∑ b<br />

j=1<br />

2 j )α/2 · E[|N(0,1)| α ].<br />

Cα := ρ −α · E[|N(0,1)| α ] = π (α−1)/2 · Γ((α + 1)/2)<br />

er en mulig konstant. ♦<br />

Flg. to korollarer er nu umiddelbare konsekvenser af Khinchine’s Ulighed.<br />

Korollar 1 Lad Z1,...,Zn betegne uafhængige symmetriske stokastiske variable. Da gælder<br />

for ethvert α > 0<br />

E[|<br />

n<br />

∑ Zk|<br />

k=1<br />

α n<br />

] ≤ Cα · E[( ∑ |Zk|<br />

k=1<br />

2 ) α/2 n<br />

β(α)<br />

] ≤ Cα · n ∑ E[|Zk|<br />

k=1<br />

α ],<br />

hvor Cα er konstanten fra Khinchine’s ulighed, og β(α) = (α/2 − 1) + , dvs. β(α) = 0 for<br />

0 < α ≤ 2 og β(α) = α/2 − 1 for α > 2.<br />

Bevis. Lad α > 0 være givet og lad ε1,...,εn betegne uafhængige Bernoulli variable, så at<br />

157


(Z1,...,Zn) og (ε1,...,εn) er uafhængige. εiZi’erne er da uafhængige, og da Zi ∼ εiZi, da Zi<br />

er symmetrisk, er<br />

(Z1,...,Zn) ∼ (ε1Z1,...,εnZn).<br />

Sættes<br />

Hα(a1,...,an) = E[|<br />

n<br />

∑<br />

k=1<br />

εk ak| α ] for a1,...,an ∈ R<br />

følger ved brug af Fubini’s Sætning, nærmere bestemt Ua 5, at<br />

E[|<br />

n<br />

∑<br />

k=1<br />

Zk| α ] = E[|<br />

n<br />

∑<br />

k=1<br />

εkZk| α ] = E[Hα(Z1,...,Zn)].<br />

Men ifølge Khinchine’s Ulighed er Hα(a1,...,an) ≤ Cα ·(<br />

E[|<br />

n<br />

∑ Zk|<br />

k=1<br />

α n<br />

] ≤ Cα · E[( ∑ |Zk|<br />

k=1<br />

2 ) α/2 ].<br />

n<br />

∑ a<br />

k=1<br />

2 k )α/2 og derfor<br />

Den sidste ulighed følger nu ved for 0 < α ≤ 2 at udnytte, at x ↦→ x α/2 er subadditiv og<br />

voksende på R+, og for α > 2 at benytte flg. konsekvens af Jensen’s Ulighed<br />

(<br />

n<br />

∑<br />

k=1<br />

|xk|) α n<br />

α−1<br />

≤ n ∑ |xk|<br />

k=1<br />

α<br />

x1,...,xn ∈ R. ♦<br />

Bemærkning. Nærlæses Korollar 1 ses, at antagelsen om Zi’erne kan svækkes til, at de 2 n<br />

stokastiske vektorer (±Z1,...,±Zn) har samme fordeling dvs.<br />

Man udtrykker ofte dette ved at sige, at<br />

(Z1,...,Zn) ∼ (±Z1,...,±Zn).<br />

Z = (Z1,...,Zn) er symmetrisk i R n .<br />

Ved brug af Korollar 2 til Ua 5 kan vi nu udvide ovenstående ulighed til generelle uafhængige<br />

variable. Konstanterne Cα og β(α) er de samme som i Korollar 1.<br />

Korollar 2 Lad Z1,...,Zn betegne uafhængige stokastiske variable med endelig middelværdi<br />

μk for k = 1,...,n. Da gælder for ethvert α > 0<br />

E[|<br />

n<br />

∑<br />

k=1<br />

∑<br />

k=1<br />

(Zk − μk)| α ] ≤ 2 α n<br />

β(α)<br />

·Cα · n<br />

E[|Zk − μk| α ].<br />

Bevis. Da uligheden er triviel for α ≤ 1, idet x ↦→ x α er voksende og subadditiv på R+,<br />

betragtes et α > 1. Lad Y1,...,Yn være en uafhængig kopi af Z1,...,Zn, dvs.<br />

(Y1,...,Yn) og (Z1,...,Zn) er uafhængige og identisk fordelte.<br />

158


Da Z1 −Y1,...,Zn −Yn derfor er uafhængige og symmetriske, fås af Korollar 1<br />

E[|<br />

n<br />

∑<br />

k=1<br />

Men da Zk ∼ Yk for alle k ≥ 1 og dermed<br />

(Zk −Yk)| α n<br />

β(α)<br />

] ≤ Cα · n ∑<br />

k=1<br />

E[|Zk −Yk| α ].<br />

E[|Zk −Yk| α ] ≤ 2 α−1 ·(E[|Zk − μk| α ]+E[|Yk − μk| α ]) = 2 α · E[|Zk − μk| α ],<br />

følger påstanden af det ovenfor nævnte korollar til Ua 5, idet<br />

E[|<br />

n<br />

∑<br />

k=1<br />

(Zk −Yk)| α ] = E[|<br />

n<br />

∑<br />

k=1<br />

(Zk − μk) −<br />

n<br />

∑<br />

k=1<br />

(Yk − μk)| α ] ≥ E[|<br />

n<br />

∑<br />

k=1<br />

(Zk − μk)| α ],<br />

n<br />

da α > 1 og ∑ (Yk − μk) har middelværdi 0. ♦<br />

k=1<br />

For at kunne udvide de store tals lov til et generelt α > 0 udledes først flg. Lα-konvergens resultat for summer af uafhængige stokastiske variable. Da resultatet er en simpel konsekvens<br />

af Korollar 2, formuleres det som endnu et korollar. Cα og β(α) er som ovenfor.<br />

Korollar 3 Lad (Xn)n≥1 betegne uafhængige stokastiske variable med endelig middelværdi<br />

μn for n ≥ 1. Da gælder for ethvert 0 < α ≤ 2, at<br />

og for alle α > 0, at<br />

∞<br />

∑ E[|Xn − μn|<br />

n=1<br />

α ] < ∞ ⇒<br />

∞<br />

∑<br />

n=1<br />

(Xn − μn) eksisterer i L α ,<br />

∞<br />

∑ E[|Xn − μn|<br />

n=1<br />

α ]/n α−β(α) < ∞ ⇒ 1 n<br />

n ∑ (Xk − μk) → 0 i L<br />

k=1<br />

α .<br />

Bevis. Hvad angår det første resultat, er det nok at vise, at afsnitsfølgen er en Cauchy følge<br />

i L α . Men dette følger af antagelsen og Korollar 2, idet denne viser, at for 0 < α ≤ 2 er<br />

E[|<br />

m<br />

∑<br />

k=n<br />

(Xk − μk)| α ] ≤ 2 α Cα<br />

m<br />

∑<br />

k=n<br />

E[|Xk − μk| α ]<br />

for alle 1 ≤ n ≤ m. Ifølge Korollar 2 gælder endvidere for alle n ≥ 1, at<br />

E[| 1<br />

n<br />

n<br />

∑(Xk<br />

− μk)|<br />

k=1<br />

α ] ≤ 2α Cα<br />

n α · n<br />

∑<br />

k=1<br />

β(α) n<br />

E[|Xk − μk| α ] = 2α Cα<br />

n α−β(α)<br />

n<br />

∑ E[|Xk − μk|<br />

k=1<br />

α ],<br />

hvoraf det andet resultat umiddelbart fås ved brug af Kronecker’s lemma. ♦<br />

Vi kan nu formulere og bevise en generel L α -version af de store tals lov. For α < 2 er der<br />

tale om en direkte oversættelse af L 2 -udgaven, hvorimod momentbetingelsen er en anden<br />

for α > 2.<br />

159


LLN 7 De store tals lov (L α -udgave).<br />

Lad (Xn)n≥1 betegne en følge af uafhængige stokastiske variable med endelig middelværdi<br />

μn for n ≥ 1. Da gælder for α ≤ 2<br />

og for α > 2<br />

∞<br />

∑<br />

n=1<br />

∞<br />

∑ E[|Xn − μn|<br />

n=1<br />

α ]/n α < ∞ ⇒ 1<br />

n<br />

n<br />

∑<br />

i=1<br />

E[|Xn − μn| α ]/n (1+α/2) < ∞ ⇒ 1<br />

n<br />

Bevis. Lad α ≤ 2 være givet. Ifølge Korollar 3 punkt 1 har vi<br />

∞<br />

∑ E[|Xn − μn|<br />

n=1<br />

α ]/n α < ∞ ⇒<br />

∞<br />

∑<br />

n=1<br />

(Xi − μi) → 0 P-n.o. og i L α (P).<br />

n<br />

∑<br />

i=1<br />

(Xi − μi) → 0 P-n.o. og i L α (P).<br />

(Xn − μn)/n konvergent i L α .<br />

Rækken konvergerer derfor også P-n.o. ifølge korollaret LLN 2, og Kronecker Lemmaet<br />

giver derfor umiddelbart, at<br />

ˆXn := 1<br />

n<br />

n<br />

∑<br />

k=1<br />

(Xk − μk) → 0 P-n.o.<br />

Anden del i Korollar 3 sikrer, at ˆXn → 0 i L α , og tilfældet α ≤ 2 er dermed klaret.<br />

Betragt dernæst et α > 2. L α -konvergensen af ( ˆXn)n≥1 følger igen af Korollar 3. Hvad angår<br />

konvergensen P-n.o. udnyttes som i beviset for LLN 2, at det er nok at vise, at ˆX2 n → 0 og<br />

Mn → 0 P-n.o., hvor<br />

Mn := max<br />

2n


Men ifølge Korollaret til Ottaviani’s Ulighed er dette tilfældet, hvis<br />

∞<br />

∑<br />

n=1<br />

og dermed ifølge Korollar 2 hvis<br />

1<br />

· E[|<br />

2nα ∞ 2<br />

∑<br />

n=1<br />

n(α/2−1)<br />

2nα Men dette er netop antagelsen, da<br />

∞<br />

∑<br />

n=1<br />

1<br />

2 n(α/2+1)<br />

2n+1 ∑<br />

j=2n (Xj − μ j)|<br />

+1<br />

α ] < ∞,<br />

2n+1 ∑<br />

j=2n E[|Xj − μ j|<br />

+1<br />

α ] < ∞.<br />

2n+1 ∑<br />

j=2n E[|Xj − μ j|<br />

+1<br />

α ∞<br />

1+α/2<br />

] ≤ 2 ∑ E[|Xj − μ j|<br />

j=1<br />

α ]/ j 1+α/2 < ∞. ♦<br />

Symmetrisering sikrer også den postulerede men ikke viste L q -konvergens i Marcinkiewicz-<br />

Zygmond’s Store tals lov.<br />

Thi lad for 1 < q < 2 situationen være som i LLN 4. Først reduceres til det symmetriske<br />

tilfælde. For hvis ( ˜Yj) j≥1 er en uafhængig kopi af (Yj) j≥1, dvs.<br />

(Yj) j≥1 og ( ˜Yj) j≥1 uafhængige og (Yj) j≥1 ∼ ( ˜Yj) j≥1<br />

og dermed Yj ∼ ˜Yj j ≥ 1 og ˜Yj’erne uafhængige, fås af korollaret til Ua 5, at<br />

da q > 1 og<br />

E[| 1<br />

n 1/q<br />

n<br />

∑<br />

j=1<br />

Yj| q ] ≤ E[| 1<br />

n 1/q<br />

n<br />

∑ Yj −<br />

j=1<br />

1<br />

n1/q E[ 1<br />

n 1/q<br />

n<br />

∑ ˜Yj|<br />

j=1<br />

q ] = E[| 1<br />

n1/q n<br />

∑ ˜Y ] = 0.<br />

j=1<br />

n<br />

∑<br />

j=1<br />

(Yj − ˜Yj)| q ],<br />

Da (Yj − ˜Yj) j≥1’erne er uafhængige, symmetriske og identisk fordelte, er det derfor, hvad<br />

konvergens i q-middel angår, nok at betragte det symmetriske tilfælde. Vi vil derfor i det<br />

videre forløb yderligere antage, at Yi’erne er symmetriske.<br />

Betragt for et givet k ≥ 1 opsplitningen<br />

Yi = Y ′ ′′<br />

k,i +Y k,i<br />

hvor Y ′<br />

k,i := Yi · 1 {|Yi|≤k} og Y ′′<br />

k,i := Yi · 1 {|Yi|>k}.<br />

De to følger (Y ′<br />

k,i )i≥1 og (Y ′′<br />

k,i )i≥1 består begge af uafhængige, symmetriske og identisk<br />

fordelte stokastiske variable. Ifølge Korollar 2 ovenfor findes der derfor en konstant C kun<br />

afhængig af q, så at<br />

E[| 1<br />

n 1/q<br />

n<br />

∑<br />

j=1<br />

Y ′′<br />

k, j |q ] ≤ C · E[|Y ′′<br />

k,1 |q ] = C · E[|Y1| q , |Y1| > k],<br />

161


og<br />

supE[|<br />

n<br />

1<br />

n1/q n<br />

∑<br />

j=1<br />

Y ′′<br />

k, j |q ]<br />

kan dermed gøres så lille som ønsket ved at vælge k stor nok. L q -konvergensen vil derfor<br />

være vist, hvis vi for givet k kan vise, at<br />

lim n E[| 1<br />

n 1/q<br />

n<br />

∑<br />

j=1<br />

Y ′<br />

k, j |q ] = lim n E[| 1<br />

n 1/q<br />

n<br />

∑ Yj · 1 {|Yj|≤k}|<br />

j=1<br />

q ] = 0.<br />

Men da q < 2 er det nok at vise konvergens i L 2 , hvilket følger af Pythagoras, for da summanderne<br />

for ethvert k ≥ 1 er uafhængige centrede kvadratisk integrable variable, gælder<br />

E[| 1<br />

n 1/q<br />

n<br />

∑ Yj · 1 {|Yj|


Fordelingskonvergens.<br />

Lad i det følgende (S,d) betegne et separabelt metrisk rum. Læseren anbefales her at tænke<br />

på R n n ≥ 1 eller mere generelt delmængder heraf udstyret med den euklidiske metrik. Lad<br />

endvidere (Xn)n≥1 og X betegne stokastiske funktioner med værdier i S, dvs.(F,B(S))målelige<br />

funktioner fra Ω ind i S, hvor (Ω,F,P) er et sandsynlighedsfelt, hvorpå alle omtalte<br />

variable tænkes defineret. I analogi med det reelle tilfælde indføres flg. konvergensbegreb.<br />

Definition. Xn → X i sandsynlighed hvis limn P(d(Xn,X) > ε) = 0 for ε > 0.<br />

Bemærkning. Separabiliteten af S sikrer at B(S × S) = B(S) ⊗B(S), og da (x,y) ↦→ d(x,y)<br />

er kontinuiert, er d(Xn,X) dermed en reel stokastisk variabel for ethvert n ≥ 1. Mængderne<br />

{d(Xn,X) > ε} er derfor hændelser og kan som sådan tilordnes en sandsynlighed.<br />

Hvis S = R er betingelsen for konvergens i sandsynlighed den vel kendte<br />

lim n P(|Xn − X| > ε) = 0 for alle ε > 0,<br />

hvilket, som vist i Lemma 12, er ækvivalent med at limn E[|Xn − X| ∧ 1] = 0. Denne ækvivalens<br />

generaliserer uden ændringer til det almene tilfælde, idet<br />

Xn → X i sandsynlighed ⇔ d(Xn,X) → 0 i sandsynlighed ⇔ lim n E[d(Xn,X) ∧ 1] = 0.<br />

Ved brug heraf fås som i det reelle tilfælde.<br />

Fk 1 Xn → X i sandsynlighed ⇒ Xnk → X P-n.o. for en delfølge (nk)k≥1.<br />

Bevis. Da d(Xn,X) → 0 i sandsynlighed i R findes der ifølge Proposition 6 en delfølge<br />

(nk)k≥1, så at d(Xnk ,X) ∧ 1 → 0 P-n.o., men dette siger netop, at Xnk → X P-n.o. ♦<br />

En anden vigtig konsekvens er følgende.<br />

Fk 2 Lad (T,δ) betegne endnu et separabelt metrisk rum og lad f : S → T være en kontinuert<br />

funktion. Da gælder<br />

Xn → X i sandsynlighed ⇒ f(Xn) → f(X) i sandsynlighed<br />

Bevis. Vi skal vise limn E[δ( f(Xn), f(X)) ∧ 1] = 0. Antag at det ikke gælder, dvs. antag<br />

Men dette fører til en modstrid, da<br />

∃r > 0 ∃(nk)k≥1 : E[δ( f(Xnk ), f(X)) ∧ 1] > r for alle k.<br />

Xnk → X i s.s. ⇒ ∃(kl)l≥1 Xnk l → X P-n.o. ⇒ f(Xnk l ) → f(X) P-n.o.<br />

⇒ δ( f(Xnk l ), f(X))) ∧ 1 → 0 P-n.o. ⇒ E[δ( f(Xnk l ), f(X))) ∧ 1] → 0. ♦<br />

Kontinuiteten udnyttes i implikation nummer to, og da det her er nok, at f er kontinuert i<br />

X(ω) for n.a. ω, behøver f blot at være kontinuert PX-n.o. Vi har derfor flg. skærpelse.<br />

Fk 2a Lad (T,δ) betegne endnu et separabelt metrisk rum og lad f : S → T være en Borel<br />

funktion, som er kontinuert PX-n.o. Da gælder<br />

Xn → X i sandsynlighed ⇒ f(Xn) → f(X) i sandsynlighed<br />

163


Specialtilfældet T = S og δ en metrik, der er ækvivalent med d, viser, idet den identiske<br />

afbildning er kontinuert både som afbildning<br />

(S,d) → (S,δ) og (S,δ) → (S,d),<br />

at konvergens i sandsynlighed ikke afhænger af den eksplicit valgte metrik, blot vi holder os<br />

indenfor klassen af ækvivalente metrikker. Dette udnyttes f.eks. i følgende bevis.<br />

Fk 3 Idet S × S udstyres med en produktmetrik gælder<br />

Xn → X og Yn → Y i sandsynlighed ⇔ (Xn,Yn) → (X,Y) i sandsynlighed.<br />

Bevis. ⇐ følger af Fk 2, da projektionsafbildningerne er kontinuerte, og ⇒ fås, da<br />

d1((x1,y1),(x2,y2)) := d(x1,y1)+d(x2,y2)<br />

er en produktmetrik, umiddelbart af uligheden<br />

˜<br />

d((Xn,Y1),(X,Y)) ∧ 1 ≤ d(Xn,X) ∧ 1+d(Yn,Y) ∧ 1. ♦<br />

Sætning 5 og Fk 2 viser tilsammen, at der for alle f ∈ bC(S) gælder<br />

Xn → X i sandsynlighed ⇒ f(Xn) → f(X) i sandsynlighed<br />

⇒ f(Xn) → f(X) i L 1 <br />

(P) ⇒ E[ f(Xn)] →n→∞ E[ f(X)] = f dPX.<br />

Med udgangspunkt heri indføres den såkaldte konvergens i fordeling i hht. flg. definition.<br />

Definition. En følge (Xn)n≥1 af stokastiske funktioner med værdier i S siges at konvergere i<br />

fordeling mod μ, et Borel sandsynlighedsmål på S, hvis<br />

<br />

E[ f(Xn)] →n→∞ f dμ for alle f ∈ bC(S).<br />

Dette betegnes i givet fald Xn ∼ → μ. Hvis μ = PX for en stokastisk funktion X med værdier<br />

i S skrives også Xn ∼ → X, og man taler om konvergens i fordeling mod X. I følge den lille<br />

transformationssætning gælder altså, at<br />

Xn ∼ → X ⇔ E[ f(Xn)] →n→∞ E[ f(X)] for alle f ∈ bC(S).<br />

Ovenstående overvejelser kan derfor formuleres som implikationen.<br />

Fk 4 Xn → X i sandsynlighed ⇒ Xn ∼ → X.<br />

Grænsemålet for en konvergent følge er entydigt bestemt, dvs.<br />

For ifølge Sætning 8 har vi<br />

Xn ∼ → μ og Xn ∼ <br />

→ ν ⇒<br />

Xn ∼ → μ og Xn ∼ → ν ⇒ μ = ν.<br />

<br />

f dμ =<br />

164<br />

f dν f ∈ bC(S) ⇒ μ = ν.


Derimod kan vi sagtens have, at Xn ∼ → X og Xn ∼ → Y , selv om X og Y er vidt forskellige. Men<br />

deres fordeling er ens, idet der gælder<br />

Xn ∼ → X og Xn ∼ → Y ⇒ PX = PY.<br />

Konvergens i fordeling er derfor udelukkende en egenskab ved fordelingsmålene opfattet<br />

som Borel sandsynlighedsmål på S, idet<br />

Xn ∼ → X ⇔ PXn<br />

w<br />

→ PX,<br />

hvor for Borel sandsynlighedsmål (μn)n≥1 og μ på S μn w → μ (μn konvergerer svagt imod μ),<br />

hvis og kun hvis <br />

f dμn →n→∞<br />

<br />

f dμ for alle f ∈ bC(S).<br />

Som følge heraf har det endog mening at tale om konvergens i fordeling for variable, der<br />

ikke nødvendigvis er definerede på samme rum. Dette skal vi dog ikke udnytte her, men det<br />

er vigtigt i mange sammenhænge.<br />

Før vi ser nærmere på dette nye konvergens begreb knyttes et par kommentarer til definitionen.<br />

Da kontinuitet i metriske rum svarer til følgekontinuitet, bevares C(S) og dermed konvergens<br />

i fordeling under overgang til en ækvivalent metrik. Endvidere ses ved opsplitning i<br />

positiv og negativ del, at det er nok at eftervise definitionsbetingelsen for f ∈ bC(S)+, og da<br />

f ∧ n ↑ f og f ∧ n ∈ bC(S)+ for f ∈ C(S)+<br />

fås af Monoton konvergens, at<br />

Xn ∼ → μ (X ) ⇒ liminf<br />

n<br />

E[ f(Xn)]<br />

<br />

≥ f dμ (E[ f(X)]) for alle f ∈ C(S)+.<br />

Denne implikation kan også vendes om, idet der gælder.<br />

Fk 5<br />

Xn ∼ → μ ⇔ liminf<br />

n<br />

E[ f(Xn)]<br />

<br />

≥<br />

f dμ for alle f ∈ bC(S)+.<br />

Bevis. Vi mangler kun at vise ⇐, og som bemærket er det nok at se på ikke-negative funktioner.<br />

Lad derfor f ∈ bC(S)+ med 0 ≤ f ≤ M været givet. Da<br />

liminf<br />

n<br />

E[(M − f)(Xn)] = M − limsup E[ f(Xn)]<br />

n<br />

fås af antagelsen brugt på f og M − f , som begge er elementer i bC(S)+, at<br />

liminf<br />

n<br />

E[ f(Xn)]<br />

<br />

≥<br />

hvilket alt i alt viser, at<br />

<br />

f dμ og M − limsup E[ f(Xn)] ≥ M −<br />

n<br />

<br />

limE[ f(Xn)] =<br />

n<br />

165<br />

f dμ. ♦<br />

f dμ,


Ligesom i Fk 2a kan resultaterne udvides til funktioner, som kun er kontinuerte n.o. Der<br />

gælder f.eks.<br />

Fk 5a<br />

Xn ∼ → μ ⇔ E[ f(Xn)] →n→∞<br />

for ethvert f ∈ bM(S), som er kontinuert μ-n.o.<br />

Bevis. Kun ⇒ kræver et bevis. Ved opsplitning i positiv og negativ del og dernæst at se på f<br />

og M − f , hvor 0 ≤ f ≤ M, indses som ovenfor, at det er nok at vise<br />

<br />

liminf E[ f(Xn)] ≥ f dμ<br />

n<br />

for et givet f ∈ bM(S)+, som er kontinuert μ-n.o. Definer for g ∈ bM(B(S))+ og k ≥ 1<br />

<br />

f dμ<br />

gk(x) := inf(k<br />

∧ g(y)+k · d(x,y)) x ∈ S.<br />

y∈S<br />

Ved brug af flg. tre uligheder, hvor x, ˜x ∈ S, k ≥ 1 og r > 0,<br />

1)<br />

2)<br />

3)<br />

gk(x) ≤ k ∧ g(x)+k · d(x,x) = k ∧ g(x) ≤ g(x)<br />

gk(x) = inf (k ∧ g(y)+k · d(x,y)) ∧ inf (k ∧ g(y)+k · d(x,y))<br />

y∈b(x,r) y/∈b(x,r)<br />

≥ inf k ∧ g(y) ∧ inf k · d(x,y) ≥ k ∧ inf g(y) ∧ kr<br />

y∈b(x,r) y/∈b(x,r) y∈b(x,r)<br />

|gk(x) − gk( ˜x)| ≤ sup |k ∧ g(y)+k · d(x,y) − k ∧ g(y) − k · d( ˜x,y)|<br />

y∈S<br />

ses, at (gk)k≥1 ⊆ C(S)+ og at<br />

= k · sup |d(x,y) − d( ˜x,y)| ≤ k · d(x, ˜x)<br />

y∈S<br />

0 ≤ gk ≤ gk+1 ≤ g k ≥ 1 samt gk(x) ↑ g(x), hvis g er kontinuert i x.<br />

Da f pr. antagelse er kontinuert μ-n.o., konvergerer fk ↑ f μ-n.o., hvor fk’erne er konstrueret<br />

ud fra f , som netop beskrevet. Heraf følger derfor ved brug af Monoton konvergens, at<br />

<br />

liminf E[ f(Xn)] ≥ sup liminf E[ fk(Xn)] = sup<br />

n<br />

k n<br />

k<br />

fk dμ = f dμ. ♦<br />

Læseren opfordres til at reformulere Fk 5 og Fk 5a svarende til at Xn ∼ → X i stedet for Xn ∼ → μ.<br />

166


Kriterier for konvergens i fordeling.<br />

Portmanteau Sætning I.<br />

Lad (S,d) betegne et separabelt metrisk rum og μ et Borel sandsynlighedsmål på S samt<br />

(Xn)n≥1 en følge af stokastiske funktioner med værdier i S. Idet<br />

Lip(S,d) := { f ∈ C(S)|∃M > 0 : | f(x) − f(y)| ≤ M d(x,y) x,y ∈ S}.<br />

er flg. udsagn ækvivalente.<br />

1) Xn ∼ → μ<br />

<br />

2) gdμ ≤ liminf<br />

n<br />

E[g(Xn)] for alle g ∈ bLip(S,d)+<br />

S<br />

3) μ(G) ≤ liminfn P(Xn ∈ G) for alle G ⊆ S åben<br />

4) μ(F) ≥ limsup n P(Xn ∈ F) for alle F ⊆ S lukket.<br />

Bemærk at modsat C(S) afhænger Lip(S,d) eksplicit af metrikken d.<br />

Bevis. Da 1) ⇒ 2) er indeholdt i definitionen, og ækvivalensen mellem 3) og 4) følger ved<br />

overgang til komplementær mængden, vises kun 2) ⇒ 3) ⇒ 1). Antag 2) og lad G være en<br />

given åben delmængde af S. Definer for k ≥ 1<br />

gk(x) = (k · d(x,G c )) ∧ 1 for x ∈ S.<br />

Konstruktionen viser, at gk ↑ 1G, og ved brug af trekantsuligheden ses for k ≥ 1, at<br />

|gk(x) − gk(y)| ≤ k · |d(x,G c ) − d(x,G c )| ≤ k · d(x,y) x,y ∈ S<br />

og dermed gk ∈ bLip(S,d)+. Ifølge 2) og Monoton konvergens gælder derfor<br />

<br />

μ(G) = sup gk dμ ≤ sup liminf<br />

k S<br />

k<br />

n<br />

E[gk(Xn)] ≤ liminf<br />

n<br />

E[1G(Xn)] ≤ liminf<br />

n<br />

P(Xn ∈ G).<br />

Antag 3). Som vist i Fk 5 er det nok at vise, at for givet f ∈ bC(S)+ er<br />

<br />

f dμ ≤ liminf E[ f(Xn)].<br />

n<br />

Men for ethvert n har vi<br />

E[ f(Xn)] =<br />

∞<br />

og tilsvarende <br />

0<br />

S<br />

P( f(Xn) > t)dt =<br />

f dμ =<br />

∞<br />

og da { f > t} er åben fås af Fatou’s lemma, at<br />

∞<br />

0<br />

μ( f > t)dt ≤<br />

∞<br />

0<br />

liminf<br />

n<br />

0<br />

∞<br />

0<br />

μ( f > t)dt,<br />

P( f(Xn) > t)dt ≤ liminf<br />

n<br />

167<br />

P(Xn ∈ { f > t})dt<br />

∞<br />

0<br />

P( f(Xn) > t)dt,


hvilket er den ønskede ulighed. ♦<br />

Til enhver Borel mængde B tilordnes mængderne<br />

B ◦ := {x ∈ B|∃ε > 0 : b(x,ε) ⊆ B} og B := {x ∈ S|∀ε > 0 : b(x,ε) ∩ B = /0}.<br />

( Hoffmann bruger betegnelserne int(B) og cl(B)) Dvs. B ◦ ⊆ B ⊆ B og<br />

B ◦ = B ⇔ B åben og B = B ⇔ B lukket.<br />

B ◦ kaldes det indre af B og er den største åbne mængde indeholdt i B, og B kaldes aflukningen<br />

af B og er den mindste lukkede mængde, der indeholder B. bd(B) := B\B ◦ kaldes tilsvarende<br />

randen af B. Ækvivalensen mellem 1), 3) og 4) kan derfor formuleres på flg. måde.<br />

Korollar. Xn ∼ → μ hvis og kun hvis<br />

μ(B ◦ ) ≤ liminf<br />

n<br />

P(Xn ∈ B) ≤ limsup P(Xn ∈ B) ≤ μ(B) for alle B ∈ B(S).<br />

n<br />

Dvs. specielt: Xn ∼ → μ ⇒ limn P(Xn ∈ B) = μ(B) hvis μ(bd(B)) = 0.<br />

Læseren opfordres igen til selv at formulere udsagnene i tilfældet Xn ∼ → X.<br />

Benyttes korollaret i tilfældet S = R på mængder af formen B = (−∞,x], fås, da B ◦ =(−∞,x[<br />

og B = B, at<br />

Xn ∼ → μ ⇒ μ((−∞,x[) ≤ liminf<br />

n<br />

og dermed, da μ({x}) = μ((−∞,x]) − μ((−∞,x[),<br />

Fn(x) ≤ limsup Fn(x) ≤ μ((−∞,x])<br />

n<br />

Xn ∼ → μ ⇒ lim n Fn(x) = μ((−∞,x]) hvis μ({x}) = 0.<br />

Fn er her fordelingsfunktionen for Xn. Dette giver anledning til flg. karakterisation af fordelingskonvergens<br />

på R.<br />

Konvergens i fordeling i R.<br />

Lad (Xn)n≥1 betegne en følge af stokastiske variable og lad μ betegne et Borel sandsynlighedsmål<br />

på R. Idet Fn er fordelingsfunktionen for Xn og Fμ funktionen x ↦→ μ((−∞,x])<br />

er flg. punkter ækvivalente<br />

a) Xn ∼ → μ<br />

b) Fμ(x−) ≤ liminfn Fn(x) ≤ limsup n Fn(x) ≤ Fμ(x) x ∈ R<br />

c) limn Fn(x) = Fμ(x) hvis Fμ(x−) = Fμ(x) dvs. hvis μ({x}) = 0<br />

d) limn Fn(x) = Fμ(x) for x ∈D hvor D er tæt i R<br />

e) liminfn P(a < Xn < b) ≥ μ(]a,b[) for alle −∞ < a < b < ∞.<br />

Dvs. hvis X er en stokastisk variabel med fordelingsfunktion F, er flg. punkter ækvivalente<br />

a1) Xn ∼ → X<br />

168


1) F(x−) ≤ liminfn Fn(x) ≤ limsup n Fn(x) ≤ F(x) x ∈ R<br />

c1) limn Fn(x) = Fμ(x) hvis F(x−) = F(x) dvs. hvis P(X = x) = 0<br />

d1) limn Fn(x) = F(x) for x ∈D hvor D er tæt i R<br />

e1) liminfn P(a < Xn < b) ≥ P(a < X < b) for alle −∞ < a < b < ∞.<br />

Bevis. Da sidste del er en umiddelbar oversættelse, vises kun første del. Her mangler vi kun<br />

at vise, at d) ⇒ e) ⇒ a). Lad derfor a < b betegne givne reelle tal. Da D er tæt i R, findes der<br />

følger (ak)k≥1 og (bk)k≥1 af elementer i D, så at<br />

For alle n,k ≥ 1 gælder derfor<br />

D.v.s.<br />

a < ak < bk < b og ak ↓ a og bk ↑ b.<br />

P(a < Xn < b) ≥ P(ak < Xn ≤ bk) = Fn(bk) − Fn(ak) →n→∞ Fμ(bk) − Fμ(ak).<br />

liminf<br />

n<br />

P(a < Xn < b) ≥ sup(Fμ(bk)<br />

− Fμ(ak)) = μ(]a,b[)<br />

k<br />

og dermed d) ⇒ e). For at vise den manglende implikation lader vi G ⊆ R betegne en begrænset<br />

åben mængde. Som vist i Appendiks F findes der højst tællelig mange parvis disjunkte<br />

intervaller (]ai,bi[)i≥1, så at G = <br />

i≥1]ai,bi[. Under antagelse af e) gælder derfor<br />

≤ liminf<br />

n<br />

μ(G) = sup<br />

k<br />

∑ j≥1<br />

∑<br />

1≤ j≤k<br />

μ(]aj,bj[) ≤ sup<br />

k<br />

∑<br />

1≤ j≤k<br />

liminf<br />

n<br />

P(a j < Xn < b j)<br />

P(a j < Xn < b j) ≤ liminf<br />

n<br />

P(Xn ∈ <br />

]a j,bj[) ≤ liminf<br />

n<br />

j≥1<br />

P(Xn ∈ G).<br />

Lad dernæst G betegne en vikårlig åben mængde. Da<br />

fås af det netop viste<br />

liminf<br />

n<br />

P(Xn ∈ G) ≥ sup<br />

k<br />

Gk := G∩ ] − k,k[ ↑ G for k → ∞<br />

liminf<br />

n<br />

P(Xn ∈ Gk) ≥ supμ(Gk)<br />

= μ(G).<br />

k<br />

Implikationen e) ⇒a) følger nu af Portmanteau sætningen. ♦<br />

Det er værd at bemærke, at hvis Fμ er kontinuert, dvs. hvis μ({x}) ≡ 0, gælder endvidere, se<br />

Appendiks F,<br />

Xn ∼ → μ ⇒ sup |Fn(x) − Fμ(x)| →n→∞ 0,<br />

x∈R<br />

dvs. Fn’erne konvergerer i dette tilfælde uniformt imod Fμ.<br />

169


Regneregler for konvergens i fordeling.<br />

Portmanteau Sætning II.<br />

Lad (S,d) og (T δ) betegne separable metriske rum og lad (Xn)n≥1 og X hhv. (Yn)n≥1 og Y<br />

betegne stokastiske funktioner med værdier i S hhv. T . Da gælder<br />

1) Xn ∼ → X ⇒ f(Xn) ∼ → f(X) for Borel funktioner f : S → T , som kontinuerte PX-n.o.<br />

2) Xn ∼ → X og X degenereret ⇒ Xn → X i sandsynlighed.<br />

3) Xn ∼ → X, Yn ∼ → Y og Y degenereret ⇒ (Xn,Yn) ∼ → (X,Y).<br />

4) Xn ∼ → X, Yn ∼ → Y og Xn og Yn uafhængige n ≥ 1 ⇒ (Xn,Yn) ∼ → PX ⊗ PY .<br />

En ækvivalent og ofte mere anvendelig formulering af 1) og 3) lyder som flg. μ er her et<br />

Borel sandsynlighedsmål på S.<br />

1)’ Xn ∼ → μ ⇒ f(Xn) ∼ → μ ◦ f −1 for Borel funktioner f : S → T , som er kontinuerte μ-n.o.<br />

3)’ Xn ∼ → μ, Yn ∼ → Y og Y degenereret ⇒ (Xn,Yn) ∼ → μ ⊗ PY .<br />

Bevis. For ethvert g ∈ bC(T) er sammensætningen g ◦ f Borel målelig og kontinuert PX-n.o.<br />

Ifølge Fk 5a gælder derfor<br />

<br />

E[g( f(Xn))] = E[g ◦ f(Xn)] →n→∞ g ◦ f dPX = gdPf(X), hvilket viser 1). I 2) antages P(X = a) = 1. Da x ↦→ d(x,a) ∧ 1 ∈ bC(S) fås<br />

E[d(Xn,X) ∧ 1] = E[d(Xn,a) ∧ 1] →n→∞ E[d(X,a) ∧ 1] = d(a,a) ∧ 1 = 0,<br />

dvs. 2) er også vist. I 3) antages P(Y = a) = 1. Definer<br />

˜<br />

d1((x1,y1),(x2,y2)) := d(x1,x2) ∧ 1+δ(y1,y2) ∧ 1 x1,x2 ∈ S, y1,y2 ∈ T.<br />

d1<br />

˜ er da en produktmetrik og for et vilkårligt element g ∈ Lip(S × T, d)+ ˜ gælder<br />

|E[g(Xn,Yn)] − E[g(X,Y)]| = |E[g(Xn,Yn)] − E[g(X,a)]|<br />

≤ E[|g(Xn,Yn) − g(Xn,a)|]+|E[g(Xn,a)] − E[g(X,a)]|<br />

≤ M · E[δ(Yn,a) ∧ 1]+|E[g(Xn,a)] − E[g(X,a)]| →n→∞ 0<br />

da x ↦→ g(x,a) ∈ bC(S) og Yn → a i sandsynlighed. Påstanden følger derfor af den første<br />

Portmanteu sætning.<br />

Det generelle bevis for 4) gennemgås ikke, men det vigtige specialtilfælde, hvor S = R n og<br />

T = R m , behandles senere i forbindelse med Kontinuitetssætningen.<br />

Det er værd at understrege, at 3) ikke gælder generelt. Dvs. vedrørende konvergens i fordeling<br />

kan vi ikke som i tilfældet med konvergens n.o. eller konvergens i sandsynlighed udlede<br />

konvergens af vektoren ud fra konvergens af marginalerne. Et simpelt eksempel, der viser<br />

dette, er beskrevet i flg. situation.<br />

Lad X betegne en U(−1,1)-fordelt stokastisk variabel, dvs. X ∼ −X, og sæt for alle n ≥ 1<br />

Xn = Yn = X og Y = −X.<br />

170


Da gælder oplagt Xn ∼ → X og Yn ∼ → Y . Hvis 3) derfor var sand uden restriktioner, ville<br />

(Xn,Yn) ∼ → (X,Y) og dermed ifølge 2), da (x,y) ↦→ x+y er kontinuert,<br />

dvs. PX = δ0, hvilket oplagt ikke er rigtigt.<br />

2X = Xn +Yn ∼ → X +Y = 0,<br />

171


Kontinuitetssætningen for karakteristiske funktioner.<br />

Fra reel analyse vides, at en følge (xk)k≥1 i R n er konvergent, hvis og kun hvis<br />

(xk)k≥1 er begrænset, og L((xk)k≥1) indeholder højst et punkt,<br />

hvor jævnfør Appendiks B L((xk)k≥1) betegner mængden af limespunkter, dvs.<br />

L((xk)k≥1) := {x ∈ R n |∃(kl)l≥1 delfølge : xkl → x}.<br />

Resultatet bygger på, at en begrænset mængde B ⊆ R n er prekompakt, dvs.<br />

(xk)k≥1 ⊆ B ⇒ L((xk)k≥1) = /0.<br />

Dette generaliserer uændret til et vilkårligt metrisk rum (S,d), idet der gælder<br />

En punktfølge (xn)n≥1 i S er konvergent, hvis og kun hvis mængden {xn |n ≥ 1} er prekompakt,<br />

og L((xn)n≥1) indeholder højst et punkt.<br />

Bevis. Kun hvis delen er allerede vist i Appendiks B. Da (xn)n≥1 er prekompakt, indeholder<br />

L((xn)n≥1) et punkt {x}, og vi vil nu vise, at xn → x. Antag at dette ikke gælder, dvs.<br />

∃r > 0 ∃(nl)n≥1 delfølge : xnl<br />

/∈ b(x,r) for alle l ≥ 1.<br />

Ifølge antagelsen er (xnl )l≥1 også prekompakt og har derfor mindst et limespunkt ˜x. Men<br />

da L((xnl )l≥1) ⊆ L((xn)n≥1) må der gælde ˜x = x, hvilket er umuligt, da d(x,xkl ) > r for alle<br />

l ≥ 1. Påstanden er hermed vist. ♦<br />

Med baggrund heri indføres nu et prekompakthedsbegreb svarende til konvergens i fordeling<br />

for stokastiske funktioner med værdier i et polsk rum (S,d). Men da vi i dette kursus kun<br />

ser på S = R n , vil vi i det følgende udelukkende koncentrere os om dette tilfælde. Begrebets<br />

betydning og konsekvenser overføres dog uændret til ethvert polsk rum.<br />

Definition. En familie af sandsynlighedsmål {μi |i ∈ I} på (Rn ,B(Rn )) siges at være stram<br />

(tight), hvis<br />

∀ε > 0, ∃K ⊆ R n kompakt : sup μi(K<br />

i∈I<br />

c ) < ε,<br />

og en familie af n-dimensionale stokastiske vektorer (X i)i∈I siges at være stram, hvis mængden<br />

af fordelingsmål {PX i |i ∈ I} udgør en stram familie, dvs. hvis<br />

∀ε > 0, ∃K ⊆ R n kompakt : sup<br />

i∈I<br />

P(X i /∈ K) < ε.<br />

Da kompakthed i R n er det samme som at være lukket og begrænset, er dette ækvivalent med<br />

∀ε > 0, ∃r > 0 : P(X i > r) < ε for alle i ∈ I,<br />

hvor x 2 := ∑ n j=1 x2 j for x ∈ Rn . Markov’s ulighed sikrer derfor flg. kriterium.<br />

Stramhed i R n . Momentbetingelse. En familie (X i)i∈I af n-dimensionale stokastiske vektorer<br />

er stram, hvis der findes et α > 0 så at<br />

supE[X<br />

i<br />

i∈I<br />

α ] < ∞.<br />

172


Definitionen viser umiddelbart, at stramhed ligesom begrænsethed og mere generelt prekompakthed<br />

er stabil under endelig foreningsmængdedannelse, samt at delmængder af stramme<br />

mængder igen er stramme, og ikke overraskende gælder tillige flg. udsagn.<br />

Eksempler på stramhed. Enhver endelig mængde af sandsynlighedsmål er stram, og ligeledes<br />

er enhver følge af stokastiske funktioner (X k)k≥1, som konvergerer i fordeling, stram.<br />

Bevis. Hvad angår endelige mængder, er det nok at vise, at alle etpunkts mængder er<br />

stramme. For R n -tilfældet er dette en umiddelbar konsekvens af, at R n er voksende foreningsmængde<br />

af kompakte mængder, f.eks. b(0,k). Det generelle bevis, der udnytter en i<br />

polske rum gældende alternativ karakterisation af kompakthed, kan findes i afsnittet "Mål på<br />

metriske rum".<br />

Anden del vises kun i R n -situationen. Antag derfor at (X k)k≥1 konvergerer i fordeling imod<br />

et Borel sandsynlighedsmål μ på R n . Som vist i korollaret til Portmanteau Sætning I gæder<br />

derfor<br />

lim k P(X k > r) = μ(R n \ b(0,r)) r > 0<br />

hvis μ(bd(b(0,r))) = 0, dvs. alle pånær tællelig mange r, da<br />

Lad ε > 0 være givet og vælg r1 så at<br />

Der findes derfor et k0 så at<br />

bd(b(0,r1)) ∩ bd(b(0,r2)) = /0 hvis r1 = r2.<br />

lim k P(X k > r1) = μ(R n \ b(0,r1)) < ε/2.<br />

P(X k > r1) < ε for k ≥ k0.<br />

Men da den endelige mængde {X k |,1 ≤ k ≤ k0} er stram, kan vi vælge et r2, så at<br />

og for r := r1 ∨ r2 gælder derfor<br />

P(X k > r2) < ε for 1 ≤ k ≤ k0,<br />

sup<br />

k<br />

P(X k > r) < ε. ♦<br />

Som allerede udnyttet i det netop gennemførte bevis, sikrer stramhed af enhver endelig familie<br />

af mål eller stokastiske vektorer, at en følge (X k)k≥1 er stram, hvis man kan vise, at<br />

∀ε > 0, ∃K ⊆ R n kompakt : limsup P(Xk /∈ K) ≤ ε.<br />

k<br />

eller ækvivalent<br />

∀ε > 0, ∃r > 0 : limsup P(X k > r) ≤ ε.<br />

k<br />

Dette udnyttes f.eks. i beviset for flg. ækvivalente beskrivelse af stramhed.<br />

Stramhed i Rn . En følge (Xk)k≥1 af n-dimensionale stokastiske vektorer er stram hvis og<br />

kun hvis<br />

∀ε > 0, ∃a > 0 : liminf E[e<br />

k<br />

−a2 ·X k2 ] > 1 − ε.<br />

173


Bevis. Lad ε > 0 være givet. Vælg a > 0, så at<br />

liminf E[e<br />

k<br />

−a2 ·X k2 ] > 1 − ε/2 eller ækvivalent limsup(1<br />

− E[e<br />

k<br />

−a2 ·Xk2 ]) < ε/2.<br />

Da x ↦→ 1 − e−a2x2 er voksende på R+ fås af Markov’s ulighed at<br />

P(X k > 1/a) = P(1 − e −a2 ·X k 2<br />

for alle k ≥ 1, og da 1 − e −1 > 1/2 har vi derfor<br />

> 1 − e −1 ) ≤ 1 − E[e−a2 ·X k 2<br />

]<br />

1 − e −1<br />

limsup P(Xk > 1/a) < 2ε/2 = ε,<br />

k<br />

hvilket, som nævnt, medfører stramhed. Kun-hvis-delen overlades til læseren. ♦<br />

Det næste resultat viser, at stramhed er det kompakthedsbegreb for fordelingskonvergens i<br />

R n , som vi har antydet. Der gælder et tilsvarende resultat i ethvert polsk rum, men den generelle<br />

sætning, der er kendt under navnet Prokhorov’s Sætning, er noget mere kompliceret.<br />

Helly-Bray’s Sætning.<br />

Enhver stram følge (Xk)k≥1 af n-dimensionale stokastiske vektorer har mindst et limespunkt,<br />

dvs. der findes en delfølge (kl)l≥1 og et Borel sandsynlighedsmål μ på Rn ∼<br />

, så at Xkl → μ.<br />

En følge af n-dimensionale stokastiske vektorer (Xk)k≥1 konvergerer derfor i fordeling, hvis<br />

og kun hvis den er stram og har højst et limespunkt.<br />

Første del vises kun i tilfældet n = 1. Tilfældet n > 1 klares på ’næsten’ samme måde, men<br />

er dog mere kompliceret, både hvad angår opskrivning og indhold.<br />

Bevis. Lad Fk betegne fordelingsfunktionen for Xk. Ifølge Helly’s Lemma (se Appendiks F)<br />

eksisterer der da en delfølge (kl)l≥1 og en højrekontinuert voksende funktion F : R → R, så<br />

at<br />

0 ≤ F ≤ 1 og limFkl (x) = F(x) for alle x ∈ CF,<br />

l<br />

hvor CF betegner mængden af kontinuitetspunkter for F. Da stramhed af (Xk)k≥1 i R kan<br />

formuleres som<br />

ses, da CF er tæt i R, at<br />

∀ε > 0, ∃r > 0 : supFk(−r)<br />

≤ ε og inf<br />

k<br />

k Fk(r) ≥ 1 − ε<br />

lim F(x) = 0 og lim F(x) = 1.<br />

x→−∞ x→∞<br />

Lebesgue-Stieltjes målet λF hørende til F er derfor et sandsynlighedsmål, da<br />

λF(R) = lim<br />

r→∞ λF(] − r,r]) = lim<br />

r→∞ (F(r) − F(−r)) = 1,<br />

∼<br />

og vi vil nu vise, at Xkl → λF. Men da F(x) = λF(] − ∞,x]) for alle x ∈ R er dette en umiddelbar<br />

konsekvens af resultatet angående fordelingskonvergens i R.<br />

Hvad angår anden del, mangler vi kun at vise hvis-delen. Lad derfor μ betegne et limespunkt.<br />

174


Stramheden sikrer eksistensen af et sådant. Antag nu at (Xk)k≥1 ikke konvergerer i fordeling<br />

mod μ. Pr. definition af konvergens i fordeling findes der altså en funktion f ∈ bC(Rn ), et<br />

ε > 0 og en delfølge (kl)l≥1, så at<br />

<br />

|E[ f(X kl )] −<br />

f dμ | > ε for alle l ≥ 1.<br />

Da følgen (X kl )l≥1 også er stram, har den derfor et limespunkt. Men da dette ligeledes er et<br />

limespunkt for hele følgen, må det ifølge entydigheden være μ, hvilket tydeligvis er umuligt<br />

i hht. valget af (kl)l≥1. ♦<br />

Korollar. En stram følge af n-dimensionale stokastiske vektorer (X k)k≥1 konvergerer i fordeling,<br />

hvis limk ϕX k (t) eksisterer for alle t ∈ R n .<br />

Bevis. Ifølge Helly-Bray’s Sætning er det nok at vise, at der højst er et limespunkt. Antag<br />

derfor at μ og ν er limespunkter, d.v.s. der findes delfølger (k(l))l≥1 og (k(m))m≥1, så at<br />

Da<br />

X k(l)<br />

∼<br />

∼<br />

→ μ og Xk(m) → ν.<br />

t ↦→ cos(t · a) og t ↦→ sin(t · a)<br />

er kontinuerte og begrænsede for ethvert a ∈ Rn , betyder dette, at<br />

<br />

e it·a <br />

μ(da) = limϕX (t) = limϕX (t) = limϕX (t) =<br />

k(l) k<br />

l k m k(m)<br />

e it·a ν(da)<br />

for alle t ∈ R n , dvs. ˆμ = ˆν. Ifølge Entydighedssætningen for karakteristiske funktioner er μ<br />

og ν derfor identiske, dvs., der er højst et limespunkt. ♦<br />

Afsnittets hovedsætning viser, at fordelingskonvergens i R n er ækvivalent med punktvis konvergens<br />

af de tilhørende karakteristiske funktioner. Der gælder nemlig flg. resultat.<br />

Kontinuitetssætningen for karakteristiske funktioner.<br />

Lad (Xk)k≥1 betegne n-dimensionale stokastiske vektorer, så at limk ϕX (t) = γ(t) for alle<br />

k<br />

t ∈ Rn , hvor γ : Rn → C er kontinuert i 0. Da findes der et Borel sandsynlighedsmål μ på<br />

Rn ∼<br />

, så at Xk → μ, og μ er karakteriseret ved, at ˆμ(t) = γ(t) for alle t ∈ Rn .<br />

Bevis. Da den ligheden ˆμ = γ er åbenbar, udestår der set i lyset af ovenstående korollar kun<br />

at vise implikationen<br />

γ kontinuert i 0 ⇒ (X k)k≥1 stram.<br />

Ifølge Kf 1 er |γ(t)| ≤ γ(0) = 1 for alle t ∈ R n . Dvs. hvis U1,...,Un er uafhængige N(0,2)fordelte<br />

stokastiske variable og U := (U1,...,Un), sikrer γ’s kontinuitet i punktet 0, at der til<br />

et givent ε findes et a > 0, så at<br />

|E[γ(aU)]| > 1 − ε,<br />

thi for an → 0 konvergerer γ(anU) mod γ(0) = 1 P-n.o. domineret af 1. Men da<br />

ϕU(t) =<br />

n<br />

∏ϕUi i=1<br />

(ti)<br />

n<br />

= ∏exp(−t i=1<br />

2 i ) = e −t2<br />

175<br />

for alle t ∈ R n ,


fås af antagelserne, Lebesgue’s Sætning samt Kf 4, at<br />

E[γ(aU)] = lim k E[ϕX k (aU)] = lim k E[ϕU(aX k)] = lim k E[e −a2 ·X k 2<br />

].<br />

D.v.s. liminfk E[e −a2 ·X k 2<br />

] > 1 − ε, og som ovenfor vist, er (X k)k≥1 er derfor stram. ♦<br />

Korollar 1 Lad (X k)k≥1 og X betegne n-dimensionale stokastiske vektorer og μ et Borel<br />

sandsynlighedsmål på R n . Da gælder<br />

og tilsvarende<br />

Specielt ses at X k<br />

X k<br />

X k<br />

∼<br />

→ X ⇔ lim k ϕX k (t) = ϕX(t) for alle t ∈ R n ,<br />

∼<br />

→ μ ⇔ lim k ϕX k (t) = ˆμ(t) for alle t ∈ R n .<br />

∼<br />

→ X i R n ⇔ t · X k<br />

∼<br />

→ t · X i R for alle t ∈ R n .<br />

Bevis. Første del er klar, da ϕX og ˆμ er kontinuerte overalt specielt i 0. Anden del ses ved at<br />

bemærke, at<br />

ϕY(t) = ϕZ(1) hvor Z = t ·Y<br />

for enhver n-dimensional stokastisk vektor Y og ethvert t ∈ R n .<br />

Korollar 2 Lad Xog (X k)k≥1 samt Y og (Y k)k≥1 betegne hhv. n og m-dimensionale stokastiske<br />

vektorer, så at X k og Y k er uafhængige for alle k. Da gælder<br />

Bevis. Da<br />

X k<br />

for alle (t,s) ∈ R n × R m = R n+m og<br />

∼<br />

∼<br />

→ X og Y k → Y ⇒ (Xk,Y k) ∼ → PX ⊗ PY.<br />

ϕ (Xk,Y k)(t,s) = ϕX k (t) · ϕY k (s) →k→∞ ϕX(t) · ϕY(s)<br />

(t,s) ↦→ ϕX(t) · ϕY(s)<br />

er kontinuert, sikrer Kontinuitetssætningen, at ((X n,Y n))n≥1 konvergerer i fordeling. Identifikationen<br />

af grænsemålet følger dernæst af Entydighedssætningen, da<br />

(t,s) ↦→ ϕX(t) · ϕY(s)<br />

ifølge Kf 5 er den Fouriertransformerede for sandsynlighedsmålet PX ⊗ PY . ♦<br />

176


Den Centrale Grænseværdisætning.<br />

Kontinuitetssætningen er det ideelle værktøj til at undersøge flg. konvergensproblem ofte<br />

omtalt som et CLT-problem (Central Limit Theorem).<br />

Givet en følge af uafhængige stokastiske variable (Xn)n≥1, findes der da to reelle talfølger<br />

(an)n≥1 ⊆ (0,∞) og (bn)n≥1 ⊆ R, så at<br />

<br />

n 1<br />

∼<br />

∑ Xk − bn → μ,<br />

an k=1<br />

hvor μ er et sandsynlighedsmål, som ikke er koncentreret i et punkt, dvs. ikke-degenereret.<br />

Udtrykt ved hjælp af Kontinuitetssætningen er dette ækvivalent med at spørge om eksistensen<br />

af (an)n≥1 ⊆ (0,∞) og (bn)n≥1 ⊆ R, så at<br />

lim n e it bn/an ·<br />

n<br />

∏<br />

k=1<br />

ϕXk (t/an) →n ψ(t) t ∈ R,<br />

hvor ψ er en karakteristisk funktion for ikke degenereret fordeling. Formuleret på denne<br />

sidste måde, er det naturligt også at lade ϕXk ’erne variere med n, dvs. i stedet for at tage udgangspunkt<br />

i en følge af uafhængige stokastiske variable, starter vi med et såkaldt uafhængigt<br />

trekantsskema (Xn j)1≤ j≤n, dvs.<br />

X11<br />

X21, X22<br />

······<br />

Xn1, Xn2, ..., Xnn<br />

·········<br />

hvor Xn1, Xn2, ..., Xnn er uafhængige for alle n ≥ 1. En følge af uafhængige variable (Xn)n≥1<br />

kan opfattes som et uafhængigt trekantsskema (Xn j)1≤ j≤n ved fastsættelsen<br />

Xn j = Xj for alle 1 ≤ j ≤ n.<br />

Problemet er nu, om der findes konstanter (an)n≥1 ⊆ (0,∞) og (bn)n≥1 ⊆ R eller retterere<br />

(mnk)1≤k≤n ⊆ R så at<br />

1<br />

an<br />

<br />

n n<br />

∑ Xnk − ∑ mnk<br />

k=1 k=1<br />

<br />

= 1<br />

<br />

n<br />

∑ (Xnk − mnk)<br />

an k=1<br />

konvergerer i fordeling mod en ikke degeneret fordeling, eller ækvivalent om<br />

n<br />

∏ ϕXnk−mnk<br />

k=1<br />

(t/an) = exp(− it<br />

an<br />

n<br />

∑<br />

k=1<br />

n<br />

mnk) · ∏<br />

k=1<br />

ϕXnk (t/an) → ψ(t)<br />

for alle t ∈ R, hvor ψ er den karakteristiske funktion for en ikke degenereret fordeling.<br />

177


For at udelukke at et enkelt led Znk = (Xnk − mnk)/an i summen er alt dominerende, restrikterer<br />

man sig normalt til situationer, hvor den såkaldte uan-betingelse, dvs.<br />

lim n max<br />

1≤k≤n P(|Znk | ≥ ε) = 0 for alle ε > 0,<br />

er opfyldt. Uan-betingelsen bevirker, at kun helt specielle fordelingsfordelinger kan fremkomme<br />

som grænseværdi på ovennævnte måde. Dette gælder f.eks. poisson og normale<br />

fordelinger, men derimod ikke binomial og uniforme fordelinger. Helt præcist er de eneste<br />

mulige grænsefordelinger under uan-betingelsen de såkaldte uendelig delelige fordelinger,<br />

hvor en stokastisk variabel X siges at have en uendelig delelig fordeling, hvis der for ethvert<br />

naturligt tal n findes stokastiske variable X1,...,Xn, som er uafhængige og identisk fordelte,<br />

så at<br />

X ∼ X1 + ···+Xn.<br />

Uan-betingelsen og endog det stærkere limn P(max1≤k≤n |Znk | ≥ ε) = 0 for alle ε > 0 er<br />

specielt opfyldt, hvis<br />

n<br />

∑ P(|Znk | ≥ ε) →n→∞ 0 for alle ε > 0.<br />

k=1<br />

Denne såkaldte Raikov-betingelse er tæt knyttet til de normale CLT-resultater, dvs. udsagn<br />

som sikrer, at grænsefordelingen eksisterer og er en normal fordeling. Vi skal udelukkende<br />

beskæftige os med denne uden sammenligning historisk vigtigste type, idet vi skal omtale tre<br />

normale CLT-resultater samt diskutere relationerne mellem dem. Udgangspunktet er i alle tre<br />

situationer et uafhængigt trekantsskema, hvor de indgående variable alle har endeligt andet<br />

moment, og konstanterne (man bruger her normalt betegnelsen sn i stedet for an) vælges i<br />

hht. flg. opskrift<br />

mnk := E[Xnk] 1 ≤ k ≤ n og sn :=<br />

<br />

n<br />

∑ Var(Xnk) n ≥ 1.<br />

k=1<br />

CLT 1 Den Centrale Grænseværdisætning, klassisk udgave.<br />

Lad (Xn)n≥1 betegne en iid-følge, hvor den fælles fordeling har endelig middelværdi μ og<br />

varians σ 2 > 0. Da konvergerer<br />

Un := 1<br />

√ nσ 2<br />

n<br />

∑<br />

j=1<br />

(Xj − μ) ∼ → N(0,1).<br />

Bevis. Lad ϕ betegne den karakteristiske funktion for X1 − μ. Regnereglerne for karakteristiske<br />

funktioner viser, at for alle t ∈ R og n ≥ 1 er<br />

ϕUn (t) = ϕ(t/√nσ 2 ) n <br />

= 1 − n(1 − ϕ(t/√nσ 2 n ))<br />

.<br />

n<br />

Men da E[X1 − μ] = 0 og Var(X1 − μ) = σ 2 fås af et vist Taylorudviklings resultat for karakteristiske<br />

funktioner, at n(1 − ϕ(t/ √ nσ 2 ) → t 2 /2 og dermed, se Appendiks G,<br />

ϕUn (t) →n→∞ e −t2 /2<br />

t ∈ R.<br />

Det ønskede resultat følger nu umiddelbart af Kontinuitetssætningen. ♦<br />

178


CLT 2 Lyapounov’s Sætning.<br />

Lad {Xn j |1 ≤ j ≤ n} betegne et uafhængigt trekantsskema, så at Xn j’erne har endelig første<br />

og andet moment. Sæt<br />

μn j = E[Xn j], σ 2 n j = Var(Xn j) og sn :=<br />

<br />

σ 2 n1 + ···+σ 2 nn<br />

for n ≥ 1 og antag, at sn > 0 for alle n. Hvis Lyapounov’s betingelse er opfyldt, dvs. hvis<br />

konvergerer<br />

∃α > 2 : lim<br />

Un := 1<br />

1<br />

n→∞ sα n<br />

n<br />

∑ E[|Xn j − μn j|<br />

j=1<br />

α ] = 0,<br />

n<br />

∑(Xn<br />

j − μn j)<br />

sn j=1<br />

∼ → N(0,1).<br />

Lyapounov’s betingelse er specielt opfyldt, hvis sn →n→∞ ∞ og Xn j − μn j’erne er uniformt<br />

begrænsede af en konstant M. For i denne situation gælder<br />

1<br />

s 3 n<br />

n<br />

∑ E[|Xn j − μn j|<br />

j=1<br />

3 ] ≤ M<br />

s3 n<br />

n<br />

∑ E[|Xn j − μn j|<br />

j=1<br />

2 ] = M<br />

→n→∞ 0.<br />

sn<br />

I beviset kan vi uden tab af generalitet antage, at Lyapounov’s betingelse er opfyldt for et α<br />

i intervallet ]2,3]. For betragt for givet n ≥ 1 produktrummet<br />

Ω × En, hvor En := {1,...,n},<br />

udstyret med produkt σ-algebraen F × 2En . Definer<br />

μn(A) :=<br />

<br />

Zn<br />

E[1A(·, j) · j 2<br />

<br />

] A ∈ F × 2 En ,<br />

n<br />

∑<br />

j=1<br />

hvor Zn j := Xn j − μn j for alle n og j. μn er da et sandsynlighedsmål, og ifølge korollaret til<br />

Jensen’s ulighed gælder derfor for ethvert δ ≥ 1, at<br />

<br />

1<br />

Zn<br />

E[ j <br />

<br />

·<br />

<br />

<br />

<br />

<br />

hvor<br />

<br />

≤ (<br />

s 3 n<br />

f δ dμn) 1/δ ≤<br />

n<br />

∑ E[|Zn j|<br />

j=1<br />

3 ] =<br />

n<br />

∑<br />

j=1<br />

<br />

<br />

E[ <br />

<br />

<br />

<br />

f(ω, j) := <br />

<br />

Zn j<br />

sn<br />

<br />

<br />

<br />

<br />

n<br />

∑<br />

j=1<br />

δ<br />

Zn j(ω)<br />

sn<br />

<br />

<br />

· <br />

<br />

Zn j<br />

sn<br />

sn<br />

sn<br />

<br />

2 1/δ<br />

<br />

<br />

<br />

]<br />

Zn j<br />

sn<br />

=<br />

<br />

2<br />

<br />

<br />

] =<br />

<br />

1<br />

s 2+δ<br />

n<br />

f dμn<br />

<br />

<br />

<br />

for alle (ω, j) ∈ Ω × En.<br />

n<br />

∑ E[|Zn j|<br />

j=1<br />

2+δ 1/δ ] ,<br />

Bevis for Lyapounov’s Sætning. Lad fortsat notationen Zn j = Xn j − μn j for 1 ≤ j ≤ n være<br />

gældende. Ifølge Kontinuitetssætningen er det nok at vise, at<br />

ϕUn (t) = ϕ ∑ n j=1 Zn j (t/sn) =<br />

n<br />

∏ ϕZn j<br />

j=1<br />

(t/sn) →n→∞ e −t2 /2<br />

for alle t ∈ R.<br />

179


Lad t ∈ R være givet. Da s 2 n = ∑n j=1 σ 2 n j er<br />

|ϕUn (t) − e−t2 /2 | = |<br />

n<br />

∏ ϕZn j<br />

j=1<br />

(t/sn) −<br />

n<br />

∏ exp(−t<br />

j=1<br />

2 σ 2 n j /2s2n )|,<br />

og benyttes nu at for ethvert sæt af komplekse tal a1,...,an og b1,...,bn med længde højst<br />

1 er<br />

fås<br />

≤<br />

|<br />

n<br />

∏<br />

j=1<br />

a j −<br />

n<br />

n−1<br />

∏ b j| ≤ |(an − bn) · ∏<br />

j=1<br />

j=1<br />

n−1 n−1<br />

≤ |an − bn|+| ∏ a j − ∏ b j| ≤ ··· ≤<br />

j=1 j=1<br />

|ϕUn (t) − e−t2 /2 | ≤<br />

n<br />

∑ |ϕZn j<br />

j=1<br />

(t/sn) − 1+ t2 σ<br />

2<br />

2 n j<br />

s2 |+<br />

n<br />

Da E[Zn j] = 0 og Var(Zn j) = σ 2 n j<br />

n−1 n−1<br />

a j|+|bn ·( ∏ a j − ∏ b j)|<br />

j=1 j=1<br />

n<br />

∑ |a j − b j|,<br />

j=1<br />

n<br />

∑ |ϕZn j<br />

j=1<br />

(t/sn) − exp(−t 2 σ 2 n j /2s2n )|<br />

n<br />

∑ |exp(−<br />

j=1<br />

t2<br />

2<br />

σ 2 n j<br />

s 2 n<br />

) − 1+ t2<br />

2<br />

σ 2 n j<br />

< ∞ viser en tidligere formuleret konsekvens af Kf 8, at<br />

|ϕZn j (t/sn) − 1+ t2<br />

2<br />

σ 2 n j<br />

s 2 n<br />

| ≤ |t| α E[|Zn j| α ]<br />

sα ,<br />

n<br />

og da endvidere |e −x − 1+x| ≤ x 2 for x ≥ 0, har vi alt i alt<br />

|ϕUn (t) − e−t2 /2 α<br />

| ≤ |t| n E[|Zn j|<br />

∑<br />

j=1<br />

α ]<br />

sα +<br />

n<br />

t4<br />

4<br />

Her går det første led imod 0 pr. antagelse, og da<br />

n<br />

∑<br />

j=1<br />

<br />

σ 2 2<br />

n j<br />

s 2 n<br />

σ<br />

≤ max<br />

1≤ j≤n<br />

2 n j<br />

s2 n<br />

mangler vi kun at vise, at limn max1≤ j≤n σ 2 n j /s2 n<br />

samt Lyapounov’s betingelse, idet<br />

σ<br />

max<br />

1≤ j≤n<br />

2 n j<br />

s2 n<br />

= max<br />

1≤ j≤n E[<br />

Xn j − μn j<br />

sn<br />

n σ<br />

∑<br />

j=1<br />

2 n j<br />

s2 n<br />

<br />

2<br />

1<br />

] ≤<br />

sα n<br />

180<br />

n<br />

∑<br />

j=1<br />

<br />

σ 2 2<br />

n j<br />

s 2 n<br />

σ<br />

= max<br />

1≤ j≤n<br />

2 n j<br />

s2 n<br />

= 0. Men dette følger af Jensen’s ulighed<br />

.<br />

s 2 n<br />

n<br />

∑ E[|Xn j − μn j|<br />

j=1<br />

α 2/α ] . ♦<br />

|.


CLT 3 Lindeberg’s Sætning.<br />

Lad {Xn j |1 ≤ j ≤ n} betegne et uafhængigt trekantsskema, så at Xn j’erne har endelig første<br />

og andet moment. Sæt<br />

μn j = E[Xn j], σ 2 n j = Var(Xn j) og sn :=<br />

<br />

σ 2 n1 + ···+σ 2 nn<br />

for n ≥ 1 og antag, at sn > 0 for alle n. Hvis Lindeberg’s betingelse er opfyldt, dvs. hvis<br />

konvergerer<br />

lim<br />

n→∞ s−2 n<br />

n <br />

∑ (Xn j − μn j)<br />

j=1 {|Xn j−μn j|>εsn}<br />

2 dP = 0 for alle ε > 0<br />

Un := 1<br />

n<br />

∑(Xn<br />

j − μn j)<br />

sn j=1<br />

∼ → N(0,1).<br />

Bevis. Ifølge Kontinuitetssætningen er det nok at vise, at for ethvert t ∈ R gælder<br />

ϕUn (t) =<br />

n<br />

∏ ϕ ˜Xn j<br />

j=1<br />

(t) →n→∞ e −t2 /2<br />

,<br />

hvor ˜Xn j = (Xn j − μn j)/sn. Lad t ∈ R være givet. Ved at bruge en allerede benyttet vurdering<br />

af afstanden mellem to produkter af komplekse tal, hvis faktorer har længde højst 1, fås, da<br />

∑ n j=1 E[ ˜X 2 n j ] = 1 for alle n, at<br />

|ϕUn (t) − e−t2 /2 | = |<br />

n<br />

∏ ϕ ˜Xn j<br />

j=1<br />

(t) −<br />

n<br />

∏<br />

j=1<br />

− t2<br />

e 2 ·E[ ˜X 2 n j ] | ≤<br />

Uligheden |e −x − 1+x| ≤ x 2 for x ≥ 0 viser, at for alle j og n er<br />

dvs.<br />

n<br />

t2<br />

∑ |ϕ ˜Xn<br />

(t) − e− 2<br />

j<br />

j=1<br />

·E[ ˜X 2 n j ] |.<br />

t2<br />

|ϕ ˜Xn<br />

(t) − e− 2<br />

j ·E[ ˜X 2 n j ] t2<br />

| ≤ |ϕ ˜Xn<br />

(t) − 1+<br />

j 2 · E[ ˜X 2 n j ]|+<br />

<br />

t2 2 · E[ ˜X 2 n j ]<br />

2<br />

,<br />

|ϕUn (t) − e−t2 /2 | ≤<br />

n<br />

t2<br />

∑ |ϕ ˜Xn<br />

(t) − 1+<br />

j<br />

j=1<br />

2 · E[ ˜X 2 t4<br />

n j ]|+<br />

4<br />

n<br />

∑ E[ ˜X<br />

j=1<br />

2 n j ]2 ,<br />

og vi skal derfor blot vise, at de to summer konvergerer mod 0 hver for sig.<br />

Hvad angår den sidste, har vi da ∑ n j=1 E[ ˜X 2 n j ] = 1, at for ethvert ε > 0 og n ≥ 1 er<br />

n<br />

∑ E[ ˜X<br />

j=1<br />

2 n j ]2 ≤ max<br />

1≤ j≤n E[ ˜X 2 n j ] ≤ ε2 +<br />

n<br />

∑ E[ ˜X<br />

j=1<br />

2 n j , | ˜Xn j| > ε],<br />

hvilket sammen med Lindeberg’s betingelse viser den ønskede konvergens. I forbindelse<br />

med den første sum benyttes uligheden (se Kf 8)<br />

|e iy − 1 − iy+y 2 /2| ≤ y 2 ∧ |y| 3 /6 y ∈ R.<br />

181


Da ˜Xn j’erne har middelværdi 0, fås heraf for alle 1 ≤ j ≤ n og ε > 0, at<br />

dvs.<br />

|ϕ ˜Xn j (t) − 1+t2 /2 · E[ ˜X 2 n j ]| = |E[eit ˜Xn j − 1 − it ˜Xn j +t 2 /2 · ˜X 2 n j ]|<br />

|<br />

≤ t 3 /6 · E[| ˜Xn j| 3 , | ˜Xn j| ≤ ε]+t 2 · E[ ˜X 2 n j , | ˜Xn j| > ε]<br />

≤ ε ·t 3 /6 · E[ ˜X 2 n j ]+t2 · E[ ˜X 2 n j , | ˜Xn j| > ε],<br />

n<br />

∑ E[e<br />

j=1<br />

it ˜Xn j 2<br />

− 1+t /2 · ˜X 2 n j ]| ≤ ε ·t3 n<br />

/6+ ∑ E[ ˜X<br />

j=1<br />

2 n j , | ˜Xn j| > ε],<br />

hvilket igen via Lindeberg’s betingelse viser den ønskede konvergens. D.v.s.<br />

|ϕUn (t) − e−t2 /2 | ≤<br />

n<br />

t2<br />

∑ |ϕ ˜Xn<br />

(t) − 1+<br />

j<br />

j=1<br />

2 · E[ ˜X 2 n j ]| →n→∞ 0,<br />

og Lindeberg’s Sætning er dermed vist. ♦<br />

CLT 3a Lyapounov’s betingelse medfører Lindeberg’s betingelse.<br />

Bevis. Lad ε > 0 være givet. For alle 1 ≤ j ≤ n og α > 2 har vi, at<br />

s −2<br />

<br />

n<br />

(Xn j − μn j)<br />

{|Xn j−μn j|>εsn}<br />

2 <br />

dP =<br />

{ |Xn j−μn j |<br />

sn<br />

>ε}<br />

(Xn j − μn j) 2<br />

≤ ε 2−α<br />

<br />

|Xn j − μn j| α<br />

sα dP ≤ ε<br />

n<br />

2−α · s −α<br />

n · E[|Xn j − μn j| α ],<br />

og dermed for alle ε > 0, n ≥ 1 og α > 2<br />

<br />

s −2<br />

n<br />

n<br />

∑<br />

j=1<br />

{|Xn j−μn j|>εsn}<br />

(Xn j − μn j) 2 dP ≤ ε 2−α · s −α<br />

n<br />

CLT 3b Lindeberg’s betingelse er opfyldt i iid-tilfældet.<br />

s 2 n<br />

dP<br />

n<br />

∑ E[|Xn j − μn j|<br />

j=1<br />

α ]. ♦<br />

Lad μ og σ 2 > 0 betegne den fælles middelværdi og varians. Da s 2 n = n · σ 2 fås dermed for<br />

ethvert ε > 0<br />

s −2<br />

n<br />

n<br />

∑<br />

j=1<br />

<br />

(Xn j − μn j)<br />

{|Xn j−μn j|>εsn}<br />

2 dP = σ −2<br />

<br />

{|X1−μ|> √ (X1 − μ)<br />

n·ε·σ}<br />

2 dP,<br />

som ifølge Lebesgue’s Sætning konvergerer mod 0 for n → ∞. ♦<br />

Regnereglerne for konvergens i fordeling viser, at for stokastiske variable (Xn)n≥1 og (Yn)n≥1<br />

gælder for ethvert σ 2 ∈ [0,∞), at<br />

Xn ∼ → N(0,σ 2 ) og Yn → 0 s.s. ⇒ Xn +Yn ∼ → N(0,σ 2 ).<br />

Denne ide kan ved at opsplitte givne variable i en ’lille’ og en ’stor’ del udnyttes til at bevise<br />

normale CLT-sætninger under svagere integrabilitetsbetingelser end de ovenfor anvendte.<br />

Opsplitningen sker normalt ved hjælp af en Borel funktion q : R → R, idet vi skriver<br />

Xn j = q(Xn j)+(Xn j − q(Xn j)),<br />

182


hvor så første del spiller rollen som den ’lille’ del og den anden den ’store’ del. Et eksempel<br />

på et sådant resultat er følgende.<br />

CLT 4 En normal CLT-sætning uden eksistens af momenter.<br />

Lad {Xn j |1 ≤ j ≤ n} betegne et uafhængigt trekantsskema og q : R → R en Borel funktion,<br />

så at mn j = E[q(Xn j)] og σ 2 n j = Var(q(Xn j)) eksisterer og er endelige for alle 1 ≤ j ≤ n.<br />

Antag endvidere at<br />

i)<br />

ii)<br />

iii)<br />

lim<br />

n→∞<br />

for et 0 ≤ σ 2 < ∞. Da konvergerer<br />

Bevis. For ethvert n er<br />

n<br />

∑<br />

j=1<br />

n<br />

∑ mn j = 0 og lim<br />

n→∞<br />

j=1<br />

x − q(x)<br />

q(0) = 0 = lim<br />

x→0 x2 n<br />

∑ σ<br />

j=1<br />

2 2<br />

n j = σ<br />

<br />

n <br />

lim ∑ (1+q(Xn j)<br />

n→∞<br />

j=1 {|Xn j|>ε}<br />

2 <br />

)dP = 0 ∀ε > 0<br />

Un :=<br />

(Xn j − mn j) =<br />

n<br />

∑<br />

j=1<br />

n<br />

∑<br />

j=1<br />

(Xn j − mn j) ∼ → N(0,σ 2 ).<br />

(Xn j − q(Xn j))+<br />

n<br />

∑<br />

j=1<br />

(q(Xn j) − mn j),<br />

og som ovenfor bemærket er det derfor nok at eftervise flg. to påstande<br />

A)<br />

n<br />

∑<br />

j=1<br />

(q(Xn j) − mn j) ∼ → N(0,σ 2 ) og B)<br />

Vi viser først A). Hvis σ 2 = 0 ses, at<br />

dvs.<br />

E[(<br />

n<br />

∑<br />

j=1<br />

n<br />

∑<br />

j=1<br />

n<br />

∑<br />

j=1<br />

(q(Xn j) − mn j)) 2 ] =<br />

(Xn j − q(Xn j)) → 0 i sandsynlighed.<br />

n<br />

∑ σ<br />

j=1<br />

2 n j → 0,<br />

(q(Xn j) − mn j) → 0 i L 2 (P)<br />

og derfor også konvergens i fordeling mod δ0 = N(0,0). Hvis derimod σ 2 > 0, skriver vi for<br />

n så stor at s2 n = ∑nj=1 σ 2 n j > 0,<br />

n<br />

∑(q(Xn<br />

j) − mn j) = σ ·<br />

j=1<br />

sn<br />

σ<br />

183<br />

· 1<br />

sn<br />

n<br />

∑<br />

j=1<br />

(q(Xn j) − mn j),


hvoraf A) følger, hvis<br />

n 1<br />

∑ sn j=1<br />

(q(Xn j) − mn j) ∼ → N(0,1).<br />

Dette vises ved at eftervise, at det uafhængige trekantsskema {q(Xn j)}1≤ j≤n opfylder Lindeberg’s<br />

betingelse holder. Lad ε > 0 være givet. Da<br />

1<br />

s 2 n<br />

≤ 2<br />

s 2 n<br />

er det ifølge i) nok at vise, at<br />

lim<br />

n→∞<br />

n <br />

∑<br />

(q(Xn j) − mn j)<br />

j=1 {|q(Xn j)−mn j|>ε·sn}<br />

2 dP<br />

n <br />

∑<br />

q(Xn j)<br />

j=1 {|q(Xn j)−mn j|>ε·sn}<br />

2 dP+ 2<br />

s2 n<br />

n<br />

∑ m<br />

j=1<br />

2 n j<br />

n <br />

∑<br />

j=1 {|q(Xn j)−mn j|>ε·σ 2 q(Xn j)<br />

/2}<br />

2 dP = 0.<br />

Men for n stor og dermed ifølge i) sup 1≤ j≤n |mn j| lille er for alle 1 ≤ j ≤ n<br />

{|q(Xn j) − mn j| > ε · σ 2 /2} ⊆ {|q(Xn j)| > ε · σ 2 /4} ⊆ {|Xn j| > ˜ε},<br />

hvor ˜ε > 0 er valgt i hht. ii), så at |q(x)| > ε ·σ 2 /4 ⇒ |x| > ˜ε. Påstanden og dermed A) følger<br />

nu umiddelbart af iii).<br />

Hvad angår B) skrives for alle ε > 0 og alle n<br />

n<br />

∑<br />

j=1<br />

(Xn j − q(Xn j)) =<br />

n<br />

∑<br />

j=1<br />

(Xn j − q(Xn j)) · 1 {|Xn j|≤ε} +<br />

n<br />

∑<br />

j=1<br />

Da limn ∑ n j=1 P(|Xn j| > ε) = 0 for ethvert ε > 0 ifølge iii) konvergerer<br />

n<br />

∑<br />

j=1<br />

(Xn j − q(Xn j)) · 1 {|Xn j|>ε}<br />

(Xn j − q(Xn j)) · 1 {|Xn j|>ε} →n→∞ 0 i sandsynlighed,<br />

for ethvert ε > 0. Et argument baseret på trekantsuligheden i en metrik, der svarer til konvergens<br />

i sandsynlighed, sikrer derfor, at det er nok at vise, at<br />

limsup E[|<br />

n<br />

n<br />

∑<br />

j=1<br />

(Xn j − q(Xn j)) · 1 {|Xn j|≤ε}|] → 0 for ε → 0.<br />

For ε > 0 så lille, at |q(x) > |x|/2 for 0 < |x| ≤ ε (her benyttes ii)) gælder nu<br />

|<br />

n<br />

∑<br />

j=1<br />

(Xn j − q(Xn j)) · 1 {|Xn j|≤ε}| ≤<br />

n<br />

≤ Mε ∑<br />

j=1<br />

n |Xn j − q(Xn j)|<br />

∑<br />

j=1 q(Xn j) 2<br />

· q(Xn j) 2 · 1 {0


D.v.s. for alle n er<br />

domineret af<br />

Mε ·<br />

E[|<br />

n<br />

∑<br />

j=1<br />

(Xn j − q(Xn j)) · 1 {|Xn j|≤ε}|]<br />

n<br />

∑ E[q(Xn j)<br />

j=1<br />

2 n<br />

] = Mε · ∑<br />

j=1<br />

som ifølge i) konvergerer mod Mε · σ 2 for n → ∞. Men da<br />

|x − q(x)|<br />

sup<br />

0


Betingede middelværdier.<br />

Som optakt til emnet betingede middelværdier vender vi kort tilbage til begrebet σ-algebraer.<br />

Allerede ved introduktionen af et sandsynlighedsfelt (Ω,F,P), omtaltes elementerne<br />

i hændelsessystemet F , som de mængder vi var interesseret i og derfor ’kendte’. Dette<br />

synspunkt er udgangspunktet for den måde, vi i det følgende skal betragte σ-algebraer eller<br />

rettere del σ-algebraer i et givent måleligt rum (Ω,F). Pr. definition er en del σ-algebra B<br />

i F en σ-algebra i Ω, hvis elementer alle ligger i F , dvs.B ⊆ F . En sådan del σ-algebra<br />

B tænkes at modellere en informationsmængde i den forstand, at elementerne i B er<br />

de mængder, vi kender, dvs. vi kan afgøre, om de indtræffer eller ej; og en variabel X siges<br />

derfor at være observerbar på baggrund af informationsmængden B, hvis den er B-målelig.<br />

Stabilitetskravene til en σ-algebra passer godt til informationssynspunktet, thi kender vi en<br />

hændelse A, så kender vi jo også A c , og kender vi Ai for ethvert i, så er det nærliggende at<br />

sige, at vi også kender ∞ i=1 Ai, thi denne indtræffer jo præcist, hvis mindst en af Ai’erne<br />

indtræffer. I dette ’informationssprog’ opfattes σ-algebraen {/0,Ω} som svarende til ingen<br />

information i modsætning til σ-algebraen F , som tolkes som fuld information.<br />

Ofte vil informationsmængden være givet ved, at vi kender værdierne af en eller flere stokastiske<br />

variable X1,...,Xn, dvs. vi kan afgøre, om hændelserne<br />

{(X1,...,Xn) ∈ A} A ∈ B(R n )<br />

indtræffer eller ej. Dette svarer til, at informationsmængden er σ-algebraen frembragt at<br />

Xi’erne, dvs. σ(X1,...,Xn). Denne er klart en del σ-algebra i F , da Xi’erne er stokastiske<br />

variable. Dens størrelse afhænger af, hvor komplicerede X1,...,Xn er, og som vist i Faktoriseringssætningen<br />

(se Øvelse 8), er enhver variabel, som er observerbar kendt på basis<br />

af denne information, dvs. σ(X1,...,Xn)-målelig, en funktion af (X1,...,Xn), og dermed på<br />

formen<br />

ϕ(X1,...,Xn) hvor ϕ : R n → R er Borel målelig.<br />

Begrebet betinget middelværdi af en variabel X indføres nu som en formalisering af det<br />

’bedste skøn’ over X på basis af en given informationsmængde B. Antag først at B er på<br />

formen σ(A1,...,An), hvor A1,...,An udgør en målelig partition af Ω, dvs. Ai’erne ligger<br />

i F , er parvis disjunkte og udfylder Ω. Da enhver reel B-målelig variabel er på formen<br />

∑i αi · 1Ai<br />

, er angivelsen af det bedste skøn over en variabel X givet B derfor ækvivalent<br />

med en beregningsformel for αi’erne. En sådan opskrift afhænger naturligvis af, hvordan<br />

vendingen ’bedste skøn’ tolkes, men i forlængelse af forståelsen af begrebet middelværdi<br />

som en form for midling af værdierne forekommer det nærliggende at vedtage, at αi’erne<br />

skal bestemmes ved formlen<br />

α X i := 1<br />

P(Ai)<br />

<br />

Ai<br />

X dP hvis P(Ai) > 0, og α X i := 0 ellers.<br />

Den foreslåede beregningsformel kræver en vis integrabilitet af X, og vi vil her nøjes med at<br />

betragte variable X i L1 (P). Thi i så fald er ∑i αX i · 1Ai en vel defineret B-målelig variabel,<br />

som ligger i L1 (P) og opfylder (husk at ethvert A ∈ B er en foreningsmængde af visse af<br />

Ai’erne) <br />

X dP =<br />

A<br />

α X i · 1Ai dP for alle A ∈ B.<br />

A ∑ i<br />

186


Dette giver nu anledning til flg. generelle eksistens - / entydighedsspørgsmål:<br />

Givet en del σ-algebra B og en variabel X ∈ L 1 (P) findes der da en variabel XB i L 1 (P,B) :=<br />

{Y ∈ L 1 (P)|Y er B målelig}, som opfylder<br />

<br />

A<br />

<br />

X dP = XB dP for alle A ∈ B,<br />

A<br />

og i hvor høj grad er en sådan entydigt bestemt ?<br />

Det sidste er det letteste, for hvis XB og ˜XB er elementer i L 1 (P,B), der begge opfylder<br />

integralbetingelsen, så er {XB = ˜XB} ifølge Proposition 5 en P-nulmængde, dvs.<br />

XB = ˜XB P-n.o.<br />

Denne entydighed op til P-nulmængder betyder, at det har mening at bruge notationen<br />

E[X |B] om enhver variabel, der opfylder ovenstående krav, og at kalde den en betinget<br />

middelværdi af X givet B. Dvs. en betinget middelværdi af en variabel X er observerbar<br />

mht. den betragtede informations σ-algebra, og dens integral m.h.t. P over ethvert element i<br />

informationsmængden er lig integralet af X over den samme mængde.<br />

For at vise eksistensen betragtes først kvadratisk integrable variable. Da underrummet<br />

L 2 (P,B) = {Y ∈ L 2 (P)|Y er B målelig}<br />

i L 2 (P) er lukket under konvergens i kvadratisk middel, findes der ifølge Projektionssætningen<br />

til ethvert X ∈ L 2 (P) et PBX ∈ L 2 (P,B), så at<br />

X − PBX ∈ L 2 (P,B) ⊥ ;<br />

specielt er X − PBX og 1A derfor orthogonale for alle A ∈ B, dvs.<br />

<br />

X dP = XB dP for alle A ∈ B.<br />

A<br />

A<br />

PBX er altså en betinget middelværdi af X givet B, og der gælder yderligere.<br />

Lemma BM 1 For alle X, Y ∈ L 2 (P) er<br />

PBX − PBY = PB(X −Y) P-n.o. og E[|PBX|] ≤ E[|X|].<br />

Bevis. Første del følger umiddelbart af, at L2 (P,B) ⊥ er stabil under addition. Hvad angår<br />

anden del indføres for et givet X i L2 (P) betegnelsen A+ = {PBX ≥ 0}. Dvs. A+ og Ac +<br />

ligger i B, da PBX er B-målelig, og der gælder derfor<br />

<br />

=<br />

A+<br />

<br />

E[|PBX|] =<br />

A+<br />

<br />

PBX dP −<br />

Ac PBX dP<br />

+<br />

<br />

X dP −<br />

Ac <br />

X dP ≤<br />

+<br />

|X|dP−<br />

A+<br />

Ac |X|dP = E[|X|].<br />

+<br />

♦<br />

187


Eksistensen af den betingede middelværdi for variable i L 1 (P) er nu let. For lad X ∈ L 1 (P)<br />

være givet. Vælg nu en følge (Xn)n≥1 ⊆ L 2 (P), så at Xn → X i L 1 (P).<br />

Xn := X · 1 {|X|≤n} for n ≥ 1<br />

kan f.eks. bruges. Ifølge Lemma BM 1 har vi for alle m,n ≥ 1<br />

E[|PBXn − PBXm |] = E[|PB(Xn − Xm)|] ≤ E[|Xn − Xm|]<br />

dvs. (PBXn)n≥1 er en Cauchy-følge i L1 (P,B), og den konvergerer derfor ifølge Sætning 6 i<br />

P-middel mod et element XB i L1 (P,B). Denne grænseværdi er en betinget middelværdi af<br />

X givet B, for benyttes implikationen<br />

Zn → Z i L 1 <br />

(P) ⇒ Zn dP →<br />

A<br />

Z dP for alle A ∈ F,<br />

som skyldes uligheden<br />

<br />

| Zn dP −<br />

A<br />

Z dP| ≤ |Zn − Z|dP for alle n ≥ 1,<br />

på følgerne (Xn)n≥1 og (PBXn)n≥1 og hændelser A ∈ B fås<br />

<br />

X dP = lim<br />

A<br />

n<br />

Xn dP = lim<br />

A<br />

n<br />

PBXn dP =<br />

A<br />

A<br />

A<br />

<br />

XB dP.<br />

A<br />

Eksistens og entydighed af betingede middelværdier er hermed vist, dvs.<br />

Proposition Bm 1 For enhver del σ-algebra B i F findes der til enhver vaiabel X ∈ L1 (P)<br />

et element E[X |B] ∈ L1 (P,B), så at<br />

<br />

X dP = E[X |B]dP for alle A ∈ B.<br />

A<br />

A<br />

E[X |B] er herved entydigt bestemt P-n.o., dvs. op til P-nulmængder findes der netop en<br />

variabel Y , som opfylder<br />

a) Y er B-målelig og integrabel.<br />

b) E[X,A] = E[Y,A] for alle A ∈ B.<br />

Vi vil nu for en vilkårlig del σ-algebra B i F nærmere studere afbildningen<br />

L 1 (P) ∋ X ↦→ E[X |B] ∈ L 1 (P,B).<br />

Afbildningen, der kaldes betinget middelværdi dannelse m.h.t.B, har en række vigtige egenskaber,<br />

hvoraf de fleste er angivet nedenfor. Som følge af den manglende punktvise entydighed<br />

skal alle udsagn, som f.eks. ligheds - eller ulighedstegn, involverende betingede middelværdier<br />

forstås som værende gældende P-n.o.<br />

Sektionerne 6.8-10 i Hoffmann indeholder endnu flere, men de er alle simple konsekvenser<br />

af de nedenstående. Det bør dog understreges, at Hoffmann betragter variable i L(P), hvor<br />

vi her kun ser på elementer i L 1 (P). Men igen er udvidelsen ikke vanskelig.<br />

188


Som en hjælp til forståelsen bemærkes, at hvis B er den trivielle σ-algebra {/0,Ω}, er afbildningen<br />

X ↦→ E[X |B] præcis middelværdiafbildningen X ↦→ E[X]. For da en variabel i<br />

denne situation er B-målelig, hvis og kun hvis den er konstant, er E[X |B] = E[X] for alle<br />

X ∈ L 1 (P). (tænk over dette)<br />

Betinget middelværdi dannelse bevarer middelværdi og er lineær og voksende (eller rettere<br />

P-lineær og P-voksende), dvs. for X,Y ∈ L 1 (P) og a ∈ R gælder<br />

Bm 0 E[E[X |B]] = E[X].<br />

Bm 1 E[X +Y |B] = E[X |B]+E[Y |B] og E[aX |B] = a · E[X |B] P-n.o.<br />

Bm 2 P(X ≥ Y) = 1 ⇒ P(E[X |B] ≥ E[Y |B]) = 1 og tilsvarende med >.<br />

Bevis. Hvis P(X ≥ Y) = 1 er ligheden P(E[X |B] ≥ E[Y |B]) = 1 en umiddelbar konsekvens<br />

af Proposition 5, da<br />

<br />

<br />

E[X |B]dP = X dP ≥ Y dP = E[Y |B]dP<br />

A<br />

A<br />

for alle A ∈ B. Men da de to yderpunkter er ens for A = {E[X |B] = E[Y |B]}, viser<br />

implikationen<br />

<br />

<br />

X dP = Y dP ⇒ P(B ∩ {X > Y }) = 0 B ∈ B,<br />

at<br />

B∩{X>Y }<br />

B∩{X>Y }<br />

P(X > Y) = 1 ⇒ P(E[X |B] > E[Y |B]) = 1. ♦<br />

Endvidere bevarer afbildningen ’konstanter’ idet<br />

Bm 3 X = c P-n.o. ⇒ E[X |B] = c P-n.o. for ethvert c ∈ R.<br />

Kombineres Bm 2 og 3 fås for X ∈ L 1 (P):<br />

Bm 4 P(X ∈ I) = 1 ⇒ P(E[X |B] ∈ I) = 1 for ethvert interval I ⊆ R.<br />

Bevis. Lineariteten sikrer, at det er nok at vise implikationerne<br />

P(X ≤ b) h.h.v.P(X < b) = 1 ⇒ P(E[X |B] ≤ b) h.h.v.P(E[X |B] < b) = 1<br />

for alle b ∈ R. Men disse følger umiddelbart af Bm 2 og 3. ♦<br />

Bm 2 og 4 sikrer flg. variant af Jensen’s ulighed for betingede middelværdier.<br />

Bm 5 Lad ϕ : R → R være en Borel funktion, som er konveks på et åbent interval I ⊆ R. Lad<br />

X ∈ L 1 (P) være givet, så at P(X ∈ I) = 1 og ϕ(X) ∈ L 1 (P), da er<br />

ϕ(E[X |B]) ≤ E[ϕ(X)|B] P-n.o.<br />

Bevis. Da ϕ er konveks på det åbne interval I, eksisterer der, som vist i Appendiks C, en<br />

følge (ln)n≥1 af affine funktioner, så at<br />

ln ≤ ϕ på I og ϕ(x) = supln(x)<br />

for alle x ∈ I,<br />

n<br />

189<br />

A<br />

A


dvs. specielt ϕ(X) ≥ ln(X) P−n.o. for alle n ≥ 1, da P(X ∈ I) = 1. Da NP er stabil under<br />

tællelig forening, gælder derfor ifølge Bm 1, 2 og 3, at<br />

E[ϕ(X)|B] ≥ sup<br />

n<br />

E[ln(X)|B] = sup<br />

n<br />

Men ifølge Bm 4 er P(E[X |B] ∈ I) = 1 og dermed<br />

sup<br />

n<br />

ln(E[X |B]) P-n.o.<br />

ln(E[X |B]) = ϕ(E[X |B]) P-n.o. ♦<br />

Det overlades til læseren at udvide resultatet til vilkårlige intervaller. Bruges Bm 5 på funktionerne<br />

x ↦→ |x| p for p ≥ 1 fås<br />

E[X |B] ∈ L p (P) hvis X ∈ L p (P) og E[X |B]p ≤ Xp dvs.<br />

Bm 6 X ↦→ E[X |B] er en lineær kontraktion i L p (P) for ethvert p ≥ 1.<br />

Bm 2 og 6 medfører flg. konvergensresultater for variable (Xn)n≥1 og X i L 1 (P).<br />

Bm 7 Xn ↑ (↓)X P-n.o. ⇒ E[Xn |B] ↑ (↓)E[X |B] P-n.o. og i P-middel.<br />

Bevis. Antag Xn ↑ X P-n.o. og dermed Xn → X i P-middel. Af Bm 2 og 6 fås derfor<br />

E[Xn |B] ↑ supE[Xn<br />

|B] ≤ E[X |B] P-n.o.<br />

n<br />

samt E[Xn |B] → E[X |B] i P-middel, specielt er der konvergens i sandsynlighed, hvorfor<br />

supE[Xn<br />

|B] = E[X |B] P-n.o. ♦<br />

n<br />

Bm 8 Hvis Xn ≥ 0 og X ≤ liminfn Xn P-n.o., er<br />

E[X |B] ≤ liminf<br />

n<br />

E[Xn |B] P-n.o.<br />

Specielt er E[liminfn Xn |B] ≤ liminfn E[Xn |B] P-n.o. hvis liminfn Xn ∈ L 1 (P).<br />

Bevis. Definer Yn := infk≥n Xk for n ≥ 1. Da<br />

X ∧Yn ↑ X ∧ liminf<br />

n<br />

Xn = X P-n.o. og Yn, X ∧Yn ∈ L 1 (P) for alle n,<br />

fås af Bm 2 og 7, at E[Yn |B] ≤ infk≥n E[Xk |B] P-n.o. og derfor<br />

E[X |B] = sup<br />

n<br />

E[X ∧Yn |B] ≤ sup<br />

n<br />

E[Yn |B] ≤ liminf<br />

n<br />

E[Xn |B] P- n.o. ♦<br />

Bm 9 Hvis Xn → X P-n.o. og |Xn| ≤ Y P-n.o. for et Y ∈ L 1 (P) konvergerer<br />

E[Xn |B] → E[X |B] P-n.o. og i P-middel.<br />

Bevis. Da Xn → X i P-middel sikrer Bm 6 middelkonvergensen, og konvergensen P-n.o. fås<br />

ved at bruge Bm 8 på følgerne (Y −Xn)n≥1 og (Y +Xn)n≥1. Detaljerne overlades til læseren.♦<br />

190


De to næste resultater viser, at B-målelige variable behandles som ’konstanter’.<br />

Bm 10 E[U |B] = U P-n.o. for ethvert U ∈ L 1 (P,B); og for X ∈ L 1 (P) og B-målelige variable<br />

U1 og U2 gælder<br />

P(U1 ≤ X ≤ U2) = 1 ⇒ P(U1 ≤ E[X |B] ≤ U2) = 1.<br />

Bevis. Første er del er umiddelbar og overlades til læseren. Da<br />

for ethvert n ≥ 1 fås af Bm 2, at<br />

P(X ∧ n ≤ U2 ∧ n) = 1 og |U2 ∧ n| ≤ n+|X| ∈ L 1 (P)<br />

E[X ∧ n|B] ≤ E[U2 ∧ n|B] = U2 ∧ n ≤ U2 P-n.o.<br />

Lader vi nu n → ∞ fås ved brug af Bm 7, at P(E[X |B] ≤ U2) = 1. Den anden halvdel følger<br />

tilsvarende. ♦<br />

Bm 11 E[U · X |B] = U · E[X |B] P-n.o., for U B-målelig og X, U · X ∈ L 1 (P).<br />

Bevis. Antag at U og X opfylder antagelserne. Ifølge Lemma 6 findes der er en følge<br />

(Un)n≥1 ⊆ S(B), så at Un → U og |Un| ≤ |U| og dermed<br />

Af Bm 9 følger derfor, at<br />

Un · X → U · X P-n.o. og |Un · X| ≤ |U · X| P-n.o.<br />

E[Un · X |B] → E[U · X |B] P-n.o.,<br />

dvs., hvis påstanden er vist for simple funktioner, fås<br />

E[U · X |B] = lim n (Un · E[X |B]) = U · E[X |B] P-n.o.<br />

Det er derfor nok at se på ’simple’ U og dermed via linearitet nok at se på U af formen 1A for<br />

et A ∈ B. Men her er påstanden en umiddelbar konsekvens af, at der for alle B ∈ B gælder<br />

<br />

<br />

<br />

1A · E[X |B]dP =<br />

B<br />

E[X |B]dP =<br />

B∩A<br />

X dP =<br />

B∩A<br />

1A · X dP. ♦<br />

B<br />

De næste fire egenskaber er af en lidt anden natur. De tre første omhandler betingning med<br />

uafhængig information, og den sidste er reglen om successiv betingning. X er her stadigvæk<br />

et element i L 1 (P) og B1 endnu en del σ-algebra i F . Bemærk at Bm 12 er specialtilfældet<br />

af Bm 13 svarende til B = {/0,Ω}.<br />

Bm 12 E[X |B] = E[X] P-n.o. hvis X og B er uafhængige.<br />

Bm 13 E[X |σ(B ∪B1)] = E[X |B] P-n.o. hvis (X,B) og B1 er uafhængige.<br />

Bm 14 E[H(X,Y)|B] = ˜H(Y) P-n.o. hvis X og B er uafhængige og Y ∈ M(B) og ˜H(y) :=<br />

E[H(X,y)], hvor H : R 2 → R er begrænset og Borel målelig.<br />

Bm 15 E[E[X |B]|B1] = E[X |B1] P-n.o. hvis B1 ⊆ B.<br />

191


Bevis. Bm 12 og 15 overlades til læseren. I Bm 14 viser et linearitetsargument, at det er nok<br />

at se på ikke-negative H. Da måleligheden og integrabiliteten følger af Tonelli’s sætning,<br />

mangler vi kun at vise, at for givet B ∈ B er<br />

<br />

˜H(Y)dP = H(X,Y)dP.<br />

A<br />

Men lader vi Z betegne den stokastiske variabel 1A fås ved gentagen brug af den lille transformationssætning<br />

og Tonelli’s sætning, at<br />

<br />

<br />

˜H(Y)dP = ˜H(Y) · 1A dP = ˜H(y) · zPY,Z(dydz)<br />

<br />

=<br />

<br />

{<br />

A<br />

A<br />

<br />

H(x,y) · zPX(dx)}P (Y,Z)(dydz) = H(x,y) · zPX ⊗ P (Y,Z)(dxdydz)<br />

<br />

<br />

<br />

= H(x,y) · zP (X,Y,Z)(dxdydz) = H(X,Y) · 1A dP =<br />

A<br />

H(X,Y)dP<br />

Hvad angår Bm 13, viser et nyt linearitetsargument, at vi kan og vil antage, at X er ikkenegativ.<br />

Da både måleligheden og integrabiliteten igen er oplagt, mangler vi kun at vise,<br />

at <br />

X dP = E[X |B]dP for alle C ∈ σ(B ∪B1).<br />

C<br />

C<br />

Men da begge sider er endelige mål på σ(B ∪B1) med samme masse E[X], behøver vi kun<br />

at vise ligheden for C af formen A ∩ B, hvor A ∈ B og B ∈ B1, idet mængden af disse er<br />

stabil under endelig gennemsnit og frembringer σ(B ∪ B1). Men for A ∈ B og B ∈ B1<br />

gælder ifølge den antagede uafhængighed, at<br />

<br />

<br />

<br />

E[X |B]dP = E[X |B] · 1A · 1B dP = P(B) E[X |B]·1A dP<br />

A∩B<br />

<br />

= P(B)<br />

<br />

<br />

X · 1A dP = X · 1A · 1B dP =<br />

A∩B<br />

X dP. ♦<br />

Ifølge Bm 4 og 6 afbilder enhver betinget middelværdi mængder af formen<br />

{X ∈ L 1 (P)|P(|X| ≤ M) = 1} og {X ∈ L 1 (P)|E[|X|] ≤ M} hvor 0 < M < ∞<br />

ind i sig selv. Øvelse 17 medfører derfor flg. vigtige egenskab, hvor (Bn)n≥1 er del σ-algebraer<br />

i E og H en delmængde af L 1 (P).<br />

Bm 16 H uniformt integrabel ⇒ {E[X |Bn]|X ∈ H , n ≥ 1} unif. integrabel.<br />

Tilfældet hvor H består af en enkelt variabel, er specielt vigtigt, dvs.<br />

Bm 16’ {E[X |Bn]|n ≥ 1} er uniformt integrabel for alle X ∈ L 1 (P).<br />

Bevis. Lad X ∈ L 1 (P) være givet. Da {|E[X |Bn]| ≥ K} ∈ Bn for alle n og K fås af regnere-<br />

glerne for betingede middelværdier, at<br />

<br />

|E[X |Bn]|dP ≤<br />

{|E[X |Bn ]|≥K}<br />

<br />

192<br />

{|E[X |Bn ]|≥K}<br />

E[|X||Bn]dP


=<br />

|X|dP ≤<br />

|X|dP<br />

{|E[X |Bn]|≥K}<br />

{E[|X||Bn]≥K}<br />

hvilket giver det ønskede, da {|X|} er uniformt integrabel og<br />

P({E[|X||Bn] ≥ K}) ≤ E[E[|X||Bn]]/K ≤ E[|X|]/K →K→∞ 0. ♦<br />

Bm 16 kan vises på nøjagtig samme måde.<br />

Lad os til slut se nærmere på tilfældet, hvor B = σ(Y) for en målelig variabel Y med værdier<br />

i et måleligt rum (E,E ). Her skrives normalt E[·|Y] i stedet for E[·|σ(Y)]. Ifølge faktoriseringssætningen<br />

findes der til ethvert X i L 1 (P) en funktion ϕ ∈ M(E ), generelt afhængig<br />

af både X, Y og P, så at<br />

E[X |Y] = ϕ(Y),<br />

og da <br />

ϕ dPY =<br />

B<br />

<br />

{Y ∈B}<br />

<br />

ϕ(Y)dP =<br />

{Y ∈B}<br />

<br />

X dP = x · 1B(y)P (X,Y)(dxdy)<br />

for alle B ∈ E , ses dels, at ϕ er entydigt bestemt PY -n.o., samt at den kun afhænger af den<br />

simultane fordeling, dvs. der gælder<br />

Bm 17a Lad X og Z betegne elementer i L 1 (P), så at (X,Y) ∼ (Z,Y) og ϕ et element i M(E ).<br />

Da er<br />

E[X |Y] = ϕ(Y) P-n.o. ⇔ E[Z |Y] = ϕ(Y) P-n.o..<br />

Helt tilsvarende ses<br />

Bm 17b Lad X betegne et element i L 1 (P) og Z og Y målelige variable med værdier i et<br />

måleligt rum (E,E ), så at (X,Y) ∼ (X,Z). Da gælder for ψ ∈ M(E ) at<br />

E[X |Y] = ψ(Y) P-n.o. ⇔ E[X |Z] = ψ(Z) P-n.o..<br />

Men hvordan bestemmer man et ϕ, der passer til et givent X ∈ L 1 (P) ? Hoffmann behandler<br />

problemet i sektion 6.11, som blandt andet indeholder flg. resultat.<br />

Bm 18 Lad (X,Y) betegne en absolut kontinuert 2-dimensional stokastisk vektor med tæthed<br />

(x,y) ↦→ f(x,y) m.h.t. det plane Lebesgue mål. Definer<br />

<br />

f2(y) :=<br />

R<br />

f(u,y)du og f X|Y(x|y) := f(x,y)<br />

f2(y) · 1 { f2>0}(y) for x,y ∈ R.<br />

Da gælder for enhver begrænset Borel funktion ψ : R2 → R, at<br />

<br />

E[ψ(X,Y)|Y] = ˜ψ(Y) P-n.o., hvor ˜ψ(y) := ψ(x,y) · fX|Y(x|y)dx y ∈ R.<br />

Da f2 er en tæthed for Y , er PY( f2 > 0) = 1. Resultatet gælder uændret for ubegrænsede ψ,<br />

hvis blot E[|ψ(X,Y)|] < ∞, dog skal ˜ψ(y) sættes lig 0 på mængden<br />

<br />

{y ∈ R|<br />

R<br />

|ψ(x,y)| · f X|Y(x|y)dx = ∞}.<br />

193<br />

R


Denne er igen en PY -nulmængde, idet<br />

<br />

<br />

{ |ψ(x,y)| · fX|Y(x|y)dx}PY(dy) =<br />

R<br />

=<br />

R<br />

<br />

R<br />

<br />

{<br />

R<br />

R<br />

<br />

{<br />

R<br />

|ψ(x,y)| · f X|Y(x|y)dx} f2(y)dy<br />

<br />

|ψ(x,y)| · 1 { f2>0}(y) · f(x,y)dx}dy =<br />

R2 |ψ(x,y)|P (X,Y)(dxdy)<br />

= E[|ψ(X,Y)|] < ∞.<br />

Bevis for Bm 18. Lad ψ ∈ bM(B(R 2 )) og B ∈ B(R) være givet. Ifølge Fubini’s Sætning<br />

gælder da<br />

E[ ˜ψ(Y),Y −1 <br />

(B)] =<br />

<br />

=<br />

B<br />

B<br />

<br />

˜ψ(y)PY(dy) =<br />

B<br />

<br />

{ ψ(x,y) · fX|Y(x|y)dx} · f2(y)dy<br />

R<br />

<br />

<br />

{ ψ(x,y) · f(x,y)dx}dy =<br />

R<br />

R2 ψ(x,y) · 1B(y) · f(x,y)λ2(dxdy)<br />

= E[ψ(X,Y), Y −1 (B)]. ♦<br />

En anden situation, hvor problemet umiddelbart lader sig løse, omtales i flg. resultat. Beviset<br />

overlades til læseren.<br />

Bm 19 Lad Y betegne en diskret stokastisk variabel, og lad (yn)n≥1 være en nummerering af<br />

den højst tællelige mængde Sp(Y), dvs.<br />

P(Y = yn) > 0 for alle n og ∑ P(Y = yn) = 1.<br />

n≥1<br />

Da gælder for enhver stokastisk variabel X og enhver Borel funktion ψ : R 2 → R, at hvis<br />

E[|ψ(X,Y)|] < ∞, så er<br />

E[ψ(X,Y)|Y] = ˜ψ(Y) P-n.o.,<br />

hvor ˜ψ(·) := ∑n≥1 an · 1 {yn}(·) og<br />

an =<br />

<br />

1<br />

ψ(X,yn)dP n ≥ 1.<br />

P(Y = yn) {Y=yn}<br />

Bm 18 og 19 knytter tæt an til, hvad der normalt kaldes en regulær betinget fordeling af X<br />

givet Y . Det er ikke et emne, vi skal gøre meget ud af, men da det indgår i behandlingen af<br />

den flerdimensionale normalfordeling, vil jeg ganske kort indføre nogle vigtige begreber og<br />

definitioner.<br />

Notation {P(A|y)|A ∈ B(R n ), y ∈ R m } kaldes en Markov kerne på B(R n ) × R m , hvis<br />

a) A ↦→ P(A|y) er et Borel sandsynlighedsmål på R n for alle y ∈ R m .<br />

b) y ↦→ P(A|y) er en Borel funktion på R m for alle A ∈ B(R n ).<br />

Lad X og Y betegne h.h.v. en n og en m-dimensional stokastisk vektor. En Markov kerne<br />

194


{PX |Y(A|y)|A ∈ B(Rn ), y ∈ Rm } på B(Rn ) × Rm kaldes en regulær betinget fordeling for<br />

X givet Y , hvis<br />

<br />

P(X ∈ A, Y ∈ B) = PX |Y(A|y)PY(dy)<br />

for alle A ∈ B(R n ) og B ∈ B(R m ). Sandsynlighedsmålet<br />

B<br />

A ↦→ P X |Y(A|y)<br />

kaldes den betingede fordeling for X givet Y = y og er det absolut kontinuert med tæthed<br />

x ↦→ f X |Y(x|y), kaldes denne en betinget tæthed for X givet Y = y.<br />

Øvelse 20. Udnyt Proposition 2 og sektionsegenskaber ved produktmålelige mængder til at<br />

vise at for alle A ∈ B(Rn+m ) = B(Rn ) ×B(Rm ) er<br />

<br />

P((X,Y) ∈ A) =<br />

Rm PX |Y(A(y)|y)PY(dy) <br />

Resultatet i Øvelse 20 viser, at hvis Z := φ(X,Y) for en k-dimensional Borel funktion φ så<br />

gælder for alle A ∈ B(R k og B ∈ B(R m , at<br />

P(Z ∈ A,Y ∈ B) = P((X,Y) ∈ φ −1 (A) ∩ R n × B) =<br />

<br />

Rm PX |Y((φ −1 (A) ∩ R n <br />

× B)(y)|y)PY(dy) =<br />

B<br />

P X |Y((φ(·,y) −1 (A)|y)PY(dy).<br />

Dvs. den betingede fordeling for Z givet Y = y er billedmålet af den betingede fordeling for<br />

X givet Y = y svarende til den målelige afbildning<br />

x ↦→ φ(x,y).<br />

Betingede fordelinger er et teoretisk vanskeligt begreb. Men for en - eller flerdimensionale<br />

stokastiske vektorer X og Y eksisterer der altid en regulær betinget fordeling for X givet Y ,<br />

og da B(R n ) er separabel, er P X |Y(·|·) entydigt bestemt i en sådan grad, at det har mening<br />

at tale om ’den betingede fordeling’ for X givet Y . De betingede fordelinger for X givet Y = y<br />

er nemlig entydigt bestemte for PY -n.a. y. Skønt der således både er eksistens og entydighed,<br />

er den eksplicitte beregning ofte vanskelig (se dog nedenstående øvelse), men i anvendelsessituationer<br />

er de betingede fordelinger heldigvis ofte givet ud fra sammenhængen.<br />

Kendskab til en betinget fordeling for X givet Y gør det muligt at generalisere resultaterne<br />

Bm 14, 18 og 19. For er f en begrænset Borel funktion på Rn × Rm , så er<br />

<br />

E[ f(X,Y)|Y] = ˜f(Y) P-n.o. hvor ˜f : y ↦→<br />

Rn f(x,y)P X |Y(dx|y),<br />

dvs. ˜f(y) er middelværdien af f(X,y) udregnet i den betingede fordeling af X givet Y = y.<br />

Formlen vises ved først at reducere til produktfunktioner, dvs. funktioner af formen<br />

(x,y) ↦→ f1(x) · f2(y),<br />

hvor f1 og f2 er Borel funktioner på R n h.h.v. R m . Standardbeviset sikrer dernæst, at det er<br />

nok at se på<br />

195


f1 = 1A og f2 = 1B for A ∈ B(R n ) og B ∈ B(R m ),<br />

men her svarer ligheden præcis til ovenstående definitionsligning. Resultatet udvider på<br />

sædvanlig vis til visse ubegrænsede f , specielt ikke-negative f .<br />

Øvelse 21. Lad X og Y være givne n og m dimensionale stokastiske vektorer og μ et vilkårligt<br />

givet Borel sandsynlighedsmål på R n . Vis nu flg. påstande.<br />

I) Hvis (X,Y) er absolut kontinuert m.h.t. λn+m med tæthed (x,y) ↦→ f(x,y), er<br />

⎧<br />

⎨<br />

PX|Y(A|y) :=<br />

⎩<br />

<br />

A f X|Y(x|y)λn(dx) A ∈ B(R n ), y ∈ { f2 > 0}<br />

μ(A) A ∈ B(R n ), y /∈ { f2 > 0}<br />

en regulær betinget fordeling for X givet Y . y ↦→ f2(y) er her en tæthed for Y og<br />

f X|Y(x|y) := f(x,y)/ f2(y) · 1 { f2>0}(y) for x ∈ R n , y ∈ R m .<br />

II) Hvis Y er diskret og Sp(Y) := {y ∈ R m |P(Y = y) > 0}, er<br />

P X|Y(A|y) :=<br />

en regulær betinget fordeling for X givet Y .<br />

III) Hvis X og Y er uafhængige, er<br />

P(X ∈ A|Y = y) A ∈ B(R n ), y ∈ Sp(Y)<br />

μ(A) A ∈ B(R n ), y /∈ Sp(Y)<br />

P X|Y(A|y) := PX(A) for A ∈ B(R n ), y ∈ R m<br />

en regulær betinget fordeling for X givet Y . <br />

Punkt III) viser, at når X og Y er uafhængige, afhænger de betingede mål for X givet Y = y<br />

ikke af y. Dette karakteriserer uafhængighed, idet flg. udsagn er ækvivalente. μ er her et<br />

sandsynlighedsmål på R n .<br />

1) X og Y er uafhængige<br />

2) P X|Y(A|y) := μ(A) for A ∈ B(R n ) og y ∈ R m er en regulær betinget fordeling for X givet<br />

Y .<br />

Øvelse 22. Eftervis 1) ⇔ 2) og vis endvidere, at μ i givet fald er fordelingsmålet for X. <br />

Øvelse 23. Lad (X,Y) være todimensionalt normalt fordelt. Vis at den betingede fordeling<br />

for X givet Y = y er en normalfordeling og bestem dens parametre.<br />

Vink: Vis at der findes et α, så at X −αY og Y er uafhængige, og udnyt dernæst bemærkningen<br />

efter Øvelse 20, idet X = (X − αY)+αY . <br />

196


Martingaler.<br />

I dette kapitel betragtes modeller for systemer, der udvikler sig i tiden. Tiden modelleres<br />

diskret, dvs. ved en tidsparametermængde T ⊆ Z, normalt et interval. Til ethvert tidspunkt<br />

n i T knytter der sig en variabel Xn og en del σ-algebra Fn i F . Vi skal tænke på Fn som<br />

den informationsmængde, der er til stede til tid n, og på Xn som en variabel, der beskriver<br />

tilstanden til tid n. Flg. krav forekommer derfor naturlige.<br />

a) Fn ⊆ Fm hvis n ≤ m for tidspunkter n og m i T , dvs. informationsmængden vokser med<br />

tiden.<br />

b) Xn er målelig m.h.t.Fn, dvs. tilstanden til tid n kan observeres på baggrund af den information,<br />

der er til stede til tid n.<br />

Med udgangspunkt heri siges en parametriseret familie (Fn)n∈T af del σ-algebraer i F at<br />

udgøre et T -filter, hvis Fn ⊆ Fm for n ≤ m, n,m ∈ T ; og b) udtrykkes ofte kort ved at sige,<br />

at processen (Xn)n∈T er tilpasset filtret (Fn)n∈T .<br />

Vi vil kun se på tilfældet, hvor T = N0 := {0,1,...}, men herved dækkes også tilfældet<br />

(Xn,Fn)n≥k, idet denne kan opfattes som ( ˜Xn, ˜<br />

Fn)n≥0, hvor<br />

˜Xn = Xn+k og ˜<br />

Fn = Fn+k n ≥ 0.<br />

Tilfældet, hvor T er et endeligt interval [k,l], er ligeledes dækket, for forlænges konstant ud<br />

over højre endepunkt kan (Xn,Fn) n∈[k,l] beskrives ved ( ˜Xn, Fn)n≥0, ˜ hvor<br />

˜Xn = Xn+k, ˜<br />

Fn = Fn+k n ≤ l − k og ˜Xn = Xl, ˜<br />

Fn = Fl n > l − k.<br />

T = N0 omfatter altså alle situationer, hvor tidsmængden har et endeligt begyndelsespunkt,<br />

og der udestår derfor i princippet kun to tilfælde nemlig, T = Z eller T = −N0. Men T = Z<br />

er ikke interessant i en martingal sammenhæng, og det godt nok meget interessante tilfælde<br />

T = −N0 overlades på grund af manglende tid til et senere kursus.<br />

Til ethvert filter (Fn)n≥0 tilknyttes de såkaldte stoptider defineret på flg. vis.<br />

Definition τ : Ω → N0 ∪ {∞} er en stoptid (mere præcist en (Fn)n≥0-stoptid), hvis<br />

{τ > n} ∈ Fn n ≥ 0.<br />

Bemærk at målelighedskravet ækvivalent kan formuleres som<br />

{τ ≤ n} ∈ Fn n ≥ 0 eller {τ = n} ∈ Fn n ≥ 0.<br />

τ siges at være en endelig stoptid, hvis P(τ < ∞) = 1, og τ siges at være en begrænset stoptid,<br />

hvis P(τ ≤ M) = 1 for et reelt tal M. Til enhver stoptid τ tilordnes σ-algebraen (overvej)<br />

Fτ := {F ∈ F∞ |F ∩ {τ = n} ∈ Fn n ≥ 0},<br />

hvor F∞ := σ( <br />

nFn), dvs.F∞ er den mindste σ-algebra, der indeholder alle Fn’erne. Fτ<br />

er altså en del σ-algebra i F∞ og omtales som informationsmængden, der er til stede til tid<br />

τ.<br />

197


Inden vi starter på den egentlige teori uddrages en række mere eller mindre åbenbare konsekvenser<br />

af de indførte defintioner på en stoptid τ og den tilhørende σ-algebra Fτ.<br />

Ma 1 τ er Fτ-målelig, og en F∞-målelig stokastisk variabel X er Fτ-målelig, hvis og kun<br />

hvis X · 1 {τ=n} er Fn-målelig for alle n ≥ 0.<br />

Bevis. Den første påstand følger af identiten<br />

<br />

{τ = n} hvis n = k<br />

{τ = k} ∩ {τ = n} =<br />

/0 hvis n = k.<br />

for n, k ∈ N0 ∪ {∞}, og den anden af identiteten<br />

{X ∈ B} ∩ {τ = n} = {X · 1 {τ=n} ∈ B} ∩ {τ = n}.<br />

for n ≥ 0 og B ∈ B(R), som, hvis 0 /∈ B, specielt giver<br />

{X · 1 {τ=n} ∈ B} = {X ∈ B} ∩ {τ = n} ∈ Fn. ♦<br />

De vigtigste stoptider er de såkaldte First Hitting Times defineret ved (her og overalt i det<br />

følgende sættes inf /0 til at være ∞ )<br />

τA(ω) := inf{n ≥ 0|Xn(ω) ∈ A} ω ∈ Ω,<br />

hvor A ∈ B(R) og (Xn)n≥0 er en tilpasset reel proces. Stoptidsegenskaben følger af ligheden<br />

{τA > n} =<br />

n<br />

{Xk ∈ A} c =<br />

k=0<br />

n<br />

{Xk ∈ A c } n ≥ 0.<br />

Dette generaliserer, se Hoffmann sektion 7.2, til de såkaldte Ocurrence Time τF defineret<br />

ved<br />

τF(ω) := inf{n ≥ 0|ω ∈ Fn} ω ∈ Ω,<br />

hvor F := (Fn)n≥0 er en følge af hændelser, så at Fn ∈ Fn for alle n ≥ 0. Bemærk at ovenstående<br />

Hitting Time svarer til Fn = {Xn ∈ A} for n ≥ 0. Igen følger stoptidsegenskaben let,<br />

idet<br />

{τF > n} =<br />

n<br />

k=0<br />

F c<br />

k<br />

k=0<br />

for n ≥ 0.<br />

Da stoptider kun antager heltallige værdier ses let, at enhver stoptid τ er en Ocurrence Time,<br />

idet τ = τF, hvor Fn = {τ ≤ n} for alle n ≥ 1.<br />

Definitionen viser, at for ethvert k ∈ N0 ∪ {∞} er den konstante variabel τ(ω) :≡ k en stoptid.<br />

Ligeledes ses at mængden af (Fn)n≥0-stoptider er stabil under endelig sum og endelig<br />

punktvis max og min dannelse, dvs.<br />

Ma 2 τ1, τ2 stoptider ⇒ τ1 + τ2, τ1 ∨ τ2 og τ1 ∧ τ2 stoptider.<br />

Bevis. Følger af lighederne<br />

{τ1 ∨ τ2 ≤ n} = {τ1 ≤ n} ∩ {τ2 ≤ n} og {τ1 ∧ τ2 > n} = {τ1 > n} ∩ {τ2 > n}<br />

198


samt<br />

{τ1 + τ2 = n} =<br />

n<br />

{τ1 = k} ∩ {τ2 = n − k} ♦<br />

Argumenterne for ∨ og ∧ udvider uden videre til tællig mange stoptider, dvs.<br />

k=1<br />

og derfor tilsvarende for en uendelig sum, da<br />

(τi)i≥1 stoptider ⇒ supτi<br />

og infτi<br />

stoptider,<br />

i i<br />

∞<br />

∑ τi = sup<br />

i=1 n<br />

Det næste resultat viser, at stoptids σ-algebraerne generaliserer de givne informations σalgebraer<br />

Fn.<br />

n<br />

∑<br />

i=1<br />

Ma 3 Fτ = Fk, hvis τ ≡ k for et k ∈ N0 ∪ {∞} og for stoptider τ1 og τ2 er<br />

{τ1 ≤ τ2} ∈ Fτ1∧τ2 = Fτ1 ∩Fτ2 , dvs. specielt τ1 ≤ τ2 ⇒ Fτ1<br />

Bevis. Den første påstand overlades til læseren. For B ∈ Fτ1∧τ2 og n ≥ 0 er<br />

1B · 1 {τ1=n} =<br />

τi.<br />

n<br />

∑ 1B · 1 {τ1∧τ2=k} · 1 {τ1=n}<br />

k=0<br />

⊆ Fτ2 .<br />

Fn-målelig, hvilket ifølge Ma 1 viser, at B ∈ Fτ1 og tilsvarende B ∈ Fτ2 . Hvis omvendt<br />

B ∈ Fτ1 ∩Fτ2 viser lighederne for n ≥ 0<br />

1B · 1 {τ1∧τ2=n} = 1B · 1 {τ1=n} · 1 {τ2>n} + 1B · 1 {τ2=n} · 1 {τ1>n} + 1B · 1 {τ1=n} · 1 {τ2=n}<br />

at B ∈ Fτ1∧τ2 . D.v.s. Fτ1∧τ2 = Fτ1 ∩Fτ2 . Resten følger tilsvarende af lighederne<br />

1 {τ1≤τ2} · 1 {τ1∧τ2=n} = 1 {τ1≤τ2} · 1 {τ1=n} = 1 {n≤τ2} · 1 {τ1=n} = 1 {n−1


Ifølge Lemma 5 er X∞ målelig m.h.t.F∞, hvis (Xn)n≥0 er tilpasset. Herefter kan vi uden<br />

problemer definere Xτ for en vilkårlig stoptid τ ved fastsættelsen<br />

Xτ :=<br />

∞<br />

∑ Xn · 1 {τ=n} + X∞ · 1 {τ=∞}.<br />

n=0<br />

Der er tydeligvis tale om en udvidelse af den allerede indførte definition for stoptider med<br />

udelukkende endelige værdier. Endvidere gælder flg. alternative beskrivelse. (Sammenlign<br />

med sektion 7.4 i Hoffmann’s bog.)<br />

<br />

limn Xτ(ω)∧n(ω) hvis denne eksisterer i R<br />

Xτ(ω) :=<br />

0 ellers,<br />

specielt er |Xτ| ≤ liminfn |Xτ∧n|. Xτ er altså ’∞-variablen’ hørende til (Xτ∧n)n≥0 defineret i<br />

hht. Lemma 5. Dette viser derfor flg. udsagn.<br />

Ma 4 Xτ er Fτ-målelig for enhver tilpasset proces (Xn)n≥0.<br />

Bevis. Som allerede vist er Xτ∧n målelig m.h.t. til Fτ∧n for alle n og dermed også Fτ-målelig<br />

for alle n. Påstanden følger derfor umiddelbart af Lemma 5. ♦<br />

Bemærk at med de indførte definitioner gælder for ethvert A ∈ B(R), at<br />

XτA ∈ A på {τA < ∞},<br />

hvor (Xn)n≥n er en tilpasset reel proces og τA den tilhørende Hitting Time til A.<br />

Vi får brug for endnu tre hjælperesultater.<br />

Ma 5 For vilkårlig X ∈ L 1 (P) og stoptid τ gælder for ethvert k ∈ N0 ∪ {∞}<br />

E[X |Fτ] · 1 {τ=k} = E[X |Fk] · 1 {τ=k}.<br />

Bevis. Lad k være givet. Da begge sider ifølge Ma 1 er Fk-målelige, og de ligeledes oplagt<br />

er integrable, er det nok at vise, at de har samme integral over ethvert B ∈ Fk. Men dette<br />

følger af definitionen på betinget middelværdi, da<br />

B ∩ {τ = k} ∈ Fτ ∩Fk for alle B ∈ Fk. ♦<br />

Ma 6 For enhver stoptid τ er Fτ = σ( <br />

nFτ∧n).<br />

Bevis. Inklusionen ⊇ er åbenbar, da Fτ∧n ⊆Fτ for alle n ≥ 0, og den anden fås af identiteten<br />

B =<br />

∞<br />

B ∩ {τ = n} ∪ B ∩ {τ = ∞},<br />

n=0<br />

idet B ∩ {τ = n} ∈ Fτ ∩Fn = Fτ∧n for alle n og alle B ∈ Fτ og<br />

F∞ = B := {B ∈ F∞ |B ∩ {τ = ∞} ∈ σ( <br />

Fτ∧n)}.<br />

200<br />

n


B er nemlig en σ-algebra, som indeholder ethvert Fn, thi for n ≥ 0 og B ∈ Fn er<br />

B ∩ {τ = ∞} =<br />

∞<br />

B ∩ {τ ≥ k} og B ∩ {τ ≥ k} ∈ Fτ∧k for k ≥ n. ♦<br />

k=n<br />

Ma 7 Lad (Xn)n≥0 betegne en tilpasset proces og τ en stoptid, så at Xτ er P-integrabel,<br />

dvs. element i L 1 (P). Da er for enhver stoptid σ<br />

E[Xτ |Fσ] = E[Xτ |Fτ∧σ].<br />

Bevis. Ifølge Ma 3 og Ma 4 er {σ < τ} og Xτ · 1 {τ≤σ} begge Fτ∧σ-målelige. Egenskaber<br />

ved betingede middelværdier viser derfor, at E[Xτ |Fσ] er lig<br />

Xτ · 1 {τ≤σ} + E[Xτ · 1 {σ


Endvidere viser Jensen’s ulighed for betingede middelværdier flg. resultat. Bemærk at da<br />

konvekse funktioner er kontinuerte, er de specielt Borel målelige.<br />

Ma 8 For enhver en reel konveks funktion ϕ : R → R gælder<br />

(Xn,Fn)n≥0 martingal og ϕ(Xn) ∈ L 1 (P) n ≥ 0 ⇒ (ϕ(Xn),Fn)n≥0 submartingal.<br />

Beviset, der beror på at<br />

E[ϕ(Xn+1)|Fn] ≥ ϕ(E[Xn+1 |Fn]) = ϕ(Xn),<br />

afslører, at hvis ϕ er konveks og voksende, så er konklusionen den samme for enhver submartingal<br />

(Xn,Fn)n≥0. Læseren opfordres til at formulere tilsvarende udsagn angående<br />

transformation af supermartingaler med konkave funktioner.<br />

Som det ses, betragtes her kun sub- og supermartingaler bestående af integrable variable,<br />

dvs. elementer i L 1 (P). Det har derfor mening at tale om den tilhørende middelværdifunktion<br />

n ↦→ E[Xn], og det ses let, at denne er voksende for submartingaler, aftagende for supermartingaler<br />

og konstant for martingaler. Ligeledes har det mening at undersøge, om processen er<br />

begrænset i L 1 , dvs. om<br />

supE[|Xn|]<br />

< ∞.<br />

n<br />

Lighederne |x| = 2x + − x = 2x − + x viser i denne sammenhæng, at<br />

E[|Xn|] = 2 · E[X + n ] − E[Xn] ≤ 2 · E[X + n ] − E[X0] n ≥ 0,<br />

hvis (Xn,Fn)n≥0 er en submartingal, og tilsvarende<br />

E[|Xn|] = 2 · E[X − n ]+E[Xn] ≤ 2 · E[X − n ]+E[X0] n ≥ 0,<br />

hvis (Xn,Fn)n≥0 er en supermartingal. Dvs.<br />

og tilsvarende<br />

En submartingal (Xn,Fn)n≥0 er begrænset i L 1 ⇔ supE[X<br />

n<br />

+ n ] < ∞,<br />

en supermartingal (Xn,Fn)n≥0 er begrænset i L 1 ⇔ supE[X<br />

n<br />

− n ] < ∞,<br />

Specielt er enhver ikke-positiv submartingal hhv. enhver ikke-negativ supermartingal begrænset<br />

i L 1 .<br />

I forbindelse med teorien om uafhængige stokastiske variable findes der mange eksempler på<br />

martingaler. Følgende er specielt vigtige. Se Hoffmann sektion 7.6 for yderligere eksempler.<br />

Ma 9 Lad (Xn)n≥0 betegne en følge af uafhængige integrable stokastiske variable. Definer<br />

Sn :=<br />

n<br />

n<br />

∑ Xj, Pn := ∏ Xj og Fn := σ(X0,...,Xn) n ≥ 0.<br />

j=0<br />

j=0<br />

202


Da gælder.<br />

1) (Sn,Fn)n≥0 er en martingal, hvis E[Xn] = 0 for alle n, en submartingal, hvis E[Xn] ≥ 0<br />

for alle n og en supermartingal, hvis E[Xn] ≤ 0 for alle n.<br />

Hvis yderligere Xn’erne alle har middelværdi 0 og endelig varians, er<br />

(S 2 n −<br />

n<br />

∑<br />

j=0<br />

Var(Xj),Fn)n≥0 også en martingal.<br />

2) (Pn,Fn)n≥0 er en martingal, hvis E[Xn] = 1 for alle n. Hvis Xn’erne yderligere er ikke negative,<br />

er (Pn,Fn)n≥0 en submartingal hhv. en supermartingal, hvis E[Xn] ≥ 1 hhv. E[Xn] ≤ 1<br />

for alle n.<br />

Bemærkning. Da det kun udnyttes, at Sn og Pn er Fn-målelige, samt at Xn er uafhængig af<br />

Fn−1, gælder resultatet for ethvert filter med denne egenskab.<br />

En anden vigtig type er de såkaldte Lévy martingaler, dvs. processer på formen<br />

(E[X |Gn],Gn)n≥0,<br />

hvor (Gn)n≥0 er et filter og X et vilkårligt element i L 1 (P). Ifølge Bm 16’ er variablene i<br />

en Lévy martingal uniformt integrable, og vi skal senere se, at enhver unifomt integrabel<br />

martingal omvendt også er en Lévy martingal.<br />

Lad mig også nævne den såkaldte Doob dekomposition. Lad (Xn,Fn)n≥0 være en tilpasset<br />

integrabel proces, dvs. Xn ∈ L 1 (P,Fn) for n ≥ 0. For n ≥ 1 er<br />

Xn = X0 +<br />

n<br />

∑<br />

k=1<br />

ΔXk = X0 +<br />

n<br />

∑<br />

k=1<br />

E[ΔXk |Fk−1]+<br />

n<br />

∑<br />

k=1<br />

(ΔXk − E[ΔXk |Fk−1]),<br />

dvs. dekompositionen Xn = X0 + An + Mn for n ≥ 0, hvor A0 = M0 ≡ 0 og<br />

An =<br />

n<br />

∑ E[ΔXk |Fk−1] og Mn =<br />

k=1<br />

n<br />

∑<br />

k=1<br />

(ΔXk − E[ΔXk |Fk−1])<br />

for n ≥ 1. Processerne (An)n≥0 og (Mn)n≥0 er begge (Fn)n≥0-tilpassede og integrable, og<br />

ved nærmere eftersyn ses, at<br />

dvs.<br />

(Mn,Fn)n≥0 er en martingal og (An)n≥0 en såkaldt (Fn)−predictabel proces,<br />

A0 er F0-målelig og An er Fn−1-målelig for alle n ≥ 1.<br />

Hvis (Xn,Fn)n≥0 er en submartingal og derfor E[ΔXn |Fn−1] ≥ 0 for alle n ≥ 1, er (An)n≥0<br />

en voksende proces, dvs. 0 ≤ An ≤ An+1 P-n.o. for n ≥ 0.<br />

Overvejelserne kan sammenfattes i flg. udsagn:<br />

Doob’s Dekompositionssætning.<br />

Enhver (Fn)n≥0-tilpasset integrabel proces (Xn)n≥0 kan skrives på formen<br />

Xn = Mn + An n ≥ 1 X0 = M0,<br />

203


hvor (Mn,Fn)n≥0 er en martingal og (An)n≥0 en (Fn)-predictabel proces. Fremstillingen er<br />

P-entydig, dvs. P(Mn = ˜Mn) = P(An = Ãn) = 1 for n ≥ 0 for enhver lignende repræsentation<br />

Xn = ˜Mn + Ãn n ≥ 1 X0 = ˜M0,<br />

Hvis (Xn,Fn)n≥0 er en sub - hhv. en supermartingal, er (An)n≥0 hhv.(−An)n≥0 en voksende<br />

integrabel proces.<br />

Lignende overvejelser viser, at hvis (Xn,Fn)n≥0 er en martingal og (Vn)n≥1 en predictabel<br />

proces, hvor Vn er begrænset for alle n, så er<br />

E[Vk · ΔXk |Fk−1] = Vk · E[ΔXk |Fk−1] = 0 for alle k ≥ 1.<br />

Dette giver derfor anledning til flg. resultat.<br />

Martingal Transforms.<br />

Lad (Xn,Fn)n≥0 betegne en martingal og (Vn)n≥0 en (Fn)-predictabel proces, hvor Vn er<br />

begrænset for alle n ≥ 0. Da er (V • Xn,Fn)n≥0 en martingal, hvor<br />

V • Xn := V0 · X0 +<br />

n<br />

∑<br />

k=1<br />

Vk · ΔXk n ≥ 0.<br />

Hvis (Xn,Fn)n≥0 en sub - / supermartingal, er (V •Xn,Fn)n≥0 en proces af samme type, hvis<br />

Vn’erne yderligere er ikke-negative. Processer af typen (V • Xn) omtales i litteraturen under<br />

navnet martingal transforms.<br />

Martingalerne har mange interessante egenskaber, og vi skal i det følgende gennemgå nedenstående<br />

fundamentale resultater. Beviserne er samlet i de efterfølgende afsnit.<br />

Sætning Ma 1. Optional Sampling. (skrabet udgave)<br />

Lad (Xn,Fn)n≥0 betegne en martingal. Den standsede proces (Xτ∧n,Fn)n≥0 er da en martingal<br />

for enhver stoptid τ, og for ethvert par af begrænsede stoptider 0 ≤ σ ≤ τ er Xτ og<br />

Xσ elementer i L 1 (P) og<br />

E[X0] = E[Xσ] = E[Xτ] samt E[Xτ |Fσ] = Xσ P -n.o.<br />

Der gælder tilsvarende resultater for sub - / supermartingaler med = erstattet af det relevante<br />

ulighedstegn. Ifølge Bm 5 og 16 kan første del præciceres som følger.<br />

Korollar Lad (Xn,Fn)n≥0 betegne en sub - / supermartingal, der er begrænset i L 1 (P), da<br />

er (Xτ∧n,Fn)n≥0 for enhver stoptid τ en proces af samme type. For martingaler bevares<br />

uniform integrabilitet ligeledes ved standsning.<br />

Sætning Ma 2. Maksimaluligheder.<br />

Lad (Xn,Fn)n≥0 betegne en submartingal og lad λ > 0 være givet. Da gælder for alle n ≥ 1<br />

λ · P( min<br />

0≤k≤n Xk < −λ) ≤ E[X + n ] − E[X0]<br />

λ · P( max<br />

0≤k≤n Xk > λ) ≤ E[Xn, max<br />

0≤k≤n Xk > λ] ≤ E[X + n ],<br />

204


hvilket ved addition viser, at for alle n ≥ 1 og λ > 0 er<br />

λ · P( max<br />

0≤k≤n |Xk| > λ) ≤ 3 · max<br />

0≤k≤n E[|Xk|].<br />

Den sidste ulighed gælder også for supermartingaler. Lader vi n → ∞ fås derfor<br />

λ · P(sup<br />

k<br />

hvilket leder til flg. korollar.<br />

|Xk| > λ) ≤ 3 · supE[|Xk|]<br />

for λ > 0,<br />

k<br />

Korollar. For enhver L 1 -begrænset sub - eller supermartingal (Xn,Fn)n≥0, specielt enhver<br />

ikke-negativ supermartingal, er<br />

P(sup<br />

k<br />

|Xk| < ∞) = 1.<br />

Ved integration og anvendelse af Fubini’s Sætning kan maksimalulighederne omdannes til<br />

momentuligheder. Et vigtigt eksempel er den såkaldte Doob’s Ulighed. Tilfældet p = 2 er<br />

specielt vigtigt.<br />

Korollar. Doob’s Ulighed.<br />

Lad (Xn,Fn)n≥0 betegne en martingal eller ikke-negativ submartingal. Da gælder for ethvert<br />

p > 1 med tilhørende konjugerede tal q = p/(p − 1), at<br />

og dermed<br />

max<br />

0≤k≤n |Xk|p ≤ q · Xn p for alle n ≥ 0<br />

E[sup |Xn|<br />

n<br />

p ] ≤ q p · sup E[|Xn|<br />

n<br />

p ].<br />

Sætning Ma 3. Opkrydsningsuligheder.<br />

Lad (Xn,Fn)n≥0 betegne en supermartingal. Da gælder<br />

(s − r) · E[U n r,s] ≤ E[(Xn − r) − ] ≤ E[X − n ]+|r|<br />

for alle n ≥ 1 og alle reelle tal r < s, hvor U n r,s er antallet af opkrydsninger over [r,s] i<br />

tidsintervallet [0,n]. Ved brug af Monoton konvergens fås derfor, at<br />

(s − r) · E[sup U<br />

n<br />

n r,s ] ≤ sup E[X<br />

n<br />

− n ]+|r|.<br />

Det totale antal opkrydsninger over [r,s], dvs. Ur,s := sup n U n r,s, er derfor endelig P-n.o., hvis<br />

sup k E[X − k ] < ∞, dvs. hvis processen er begrænset i L1 .<br />

Sætning Ma 4. Martingalkonvergenssætninger.<br />

Lad (Xn,Fn)n≥0 betegne en sub- eller supermartingal. Da eksisterer limn Xn(ω) i R for Pn.a.<br />

ω hvis sup k E[|Xk|] < ∞, og grænsefunktionen er P-integrabel. Udtrykt ved hjælp af X∞<br />

kan dette formuleres som<br />

sup<br />

k<br />

E[|Xk|] < ∞ ⇒ Xn → X∞ P-n.o. og X∞ ∈ L 1 (P).<br />

205


Enhver ikke-negativ supermartingal specielt enhver ikke-negativ martingal konvergerer derfor<br />

P-n.o. Kombineres med Sætning 6 fås endvidere.<br />

Korollar For enhver uniformt integrabel sub- eller supermartingal (Xn,Fn)n≥0 gælder<br />

X∞ ∈ L 1 (P) og Xn → X∞ P-n.o. og i P-middel.<br />

Det er nærliggende at undersøge sammenhængen mellem Xn og E[X∞ |Fn], dvs. undersøge<br />

om martingal- h.h.v. sub- eller supermartingalegenskaben udvider til ’tidspunkt ∞’. Resultatet,<br />

der formuleres som endnu et korollar konvergenssætningen, omtaler kun martingaler<br />

og submartingaler, men der gælder selvfølgeligt et tilsvarende resultat for supermartingaler.<br />

Korollar For enhver submartingal (Xn,Fn)n≥0 gælder<br />

{X + n |n ≥ 1} er uniformt integrabel ⇒ Xn ≤ E[X∞ |Fn] P-n.o. for n ≥ 0,<br />

og hvis (Xn,Fn)n≥0 er en martingal gælder tilsvarende<br />

{Xn |n ≥ 1} er uniformt integrabel ⇒ Xn = E[X∞ |Fn] P-n.o. for n ≥ 0.<br />

Bemærk at sidste del sammen med Bm 16 viser, at mængden af Lévy martingaler er identisk<br />

med mængden af uniformt integrable martingaler.<br />

Det er relevant eksplicit at formulere yderligere to konsekvenser af martingalkonvergenssætningen.<br />

Lévy’s Sætning<br />

For ethvert X ∈ L 1 (P) og ethvert filter (Gn)n≥0 med G∞ := σ( <br />

nGn) konvergerer<br />

E[X |Gn] → E[X |G∞] P-n.o. og i L 1 (P).<br />

D.v.s. E[X |Gn] → X P-n.o. og i L 1 , hvis X er G∞-målelig. Endvidere gælder for enhver (Gn)stoptid<br />

τ, at hvis Xn = E[X |Gn] for n ≥ 0, så er<br />

Xτ = E[X |Gτ] P-n.o.<br />

L p -konvergens. (p > 1)<br />

For enhver martingal (Mn,Fn)n≥0 og ethvert p > 1 gælder :<br />

supE[|Mn|<br />

n<br />

p ] < ∞ ⇔ limMn eksisterer P-n.o. og i L<br />

n p (P).<br />

Sætning Ma 5. Optional Sampling.<br />

Lad (Xn,Fn)n≥0 betegne en martingal og lad σ ≤ τ betegne to stoptider, hvor τ er optional<br />

for (Xn)n≥0. Da er Xτ og Xσ elementer i L 1 (P) og<br />

E[X0] = E[Xσ] = E[Xτ] samt E[Xτ |Fσ] = Xσ P -n.o.<br />

Der gælder et tilsvarende resultat for sub- og supermartingaler med = erstattet af det relevante<br />

ulighedstegn. Optionalitetskravet kan her svækkes lidt, idet det for en submartingal er<br />

nok, at τ er optional for processen (X + n )n≥0, og tilsvarende for en supermartingal nok at τ er<br />

optional for (X − n )n≥0. Specielt har vi derfor flg. korollar.<br />

Korollar Lad (Xn,Fn)n≥0 betegne en ikke-negativ supermartingal. Da er Xτ ∈ L 1 (P) for<br />

enhver stoptid τ, og for ethvert par af stoptider σ ≤ τ gælder<br />

E[X∞] ≤ E[Xτ] ≤ E[Xσ] ≤ E[X0] samt E[Xτ |Fσ] ≤ Xσ P -n.o.<br />

206


Sætning Ma 1 og Ma 2.<br />

Bevis for ætning Ma 1 (submartingal tilfældet). Lad τ betegne en stoptid. Da<br />

|Xτ∧n| ≤<br />

n<br />

n−1<br />

∑ |Xk| og Xτ∧n = ∑ 1 {τ=k}Xk + 1 {τ≥n}Xn<br />

k=0<br />

k=0<br />

er Xτ∧n integrabel og Fn-målelig for alle n ≥ 0. Ligeledes gælder for ethvert n ifølge regnereglerne<br />

for betingede middelværdier, da<br />

at<br />

1 {τ≤n}Xτ = 1 {τ≤n}Xτ∧n og {τ > n} er Fn-målelige,<br />

E[X τ∧(n+1) |Fn] = E[1 {τ≤n}Xτ + 1 {τ>n}Xn+1 |Fn] =<br />

1 {τ≤n}Xτ + 1 {τ>n} · E[Xn+1 |Fn] ≥ 1 {τ≤n}Xτ + 1 {τ>n}Xn = Xτ∧n.<br />

Dette viser den første påstand. Lad dernæst σ og τ betegne to begrænsede stoptider, så at<br />

σ ≤ τ. Der findes altså et helt tal m ≥ 1, så at P(σ ≤ τ ≤ m) = 1. Integrabiliteten af Xτ og<br />

Xσ følger som ovenfor, og ifølge det netop viste er<br />

E[Xτ |Fn] = E[Xτ∧m |Fn] ≥ Xτ∧n P-n.o.<br />

for alle 0 ≤ n ≤ m. Men heraf fås ifølge Ma 5, at<br />

E[Xτ |Fσ] =<br />

m<br />

m<br />

∑ E[Xτ |Fn] · 1 {σ=n} ≥ ∑ Xτ∧n · 1 {σ=n} = Xτ∧σ = Xσ P-n.o..<br />

n=0<br />

n=0<br />

Uligheden E[Xσ] ≤ E[Xτ] følger herefter umiddelbart ved at tage middelværdi på begge sider,<br />

og ved et passende valg af begrænsede stoptider indeholder denne som et specialtilfælde også<br />

uligheden E[X0] ≤ E[Xσ]. ♦<br />

Som en umiddelbar konsekvens ses at for enhver stoptid τ og ethvert n ≥ 0 er<br />

i martingaltilfældet og<br />

Xτ∧n = E[Xn |Fτ∧n]<br />

X + τ∧n ≤ E[X+ n |Fτ∧n]<br />

i submartingaltilfældet. Dette viser ved brug af Bm 16 umiddelbart den formulerede præcisering<br />

af første del af sætningen.<br />

Som en første anvendelse af den viste skrabede udgave af Optional Sampling vises Sætning<br />

Ma 2. Lad derfor (Xn,Fn)n≥0 betegne en submartingal og lad λ > 0 være givet. Definer,<br />

idet inf /0 := ∞,<br />

τ λ := inf{n ≥ 0|Xn > λ} og σ λ := inf{n ≥ 0|Xn < −λ}.<br />

Da (Xn)n≥0 er tilpasset, er τ λ og σ λ stoptider, og for alle n gælder<br />

{ max<br />

0≤k≤n Xk > λ} = {τ λ ≤ n} = {Xτ λ ∧n > λ} ∩ {τ λ ≤ n}<br />

207


og tilsvarende<br />

{ min<br />

0≤k≤n Xk < −λ} = {σ λ ≤ n} = {−Xσ λ ∧n > λ} ∩ {σ λ ≤ n}.<br />

Ifølge den ovenfor viste ’skrabede udgave’ af Optional Sampling gælder derfor for alle n, da<br />

{τ λ ≤ n} ∈ Fτ λ ∧n og tilsvarende {σ λ > n} = {σ λ ≤ n} c ∈ Fσ λ ∧n, at<br />

og tilsvarende<br />

λ · P( max<br />

0≤k≤n Xk<br />

<br />

> λ) = λ · P(τλ ≤ n) = λ dP ≤<br />

{τλ ≤n}<br />

Xτλ ∧n dP<br />

{τλ ≤n}<br />

≤ E[Xτ λ ∧n, τ λ ≤ n] ≤ E[Xn, τ λ ≤ n] ≤ E[X + n ,τ λ ≤ n] ≤ E[X + n ].<br />

λ · P( min<br />

0≤k≤n Xk < −λ) = λ · P(σ λ ≤ n) =<br />

<br />

<br />

λ dP ≤ −Xσλ ∧n dP<br />

{σλ ≤n}<br />

{σλ ≤n}<br />

≤ E[−Xσ λ ∧n, σ λ ≤ n] = E[Xσ λ ∧n, σ λ > n] − E[Xσ λ ∧n]<br />

≤ E[Xn, σ λ > n] − E[Xσ λ ∧n] ≤ E[X + n<br />

] − E[X0].<br />

Da absolutværdien af en martingal er en submartingal, gælder specielt.<br />

Doob’s Ulighed.<br />

Lad (Xn,Fn)n≥0 betegne en martingal. Da gælder for alle λ > 0 og n ≥ 0<br />

λ · P( max<br />

0≤k≤n |Xk| > λ) ≤ E[|Xn|, max<br />

0≤k≤n |Xk| > λ ]<br />

og dermed (se nedenstående momentulighed) for alle p > 1<br />

max<br />

0≤k≤n |Xk|p ≤ p/(p − 1) · Xn p n ≥ 0.<br />

Momentulighed.<br />

Lad X og Y betegne ikke-negative stokastiske variable. Hvis<br />

er<br />

P(X > λ) ≤ E[Y/λ, X > λ ] for alle λ > 0,<br />

E[X p ] 1/p ≤ p/(p − 1) · E[Y p ] 1/p<br />

for alle p > 1.<br />

Bevisskitse. Integrationsformlen for ikke negative integranter viser sammen med Tonelli’s<br />

Sætning at ∞<br />

P(X > λ) · pλ p−1 dλ = E[X p ]<br />

og ∞<br />

0<br />

0<br />

E[Y/λ, X > λ ] · pλ p−1 dλ = p<br />

p − 1 E[X p−1 ·Y ].<br />

Hvoraf uligheden følger ved brug af Hölder’s Ulighed.<br />

208


Sætning Ma 3 og Ma 4.<br />

Bevis for Sætning Ma 3. Lad (Xn,Fn)n≥0 betegne en supermartingal og r < s reelle tal. Da<br />

(Xn)n≥0 er tilpasset, definerer<br />

τ1 := inf{n ≥ 0|Xn < r} og σ1 := inf{n ≥ τ1 |Xn > s}<br />

τk := inf{n ≥ σk−1 |Xn < r} og σk := inf{n ≥ τk |Xn > s} k > 1<br />

stoptider, så at τ1 ≤ σ1 ≤ τ2 ≤ σ2 ≤ ···. Bemærk at σk ≥ k samt at Xτk < r på {τk < ∞} og<br />

tilsvarende Xσk > s på {σk < ∞} og dermed da τk ≤ σk<br />

Xσk − Xτk > s − r på {σk < ∞}.<br />

Herudfra defineres for ethvert n ≥ 1 antallet af opkrydsninger U n r,s over intervallet [r,s] i<br />

tidsrummet {0,1,...n} som<br />

U n r,s := sup{k |σk ≤ n} =<br />

n<br />

∑ 1 {σk≤n},<br />

k=1<br />

hvor sidste lighedstegnet skyldes at σn+1 > n. For ethvert n, k ≥ 1 er<br />

dvs.<br />

og dermed<br />

+<br />

n<br />

∑<br />

k=1<br />

n<br />

1 {τk≤n} = 1 {σk≤n} + 1 {τk≤n


Korollar Lad (Xn,Fn)n≥0 betegne en sub- eller en supermartingal, som er begrænset i<br />

L 1 (P), dvs. sup n E[|Xn|] < ∞. Da er<br />

P(−∞ < liminf<br />

n<br />

dvs. limn Xn(ω) eksisterer i R for P-n.a. ω.<br />

Xn = limsup Xn < ∞) = 1,<br />

n<br />

Bevis. Den simple sammenhæng mellem sub - og supermartingaler viser, at vi uden tab af<br />

generalitet kan antage, at (Xn,Fn)n≥0 er en supermartingal. Da<br />

sup<br />

n<br />

E[|Xn|] < ∞ ⇒ P(sup|Xn|<br />

< ∞) = 1<br />

n<br />

ifølge maksimalulighederne, udestår kun at vise, at lighedstegnet holder P-n.o. Men gælder<br />

dette ikke, eksisterer der, da R er separabel, reelle tal r < s, så at<br />

0 < P(liminf<br />

n<br />

Xn < r < s < limsup<br />

n<br />

Xn) ≤ P(supU<br />

n<br />

n r,s = ∞),<br />

hvilket strider mod Sætning Ma 3, da E[sup nU n r,s ] = supn E[U n r,s ] < ∞. ♦<br />

Bemærkning. Da E[|Xn|] = E[Xn] ≤ E[X0] for en ikke-negativ supermartingal (Xn,Fn)n≥0<br />

er en sådan altid konvergent P-n.o.<br />

Med X∞ defineret på sædvanlig vis, kan det viste formuleres som.<br />

Martingal Konvergenssætningen.<br />

For enhver sub- eller supermartingal (Xn,Fn)n≥0 gælder<br />

sup<br />

k<br />

E[|Xk|] < ∞ ⇒ Xn → X∞ P-n.o. og X∞ ∈ L 1 (P).<br />

Hvis {Xn |n ≥ 0} er uniformt integrabel, er der yderligere konvergens i L 1 (P).<br />

Integrabiliteten følger af Fatou’s Lemma, idet<br />

E[|X∞|] ≤ liminf<br />

n<br />

E[|Xn|] ≤ supE[|Xn|]<br />

< ∞,<br />

n<br />

og konvergensen i L 1 (P) følger dernæst af Sætning 6. Det sidste punkt kan præciseres yderligere.<br />

Korollar For enhver martingal (Xn,Fn)n≥0 gælder<br />

{Xn |n ≥ 0} uniformt integrabel ⇒ Xn = E[X∞ |Fn] P-n.o. n ≥ 0,<br />

og hvis (Xn,Fn)n≥0 er en submartingal gælder<br />

{X + n |n ≥ 0} uniformt integrabel ⇒ Xn ≤ E[X∞ |Fn] P-n.o. n ≥ 0,<br />

Bevis. Da betinget middelværdi er en kontraktion i L 1 (P), har vi<br />

Xk → X∞ i L 1 (P) ⇒ E[Xk |Fn] →k→∞ E[X∞ |Fn] i L 1 (P)<br />

210


for alle n, hvoraf martingaltilfældet umiddelbart følger, da<br />

Xn = E[Xk |Fn] P-n.o. for k ≥ n.<br />

Betragt dernæst submartingaltilfældet. Antagelsen sikrer at sup k E[|Xk|] < ∞ og dermed<br />

Xn → X∞ P-n.o. For ethvert m ≥ 0 konvergerer derfor<br />

Xn ∨(−m) → X∞ ∨(−m) P-n.o.,<br />

og også i L 1 (P), idet {Xn ∨(−m)|n ≥ 0} er uniformt integrabel, da<br />

|Xn ∨(−m)| ≤ X + n<br />

+ m for alle n, m ≥ 0.<br />

Ved fornyet brug af, at betingede middelværdier er kontraktioner i L 1 (P), fås derfor<br />

E[Xk ∨(−m)|Fn] →k→∞ E[X∞ ∨(−m)|Fn] i L 1 (P)<br />

for alle n ≥ 0, og dermed Xn ≤ E[X∞ ∨(−m)|Fn] P-n.o. for alle m ≥ 0, da<br />

Xn ≤ Xn ∨(−m) ≤ E[Xk ∨(−m)|Fn] P-n.o.<br />

for alle n ≤ k. Det ønskede resultat følger nu ved grænseovergang, idet<br />

E[X∞ |Fn] = inf<br />

m≥0 E[X∞ ∨(−m)|Fn] P-n.o.<br />

for ethvert n ≥ 0 ifølge Bm 7. ♦<br />

Konvergenssætningen giver anledning til et par interessante korollarer.<br />

Lévy’s Sætning<br />

For ethvert X ∈ L 1 (P) og ethvert filter (Gn)n≥0 konvergerer<br />

E[X |Gn] → E[X |G∞] P-n.o. og i L 1 (P).<br />

Specielt gælder for enhver (Gn)-stoptid τ, at hvis Xn = E[X |Gn] for n ≥ 0, så er<br />

Xτ = E[X |Gτ] P-n.o.<br />

Bevis. Lad X ∈ L 1 (P) og (Gn)n≥0 være givet. (E[X |Gn],Gn)n≥0 er da en uniform integrabel<br />

martingal, og ifølge martingalkonvergenssætningen findes der derfor et element ˜X ∈ L 1 (P),<br />

som er G∞-målelig, så at<br />

E[X |Gn] → ˜X P-n.o. og i L 1 (P) og E[X |Gn] = E[ ˜X |Gn] P-n.o. n ≥ 0.<br />

For alle n ≥ 0 og alle B ∈ Gn gælder dermed<br />

<br />

<br />

X dP = E[X |Gn]dP =<br />

B<br />

B<br />

B<br />

<br />

E[ ˜X |Gn]dP =<br />

B<br />

˜X dP.<br />

Men ifølge det andet korollar til Proposition 5 viser dette, da <br />

nGn er en algebra, som frembringer<br />

G∞, netop ligheden<br />

˜X = E[X |G∞] P-n.o.<br />

211


og dermed sætningens første del. Da X∞ = E[X |G∞] P-n.o. ifølge det netop viste, fås af<br />

Ma 5, at<br />

Xτ = ∑ Xk · 1 {τ=k} = ∑ E[X |Gk] · 1 {τ=k} = E[X |Gτ]. ♦<br />

k∈N0 ∪{∞}<br />

k∈N0 ∪{∞}<br />

Bemærkning. Da enhver betinget middelværdi er en kontraktion i L 1 (P) kan Levý’s Sætning<br />

suppleres med implikationen<br />

Xn → X i L 1 (P) ⇒ E[Xn |Gn] → E[X |G∞] i L 1 (P).<br />

og der er konvergens P-n.o. og i L 1 (P), hvis Xn → X P-n.o. og sup n |Xn| ∈ L 1 (P).<br />

L p -konvergens. (p > 1)<br />

For enhver martingal (Mn,Fn)n≥0 og ethvert p > 1 gælder :<br />

supE[|Mn|<br />

n<br />

p ] < ∞ ⇔ limMn eksisterer P-n.o. og i L<br />

n p (P).<br />

Bevis. Implikationen ⇐ er en umiddelbar konsekvens af definitionen på L p -konvergens.<br />

Men hvis sup n E[|Mn| p ] < ∞ er {Mn |n ≥ 0} uniformt integrabel, og ifølge martingal konvergenssætningen<br />

findes der derfor et M ∈ L 1 (P,F∞), så at<br />

Ifølge Fatou’s Lemma gælder derfor<br />

dvs. M ∈ L p (P), og da<br />

Mn = E[M |Fn] og Mn → M P-n.o.<br />

E[|M| p ] ≤ liminf<br />

n<br />

E[|Mn| p ] ≤ supE[|Mn|<br />

n<br />

p ] < ∞,<br />

|Mn| p ≤ E[|M| p |Fn] P-n.o. for alle n ≥ 0<br />

ifølge Jensen’s ulighed for betingede middelværdier, har vi alt i alt, at limn Mn eksisterer Pn.o.<br />

og {|Mn| p |n ≥ 0} er uniformt integrabel. L p (P)-konvergensen følger derfor af korollaret<br />

til Sætning 6. ♦<br />

Det netop formulerede resultat gælder generelt ikke for p = 1, men hvis den betragtede<br />

martingal er afsnitsfølgen hørende til en sum af uafhængige centrerede variable, kan man<br />

ved hjælp af korollaret til Ottavianis ulighed vise flg. resultat. Sammenlign med LLN 2.<br />

L 1 -konvergens for summer af uafhængige variable.<br />

For enhver følge (Xi)i≥1 af uafhængige integrable stokastiske variable med tilhørende afsnitssummer<br />

Sn := ∑ n i=1 Xi for n ≥ 1 gælder<br />

lim Sn eksisterer P-n.o. og i L<br />

n 1 (P) ⇔ supE[|Sn|]<br />

< ∞ og limE[Sn] eksisterer.<br />

n<br />

n<br />

Biimplikationen gælder uændret, hvis hvis højresiden erstattes af<br />

supnE[|Sn|] < ∞ og (Sn)n≥1 konvergent i fordeling.<br />

212


Bevis. Kun ⇐ kræver et bevis, og da |E[Sn]| ≤ E[|Sn|] for alle n ses, at under højresidens<br />

antagelser er supn E[|Sn − E[Sn]|] < ∞, og<br />

<br />

(Sn − E[Sn])n =<br />

<br />

n<br />

∑ (Xi − E[Xi])<br />

i=1<br />

dermed en L 1 -begrænset martingal. Ifølge martingalkonvergenssætningen gælder derfor, at<br />

og da<br />

E[sup<br />

n<br />

lim n (Sn − E[Sn]) eksisterer P -n.o.,<br />

|Sn − E[Sn]|] ≤ 6 · supE[|Sn<br />

− E[Sn]|] < ∞<br />

n<br />

ifølge korollar 2 til Ottaviani’s ulighed, er der også konvergens i L 1 (P). Addition af den<br />

konvergente følge (E[Sn])n≥1 giver derfor umiddelbart det første resultat.<br />

Hvis sup n E[|Sn|] < ∞ i stedet suppleres med den anden antagelse, konvergerer<br />

De to funktionsfølger<br />

(Sn)n≥1 og (Sn − E[Sn])n≥1 begge i fordeling.<br />

(ϕSn (t))n≥1 og (e −iE[Sn]t · ϕSn (t))n≥1<br />

konvergerer derfor begge mod en karakteristisk funktion. Men da enhver sådan er kontinuert<br />

og 1 i 0 følger ved division, at<br />

lim n e iE[Sn]t eksisterer for alle t ∈ R.<br />

Men da vi endvidere pr. antagelse ved, at (E[Sn])n≥1 er en begrænset følge, viser et simpelt<br />

delfølge argument, at limn E[Sn] eksisterer i R. Resultatet følger derfor af det ovenstående.♦<br />

Bemærkning. Betragtes den deterministiske og dermed uafhængige følge Xi :≡ (−1) i for<br />

i ≥ 1 ses, at konvergens ikke følger ud fra en antagelse om blot sup n E[|Sn|] < ∞.<br />

213<br />

n


Optionalitet.<br />

Lad i dette afsnit (Fn)n≥0 betegne et filter i F , og lad det være underforstået at udtryk<br />

som tilpassethed og stoptidsegenskab altid er m.h.t.(Fn)n≥0. Endvidere betegner (Yn)n≥0 en<br />

given tilpasset reel proces.<br />

Notation. En stoptid τ siges at være optional for (Yn)n≥0, hvis {Yτ∧n |n ≥ 0} er uniformt<br />

integrabel.<br />

Da den indførte definition af Yτ bevirker, at |Yτ| ≤ liminfn |Yτ∧n| P-n.o., og dermed ifølge<br />

Fatou’s Lemma, at<br />

E[|Yτ|] ≤ liminf<br />

n<br />

E[|Yτ∧n|] ≤ supE[|Yτ∧n|],<br />

n<br />

ses, at integrabilitet af Yτ er en nødvendig betingelse for optionalitet. D.v.s. vi har implkationen<br />

τ optional for (Yn)n≥0 ⇒ Yτ ∈ L 1 (P).<br />

Betingelsen er dog generel ikke tilstrækkelig, og vi vil nedenfor undersøge, hvad der yderligere<br />

skal til. Men inden udnyttes de tidligere viste kriterier for uniform integrabilitet, se<br />

f.eks. øvelsene 16 og 17, Lemma 10 med korollarer, Sætning 6 og Proposition 11, til at liste<br />

en række tilstrækkelige betingelser, som hver især sikrer optionalitet.<br />

Kriterier for optionalitet.<br />

En stoptid τ er optional for (Yn)n≥0 i hver af de følgende fire situationer.<br />

a) Der findes et Y ∈ L 1 (P), så at |Yτ∧n| ≤ Y P-n.o. for alle n ≥ 0, eller ækvivalent hvis<br />

sup n |Yτ∧n| ∈ L 1 (P).<br />

b) For ethvert ε > 0 findes der elementer Mε og (Zε,n)n≥1 i L 1 (P)+, så at<br />

E[Zε,n] ≤ ε og |Yτ∧n| ≤ Mε + Zε,n P-n.o. for alle n ≥ 0.<br />

c) Der findes et α > 1, så at sup n E[|Yτ∧n| α ] < ∞.<br />

d) limnYτ∧n eksisterer i L 1 (P).<br />

Bemærk at Bm 16 og 16" også kan bruges til at vise optionalitet.<br />

a) er opfyldt i flg. to specialtilfælde.<br />

a1) τ begrænset stoptid og Yn’erne integrable; thi er M en konstant, der dominerer τ, gælder<br />

her<br />

|Yτ∧n| ≤<br />

M<br />

∑ |Yk| ∈ L<br />

k=0<br />

1 (P) for alle n ≥ 0.<br />

a2) E[τ] og E[|Y0|] endelige samt |Yn −Yn−1| ≤ M < ∞ P-n.o. for alle n ≥ 1; thi her gælder<br />

Opskrivningerne<br />

τ∧n<br />

|Yτ∧n| ≤ |Y0|+ ∑ |Yk −Yk−1| ≤ |Y0|+M · τ.<br />

k=1<br />

Yτ∧σ∧n = 1 {σ>τ}Yτ∧n + 1 {σ≤τ}Yσ∧n, Y (τ∨σ)∧n = 1 {σ


og dermed |Yτ∧σ∧n|∨|Y (τ∨σ)∧n| ≤ |Yτ∧n|+|Yσ∧n| viser, at mængden af optionale stoptider er<br />

stabil under max og min, dvs.<br />

τ og σ optionale for (Yn)n≥0 ⇒ τ ∧ σ og τ ∨ σ optionale for (Yn)n≥0.<br />

Som allerede nævnt er integrabilitet af Yτ nødvendig for optionalitet af τ, og vi vil nu se<br />

undersøge på, hvad der yderligere skal til. Ligheden<br />

Yτ∧n = 1 {τ>n}Yn + 1 {τ≤n}Yτ<br />

viser, da {τ > n} og {τ ≤ n} er disjunkte, at τ er optional, hvis og kun hvis mængderne<br />

{1 {τ≤n}Yτ | n ≥ 0} og {1 {τ>n}Yn |n ≥ 0}<br />

begge er uniformt integrable. Den første klares let, for da 1 {τ≤n}|Yτ| ↑ 1 {τn}Yτ∧n,<br />

at det netop er opfyldt, hvis {1 {σ≤n}Yσ |n ≥ 0} er uniformt integrabel, dvs. hvis<br />

E[|Yσ|,σ < ∞] < ∞.<br />

Men som allerede bemærket er denne egenskab også nødvendig, og vi har derfor vist.<br />

Opt. 2 Hvis τ er optional for (Yn)n≥0, så gælder for enhver stoptid σ ≤ τ, at<br />

σ er optional for (Yn)n≥0 ⇔ E[|Yσ|,σ < ∞] < ∞.<br />

215


Sætning Ma 5.<br />

Bevis for Sætning Ma 5. Lad (Xn,Fn)n≥0 være en submartingal og 0 ≤ σ ≤ τ stoptider, hvor<br />

τ antages optional for (X + n )n≥0, dvs. {X + τ∧n |n ≥ 0} er uniformt integrabel. Da σ ∧ n ≤ τ ∧ n<br />

viser den ’skrabede udgave’ af Optional Sampling at<br />

Xσ∧n ≤ E[Xτ∧n |Fσ∧n] og dermed X + σ∧n ≤ E[X+ τ∧n |Fσ∧n]<br />

for n ≥ 0, og ifølge Bm 16 er {X + σ∧n |n ≥ 0} derfor uniformt integrabel, dvs. σ er også optional<br />

for (X + n )n≥0. Benyttes martingal konvergenssætningen på de to submartingaler<br />

(Xσ∧n,Fn)n≥0 og (Xτ∧n,Fn)n≥0<br />

fås derfor, at Xσ og Xτ er elementer i L 1 (P) og<br />

Xσ∧n →n→∞ Xσ og Xτ∧n →n→∞ Xτ P-n.o.<br />

Korollaret til martingal konvergenssætningen viser endvidere, at<br />

Xτ∧n ≤ E[Xτ |Fn] P-n.o.<br />

og dermed ifølge den skrabede udgave af Optional Sampling<br />

Xσ∧n ≤ E[Xτ∧n |Fσ∧n] ≤ E[E[Xτ |Fn]|Fσ∧n] = E[Xτ |Fσ∧n].<br />

Som allerede nævnt konvergerer venstresiden her P-n.o. mod Xσ, og da<br />

ifølge Lévy’s Sætning og Ma 6 ses at<br />

E[Xτ |Fσ∧n] →n→∞ E[Xτ |Fσ] P-n.o.,<br />

Xσ ≤ E[Xτ |Fσ] P-n.o.<br />

og dermed også uligheden E[Xσ] ≤ E[Xτ]. ♦<br />

I martingaltilfældet gælder tilsvarende formler blot med lighedstegn overalt. Som en konsekvens<br />

af Ma 7 og det viste resultat har vi flg. korollar.<br />

Korollar. Lad (Xn,Fn)n≥0 være en martingal og τ en stoptid, som er optional for (Xn)n≥0.<br />

Da er<br />

Xσ∧τ = E[Xτ |Fσ] P-n.o.<br />

for enhver stoptid σ, dvs. {Xσ |σ stoptid, σ ≤ τ} er uniformt integrabel.<br />

Hvis (Xn,Fn)n≥0 er en submartingal og τ optional for (X + n )n≥0, gælder tilsvarende<br />

Xσ∧τ ≤ E[Xτ |Fσ] P-n.o.<br />

for enhver stoptid σ, og mængden {X + σ |σ stoptid, σ ≤ τ} er derfor uniformt integrabel.<br />

216


Appendiks F. Resultater fra reel analyse.<br />

I forbindelse med gennemgangen af stoffet får vi brug for nogle få specielle resultater fra reel<br />

analyse. Da de normalt ikke vil være gennemgået i et indledende kursus i reel analyse, og<br />

de ikke naturligt passer ind i teksten, har jeg valgt at samle dem i dette appendiks. Vi starter<br />

med to resultater omhandlende funktionskonvergens dernæst lidt rækketeori for til sidst at<br />

omtale en vigtig egenskab ved den reelle akse.<br />

Weierstrass - Bernstein’s Sætning<br />

Til ethvert f ∈ C(R) findes der en følge af polynomier (Pn)n≥1 så at Pn(x) → f(x) uniformt<br />

for x ∈ [0,1].<br />

Bevis. Lad f ∈ C(R) være givet. Definer for alle n ≥ 1 og x ∈ R<br />

Pn f(x) :=<br />

Bemærk at for alle n ≥ 1 og x ∈ [0,1] er<br />

hvor S x n ∼ bi(n,x), hvor bi(n,0) := δ0. Da<br />

n <br />

n<br />

∑ f(k/n) ·<br />

k<br />

k=0<br />

Pn f(x) = E[ f(S x n /n)]<br />

<br />

· x k ·(1 − x) n−k .<br />

E[S x n /n] = x og Var(Sx x(1 − x)<br />

n /n) = ≤<br />

n<br />

1<br />

4n<br />

fås ved brug af Chebychev’s ulighed, at for alle n ≥ 1, x ∈ [0,1] og ε > 0 er<br />

P(|S x n/n − x| > ε) ≤ (4nε 2 ) −1 .<br />

Dvs. for x ∈ [0,1] har vi for alle n ≥ 1 og ε > 0<br />

hvor<br />

|Pn f(x) − f(x)| = |E[ f(S x n/n) − f(x)]| ≤ E[| f(S x n/n) − f(x)|]<br />

= E[| f(S x n /n) − f(x)|,|Sx n /n − x| > ε ]+E[| f(Sx n /n) − f(x)|,|Sx n /n − x| ≤ ε ]<br />

≤ Mf · P(|S x n/n − x| > ε)+Vf(ε) ≤ M<br />

+Vf(ε),<br />

4nε2 Mf = sup | f(t)| og Vf(ε) = sup{| f(u) − f(v)||u,v ∈ [0,1], |u − v| ≤ ε}.<br />

t∈[0,1]<br />

Men da f er kontinuert og dermed begrænset og uniformt kontinuert på [0,1], dvs.<br />

Mf < ∞ og Vf(ε) →ε→0 0,<br />

følger umiddelbart, at Pn f(x) → f(x) uniformt for x ∈ [0,1]. ♦<br />

217


Helly’s Lemma<br />

Lad (Fn)n≥1 betegne en følge af fordelingsfunktioner. Der findes da en delfølge (σ(n))n≥1<br />

og en højrekontinuert voksende funktion F : R → R, så at 0 ≤ F ≤ 1 og<br />

F σ(n)(x) → F(x) for alle x ∈ CF,<br />

hvor CF betegner mænden af kontinuitetspunkter for F. Dvs. F σ(n) → F punktvis, hvis F er<br />

kontinuert.<br />

Bevis. Da mængden af rationale tal er tællelig, kan vi, da fordelingsfunktioner kun antager<br />

værdier i [0,1], ved successiv udtynding vælge en delfølge (σ(n))n≥1, så at<br />

Definitionen viser umiddelbart, at<br />

for vilkårlige rationale tal r1 < r2. Definer<br />

G(r) := lim n F σ(n)(r) eksisterer for alle r ∈ Q.<br />

0 ≤ G(r1) ≤ G(r2) ≤ 1<br />

F(x) := inf G(r) x ∈ R.<br />

r>x,r∈Q<br />

Ifølge simpel reel analyse er F ikke-aftagende og højrekontinuert samt opfylder uligheden<br />

0 ≤ F ≤ 1. Betragt et x ∈ R. For alle m ≥ 1 og rationale tal r, så at x − 1/m < r < x, har vi<br />

F(x − 1/m) ≤ G(r) = limFσ(n)(r) ≤ liminf<br />

n n<br />

Fσ(n)(x), og dermed F(x−) = supm F(x − 1/m) ≤ liminfn Fσ(n)(x). Tilsvarende gælder for alle rationale<br />

tal r > x, at<br />

limsup Fσ(n)(x) ≤ limFσ(n)(r) = G(r)<br />

n<br />

n<br />

og dermed limsup n F σ(n)(x) ≤ F(x), da F(x) = infr>x,r∈Q G(r) pr. definition. Alt i alt er<br />

F(x−) ≤ liminf<br />

k<br />

Fσ(n)(x) ≤ limsup Fσ(n)(x) ≤ F(x)<br />

n<br />

for alle x ∈ R, hvilket viser den sidste påstand. ♦<br />

I forlængelse af den sidste bemærkning er det værd at nævne flg. resultat.<br />

Hvis (Fn)n≥1 og F er fordelingsfunktioner, og F er kontinuert, gælder<br />

Fn(x) → F(x) for alle x ∈ R ⇒ supx∈R|Fn(x) − F(x)| → 0,<br />

dvs. punktvis konvergens medfører uniform konvergens.<br />

218


Kronecker’s Lemma<br />

Lad (an)n≥1 og (bn)n≥1 betegne reelle talfølger, så at 0 < bn < bn+1 ↑ ∞. Da gælder<br />

∞<br />

∑ an/bn konvergent i R ⇒<br />

n=1<br />

1<br />

bn<br />

n<br />

∑ ai → 0.<br />

i=1<br />

Navnet Kronecker’s Lemma refererer normalt til specialtilfældet bn = n.<br />

Bevis. Sæt<br />

Dvs. rn → 0 og<br />

og dermed for alle n > m ≥ 1<br />

∞<br />

rn = ∑<br />

i=n<br />

ai/bi n ≥ 1.<br />

an = bn(rn − rn+1) = bn−1rn − bnrn+1 + rn(bn − bn−1)<br />

n m<br />

∑ ai = ∑ ai +<br />

n<br />

∑ (bi−1ri − biri+1)+<br />

n<br />

∑<br />

i=1 i=1 i=m+1<br />

i=m+1<br />

=<br />

m<br />

∑ ai +(bmrm+1 − bnrn+1)+<br />

n<br />

∑<br />

i=1<br />

i=m+1<br />

Ved brug af trekantsuligheden fås derfor for n > m ≥ 1<br />

| 1<br />

bn<br />

n<br />

∑ ai | ≤<br />

i=1<br />

1<br />

bn<br />

(<br />

m<br />

∑<br />

i=1<br />

≤ 1<br />

bn<br />

ri(bi − bi−1)<br />

ri(bi − bi−1).<br />

|ai|+sup |ri|((bm + bn)+(bn − bm)))<br />

i>m<br />

m<br />

∑<br />

i=1<br />

|ai|+2sup |ri|.<br />

i>m<br />

For givet ε > 0 bestemmes først m, så at sidste led er mindre end ε/2, og for m fast går første<br />

led mod 0, da bn → ∞. ♦<br />

Vi får yderligere brug for flg. resultat.<br />

Hvis en reel talfølge (an)n≥1 er enten opad eller nedad begrænset, dvs. hvis<br />

så er<br />

hvor<br />

lim n<br />

n<br />

supan<br />

< ∞ eller inf<br />

n<br />

n an > −∞,<br />

1<br />

n ∑ ai = 0 hvis lim<br />

n<br />

i=1<br />

νk(n)<br />

1<br />

νk(n) ∑ ai = 0 for alle k ≥ 1,<br />

i=1<br />

νk(n) := [(1+1/k) n ] for n, k ≥ 1.<br />

Bevis. Antag at an’erne er nedad begrænset. Ved addition med en ikke-negativ konstant M<br />

ses, at vi kan antage, at an’erne er ikke-negative, samt at det nu gælder om at vise konvergens<br />

219


mod M ud fra en antagelse om konvergens mod M. Men dette følger umiddelbart. For lader<br />

vi for ethvert n ≥ 2 og ethvert k νk(ln) være valgt så at<br />

gælder åbenbart<br />

og<br />

1<br />

n<br />

1<br />

n<br />

n<br />

n<br />

∑ ai ≤<br />

i=1<br />

1<br />

νk(ln)<br />

∑ ai ≥<br />

i=1<br />

for alle k og derfor<br />

1<br />

νk(ln + 1)<br />

νk(ln) ≤ n < νk(ln + 1),<br />

νk(ln+1)<br />

∑ ai ≤<br />

i=1<br />

1+1/k<br />

νk(ln + 1)<br />

νk(ln)<br />

∑ ai ≥<br />

i=1<br />

(1+1/k)−1<br />

νk(ln)<br />

1<br />

n<br />

n<br />

∑ ai → M. ♦<br />

i=1<br />

νk(ln+1)<br />

∑ ai → (1+1/k) · M<br />

i=1<br />

νk(ln)<br />

∑ ai → (1+1/k)<br />

i=1<br />

−1 · M,<br />

I forbindelse med det netop viste resultat er det værd at minde om, at for enhver reel, flerdimensional<br />

eller kompleks talfølge (an)n≥1 gælder den vel kendte implikation<br />

an → a ⇒ 1<br />

n<br />

n<br />

∑ ai → a,<br />

i=1<br />

dvs. konvergens i sædvanlig forstand medfører konvergens i Cecaro 1-middel.<br />

Åbne mængder i R<br />

Enhver åben delmængde af den reelle akse er en højst tællelig disjunkt forening af åbne intervaller.<br />

Bevis. Lad G ⊆ R betegne en ikke-tom åben mængde. Idet inf /0 og sup /0 sættes til hhv. ∞<br />

og −∞ defineres for ethvert x ∈ G<br />

xh := inf{y|y > x, y /∈ G} og xv := sup{y|y < x, y /∈ G}.<br />

Da G er åben, og Q er tæt i R, ses let at flg. betingelser er opfyldte for alle x ∈ G:<br />

samt<br />

a) −∞ ≤ xv < x < xh ≤ ∞. b) (xv,xh) ⊆ G. c) Q ∩ G ∩(xv,xh) = /0<br />

d) (xv,xh) ∩(˜xv, ˜xh) = /0 ⇒ (xv,xh) = ( ˜xv, ˜xh) for vilkårlige x, ˜x ∈ G.<br />

Specielt findes der altså for alle x ∈ G et ˜x ∈ Q ∩ G, så at (xv,xh) = ( ˜xv, ˜xh).<br />

Lader vi derfor (x(n))n≥1 betegne en nummerering af Q ∩ G har vi<br />

G = <br />

(xv,xh) =<br />

x∈G<br />

∞<br />

(x(n)v,x(n)h),<br />

n=1<br />

220


og intervallerne er enten sammenfaldende eller disjunkte. Ved udtynding følger derfor, at G<br />

kan skrives som en højst tællelig disjunkt forening af åbne intervaller. ♦<br />

Det er på sin plads at understrege, at resultatet kun gælder i dimension 1. Et ’tilsvarende’<br />

resultat i højere dimensioner, som benyttes i beviset for Transformationssætningen, er flg.<br />

Enhver åben mængde G ⊆ R n kan skrives som en højst tællelig disjunkt foreningsmængde af<br />

’halvåbne’ kasser, dvs. mængder på formen<br />

hvor −∞ < ai < bi < ∞ for i = 1,...,n.<br />

n<br />

∏ ]ai,bi]<br />

i=1<br />

221


Appendiks G.<br />

Fra indledende reel analyse er det velkendt, at for reelle tal (an)n≥1 og a gælder implikationen<br />

an →n→∞ a ⇒ (1+ an<br />

n )n →n→∞ e a .<br />

Men i forbindelse med beviset for den klassiske udgave af Den centrale Grænseværdisætning<br />

udnyttedes, at resultatet også gælder for komplekse tal. Et argument herfor går som følger.<br />

Lad (an)n≥1 og a betegne komplekse tal, så at an →n→∞ a. Ifølge definitionen på konvergens<br />

af komplekse tal har vi derfor<br />

|an| →n→∞ |a|, ℜan →n→∞ ℜa og ℑan →n→∞ ℑa.<br />

Da an/n → 0 gælder derfor fra et vist trin at regne, at<br />

og dermed<br />

1+ an<br />

n<br />

= |1+ an<br />

n | · ei arctanθn hvor θn = ℑan/n<br />

1+ℜan/n ,<br />

(1+ an<br />

n )n = |1+ an<br />

n |n · e in arctanθn .<br />

x ↦→ arctanx betegner her hoveddeterminationen af tan −1 . Da denne er differentiabel i 0 med<br />

differentialkvotient 1 og θn →n→∞ 0, fås derfor, at<br />

n arctanθn = n · θn · arctanθn<br />

θn<br />

Tilsvarende fås ved brug af ovenstående reelle udgave, at<br />

Dvs. alt i alt<br />

|1+ an<br />

n |n = ((1+ℜan/n) 2 +(ℑan/n) 2 ) n/2 <br />

= 1+<br />

=<br />

ℑan arctanθn<br />

· →n→∞ ℑa.<br />

1+ℜan/n θn<br />

<br />

1+ |an| 2 n1/2 <br />

/n+2ℜan<br />

→n→∞ e<br />

n<br />

2ℜa = e ℜa .<br />

|an| 2<br />

n1/2<br />

2ℜan<br />

+ =<br />

n2 n<br />

lim n (1+ an<br />

n )n = lim n |1+ an<br />

n |n · lim n e inarctanθn = e ℜa · e iℑa = e a .<br />

222


INDHOLDSFORTEGNELSE<br />

<strong>Momentproblemet</strong> 139<br />

Den flerdimensionale normalfordeling 142<br />

Maksimal Uligheder 145<br />

De store tals love I 148<br />

De store tals love II 156<br />

Fordelingskonvergens 163<br />

Kriterier for konvergens i fordeling 167<br />

Regneregler for konvergens i fordeling 170<br />

Kontinuitetetssætningen for karakteristiske funktioner 172<br />

Den Centrale Grænseværdisætning 177<br />

Betingede middelværdier 186<br />

Martingaler 197<br />

Appendiks F 217<br />

Appendiks G 222<br />

223

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!