Momentproblemet.

Momentproblemet. 

Lad i dette afsnit X betegne en stokastisk variabel med momenter af enhver orden. Momentfølgen 

(E[X n ])n≥1 er derfor en vel defineret reel talfølge bestemt ved fordelingen, og 

spørgsmålet om, den omvendt bestemmer fordelingen, er kendt under navnet Momentproblemet. 

Korollar 1 i afsnittet Separation af endelige Borel mål viser, at dette gælder for 

begrænsede stokastiske variable, og som det fremgår af det udleverede fordelingskatalog 

gælder det for alle de kendte fordelingstyper med momenter af enhver orden pånær lognormalfordelingen. 

Et sådant eksempel på en vigtig fordelingstype, hvor momentfølgen 

ikke bestemmer fordelingen entydigt, gør det naturligvis interessant at vide, hvornår det er 

tilfældet. Problemet, der er blevet studeret i næsten 100 år, er stadig uløst i den forstand, at 

man endnu ikke er i stand til at formulere en generel nødvendig og tilstrækkelig betingelse 

på momentfølgen, som sikrer, at den bestemmer fordelingen. Men flg. simple tilstrækkelige 

betingelse er ofte brugbar. 

En stokastisk variabel X siges at opfylde (∗), hvis E[e ρ|X| ] < ∞ for et ρ > 0. 

(∗) holder klart, hvis X er begrænset, dvs. hvis P(|X| ≤ M) = 1 for et M ∈ R+, og som 

det fremgår af fordelingskatalogets punkt (H), er den opfyldt for en stor del af de kendte 

fordelingstyper. (∗) medfører klart eksistens af momenter af enhver orden, og da 

E[e r|X| ] = 

∞ 

∑ r 

n=0 

n · E[|X| n ]/n! for alle r > 0 

ifølge monoton konvergens, giver potensrækketeori , at (∗) er ækvivalent med, at 

limsup(E[|X| 

n 

n ]/n!) 1/n < ∞ dvs. ∃ c ∈ R+ : E[|X| n ] ≤ c n · n! n ≥ 1. 

Begrundelsen for at (∗) er interessant ligger, som allerede indikeret, gemt i flg. resultat. 

Mp 1 Antag at X opfylder (∗). Momentfølgen (E[X n ])n≥1 bestemmer da fordelingen for X. 

Bevis. (∗) betyder specielt, at 

lim n ρ n · E[|X| n ]/n! = 0, 

og iIfølge Kf 9 kan ϕX derfor rækkeudvikles omkring ethvert punkt a med en konvergensradius, 

som er mindst ρ. Heraf kan resultatet nu vises, for ved først at rækkeudvikle omkring 

0 ses, da ϕX(0) = 1, at (E[X n ])n≥1 bestemmer ϕX og dermed alle dens afledede i intervallet 

] − ρ,ρ [. Ved fornyet rækkeudvikling omkring punkter tæt ved ρ og −ρ ses derfor, at dette 

også gælder i intervallet ] − 2ρ,2ρ [. Sådan fortsættes og momentfølgen bestemmer derfor 

ϕX og dermed ifølge Entydighedssætningen fordelingsmålet PX. ♦ 

(∗) er en betingelse på de absolutte momenter, men der gælder flg. resultat. 

Mp 2 Lad X og Y være stokastiske variable med momenter af enhver orden, så at E[X k ] = 

E[Y k ] for alle k ≥ 1. Da holder (∗) for X, hvis og kun hvis (∗) holder for Y ; og i givet fald 

er X og Y derfor identisk fordelte. 

139

Bevis. Antag at X opfylder (∗), dvs. ∃c ∈ R+ : E[|X| n ] ≤ cn · n! n ≥ 1. Ifølge Cauchy- 

Schwarz’s gælder derfor 

E[|Y | n 

] ≤ E[Y 2n 

] = E[X 2n 

] ≤ c2n ·(2n)! = c n · (2n)!, 

og da (2n)! ≤ 2 n · n! for alle n ses, at Y også opfylder (∗). ♦ 

Lad fortsat X betegne en given stokastisk variabel. Da 

e aX ∨ e −aX ≤ e a|X| ≤ e aX + e −aX for alle a > 0, 

følger det umiddelbart, at hvis R(LX) := {t ∈ R|E[e tX ] < ∞}, så gælder biimplikationen 

X opfylder (∗) ⇔ R(LX) indeholder et åbent interval omkring 0. 

R(LX) er altid et interval indeholdende 0, men kan bestå af 0 alene eller have 0 som enten 

venstre eller højre endepunkt. Definer 

MX(t) := E[e tX ] for t ∈ R(LX). 

MX(·) kaldes ofte den momentfrembringende funktion. Begrundelsen for dette er klar ud 

fra det ovenstående, for indeholder R(LX) et åbent interval af formen ] − ε,ε [, så har X 

momenter af enhver orden og 

MX(t) = 

∞ E[X 

∑ 

n=1 

n ] 

·t 

n! 

n 

for |t| < ε. 

Ifølge potensrækketeori er t ↦→ MX(t) derfor uendelig ofte differentiabel i 0 med 

Alt i alt viser dette 

M (n) 

X (0) = E[X n ] n ≥ 1. 

Mp 3 Lad X og Y være stokastiske variable. Fordelingen for X er entydig bestemt ved MX, 

hvis denne er endelig i et åbent interval omkring 0, og X og Y er identisk fordelte, hvis 

MX(t) = MY(t) < ∞ for alle t i et åbent interval omkring 0. 

Bemærkning. Da momenterne er bestemt som afledede i punktet 0, kan man forholdsvis 

nemt vise, at det er nok, at R(LX) og R(LY) begge indeholder et åbent interval omkring 0, 

og MX(tn) = MY(tn) for en følge (tn)n≥1, som konvergerer mod 0. 

Et såkaldt ’målskifte’ argument viser, at Mp 3 gælder uændret for ethvert interval, dvs. 

Mp 3a Stokastiske variable X og Y er identisk fordelte, hvis MX(t) = MY(t) < ∞ for alle t i 

et åbent interval. 

’Bevis’. Antag MX(t) = MY(t) < ∞ for alle t ∈]λ1,λ2[, hvor λ1 < λ2. Lad for et λ0 ∈ 

]λ1,λ2[ QX og QY betegne sandsynlighedsmålene på (Ω,F) givet ved 

QX := a · e λ0X dP og QY := a · e λ0Y dP, hvor a −1 = E[e λ0X ] = E[e λ0Y ], 

140

og lad M Q 

X 

og MQ 

Y betegne de momentfrembringende funktioner for X under QX og Y under 

QY . Reglerne for integration med hensyn til afledte mål viser, at M Q 

X 

og MQ 

Y 

er endelige 

og ens i intervallet ]λ1 − λ0,λ2 − λ0[. Da dette interval indeholder 0, følger af Mp 2 at 

QX ◦ X −1 = QY ◦Y −1 . Specielt er 

E[ f(X) · e λ0X ] = a −1 · E QX [ f(X)] = a −1 · E QY [ f(Y)] = E[ f(Y) · e λ0Y ] 

og dermed E[ f(X)] = E[ f(Y)] for alle kontinuerte funktioner f med kompakt støtte, hvilket 

kun er muligt, hvis X og Y har samme fordeling. ♦ 

141

Den flerdimensionale normalfordeling. 

Som en simpel konsekvens af entydighedssætningen og regneregler for karakteristiske funktioner 

genfinder vi flg. vel kendte egenskab ved klassen af en-dimensionale normalfordelinger. 

Hvis X1,...,Xn er uafhængige normalfordelte stokastiske variable, er ∑ n i=1 aiXi igen normalfordelt 

for ethvert valg af reelle konstanter a1,...an. 

Med udgangspunkt heri indføres flg. flerdimensionale fordelingsklasse. 

Definition. En n-dimensional stokastisk vektor X siges at være n-dimensional normalfordelt, 

hvis 

t · X = 

er normalfordelt for alle t = (t1,...,tn) ∈ R n . 

n 

∑ ti Xi 

i=1 

Vælges t som en passende enhedsvektor ses, at alle koordinatvariable i en flerdimensional 

normalfordeling X er en-dimensionale normalfordelinger, dvs. de har både middelværdi og 

varians. Middelværdivektoren og kovariansmatricen 

μX := (E[X1],...,E[Xn]) og σ X := {Cov(Xi,Xj)}1≤i, j≤n 

er derfor vel definerede, og som i det en-dimensionale tilfælde er en n-dimensional normalfordeling 

bestemt ved sin tilhørende middelværdivektor og kovariansmatrice. Der gælder 

nemlig flg. resultat. 

N 1 Hvis X og Y er n-dimensional normalfordelt med μX = μY og σ X = σ Y , så er ϕX = ϕY , 

dvs. X og Y er identiske fordelte. 

Bevis. Lad t ∈ R n være givet. Da t · X og t ·Y begge er normalfordelte stokastiske variable, 

er de identisk fordelte, da 

og 

Dvs. for t ∈ R n er 

E[t · X] = t · μX = t · μY = E[t ·Y] 

Var(t · X) = ∑ ti σ (i, j)t 

X 

j = ∑ ti σ (i, j)t 

Y 

j = Var(t ·Y). 

1≤i, j≤n 

1≤i, j≤n 

ϕX(t) = E[exp(i(t · X))] = E[exp(i(t ·Y))] = ϕY(t), 

hvilket ifølge Entydighedssætningen for karakteristiske funktioner betyder, at X ∼ Y . ♦ 

Det har altså mening, at tale om den n-dimensionale normalfordeling med middelværdi vektor 

μ og kovariansmatrice σ, og vi vil i denne forbindelse skrive 

X ∼ Nn(μ,σ), 

hvis X er n-dimensional normalfordelt med μX = μ og σ X = σ. 

142

Flg. vigtige egenskaber ved flerdimensionale normalfordelinger er nu åbenbare. Som det er 

sædvane bruges ’samme’ notation for den lineære afbildning og den tilhørende matrice udregnet 

i hht. den kanoniske basis. Kovariansmatrice formlen forudsætter, at vektorerne i R n 

opfattes som søjlevektorer. 

N 2 Klassen af flerdimensionale normalfordelinger er stabil under affine transformationer, 

dvs. hvis X ∼ Nn(μ,σ) og T : R n → R m lineær, så er 

Y := y+T(X) ∼ Nm(y+T(μ), T · σ · T t ) 

for ethvert y ∈ R m . Specielt er Y ∼ Nm(y,T · T t ), hvis X ∼ Nn(0,In). 

Bevis. Da enhver linearkombination af koordinaterne i Y er en affin linearkombination af 

koordinaterne i X, er Y m-dimensionalt normalfordelt. Resten følger nu ved beregning af 

den tilhørende middelværdivektor og kovariansmatrice. ♦ 

Entydighedssætningen for karakteristiske funktioner viser sammen med N 1 og N 2 umiddelbart 

flg. karakterisation af den n-dimensionale normalfordeling. 

N 3 

 

X ∼ Nn(μ,σ) ⇔ ϕX(t) = exp i(t · μ) − 1/2 ·t · σ ·t t 

t ∈ R n . 

Dette gør det let at vise, at uafhængighed og ukorellerethed er det samme for simultant 

normal fordelte variable. For ved gentagen anvendelse af Kf 6, dvs. ækvivalensen mellem 

uafhængighed og faktorisering af den karakteristiske funktion, ses flg. resultat at holde. Detaljerne 

overlades til læseren. 

N 4 Hvis Z er en flerdimensional normalfordelt stokastisk vektor, er vilkårlige marginaler 

(Zn1 ,...Znk ) og (Zm1 ,...Zml ) uafhængige hvis og kun hvis 

Cov(Zni ,Zm j ) = 0 for alle i = 1,...,k og j = 1,...,l. 

Hvis X ∼ Nn(μ 1 ,σ 1 ) og Y ∼ Nm(μ 2 ,σ 2 ) er uafhængige, er (X,Y) ∼ Nn+m(μ,σ), hvor 

 

σ 0 

μ = (μ , μ ) og σ = 1 

1 2 0 σ . 

2 

Korollar X = (X1,...Xn) ∼ Nn(0,I n ) hvis og kun hvis X1,...Xn er uafhængige N(0,1)-fordelte 

stokastiske variable. ( I n betegner her n × n enhedsmatricen.) 

Ikke alle men dog de vigtigste flerdimensionale normalfordelinger er absolut kontinuerte. 

Mere præcist gælder. 

N 5 X ∼ Nn(μ,σ) er absolut kontinuert, hvis og kun hvis σ er invertibel, og i givet fald er en 

tæthed givet ved 

1 

x ↦→ 

(2π) n 

exp 

detσ 

− 1 

2 ∑ (xi − μi)σ 

1≤i, j≤n 

−1 

(i, j)(x j − μ j) x ∈ R n . 

143

Bevis. Hvis σ ikke er invertibel, findes der et t ∈ R n \ {0}, så at 

Var(t · X) = t · σ ·t t = 0. 

Der findes derfor en konstant c ∈ R, så t · X = c P-n.o. D.v.s. 

P(X ∈ A(t,c)) = 1, hvor A(t,c) = {x ∈ R n |t · x = c}, 

hvilket er uforeneligt med absolut kontinuitet, da ethvert ægte affint underrum i R n har 

Lebesgue mål 0. 

Hvis omvendt σ er invertibel, kan den ifølge vel kendt teori skrives på formen 

og ifølge N 2 gælder derfor 

σ = T · I n · T t 

for T : R n → R n lineær bijektion, 

X ∼ μ + T(U) hvor U ∼ Nn(0,I n ). 

Resten følger nu som tidligere vist af den lineære transformationssætning, for da koordinatvariablene 

U1,...,Un i U er uafhængige N(0,1)-variable, har U tæthed 

x ↦→ (2π) −n/2 exp(−x 2 /2) = (2π) −n/2 exp(− 1 

2 

n 

∑ 

i=1 

x 2 i 

). ♦ 

Lad mig slutte med uden bevis at nævne flg. resultat angående betingede fordelinger. (Se 

afsnittet om betingede middelværdier for ikke forklaret notation.) Vi betragter kun det to - 

dimensionale tilfælde, men der gælder et helt tilsvarende udsagn i højere dimensioner. 

N 6 Lad (X,Y) være to -dimensionalt normalt fordelt, så at Y ikke er konstant. Da gælder 

for alle y ∈ R, at under det betingede mål givet Y = y, er 

X ∼ N(μX + σX,Y/σ 2 Y ·(y − μY),σ 2 X − σ 2 X,Y/σ 2 Y), 

hvor μX, μY, σ 2 X og σ 2 Y er middelværdi og varians for X og Y , og σX,Y er kovariansen mellem 

dem. 

144

Maksimal Uligheder. 

Ottaviani’s Ulighed. 

Lad X1,...,Xn betegne uafhængige stokastiske variable. Sæt 

Da gælder for alle reelle tal x og y 

Mn = max 

1≤ j≤n |S j| hvor Sk = X1 + ···+Xk 1 ≤ k ≤ n. 

P(Mn > x+y) · min 

1≤ j≤n P(|Sn − S j| ≤ y) ≤ P(|Sn| > x), 

Bevis. Da uligheden er triviel, hvis enten x eller y er negativ, lader vi x,y ≥ 0 være givet. Sæt 

D1 = {|S1| > x+y} og D j = {|S j| > x+y, |S1| ≤ x+y,...,|S j−1| ≤ x+y} j ≥ 2. 

Da D j’erne er disjunkte og {Mn > x+y} = n j=1 D j, er 

P(Mn > x+y) = 

For ethvert j fås endvidere af trekantsuligheden at 

n 

∑ P(D j). 

j=1 

{|S j| > x+y} ⊆ {|Sn|+|Sn − S j| > x+y} ⊆ {|Sn| > x} ∪ {|Sn − S j| > y}. 

Heraf følger, da (X1,...,Xj) og dermed D j og |Sn − S j| er uafhængige, at 

P(Mn > x+y) ≤ 

≤ 

hvoraf resultatet følger, da 

Korollar 1 For alle p > 0 er 

n 

∑ P({|Sn| > x} ∩ D j)+P({|Sn − S j| > y} ∩ D j) 

j=1 

 

n 

∑ P({|Sn| > x} ∩ D j)+P(|Sn − S j| > y) · P(D j) 

j=1 

 

≤ P(|Sn| > x)+ max 

1≤ j≤n P(|Sn − S j| > y) · P(Mn > x+y), 

1 − max 

1≤ j≤n P(|Sn − S j| > y) = min 

1≤ j≤n P(|Sn − S j| ≤ y). 

E[M p n] ≤ 2 p+1 (1+2 p+1 ) · max 

1≤ j≤n E[|S j| p ]. 

Bevis. Lad p > 0 være givet og antag uden tab af generalitet, at 

mn := max 

1≤ j≤n E[|S j| p ] < ∞. 

145

For τ := (2 p+1 · mn) 1/p gælder ifølge Markov’s Ulighed 

P(|Sn − S j| > τ) ≤ E[|Sn − S j| p ]/τ p ≤ 2 p−1 (E[|Sn| p ]+E[|S j| p )/τ p ≤ 2 p · mn/τ p = 1/2 

og dermed 

Dvs. 

min 

1≤ j≤n P(|Sn − S j| ≤ τ) ≥ 1 − 1/2 = 1/2. 

P(Mn > x) = P(Mn > (x − τ)+τ) ≤ 2 · P(|Sn| > x − τ) = 2 · P(|Sn|+τ > x) 

for alle x > 0 og ved integration derfor 

E[M p n ] ≤ 2 · E[(|Sn|+τ) p ] ≤ 2 p · E[|Sn| p + τ p ] ≤ 2 p+1 (1+2 p+1 ) · mn. ♦ 

Hvis Xi’erne yderligere alle har middelværdi 0, og S j og Sn − S j for 1 ≤ j ≤ n derfor er 

uafhængige og centrerede variable, viser uligheden 

E[|Sn − S j| p ] ≤ E[|Sn − S j + S j| p ] = E[|Sn| p ] for 1 ≤ j ≤ n og p ≥ 1 

og et tilsvarende argument, at der gælder 

Korollar 2 Hvis E[Xi] = 0 for alle i ≥ 1 er 

E[M p n ] ≤ 3 · 2p · E[|Sn| p ] for p ≥ 1. 

Det er værd at bemærke, at konstanterne i Korollar 1 og 2 kun afhænger af p. De angivne 

værdier er på ingen måde optimale, dvs. mindst mulige. 

Ottaviani’s Ulighed gælder for alle sæt af uafhængige stokastiske variable, men er variablene 

yderligere symmetriske, dvs. X ∼ −X, gælder med samme notation flg. mere præcise resultat. 

Lévy’s Ulighed. 

Lad X1,...,Xn betegne uafhængige symmetriske stokastiske variable. Da er 

P(Mn > t) ≤ 2 · P(|Sn| > t) for alle t > 0, 

og dermed E[M p n] ≤ 2 · E[|Sn| p ] for alle p > 0. 

Bevis. Lad t > 0 være givet. Sæt igen 

D1 = {|S1| > t} og D j = {|S j| > x,|S1| ≤ t,...,|S j−1| ≤ t} j ≥ 2. 

Da D j’erne er disjunkte gælder som ovenfor 

P(Mn > t) = 

≤ 

n 

∑ P(|S j| > t,Dj) = 

j=1 

n 

∑ P(|Sn + S 

j=1 

j n | > 2t,Dj) 

n 

n 

∑ P(|Sn| > t,Dj)+ ∑ P(|S 

j=1 

j=1 

j n | > t,Dj), 

146

hvor 

S j n := X1 + ···+Xj −(Xj+1 + ···+Xn). 

Men da Xi’erne er symmetriske og uafhængige, er 

og dermed specielt 

Indsættes dette ovenfor fås 

(X1,...,Xn) ∼ (X1,...,Xj,−Xj+1,...,−Xn) for alle j, 

P(|Sn| > t,Dj) = P(|S j n | > t,Dj) for alle j. 

P(Mn > t) ≤ 2 

n 

∑ P(|Sn| > t,Dj) ≤ 2 · P(|Sn| > t). ♦ 

j=1 

147

De store tals love I. 

Betegnelsen De store tals love dækker over et utal af resultater angående den asymptotiske 

opførsel af empiriske gennemsnit, dvs. variable af formen 

1 

n 

n 

∑ Xi eller mere generelt 

i=1 

1 

n 

n 

∑ 

i=1 

(Xi − μi), 

med henblik på konvergens P-n.o. eller i sandsynlighed for n → ∞. (Xn)n≥1 er her en følge 

af stokastiske variable og (μn)n≥1 en reel talfølge. Der findes tilsvarende resultater for 

stokastiske vektorer (X n)n≥1 og vektorer (μ n)n≥1. Hvis Xi’erne har endelig middelværdi, 

vælges μi normalt som middelværdien E[Xi], og der er i denne situation dermed tale om 

normerede centrerede partialsummer. 

Resultaterne opdeles i to kategorier, idet der skelnes mellem stærke og svage love. En stærk 

lov er her et udsagn, der sikrer konvergens P-n.o. i modsætning til en svag lov, som vedrører 

konvergens i sandsynlighed. Da konvergens n.o. som bekendt medfører konvergens 

i sandsynlighed, giver enhver stærk lov anledning til en tilsvarende svag lov. Det absolut 

vigtigste resultat indenfor emnet, hvis historie går helt tilbage til Bernouilli brødrene i 

begyndelsen af 1700 tallet, er flg. klassiske stærke lov ofte omtalt som en af sandsynlighedsteoriens 

tre perler. 

LLN 1 Kolmogorov’s Store tals lov. 

Hvis (Xn)n≥1 er en følge af uafhængige identisk fordelte stokastiske variable med endelig 

middelværdi μ, konvergerer 

1 

n 

n 

∑ Xi → μ P-n.o. og i L 

i=1 

1 (P). 

Da E[Xn] = μ for alle n ≥ 1 kan påstanden ækvivalent formuleres som 

1 

n 

n 

∑ 

i=1 

(Xi − E[Xi]) → 0 P-n.o. og i L 1 (P). 

Resultatet spiller en meget vigtig rolle i sandsynlighedsteorien, da det dukker naturligt op i 

mange sammenhænge. Men det er også af en mere fundamental betydning for den moderne 

sandsynlighedsteori, dvs. Kolmogorov-modellen. For kunne et sådant resultat ikke vises, 

ville modellen simpelt hen være ubrugelig. Endvidere fremhæver det betydningen af det 

indførte middelværdibegreb, for som resultatet viser, konvergerer den empiriske middelværdi 

mod den teoretiske, hvis denne eksisterer, uanset hvilken fordeling der end er tale om. 

I bestræbelserne på at bevise sætningen er der udviklet mange særdeles værdifulde teknikker, 

som udover at tjene deres oprindelige formål har muliggjort mange udvidelser af resultatet. 

Vi skal i det følgende beskæftige os med en lille del af denne omfattende teori, men det er 

vigtigt hele tiden at have ovenstående hovedresultat i tankerne. 

148

Flg. spørgsmål fra den reelle analyse er tydeligvis af interesse : 

Hvornår er limn 1 n 

i=1 

n 

∑ 

ai = 0 for en given reel talfølge (an)n≥1 ?, 

dvs. hvornår konvergerer an → 0 i Cecaro middel ? Som bekendt gælder det, hvis an → 0 i 

sædvanlig forstand, men yderligere to resultater er af interesse i denne forbindelse. ( Se Appendiks 

F for en nøjagtig formulering og et bevis.) Først og fremmest det såkaldte Kronecker 

Lemma, dvs. implikationen 

∞ 

∑ an/bn konvergent i R ⇒ lim 

n 

n=1 

hvor 0 < bn < bn+1 ↑ ∞. Tilfældet bn ≡ n er specielt interessant. 

1 

bn 

n 

∑ ai = 0, 

i=1 

Desuden vises, at hvis an’erne enten er opad eller nedad begrænsede, så er 

lim n 

1 

n 

n 

∑ 

i=1 

ai = 0 hvis lim n 

1 

[λ n [λ 

] 

n ] 

∑ ai = 0 for ethvert λ > 1. 

i=1 

Til senere brug bemærkes, at det her er nok, at konvergensen holder for ethvert af de tællelig 

mange λ’er af formen 1+k −1 for k ≥ 1. 

Med baggrund i dette åbner der sig derfor to mulige bevismetoder for ovenstående sætning. 

Enten kan den omformuleres til et spørgsmål om konvergens i R P-n.o. af den uendelige 

række 

∞ 

eller også kan man først studere 

∑ 

n=1 

1 

n 

(Xn − μ)/n, 

n 

∑ 

i=1 

(Xi − μ) 

langs med hurtigt voksende delfølger af formen ([λ n ])n≥1 for λ > 1, og dernæst herudfra 

forhåbentligt deducere den ønskede konvergens for hele følgen. 

Tilfældet, hvor Xi’erne er uafhængige, er af speciel interesse. I denne forbindelse er det næste 

resultat, som viser, at n.o.-konvergens og konvergens i sandsynlighed er sammenfaldende for 

summer af uafhængige variable, meget vigtigt. 

LLN 2 n.o.-konvergens af summer af uafhængige variable. 

Lad (Zn)n≥1 betegne en følge af uafhængige variable. Da gælder 

∞ 

∑ Zn er summabel P-n.o. ⇔ 

n=1 

hvor ’summabel P-n.o.’ betyder at 

∞ 

∑ Zn konvergent i sandsynlighed, 

n=1 

∞ 

∑ Zn(ω) er konvergent i R for P-n.a. ω. 

n=1 

149

Korollar For uafhængige stokastiske variable (Zn)n≥1 gælder for alle p > 0 

∞ 

∑ Zn konvergent i L 

n=1 

p (P) ⇒ 

∞ 

∑ Zn er summabel P-n.o. 

n=1 

Korollaret, der er interessant, fordi konvergens i L p ofte er simpelt at eftervise, er en umiddelbar 

konsekvens af sætningen, da konvergens i L p medfører konvergens i sandsynlighed. 

Herudfra deduceres uden problemer flg. stærke lov. 

LLN 3 De store tals lov (L2-udgave). Lad (Xn)n≥1 betegne en følge af uafhængige kvadratisk integrable stokastiske variable. Da 

gælder 

∞ 

∑ 

n=1 

Var(Xn)/n 2 < ∞ ⇒ 1 

n 

n 

∑ 

i=1 

(Xi − E[Xi]) → 0 P-n.o. og i L 2 (P). 

Bevis. Uafhængigheden bevirker, at (Xn − E[Xn])n≥1 udgør en orthogonal følge i L 2 , og da 

fås af Pythagoras, mere præcist Lemma 14, at 

∞ 

∑ Var(Xn)/n 

n=1 

2 < ∞ ⇒ 

Xn − E[Xn] 2 2 = Var(Xn) for alle n ≥ 1 

∞ 

∑ 

n=1 

(Xn − E[Xn])/n konvergerer i L 2 (P). 

Konvergensen P-n.o. følger nu af ovenstående korollar samt Kroneckers Lemma, og da 

E[ 

 

1 

n 

n 

∑ 

i=1 

(Xi − μi) 

2 

] = 1 

n 2 

n 

∑ 

i=1 

Var(Xi) 

følger konvergensen i L 2 ligeledes af Kronecker Lemmaet. ♦ 

Bemærkning. Da beviset udnytter begrebet orthogonalitet, er det på ingen måde klart, at 

resultatet kan generaliseres til eksponenter α = 2. Men vi skal senere se, at det dog i et vist 

omfang er muligt. 

Bevis for LLN 2. Sæt for n ≥ 1 Sn = ∑ n i=1 Zi og lad S betegne grænsevariablen, dvs. Sn → S 

i sandsynlighed. Der findes derfor en delfølge (nk)k≥1, så at Snk → S n.o. for k → ∞. Definer 

for k ≥ 1 

Mk := max |Sl − Snk−1 

nk−1 0 og k ≥ 1 

P(Mk > 2ε) ·(1 − max P(|Snk 

nk−1 ε)) ≤ P(|Snk − Snk−1 | > ε). 

Da |Snk − Snk−1 | → 0 P-n.o. er 

#{k ≥ 1||Snk (ω) − Snk−1 (ω)| > ε } < ∞ 

150

for P-n.a. ω, og da |Snk − Snk−1 |’erne er uafhængige, følger derfor af Det andet Borel - Cantelli 

Lemma at 

∞ 

Heraf følger, at 

∞ 

∑ 

k=1 

∑ P(|Snk 

k=1 

− Snk−1 | > ε) < ∞. 

P(Mk > 2ε) < ∞ og dermed P(limsup {Mk > 2ε}) = 0, 

k 

for da Sn → S i sandsynlighed giver trekantsuligheden, at 

og dermed 

1 − max P(|Snk 

nk−1 ε) ≥ 1 − 2 · sup P(|S − Sl| > ε/2) →k→∞ 1 

l>nk−1 

P(Mk > 2ε) ≤ 2P(|Snk − Snk−1 | > ε) for k stor. 

Betragtes de tællelig mange ε på formen 1/n for n ≥ 1 viser, det første Borel - Cantelli 

Lemma derfor, at for P-n.a. ω er 

#{k |Mk(ω) ≥ 2/n} < ∞ for alle n ≥ 1, 

dvs. netop at Mk → 0 P-n.o. For n.a. ω gælder altså at 

Snk (ω) → S(ω) og Mk(ω) → 0 for k → ∞. 

Men heraf følger at liml Sl(ω) = S(ω), for med k(l) bestemt ved n k(l)−1 < l ≤ n k(l) gælder 

for alle l uligheden 

|Sl(ω) − S(ω)| ≤ |Sl(ω) − Sn k(l)−1 (ω)|+|Sn k(l)−1 (ω) − S(ω)| 

≤ M k(l)(ω)+|Sn k(l)−1 (ω) − S(ω)| 

og dermed konvergensen, da k(l) → ∞ for l → ∞. ♦ 

Bevis for LLN 1. Lad (Xn)n≥1 betegne en følge af uafhængige identisk fordelte stokastiske 

variable med endelig middelværdi μ. Vi skal vise, at 

1 

n 

n 

∑ Xi → μ P-n.o. 

i=1 

Som netop vist, findes der et relevant resultat i det kvadratisk integrable tilfælde. Men da vi 

her kun forudsætter integrabilitet, får vi brug for den såkaldte trunkeringsteknik, som består 

i at skrive de enkelte variable som en sum af to i hht. flg. ide: 

Xn = X ′ 

n + ˜Xn hvor X ′ 

n := Xn · 1 [−an,an ](Xn) og ˜Xn := Xn − X ′ 

n = Xn · 1 {|Xn|>an} 

for et passende valg af positive reelle tal an. Da Xn’erne er forudsat integrable er an = n et 

godt valg, idet der da gælder 

∞ 

∑ P( ˜Xn = 0) = 

n=1 

∞ 

∑ P(|Xn| > n) = 

n=1 

151 

∞ 

∑ P(|X1| > n) < ∞. 

n=1

Ved brug af Det første Borel-Cantelli Lemma fås derfor at 

og dermed 

og da 

P(∃n ≥ 1 : ˜Xi = 0 i ≥ n) = 1 

1 

n 

n 

∑ 

i=1 

n 1 

˜Xi 

n ∑ → 0 P-n.o., 

i=1 

Xi = 1 

n 

n 

∑ 

i=1 

X ′ 1 

i + 

n 

n 

∑ ˜Xi, 

i=1 

mangler vi kun at vise, at første led konvergerer P-n.o. mod μ. Hertil bemærkes, at 

Var(X ′ 

n ) ≤ E[X ′ 2 

n ] = E[X 2 n · 1 [−n,n](Xn)] = E[X 2 1 · 1 [−n,n](X1)] = E[X 2 1 ,|X1| ≤ n] 

og at der findes en konstant C ∈ R+, så at 

∞ 

∑ E[X 

n=1 

2 1,|X1| ≤ n]/n 2 = E[X 2 1 · ∑ 1/n 

n,n≥|X1|∨1 

2 ] ≤ C · E[|X1|] < ∞. 

Ifølge LLN 3 gælder derfor, at 

1 

n 

n 

∑ 

i=1 

X ′ 1 

i − 

n 

n 

∑ 

i=1 

E[X ′ 1 

i ] = 

n 

n 

∑ 

i=1 

(X ′ 

i 

hvoraf påstanden følger, da Lebesgue’s Sætning viser, at 

og dermed også 1 

n 

n 

∑ 

i=1 

′ 

− E[X i ]) → 0 P-n.o., 

E[X ′ 

n ] = E[X1 · 1 [−n,n](X1)] →n→∞ μ 

E[X ′ 

i] →n→∞ μ. 

L 1 -konvergensen følger ved at kombinere konvergensen P-n.o. med Sætning 5, da 

{Xn |n ≥ 1} og dermed { 1 n 

n ∑ Xi |n ≥ 1} 

i=1 

er uniformt integrable. ♦ 

Trunkeringsteknikken kan på lignende vis bruges til at vise flg. generalisation af Komogorov’s 

Store tals lov. Bemærk at den ændrede integrabilitetsantagelse afspejler sig i valget af 

trunkeringskonstant. 

152

LLN 4 Marcinkiewicz-Zygmond’s Store tals lov. 

Lad 1 ≤ q < 2 være givet og lad (Yn)n≥1 betegne en følge af uafhængige identisk fordelte 

variable med endelig q’te moment. Idet μ betegner den fælles middelværdi, gælder da 

1 

n 1/q 

n 

∑ 

i=1 

(Yi − μ) → 0 P-n.o. og i L q . 

Bevis. Da q = 1 allerede er klaret, betragter vi et 1 < q < 2, og ved at se på Yn − μ i stedet 

for Yn, kan vi antage, at den fælles middelværdi er lig 0. Skriv 

hvor 

Ifølge Kronecker Lemma vil 

n 

−1/q 

n ∑ 

j=1 

Yj = Y ′ 

j +Y ” j = (Y ′ 

j − E[Y ′ 

j])+Y ” j + E[Y ′ 

j] 

Y ′ 

j = Yj · 1 {|Yj|< j 1/q } og Y ” j = Yj · 1 {|Yj|≥i 1/q } . 

Yj → 0 P-n.o. hvis 

∞ 

∑ 

j=1 

Yj/ j 1/q er P-summabel. 

Det er derfor nok at vise, at flg. tre rækker hver for sig konvergerer P-n.o. 

∞ 

∑ (Y 

j=1 

′ 

j − E[Y ′ 

j]) · j −1/q , 

∞ 

∑ Y 

j=1 

” j · j −1/q og 

∞ 

∑ E[Y 

j=1 

′ 

j] · j −1/q . 

Leddene i den første sum er uafhængige, centrerede og har endelig varians. Ifølge korollaret 

til LLN 2 og Pythagoras er rækken derfor P-summabel, hvis summen af varianserne er 

endelig, dvs. hvis 

∞ 

∑ E[(Y 

j=1 

′ ′ 

j − E[Y j ])2 ] · j −2/q ∞ 

≤ ∑ E[Y 

j=1 

′ 2 

j ] · j −2/q < ∞. 

Men dette gælder, da der findes en konstant rq > 0 kun afhængig af q, så at 

og dermed 

∑ j 

j: j>x 

−2/q ≤ rq x −(2/q−1) 

for alle x > 0 

∞ 

∑ E[Y 

j=1 

′ 2 

j ] · j −2/q = E[Y 2 1 ∑ 

j: j>|Y1| q 

j −2/q ] ≤ rq E[Y 2 1 · |Y1| −q(2/q−1) ] = rq E[|Y1| q ]. 

Konvergensen af række nr. to følger som ovenfor af Borel-Cantelli Lemmaet, for da E[|Y1| q ] 

er endelig, er 

∞ 

∑ P(Y 

j=1 

′′ 

j = 0) = 

∞ 

∑ P(|Yj| ≥ j 

j=1 

1/q ) = 

153 

∞ 

∑ P(|Y1| 

j=1 

q ≥ j) < ∞.

Hvad angår den sidste række bemærkes først, at da Yj’erne har middelværdi 0 er 

dvs. vi skal vise, at 

E[Y ′ 

j ] = −E[Y ” j ] = −E[Yj · 1 {|Yj|≥ j 1/q } ] = −E[Yj · 1 {|Yj| q ≥ j}], 

∞ 

∑ E[|Y1| · 1 {|Y1| 

j=1 

q≥ j}] · j −1/q < ∞. 

Men dette følger af, at der findes endnu en konstant ˜rq kun afhængig af q, så at 

og dermed 

∑ j 

1≤ j≤x 

−1/q ≤ ˜rq x −(1/q−1) 

for alle x > 0 

∞ 

∑ E[|Y1| · 1 {|Y1| 

j=1 

q≥ j}] · j −1/q = E[|Y1| · ∑ 

1≤ j≤|Y1| q 

j −1/q ] ≤ ˜rq E[|Y1| · |Y1| −q(1/q−1) ]. 

Dvs. den betragtede sum er mindre end ˜rq · E[|Y1| q ] og derfor endelig. n.o.-konvergensen er 

hermed vist. Beviset for konvergensen i L q udsættes til senere. ♦ 

I beviset for ovenstående L 2 -udgave af de store tals lov gjorde vi brug af implikationen 

uafhængighed ⇒ ukorrellerethed dvs. orthogonalitet 

I det næste resultat tages i stedet udgangspunkt i ukorrellerethed. 

LLN 5 De store tals lov (L2-udgave, supplement). 

Lad (Xn)n≥1 betegne en følge af ukorrellerede kvadratisk integrable stokastiske variable så 

at 

∞ 

∑ Var(Xn)/n 

n=1 

2 < ∞ 

Sæt for n ≥ 1 ˆXn = 1 n 

n 

∑ 

i=1 

(Xi − E[Xi]). Da gælder 

1) ˆXn → 0 i sandsynlighed og L 2 (P). 

2) ˆX [λ n ] → 0 P-n.o. for λ > 1. 

3) ˆXn → 0 P-n.o. hvis sup n (Xn(ω) − E[Xn]) < ∞ eller infn(Xn(ω) − E[Xn]) > −∞ 

for P-n.a. ω. 

Betingelsen i 3) er specielt opfyldt, hvis Xn’erne er ikke negative og sup n E[Xn] < ∞. 

Bevis. For nemheds skyld skrives μn i stedet for E[Xn]. Da (Xn − μn)n≥1 pr. antagelse er 

parvis orthogonale i L 2 (P) fås for ethvert n ≥ 1 af Pythagoras, at 

E[ ˆX 2 1 

n ] = 

n2 n 

∑ E[(Xj − μ j) 

j=1 

2 ] = 1 

n2 154 

n 

∑ 

j=1 

Var(Xj) →n→∞ 0,

hvor konvergensen følger af antagelsen og Kronecker Lemmaet. Dvs. ˆXn → 0 i L 2 (P) og 

dermed også i sandsynlighed. 

For ethvert λ > 1 har vi tilsvarende, da [λ n ] ≤ λ n ≤ 2[λ n ], at 

= 

 

∞ 

∑ 

j=1 

∞ 

∑ E[ ˆX 

n=1 

2 

[λ n ∞ 1 

] ] = ∑ 

n=1 [λ n ] 2 

[λ n ] 

∑ 

j=1 

Var(Xj) 

∞ 

∑ 

n:[λ n ]≥ j 

1 

[λ n ] 2 

 

≤ C λ 

Var(Xj) 

∞ 

∑ 

j=1 

Var(Xj)/ j 2 < ∞, 

hvor C λ er en konstant kun afhængig af λ. Dvs. for ethvert λ > 1 er 

E[ 

∞ 

∑ 

n=1 

ˆX 2 

[λ n ] ] < ∞ og dermed 

∞ 

∑ ˆX 

n=1 

2 

[λ n ] < ∞ P-n.o., 

hvoraf 2) let følger, da leddene i en konvergent række går mod 0. 

Ifølge 2) er 

hvor 

P( ˆX νk(n) → 0 for alle k ≥ 1) = 1, 

νk(n) = [(1+k −1 ) n ] for alle n,k ≥ 1. 

Kombineres dette med antagelserne gælder derfor for P-n.a. ω, at 

samt 

lim n 

ˆX νk(n)(ω) = 0 for alle k ≥ 1 

−∞ < inf(Xj(ω) 

− μ j) eller sup(Xj(ω) 

− μ j) < ∞, 

j 

og derfor som tidligere nævnt, se , at limn ˆXn = 0 P-n.o. ♦ 

Ved at udnytte LLN 5 punkt 3) kan man, se Hoffmann sektionerne 4.11 og 4.12, vise, at Kolmogorov’s 

store tals lov stadig gælder, selvom uafhængighed erstattes med parvis uafhængighed. 

Men da denne generalisation yderst sjældent er interessant, vil vi lade den ligge. 

Lad mig til slut uden bevis nævne flg. supplement til LLN 5. Notationen er som ovenfor. 

Rademacher - Mensov’s Store tals lov. 

Lad (Xn)n≥1 betegne en følge af ukorrellerede kvadratisk integrable stokastiske variable. Da 

gælder 

dvs. specielt 

∞ 

∑ log 

n=1 

2 n ·Var(Xn) < ∞ ⇒ 

∞ 

∑ 

n=1 

j 

(Xn − E[Xn]) summabel P-n.o. 

∞ log 

∑ 

n=1 

2 n 

n2 ·Var(Xn) < ∞ ⇒ ˆXn → 0 P-n.o. 

155

De store tals love II. 

Som allerede nævnt adskiller eksponenten 2 sig fra andre eksponenter. Men som vi nu 

skal se, kan man i det uafhængige tilfælde ved hjælp af den såkaldte symmetriseringsteknik 

alligevel vise lignende resultater for alle eksponenter α > 0. 

En væsentlig brik i teorien er flg. resultat normalt kaldet Khinchine’s Ulighed: 

LLN 6 Khinchine’s Ulighed. 

Lad (εi)i≥1 betegne en følge af uafhængige Bernoulli variable, dvs. 

P(εi = −1) = P(εi = 1) = 1/2 for alle i ≥ 1 

Da findes der for α > 0 positive konstanter cα og Cα kun afhængig af α, så at 

cα ·( 

n 

∑ b 

j=1 

2 j )α/2 ≤ E[| 

for alle n ≥ 1 og alle reelle talfølger (b j) j≥1. 

n 

∑ b j · ε j| 

j=1 

α ] ≤ Cα ·( 

n 

∑ b 

j=1 

2 j )α/2 

Bevis del I. Ifølge Jensen’s ulighed er α ↦→ E[|∑ n j=1 b j · ε j| α ] 1/α voksende for ethvert n ≥ 1 

og alle reelle talfølger (bn)n≥1, og da 

ses, at 

og 

E[| 

( 

E[| 

n 

∑ b j · ε j| 

j=1 

α ] ≤ E[| 

n 

∑ b 

j=1 

2 j )α/2 = E[| 

n 

∑ b j · ε j| 

j=1 

2 2 n 

] = E[ ∑ b j · ε j ] = 

j=1 

n 

∑ b j · ε j| 

j=1 

2 ] α/2 = ( 

n 

∑ b j · ε j| 

j=1 

2 ] α/2 ≤ E[| 

n 

∑ b 

j=1 

2 j 

n 

∑ b 

j=1 

2 j ) α/2 

for α ≤ 2 

n 

∑ b j · ε j| 

j=1 

α ] for α ≥ 2. 

1 kan altså bruges som Cα for 0 < α ≤ 2 og som cα for α ≥ 2, og følgen (b j) j≥1 = 

(1,0,...,0,...) viser, at begge konstanter er optimale. ♦ 

De resterende tilfælde er tæt forbundne, for er Cα bestemt for α > 2, gælder ifølge Cauchy- 

Schwarz’s Ulighed for 0 < α < 2, at 

E[| 

n 

∑ b 

j=1 

2 j = E[| 

n 

∑ b j · ε j| 

j=1 

4−α ] 1/2 · E[| 

som efter forkortning viser, at 

n 

∑ b j · ε j| 

j=1 

2 ] = E[| 

( 

n 

∑ 

j=1 

n 

∑ b j · ε j| 

j=1 

2−α/2 · | 

n 

∑ b j · ε j| 

j=1 

α ] 1/2 ≤ C 1/2 

4−α ·( 

b 2 j )α/4 ≤ C −1/2 

4−α · E[| 

156 

n 

∑ b j · ε j| 

j=1 

α/2 ] ≤ 

n 

∑ b 

j=1 

2 j )1−α/4 · E[| 

n 

∑ b j · ε j| 

j=1 

α ] 1/2 . 

n 

∑ b j · ε j| 

j=1 

α ] 1/2 ,

D.v.s.C −1 

4−α kan bruges som cα i intervallet 0 < α < 2. Bestemmelsen af Cα for α > 2 er 

mere kompliceret, specielt er bestemmelsen af den optimale værdi, dvs. den mindst mulige, 

yderst vanskeligt. Hoffmann viser i sektion 4.30, at Cα = 2 α/2 · α · Γ(α/2) kan bruges. 

Denne konstant er ikke optimal ligesom den, vi nu vil bestemme ved brug af teorien om 

betingede middelværdier. 

Bevis del II. Lad α > 2 og n ≥ 1 være givet og lad U1,...,Un betegne uafhængige N(0,1)fordelte 

stokastiske variable. Definer 

n 

Bi := σ({Ui > 0}) i = 1,...,n og B := σ( Bi). 

i=1 

Ifølge regneregler for betingede middelværdier gælder for ethvert i, da Ui’erne er symmetriske 

og P(Ui > 0) derfor lig 1/2 for alle i, at 

hvor 

D.v.s. 

E[Ui |B] = E[Ui |Bi] = ρ ·(1 {Ui>0} − 1 {Ui≤0}) P-n.o., 

ρ = 2 · E[Ui |Ui > 0] = −2 · E[Ui |Ui ≤ 0] = 2/π. 

E[U1 |B]/ρ,...,E[Un |B]/ρ er uafhængige Bernoulli variable, 

og for ethvert valg af konstanter b1,...,bn gælder derfor 

D.v.s. 

ρ α · E[| 

≤ E[| 

n 

∑ b j · ε j| 

j=1 

α ] = E[| 

n 

∑ b j · Xj| 

j=1 

α ] = E[|N(0, 

n 

∑ b j · E[Uj |B]| 

j=1 

α ] = E[|E[ 

n 

∑ b 

j=1 

2 j )|α ] = ( 

n 

∑ b j ·Uj |B]| 

j=1 

α ] 

n 

∑ b 

j=1 

2 j )α/2 · E[|N(0,1)| α ]. 

Cα := ρ −α · E[|N(0,1)| α ] = π (α−1)/2 · Γ((α + 1)/2) 

er en mulig konstant. ♦ 

Flg. to korollarer er nu umiddelbare konsekvenser af Khinchine’s Ulighed. 

Korollar 1 Lad Z1,...,Zn betegne uafhængige symmetriske stokastiske variable. Da gælder 

for ethvert α > 0 

E[| 

n 

∑ Zk| 

k=1 

α n 

] ≤ Cα · E[( ∑ |Zk| 

k=1 

2 ) α/2 n 

β(α) 

] ≤ Cα · n ∑ E[|Zk| 

k=1 

α ], 

hvor Cα er konstanten fra Khinchine’s ulighed, og β(α) = (α/2 − 1) + , dvs. β(α) = 0 for 

0 < α ≤ 2 og β(α) = α/2 − 1 for α > 2. 

Bevis. Lad α > 0 være givet og lad ε1,...,εn betegne uafhængige Bernoulli variable, så at 

157

(Z1,...,Zn) og (ε1,...,εn) er uafhængige. εiZi’erne er da uafhængige, og da Zi ∼ εiZi, da Zi 

er symmetrisk, er 

(Z1,...,Zn) ∼ (ε1Z1,...,εnZn). 

Sættes 

Hα(a1,...,an) = E[| 

n 

∑ 

k=1 

εk ak| α ] for a1,...,an ∈ R 

følger ved brug af Fubini’s Sætning, nærmere bestemt Ua 5, at 

E[| 

n 

∑ 

k=1 

Zk| α ] = E[| 

n 

∑ 

k=1 

εkZk| α ] = E[Hα(Z1,...,Zn)]. 

Men ifølge Khinchine’s Ulighed er Hα(a1,...,an) ≤ Cα ·( 

E[| 

n 

∑ Zk| 

k=1 

α n 

] ≤ Cα · E[( ∑ |Zk| 

k=1 

2 ) α/2 ]. 

n 

∑ a 

k=1 

2 k )α/2 og derfor 

Den sidste ulighed følger nu ved for 0 < α ≤ 2 at udnytte, at x ↦→ x α/2 er subadditiv og 

voksende på R+, og for α > 2 at benytte flg. konsekvens af Jensen’s Ulighed 

( 

n 

∑ 

k=1 

|xk|) α n 

α−1 

≤ n ∑ |xk| 

k=1 

α 

x1,...,xn ∈ R. ♦ 

Bemærkning. Nærlæses Korollar 1 ses, at antagelsen om Zi’erne kan svækkes til, at de 2 n 

stokastiske vektorer (±Z1,...,±Zn) har samme fordeling dvs. 

Man udtrykker ofte dette ved at sige, at 

(Z1,...,Zn) ∼ (±Z1,...,±Zn). 

Z = (Z1,...,Zn) er symmetrisk i R n . 

Ved brug af Korollar 2 til Ua 5 kan vi nu udvide ovenstående ulighed til generelle uafhængige 

variable. Konstanterne Cα og β(α) er de samme som i Korollar 1. 

Korollar 2 Lad Z1,...,Zn betegne uafhængige stokastiske variable med endelig middelværdi 

μk for k = 1,...,n. Da gælder for ethvert α > 0 

E[| 

n 

∑ 

k=1 

∑ 

k=1 

(Zk − μk)| α ] ≤ 2 α n 

β(α) 

·Cα · n 

E[|Zk − μk| α ]. 

Bevis. Da uligheden er triviel for α ≤ 1, idet x ↦→ x α er voksende og subadditiv på R+, 

betragtes et α > 1. Lad Y1,...,Yn være en uafhængig kopi af Z1,...,Zn, dvs. 

(Y1,...,Yn) og (Z1,...,Zn) er uafhængige og identisk fordelte. 

158

Da Z1 −Y1,...,Zn −Yn derfor er uafhængige og symmetriske, fås af Korollar 1 

E[| 

n 

∑ 

k=1 

Men da Zk ∼ Yk for alle k ≥ 1 og dermed 

(Zk −Yk)| α n 

β(α) 

] ≤ Cα · n ∑ 

k=1 

E[|Zk −Yk| α ]. 

E[|Zk −Yk| α ] ≤ 2 α−1 ·(E[|Zk − μk| α ]+E[|Yk − μk| α ]) = 2 α · E[|Zk − μk| α ], 

følger påstanden af det ovenfor nævnte korollar til Ua 5, idet 

E[| 

n 

∑ 

k=1 

(Zk −Yk)| α ] = E[| 

n 

∑ 

k=1 

(Zk − μk) − 

n 

∑ 

k=1 

(Yk − μk)| α ] ≥ E[| 

n 

∑ 

k=1 

(Zk − μk)| α ], 

n 

da α > 1 og ∑ (Yk − μk) har middelværdi 0. ♦ 

k=1 

For at kunne udvide de store tals lov til et generelt α > 0 udledes først flg. Lα-konvergens resultat for summer af uafhængige stokastiske variable. Da resultatet er en simpel konsekvens 

af Korollar 2, formuleres det som endnu et korollar. Cα og β(α) er som ovenfor. 

Korollar 3 Lad (Xn)n≥1 betegne uafhængige stokastiske variable med endelig middelværdi 

μn for n ≥ 1. Da gælder for ethvert 0 < α ≤ 2, at 

og for alle α > 0, at 

∞ 

∑ E[|Xn − μn| 

n=1 

α ] < ∞ ⇒ 

∞ 

∑ 

n=1 

(Xn − μn) eksisterer i L α , 

∞ 

∑ E[|Xn − μn| 

n=1 

α ]/n α−β(α) < ∞ ⇒ 1 n 

n ∑ (Xk − μk) → 0 i L 

k=1 

α . 

Bevis. Hvad angår det første resultat, er det nok at vise, at afsnitsfølgen er en Cauchy følge 

i L α . Men dette følger af antagelsen og Korollar 2, idet denne viser, at for 0 < α ≤ 2 er 

E[| 

m 

∑ 

k=n 

(Xk − μk)| α ] ≤ 2 α Cα 

m 

∑ 

k=n 

E[|Xk − μk| α ] 

for alle 1 ≤ n ≤ m. Ifølge Korollar 2 gælder endvidere for alle n ≥ 1, at 

E[| 1 

n 

n 

∑(Xk 

− μk)| 

k=1 

α ] ≤ 2α Cα 

n α · n 

∑ 

k=1 

β(α) n 

E[|Xk − μk| α ] = 2α Cα 

n α−β(α) 

n 

∑ E[|Xk − μk| 

k=1 

α ], 

hvoraf det andet resultat umiddelbart fås ved brug af Kronecker’s lemma. ♦ 

Vi kan nu formulere og bevise en generel L α -version af de store tals lov. For α < 2 er der 

tale om en direkte oversættelse af L 2 -udgaven, hvorimod momentbetingelsen er en anden 

for α > 2. 

159

LLN 7 De store tals lov (L α -udgave). 

Lad (Xn)n≥1 betegne en følge af uafhængige stokastiske variable med endelig middelværdi 

μn for n ≥ 1. Da gælder for α ≤ 2 

og for α > 2 

∞ 

∑ 

n=1 

∞ 

∑ E[|Xn − μn| 

n=1 

α ]/n α < ∞ ⇒ 1 

n 

n 

∑ 

i=1 

E[|Xn − μn| α ]/n (1+α/2) < ∞ ⇒ 1 

n 

Bevis. Lad α ≤ 2 være givet. Ifølge Korollar 3 punkt 1 har vi 

∞ 

∑ E[|Xn − μn| 

n=1 

α ]/n α < ∞ ⇒ 

∞ 

∑ 

n=1 

(Xi − μi) → 0 P-n.o. og i L α (P). 

n 

∑ 

i=1 

(Xi − μi) → 0 P-n.o. og i L α (P). 

(Xn − μn)/n konvergent i L α . 

Rækken konvergerer derfor også P-n.o. ifølge korollaret LLN 2, og Kronecker Lemmaet 

giver derfor umiddelbart, at 

ˆXn := 1 

n 

n 

∑ 

k=1 

(Xk − μk) → 0 P-n.o. 

Anden del i Korollar 3 sikrer, at ˆXn → 0 i L α , og tilfældet α ≤ 2 er dermed klaret. 

Betragt dernæst et α > 2. L α -konvergensen af ( ˆXn)n≥1 følger igen af Korollar 3. Hvad angår 

konvergensen P-n.o. udnyttes som i beviset for LLN 2, at det er nok at vise, at ˆX2 n → 0 og 

Mn → 0 P-n.o., hvor 

Mn := max 

2n

Men ifølge Korollaret til Ottaviani’s Ulighed er dette tilfældet, hvis 

∞ 

∑ 

n=1 

og dermed ifølge Korollar 2 hvis 

1 

· E[| 

2nα ∞ 2 

∑ 

n=1 

n(α/2−1) 

2nα Men dette er netop antagelsen, da 

∞ 

∑ 

n=1 

1 

2 n(α/2+1) 

2n+1 ∑ 

j=2n (Xj − μ j)| 

+1 

α ] < ∞, 

2n+1 ∑ 

j=2n E[|Xj − μ j| 

+1 

α ] < ∞. 

2n+1 ∑ 

j=2n E[|Xj − μ j| 

+1 

α ∞ 

1+α/2 

] ≤ 2 ∑ E[|Xj − μ j| 

j=1 

α ]/ j 1+α/2 < ∞. ♦ 

Symmetrisering sikrer også den postulerede men ikke viste L q -konvergens i Marcinkiewicz- 

Zygmond’s Store tals lov. 

Thi lad for 1 < q < 2 situationen være som i LLN 4. Først reduceres til det symmetriske 

tilfælde. For hvis ( ˜Yj) j≥1 er en uafhængig kopi af (Yj) j≥1, dvs. 

(Yj) j≥1 og ( ˜Yj) j≥1 uafhængige og (Yj) j≥1 ∼ ( ˜Yj) j≥1 

og dermed Yj ∼ ˜Yj j ≥ 1 og ˜Yj’erne uafhængige, fås af korollaret til Ua 5, at 

da q > 1 og 

E[| 1 

n 1/q 

n 

∑ 

j=1 

Yj| q ] ≤ E[| 1 

n 1/q 

n 

∑ Yj − 

j=1 

1 

n1/q E[ 1 

n 1/q 

n 

∑ ˜Yj| 

j=1 

q ] = E[| 1 

n1/q n 

∑ ˜Y ] = 0. 

j=1 

n 

∑ 

j=1 

(Yj − ˜Yj)| q ], 

Da (Yj − ˜Yj) j≥1’erne er uafhængige, symmetriske og identisk fordelte, er det derfor, hvad 

konvergens i q-middel angår, nok at betragte det symmetriske tilfælde. Vi vil derfor i det 

videre forløb yderligere antage, at Yi’erne er symmetriske. 

Betragt for et givet k ≥ 1 opsplitningen 

Yi = Y ′ ′′ 

k,i +Y k,i 

hvor Y ′ 

k,i := Yi · 1 {|Yi|≤k} og Y ′′ 

k,i := Yi · 1 {|Yi|>k}. 

De to følger (Y ′ 

k,i )i≥1 og (Y ′′ 

k,i )i≥1 består begge af uafhængige, symmetriske og identisk 

fordelte stokastiske variable. Ifølge Korollar 2 ovenfor findes der derfor en konstant C kun 

afhængig af q, så at 

E[| 1 

n 1/q 

n 

∑ 

j=1 

Y ′′ 

k, j |q ] ≤ C · E[|Y ′′ 

k,1 |q ] = C · E[|Y1| q , |Y1| > k], 

161

og 

supE[| 

n 

1 

n1/q n 

∑ 

j=1 

Y ′′ 

k, j |q ] 

kan dermed gøres så lille som ønsket ved at vælge k stor nok. L q -konvergensen vil derfor 

være vist, hvis vi for givet k kan vise, at 

lim n E[| 1 

n 1/q 

n 

∑ 

j=1 

Y ′ 

k, j |q ] = lim n E[| 1 

n 1/q 

n 

∑ Yj · 1 {|Yj|≤k}| 

j=1 

q ] = 0. 

Men da q < 2 er det nok at vise konvergens i L 2 , hvilket følger af Pythagoras, for da summanderne 

for ethvert k ≥ 1 er uafhængige centrede kvadratisk integrable variable, gælder 

E[| 1 

n 1/q 

n 

∑ Yj · 1 {|Yj|

Fordelingskonvergens. 

Lad i det følgende (S,d) betegne et separabelt metrisk rum. Læseren anbefales her at tænke 

på R n n ≥ 1 eller mere generelt delmængder heraf udstyret med den euklidiske metrik. Lad 

endvidere (Xn)n≥1 og X betegne stokastiske funktioner med værdier i S, dvs.(F,B(S))målelige 

funktioner fra Ω ind i S, hvor (Ω,F,P) er et sandsynlighedsfelt, hvorpå alle omtalte 

variable tænkes defineret. I analogi med det reelle tilfælde indføres flg. konvergensbegreb. 

Definition. Xn → X i sandsynlighed hvis limn P(d(Xn,X) > ε) = 0 for ε > 0. 

Bemærkning. Separabiliteten af S sikrer at B(S × S) = B(S) ⊗B(S), og da (x,y) ↦→ d(x,y) 

er kontinuiert, er d(Xn,X) dermed en reel stokastisk variabel for ethvert n ≥ 1. Mængderne 

{d(Xn,X) > ε} er derfor hændelser og kan som sådan tilordnes en sandsynlighed. 

Hvis S = R er betingelsen for konvergens i sandsynlighed den vel kendte 

lim n P(|Xn − X| > ε) = 0 for alle ε > 0, 

hvilket, som vist i Lemma 12, er ækvivalent med at limn E[|Xn − X| ∧ 1] = 0. Denne ækvivalens 

generaliserer uden ændringer til det almene tilfælde, idet 

Xn → X i sandsynlighed ⇔ d(Xn,X) → 0 i sandsynlighed ⇔ lim n E[d(Xn,X) ∧ 1] = 0. 

Ved brug heraf fås som i det reelle tilfælde. 

Fk 1 Xn → X i sandsynlighed ⇒ Xnk → X P-n.o. for en delfølge (nk)k≥1. 

Bevis. Da d(Xn,X) → 0 i sandsynlighed i R findes der ifølge Proposition 6 en delfølge 

(nk)k≥1, så at d(Xnk ,X) ∧ 1 → 0 P-n.o., men dette siger netop, at Xnk → X P-n.o. ♦ 

En anden vigtig konsekvens er følgende. 

Fk 2 Lad (T,δ) betegne endnu et separabelt metrisk rum og lad f : S → T være en kontinuert 

funktion. Da gælder 

Xn → X i sandsynlighed ⇒ f(Xn) → f(X) i sandsynlighed 

Bevis. Vi skal vise limn E[δ( f(Xn), f(X)) ∧ 1] = 0. Antag at det ikke gælder, dvs. antag 

Men dette fører til en modstrid, da 

∃r > 0 ∃(nk)k≥1 : E[δ( f(Xnk ), f(X)) ∧ 1] > r for alle k. 

Xnk → X i s.s. ⇒ ∃(kl)l≥1 Xnk l → X P-n.o. ⇒ f(Xnk l ) → f(X) P-n.o. 

⇒ δ( f(Xnk l ), f(X))) ∧ 1 → 0 P-n.o. ⇒ E[δ( f(Xnk l ), f(X))) ∧ 1] → 0. ♦ 

Kontinuiteten udnyttes i implikation nummer to, og da det her er nok, at f er kontinuert i 

X(ω) for n.a. ω, behøver f blot at være kontinuert PX-n.o. Vi har derfor flg. skærpelse. 

Fk 2a Lad (T,δ) betegne endnu et separabelt metrisk rum og lad f : S → T være en Borel 

funktion, som er kontinuert PX-n.o. Da gælder 


163

Specialtilfældet T = S og δ en metrik, der er ækvivalent med d, viser, idet den identiske 

afbildning er kontinuert både som afbildning 

(S,d) → (S,δ) og (S,δ) → (S,d), 

at konvergens i sandsynlighed ikke afhænger af den eksplicit valgte metrik, blot vi holder os 

indenfor klassen af ækvivalente metrikker. Dette udnyttes f.eks. i følgende bevis. 

Fk 3 Idet S × S udstyres med en produktmetrik gælder 

Xn → X og Yn → Y i sandsynlighed ⇔ (Xn,Yn) → (X,Y) i sandsynlighed. 

Bevis. ⇐ følger af Fk 2, da projektionsafbildningerne er kontinuerte, og ⇒ fås, da 

d1((x1,y1),(x2,y2)) := d(x1,y1)+d(x2,y2) 

er en produktmetrik, umiddelbart af uligheden 

˜ 

d((Xn,Y1),(X,Y)) ∧ 1 ≤ d(Xn,X) ∧ 1+d(Yn,Y) ∧ 1. ♦ 

Sætning 5 og Fk 2 viser tilsammen, at der for alle f ∈ bC(S) gælder 


⇒ f(Xn) → f(X) i L 1 

(P) ⇒ E[ f(Xn)] →n→∞ E[ f(X)] = f dPX. 

Med udgangspunkt heri indføres den såkaldte konvergens i fordeling i hht. flg. definition. 

Definition. En følge (Xn)n≥1 af stokastiske funktioner med værdier i S siges at konvergere i 

fordeling mod μ, et Borel sandsynlighedsmål på S, hvis 

 

E[ f(Xn)] →n→∞ f dμ for alle f ∈ bC(S). 

Dette betegnes i givet fald Xn ∼ → μ. Hvis μ = PX for en stokastisk funktion X med værdier 

i S skrives også Xn ∼ → X, og man taler om konvergens i fordeling mod X. I følge den lille 

transformationssætning gælder altså, at 

Xn ∼ → X ⇔ E[ f(Xn)] →n→∞ E[ f(X)] for alle f ∈ bC(S). 

Ovenstående overvejelser kan derfor formuleres som implikationen. 

Fk 4 Xn → X i sandsynlighed ⇒ Xn ∼ → X. 

Grænsemålet for en konvergent følge er entydigt bestemt, dvs. 

For ifølge Sætning 8 har vi 

Xn ∼ → μ og Xn ∼ 

→ ν ⇒ 

Xn ∼ → μ og Xn ∼ → ν ⇒ μ = ν. 

 

f dμ = 

164 

f dν f ∈ bC(S) ⇒ μ = ν.

Derimod kan vi sagtens have, at Xn ∼ → X og Xn ∼ → Y , selv om X og Y er vidt forskellige. Men 

deres fordeling er ens, idet der gælder 

Xn ∼ → X og Xn ∼ → Y ⇒ PX = PY. 

Konvergens i fordeling er derfor udelukkende en egenskab ved fordelingsmålene opfattet 

som Borel sandsynlighedsmål på S, idet 

Xn ∼ → X ⇔ PXn 

w 

→ PX, 

hvor for Borel sandsynlighedsmål (μn)n≥1 og μ på S μn w → μ (μn konvergerer svagt imod μ), 

hvis og kun hvis 

f dμn →n→∞ 

 

f dμ for alle f ∈ bC(S). 

Som følge heraf har det endog mening at tale om konvergens i fordeling for variable, der 

ikke nødvendigvis er definerede på samme rum. Dette skal vi dog ikke udnytte her, men det 

er vigtigt i mange sammenhænge. 

Før vi ser nærmere på dette nye konvergens begreb knyttes et par kommentarer til definitionen. 

Da kontinuitet i metriske rum svarer til følgekontinuitet, bevares C(S) og dermed konvergens 

i fordeling under overgang til en ækvivalent metrik. Endvidere ses ved opsplitning i 

positiv og negativ del, at det er nok at eftervise definitionsbetingelsen for f ∈ bC(S)+, og da 

f ∧ n ↑ f og f ∧ n ∈ bC(S)+ for f ∈ C(S)+ 

fås af Monoton konvergens, at 

Xn ∼ → μ (X ) ⇒ liminf 

n 

E[ f(Xn)] 

 

≥ f dμ (E[ f(X)]) for alle f ∈ C(S)+. 

Denne implikation kan også vendes om, idet der gælder. 

Fk 5 

Xn ∼ → μ ⇔ liminf 

n 

E[ f(Xn)] 

 

≥ 

f dμ for alle f ∈ bC(S)+. 

Bevis. Vi mangler kun at vise ⇐, og som bemærket er det nok at se på ikke-negative funktioner. 

Lad derfor f ∈ bC(S)+ med 0 ≤ f ≤ M været givet. Da 

liminf 

n 

E[(M − f)(Xn)] = M − limsup E[ f(Xn)] 

n 

fås af antagelsen brugt på f og M − f , som begge er elementer i bC(S)+, at 

liminf 

n 

E[ f(Xn)] 

 

≥ 

hvilket alt i alt viser, at 

 

f dμ og M − limsup E[ f(Xn)] ≥ M − 

n 

 

limE[ f(Xn)] = 

n 

165 

f dμ. ♦ 

f dμ,

Ligesom i Fk 2a kan resultaterne udvides til funktioner, som kun er kontinuerte n.o. Der 

gælder f.eks. 

Fk 5a 

Xn ∼ → μ ⇔ E[ f(Xn)] →n→∞ 

for ethvert f ∈ bM(S), som er kontinuert μ-n.o. 

Bevis. Kun ⇒ kræver et bevis. Ved opsplitning i positiv og negativ del og dernæst at se på f 

og M − f , hvor 0 ≤ f ≤ M, indses som ovenfor, at det er nok at vise 

 

liminf E[ f(Xn)] ≥ f dμ 

n 

for et givet f ∈ bM(S)+, som er kontinuert μ-n.o. Definer for g ∈ bM(B(S))+ og k ≥ 1 

 

f dμ 

gk(x) := inf(k 

∧ g(y)+k · d(x,y)) x ∈ S. 

y∈S 

Ved brug af flg. tre uligheder, hvor x, ˜x ∈ S, k ≥ 1 og r > 0, 

1) 

2) 

3) 

gk(x) ≤ k ∧ g(x)+k · d(x,x) = k ∧ g(x) ≤ g(x) 

gk(x) = inf (k ∧ g(y)+k · d(x,y)) ∧ inf (k ∧ g(y)+k · d(x,y)) 

y∈b(x,r) y/∈b(x,r) 

≥ inf k ∧ g(y) ∧ inf k · d(x,y) ≥ k ∧ inf g(y) ∧ kr 

y∈b(x,r) y/∈b(x,r) y∈b(x,r) 

|gk(x) − gk( ˜x)| ≤ sup |k ∧ g(y)+k · d(x,y) − k ∧ g(y) − k · d( ˜x,y)| 

y∈S 

ses, at (gk)k≥1 ⊆ C(S)+ og at 

= k · sup |d(x,y) − d( ˜x,y)| ≤ k · d(x, ˜x) 

y∈S 

0 ≤ gk ≤ gk+1 ≤ g k ≥ 1 samt gk(x) ↑ g(x), hvis g er kontinuert i x. 

Da f pr. antagelse er kontinuert μ-n.o., konvergerer fk ↑ f μ-n.o., hvor fk’erne er konstrueret 

ud fra f , som netop beskrevet. Heraf følger derfor ved brug af Monoton konvergens, at 

 

liminf E[ f(Xn)] ≥ sup liminf E[ fk(Xn)] = sup 

n 

k n 

k 

fk dμ = f dμ. ♦ 

Læseren opfordres til at reformulere Fk 5 og Fk 5a svarende til at Xn ∼ → X i stedet for Xn ∼ → μ. 

166

Kriterier for konvergens i fordeling. 

Portmanteau Sætning I. 

Lad (S,d) betegne et separabelt metrisk rum og μ et Borel sandsynlighedsmål på S samt 

(Xn)n≥1 en følge af stokastiske funktioner med værdier i S. Idet 

Lip(S,d) := { f ∈ C(S)|∃M > 0 : | f(x) − f(y)| ≤ M d(x,y) x,y ∈ S}. 

er flg. udsagn ækvivalente. 

1) Xn ∼ → μ 

 

2) gdμ ≤ liminf 

n 

E[g(Xn)] for alle g ∈ bLip(S,d)+ 

S 

3) μ(G) ≤ liminfn P(Xn ∈ G) for alle G ⊆ S åben 

4) μ(F) ≥ limsup n P(Xn ∈ F) for alle F ⊆ S lukket. 

Bemærk at modsat C(S) afhænger Lip(S,d) eksplicit af metrikken d. 

Bevis. Da 1) ⇒ 2) er indeholdt i definitionen, og ækvivalensen mellem 3) og 4) følger ved 

overgang til komplementær mængden, vises kun 2) ⇒ 3) ⇒ 1). Antag 2) og lad G være en 

given åben delmængde af S. Definer for k ≥ 1 

gk(x) = (k · d(x,G c )) ∧ 1 for x ∈ S. 

Konstruktionen viser, at gk ↑ 1G, og ved brug af trekantsuligheden ses for k ≥ 1, at 

|gk(x) − gk(y)| ≤ k · |d(x,G c ) − d(x,G c )| ≤ k · d(x,y) x,y ∈ S 

og dermed gk ∈ bLip(S,d)+. Ifølge 2) og Monoton konvergens gælder derfor 

 

μ(G) = sup gk dμ ≤ sup liminf 

k S 

k 

n 

E[gk(Xn)] ≤ liminf 

n 

E[1G(Xn)] ≤ liminf 

n 

P(Xn ∈ G). 

Antag 3). Som vist i Fk 5 er det nok at vise, at for givet f ∈ bC(S)+ er 

 

f dμ ≤ liminf E[ f(Xn)]. 

n 

Men for ethvert n har vi 

E[ f(Xn)] = 

∞ 

og tilsvarende 

0 

S 

P( f(Xn) > t)dt = 

f dμ = 

∞ 

og da { f > t} er åben fås af Fatou’s lemma, at 

∞ 

0 

μ( f > t)dt ≤ 

∞ 

0 

liminf 

n 

0 

∞ 

0 

μ( f > t)dt, 

P( f(Xn) > t)dt ≤ liminf 

n 

167 

P(Xn ∈ { f > t})dt 

∞ 

0 

P( f(Xn) > t)dt,

hvilket er den ønskede ulighed. ♦ 

Til enhver Borel mængde B tilordnes mængderne 

B ◦ := {x ∈ B|∃ε > 0 : b(x,ε) ⊆ B} og B := {x ∈ S|∀ε > 0 : b(x,ε) ∩ B = /0}. 

( Hoffmann bruger betegnelserne int(B) og cl(B)) Dvs. B ◦ ⊆ B ⊆ B og 

B ◦ = B ⇔ B åben og B = B ⇔ B lukket. 

B ◦ kaldes det indre af B og er den største åbne mængde indeholdt i B, og B kaldes aflukningen 

af B og er den mindste lukkede mængde, der indeholder B. bd(B) := B\B ◦ kaldes tilsvarende 

randen af B. Ækvivalensen mellem 1), 3) og 4) kan derfor formuleres på flg. måde. 

Korollar. Xn ∼ → μ hvis og kun hvis 

μ(B ◦ ) ≤ liminf 

n 

P(Xn ∈ B) ≤ limsup P(Xn ∈ B) ≤ μ(B) for alle B ∈ B(S). 

n 

Dvs. specielt: Xn ∼ → μ ⇒ limn P(Xn ∈ B) = μ(B) hvis μ(bd(B)) = 0. 

Læseren opfordres igen til selv at formulere udsagnene i tilfældet Xn ∼ → X. 

Benyttes korollaret i tilfældet S = R på mængder af formen B = (−∞,x], fås, da B ◦ =(−∞,x[ 

og B = B, at 

Xn ∼ → μ ⇒ μ((−∞,x[) ≤ liminf 

n 

og dermed, da μ({x}) = μ((−∞,x]) − μ((−∞,x[), 

Fn(x) ≤ limsup Fn(x) ≤ μ((−∞,x]) 

n 

Xn ∼ → μ ⇒ lim n Fn(x) = μ((−∞,x]) hvis μ({x}) = 0. 

Fn er her fordelingsfunktionen for Xn. Dette giver anledning til flg. karakterisation af fordelingskonvergens 

på R. 

Konvergens i fordeling i R. 

Lad (Xn)n≥1 betegne en følge af stokastiske variable og lad μ betegne et Borel sandsynlighedsmål 

på R. Idet Fn er fordelingsfunktionen for Xn og Fμ funktionen x ↦→ μ((−∞,x]) 

er flg. punkter ækvivalente 

a) Xn ∼ → μ 

b) Fμ(x−) ≤ liminfn Fn(x) ≤ limsup n Fn(x) ≤ Fμ(x) x ∈ R 

c) limn Fn(x) = Fμ(x) hvis Fμ(x−) = Fμ(x) dvs. hvis μ({x}) = 0 

d) limn Fn(x) = Fμ(x) for x ∈D hvor D er tæt i R 

e) liminfn P(a < Xn < b) ≥ μ(]a,b[) for alle −∞ < a 

Dvs. hvis X er en stokastisk variabel med fordelingsfunktion F, er flg. punkter ækvivalente 

a1) Xn ∼ → X 

168

1) F(x−) ≤ liminfn Fn(x) ≤ limsup n Fn(x) ≤ F(x) x ∈ R 

c1) limn Fn(x) = Fμ(x) hvis F(x−) = F(x) dvs. hvis P(X = x) = 0 

d1) limn Fn(x) = F(x) for x ∈D hvor D er tæt i R 

e1) liminfn P(a < Xn < b) ≥ P(a < X < b) for alle −∞ < a 

Bevis. Da sidste del er en umiddelbar oversættelse, vises kun første del. Her mangler vi kun 

at vise, at d) ⇒ e) ⇒ a). Lad derfor a 

følger (ak)k≥1 og (bk)k≥1 af elementer i D, så at 

For alle n,k ≥ 1 gælder derfor 

D.v.s. 

a < ak < bk 

P(a < Xn < b) ≥ P(ak < Xn ≤ bk) = Fn(bk) − Fn(ak) →n→∞ Fμ(bk) − Fμ(ak). 

liminf 

n 

P(a < Xn < b) ≥ sup(Fμ(bk) 

− Fμ(ak)) = μ(]a,b[) 

k 

og dermed d) ⇒ e). For at vise den manglende implikation lader vi G ⊆ R betegne en begrænset 

åben mængde. Som vist i Appendiks F findes der højst tællelig mange parvis disjunkte 

intervaller (]ai,bi[)i≥1, så at G = 

i≥1]ai,bi[. Under antagelse af e) gælder derfor 

≤ liminf 

n 

μ(G) = sup 

k 

∑ j≥1 

∑ 

1≤ j≤k 

μ(]aj,bj[) ≤ sup 

k 

∑ 

1≤ j≤k 

liminf 

n 

P(a j < Xn 

P(a j < Xn 

n 

P(Xn ∈ 

]a j,bj[) ≤ liminf 

n 

j≥1 

P(Xn ∈ G). 

Lad dernæst G betegne en vikårlig åben mængde. Da 

fås af det netop viste 

liminf 

n 

P(Xn ∈ G) ≥ sup 

k 

Gk := G∩ ] − k,k[ ↑ G for k → ∞ 

liminf 

n 

P(Xn ∈ Gk) ≥ supμ(Gk) 

= μ(G). 

k 

Implikationen e) ⇒a) følger nu af Portmanteau sætningen. ♦ 

Det er værd at bemærke, at hvis Fμ er kontinuert, dvs. hvis μ({x}) ≡ 0, gælder endvidere, se 

Appendiks F, 

Xn ∼ → μ ⇒ sup |Fn(x) − Fμ(x)| →n→∞ 0, 

x∈R 

dvs. Fn’erne konvergerer i dette tilfælde uniformt imod Fμ. 

169

Regneregler for konvergens i fordeling. 

Portmanteau Sætning II. 

Lad (S,d) og (T δ) betegne separable metriske rum og lad (Xn)n≥1 og X hhv. (Yn)n≥1 og Y 

betegne stokastiske funktioner med værdier i S hhv. T . Da gælder 

1) Xn ∼ → X ⇒ f(Xn) ∼ → f(X) for Borel funktioner f : S → T , som kontinuerte PX-n.o. 

2) Xn ∼ → X og X degenereret ⇒ Xn → X i sandsynlighed. 

3) Xn ∼ → X, Yn ∼ → Y og Y degenereret ⇒ (Xn,Yn) ∼ → (X,Y). 

4) Xn ∼ → X, Yn ∼ → Y og Xn og Yn uafhængige n ≥ 1 ⇒ (Xn,Yn) ∼ → PX ⊗ PY . 

En ækvivalent og ofte mere anvendelig formulering af 1) og 3) lyder som flg. μ er her et 

Borel sandsynlighedsmål på S. 

1)’ Xn ∼ → μ ⇒ f(Xn) ∼ → μ ◦ f −1 for Borel funktioner f : S → T , som er kontinuerte μ-n.o. 

3)’ Xn ∼ → μ, Yn ∼ → Y og Y degenereret ⇒ (Xn,Yn) ∼ → μ ⊗ PY . 

Bevis. For ethvert g ∈ bC(T) er sammensætningen g ◦ f Borel målelig og kontinuert PX-n.o. 

Ifølge Fk 5a gælder derfor 

 

E[g( f(Xn))] = E[g ◦ f(Xn)] →n→∞ g ◦ f dPX = gdPf(X), hvilket viser 1). I 2) antages P(X = a) = 1. Da x ↦→ d(x,a) ∧ 1 ∈ bC(S) fås 

E[d(Xn,X) ∧ 1] = E[d(Xn,a) ∧ 1] →n→∞ E[d(X,a) ∧ 1] = d(a,a) ∧ 1 = 0, 

dvs. 2) er også vist. I 3) antages P(Y = a) = 1. Definer 

˜ 

d1((x1,y1),(x2,y2)) := d(x1,x2) ∧ 1+δ(y1,y2) ∧ 1 x1,x2 ∈ S, y1,y2 ∈ T. 

d1 

˜ er da en produktmetrik og for et vilkårligt element g ∈ Lip(S × T, d)+ ˜ gælder 

|E[g(Xn,Yn)] − E[g(X,Y)]| = |E[g(Xn,Yn)] − E[g(X,a)]| 

≤ E[|g(Xn,Yn) − g(Xn,a)|]+|E[g(Xn,a)] − E[g(X,a)]| 

≤ M · E[δ(Yn,a) ∧ 1]+|E[g(Xn,a)] − E[g(X,a)]| →n→∞ 0 

da x ↦→ g(x,a) ∈ bC(S) og Yn → a i sandsynlighed. Påstanden følger derfor af den første 

Portmanteu sætning. 

Det generelle bevis for 4) gennemgås ikke, men det vigtige specialtilfælde, hvor S = R n og 

T = R m , behandles senere i forbindelse med Kontinuitetssætningen. 

Det er værd at understrege, at 3) ikke gælder generelt. Dvs. vedrørende konvergens i fordeling 

kan vi ikke som i tilfældet med konvergens n.o. eller konvergens i sandsynlighed udlede 

konvergens af vektoren ud fra konvergens af marginalerne. Et simpelt eksempel, der viser 

dette, er beskrevet i flg. situation. 

Lad X betegne en U(−1,1)-fordelt stokastisk variabel, dvs. X ∼ −X, og sæt for alle n ≥ 1 

Xn = Yn = X og Y = −X. 

170

Da gælder oplagt Xn ∼ → X og Yn ∼ → Y . Hvis 3) derfor var sand uden restriktioner, ville 

(Xn,Yn) ∼ → (X,Y) og dermed ifølge 2), da (x,y) ↦→ x+y er kontinuert, 

dvs. PX = δ0, hvilket oplagt ikke er rigtigt. 

2X = Xn +Yn ∼ → X +Y = 0, 

171

Kontinuitetssætningen for karakteristiske funktioner. 

Fra reel analyse vides, at en følge (xk)k≥1 i R n er konvergent, hvis og kun hvis 

(xk)k≥1 er begrænset, og L((xk)k≥1) indeholder højst et punkt, 

hvor jævnfør Appendiks B L((xk)k≥1) betegner mængden af limespunkter, dvs. 

L((xk)k≥1) := {x ∈ R n |∃(kl)l≥1 delfølge : xkl → x}. 

Resultatet bygger på, at en begrænset mængde B ⊆ R n er prekompakt, dvs. 

(xk)k≥1 ⊆ B ⇒ L((xk)k≥1) = /0. 

Dette generaliserer uændret til et vilkårligt metrisk rum (S,d), idet der gælder 

En punktfølge (xn)n≥1 i S er konvergent, hvis og kun hvis mængden {xn |n ≥ 1} er prekompakt, 

og L((xn)n≥1) indeholder højst et punkt. 

Bevis. Kun hvis delen er allerede vist i Appendiks B. Da (xn)n≥1 er prekompakt, indeholder 

L((xn)n≥1) et punkt {x}, og vi vil nu vise, at xn → x. Antag at dette ikke gælder, dvs. 

∃r > 0 ∃(nl)n≥1 delfølge : xnl 

/∈ b(x,r) for alle l ≥ 1. 

Ifølge antagelsen er (xnl )l≥1 også prekompakt og har derfor mindst et limespunkt ˜x. Men 

da L((xnl )l≥1) ⊆ L((xn)n≥1) må der gælde ˜x = x, hvilket er umuligt, da d(x,xkl ) > r for alle 

l ≥ 1. Påstanden er hermed vist. ♦ 

Med baggrund heri indføres nu et prekompakthedsbegreb svarende til konvergens i fordeling 

for stokastiske funktioner med værdier i et polsk rum (S,d). Men da vi i dette kursus kun 

ser på S = R n , vil vi i det følgende udelukkende koncentrere os om dette tilfælde. Begrebets 

betydning og konsekvenser overføres dog uændret til ethvert polsk rum. 

Definition. En familie af sandsynlighedsmål {μi |i ∈ I} på (Rn ,B(Rn )) siges at være stram 

(tight), hvis 

∀ε > 0, ∃K ⊆ R n kompakt : sup μi(K 

i∈I 

c ) < ε, 

og en familie af n-dimensionale stokastiske vektorer (X i)i∈I siges at være stram, hvis mængden 

af fordelingsmål {PX i |i ∈ I} udgør en stram familie, dvs. hvis 

∀ε > 0, ∃K ⊆ R n kompakt : sup 

i∈I 

P(X i /∈ K) < ε. 

Da kompakthed i R n er det samme som at være lukket og begrænset, er dette ækvivalent med 

∀ε > 0, ∃r > 0 : P(X i > r) < ε for alle i ∈ I, 

hvor x 2 := ∑ n j=1 x2 j for x ∈ Rn . Markov’s ulighed sikrer derfor flg. kriterium. 

Stramhed i R n . Momentbetingelse. En familie (X i)i∈I af n-dimensionale stokastiske vektorer 

er stram, hvis der findes et α > 0 så at 

supE[X 

i 

i∈I 

α ] < ∞. 

172

Definitionen viser umiddelbart, at stramhed ligesom begrænsethed og mere generelt prekompakthed 

er stabil under endelig foreningsmængdedannelse, samt at delmængder af stramme 

mængder igen er stramme, og ikke overraskende gælder tillige flg. udsagn. 

Eksempler på stramhed. Enhver endelig mængde af sandsynlighedsmål er stram, og ligeledes 

er enhver følge af stokastiske funktioner (X k)k≥1, som konvergerer i fordeling, stram. 

Bevis. Hvad angår endelige mængder, er det nok at vise, at alle etpunkts mængder er 

stramme. For R n -tilfældet er dette en umiddelbar konsekvens af, at R n er voksende foreningsmængde 

af kompakte mængder, f.eks. b(0,k). Det generelle bevis, der udnytter en i 

polske rum gældende alternativ karakterisation af kompakthed, kan findes i afsnittet "Mål på 

metriske rum". 

Anden del vises kun i R n -situationen. Antag derfor at (X k)k≥1 konvergerer i fordeling imod 

et Borel sandsynlighedsmål μ på R n . Som vist i korollaret til Portmanteau Sætning I gæder 

derfor 

lim k P(X k > r) = μ(R n \ b(0,r)) r > 0 

hvis μ(bd(b(0,r))) = 0, dvs. alle pånær tællelig mange r, da 

Lad ε > 0 være givet og vælg r1 så at 

Der findes derfor et k0 så at 

bd(b(0,r1)) ∩ bd(b(0,r2)) = /0 hvis r1 = r2. 

lim k P(X k > r1) = μ(R n \ b(0,r1)) < ε/2. 

P(X k > r1) < ε for k ≥ k0. 

Men da den endelige mængde {X k |,1 ≤ k ≤ k0} er stram, kan vi vælge et r2, så at 

og for r := r1 ∨ r2 gælder derfor 

P(X k > r2) < ε for 1 ≤ k ≤ k0, 

sup 

k 

P(X k > r) < ε. ♦ 

Som allerede udnyttet i det netop gennemførte bevis, sikrer stramhed af enhver endelig familie 

af mål eller stokastiske vektorer, at en følge (X k)k≥1 er stram, hvis man kan vise, at 

∀ε > 0, ∃K ⊆ R n kompakt : limsup P(Xk /∈ K) ≤ ε. 

k 

eller ækvivalent 

∀ε > 0, ∃r > 0 : limsup P(X k > r) ≤ ε. 

k 

Dette udnyttes f.eks. i beviset for flg. ækvivalente beskrivelse af stramhed. 

Stramhed i Rn . En følge (Xk)k≥1 af n-dimensionale stokastiske vektorer er stram hvis og 

kun hvis 

∀ε > 0, ∃a > 0 : liminf E[e 

k 

−a2 ·X k2 ] > 1 − ε. 

173

Bevis. Lad ε > 0 være givet. Vælg a > 0, så at 

liminf E[e 

k 

−a2 ·X k2 ] > 1 − ε/2 eller ækvivalent limsup(1 

− E[e 

k 

−a2 ·Xk2 ]) < ε/2. 

Da x ↦→ 1 − e−a2x2 er voksende på R+ fås af Markov’s ulighed at 

P(X k > 1/a) = P(1 − e −a2 ·X k 2 

for alle k ≥ 1, og da 1 − e −1 > 1/2 har vi derfor 

> 1 − e −1 ) ≤ 1 − E[e−a2 ·X k 2 

] 

1 − e −1 

limsup P(Xk > 1/a) < 2ε/2 = ε, 

k 

hvilket, som nævnt, medfører stramhed. Kun-hvis-delen overlades til læseren. ♦ 

Det næste resultat viser, at stramhed er det kompakthedsbegreb for fordelingskonvergens i 

R n , som vi har antydet. Der gælder et tilsvarende resultat i ethvert polsk rum, men den generelle 

sætning, der er kendt under navnet Prokhorov’s Sætning, er noget mere kompliceret. 

Helly-Bray’s Sætning. 

Enhver stram følge (Xk)k≥1 af n-dimensionale stokastiske vektorer har mindst et limespunkt, 

dvs. der findes en delfølge (kl)l≥1 og et Borel sandsynlighedsmål μ på Rn ∼ 

, så at Xkl → μ. 

En følge af n-dimensionale stokastiske vektorer (Xk)k≥1 konvergerer derfor i fordeling, hvis 

og kun hvis den er stram og har højst et limespunkt. 

Første del vises kun i tilfældet n = 1. Tilfældet n > 1 klares på ’næsten’ samme måde, men 

er dog mere kompliceret, både hvad angår opskrivning og indhold. 

Bevis. Lad Fk betegne fordelingsfunktionen for Xk. Ifølge Helly’s Lemma (se Appendiks F) 

eksisterer der da en delfølge (kl)l≥1 og en højrekontinuert voksende funktion F : R → R, så 

at 

0 ≤ F ≤ 1 og limFkl (x) = F(x) for alle x ∈ CF, 

l 

hvor CF betegner mængden af kontinuitetspunkter for F. Da stramhed af (Xk)k≥1 i R kan 

formuleres som 

ses, da CF er tæt i R, at 

∀ε > 0, ∃r > 0 : supFk(−r) 

≤ ε og inf 

k 

k Fk(r) ≥ 1 − ε 

lim F(x) = 0 og lim F(x) = 1. 

x→−∞ x→∞ 

Lebesgue-Stieltjes målet λF hørende til F er derfor et sandsynlighedsmål, da 

λF(R) = lim 

r→∞ λF(] − r,r]) = lim 

r→∞ (F(r) − F(−r)) = 1, 

∼ 

og vi vil nu vise, at Xkl → λF. Men da F(x) = λF(] − ∞,x]) for alle x ∈ R er dette en umiddelbar 

konsekvens af resultatet angående fordelingskonvergens i R. 

Hvad angår anden del, mangler vi kun at vise hvis-delen. Lad derfor μ betegne et limespunkt. 

174

Stramheden sikrer eksistensen af et sådant. Antag nu at (Xk)k≥1 ikke konvergerer i fordeling 

mod μ. Pr. definition af konvergens i fordeling findes der altså en funktion f ∈ bC(Rn ), et 

ε > 0 og en delfølge (kl)l≥1, så at 

 

|E[ f(X kl )] − 

f dμ | > ε for alle l ≥ 1. 

Da følgen (X kl )l≥1 også er stram, har den derfor et limespunkt. Men da dette ligeledes er et 

limespunkt for hele følgen, må det ifølge entydigheden være μ, hvilket tydeligvis er umuligt 

i hht. valget af (kl)l≥1. ♦ 

Korollar. En stram følge af n-dimensionale stokastiske vektorer (X k)k≥1 konvergerer i fordeling, 

hvis limk ϕX k (t) eksisterer for alle t ∈ R n . 

Bevis. Ifølge Helly-Bray’s Sætning er det nok at vise, at der højst er et limespunkt. Antag 

derfor at μ og ν er limespunkter, d.v.s. der findes delfølger (k(l))l≥1 og (k(m))m≥1, så at 

Da 

X k(l) 

∼ 

∼ 

→ μ og Xk(m) → ν. 

t ↦→ cos(t · a) og t ↦→ sin(t · a) 

er kontinuerte og begrænsede for ethvert a ∈ Rn , betyder dette, at 

 

e it·a 

μ(da) = limϕX (t) = limϕX (t) = limϕX (t) = 

k(l) k 

l k m k(m) 

e it·a ν(da) 

for alle t ∈ R n , dvs. ˆμ = ˆν. Ifølge Entydighedssætningen for karakteristiske funktioner er μ 

og ν derfor identiske, dvs., der er højst et limespunkt. ♦ 

Afsnittets hovedsætning viser, at fordelingskonvergens i R n er ækvivalent med punktvis konvergens 

af de tilhørende karakteristiske funktioner. Der gælder nemlig flg. resultat. 

Kontinuitetssætningen for karakteristiske funktioner. 

Lad (Xk)k≥1 betegne n-dimensionale stokastiske vektorer, så at limk ϕX (t) = γ(t) for alle 

k 

t ∈ Rn , hvor γ : Rn → C er kontinuert i 0. Da findes der et Borel sandsynlighedsmål μ på 

Rn ∼ 

, så at Xk → μ, og μ er karakteriseret ved, at ˆμ(t) = γ(t) for alle t ∈ Rn . 

Bevis. Da den ligheden ˆμ = γ er åbenbar, udestår der set i lyset af ovenstående korollar kun 

at vise implikationen 

γ kontinuert i 0 ⇒ (X k)k≥1 stram. 

Ifølge Kf 1 er |γ(t)| ≤ γ(0) = 1 for alle t ∈ R n . Dvs. hvis U1,...,Un er uafhængige N(0,2)fordelte 

stokastiske variable og U := (U1,...,Un), sikrer γ’s kontinuitet i punktet 0, at der til 

et givent ε findes et a > 0, så at 

|E[γ(aU)]| > 1 − ε, 

thi for an → 0 konvergerer γ(anU) mod γ(0) = 1 P-n.o. domineret af 1. Men da 

ϕU(t) = 

n 

∏ϕUi i=1 

(ti) 

n 

= ∏exp(−t i=1 

2 i ) = e −t2 

175 

for alle t ∈ R n ,

fås af antagelserne, Lebesgue’s Sætning samt Kf 4, at 

E[γ(aU)] = lim k E[ϕX k (aU)] = lim k E[ϕU(aX k)] = lim k E[e −a2 ·X k 2 

]. 

D.v.s. liminfk E[e −a2 ·X k 2 

] > 1 − ε, og som ovenfor vist, er (X k)k≥1 er derfor stram. ♦ 

Korollar 1 Lad (X k)k≥1 og X betegne n-dimensionale stokastiske vektorer og μ et Borel 

sandsynlighedsmål på R n . Da gælder 

og tilsvarende 

Specielt ses at X k 

X k 

X k 

∼ 

→ X ⇔ lim k ϕX k (t) = ϕX(t) for alle t ∈ R n , 

∼ 

→ μ ⇔ lim k ϕX k (t) = ˆμ(t) for alle t ∈ R n . 

∼ 

→ X i R n ⇔ t · X k 

∼ 

→ t · X i R for alle t ∈ R n . 

Bevis. Første del er klar, da ϕX og ˆμ er kontinuerte overalt specielt i 0. Anden del ses ved at 

bemærke, at 

ϕY(t) = ϕZ(1) hvor Z = t ·Y 

for enhver n-dimensional stokastisk vektor Y og ethvert t ∈ R n . 

Korollar 2 Lad Xog (X k)k≥1 samt Y og (Y k)k≥1 betegne hhv. n og m-dimensionale stokastiske 

vektorer, så at X k og Y k er uafhængige for alle k. Da gælder 

Bevis. Da 

X k 

for alle (t,s) ∈ R n × R m = R n+m og 

∼ 

∼ 

→ X og Y k → Y ⇒ (Xk,Y k) ∼ → PX ⊗ PY. 

ϕ (Xk,Y k)(t,s) = ϕX k (t) · ϕY k (s) →k→∞ ϕX(t) · ϕY(s) 

(t,s) ↦→ ϕX(t) · ϕY(s) 

er kontinuert, sikrer Kontinuitetssætningen, at ((X n,Y n))n≥1 konvergerer i fordeling. Identifikationen 

af grænsemålet følger dernæst af Entydighedssætningen, da 

(t,s) ↦→ ϕX(t) · ϕY(s) 

ifølge Kf 5 er den Fouriertransformerede for sandsynlighedsmålet PX ⊗ PY . ♦ 

176

Den Centrale Grænseværdisætning. 

Kontinuitetssætningen er det ideelle værktøj til at undersøge flg. konvergensproblem ofte 

omtalt som et CLT-problem (Central Limit Theorem). 

Givet en følge af uafhængige stokastiske variable (Xn)n≥1, findes der da to reelle talfølger 

(an)n≥1 ⊆ (0,∞) og (bn)n≥1 ⊆ R, så at 

 

n 1 

∼ 

∑ Xk − bn → μ, 

an k=1 

hvor μ er et sandsynlighedsmål, som ikke er koncentreret i et punkt, dvs. ikke-degenereret. 

Udtrykt ved hjælp af Kontinuitetssætningen er dette ækvivalent med at spørge om eksistensen 

af (an)n≥1 ⊆ (0,∞) og (bn)n≥1 ⊆ R, så at 

lim n e it bn/an · 

n 

∏ 

k=1 

ϕXk (t/an) →n ψ(t) t ∈ R, 

hvor ψ er en karakteristisk funktion for ikke degenereret fordeling. Formuleret på denne 

sidste måde, er det naturligt også at lade ϕXk ’erne variere med n, dvs. i stedet for at tage udgangspunkt 

i en følge af uafhængige stokastiske variable, starter vi med et såkaldt uafhængigt 

trekantsskema (Xn j)1≤ j≤n, dvs. 

X11 

X21, X22 

······ 

Xn1, Xn2, ..., Xnn 

········· 

hvor Xn1, Xn2, ..., Xnn er uafhængige for alle n ≥ 1. En følge af uafhængige variable (Xn)n≥1 

kan opfattes som et uafhængigt trekantsskema (Xn j)1≤ j≤n ved fastsættelsen 

Xn j = Xj for alle 1 ≤ j ≤ n. 

Problemet er nu, om der findes konstanter (an)n≥1 ⊆ (0,∞) og (bn)n≥1 ⊆ R eller retterere 

(mnk)1≤k≤n ⊆ R så at 

1 

an 

 

n n 

∑ Xnk − ∑ mnk 

k=1 k=1 

 

= 1 

 

n 

∑ (Xnk − mnk) 

an k=1 

konvergerer i fordeling mod en ikke degeneret fordeling, eller ækvivalent om 

n 

∏ ϕXnk−mnk 

k=1 

(t/an) = exp(− it 

an 

n 

∑ 

k=1 

n 

mnk) · ∏ 

k=1 

ϕXnk (t/an) → ψ(t) 

for alle t ∈ R, hvor ψ er den karakteristiske funktion for en ikke degenereret fordeling. 

177

For at udelukke at et enkelt led Znk = (Xnk − mnk)/an i summen er alt dominerende, restrikterer 

man sig normalt til situationer, hvor den såkaldte uan-betingelse, dvs. 

lim n max 

1≤k≤n P(|Znk | ≥ ε) = 0 for alle ε > 0, 

er opfyldt. Uan-betingelsen bevirker, at kun helt specielle fordelingsfordelinger kan fremkomme 

som grænseværdi på ovennævnte måde. Dette gælder f.eks. poisson og normale 

fordelinger, men derimod ikke binomial og uniforme fordelinger. Helt præcist er de eneste 

mulige grænsefordelinger under uan-betingelsen de såkaldte uendelig delelige fordelinger, 

hvor en stokastisk variabel X siges at have en uendelig delelig fordeling, hvis der for ethvert 

naturligt tal n findes stokastiske variable X1,...,Xn, som er uafhængige og identisk fordelte, 

så at 

X ∼ X1 + ···+Xn. 

Uan-betingelsen og endog det stærkere limn P(max1≤k≤n |Znk | ≥ ε) = 0 for alle ε > 0 er 

specielt opfyldt, hvis 

n 

∑ P(|Znk | ≥ ε) →n→∞ 0 for alle ε > 0. 

k=1 

Denne såkaldte Raikov-betingelse er tæt knyttet til de normale CLT-resultater, dvs. udsagn 

som sikrer, at grænsefordelingen eksisterer og er en normal fordeling. Vi skal udelukkende 

beskæftige os med denne uden sammenligning historisk vigtigste type, idet vi skal omtale tre 

normale CLT-resultater samt diskutere relationerne mellem dem. Udgangspunktet er i alle tre 

situationer et uafhængigt trekantsskema, hvor de indgående variable alle har endeligt andet 

moment, og konstanterne (man bruger her normalt betegnelsen sn i stedet for an) vælges i 

hht. flg. opskrift 

mnk := E[Xnk] 1 ≤ k ≤ n og sn := 

 

n 

∑ Var(Xnk) n ≥ 1. 

k=1 

CLT 1 Den Centrale Grænseværdisætning, klassisk udgave. 

Lad (Xn)n≥1 betegne en iid-følge, hvor den fælles fordeling har endelig middelværdi μ og 

varians σ 2 > 0. Da konvergerer 

Un := 1 

√ nσ 2 

n 

∑ 

j=1 

(Xj − μ) ∼ → N(0,1). 

Bevis. Lad ϕ betegne den karakteristiske funktion for X1 − μ. Regnereglerne for karakteristiske 

funktioner viser, at for alle t ∈ R og n ≥ 1 er 

ϕUn (t) = ϕ(t/√nσ 2 ) n 

= 1 − n(1 − ϕ(t/√nσ 2 n )) 

. 

n 

Men da E[X1 − μ] = 0 og Var(X1 − μ) = σ 2 fås af et vist Taylorudviklings resultat for karakteristiske 

funktioner, at n(1 − ϕ(t/ √ nσ 2 ) → t 2 /2 og dermed, se Appendiks G, 

ϕUn (t) →n→∞ e −t2 /2 

t ∈ R. 

Det ønskede resultat følger nu umiddelbart af Kontinuitetssætningen. ♦ 

178

CLT 2 Lyapounov’s Sætning. 

Lad {Xn j |1 ≤ j ≤ n} betegne et uafhængigt trekantsskema, så at Xn j’erne har endelig første 

og andet moment. Sæt 

μn j = E[Xn j], σ 2 n j = Var(Xn j) og sn := 

 

σ 2 n1 + ···+σ 2 nn 

for n ≥ 1 og antag, at sn > 0 for alle n. Hvis Lyapounov’s betingelse er opfyldt, dvs. hvis 

konvergerer 

∃α > 2 : lim 

Un := 1 

1 

n→∞ sα n 

n 

∑ E[|Xn j − μn j| 

j=1 

α ] = 0, 

n 

∑(Xn 

j − μn j) 

sn j=1 

∼ → N(0,1). 

Lyapounov’s betingelse er specielt opfyldt, hvis sn →n→∞ ∞ og Xn j − μn j’erne er uniformt 

begrænsede af en konstant M. For i denne situation gælder 

1 

s 3 n 

n 

∑ E[|Xn j − μn j| 

j=1 

3 ] ≤ M 

s3 n 

n 

∑ E[|Xn j − μn j| 

j=1 

2 ] = M 

→n→∞ 0. 

sn 

I beviset kan vi uden tab af generalitet antage, at Lyapounov’s betingelse er opfyldt for et α 

i intervallet ]2,3]. For betragt for givet n ≥ 1 produktrummet 

Ω × En, hvor En := {1,...,n}, 

udstyret med produkt σ-algebraen F × 2En . Definer 

μn(A) := 

 

Zn 

E[1A(·, j) · j 2 

 

] A ∈ F × 2 En , 

n 

∑ 

j=1 

hvor Zn j := Xn j − μn j for alle n og j. μn er da et sandsynlighedsmål, og ifølge korollaret til 

Jensen’s ulighed gælder derfor for ethvert δ ≥ 1, at 

 

1 

Zn 

E[ j 

 

· 

 

 

 

 

hvor 

 

≤ ( 

s 3 n 

f δ dμn) 1/δ ≤ 

n 

∑ E[|Zn j| 

j=1 

3 ] = 

n 

∑ 

j=1 

 

 

E[ 

 

 

 

f(ω, j) := 

 

Zn j 

sn 

 

 

 

 

n 

∑ 

j=1 

δ 

Zn j(ω) 

sn 

 

 

· 

 

Zn j 

sn 

sn 

sn 

 

2 1/δ 

 

 

 

] 

Zn j 

sn 

= 

 

2 

 

 

] = 

 

1 

s 2+δ 

n 

f dμn 

 

 

 

for alle (ω, j) ∈ Ω × En. 

n 

∑ E[|Zn j| 

j=1 

2+δ 1/δ ] , 

Bevis for Lyapounov’s Sætning. Lad fortsat notationen Zn j = Xn j − μn j for 1 ≤ j ≤ n være 

gældende. Ifølge Kontinuitetssætningen er det nok at vise, at 

ϕUn (t) = ϕ ∑ n j=1 Zn j (t/sn) = 

n 

∏ ϕZn j 

j=1 

(t/sn) →n→∞ e −t2 /2 

for alle t ∈ R. 

179

Lad t ∈ R være givet. Da s 2 n = ∑n j=1 σ 2 n j er 

|ϕUn (t) − e−t2 /2 | = | 

n 

∏ ϕZn j 

j=1 

(t/sn) − 

n 

∏ exp(−t 

j=1 

2 σ 2 n j /2s2n )|, 

og benyttes nu at for ethvert sæt af komplekse tal a1,...,an og b1,...,bn med længde højst 

1 er 

fås 

≤ 

| 

n 

∏ 

j=1 

a j − 

n 

n−1 

∏ b j| ≤ |(an − bn) · ∏ 

j=1 

j=1 

n−1 n−1 

≤ |an − bn|+| ∏ a j − ∏ b j| ≤ ··· ≤ 

j=1 j=1 

|ϕUn (t) − e−t2 /2 | ≤ 

n 

∑ |ϕZn j 

j=1 

(t/sn) − 1+ t2 σ 

2 

2 n j 

s2 |+ 

n 

Da E[Zn j] = 0 og Var(Zn j) = σ 2 n j 

n−1 n−1 

a j|+|bn ·( ∏ a j − ∏ b j)| 

j=1 j=1 

n 

∑ |a j − b j|, 

j=1 

n 

∑ |ϕZn j 

j=1 

(t/sn) − exp(−t 2 σ 2 n j /2s2n )| 

n 

∑ |exp(− 

j=1 

t2 

2 

σ 2 n j 

s 2 n 

) − 1+ t2 

2 

σ 2 n j 

< ∞ viser en tidligere formuleret konsekvens af Kf 8, at 

|ϕZn j (t/sn) − 1+ t2 

2 

σ 2 n j 

s 2 n 

| ≤ |t| α E[|Zn j| α ] 

sα , 

n 

og da endvidere |e −x − 1+x| ≤ x 2 for x ≥ 0, har vi alt i alt 

|ϕUn (t) − e−t2 /2 α 

| ≤ |t| n E[|Zn j| 

∑ 

j=1 

α ] 

sα + 

n 

t4 

4 

Her går det første led imod 0 pr. antagelse, og da 

n 

∑ 

j=1 

 

σ 2 2 

n j 

s 2 n 

σ 

≤ max 

1≤ j≤n 

2 n j 

s2 n 

mangler vi kun at vise, at limn max1≤ j≤n σ 2 n j /s2 n 

samt Lyapounov’s betingelse, idet 

σ 

max 

1≤ j≤n 

2 n j 

s2 n 

= max 

1≤ j≤n E[ 

Xn j − μn j 

sn 

n σ 

∑ 

j=1 

2 n j 

s2 n 

 

2 

1 

] ≤ 

sα n 

180 

n 

∑ 

j=1 

 

σ 2 2 

n j 

s 2 n 

σ 

= max 

1≤ j≤n 

2 n j 

s2 n 

= 0. Men dette følger af Jensen’s ulighed 

. 

s 2 n 

n 

∑ E[|Xn j − μn j| 

j=1 

α 2/α ] . ♦ 

|.

CLT 3 Lindeberg’s Sætning. 

Lad {Xn j |1 ≤ j ≤ n} betegne et uafhængigt trekantsskema, så at Xn j’erne har endelig første 

og andet moment. Sæt 

μn j = E[Xn j], σ 2 n j = Var(Xn j) og sn := 

 

σ 2 n1 + ···+σ 2 nn 

for n ≥ 1 og antag, at sn > 0 for alle n. Hvis Lindeberg’s betingelse er opfyldt, dvs. hvis 

konvergerer 

lim 

n→∞ s−2 n 

n 

∑ (Xn j − μn j) 

j=1 {|Xn j−μn j|>εsn} 

2 dP = 0 for alle ε > 0 

Un := 1 

n 

∑(Xn 

j − μn j) 

sn j=1 

∼ → N(0,1). 

Bevis. Ifølge Kontinuitetssætningen er det nok at vise, at for ethvert t ∈ R gælder 

ϕUn (t) = 

n 

∏ ϕ ˜Xn j 

j=1 

(t) →n→∞ e −t2 /2 

, 

hvor ˜Xn j = (Xn j − μn j)/sn. Lad t ∈ R være givet. Ved at bruge en allerede benyttet vurdering 

af afstanden mellem to produkter af komplekse tal, hvis faktorer har længde højst 1, fås, da 

∑ n j=1 E[ ˜X 2 n j ] = 1 for alle n, at 

|ϕUn (t) − e−t2 /2 | = | 

n 

∏ ϕ ˜Xn j 

j=1 

(t) − 

n 

∏ 

j=1 

− t2 

e 2 ·E[ ˜X 2 n j ] | ≤ 

Uligheden |e −x − 1+x| ≤ x 2 for x ≥ 0 viser, at for alle j og n er 

dvs. 

n 

t2 

∑ |ϕ ˜Xn 

(t) − e− 2 

j 

j=1 

·E[ ˜X 2 n j ] |. 

t2 

|ϕ ˜Xn 

(t) − e− 2 

j ·E[ ˜X 2 n j ] t2 

| ≤ |ϕ ˜Xn 

(t) − 1+ 

j 2 · E[ ˜X 2 n j ]|+ 

 

t2 2 · E[ ˜X 2 n j ] 

2 

, 

|ϕUn (t) − e−t2 /2 | ≤ 

n 

t2 

∑ |ϕ ˜Xn 

(t) − 1+ 

j 

j=1 

2 · E[ ˜X 2 t4 

n j ]|+ 

4 

n 

∑ E[ ˜X 

j=1 

2 n j ]2 , 

og vi skal derfor blot vise, at de to summer konvergerer mod 0 hver for sig. 

Hvad angår den sidste, har vi da ∑ n j=1 E[ ˜X 2 n j ] = 1, at for ethvert ε > 0 og n ≥ 1 er 

n 

∑ E[ ˜X 

j=1 

2 n j ]2 ≤ max 

1≤ j≤n E[ ˜X 2 n j ] ≤ ε2 + 

n 

∑ E[ ˜X 

j=1 

2 n j , | ˜Xn j| > ε], 

hvilket sammen med Lindeberg’s betingelse viser den ønskede konvergens. I forbindelse 

med den første sum benyttes uligheden (se Kf 8) 

|e iy − 1 − iy+y 2 /2| ≤ y 2 ∧ |y| 3 /6 y ∈ R. 

181

Da ˜Xn j’erne har middelværdi 0, fås heraf for alle 1 ≤ j ≤ n og ε > 0, at 

dvs. 

|ϕ ˜Xn j (t) − 1+t2 /2 · E[ ˜X 2 n j ]| = |E[eit ˜Xn j − 1 − it ˜Xn j +t 2 /2 · ˜X 2 n j ]| 

| 

≤ t 3 /6 · E[| ˜Xn j| 3 , | ˜Xn j| ≤ ε]+t 2 · E[ ˜X 2 n j , | ˜Xn j| > ε] 

≤ ε ·t 3 /6 · E[ ˜X 2 n j ]+t2 · E[ ˜X 2 n j , | ˜Xn j| > ε], 

n 

∑ E[e 

j=1 

it ˜Xn j 2 

− 1+t /2 · ˜X 2 n j ]| ≤ ε ·t3 n 

/6+ ∑ E[ ˜X 

j=1 

2 n j , | ˜Xn j| > ε], 

hvilket igen via Lindeberg’s betingelse viser den ønskede konvergens. D.v.s. 

|ϕUn (t) − e−t2 /2 | ≤ 

n 

t2 

∑ |ϕ ˜Xn 

(t) − 1+ 

j 

j=1 

2 · E[ ˜X 2 n j ]| →n→∞ 0, 

og Lindeberg’s Sætning er dermed vist. ♦ 

CLT 3a Lyapounov’s betingelse medfører Lindeberg’s betingelse. 

Bevis. Lad ε > 0 være givet. For alle 1 ≤ j ≤ n og α > 2 har vi, at 

s −2 

 

n 

(Xn j − μn j) 

{|Xn j−μn j|>εsn} 

2 

dP = 

{ |Xn j−μn j | 

sn 

>ε} 

(Xn j − μn j) 2 

≤ ε 2−α 

 

|Xn j − μn j| α 

sα dP ≤ ε 

n 

2−α · s −α 

n · E[|Xn j − μn j| α ], 

og dermed for alle ε > 0, n ≥ 1 og α > 2 

 

s −2 

n 

n 

∑ 

j=1 


(Xn j − μn j) 2 dP ≤ ε 2−α · s −α 

n 

CLT 3b Lindeberg’s betingelse er opfyldt i iid-tilfældet. 

s 2 n 

dP 

n 

∑ E[|Xn j − μn j| 

j=1 

α ]. ♦ 

Lad μ og σ 2 > 0 betegne den fælles middelværdi og varians. Da s 2 n = n · σ 2 fås dermed for 

ethvert ε > 0 

s −2 

n 

n 

∑ 

j=1 

 

(Xn j − μn j) 


2 dP = σ −2 

 

{|X1−μ|> √ (X1 − μ) 

n·ε·σ} 

2 dP, 

som ifølge Lebesgue’s Sætning konvergerer mod 0 for n → ∞. ♦ 

Regnereglerne for konvergens i fordeling viser, at for stokastiske variable (Xn)n≥1 og (Yn)n≥1 

gælder for ethvert σ 2 ∈ [0,∞), at 

Xn ∼ → N(0,σ 2 ) og Yn → 0 s.s. ⇒ Xn +Yn ∼ → N(0,σ 2 ). 

Denne ide kan ved at opsplitte givne variable i en ’lille’ og en ’stor’ del udnyttes til at bevise 

normale CLT-sætninger under svagere integrabilitetsbetingelser end de ovenfor anvendte. 

Opsplitningen sker normalt ved hjælp af en Borel funktion q : R → R, idet vi skriver 

Xn j = q(Xn j)+(Xn j − q(Xn j)), 

182

hvor så første del spiller rollen som den ’lille’ del og den anden den ’store’ del. Et eksempel 

på et sådant resultat er følgende. 

CLT 4 En normal CLT-sætning uden eksistens af momenter. 

Lad {Xn j |1 ≤ j ≤ n} betegne et uafhængigt trekantsskema og q : R → R en Borel funktion, 

så at mn j = E[q(Xn j)] og σ 2 n j = Var(q(Xn j)) eksisterer og er endelige for alle 1 ≤ j ≤ n. 

Antag endvidere at 

i) 

ii) 

iii) 

lim 

n→∞ 

for et 0 ≤ σ 2 < ∞. Da konvergerer 

Bevis. For ethvert n er 

n 

∑ 

j=1 

n 

∑ mn j = 0 og lim 

n→∞ 

j=1 

x − q(x) 

q(0) = 0 = lim 

x→0 x2 n 

∑ σ 

j=1 

2 2 

n j = σ 

 

n 

lim ∑ (1+q(Xn j) 

n→∞ 

j=1 {|Xn j|>ε} 

2 

)dP = 0 ∀ε > 0 

Un := 

(Xn j − mn j) = 

n 

∑ 

j=1 

n 

∑ 

j=1 

(Xn j − mn j) ∼ → N(0,σ 2 ). 

(Xn j − q(Xn j))+ 

n 

∑ 

j=1 

(q(Xn j) − mn j), 

og som ovenfor bemærket er det derfor nok at eftervise flg. to påstande 

A) 

n 

∑ 

j=1 

(q(Xn j) − mn j) ∼ → N(0,σ 2 ) og B) 

Vi viser først A). Hvis σ 2 = 0 ses, at 

dvs. 

E[( 

n 

∑ 

j=1 

n 

∑ 

j=1 

n 

∑ 

j=1 

(q(Xn j) − mn j)) 2 ] = 

(Xn j − q(Xn j)) → 0 i sandsynlighed. 

n 

∑ σ 

j=1 

2 n j → 0, 

(q(Xn j) − mn j) → 0 i L 2 (P) 

og derfor også konvergens i fordeling mod δ0 = N(0,0). Hvis derimod σ 2 > 0, skriver vi for 

n så stor at s2 n = ∑nj=1 σ 2 n j > 0, 

n 

∑(q(Xn 

j) − mn j) = σ · 

j=1 

sn 

σ 

183 

· 1 

sn 

n 

∑ 

j=1 

(q(Xn j) − mn j),

hvoraf A) følger, hvis 

n 1 

∑ sn j=1 

(q(Xn j) − mn j) ∼ → N(0,1). 

Dette vises ved at eftervise, at det uafhængige trekantsskema {q(Xn j)}1≤ j≤n opfylder Lindeberg’s 

betingelse holder. Lad ε > 0 være givet. Da 

1 

s 2 n 

≤ 2 

s 2 n 

er det ifølge i) nok at vise, at 

lim 

n→∞ 

n 

∑ 

(q(Xn j) − mn j) 

j=1 {|q(Xn j)−mn j|>ε·sn} 

2 dP 

n 

∑ 

q(Xn j) 

j=1 {|q(Xn j)−mn j|>ε·sn} 

2 dP+ 2 

s2 n 

n 

∑ m 

j=1 

2 n j 

n 

∑ 

j=1 {|q(Xn j)−mn j|>ε·σ 2 q(Xn j) 

/2} 

2 dP = 0. 

Men for n stor og dermed ifølge i) sup 1≤ j≤n |mn j| lille er for alle 1 ≤ j ≤ n 

{|q(Xn j) − mn j| > ε · σ 2 /2} ⊆ {|q(Xn j)| > ε · σ 2 /4} ⊆ {|Xn j| > ˜ε}, 

hvor ˜ε > 0 er valgt i hht. ii), så at |q(x)| > ε ·σ 2 /4 ⇒ |x| > ˜ε. Påstanden og dermed A) følger 

nu umiddelbart af iii). 

Hvad angår B) skrives for alle ε > 0 og alle n 

n 

∑ 

j=1 

(Xn j − q(Xn j)) = 

n 

∑ 

j=1 

(Xn j − q(Xn j)) · 1 {|Xn j|≤ε} + 

n 

∑ 

j=1 

Da limn ∑ n j=1 P(|Xn j| > ε) = 0 for ethvert ε > 0 ifølge iii) konvergerer 

n 

∑ 

j=1 

(Xn j − q(Xn j)) · 1 {|Xn j|>ε} 

(Xn j − q(Xn j)) · 1 {|Xn j|>ε} →n→∞ 0 i sandsynlighed, 

for ethvert ε > 0. Et argument baseret på trekantsuligheden i en metrik, der svarer til konvergens 

i sandsynlighed, sikrer derfor, at det er nok at vise, at 

limsup E[| 

n 

n 

∑ 

j=1 

(Xn j − q(Xn j)) · 1 {|Xn j|≤ε}|] → 0 for ε → 0. 

For ε > 0 så lille, at |q(x) > |x|/2 for 0 < |x| ≤ ε (her benyttes ii)) gælder nu 

| 

n 

∑ 

j=1 

(Xn j − q(Xn j)) · 1 {|Xn j|≤ε}| ≤ 

n 

≤ Mε ∑ 

j=1 

n |Xn j − q(Xn j)| 

∑ 

j=1 q(Xn j) 2 

· q(Xn j) 2 · 1 {0

D.v.s. for alle n er 

domineret af 

Mε · 

E[| 

n 

∑ 

j=1 

(Xn j − q(Xn j)) · 1 {|Xn j|≤ε}|] 

n 

∑ E[q(Xn j) 

j=1 

2 n 

] = Mε · ∑ 

j=1 

som ifølge i) konvergerer mod Mε · σ 2 for n → ∞. Men da 

|x − q(x)| 

sup 

0

Betingede middelværdier. 

Som optakt til emnet betingede middelværdier vender vi kort tilbage til begrebet σ-algebraer. 

Allerede ved introduktionen af et sandsynlighedsfelt (Ω,F,P), omtaltes elementerne 

i hændelsessystemet F , som de mængder vi var interesseret i og derfor ’kendte’. Dette 

synspunkt er udgangspunktet for den måde, vi i det følgende skal betragte σ-algebraer eller 

rettere del σ-algebraer i et givent måleligt rum (Ω,F). Pr. definition er en del σ-algebra B 

i F en σ-algebra i Ω, hvis elementer alle ligger i F , dvs.B ⊆ F . En sådan del σ-algebra 

B tænkes at modellere en informationsmængde i den forstand, at elementerne i B er 

de mængder, vi kender, dvs. vi kan afgøre, om de indtræffer eller ej; og en variabel X siges 

derfor at være observerbar på baggrund af informationsmængden B, hvis den er B-målelig. 

Stabilitetskravene til en σ-algebra passer godt til informationssynspunktet, thi kender vi en 

hændelse A, så kender vi jo også A c , og kender vi Ai for ethvert i, så er det nærliggende at 

sige, at vi også kender ∞ i=1 Ai, thi denne indtræffer jo præcist, hvis mindst en af Ai’erne 

indtræffer. I dette ’informationssprog’ opfattes σ-algebraen {/0,Ω} som svarende til ingen 

information i modsætning til σ-algebraen F , som tolkes som fuld information. 

Ofte vil informationsmængden være givet ved, at vi kender værdierne af en eller flere stokastiske 

variable X1,...,Xn, dvs. vi kan afgøre, om hændelserne 

{(X1,...,Xn) ∈ A} A ∈ B(R n ) 

indtræffer eller ej. Dette svarer til, at informationsmængden er σ-algebraen frembragt at 

Xi’erne, dvs. σ(X1,...,Xn). Denne er klart en del σ-algebra i F , da Xi’erne er stokastiske 

variable. Dens størrelse afhænger af, hvor komplicerede X1,...,Xn er, og som vist i Faktoriseringssætningen 

(se Øvelse 8), er enhver variabel, som er observerbar kendt på basis 

af denne information, dvs. σ(X1,...,Xn)-målelig, en funktion af (X1,...,Xn), og dermed på 

formen 

ϕ(X1,...,Xn) hvor ϕ : R n → R er Borel målelig. 

Begrebet betinget middelværdi af en variabel X indføres nu som en formalisering af det 

’bedste skøn’ over X på basis af en given informationsmængde B. Antag først at B er på 

formen σ(A1,...,An), hvor A1,...,An udgør en målelig partition af Ω, dvs. Ai’erne ligger 

i F , er parvis disjunkte og udfylder Ω. Da enhver reel B-målelig variabel er på formen 

∑i αi · 1Ai 

, er angivelsen af det bedste skøn over en variabel X givet B derfor ækvivalent 

med en beregningsformel for αi’erne. En sådan opskrift afhænger naturligvis af, hvordan 

vendingen ’bedste skøn’ tolkes, men i forlængelse af forståelsen af begrebet middelværdi 

som en form for midling af værdierne forekommer det nærliggende at vedtage, at αi’erne 

skal bestemmes ved formlen 

α X i := 1 

P(Ai) 

 

Ai 

X dP hvis P(Ai) > 0, og α X i := 0 ellers. 

Den foreslåede beregningsformel kræver en vis integrabilitet af X, og vi vil her nøjes med at 

betragte variable X i L1 (P). Thi i så fald er ∑i αX i · 1Ai en vel defineret B-målelig variabel, 

som ligger i L1 (P) og opfylder (husk at ethvert A ∈ B er en foreningsmængde af visse af 

Ai’erne) 

X dP = 

A 

α X i · 1Ai dP for alle A ∈ B. 

A ∑ i 

186

Dette giver nu anledning til flg. generelle eksistens - / entydighedsspørgsmål: 

Givet en del σ-algebra B og en variabel X ∈ L 1 (P) findes der da en variabel XB i L 1 (P,B) := 

{Y ∈ L 1 (P)|Y er B målelig}, som opfylder 

 

A 

 

X dP = XB dP for alle A ∈ B, 

A 

og i hvor høj grad er en sådan entydigt bestemt ? 

Det sidste er det letteste, for hvis XB og ˜XB er elementer i L 1 (P,B), der begge opfylder 

integralbetingelsen, så er {XB = ˜XB} ifølge Proposition 5 en P-nulmængde, dvs. 

XB = ˜XB P-n.o. 

Denne entydighed op til P-nulmængder betyder, at det har mening at bruge notationen 

E[X |B] om enhver variabel, der opfylder ovenstående krav, og at kalde den en betinget 

middelværdi af X givet B. Dvs. en betinget middelværdi af en variabel X er observerbar 

mht. den betragtede informations σ-algebra, og dens integral m.h.t. P over ethvert element i 

informationsmængden er lig integralet af X over den samme mængde. 

For at vise eksistensen betragtes først kvadratisk integrable variable. Da underrummet 

L 2 (P,B) = {Y ∈ L 2 (P)|Y er B målelig} 

i L 2 (P) er lukket under konvergens i kvadratisk middel, findes der ifølge Projektionssætningen 

til ethvert X ∈ L 2 (P) et PBX ∈ L 2 (P,B), så at 

X − PBX ∈ L 2 (P,B) ⊥ ; 

specielt er X − PBX og 1A derfor orthogonale for alle A ∈ B, dvs. 

 

X dP = XB dP for alle A ∈ B. 

A 

A 

PBX er altså en betinget middelværdi af X givet B, og der gælder yderligere. 

Lemma BM 1 For alle X, Y ∈ L 2 (P) er 

PBX − PBY = PB(X −Y) P-n.o. og E[|PBX|] ≤ E[|X|]. 

Bevis. Første del følger umiddelbart af, at L2 (P,B) ⊥ er stabil under addition. Hvad angår 

anden del indføres for et givet X i L2 (P) betegnelsen A+ = {PBX ≥ 0}. Dvs. A+ og Ac + 

ligger i B, da PBX er B-målelig, og der gælder derfor 

 

= 

A+ 

 

E[|PBX|] = 

A+ 

 

PBX dP − 

Ac PBX dP 

+ 

 

X dP − 

Ac 

X dP ≤ 

+ 

|X|dP− 

A+ 

Ac |X|dP = E[|X|]. 

+ 

♦ 

187

Eksistensen af den betingede middelværdi for variable i L 1 (P) er nu let. For lad X ∈ L 1 (P) 

være givet. Vælg nu en følge (Xn)n≥1 ⊆ L 2 (P), så at Xn → X i L 1 (P). 

Xn := X · 1 {|X|≤n} for n ≥ 1 

kan f.eks. bruges. Ifølge Lemma BM 1 har vi for alle m,n ≥ 1 

E[|PBXn − PBXm |] = E[|PB(Xn − Xm)|] ≤ E[|Xn − Xm|] 

dvs. (PBXn)n≥1 er en Cauchy-følge i L1 (P,B), og den konvergerer derfor ifølge Sætning 6 i 

P-middel mod et element XB i L1 (P,B). Denne grænseværdi er en betinget middelværdi af 

X givet B, for benyttes implikationen 

Zn → Z i L 1 

(P) ⇒ Zn dP → 

A 

Z dP for alle A ∈ F, 

som skyldes uligheden 

 

| Zn dP − 

A 

Z dP| ≤ |Zn − Z|dP for alle n ≥ 1, 

på følgerne (Xn)n≥1 og (PBXn)n≥1 og hændelser A ∈ B fås 

 

X dP = lim 

A 

n 

Xn dP = lim 

A 

n 

PBXn dP = 

A 

A 

A 

 

XB dP. 

A 

Eksistens og entydighed af betingede middelværdier er hermed vist, dvs. 

Proposition Bm 1 For enhver del σ-algebra B i F findes der til enhver vaiabel X ∈ L1 (P) 

et element E[X |B] ∈ L1 (P,B), så at 

 

X dP = E[X |B]dP for alle A ∈ B. 

A 

A 

E[X |B] er herved entydigt bestemt P-n.o., dvs. op til P-nulmængder findes der netop en 

variabel Y , som opfylder 

a) Y er B-målelig og integrabel. 

b) E[X,A] = E[Y,A] for alle A ∈ B. 

Vi vil nu for en vilkårlig del σ-algebra B i F nærmere studere afbildningen 

L 1 (P) ∋ X ↦→ E[X |B] ∈ L 1 (P,B). 

Afbildningen, der kaldes betinget middelværdi dannelse m.h.t.B, har en række vigtige egenskaber, 

hvoraf de fleste er angivet nedenfor. Som følge af den manglende punktvise entydighed 

skal alle udsagn, som f.eks. ligheds - eller ulighedstegn, involverende betingede middelværdier 

forstås som værende gældende P-n.o. 

Sektionerne 6.8-10 i Hoffmann indeholder endnu flere, men de er alle simple konsekvenser 

af de nedenstående. Det bør dog understreges, at Hoffmann betragter variable i L(P), hvor 

vi her kun ser på elementer i L 1 (P). Men igen er udvidelsen ikke vanskelig. 

188

Som en hjælp til forståelsen bemærkes, at hvis B er den trivielle σ-algebra {/0,Ω}, er afbildningen 

X ↦→ E[X |B] præcis middelværdiafbildningen X ↦→ E[X]. For da en variabel i 

denne situation er B-målelig, hvis og kun hvis den er konstant, er E[X |B] = E[X] for alle 

X ∈ L 1 (P). (tænk over dette) 

Betinget middelværdi dannelse bevarer middelværdi og er lineær og voksende (eller rettere 

P-lineær og P-voksende), dvs. for X,Y ∈ L 1 (P) og a ∈ R gælder 

Bm 0 E[E[X |B]] = E[X]. 

Bm 1 E[X +Y |B] = E[X |B]+E[Y |B] og E[aX |B] = a · E[X |B] P-n.o. 

Bm 2 P(X ≥ Y) = 1 ⇒ P(E[X |B] ≥ E[Y |B]) = 1 og tilsvarende med >. 

Bevis. Hvis P(X ≥ Y) = 1 er ligheden P(E[X |B] ≥ E[Y |B]) = 1 en umiddelbar konsekvens 

af Proposition 5, da 

 

 

E[X |B]dP = X dP ≥ Y dP = E[Y |B]dP 

A 

A 

for alle A ∈ B. Men da de to yderpunkter er ens for A = {E[X |B] = E[Y |B]}, viser 

implikationen 

 

 

X dP = Y dP ⇒ P(B ∩ {X > Y }) = 0 B ∈ B, 

at 

B∩{X>Y } 

B∩{X>Y } 

P(X > Y) = 1 ⇒ P(E[X |B] > E[Y |B]) = 1. ♦ 

Endvidere bevarer afbildningen ’konstanter’ idet 

Bm 3 X = c P-n.o. ⇒ E[X |B] = c P-n.o. for ethvert c ∈ R. 

Kombineres Bm 2 og 3 fås for X ∈ L 1 (P): 

Bm 4 P(X ∈ I) = 1 ⇒ P(E[X |B] ∈ I) = 1 for ethvert interval I ⊆ R. 

Bevis. Lineariteten sikrer, at det er nok at vise implikationerne 

P(X ≤ b) h.h.v.P(X < b) = 1 ⇒ P(E[X |B] ≤ b) h.h.v.P(E[X |B] < b) = 1 

for alle b ∈ R. Men disse følger umiddelbart af Bm 2 og 3. ♦ 

Bm 2 og 4 sikrer flg. variant af Jensen’s ulighed for betingede middelværdier. 

Bm 5 Lad ϕ : R → R være en Borel funktion, som er konveks på et åbent interval I ⊆ R. Lad 

X ∈ L 1 (P) være givet, så at P(X ∈ I) = 1 og ϕ(X) ∈ L 1 (P), da er 

ϕ(E[X |B]) ≤ E[ϕ(X)|B] P-n.o. 

Bevis. Da ϕ er konveks på det åbne interval I, eksisterer der, som vist i Appendiks C, en 

følge (ln)n≥1 af affine funktioner, så at 

ln ≤ ϕ på I og ϕ(x) = supln(x) 

for alle x ∈ I, 

n 

189 

A 

A

dvs. specielt ϕ(X) ≥ ln(X) P−n.o. for alle n ≥ 1, da P(X ∈ I) = 1. Da NP er stabil under 

tællelig forening, gælder derfor ifølge Bm 1, 2 og 3, at 

E[ϕ(X)|B] ≥ sup 

n 

E[ln(X)|B] = sup 

n 

Men ifølge Bm 4 er P(E[X |B] ∈ I) = 1 og dermed 

sup 

n 

ln(E[X |B]) P-n.o. 

ln(E[X |B]) = ϕ(E[X |B]) P-n.o. ♦ 

Det overlades til læseren at udvide resultatet til vilkårlige intervaller. Bruges Bm 5 på funktionerne 

x ↦→ |x| p for p ≥ 1 fås 

E[X |B] ∈ L p (P) hvis X ∈ L p (P) og E[X |B]p ≤ Xp dvs. 

Bm 6 X ↦→ E[X |B] er en lineær kontraktion i L p (P) for ethvert p ≥ 1. 

Bm 2 og 6 medfører flg. konvergensresultater for variable (Xn)n≥1 og X i L 1 (P). 

Bm 7 Xn ↑ (↓)X P-n.o. ⇒ E[Xn |B] ↑ (↓)E[X |B] P-n.o. og i P-middel. 

Bevis. Antag Xn ↑ X P-n.o. og dermed Xn → X i P-middel. Af Bm 2 og 6 fås derfor 

E[Xn |B] ↑ supE[Xn 

|B] ≤ E[X |B] P-n.o. 

n 

samt E[Xn |B] → E[X |B] i P-middel, specielt er der konvergens i sandsynlighed, hvorfor 

supE[Xn 

|B] = E[X |B] P-n.o. ♦ 

n 

Bm 8 Hvis Xn ≥ 0 og X ≤ liminfn Xn P-n.o., er 

E[X |B] ≤ liminf 

n 

E[Xn |B] P-n.o. 

Specielt er E[liminfn Xn |B] ≤ liminfn E[Xn |B] P-n.o. hvis liminfn Xn ∈ L 1 (P). 

Bevis. Definer Yn := infk≥n Xk for n ≥ 1. Da 

X ∧Yn ↑ X ∧ liminf 

n 

Xn = X P-n.o. og Yn, X ∧Yn ∈ L 1 (P) for alle n, 

fås af Bm 2 og 7, at E[Yn |B] ≤ infk≥n E[Xk |B] P-n.o. og derfor 

E[X |B] = sup 

n 

E[X ∧Yn |B] ≤ sup 

n 

E[Yn |B] ≤ liminf 

n 

E[Xn |B] P- n.o. ♦ 

Bm 9 Hvis Xn → X P-n.o. og |Xn| ≤ Y P-n.o. for et Y ∈ L 1 (P) konvergerer 

E[Xn |B] → E[X |B] P-n.o. og i P-middel. 

Bevis. Da Xn → X i P-middel sikrer Bm 6 middelkonvergensen, og konvergensen P-n.o. fås 

ved at bruge Bm 8 på følgerne (Y −Xn)n≥1 og (Y +Xn)n≥1. Detaljerne overlades til læseren.♦ 

190

De to næste resultater viser, at B-målelige variable behandles som ’konstanter’. 

Bm 10 E[U |B] = U P-n.o. for ethvert U ∈ L 1 (P,B); og for X ∈ L 1 (P) og B-målelige variable 

U1 og U2 gælder 

P(U1 ≤ X ≤ U2) = 1 ⇒ P(U1 ≤ E[X |B] ≤ U2) = 1. 

Bevis. Første er del er umiddelbar og overlades til læseren. Da 

for ethvert n ≥ 1 fås af Bm 2, at 

P(X ∧ n ≤ U2 ∧ n) = 1 og |U2 ∧ n| ≤ n+|X| ∈ L 1 (P) 

E[X ∧ n|B] ≤ E[U2 ∧ n|B] = U2 ∧ n ≤ U2 P-n.o. 

Lader vi nu n → ∞ fås ved brug af Bm 7, at P(E[X |B] ≤ U2) = 1. Den anden halvdel følger 

tilsvarende. ♦ 

Bm 11 E[U · X |B] = U · E[X |B] P-n.o., for U B-målelig og X, U · X ∈ L 1 (P). 

Bevis. Antag at U og X opfylder antagelserne. Ifølge Lemma 6 findes der er en følge 

(Un)n≥1 ⊆ S(B), så at Un → U og |Un| ≤ |U| og dermed 

Af Bm 9 følger derfor, at 

Un · X → U · X P-n.o. og |Un · X| ≤ |U · X| P-n.o. 

E[Un · X |B] → E[U · X |B] P-n.o., 

dvs., hvis påstanden er vist for simple funktioner, fås 

E[U · X |B] = lim n (Un · E[X |B]) = U · E[X |B] P-n.o. 

Det er derfor nok at se på ’simple’ U og dermed via linearitet nok at se på U af formen 1A for 

et A ∈ B. Men her er påstanden en umiddelbar konsekvens af, at der for alle B ∈ B gælder 

 

 

 

1A · E[X |B]dP = 

B 

E[X |B]dP = 

B∩A 

X dP = 

B∩A 

1A · X dP. ♦ 

B 

De næste fire egenskaber er af en lidt anden natur. De tre første omhandler betingning med 

uafhængig information, og den sidste er reglen om successiv betingning. X er her stadigvæk 

et element i L 1 (P) og B1 endnu en del σ-algebra i F . Bemærk at Bm 12 er specialtilfældet 

af Bm 13 svarende til B = {/0,Ω}. 

Bm 12 E[X |B] = E[X] P-n.o. hvis X og B er uafhængige. 

Bm 13 E[X |σ(B ∪B1)] = E[X |B] P-n.o. hvis (X,B) og B1 er uafhængige. 

Bm 14 E[H(X,Y)|B] = ˜H(Y) P-n.o. hvis X og B er uafhængige og Y ∈ M(B) og ˜H(y) := 

E[H(X,y)], hvor H : R 2 → R er begrænset og Borel målelig. 

Bm 15 E[E[X |B]|B1] = E[X |B1] P-n.o. hvis B1 ⊆ B. 

191

Bevis. Bm 12 og 15 overlades til læseren. I Bm 14 viser et linearitetsargument, at det er nok 

at se på ikke-negative H. Da måleligheden og integrabiliteten følger af Tonelli’s sætning, 

mangler vi kun at vise, at for givet B ∈ B er 

 

˜H(Y)dP = H(X,Y)dP. 

A 

Men lader vi Z betegne den stokastiske variabel 1A fås ved gentagen brug af den lille transformationssætning 

og Tonelli’s sætning, at 

 

 

˜H(Y)dP = ˜H(Y) · 1A dP = ˜H(y) · zPY,Z(dydz) 

 

= 

 

{ 

A 

A 

 

H(x,y) · zPX(dx)}P (Y,Z)(dydz) = H(x,y) · zPX ⊗ P (Y,Z)(dxdydz) 

 

 

 

= H(x,y) · zP (X,Y,Z)(dxdydz) = H(X,Y) · 1A dP = 

A 

H(X,Y)dP 

Hvad angår Bm 13, viser et nyt linearitetsargument, at vi kan og vil antage, at X er ikkenegativ. 

Da både måleligheden og integrabiliteten igen er oplagt, mangler vi kun at vise, 

at 

X dP = E[X |B]dP for alle C ∈ σ(B ∪B1). 

C 

C 

Men da begge sider er endelige mål på σ(B ∪B1) med samme masse E[X], behøver vi kun 

at vise ligheden for C af formen A ∩ B, hvor A ∈ B og B ∈ B1, idet mængden af disse er 

stabil under endelig gennemsnit og frembringer σ(B ∪ B1). Men for A ∈ B og B ∈ B1 

gælder ifølge den antagede uafhængighed, at 

 

 

 

E[X |B]dP = E[X |B] · 1A · 1B dP = P(B) E[X |B]·1A dP 

A∩B 

 

= P(B) 

 

 

X · 1A dP = X · 1A · 1B dP = 

A∩B 

X dP. ♦ 

Ifølge Bm 4 og 6 afbilder enhver betinget middelværdi mængder af formen 

{X ∈ L 1 (P)|P(|X| ≤ M) = 1} og {X ∈ L 1 (P)|E[|X|] ≤ M} hvor 0 < M < ∞ 

ind i sig selv. Øvelse 17 medfører derfor flg. vigtige egenskab, hvor (Bn)n≥1 er del σ-algebraer 

i E og H en delmængde af L 1 (P). 

Bm 16 H uniformt integrabel ⇒ {E[X |Bn]|X ∈ H , n ≥ 1} unif. integrabel. 

Tilfældet hvor H består af en enkelt variabel, er specielt vigtigt, dvs. 

Bm 16’ {E[X |Bn]|n ≥ 1} er uniformt integrabel for alle X ∈ L 1 (P). 

Bevis. Lad X ∈ L 1 (P) være givet. Da {|E[X |Bn]| ≥ K} ∈ Bn for alle n og K fås af regnere- 

glerne for betingede middelværdier, at 

 

|E[X |Bn]|dP ≤ 

{|E[X |Bn ]|≥K} 

 

192 

{|E[X |Bn ]|≥K} 

E[|X||Bn]dP

= 

|X|dP ≤ 

|X|dP 

{|E[X |Bn]|≥K} 

{E[|X||Bn]≥K} 

hvilket giver det ønskede, da {|X|} er uniformt integrabel og 

P({E[|X||Bn] ≥ K}) ≤ E[E[|X||Bn]]/K ≤ E[|X|]/K →K→∞ 0. ♦ 

Bm 16 kan vises på nøjagtig samme måde. 

Lad os til slut se nærmere på tilfældet, hvor B = σ(Y) for en målelig variabel Y med værdier 

i et måleligt rum (E,E ). Her skrives normalt E[·|Y] i stedet for E[·|σ(Y)]. Ifølge faktoriseringssætningen 

findes der til ethvert X i L 1 (P) en funktion ϕ ∈ M(E ), generelt afhængig 

af både X, Y og P, så at 

E[X |Y] = ϕ(Y), 

og da 

ϕ dPY = 

B 

 

{Y ∈B} 

 

ϕ(Y)dP = 

{Y ∈B} 

 

X dP = x · 1B(y)P (X,Y)(dxdy) 

for alle B ∈ E , ses dels, at ϕ er entydigt bestemt PY -n.o., samt at den kun afhænger af den 

simultane fordeling, dvs. der gælder 

Bm 17a Lad X og Z betegne elementer i L 1 (P), så at (X,Y) ∼ (Z,Y) og ϕ et element i M(E ). 

Da er 

E[X |Y] = ϕ(Y) P-n.o. ⇔ E[Z |Y] = ϕ(Y) P-n.o.. 

Helt tilsvarende ses 

Bm 17b Lad X betegne et element i L 1 (P) og Z og Y målelige variable med værdier i et 

måleligt rum (E,E ), så at (X,Y) ∼ (X,Z). Da gælder for ψ ∈ M(E ) at 

E[X |Y] = ψ(Y) P-n.o. ⇔ E[X |Z] = ψ(Z) P-n.o.. 

Men hvordan bestemmer man et ϕ, der passer til et givent X ∈ L 1 (P) ? Hoffmann behandler 

problemet i sektion 6.11, som blandt andet indeholder flg. resultat. 

Bm 18 Lad (X,Y) betegne en absolut kontinuert 2-dimensional stokastisk vektor med tæthed 

(x,y) ↦→ f(x,y) m.h.t. det plane Lebesgue mål. Definer 

 

f2(y) := 

R 

f(u,y)du og f X|Y(x|y) := f(x,y) 

f2(y) · 1 { f2>0}(y) for x,y ∈ R. 

Da gælder for enhver begrænset Borel funktion ψ : R2 → R, at 

 

E[ψ(X,Y)|Y] = ˜ψ(Y) P-n.o., hvor ˜ψ(y) := ψ(x,y) · fX|Y(x|y)dx y ∈ R. 

Da f2 er en tæthed for Y , er PY( f2 > 0) = 1. Resultatet gælder uændret for ubegrænsede ψ, 

hvis blot E[|ψ(X,Y)|] < ∞, dog skal ˜ψ(y) sættes lig 0 på mængden 

 

{y ∈ R| 

R 

|ψ(x,y)| · f X|Y(x|y)dx = ∞}. 

193 

R

Denne er igen en PY -nulmængde, idet 

 

 

{ |ψ(x,y)| · fX|Y(x|y)dx}PY(dy) = 

R 

= 

R 

 

R 

 

{ 

R 

R 

 

{ 

R 

|ψ(x,y)| · f X|Y(x|y)dx} f2(y)dy 

 

|ψ(x,y)| · 1 { f2>0}(y) · f(x,y)dx}dy = 

R2 |ψ(x,y)|P (X,Y)(dxdy) 

= E[|ψ(X,Y)|] < ∞. 

Bevis for Bm 18. Lad ψ ∈ bM(B(R 2 )) og B ∈ B(R) være givet. Ifølge Fubini’s Sætning 

gælder da 

E[ ˜ψ(Y),Y −1 

(B)] = 

 

= 

B 

B 

 

˜ψ(y)PY(dy) = 

B 

 

{ ψ(x,y) · fX|Y(x|y)dx} · f2(y)dy 

R 

 

 

{ ψ(x,y) · f(x,y)dx}dy = 

R 

R2 ψ(x,y) · 1B(y) · f(x,y)λ2(dxdy) 

= E[ψ(X,Y), Y −1 (B)]. ♦ 

En anden situation, hvor problemet umiddelbart lader sig løse, omtales i flg. resultat. Beviset 

overlades til læseren. 

Bm 19 Lad Y betegne en diskret stokastisk variabel, og lad (yn)n≥1 være en nummerering af 

den højst tællelige mængde Sp(Y), dvs. 

P(Y = yn) > 0 for alle n og ∑ P(Y = yn) = 1. 

n≥1 

Da gælder for enhver stokastisk variabel X og enhver Borel funktion ψ : R 2 → R, at hvis 

E[|ψ(X,Y)|] < ∞, så er 

E[ψ(X,Y)|Y] = ˜ψ(Y) P-n.o., 

hvor ˜ψ(·) := ∑n≥1 an · 1 {yn}(·) og 

an = 

 

1 

ψ(X,yn)dP n ≥ 1. 

P(Y = yn) {Y=yn} 

Bm 18 og 19 knytter tæt an til, hvad der normalt kaldes en regulær betinget fordeling af X 

givet Y . Det er ikke et emne, vi skal gøre meget ud af, men da det indgår i behandlingen af 

den flerdimensionale normalfordeling, vil jeg ganske kort indføre nogle vigtige begreber og 

definitioner. 

Notation {P(A|y)|A ∈ B(R n ), y ∈ R m } kaldes en Markov kerne på B(R n ) × R m , hvis 

a) A ↦→ P(A|y) er et Borel sandsynlighedsmål på R n for alle y ∈ R m . 

b) y ↦→ P(A|y) er en Borel funktion på R m for alle A ∈ B(R n ). 

Lad X og Y betegne h.h.v. en n og en m-dimensional stokastisk vektor. En Markov kerne 

194

{PX |Y(A|y)|A ∈ B(Rn ), y ∈ Rm } på B(Rn ) × Rm kaldes en regulær betinget fordeling for 

X givet Y , hvis 

 

P(X ∈ A, Y ∈ B) = PX |Y(A|y)PY(dy) 

for alle A ∈ B(R n ) og B ∈ B(R m ). Sandsynlighedsmålet 

B 

A ↦→ P X |Y(A|y) 

kaldes den betingede fordeling for X givet Y = y og er det absolut kontinuert med tæthed 

x ↦→ f X |Y(x|y), kaldes denne en betinget tæthed for X givet Y = y. 

Øvelse 20. Udnyt Proposition 2 og sektionsegenskaber ved produktmålelige mængder til at 

vise at for alle A ∈ B(Rn+m ) = B(Rn ) ×B(Rm ) er 

 

P((X,Y) ∈ A) = 

Rm PX |Y(A(y)|y)PY(dy) 

Resultatet i Øvelse 20 viser, at hvis Z := φ(X,Y) for en k-dimensional Borel funktion φ så 

gælder for alle A ∈ B(R k og B ∈ B(R m , at 

P(Z ∈ A,Y ∈ B) = P((X,Y) ∈ φ −1 (A) ∩ R n × B) = 

 

Rm PX |Y((φ −1 (A) ∩ R n 

× B)(y)|y)PY(dy) = 

B 

P X |Y((φ(·,y) −1 (A)|y)PY(dy). 

Dvs. den betingede fordeling for Z givet Y = y er billedmålet af den betingede fordeling for 

X givet Y = y svarende til den målelige afbildning 

x ↦→ φ(x,y). 

Betingede fordelinger er et teoretisk vanskeligt begreb. Men for en - eller flerdimensionale 

stokastiske vektorer X og Y eksisterer der altid en regulær betinget fordeling for X givet Y , 

og da B(R n ) er separabel, er P X |Y(·|·) entydigt bestemt i en sådan grad, at det har mening 

at tale om ’den betingede fordeling’ for X givet Y . De betingede fordelinger for X givet Y = y 

er nemlig entydigt bestemte for PY -n.a. y. Skønt der således både er eksistens og entydighed, 

er den eksplicitte beregning ofte vanskelig (se dog nedenstående øvelse), men i anvendelsessituationer 

er de betingede fordelinger heldigvis ofte givet ud fra sammenhængen. 

Kendskab til en betinget fordeling for X givet Y gør det muligt at generalisere resultaterne 

Bm 14, 18 og 19. For er f en begrænset Borel funktion på Rn × Rm , så er 

 

E[ f(X,Y)|Y] = ˜f(Y) P-n.o. hvor ˜f : y ↦→ 

Rn f(x,y)P X |Y(dx|y), 

dvs. ˜f(y) er middelværdien af f(X,y) udregnet i den betingede fordeling af X givet Y = y. 

Formlen vises ved først at reducere til produktfunktioner, dvs. funktioner af formen 

(x,y) ↦→ f1(x) · f2(y), 

hvor f1 og f2 er Borel funktioner på R n h.h.v. R m . Standardbeviset sikrer dernæst, at det er 

nok at se på 

195

f1 = 1A og f2 = 1B for A ∈ B(R n ) og B ∈ B(R m ), 

men her svarer ligheden præcis til ovenstående definitionsligning. Resultatet udvider på 

sædvanlig vis til visse ubegrænsede f , specielt ikke-negative f . 

Øvelse 21. Lad X og Y være givne n og m dimensionale stokastiske vektorer og μ et vilkårligt 

givet Borel sandsynlighedsmål på R n . Vis nu flg. påstande. 

I) Hvis (X,Y) er absolut kontinuert m.h.t. λn+m med tæthed (x,y) ↦→ f(x,y), er 

⎧ 

⎨ 

PX|Y(A|y) := 

⎩ 

 

A f X|Y(x|y)λn(dx) A ∈ B(R n ), y ∈ { f2 > 0} 

μ(A) A ∈ B(R n ), y /∈ { f2 > 0} 

en regulær betinget fordeling for X givet Y . y ↦→ f2(y) er her en tæthed for Y og 

f X|Y(x|y) := f(x,y)/ f2(y) · 1 { f2>0}(y) for x ∈ R n , y ∈ R m . 

II) Hvis Y er diskret og Sp(Y) := {y ∈ R m |P(Y = y) > 0}, er 

P X|Y(A|y) := 

en regulær betinget fordeling for X givet Y . 

III) Hvis X og Y er uafhængige, er 

P(X ∈ A|Y = y) A ∈ B(R n ), y ∈ Sp(Y) 

μ(A) A ∈ B(R n ), y /∈ Sp(Y) 

P X|Y(A|y) := PX(A) for A ∈ B(R n ), y ∈ R m 

en regulær betinget fordeling for X givet Y . 

Punkt III) viser, at når X og Y er uafhængige, afhænger de betingede mål for X givet Y = y 

ikke af y. Dette karakteriserer uafhængighed, idet flg. udsagn er ækvivalente. μ er her et 

sandsynlighedsmål på R n . 

1) X og Y er uafhængige 

2) P X|Y(A|y) := μ(A) for A ∈ B(R n ) og y ∈ R m er en regulær betinget fordeling for X givet 

Y . 

Øvelse 22. Eftervis 1) ⇔ 2) og vis endvidere, at μ i givet fald er fordelingsmålet for X. 

Øvelse 23. Lad (X,Y) være todimensionalt normalt fordelt. Vis at den betingede fordeling 

for X givet Y = y er en normalfordeling og bestem dens parametre. 

Vink: Vis at der findes et α, så at X −αY og Y er uafhængige, og udnyt dernæst bemærkningen 

efter Øvelse 20, idet X = (X − αY)+αY . 

196

Martingaler. 

I dette kapitel betragtes modeller for systemer, der udvikler sig i tiden. Tiden modelleres 

diskret, dvs. ved en tidsparametermængde T ⊆ Z, normalt et interval. Til ethvert tidspunkt 

n i T knytter der sig en variabel Xn og en del σ-algebra Fn i F . Vi skal tænke på Fn som 

den informationsmængde, der er til stede til tid n, og på Xn som en variabel, der beskriver 

tilstanden til tid n. Flg. krav forekommer derfor naturlige. 

a) Fn ⊆ Fm hvis n ≤ m for tidspunkter n og m i T , dvs. informationsmængden vokser med 

tiden. 

b) Xn er målelig m.h.t.Fn, dvs. tilstanden til tid n kan observeres på baggrund af den information, 

der er til stede til tid n. 

Med udgangspunkt heri siges en parametriseret familie (Fn)n∈T af del σ-algebraer i F at 

udgøre et T -filter, hvis Fn ⊆ Fm for n ≤ m, n,m ∈ T ; og b) udtrykkes ofte kort ved at sige, 

at processen (Xn)n∈T er tilpasset filtret (Fn)n∈T . 

Vi vil kun se på tilfældet, hvor T = N0 := {0,1,...}, men herved dækkes også tilfældet 

(Xn,Fn)n≥k, idet denne kan opfattes som ( ˜Xn, ˜ 

Fn)n≥0, hvor 

˜Xn = Xn+k og ˜ 

Fn = Fn+k n ≥ 0. 

Tilfældet, hvor T er et endeligt interval [k,l], er ligeledes dækket, for forlænges konstant ud 

over højre endepunkt kan (Xn,Fn) n∈[k,l] beskrives ved ( ˜Xn, Fn)n≥0, ˜ hvor 

˜Xn = Xn+k, ˜ 

Fn = Fn+k n ≤ l − k og ˜Xn = Xl, ˜ 

Fn = Fl n > l − k. 

T = N0 omfatter altså alle situationer, hvor tidsmængden har et endeligt begyndelsespunkt, 

og der udestår derfor i princippet kun to tilfælde nemlig, T = Z eller T = −N0. Men T = Z 

er ikke interessant i en martingal sammenhæng, og det godt nok meget interessante tilfælde 

T = −N0 overlades på grund af manglende tid til et senere kursus. 

Til ethvert filter (Fn)n≥0 tilknyttes de såkaldte stoptider defineret på flg. vis. 

Definition τ : Ω → N0 ∪ {∞} er en stoptid (mere præcist en (Fn)n≥0-stoptid), hvis 

{τ > n} ∈ Fn n ≥ 0. 

Bemærk at målelighedskravet ækvivalent kan formuleres som 

{τ ≤ n} ∈ Fn n ≥ 0 eller {τ = n} ∈ Fn n ≥ 0. 

τ siges at være en endelig stoptid, hvis P(τ < ∞) = 1, og τ siges at være en begrænset stoptid, 

hvis P(τ ≤ M) = 1 for et reelt tal M. Til enhver stoptid τ tilordnes σ-algebraen (overvej) 

Fτ := {F ∈ F∞ |F ∩ {τ = n} ∈ Fn n ≥ 0}, 

hvor F∞ := σ( 

nFn), dvs.F∞ er den mindste σ-algebra, der indeholder alle Fn’erne. Fτ 

er altså en del σ-algebra i F∞ og omtales som informationsmængden, der er til stede til tid 

τ. 

197

Inden vi starter på den egentlige teori uddrages en række mere eller mindre åbenbare konsekvenser 

af de indførte defintioner på en stoptid τ og den tilhørende σ-algebra Fτ. 

Ma 1 τ er Fτ-målelig, og en F∞-målelig stokastisk variabel X er Fτ-målelig, hvis og kun 

hvis X · 1 {τ=n} er Fn-målelig for alle n ≥ 0. 

Bevis. Den første påstand følger af identiten 

 

{τ = n} hvis n = k 

{τ = k} ∩ {τ = n} = 

/0 hvis n = k. 

for n, k ∈ N0 ∪ {∞}, og den anden af identiteten 

{X ∈ B} ∩ {τ = n} = {X · 1 {τ=n} ∈ B} ∩ {τ = n}. 

for n ≥ 0 og B ∈ B(R), som, hvis 0 /∈ B, specielt giver 

{X · 1 {τ=n} ∈ B} = {X ∈ B} ∩ {τ = n} ∈ Fn. ♦ 

De vigtigste stoptider er de såkaldte First Hitting Times defineret ved (her og overalt i det 

følgende sættes inf /0 til at være ∞ ) 

τA(ω) := inf{n ≥ 0|Xn(ω) ∈ A} ω ∈ Ω, 

hvor A ∈ B(R) og (Xn)n≥0 er en tilpasset reel proces. Stoptidsegenskaben følger af ligheden 

{τA > n} = 

n 

{Xk ∈ A} c = 

k=0 

n 

{Xk ∈ A c } n ≥ 0. 

Dette generaliserer, se Hoffmann sektion 7.2, til de såkaldte Ocurrence Time τF defineret 

ved 

τF(ω) := inf{n ≥ 0|ω ∈ Fn} ω ∈ Ω, 

hvor F := (Fn)n≥0 er en følge af hændelser, så at Fn ∈ Fn for alle n ≥ 0. Bemærk at ovenstående 

Hitting Time svarer til Fn = {Xn ∈ A} for n ≥ 0. Igen følger stoptidsegenskaben let, 

idet 

{τF > n} = 

n 

k=0 

F c 

k 

k=0 

for n ≥ 0. 

Da stoptider kun antager heltallige værdier ses let, at enhver stoptid τ er en Ocurrence Time, 

idet τ = τF, hvor Fn = {τ ≤ n} for alle n ≥ 1. 

Definitionen viser, at for ethvert k ∈ N0 ∪ {∞} er den konstante variabel τ(ω) :≡ k en stoptid. 

Ligeledes ses at mængden af (Fn)n≥0-stoptider er stabil under endelig sum og endelig 

punktvis max og min dannelse, dvs. 

Ma 2 τ1, τ2 stoptider ⇒ τ1 + τ2, τ1 ∨ τ2 og τ1 ∧ τ2 stoptider. 

Bevis. Følger af lighederne 

{τ1 ∨ τ2 ≤ n} = {τ1 ≤ n} ∩ {τ2 ≤ n} og {τ1 ∧ τ2 > n} = {τ1 > n} ∩ {τ2 > n} 

198

samt 

{τ1 + τ2 = n} = 

n 

{τ1 = k} ∩ {τ2 = n − k} ♦ 

Argumenterne for ∨ og ∧ udvider uden videre til tællig mange stoptider, dvs. 

k=1 

og derfor tilsvarende for en uendelig sum, da 

(τi)i≥1 stoptider ⇒ supτi 

og infτi 

stoptider, 

i i 

∞ 

∑ τi = sup 

i=1 n 

Det næste resultat viser, at stoptids σ-algebraerne generaliserer de givne informations σalgebraer 

Fn. 

n 

∑ 

i=1 

Ma 3 Fτ = Fk, hvis τ ≡ k for et k ∈ N0 ∪ {∞} og for stoptider τ1 og τ2 er 

{τ1 ≤ τ2} ∈ Fτ1∧τ2 = Fτ1 ∩Fτ2 , dvs. specielt τ1 ≤ τ2 ⇒ Fτ1 

Bevis. Den første påstand overlades til læseren. For B ∈ Fτ1∧τ2 og n ≥ 0 er 

1B · 1 {τ1=n} = 

τi. 

n 

∑ 1B · 1 {τ1∧τ2=k} · 1 {τ1=n} 

k=0 

⊆ Fτ2 . 

Fn-målelig, hvilket ifølge Ma 1 viser, at B ∈ Fτ1 og tilsvarende B ∈ Fτ2 . Hvis omvendt 

B ∈ Fτ1 ∩Fτ2 viser lighederne for n ≥ 0 

1B · 1 {τ1∧τ2=n} = 1B · 1 {τ1=n} · 1 {τ2>n} + 1B · 1 {τ2=n} · 1 {τ1>n} + 1B · 1 {τ1=n} · 1 {τ2=n} 

at B ∈ Fτ1∧τ2 . D.v.s. Fτ1∧τ2 = Fτ1 ∩Fτ2 . Resten følger tilsvarende af lighederne 

1 {τ1≤τ2} · 1 {τ1∧τ2=n} = 1 {τ1≤τ2} · 1 {τ1=n} = 1 {n≤τ2} · 1 {τ1=n} = 1 {n−1

Ifølge Lemma 5 er X∞ målelig m.h.t.F∞, hvis (Xn)n≥0 er tilpasset. Herefter kan vi uden 

problemer definere Xτ for en vilkårlig stoptid τ ved fastsættelsen 

Xτ := 

∞ 

∑ Xn · 1 {τ=n} + X∞ · 1 {τ=∞}. 

n=0 

Der er tydeligvis tale om en udvidelse af den allerede indførte definition for stoptider med 

udelukkende endelige værdier. Endvidere gælder flg. alternative beskrivelse. (Sammenlign 

med sektion 7.4 i Hoffmann’s bog.) 

 

limn Xτ(ω)∧n(ω) hvis denne eksisterer i R 

Xτ(ω) := 

0 ellers, 

specielt er |Xτ| ≤ liminfn |Xτ∧n|. Xτ er altså ’∞-variablen’ hørende til (Xτ∧n)n≥0 defineret i 

hht. Lemma 5. Dette viser derfor flg. udsagn. 

Ma 4 Xτ er Fτ-målelig for enhver tilpasset proces (Xn)n≥0. 

Bevis. Som allerede vist er Xτ∧n målelig m.h.t. til Fτ∧n for alle n og dermed også Fτ-målelig 

for alle n. Påstanden følger derfor umiddelbart af Lemma 5. ♦ 

Bemærk at med de indførte definitioner gælder for ethvert A ∈ B(R), at 

XτA ∈ A på {τA < ∞}, 

hvor (Xn)n≥n er en tilpasset reel proces og τA den tilhørende Hitting Time til A. 

Vi får brug for endnu tre hjælperesultater. 

Ma 5 For vilkårlig X ∈ L 1 (P) og stoptid τ gælder for ethvert k ∈ N0 ∪ {∞} 

E[X |Fτ] · 1 {τ=k} = E[X |Fk] · 1 {τ=k}. 

Bevis. Lad k være givet. Da begge sider ifølge Ma 1 er Fk-målelige, og de ligeledes oplagt 

er integrable, er det nok at vise, at de har samme integral over ethvert B ∈ Fk. Men dette 

følger af definitionen på betinget middelværdi, da 

B ∩ {τ = k} ∈ Fτ ∩Fk for alle B ∈ Fk. ♦ 

Ma 6 For enhver stoptid τ er Fτ = σ( 

nFτ∧n). 

Bevis. Inklusionen ⊇ er åbenbar, da Fτ∧n ⊆Fτ for alle n ≥ 0, og den anden fås af identiteten 

B = 

∞ 

B ∩ {τ = n} ∪ B ∩ {τ = ∞}, 

n=0 

idet B ∩ {τ = n} ∈ Fτ ∩Fn = Fτ∧n for alle n og alle B ∈ Fτ og 

F∞ = B := {B ∈ F∞ |B ∩ {τ = ∞} ∈ σ( 

Fτ∧n)}. 

200 

n

B er nemlig en σ-algebra, som indeholder ethvert Fn, thi for n ≥ 0 og B ∈ Fn er 

B ∩ {τ = ∞} = 

∞ 

B ∩ {τ ≥ k} og B ∩ {τ ≥ k} ∈ Fτ∧k for k ≥ n. ♦ 

k=n 

Ma 7 Lad (Xn)n≥0 betegne en tilpasset proces og τ en stoptid, så at Xτ er P-integrabel, 

dvs. element i L 1 (P). Da er for enhver stoptid σ 

E[Xτ |Fσ] = E[Xτ |Fτ∧σ]. 

Bevis. Ifølge Ma 3 og Ma 4 er {σ < τ} og Xτ · 1 {τ≤σ} begge Fτ∧σ-målelige. Egenskaber 

ved betingede middelværdier viser derfor, at E[Xτ |Fσ] er lig 

Xτ · 1 {τ≤σ} + E[Xτ · 1 {σ

Endvidere viser Jensen’s ulighed for betingede middelværdier flg. resultat. Bemærk at da 

konvekse funktioner er kontinuerte, er de specielt Borel målelige. 

Ma 8 For enhver en reel konveks funktion ϕ : R → R gælder 

(Xn,Fn)n≥0 martingal og ϕ(Xn) ∈ L 1 (P) n ≥ 0 ⇒ (ϕ(Xn),Fn)n≥0 submartingal. 

Beviset, der beror på at 

E[ϕ(Xn+1)|Fn] ≥ ϕ(E[Xn+1 |Fn]) = ϕ(Xn), 

afslører, at hvis ϕ er konveks og voksende, så er konklusionen den samme for enhver submartingal 

(Xn,Fn)n≥0. Læseren opfordres til at formulere tilsvarende udsagn angående 

transformation af supermartingaler med konkave funktioner. 

Som det ses, betragtes her kun sub- og supermartingaler bestående af integrable variable, 

dvs. elementer i L 1 (P). Det har derfor mening at tale om den tilhørende middelværdifunktion 

n ↦→ E[Xn], og det ses let, at denne er voksende for submartingaler, aftagende for supermartingaler 

og konstant for martingaler. Ligeledes har det mening at undersøge, om processen er 

begrænset i L 1 , dvs. om 

supE[|Xn|] 

< ∞. 

n 

Lighederne |x| = 2x + − x = 2x − + x viser i denne sammenhæng, at 

E[|Xn|] = 2 · E[X + n ] − E[Xn] ≤ 2 · E[X + n ] − E[X0] n ≥ 0, 

hvis (Xn,Fn)n≥0 er en submartingal, og tilsvarende 

E[|Xn|] = 2 · E[X − n ]+E[Xn] ≤ 2 · E[X − n ]+E[X0] n ≥ 0, 

hvis (Xn,Fn)n≥0 er en supermartingal. Dvs. 


En submartingal (Xn,Fn)n≥0 er begrænset i L 1 ⇔ supE[X 

n 

+ n ] < ∞, 

en supermartingal (Xn,Fn)n≥0 er begrænset i L 1 ⇔ supE[X 

n 

− n ] < ∞, 

Specielt er enhver ikke-positiv submartingal hhv. enhver ikke-negativ supermartingal begrænset 

i L 1 . 

I forbindelse med teorien om uafhængige stokastiske variable findes der mange eksempler på 

martingaler. Følgende er specielt vigtige. Se Hoffmann sektion 7.6 for yderligere eksempler. 

Ma 9 Lad (Xn)n≥0 betegne en følge af uafhængige integrable stokastiske variable. Definer 

Sn := 

n 

n 

∑ Xj, Pn := ∏ Xj og Fn := σ(X0,...,Xn) n ≥ 0. 

j=0 

j=0 

202

Da gælder. 

1) (Sn,Fn)n≥0 er en martingal, hvis E[Xn] = 0 for alle n, en submartingal, hvis E[Xn] ≥ 0 

for alle n og en supermartingal, hvis E[Xn] ≤ 0 for alle n. 

Hvis yderligere Xn’erne alle har middelværdi 0 og endelig varians, er 

(S 2 n − 

n 

∑ 

j=0 

Var(Xj),Fn)n≥0 også en martingal. 

2) (Pn,Fn)n≥0 er en martingal, hvis E[Xn] = 1 for alle n. Hvis Xn’erne yderligere er ikke negative, 

er (Pn,Fn)n≥0 en submartingal hhv. en supermartingal, hvis E[Xn] ≥ 1 hhv. E[Xn] ≤ 1 

for alle n. 

Bemærkning. Da det kun udnyttes, at Sn og Pn er Fn-målelige, samt at Xn er uafhængig af 

Fn−1, gælder resultatet for ethvert filter med denne egenskab. 

En anden vigtig type er de såkaldte Lévy martingaler, dvs. processer på formen 

(E[X |Gn],Gn)n≥0, 

hvor (Gn)n≥0 er et filter og X et vilkårligt element i L 1 (P). Ifølge Bm 16’ er variablene i 

en Lévy martingal uniformt integrable, og vi skal senere se, at enhver unifomt integrabel 

martingal omvendt også er en Lévy martingal. 

Lad mig også nævne den såkaldte Doob dekomposition. Lad (Xn,Fn)n≥0 være en tilpasset 

integrabel proces, dvs. Xn ∈ L 1 (P,Fn) for n ≥ 0. For n ≥ 1 er 

Xn = X0 + 

n 

∑ 

k=1 

ΔXk = X0 + 

n 

∑ 

k=1 

E[ΔXk |Fk−1]+ 

n 

∑ 

k=1 

(ΔXk − E[ΔXk |Fk−1]), 

dvs. dekompositionen Xn = X0 + An + Mn for n ≥ 0, hvor A0 = M0 ≡ 0 og 

An = 

n 

∑ E[ΔXk |Fk−1] og Mn = 

k=1 

n 

∑ 

k=1 

(ΔXk − E[ΔXk |Fk−1]) 

for n ≥ 1. Processerne (An)n≥0 og (Mn)n≥0 er begge (Fn)n≥0-tilpassede og integrable, og 

ved nærmere eftersyn ses, at 

dvs. 

(Mn,Fn)n≥0 er en martingal og (An)n≥0 en såkaldt (Fn)−predictabel proces, 

A0 er F0-målelig og An er Fn−1-målelig for alle n ≥ 1. 

Hvis (Xn,Fn)n≥0 er en submartingal og derfor E[ΔXn |Fn−1] ≥ 0 for alle n ≥ 1, er (An)n≥0 

en voksende proces, dvs. 0 ≤ An ≤ An+1 P-n.o. for n ≥ 0. 

Overvejelserne kan sammenfattes i flg. udsagn: 

Doob’s Dekompositionssætning. 

Enhver (Fn)n≥0-tilpasset integrabel proces (Xn)n≥0 kan skrives på formen 

Xn = Mn + An n ≥ 1 X0 = M0, 

203

hvor (Mn,Fn)n≥0 er en martingal og (An)n≥0 en (Fn)-predictabel proces. Fremstillingen er 

P-entydig, dvs. P(Mn = ˜Mn) = P(An = Ãn) = 1 for n ≥ 0 for enhver lignende repræsentation 

Xn = ˜Mn + Ãn n ≥ 1 X0 = ˜M0, 

Hvis (Xn,Fn)n≥0 er en sub - hhv. en supermartingal, er (An)n≥0 hhv.(−An)n≥0 en voksende 

integrabel proces. 

Lignende overvejelser viser, at hvis (Xn,Fn)n≥0 er en martingal og (Vn)n≥1 en predictabel 

proces, hvor Vn er begrænset for alle n, så er 

E[Vk · ΔXk |Fk−1] = Vk · E[ΔXk |Fk−1] = 0 for alle k ≥ 1. 

Dette giver derfor anledning til flg. resultat. 

Martingal Transforms. 

Lad (Xn,Fn)n≥0 betegne en martingal og (Vn)n≥0 en (Fn)-predictabel proces, hvor Vn er 

begrænset for alle n ≥ 0. Da er (V • Xn,Fn)n≥0 en martingal, hvor 

V • Xn := V0 · X0 + 

n 

∑ 

k=1 

Vk · ΔXk n ≥ 0. 

Hvis (Xn,Fn)n≥0 en sub - / supermartingal, er (V •Xn,Fn)n≥0 en proces af samme type, hvis 

Vn’erne yderligere er ikke-negative. Processer af typen (V • Xn) omtales i litteraturen under 

navnet martingal transforms. 

Martingalerne har mange interessante egenskaber, og vi skal i det følgende gennemgå nedenstående 

fundamentale resultater. Beviserne er samlet i de efterfølgende afsnit. 

Sætning Ma 1. Optional Sampling. (skrabet udgave) 

Lad (Xn,Fn)n≥0 betegne en martingal. Den standsede proces (Xτ∧n,Fn)n≥0 er da en martingal 

for enhver stoptid τ, og for ethvert par af begrænsede stoptider 0 ≤ σ ≤ τ er Xτ og 

Xσ elementer i L 1 (P) og 

E[X0] = E[Xσ] = E[Xτ] samt E[Xτ |Fσ] = Xσ P -n.o. 

Der gælder tilsvarende resultater for sub - / supermartingaler med = erstattet af det relevante 

ulighedstegn. Ifølge Bm 5 og 16 kan første del præciceres som følger. 

Korollar Lad (Xn,Fn)n≥0 betegne en sub - / supermartingal, der er begrænset i L 1 (P), da 

er (Xτ∧n,Fn)n≥0 for enhver stoptid τ en proces af samme type. For martingaler bevares 

uniform integrabilitet ligeledes ved standsning. 

Sætning Ma 2. Maksimaluligheder. 

Lad (Xn,Fn)n≥0 betegne en submartingal og lad λ > 0 være givet. Da gælder for alle n ≥ 1 

λ · P( min 

0≤k≤n Xk < −λ) ≤ E[X + n ] − E[X0] 

λ · P( max 

0≤k≤n Xk > λ) ≤ E[Xn, max 

0≤k≤n Xk > λ] ≤ E[X + n ], 

204

hvilket ved addition viser, at for alle n ≥ 1 og λ > 0 er 

λ · P( max 

0≤k≤n |Xk| > λ) ≤ 3 · max 

0≤k≤n E[|Xk|]. 

Den sidste ulighed gælder også for supermartingaler. Lader vi n → ∞ fås derfor 

λ · P(sup 

k 

hvilket leder til flg. korollar. 

|Xk| > λ) ≤ 3 · supE[|Xk|] 

for λ > 0, 

k 

Korollar. For enhver L 1 -begrænset sub - eller supermartingal (Xn,Fn)n≥0, specielt enhver 

ikke-negativ supermartingal, er 

P(sup 

k 

|Xk| < ∞) = 1. 

Ved integration og anvendelse af Fubini’s Sætning kan maksimalulighederne omdannes til 

momentuligheder. Et vigtigt eksempel er den såkaldte Doob’s Ulighed. Tilfældet p = 2 er 

specielt vigtigt. 

Korollar. Doob’s Ulighed. 

Lad (Xn,Fn)n≥0 betegne en martingal eller ikke-negativ submartingal. Da gælder for ethvert 

p > 1 med tilhørende konjugerede tal q = p/(p − 1), at 

og dermed 

max 

0≤k≤n |Xk|p ≤ q · Xn p for alle n ≥ 0 

E[sup |Xn| 

n 

p ] ≤ q p · sup E[|Xn| 

n 

p ]. 

Sætning Ma 3. Opkrydsningsuligheder. 

Lad (Xn,Fn)n≥0 betegne en supermartingal. Da gælder 

(s − r) · E[U n r,s] ≤ E[(Xn − r) − ] ≤ E[X − n ]+|r| 

for alle n ≥ 1 og alle reelle tal r < s, hvor U n r,s er antallet af opkrydsninger over [r,s] i 

tidsintervallet [0,n]. Ved brug af Monoton konvergens fås derfor, at 

(s − r) · E[sup U 

n 

n r,s ] ≤ sup E[X 

n 

− n ]+|r|. 

Det totale antal opkrydsninger over [r,s], dvs. Ur,s := sup n U n r,s, er derfor endelig P-n.o., hvis 

sup k E[X − k ] < ∞, dvs. hvis processen er begrænset i L1 . 

Sætning Ma 4. Martingalkonvergenssætninger. 

Lad (Xn,Fn)n≥0 betegne en sub- eller supermartingal. Da eksisterer limn Xn(ω) i R for Pn.a. 

ω hvis sup k E[|Xk|] < ∞, og grænsefunktionen er P-integrabel. Udtrykt ved hjælp af X∞ 

kan dette formuleres som 

sup 

k 

E[|Xk|] < ∞ ⇒ Xn → X∞ P-n.o. og X∞ ∈ L 1 (P). 

205

Enhver ikke-negativ supermartingal specielt enhver ikke-negativ martingal konvergerer derfor 

P-n.o. Kombineres med Sætning 6 fås endvidere. 

Korollar For enhver uniformt integrabel sub- eller supermartingal (Xn,Fn)n≥0 gælder 

X∞ ∈ L 1 (P) og Xn → X∞ P-n.o. og i P-middel. 

Det er nærliggende at undersøge sammenhængen mellem Xn og E[X∞ |Fn], dvs. undersøge 

om martingal- h.h.v. sub- eller supermartingalegenskaben udvider til ’tidspunkt ∞’. Resultatet, 

der formuleres som endnu et korollar konvergenssætningen, omtaler kun martingaler 

og submartingaler, men der gælder selvfølgeligt et tilsvarende resultat for supermartingaler. 

Korollar For enhver submartingal (Xn,Fn)n≥0 gælder 

{X + n |n ≥ 1} er uniformt integrabel ⇒ Xn ≤ E[X∞ |Fn] P-n.o. for n ≥ 0, 

og hvis (Xn,Fn)n≥0 er en martingal gælder tilsvarende 

{Xn |n ≥ 1} er uniformt integrabel ⇒ Xn = E[X∞ |Fn] P-n.o. for n ≥ 0. 

Bemærk at sidste del sammen med Bm 16 viser, at mængden af Lévy martingaler er identisk 

med mængden af uniformt integrable martingaler. 

Det er relevant eksplicit at formulere yderligere to konsekvenser af martingalkonvergenssætningen. 

Lévy’s Sætning 

For ethvert X ∈ L 1 (P) og ethvert filter (Gn)n≥0 med G∞ := σ( 

nGn) konvergerer 

E[X |Gn] → E[X |G∞] P-n.o. og i L 1 (P). 

D.v.s. E[X |Gn] → X P-n.o. og i L 1 , hvis X er G∞-målelig. Endvidere gælder for enhver (Gn)stoptid 

τ, at hvis Xn = E[X |Gn] for n ≥ 0, så er 

Xτ = E[X |Gτ] P-n.o. 

L p -konvergens. (p > 1) 

For enhver martingal (Mn,Fn)n≥0 og ethvert p > 1 gælder : 

supE[|Mn| 

n 

p ] < ∞ ⇔ limMn eksisterer P-n.o. og i L 

n p (P). 

Sætning Ma 5. Optional Sampling. 

Lad (Xn,Fn)n≥0 betegne en martingal og lad σ ≤ τ betegne to stoptider, hvor τ er optional 

for (Xn)n≥0. Da er Xτ og Xσ elementer i L 1 (P) og 

E[X0] = E[Xσ] = E[Xτ] samt E[Xτ |Fσ] = Xσ P -n.o. 

Der gælder et tilsvarende resultat for sub- og supermartingaler med = erstattet af det relevante 

ulighedstegn. Optionalitetskravet kan her svækkes lidt, idet det for en submartingal er 

nok, at τ er optional for processen (X + n )n≥0, og tilsvarende for en supermartingal nok at τ er 

optional for (X − n )n≥0. Specielt har vi derfor flg. korollar. 

Korollar Lad (Xn,Fn)n≥0 betegne en ikke-negativ supermartingal. Da er Xτ ∈ L 1 (P) for 

enhver stoptid τ, og for ethvert par af stoptider σ ≤ τ gælder 

E[X∞] ≤ E[Xτ] ≤ E[Xσ] ≤ E[X0] samt E[Xτ |Fσ] ≤ Xσ P -n.o. 

206

Sætning Ma 1 og Ma 2. 

Bevis for ætning Ma 1 (submartingal tilfældet). Lad τ betegne en stoptid. Da 

|Xτ∧n| ≤ 

n 

n−1 

∑ |Xk| og Xτ∧n = ∑ 1 {τ=k}Xk + 1 {τ≥n}Xn 

k=0 

k=0 

er Xτ∧n integrabel og Fn-målelig for alle n ≥ 0. Ligeledes gælder for ethvert n ifølge regnereglerne 

for betingede middelværdier, da 

at 

1 {τ≤n}Xτ = 1 {τ≤n}Xτ∧n og {τ > n} er Fn-målelige, 

E[X τ∧(n+1) |Fn] = E[1 {τ≤n}Xτ + 1 {τ>n}Xn+1 |Fn] = 

1 {τ≤n}Xτ + 1 {τ>n} · E[Xn+1 |Fn] ≥ 1 {τ≤n}Xτ + 1 {τ>n}Xn = Xτ∧n. 

Dette viser den første påstand. Lad dernæst σ og τ betegne to begrænsede stoptider, så at 

σ ≤ τ. Der findes altså et helt tal m ≥ 1, så at P(σ ≤ τ ≤ m) = 1. Integrabiliteten af Xτ og 

Xσ følger som ovenfor, og ifølge det netop viste er 

E[Xτ |Fn] = E[Xτ∧m |Fn] ≥ Xτ∧n P-n.o. 

for alle 0 ≤ n ≤ m. Men heraf fås ifølge Ma 5, at 

E[Xτ |Fσ] = 

m 

m 

∑ E[Xτ |Fn] · 1 {σ=n} ≥ ∑ Xτ∧n · 1 {σ=n} = Xτ∧σ = Xσ P-n.o.. 

n=0 

n=0 

Uligheden E[Xσ] ≤ E[Xτ] følger herefter umiddelbart ved at tage middelværdi på begge sider, 

og ved et passende valg af begrænsede stoptider indeholder denne som et specialtilfælde også 

uligheden E[X0] ≤ E[Xσ]. ♦ 

Som en umiddelbar konsekvens ses at for enhver stoptid τ og ethvert n ≥ 0 er 

i martingaltilfældet og 

Xτ∧n = E[Xn |Fτ∧n] 

X + τ∧n ≤ E[X+ n |Fτ∧n] 

i submartingaltilfældet. Dette viser ved brug af Bm 16 umiddelbart den formulerede præcisering 

af første del af sætningen. 

Som en første anvendelse af den viste skrabede udgave af Optional Sampling vises Sætning 

Ma 2. Lad derfor (Xn,Fn)n≥0 betegne en submartingal og lad λ > 0 være givet. Definer, 

idet inf /0 := ∞, 

τ λ := inf{n ≥ 0|Xn > λ} og σ λ := inf{n ≥ 0|Xn < −λ}. 

Da (Xn)n≥0 er tilpasset, er τ λ og σ λ stoptider, og for alle n gælder 

{ max 

0≤k≤n Xk > λ} = {τ λ ≤ n} = {Xτ λ ∧n > λ} ∩ {τ λ ≤ n} 

207


{ min 

0≤k≤n Xk < −λ} = {σ λ ≤ n} = {−Xσ λ ∧n > λ} ∩ {σ λ ≤ n}. 

Ifølge den ovenfor viste ’skrabede udgave’ af Optional Sampling gælder derfor for alle n, da 

{τ λ ≤ n} ∈ Fτ λ ∧n og tilsvarende {σ λ > n} = {σ λ ≤ n} c ∈ Fσ λ ∧n, at 


λ · P( max 

0≤k≤n Xk 

 

> λ) = λ · P(τλ ≤ n) = λ dP ≤ 

{τλ ≤n} 

Xτλ ∧n dP 

{τλ ≤n} 

≤ E[Xτ λ ∧n, τ λ ≤ n] ≤ E[Xn, τ λ ≤ n] ≤ E[X + n ,τ λ ≤ n] ≤ E[X + n ]. 

λ · P( min 

0≤k≤n Xk < −λ) = λ · P(σ λ ≤ n) = 

 

 

λ dP ≤ −Xσλ ∧n dP 

{σλ ≤n} 

{σλ ≤n} 

≤ E[−Xσ λ ∧n, σ λ ≤ n] = E[Xσ λ ∧n, σ λ > n] − E[Xσ λ ∧n] 

≤ E[Xn, σ λ > n] − E[Xσ λ ∧n] ≤ E[X + n 

] − E[X0]. 

Da absolutværdien af en martingal er en submartingal, gælder specielt. 

Doob’s Ulighed. 

Lad (Xn,Fn)n≥0 betegne en martingal. Da gælder for alle λ > 0 og n ≥ 0 

λ · P( max 

0≤k≤n |Xk| > λ) ≤ E[|Xn|, max 

0≤k≤n |Xk| > λ ] 

og dermed (se nedenstående momentulighed) for alle p > 1 

max 

0≤k≤n |Xk|p ≤ p/(p − 1) · Xn p n ≥ 0. 

Momentulighed. 

Lad X og Y betegne ikke-negative stokastiske variable. Hvis 

er 

P(X > λ) ≤ E[Y/λ, X > λ ] for alle λ > 0, 

E[X p ] 1/p ≤ p/(p − 1) · E[Y p ] 1/p 

for alle p > 1. 

Bevisskitse. Integrationsformlen for ikke negative integranter viser sammen med Tonelli’s 

Sætning at ∞ 

P(X > λ) · pλ p−1 dλ = E[X p ] 

og ∞ 

0 

0 

E[Y/λ, X > λ ] · pλ p−1 dλ = p 

p − 1 E[X p−1 ·Y ]. 

Hvoraf uligheden følger ved brug af Hölder’s Ulighed. 

208

Sætning Ma 3 og Ma 4. 

Bevis for Sætning Ma 3. Lad (Xn,Fn)n≥0 betegne en supermartingal og r < s reelle tal. Da 

(Xn)n≥0 er tilpasset, definerer 

τ1 := inf{n ≥ 0|Xn < r} og σ1 := inf{n ≥ τ1 |Xn > s} 

τk := inf{n ≥ σk−1 |Xn < r} og σk := inf{n ≥ τk |Xn > s} k > 1 

stoptider, så at τ1 ≤ σ1 ≤ τ2 ≤ σ2 ≤ ···. Bemærk at σk ≥ k samt at Xτk < r på {τk < ∞} og 

tilsvarende Xσk > s på {σk < ∞} og dermed da τk ≤ σk 

Xσk − Xτk > s − r på {σk < ∞}. 

Herudfra defineres for ethvert n ≥ 1 antallet af opkrydsninger U n r,s over intervallet [r,s] i 

tidsrummet {0,1,...n} som 

U n r,s := sup{k |σk ≤ n} = 

n 

∑ 1 {σk≤n}, 

k=1 

hvor sidste lighedstegnet skyldes at σn+1 > n. For ethvert n, k ≥ 1 er 

dvs. 

og dermed 

+ 

n 

∑ 

k=1 

n 

1 {τk≤n} = 1 {σk≤n} + 1 {τk≤n

Korollar Lad (Xn,Fn)n≥0 betegne en sub- eller en supermartingal, som er begrænset i 

L 1 (P), dvs. sup n E[|Xn|] < ∞. Da er 

P(−∞ < liminf 

n 

dvs. limn Xn(ω) eksisterer i R for P-n.a. ω. 

Xn = limsup Xn < ∞) = 1, 

n 

Bevis. Den simple sammenhæng mellem sub - og supermartingaler viser, at vi uden tab af 

generalitet kan antage, at (Xn,Fn)n≥0 er en supermartingal. Da 

sup 

n 

E[|Xn|] < ∞ ⇒ P(sup|Xn| 

< ∞) = 1 

n 

ifølge maksimalulighederne, udestår kun at vise, at lighedstegnet holder P-n.o. Men gælder 

dette ikke, eksisterer der, da R er separabel, reelle tal r < s, så at 

0 < P(liminf 

n 

Xn < r < s < limsup 

n 

Xn) ≤ P(supU 

n 

n r,s = ∞), 

hvilket strider mod Sætning Ma 3, da E[sup nU n r,s ] = supn E[U n r,s ] < ∞. ♦ 

Bemærkning. Da E[|Xn|] = E[Xn] ≤ E[X0] for en ikke-negativ supermartingal (Xn,Fn)n≥0 

er en sådan altid konvergent P-n.o. 

Med X∞ defineret på sædvanlig vis, kan det viste formuleres som. 

Martingal Konvergenssætningen. 

For enhver sub- eller supermartingal (Xn,Fn)n≥0 gælder 

sup 

k 

E[|Xk|] < ∞ ⇒ Xn → X∞ P-n.o. og X∞ ∈ L 1 (P). 

Hvis {Xn |n ≥ 0} er uniformt integrabel, er der yderligere konvergens i L 1 (P). 

Integrabiliteten følger af Fatou’s Lemma, idet 

E[|X∞|] ≤ liminf 

n 

E[|Xn|] ≤ supE[|Xn|] 

< ∞, 

n 

og konvergensen i L 1 (P) følger dernæst af Sætning 6. Det sidste punkt kan præciseres yderligere. 

Korollar For enhver martingal (Xn,Fn)n≥0 gælder 

{Xn |n ≥ 0} uniformt integrabel ⇒ Xn = E[X∞ |Fn] P-n.o. n ≥ 0, 

og hvis (Xn,Fn)n≥0 er en submartingal gælder 

{X + n |n ≥ 0} uniformt integrabel ⇒ Xn ≤ E[X∞ |Fn] P-n.o. n ≥ 0, 

Bevis. Da betinget middelværdi er en kontraktion i L 1 (P), har vi 

Xk → X∞ i L 1 (P) ⇒ E[Xk |Fn] →k→∞ E[X∞ |Fn] i L 1 (P) 

210

for alle n, hvoraf martingaltilfældet umiddelbart følger, da 

Xn = E[Xk |Fn] P-n.o. for k ≥ n. 

Betragt dernæst submartingaltilfældet. Antagelsen sikrer at sup k E[|Xk|] < ∞ og dermed 

Xn → X∞ P-n.o. For ethvert m ≥ 0 konvergerer derfor 

Xn ∨(−m) → X∞ ∨(−m) P-n.o., 

og også i L 1 (P), idet {Xn ∨(−m)|n ≥ 0} er uniformt integrabel, da 

|Xn ∨(−m)| ≤ X + n 

+ m for alle n, m ≥ 0. 

Ved fornyet brug af, at betingede middelværdier er kontraktioner i L 1 (P), fås derfor 

E[Xk ∨(−m)|Fn] →k→∞ E[X∞ ∨(−m)|Fn] i L 1 (P) 

for alle n ≥ 0, og dermed Xn ≤ E[X∞ ∨(−m)|Fn] P-n.o. for alle m ≥ 0, da 

Xn ≤ Xn ∨(−m) ≤ E[Xk ∨(−m)|Fn] P-n.o. 

for alle n ≤ k. Det ønskede resultat følger nu ved grænseovergang, idet 

E[X∞ |Fn] = inf 

m≥0 E[X∞ ∨(−m)|Fn] P-n.o. 

for ethvert n ≥ 0 ifølge Bm 7. ♦ 

Konvergenssætningen giver anledning til et par interessante korollarer. 

Lévy’s Sætning 

For ethvert X ∈ L 1 (P) og ethvert filter (Gn)n≥0 konvergerer 

E[X |Gn] → E[X |G∞] P-n.o. og i L 1 (P). 

Specielt gælder for enhver (Gn)-stoptid τ, at hvis Xn = E[X |Gn] for n ≥ 0, så er 

Xτ = E[X |Gτ] P-n.o. 

Bevis. Lad X ∈ L 1 (P) og (Gn)n≥0 være givet. (E[X |Gn],Gn)n≥0 er da en uniform integrabel 

martingal, og ifølge martingalkonvergenssætningen findes der derfor et element ˜X ∈ L 1 (P), 

som er G∞-målelig, så at 

E[X |Gn] → ˜X P-n.o. og i L 1 (P) og E[X |Gn] = E[ ˜X |Gn] P-n.o. n ≥ 0. 

For alle n ≥ 0 og alle B ∈ Gn gælder dermed 

 

 

X dP = E[X |Gn]dP = 

B 

B 

B 

 

E[ ˜X |Gn]dP = 

B 

˜X dP. 

Men ifølge det andet korollar til Proposition 5 viser dette, da 

nGn er en algebra, som frembringer 

G∞, netop ligheden 

˜X = E[X |G∞] P-n.o. 

211

og dermed sætningens første del. Da X∞ = E[X |G∞] P-n.o. ifølge det netop viste, fås af 

Ma 5, at 

Xτ = ∑ Xk · 1 {τ=k} = ∑ E[X |Gk] · 1 {τ=k} = E[X |Gτ]. ♦ 

k∈N0 ∪{∞} 

k∈N0 ∪{∞} 

Bemærkning. Da enhver betinget middelværdi er en kontraktion i L 1 (P) kan Levý’s Sætning 

suppleres med implikationen 

Xn → X i L 1 (P) ⇒ E[Xn |Gn] → E[X |G∞] i L 1 (P). 

og der er konvergens P-n.o. og i L 1 (P), hvis Xn → X P-n.o. og sup n |Xn| ∈ L 1 (P). 

L p -konvergens. (p > 1) 

For enhver martingal (Mn,Fn)n≥0 og ethvert p > 1 gælder : 

supE[|Mn| 

n 

p ] < ∞ ⇔ limMn eksisterer P-n.o. og i L 

n p (P). 

Bevis. Implikationen ⇐ er en umiddelbar konsekvens af definitionen på L p -konvergens. 

Men hvis sup n E[|Mn| p ] < ∞ er {Mn |n ≥ 0} uniformt integrabel, og ifølge martingal konvergenssætningen 

findes der derfor et M ∈ L 1 (P,F∞), så at 

Ifølge Fatou’s Lemma gælder derfor 

dvs. M ∈ L p (P), og da 

Mn = E[M |Fn] og Mn → M P-n.o. 

E[|M| p ] ≤ liminf 

n 

E[|Mn| p ] ≤ supE[|Mn| 

n 

p ] < ∞, 

|Mn| p ≤ E[|M| p |Fn] P-n.o. for alle n ≥ 0 

ifølge Jensen’s ulighed for betingede middelværdier, har vi alt i alt, at limn Mn eksisterer Pn.o. 

og {|Mn| p |n ≥ 0} er uniformt integrabel. L p (P)-konvergensen følger derfor af korollaret 

til Sætning 6. ♦ 

Det netop formulerede resultat gælder generelt ikke for p = 1, men hvis den betragtede 

martingal er afsnitsfølgen hørende til en sum af uafhængige centrerede variable, kan man 

ved hjælp af korollaret til Ottavianis ulighed vise flg. resultat. Sammenlign med LLN 2. 

L 1 -konvergens for summer af uafhængige variable. 

For enhver følge (Xi)i≥1 af uafhængige integrable stokastiske variable med tilhørende afsnitssummer 

Sn := ∑ n i=1 Xi for n ≥ 1 gælder 

lim Sn eksisterer P-n.o. og i L 

n 1 (P) ⇔ supE[|Sn|] 

< ∞ og limE[Sn] eksisterer. 

n 

n 

Biimplikationen gælder uændret, hvis hvis højresiden erstattes af 

supnE[|Sn|] < ∞ og (Sn)n≥1 konvergent i fordeling. 

212

Bevis. Kun ⇐ kræver et bevis, og da |E[Sn]| ≤ E[|Sn|] for alle n ses, at under højresidens 

antagelser er supn E[|Sn − E[Sn]|] < ∞, og 

 

(Sn − E[Sn])n = 

 

n 

∑ (Xi − E[Xi]) 

i=1 

dermed en L 1 -begrænset martingal. Ifølge martingalkonvergenssætningen gælder derfor, at 

og da 

E[sup 

n 

lim n (Sn − E[Sn]) eksisterer P -n.o., 

|Sn − E[Sn]|] ≤ 6 · supE[|Sn 

− E[Sn]|] < ∞ 

n 

ifølge korollar 2 til Ottaviani’s ulighed, er der også konvergens i L 1 (P). Addition af den 

konvergente følge (E[Sn])n≥1 giver derfor umiddelbart det første resultat. 

Hvis sup n E[|Sn|] < ∞ i stedet suppleres med den anden antagelse, konvergerer 

De to funktionsfølger 

(Sn)n≥1 og (Sn − E[Sn])n≥1 begge i fordeling. 

(ϕSn (t))n≥1 og (e −iE[Sn]t · ϕSn (t))n≥1 

konvergerer derfor begge mod en karakteristisk funktion. Men da enhver sådan er kontinuert 

og 1 i 0 følger ved division, at 

lim n e iE[Sn]t eksisterer for alle t ∈ R. 

Men da vi endvidere pr. antagelse ved, at (E[Sn])n≥1 er en begrænset følge, viser et simpelt 

delfølge argument, at limn E[Sn] eksisterer i R. Resultatet følger derfor af det ovenstående.♦ 

Bemærkning. Betragtes den deterministiske og dermed uafhængige følge Xi :≡ (−1) i for 

i ≥ 1 ses, at konvergens ikke følger ud fra en antagelse om blot sup n E[|Sn|] < ∞. 

213 

n

Optionalitet. 

Lad i dette afsnit (Fn)n≥0 betegne et filter i F , og lad det være underforstået at udtryk 

som tilpassethed og stoptidsegenskab altid er m.h.t.(Fn)n≥0. Endvidere betegner (Yn)n≥0 en 

given tilpasset reel proces. 

Notation. En stoptid τ siges at være optional for (Yn)n≥0, hvis {Yτ∧n |n ≥ 0} er uniformt 

integrabel. 

Da den indførte definition af Yτ bevirker, at |Yτ| ≤ liminfn |Yτ∧n| P-n.o., og dermed ifølge 

Fatou’s Lemma, at 

E[|Yτ|] ≤ liminf 

n 

E[|Yτ∧n|] ≤ supE[|Yτ∧n|], 

n 

ses, at integrabilitet af Yτ er en nødvendig betingelse for optionalitet. D.v.s. vi har implkationen 

τ optional for (Yn)n≥0 ⇒ Yτ ∈ L 1 (P). 

Betingelsen er dog generel ikke tilstrækkelig, og vi vil nedenfor undersøge, hvad der yderligere 

skal til. Men inden udnyttes de tidligere viste kriterier for uniform integrabilitet, se 

f.eks. øvelsene 16 og 17, Lemma 10 med korollarer, Sætning 6 og Proposition 11, til at liste 

en række tilstrækkelige betingelser, som hver især sikrer optionalitet. 

Kriterier for optionalitet. 

En stoptid τ er optional for (Yn)n≥0 i hver af de følgende fire situationer. 

a) Der findes et Y ∈ L 1 (P), så at |Yτ∧n| ≤ Y P-n.o. for alle n ≥ 0, eller ækvivalent hvis 

sup n |Yτ∧n| ∈ L 1 (P). 

b) For ethvert ε > 0 findes der elementer Mε og (Zε,n)n≥1 i L 1 (P)+, så at 

E[Zε,n] ≤ ε og |Yτ∧n| ≤ Mε + Zε,n P-n.o. for alle n ≥ 0. 

c) Der findes et α > 1, så at sup n E[|Yτ∧n| α ] < ∞. 

d) limnYτ∧n eksisterer i L 1 (P). 

Bemærk at Bm 16 og 16" også kan bruges til at vise optionalitet. 

a) er opfyldt i flg. to specialtilfælde. 

a1) τ begrænset stoptid og Yn’erne integrable; thi er M en konstant, der dominerer τ, gælder 

her 

|Yτ∧n| ≤ 

M 

∑ |Yk| ∈ L 

k=0 

1 (P) for alle n ≥ 0. 

a2) E[τ] og E[|Y0|] endelige samt |Yn −Yn−1| ≤ M < ∞ P-n.o. for alle n ≥ 1; thi her gælder 

Opskrivningerne 

τ∧n 

|Yτ∧n| ≤ |Y0|+ ∑ |Yk −Yk−1| ≤ |Y0|+M · τ. 

k=1 

Yτ∧σ∧n = 1 {σ>τ}Yτ∧n + 1 {σ≤τ}Yσ∧n, Y (τ∨σ)∧n = 1 {σ

og dermed |Yτ∧σ∧n|∨|Y (τ∨σ)∧n| ≤ |Yτ∧n|+|Yσ∧n| viser, at mængden af optionale stoptider er 

stabil under max og min, dvs. 

τ og σ optionale for (Yn)n≥0 ⇒ τ ∧ σ og τ ∨ σ optionale for (Yn)n≥0. 

Som allerede nævnt er integrabilitet af Yτ nødvendig for optionalitet af τ, og vi vil nu se 

undersøge på, hvad der yderligere skal til. Ligheden 

Yτ∧n = 1 {τ>n}Yn + 1 {τ≤n}Yτ 

viser, da {τ > n} og {τ ≤ n} er disjunkte, at τ er optional, hvis og kun hvis mængderne 

{1 {τ≤n}Yτ | n ≥ 0} og {1 {τ>n}Yn |n ≥ 0} 

begge er uniformt integrable. Den første klares let, for da 1 {τ≤n}|Yτ| ↑ 1 {τn}Yτ∧n, 

at det netop er opfyldt, hvis {1 {σ≤n}Yσ |n ≥ 0} er uniformt integrabel, dvs. hvis 

E[|Yσ|,σ < ∞] < ∞. 

Men som allerede bemærket er denne egenskab også nødvendig, og vi har derfor vist. 

Opt. 2 Hvis τ er optional for (Yn)n≥0, så gælder for enhver stoptid σ ≤ τ, at 

σ er optional for (Yn)n≥0 ⇔ E[|Yσ|,σ < ∞] < ∞. 

215

Sætning Ma 5. 

Bevis for Sætning Ma 5. Lad (Xn,Fn)n≥0 være en submartingal og 0 ≤ σ ≤ τ stoptider, hvor 

τ antages optional for (X + n )n≥0, dvs. {X + τ∧n |n ≥ 0} er uniformt integrabel. Da σ ∧ n ≤ τ ∧ n 

viser den ’skrabede udgave’ af Optional Sampling at 

Xσ∧n ≤ E[Xτ∧n |Fσ∧n] og dermed X + σ∧n ≤ E[X+ τ∧n |Fσ∧n] 

for n ≥ 0, og ifølge Bm 16 er {X + σ∧n |n ≥ 0} derfor uniformt integrabel, dvs. σ er også optional 

for (X + n )n≥0. Benyttes martingal konvergenssætningen på de to submartingaler 

(Xσ∧n,Fn)n≥0 og (Xτ∧n,Fn)n≥0 

fås derfor, at Xσ og Xτ er elementer i L 1 (P) og 

Xσ∧n →n→∞ Xσ og Xτ∧n →n→∞ Xτ P-n.o. 

Korollaret til martingal konvergenssætningen viser endvidere, at 

Xτ∧n ≤ E[Xτ |Fn] P-n.o. 

og dermed ifølge den skrabede udgave af Optional Sampling 

Xσ∧n ≤ E[Xτ∧n |Fσ∧n] ≤ E[E[Xτ |Fn]|Fσ∧n] = E[Xτ |Fσ∧n]. 

Som allerede nævnt konvergerer venstresiden her P-n.o. mod Xσ, og da 

ifølge Lévy’s Sætning og Ma 6 ses at 

E[Xτ |Fσ∧n] →n→∞ E[Xτ |Fσ] P-n.o., 

Xσ ≤ E[Xτ |Fσ] P-n.o. 

og dermed også uligheden E[Xσ] ≤ E[Xτ]. ♦ 

I martingaltilfældet gælder tilsvarende formler blot med lighedstegn overalt. Som en konsekvens 

af Ma 7 og det viste resultat har vi flg. korollar. 

Korollar. Lad (Xn,Fn)n≥0 være en martingal og τ en stoptid, som er optional for (Xn)n≥0. 

Da er 

Xσ∧τ = E[Xτ |Fσ] P-n.o. 

for enhver stoptid σ, dvs. {Xσ |σ stoptid, σ ≤ τ} er uniformt integrabel. 

Hvis (Xn,Fn)n≥0 er en submartingal og τ optional for (X + n )n≥0, gælder tilsvarende 

Xσ∧τ ≤ E[Xτ |Fσ] P-n.o. 

for enhver stoptid σ, og mængden {X + σ |σ stoptid, σ ≤ τ} er derfor uniformt integrabel. 

216

Appendiks F. Resultater fra reel analyse. 

I forbindelse med gennemgangen af stoffet får vi brug for nogle få specielle resultater fra reel 

analyse. Da de normalt ikke vil være gennemgået i et indledende kursus i reel analyse, og 

de ikke naturligt passer ind i teksten, har jeg valgt at samle dem i dette appendiks. Vi starter 

med to resultater omhandlende funktionskonvergens dernæst lidt rækketeori for til sidst at 

omtale en vigtig egenskab ved den reelle akse. 

Weierstrass - Bernstein’s Sætning 

Til ethvert f ∈ C(R) findes der en følge af polynomier (Pn)n≥1 så at Pn(x) → f(x) uniformt 

for x ∈ [0,1]. 

Bevis. Lad f ∈ C(R) være givet. Definer for alle n ≥ 1 og x ∈ R 

Pn f(x) := 

Bemærk at for alle n ≥ 1 og x ∈ [0,1] er 

hvor S x n ∼ bi(n,x), hvor bi(n,0) := δ0. Da 

n 

n 

∑ f(k/n) · 

k 

k=0 

Pn f(x) = E[ f(S x n /n)] 

 

· x k ·(1 − x) n−k . 

E[S x n /n] = x og Var(Sx x(1 − x) 

n /n) = ≤ 

n 

1 

4n 

fås ved brug af Chebychev’s ulighed, at for alle n ≥ 1, x ∈ [0,1] og ε > 0 er 

P(|S x n/n − x| > ε) ≤ (4nε 2 ) −1 . 

Dvs. for x ∈ [0,1] har vi for alle n ≥ 1 og ε > 0 

hvor 

|Pn f(x) − f(x)| = |E[ f(S x n/n) − f(x)]| ≤ E[| f(S x n/n) − f(x)|] 

= E[| f(S x n /n) − f(x)|,|Sx n /n − x| > ε ]+E[| f(Sx n /n) − f(x)|,|Sx n /n − x| ≤ ε ] 

≤ Mf · P(|S x n/n − x| > ε)+Vf(ε) ≤ M 

+Vf(ε), 

4nε2 Mf = sup | f(t)| og Vf(ε) = sup{| f(u) − f(v)||u,v ∈ [0,1], |u − v| ≤ ε}. 

t∈[0,1] 

Men da f er kontinuert og dermed begrænset og uniformt kontinuert på [0,1], dvs. 

Mf < ∞ og Vf(ε) →ε→0 0, 

følger umiddelbart, at Pn f(x) → f(x) uniformt for x ∈ [0,1]. ♦ 

217

Helly’s Lemma 

Lad (Fn)n≥1 betegne en følge af fordelingsfunktioner. Der findes da en delfølge (σ(n))n≥1 

og en højrekontinuert voksende funktion F : R → R, så at 0 ≤ F ≤ 1 og 

F σ(n)(x) → F(x) for alle x ∈ CF, 

hvor CF betegner mænden af kontinuitetspunkter for F. Dvs. F σ(n) → F punktvis, hvis F er 

kontinuert. 

Bevis. Da mængden af rationale tal er tællelig, kan vi, da fordelingsfunktioner kun antager 

værdier i [0,1], ved successiv udtynding vælge en delfølge (σ(n))n≥1, så at 

Definitionen viser umiddelbart, at 

for vilkårlige rationale tal r1 < r2. Definer 

G(r) := lim n F σ(n)(r) eksisterer for alle r ∈ Q. 

0 ≤ G(r1) ≤ G(r2) ≤ 1 

F(x) := inf G(r) x ∈ R. 

r>x,r∈Q 

Ifølge simpel reel analyse er F ikke-aftagende og højrekontinuert samt opfylder uligheden 

0 ≤ F ≤ 1. Betragt et x ∈ R. For alle m ≥ 1 og rationale tal r, så at x − 1/m < r < x, har vi 

F(x − 1/m) ≤ G(r) = limFσ(n)(r) ≤ liminf 

n n 

Fσ(n)(x), og dermed F(x−) = supm F(x − 1/m) ≤ liminfn Fσ(n)(x). Tilsvarende gælder for alle rationale 

tal r > x, at 

limsup Fσ(n)(x) ≤ limFσ(n)(r) = G(r) 

n 

n 

og dermed limsup n F σ(n)(x) ≤ F(x), da F(x) = infr>x,r∈Q G(r) pr. definition. Alt i alt er 

F(x−) ≤ liminf 

k 

Fσ(n)(x) ≤ limsup Fσ(n)(x) ≤ F(x) 

n 

for alle x ∈ R, hvilket viser den sidste påstand. ♦ 

I forlængelse af den sidste bemærkning er det værd at nævne flg. resultat. 

Hvis (Fn)n≥1 og F er fordelingsfunktioner, og F er kontinuert, gælder 

Fn(x) → F(x) for alle x ∈ R ⇒ supx∈R|Fn(x) − F(x)| → 0, 

dvs. punktvis konvergens medfører uniform konvergens. 

218

Kronecker’s Lemma 

Lad (an)n≥1 og (bn)n≥1 betegne reelle talfølger, så at 0 < bn < bn+1 ↑ ∞. Da gælder 

∞ 

∑ an/bn konvergent i R ⇒ 

n=1 

1 

bn 

n 

∑ ai → 0. 

i=1 

Navnet Kronecker’s Lemma refererer normalt til specialtilfældet bn = n. 

Bevis. Sæt 

Dvs. rn → 0 og 

og dermed for alle n > m ≥ 1 

∞ 

rn = ∑ 

i=n 

ai/bi n ≥ 1. 

an = bn(rn − rn+1) = bn−1rn − bnrn+1 + rn(bn − bn−1) 

n m 

∑ ai = ∑ ai + 

n 

∑ (bi−1ri − biri+1)+ 

n 

∑ 

i=1 i=1 i=m+1 

i=m+1 

= 

m 

∑ ai +(bmrm+1 − bnrn+1)+ 

n 

∑ 

i=1 

i=m+1 

Ved brug af trekantsuligheden fås derfor for n > m ≥ 1 

| 1 

bn 

n 

∑ ai | ≤ 

i=1 

1 

bn 

( 

m 

∑ 

i=1 

≤ 1 

bn 

ri(bi − bi−1) 

ri(bi − bi−1). 

|ai|+sup |ri|((bm + bn)+(bn − bm))) 

i>m 

m 

∑ 

i=1 

|ai|+2sup |ri|. 

i>m 

For givet ε > 0 bestemmes først m, så at sidste led er mindre end ε/2, og for m fast går første 

led mod 0, da bn → ∞. ♦ 

Vi får yderligere brug for flg. resultat. 

Hvis en reel talfølge (an)n≥1 er enten opad eller nedad begrænset, dvs. hvis 

så er 

hvor 

lim n 

n 

supan 

< ∞ eller inf 

n 

n an > −∞, 

1 

n ∑ ai = 0 hvis lim 

n 

i=1 

νk(n) 

1 

νk(n) ∑ ai = 0 for alle k ≥ 1, 

i=1 

νk(n) := [(1+1/k) n ] for n, k ≥ 1. 

Bevis. Antag at an’erne er nedad begrænset. Ved addition med en ikke-negativ konstant M 

ses, at vi kan antage, at an’erne er ikke-negative, samt at det nu gælder om at vise konvergens 

219

mod M ud fra en antagelse om konvergens mod M. Men dette følger umiddelbart. For lader 

vi for ethvert n ≥ 2 og ethvert k νk(ln) være valgt så at 

gælder åbenbart 

og 

1 

n 

1 

n 

n 

n 

∑ ai ≤ 

i=1 

1 

νk(ln) 

∑ ai ≥ 

i=1 

for alle k og derfor 

1 

νk(ln + 1) 

νk(ln) ≤ n < νk(ln + 1), 

νk(ln+1) 

∑ ai ≤ 

i=1 

1+1/k 

νk(ln + 1) 

νk(ln) 

∑ ai ≥ 

i=1 

(1+1/k)−1 

νk(ln) 

1 

n 

n 

∑ ai → M. ♦ 

i=1 

νk(ln+1) 

∑ ai → (1+1/k) · M 

i=1 

νk(ln) 

∑ ai → (1+1/k) 

i=1 

−1 · M, 

I forbindelse med det netop viste resultat er det værd at minde om, at for enhver reel, flerdimensional 

eller kompleks talfølge (an)n≥1 gælder den vel kendte implikation 

an → a ⇒ 1 

n 

n 

∑ ai → a, 

i=1 

dvs. konvergens i sædvanlig forstand medfører konvergens i Cecaro 1-middel. 

Åbne mængder i R 

Enhver åben delmængde af den reelle akse er en højst tællelig disjunkt forening af åbne intervaller. 

Bevis. Lad G ⊆ R betegne en ikke-tom åben mængde. Idet inf /0 og sup /0 sættes til hhv. ∞ 

og −∞ defineres for ethvert x ∈ G 

xh := inf{y|y > x, y /∈ G} og xv := sup{y|y < x, y /∈ G}. 

Da G er åben, og Q er tæt i R, ses let at flg. betingelser er opfyldte for alle x ∈ G: 

samt 

a) −∞ ≤ xv < x < xh ≤ ∞. b) (xv,xh) ⊆ G. c) Q ∩ G ∩(xv,xh) = /0 

d) (xv,xh) ∩(˜xv, ˜xh) = /0 ⇒ (xv,xh) = ( ˜xv, ˜xh) for vilkårlige x, ˜x ∈ G. 

Specielt findes der altså for alle x ∈ G et ˜x ∈ Q ∩ G, så at (xv,xh) = ( ˜xv, ˜xh). 

Lader vi derfor (x(n))n≥1 betegne en nummerering af Q ∩ G har vi 

G = 

(xv,xh) = 

x∈G 

∞ 

(x(n)v,x(n)h), 

n=1 

220

og intervallerne er enten sammenfaldende eller disjunkte. Ved udtynding følger derfor, at G 

kan skrives som en højst tællelig disjunkt forening af åbne intervaller. ♦ 

Det er på sin plads at understrege, at resultatet kun gælder i dimension 1. Et ’tilsvarende’ 

resultat i højere dimensioner, som benyttes i beviset for Transformationssætningen, er flg. 

Enhver åben mængde G ⊆ R n kan skrives som en højst tællelig disjunkt foreningsmængde af 

’halvåbne’ kasser, dvs. mængder på formen 

hvor −∞ < ai < bi < ∞ for i = 1,...,n. 

n 

∏ ]ai,bi] 

i=1 

221

Appendiks G. 

Fra indledende reel analyse er det velkendt, at for reelle tal (an)n≥1 og a gælder implikationen 

an →n→∞ a ⇒ (1+ an 

n )n →n→∞ e a . 

Men i forbindelse med beviset for den klassiske udgave af Den centrale Grænseværdisætning 

udnyttedes, at resultatet også gælder for komplekse tal. Et argument herfor går som følger. 

Lad (an)n≥1 og a betegne komplekse tal, så at an →n→∞ a. Ifølge definitionen på konvergens 

af komplekse tal har vi derfor 

|an| →n→∞ |a|, ℜan →n→∞ ℜa og ℑan →n→∞ ℑa. 

Da an/n → 0 gælder derfor fra et vist trin at regne, at 

og dermed 

1+ an 

n 

= |1+ an 

n | · ei arctanθn hvor θn = ℑan/n 

1+ℜan/n , 

(1+ an 

n )n = |1+ an 

n |n · e in arctanθn . 

x ↦→ arctanx betegner her hoveddeterminationen af tan −1 . Da denne er differentiabel i 0 med 

differentialkvotient 1 og θn →n→∞ 0, fås derfor, at 

n arctanθn = n · θn · arctanθn 

θn 

Tilsvarende fås ved brug af ovenstående reelle udgave, at 

Dvs. alt i alt 

|1+ an 

n |n = ((1+ℜan/n) 2 +(ℑan/n) 2 ) n/2 

= 1+ 

= 

ℑan arctanθn 

· →n→∞ ℑa. 

1+ℜan/n θn 

 

1+ |an| 2 n1/2 

/n+2ℜan 

→n→∞ e 

n 

2ℜa = e ℜa . 

|an| 2 

n1/2 

2ℜan 

+ = 

n2 n 

lim n (1+ an 

n )n = lim n |1+ an 

n |n · lim n e inarctanθn = e ℜa · e iℑa = e a . 

222

INDHOLDSFORTEGNELSE 

Momentproblemet 139 

Den flerdimensionale normalfordeling 142 

Maksimal Uligheder 145 

De store tals love I 148 

De store tals love II 156 

Fordelingskonvergens 163 

Kriterier for konvergens i fordeling 167 

Regneregler for konvergens i fordeling 170 

Kontinuitetetssætningen for karakteristiske funktioner 172 

Den Centrale Grænseværdisætning 177 

Betingede middelværdier 186 

Martingaler 197 

Appendiks F 217 

Appendiks G 222 

223

Momentproblemet.

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?