09.11.2014 Views

Normalna aproksimacija po Steinovi metodi - Univerza v Ljubljani

Normalna aproksimacija po Steinovi metodi - Univerza v Ljubljani

Normalna aproksimacija po Steinovi metodi - Univerza v Ljubljani

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

UNIVERZA V LJUBLJANI<br />

FAKULTETA ZA MATEMATIKO IN FIZIKO<br />

Matematika — raziskovalna smer<br />

Martin Raič<br />

<strong>Normalna</strong> <strong>aproksimacija</strong> <strong>po</strong> <strong>Steinovi</strong> <strong>metodi</strong><br />

Doktorska disertacija<br />

z do<strong>po</strong>lnitvami in <strong>po</strong>pravki<br />

Izšlo junija 2006.<br />

Zadnji <strong>po</strong>pravek: 29. 6. 2010


Zahvala<br />

Mnogo je ljudi, brez katerih pričujoča disertacija še zdaleč ne bi bila takšna, kakršna<br />

je. Prav vsem iskrena hvala! Še <strong>po</strong>sebej pa bi se želel zahvaliti:<br />

• mentorju prof. dr. Mihaelu Permanu, ki me je seznanil s tem čudovitim <strong>po</strong>dročjem<br />

teorije verjetnosti, me o<strong>po</strong>zoril na nekaj novih stvari in prebral disertacijo;<br />

• prof. dr. Vidmantasu Bentkusu iz Vilniusa, ki mi je razkril <strong>po</strong>vezavo med Steinovo<br />

in Lindeberg–Bergströmovo metodo ter me seznanil z velikostnim redom Gaussovih<br />

perimetrov konveksnih množic. Slava njegovemu s<strong>po</strong>minu!<br />

• prof. dr. Andrewu D. Barbourju iz Züricha za nekaj koristnih namigov in vz<strong>po</strong>dbudne<br />

besede ter Oddelku za u<strong>po</strong>rabno matematiko Univerze v Zürichu, ki je<br />

<strong>po</strong>kril <strong>po</strong>tne stroške <strong>po</strong>letne šole iz Steinove metode leta 2003 v Singapuru;<br />

• Inštitutu matematičnih ved (Institute of Mathematical Sciences) Singapurske nacionalne<br />

univerze (National University of Singa<strong>po</strong>re), ki je <strong>po</strong>kril stroške bivanja<br />

prej omenjene <strong>po</strong>letne šole;<br />

• prof. dr. Matjažu Omladiču in prof. dr. Borisu Lavriču za terminološke nasvete;<br />

• vsem domačim, še zlasti staršem, ženi Urši, njenim staršem ter Alenki in Heleni<br />

za nesebično <strong>po</strong>d<strong>po</strong>ro, vz<strong>po</strong>dbudo, razumevanje in <strong>po</strong>moč pri varstvu.<br />

iii


Povzetek<br />

Steinova metoda je domiseln način ocenjevanja napake pri aproksimaciji <strong>po</strong>razdelitev<br />

določenih slučajnih spremenljivk, ki temelji na ocenjevanju matematičnih upanj<br />

določenih linearnih operatorjev (navadno diferencialnih ali diferenčnih). Razvita je<br />

bila najprej za normalno aproksimacijo, kasneje pa so jo modificirali še za vrsto drugih<br />

aproksimacij, med katerimi so najbolj znane Poissonova s <strong>po</strong>splošitvami, binomska,<br />

<strong>po</strong>linomska, gama in vrsta drugih.<br />

Glavna odlika Steinove metode je, da dobro deluje pri aproksimaciji vsot slučajnih<br />

spremenljivk z določeno vrsto odvisnosti, predvsem tam, kjer vrstni red seštevancev<br />

ni <strong>po</strong>memben (v nasprotju npr. z martingali). Področja u<strong>po</strong>rabe med drugim zajemajo<br />

statistiko, slučajne grafe, analizo DNK, epidemiologijo, teorijo iger, verjetnostno teorijo<br />

števil in zavarovalniško matematiko.<br />

V tem delu se osredotočimo na normalno aproksimacijo, in sicer tako eno- kot tudi<br />

večrazsežno. V dobršni meri se <strong>po</strong>svetimo reševanju Steinove enačbe, ki je ključen<br />

korak pri u<strong>po</strong>rabi metode. To je netrivialen problem v večrazsežnem primeru, ko gre<br />

za parcialno diferencialno enačbo eliptičnega tipa, ki se da rešiti s <strong>po</strong>močjo operatorskih<br />

<strong>po</strong>lgrup. Tu <strong>po</strong>kažemo, da ta konstrukcija deluje za vse zvezne testne funkcije, ki so<br />

integrabilne glede na ustrezno normalno <strong>po</strong>razdelitev.<br />

Oceno napake formuliramo v dveh oblikah. Pri prvi aproksimiramo matematična<br />

upanja dovolj gladkih testnih funkcij. To obliko ocene formuliramo v dokaj splošni<br />

obliki v eni in več dimenzijah. Pri drugi pa aproksimiramo verjetnosti, da slučajna<br />

spremenljivka pripada določenemu <strong>po</strong>ltraku na realni osi (ocene Berry–Esséenovega<br />

tipa) ali, splošneje, določeni, praviloma konveksni <strong>po</strong>množici prostoraR n . Ocene<br />

Berry–Esséenovega tipa izpeljemo v skoraj tako splošni obliki kot ocene za gladke testne<br />

funkcije (dodatno privzamemo določeno omejenost), pri večrazsežnem primeru pa se<br />

omejimo le na vsote neodvisnih slučajnih vektorjev, zato pa izboljšamo doslej znane<br />

konstante. Le-te v veliki meri temeljijo na ocenah Gaussovih perimetrov konveksnih<br />

množic, ki jih izpeljemo v eksplicitni obliki in prav tako z izboljšano konstanto.<br />

V delu <strong>po</strong>damo pregled večine konceptov odvisnosti, za katere je bila u<strong>po</strong>rabljena<br />

Steinova metoda za normalno <strong>po</strong>razdelitev. Ti med drugim zajemajo tudi koncept<br />

lokalne odvisnosti. Rezultate <strong>po</strong>dpremo z nekaj zgledi iz statistike, fiksnih in slučajnih<br />

grafov ter Nashevih ravnotežij.<br />

Ključne besede:<br />

Verjetnost; Steinova metoda; Centralni limitni izrek; Berry–Esséenov izrek; Večrazsežna<br />

normalna <strong>aproksimacija</strong>; Lokalna odvisnost; Statistika; Statistike končnih <strong>po</strong>pulacij;<br />

Barvanja grafov; Slučajni grafi; Nashevo ravnovesje; Gaussovi perimetri konveksnih<br />

množic; Tenzorski račun; Norme tenzorjev; Parcialne diferencialne enačbe eliptičnega<br />

tipa; Operatorske <strong>po</strong>lgrupe<br />

Matematična predmetna klasifikacija (2000):<br />

60F05; 62F12, 60C05, 05C80, 05C15, 91A60, 52A40, 15A69, 46B28, 35J05, 47D07<br />

v


Abstract<br />

Stein’s method provides an ingenious tool for giving bounds for the accuracy of the<br />

distribution approximation for certain random variables. It is based on the estimation<br />

of the expectations of certain linear operators (usually differential or difference). It<br />

was originally designed for the normal approximation, but later extended to numerous<br />

other approximations, like Poisson approximation with several extensions, binomial,<br />

gamma and many others.<br />

A remarkable feature of Stein’s method is that it works very well for sums of<br />

random variables with certain dependence structure, especially when the ordering of<br />

the summands plays no role (in contrast with e. g. the martingale approach). Its broad<br />

range of applications includes statistics, random graphs, DNA analysis, epidemiology,<br />

game theory, probabilistic number theory, insurance mathematics and many other<br />

areas.<br />

In the dissertation, we focus on the uni- and multivariate normal approximation.<br />

We study the behavior of the solutions of the Stein equation, fundamental to the success<br />

of the method, in great detail. This is non-trivial in the multivariate case, where Stein’s<br />

equation turns out to be an elliptic partial differential equation, which can be solved<br />

by means of operator semigroups. We show that this construction works for all test<br />

functions which are integrable with respect to the appropriate normal distribution.<br />

The accuracy of the approximation is given in two forms. The first one is based<br />

on the expectations of sufficiently smooth test functions. This form is given for quite<br />

a general case, which includes uni- as well as multivariate bounds. The second form<br />

is based on the probabilities of half-lines (the Berry–Esséen type estimates) or, more<br />

generally, certain (usually convex) subsets ofR n . The Berry–Esséen type estimates are<br />

given in almost as general form as the estimates based on smooth test functions (under<br />

some additional boundedness assumptions). In the multivariate case, we only consider<br />

sums of independent random vectors. However, we improve the constants, which are<br />

to great extent based on Gaussian perimeters of convex sets. We derive explicit bounds<br />

for them with improved constants as well.<br />

We give a survey of most concepts of dependence for which Stein’s method for<br />

normal approximation has been applied, including the concept of local dependence.<br />

The results are illustrated with several applications from statistics, fixed and random<br />

graphs, and Nash equilibrium <strong>po</strong>ints.<br />

Key words:<br />

Probability; Stein’s Method; Central Limit Theorem; Berry–Esséen Theorem; Multivariate<br />

Normal Approximation; Local Dependence; Statistics; Finite Population Statistics;<br />

Graph Colorings; Random Graphs; Nash Equilibrium; Gaussian Perimeters of Convex<br />

Sets; Tensor Products; Tensor Norms; Elliptic Partial Differential Equations; Operator<br />

Semigroups<br />

Mathematics Subject Classification (2000):<br />

60F05; 62F12, 60C05, 05C80, 05C15, 91A60, 52A40, 15A69, 46B28, 35J05, 47D07<br />

vi


Kazalo<br />

Uvod 1<br />

I. del: Teorija 5<br />

1. Izpeljava Steinove metode 7<br />

1.1 Steinov operator in Steinova enačba . . . . . . . . . . . . . . . . . . . . . 7<br />

1.2 Konstrukcija Steinovega operatorja . . . . . . . . . . . . . . . . . . . . . . 9<br />

1.3 Poissonova <strong>aproksimacija</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

1.4 Enorazsežna normalna <strong>aproksimacija</strong> . . . . . . . . . . . . . . . . . . . . 15<br />

2. Večrazsežna normalna <strong>aproksimacija</strong> 23<br />

2.1 Lindeberg–Bergströmova metoda . . . . . . . . . . . . . . . . . . . . . . . 24<br />

2.2 Steinova metoda in markovske verige . . . . . . . . . . . . . . . . . . . . 27<br />

2.3 Prehod v zvezni čas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

2.4 Ornstein–Uhlenbeckov proces . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

2.5 Aproksimacija s <strong>po</strong>močjo Steinovega operatorja . . . . . . . . . . . . . . 44<br />

2.6 Rešitev Steinove enačbe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49<br />

2.7 Enoličnost rešitve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

2.8 Primerjava z enorazsežnim primerom . . . . . . . . . . . . . . . . . . . . 65<br />

3. Steinova metoda in odvisnost 71<br />

3.1 Sklapljanje z izmenljivim parom . . . . . . . . . . . . . . . . . . . . . . . 71<br />

3.2 Prema utežitev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

3.3 Konstrukcija premih uteženk . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />

3.4 Ocene, dobljene ne<strong>po</strong>sredno iz sklapljanj . . . . . . . . . . . . . . . . . . 86<br />

3.5 Razčlenitve prvega reda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91<br />

3.6 Kumulativna prema utežitev . . . . . . . . . . . . . . . . . . . . . . . . . 95<br />

3.7 Konstrukcija kumulativnih premih uteženk . . . . . . . . . . . . . . . . . 99<br />

3.8 Ocene, dobljene ne<strong>po</strong>sredno iz dvojnih sklapljanj . . . . . . . . . . . . . . 100<br />

3.9 Razčlenitve drugega reda . . . . . . . . . . . . . . . . . . . . . . . . . . . 105<br />

3.10 Ocene Lindebergovega tipa . . . . . . . . . . . . . . . . . . . . . . . . . . 113<br />

3.11 Lipschitzeve testne funkcije v več dimenzijah . . . . . . . . . . . . . . . . 120<br />

vii


4. Ocene Berry–Esséenovega tipa 133<br />

4.1 Klasični Berry–Esséenov izrek . . . . . . . . . . . . . . . . . . . . . . . . . 133<br />

4.2 Posplošitev na odvisne slučajne spremenljivke . . . . . . . . . . . . . . . 141<br />

4.3 Posplošitev na večrazsežni primer . . . . . . . . . . . . . . . . . . . . . . 146<br />

II. del: Zgledi 163<br />

5. U<strong>po</strong>raba v statistiki 165<br />

5.1 Neodvisno izbiranje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166<br />

5.2 Izbiranje brez <strong>po</strong>navljanja . . . . . . . . . . . . . . . . . . . . . . . . . . . 168<br />

6. Statistike na grafih 173<br />

6.1 Število <strong>po</strong>vezav s krajiščema iste barve . . . . . . . . . . . . . . . . . . . . 173<br />

6.2 Lokalni maksimumi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174<br />

6.3 Nasheva ravnotežja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176<br />

7. Slučajni grafi 179<br />

7.1 Splošna obravnava . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179<br />

7.2 Stopnje oglišč . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181<br />

III. del: Dodatki 183<br />

A Konvergenca <strong>po</strong>razdelitev 185<br />

A.1 Metrike iz testnih funkcij . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185<br />

A.2 Metrika totalne variacije . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186<br />

A.3 Šibke to<strong>po</strong>logije v splošnem . . . . . . . . . . . . . . . . . . . . . . . . . . 187<br />

A.4 Zamenjava razreda testnih funkcij . . . . . . . . . . . . . . . . . . . . . . 188<br />

A.5 Običajna šibka to<strong>po</strong>logija . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190<br />

A.6 Zadostni <strong>po</strong>goji za šibko konvergenco . . . . . . . . . . . . . . . . . . . . 191<br />

A.7 Zadostni <strong>po</strong>goji za konvergenco v metriki . . . . . . . . . . . . . . . . . . 193<br />

A.8 Wassersteinova metrika . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196<br />

A.9 Posplošitve Wassersteinove metrike . . . . . . . . . . . . . . . . . . . . . 198<br />

A.10 Metrika Kolmogorova in <strong>po</strong>splošitve . . . . . . . . . . . . . . . . . . . . . 203<br />

B Operatorske <strong>po</strong>lgrupe 209<br />

B.1 Definicija in osnovne lastnosti . . . . . . . . . . . . . . . . . . . . . . . . . 209<br />

B.2 Riemannov integral v Banachovih prostorih . . . . . . . . . . . . . . . . . 211<br />

B.3 Dynkinova formula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214<br />

B.4 Resolventa, Hille–Yosidov izrek . . . . . . . . . . . . . . . . . . . . . . . . 215<br />

C O Millsovem razmerju 217<br />

C.1 Definicija in osnovne lastnosti . . . . . . . . . . . . . . . . . . . . . . . . . 217<br />

C.2 Nekaj neenakosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218<br />

C.3 Nekaj enakosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219<br />

viii


D Tenzorski račun 223<br />

D.1 Multilinearne preslikave . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223<br />

D.2 Dualni pari vektorskih prostorov . . . . . . . . . . . . . . . . . . . . . . . 224<br />

D.3 Tenzorji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225<br />

D.4 Tenzorski produkti končnorazsežnih prostorov . . . . . . . . . . . . . . . 227<br />

D.5 Skrčitve tenzorjev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229<br />

D.6 Tenzorski produkti evklidskih prostorov . . . . . . . . . . . . . . . . . . . 233<br />

D.7 Dviganje in spuščanje indeksov . . . . . . . . . . . . . . . . . . . . . . . . 234<br />

D.8 Norme tenzorjev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237<br />

D.9 Norme na tenzorskih produktih evklidskih prostorov . . . . . . . . . . . 240<br />

D.10 Injektivna norma simetričnega tenzorja . . . . . . . . . . . . . . . . . . . 241<br />

E Diferencialni račun v več spremenljivkah 245<br />

E.1 Odvodi funkcij več spremenljivk . . . . . . . . . . . . . . . . . . . . . . . 245<br />

E.2 Taylorjeva formula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247<br />

E.3 Šibki odvodi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248<br />

E.4 Šibka odvedljivost in absolutna zveznost . . . . . . . . . . . . . . . . . . 256<br />

E.5 Odvodi Lipschitzevih funkcij . . . . . . . . . . . . . . . . . . . . . . . . . 256<br />

E.6 Odvajanje integralov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262<br />

E.7 Integracija per partes, odvod produkta . . . . . . . . . . . . . . . . . . . . 263<br />

E.8 O odvodih Gaussove gostote . . . . . . . . . . . . . . . . . . . . . . . . . 265<br />

F O Hausdorffovi meri 267<br />

F.1 O zunanjih merah . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267<br />

F.2 Definicija in osnovne lastnosti . . . . . . . . . . . . . . . . . . . . . . . . . 269<br />

F.3 Krivočrtni Fubinijev izrek . . . . . . . . . . . . . . . . . . . . . . . . . . . 273<br />

G O konveksnih množicah 277<br />

G.1 Definicija in osnovne lastnosti . . . . . . . . . . . . . . . . . . . . . . . . . 277<br />

G.2 Notranjost in rob konveksne množice . . . . . . . . . . . . . . . . . . . . 279<br />

G.3 O<strong>po</strong>rni <strong>po</strong>lprostori in pravokotna projekcija . . . . . . . . . . . . . . . . . 281<br />

G.4 Radialna projekcija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285<br />

H Gaussovi perimetri konveksnih množic 293<br />

H.1 Formulacija in zgodovina problema . . . . . . . . . . . . . . . . . . . . . 293<br />

H.2 Izražava s Hausdorffovo mero . . . . . . . . . . . . . . . . . . . . . . . . . 295<br />

H.3 Eksplicitna različica ocene Nazarova . . . . . . . . . . . . . . . . . . . . . 298<br />

H.4 Izboljšava ocene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305<br />

Sklep 311<br />

Literatura 313<br />

Notacija 323<br />

Stvarno kazalo 327<br />

ix


Uvod<br />

Računanje <strong>po</strong>razdelitev vsot velikega števila slučajnih spremenljivk (npr. računanje<br />

verjetnosti, da taka slučajna spremenljivka pripada določenemu intervalu, ali računanje<br />

matematičnega upanja njene nelinearne funkcije) je lahko zelo težavno, zato so že zelo<br />

zgodaj začeli iskati približne obrazce. Že leta 1718 je de Moivre [82] izpeljal formulo,<br />

ki aproksimira simetrično binomsko <strong>po</strong>razdelitev. Njegovo delo je leta 1812 do<strong>po</strong>lnil<br />

Laplace [43]. Laplaceov rezultat lahko formuliramo v naslednji obliki:<br />

Izrek 1. Če so X 1 , X 2 ,...X n neodvisne in enako <strong>po</strong>razdeljene Bernoullijeve slučajne<br />

spremenljivke z vsoto W, je le-ta <strong>po</strong>razdeljena približno normalno. Z drugimi besedami, velja<br />

približna enakost:<br />

P ( var(W) −1/2 (W−E W)≤x ) ≈Φ(x) := 1 √<br />

2π<br />

∫ x<br />

−∞<br />

e −x2 /2 dx (1)<br />

Natančneje, ko gre n proti neskončno, <strong>po</strong>razdelitev slučajnih spremenljivk X i pa ostaja fiksna,<br />

gre napaka v zgornji zvezi proti nič za vsak x∈R.<br />

Čebišev [43] je leta 1890 z u<strong>po</strong>rabo metode momentov zgornji izrek <strong>po</strong>splošil na<br />

primer, ko so X i splošnejše slučajne spremenljivke, privzel pa je dokaj stroge <strong>po</strong>goje<br />

glede njihovih momentov. Nato je v letih 1900 in 1901 Ljapunov [75], [76] z u<strong>po</strong>rabo<br />

karakterističnih funkcij <strong>po</strong>goje omilil le na obstoj absolutnega momenta reda več kot<br />

2. Izrek Ljapunova velja tudi za primer, ko slučajne spremenljivke X i niso nujno enako<br />

<strong>po</strong>razdeljene. Leta 1922 pa je Lindeberg [74] spet z novo, ne<strong>po</strong>sredno metodo izpeljal<br />

konvergenco vsot neodvisnih slučajnih spremenljivk proti normalni <strong>po</strong>razdelitvi <strong>po</strong>d<br />

<strong>po</strong>goji, za katere je leta 1935 Feller [58] dokazal, da so tudi <strong>po</strong>trebni. Neodvisno je leta<br />

1925 Lévy [73] izpeljal <strong>po</strong>seben primer Lindebergovega izreka, ki se nanaša na enako<br />

<strong>po</strong>razdeljene slučajne spremenljivke. Lindebergov in Lévyjev rezultat privzemata le<br />

končne druge momente.<br />

Poleg dokaza konvergence pa je <strong>po</strong>membna tudi ocena napake. Le-to je prvi izpeljal<br />

Ljapunov [76], a njegova ocena hitrosti konvergence je nekoliko šibkejša od najboljše<br />

možne. Le-to pa sta za primer, ko so slučajne spremenljivke X i enako <strong>po</strong>razdeljene,<br />

neodvisno drug od drugega izpeljala Berry [27] leta 1941 in Esséen [53] leta 1942. Ta<br />

rezultat je leta 1945 Esséen [54]) <strong>po</strong>splošil še na primer, ko sumandi niso nujno enako<br />

<strong>po</strong>razdeljeni, kar lahko formuliramo v naslednji obliki.<br />

Izrek 2. Če so X 1 , X 2 ,...X n neodvisne in enako <strong>po</strong>razdeljene slučajne spremenljivke z<br />

vsoto W ter če veljaE X i = 0 in var(W)=1, za vsak x∈Rvelja ocena:<br />

kjer je C univerzalna konstanta.<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ n∑<br />

∣≤C E|X i | 3 (2)<br />

1<br />

i=1


2<br />

Vse do današnjih dni je bilo precej dela <strong>po</strong>svečenega izboljševanju konstante. Zadnjo<br />

izboljšavo je leta 2010 naredila Ševcova [121], ki je dokazala, da zgornji izrek velja za<br />

C=0,56.<br />

Vsi navedeni rezultati veljajo za vsote neodvisnih slučajnih spremenljivk. Neodvisnost<br />

pa je v praksi prej izjema kot pravilo. Posplošitve na vsote odvisnih slučajnih<br />

spremenljivk so začeli intenzivno študirati <strong>po</strong> letu 1950. Zelo domiselno metodo, <strong>po</strong><br />

kateri se da razmeroma lahko oceniti napako pri normalni aproksimaciji, je leta 1970<br />

odkril Charles Stein [124]. Ta metoda, danes splošno znana kot Steinova metoda, se<br />

še zlasti obnese pri vsotah slučajnih spremenljivk z določeno vrsto odvisnosti, pri kateri<br />

vrstni red seštevancev ne igra vloge (v nasprotju denimo z martingali). Področja<br />

u<strong>po</strong>rabe Steinove metode zajemajo veliko primerov, med drugim:<br />

• statistiko (glej Rinott in Rotar [105] ter Chen in Shao [42]);<br />

• slučajne grafe (glej Barbour [7], Barbour, Karoński in Ruciński [17], Goldstein in<br />

Rinott [63], Konieczna [71] ter Rinott in Rotar [104]);<br />

• teorijo iger (glej Rinott in Scarsini [108]);<br />

• teorijo ekstremov: (glej Smith [123], Mihajlov [80] in Tawn [128])<br />

• zavarovalniško matematiko (glej Barbour in Chryssaphinou [14]);<br />

• analizo za<strong>po</strong>redij v DNK (glej spet Barbour in Chryssaphinou [14]);<br />

• epidemiologijo (glej Reinert [100, 102]);<br />

• verjetnostno teorijo števil (glej Diaconis [49] in Stein [125]);<br />

• markovske verige (glej Diaconis [51]).<br />

Ker nekaj zanimivih primerov u<strong>po</strong>rabe je predstavljenih tudi v Dembovem in Rinottovem<br />

članku [47].<br />

Osnovna ideja Steinove metode je, da za dano slučajno spremenljivko W zE W= 0<br />

in var(W)=1ocenimo matematično upanje:<br />

E [ h ′ (W)−h(W)W ] (3)<br />

kjer je h primerno gladka funkcija (če je W <strong>po</strong>razdeljena standardizirano normalno,<br />

ni težko preveriti, da je zgornje matematično upanje enako nič). Nato za h vstavimo<br />

rešitev Steinove enačbe:<br />

h ′ (w)−h(w)w= f (w)−N(0, 1){ f} (4)<br />

in dobimo oceno razlikeE f (W)−N(0, 1){ f}.<br />

Steinova metoda nikakor ni omejena le na normalno aproksimacijo. Leta 1975 je<br />

Chen [38] metodo razširil na Poissonovo aproksimacijo, kasneje pa so jo razširili še<br />

na vrsto drugih aproksimacij, med drugimi binomsko (glej Loh [77], enakomerno (glej<br />

[50]) in gama (glej Luk [78]). Splošen koncept u<strong>po</strong>rabe Steinove metode za vnaprej<br />

določeno <strong>po</strong>razdelitev z vrsto primerov je predstavljen v Schoutensovem članku [118].


UVOD 3<br />

Steinova metoda dopušča tudi bolj rafinirane aproksimacije, kot je npr. Edgeworthov<br />

razvoj (glej Barbour [8], Schneller [117] ter Rinott in Rotar [107]). Zelo zanimiva<br />

je u<strong>po</strong>raba Steinove metode pri sestavljeni Poissonovi (angl. com<strong>po</strong>und Poisson)<br />

aproksimaciji (glej Barbour, Chen in Loh [13], Barbour in Utev [18], [19], Barbour in Xia<br />

[20] ter tudi Barbour in Čekanavičius [15]). Barbour in Čekanavičius [15] pa ocenjujeta<br />

tudi napako pri Poisson–Charlierovi aproksimaciji.<br />

Steinova metoda tudi ni omejena le na realne slučajne spremenljivke. Tako se<br />

da Poissonova <strong>aproksimacija</strong> razširiti na aproksimacijo s Poissonovim procesom (glej<br />

Barbour, Holst in Janson [16] ter Barbour in Xia [20]). Prav tako se da enorazsežna<br />

normalna <strong>aproksimacija</strong> razširiti na večrazsežno (le-to je prvi izpeljal Götze [64]) in<br />

aproksimacijo z Brownovim gibanjem (glej Barbour [9]). S <strong>po</strong>močjo Steinove metode<br />

se da izpeljati tudi <strong>aproksimacija</strong> procesov, ki imajo vrednosti v merah (glej Reinert<br />

[101]).<br />

Steinova metoda je <strong>po</strong>drobno predstavljena v <strong>Steinovi</strong> monografiji [125], kjer je <strong>po</strong>danih<br />

tudi nekaj zgledov iz normalne in Poissonove aproksimacije. Podroben pregled<br />

Poissonove aproksimacije <strong>po</strong> <strong>Steinovi</strong> <strong>metodi</strong> je prikazan v Barbourjevi, Holstovi in<br />

Jansonovi monografiji [16]. Delen pregled normalne aproksimacije je <strong>po</strong>dan tudi v<br />

Rinottovem in Rotarjevem [106] ter avtorjevem prispevku [95]. Nekaj zanimivih primerov<br />

je zbranih v Chenovem prispevku [39]. Sodoben pregled Steinove metode z<br />

najnovejšimi rezultati pa je narejen v monografijah [11] in [12].<br />

V tem delu se večinoma osredotočimo na normalno aproksimacijo. V prvem <strong>po</strong>glavju<br />

prikažemo, kako pridemo do operatorja v (3), in konstrukcijo izpeljemo za normalno<br />

in Poissonovo aproksimacijo. Drugo <strong>po</strong>glavje je večinoma <strong>po</strong>svečeno reševanju<br />

Steinove enačbe v več dimenzijah, ki je neprimerno zahtevnejše kot v enorazsežnem<br />

primeru (gre za parcialno diferencialno enačbo eliptičnega tipa). Enačbo rešimo za<br />

najsplošnejši primer, kjer je normalna <strong>aproksimacija</strong> sploh še smiselna (t. j. za vse<br />

testne funkcije f , ki so integrabilne glede na standardizirano normalno <strong>po</strong>razdelitev –<br />

izrek 2.6.1). Prikažemo tudi <strong>po</strong>membne kvalitativne razlike med obnašanjem rešitve<br />

Steinove enačbe v eni in več dimenzijah (izrek 2.8.3). Poleg tega pa <strong>po</strong>kažemo tudi, da<br />

se da Steinova metoda izvesti tudi brez reševanja Steinove enačbe.<br />

Tretje <strong>po</strong>glavje je namenjeno izčrpni predstavitvi konceptov odvisnosti, za katere je<br />

bila razvita normalna <strong>aproksimacija</strong> <strong>po</strong> <strong>Steinovi</strong> <strong>metodi</strong>. Pokažemo, da je večina teh<br />

konceptov v dobršni meri ekvivalentna, in rezultate ilustriramo na nekaj standardnih<br />

zgledih. Rezultate izpeljemo za gladke in Lipschitzeve testne funkcije v eno- in večrazsežnem<br />

primeru (natančneje, ocenjujemo razlikeE f (W)−N(0, I){ f}, kjer je f primerno<br />

gladka funkcija). Med drugim izpeljemo tudi <strong>po</strong>splošitev Lindebergovega izreka na<br />

vsote odvisnih slučajnih spremenljivk: izrek 3.10.5 nam omogoča izpeljavo šibke konvergence<br />

proti normalni <strong>po</strong>razdelitvi le pri končnih drugih momentih (glej tudi trditev<br />

3.10.9 in avtorjev članek [96]).<br />

V četrtem <strong>po</strong>glavju pa izpeljemo ocene Berry–Esséenovega tipa (t. j. ocenjujemo levo<br />

stran v (2)). Tako izpeljemo razmeroma splošno <strong>po</strong>splošitev Berry–Esséenovega izreka<br />

na vsote odvisnih slučajnih spremenljivk (izrek 4.2.1). Izpeljemo pa tudi večrazsežne<br />

<strong>po</strong>splošitve Berry–Esséenovega izreka (t. j. ocenjujemo razlikeP(W∈ A)−N(0, I){A},<br />

kjer je A praviloma konveksna množica). Pri tem se omejimo le na vsote neodvisnih<br />

slučajnih spremenljivk, zato pa izboljšamo doslej znane konstante (izreka 4.3.1 in 4.3.2).


4<br />

Peto, šesto in sedmo <strong>po</strong>glavje so namenjena zgledom. Podamo zglede iz statistike,<br />

teorije grafov in slučajnih grafov, študiramo pa tudi število Nashevih ravnotežij. Pri<br />

vseh zgledih izpeljemo Berry–Esséenove ocene, in sicer s <strong>po</strong>močjo izreka 4.2.1.<br />

Delo ima tudi osem dodatkov. Večinoma so namenjeni seznanjanju z oznakami,<br />

formulaciji <strong>po</strong>možnih rezultatov in prikazu širšega ozadja določenih stvari, ki se <strong>po</strong>javljajo<br />

v glavnem delu disertacije. V dodatku H pa tudi nekoliko izboljšamo oceno<br />

Gaussovih perimetrov konveksnih množic, pri čemer rezultat <strong>po</strong>damo v <strong>po</strong><strong>po</strong>lnoma<br />

eksplicitni obliki (izrek H.1.3). To igra <strong>po</strong>membno vlogo pri oceni napake v večrazsežnem<br />

primeru.<br />

Pričujoča disertacija nikakor ne zajema vsega, kar je na njenem <strong>po</strong>dročju doslej<br />

znanega. Prav gotovo bi bilo lahko zajetih še več zgledov (nekaj zelo zanimivih zgledov<br />

je <strong>po</strong>danih v Goldsteinovih člankih [60] in [61]). Manjka tudi večrazsežna različica<br />

Berry–Esséenovega izreka za vsote odvisnih slučajnih vektorjev, neenakomerne ocene<br />

(t. j. take, pri katerih ocena napake|P(W≤x)−Φ(x)| pada z x, glej Chen in Shao<br />

[40, 41, 42]), verjetnosti velikih odklonov (glej avtorjev članek [97]) in še kaj bi se našlo.<br />

Vendar pa bi to že preseglo okvir tega dela.


I. del:<br />

Teorija<br />

5


1.<br />

Izpeljava Steinove metode<br />

1.1 Steinov operator in Steinova enačba<br />

Steinova metoda nudi aproksimacijo <strong>po</strong>razdelitev slučajnih spremenljivk, tako da<br />

aproksimira matematična upanja njihovih funkcij. V izvirniku za primerno določeno<br />

spremenljivko W in testne funkcije f iz primernega linearnega prostoraF iščemo<br />

aproksimacije:<br />

E f (W)≈N f (1.1.1)<br />

kjer jeN : F→R linearni funkcional, ki ga je lažje izračunati kot levo stran, želeli pa<br />

bi tudi oceniti napako.<br />

Včasih se izkaže, da je operatorN ugodno spet izraziti kot matematično upanje<br />

funkcije slučajne spremenljivke W. Tako bomo iskali aproksimacije tipa:<br />

E f (W)≈EPf (W) (1.1.2)<br />

kjer jePprojektor izF na primeren <strong>po</strong>dprostor funkcij, za katere je matematična upanja<br />

lažje računati kot za splošne funkcije izF. Ker lahko za ta <strong>po</strong>dprostor vedno vzamemo<br />

prostor konstantnih funkcij, s tem nismo nič izgubili na splošnosti.<br />

Zadeva se da formulirati še nekoliko bolj abstraktno, v duhu funkcionalne analize:<br />

vzamemo abstrakten linearni prostorF in funkcionalεna njem, ki ga je za splošne<br />

elemente izF težko izračunati. Zato bi želeli aproksimirati:<br />

ε f≈εP f (1.1.3)<br />

kjer jePspet primeren projektor. Še splošneje, želeli bi aproksimirati zapleten element<br />

f z enostavnejšim elementomP f v dani seminormi p, definirani naF , t. j. želeli bi<br />

oceniti p( f−P f ). To se prevede na (1.1.3) oz. (1.1.2), če <strong>po</strong>stavimo:<br />

p(h)=|εh| oziroma p(h)=|Eh(W)| (1.1.4)<br />

Osnovna Steinova [125] ideja je, da najprej z verjetnostno konstrukcijo, opisano<br />

v naslednjem razdelku, <strong>po</strong>iščemo operatorA(Steinov operator) iz nekega drugega<br />

linearnega prostoraGvF , pri čemer je tudi na prostoruGdefinirana seminorma q in<br />

je:<br />

p(Ag)≪q(g) (1.1.5)<br />

7


8 1.1 STEINOV OPERATOR IN STEINOVA ENAČBA<br />

Če je seminorma p <strong>po</strong>dana z (1.1.4), pa lahko zapišemo:<br />

ProjektorP<strong>po</strong>iščemo tako, da je Steinova enačba:<br />

εAg≈0 oziroma EAg(W)≈0 (1.1.6)<br />

Ag= f−P f (1.1.7)<br />

rešljiva in da količina q(g) ni prevelika v primerjavi s p( f ). Z drugimi besedami, obstajati<br />

mora dovolj krotek desni inverz operatorjaA, definiran na zalogi vrednosti projektorja<br />

I−P (t. j. jedru projektorjaP). Tako lahko zapišemo:<br />

p( f−P f )=p(Ag)≪p( f ) (1.1.8)<br />

Vsak projektorPpredstavlja dekom<strong>po</strong>zicijo prostora na direktno vsoto njegovega<br />

jedraH= kerP in zaloge vrednostiK= im P. Stvar lahko <strong>po</strong>gledamo tudi obratno:<br />

projektorPkonstruiramo tako, da konstruiramo tako dekom<strong>po</strong>zicijoF =H⊕K, da<br />

ima operatorAna prostoruH krotek desni inverz, elementi prostoraK pa so enostavni.<br />

Najenostavneje bi bilo, da bi bilK kar ničelni <strong>po</strong>dprostor, toda to bi <strong>po</strong>menilo, da bi<br />

ocenjevali le p( f ), kar v večini primerov ni dovolj. Pač pa je v primeru, ko iščemo<br />

(1.1.3), zaK navadno dovolj vzeti enorazsežen <strong>po</strong>dprostor (to je zato, ker ima kerε<br />

kodimenzijo ena). V primeru, ko jeε f=E f (W), bomo zaK navadno vzeli kar prostor<br />

konstant. V tem primeru naš projektorPiz (1.1.2) sovpade s funkcionalomN iz (1.1.1).<br />

Včasih pa je ugodneje vzeti kaj drugega: v avtorjevem članku [97], ki obravnava velike<br />

odklone, se tako zaK vzame prostor večkratnikov eks<strong>po</strong>nentne funkcije x↦→ e λx (za<br />

fiksenλ).<br />

Možnosti, kako konstruirati operatorA, je veliko. V naslednjem razdelku bomo<br />

predstavili izvirno Steinovo konstrukcijo, predstavljeno v [125], ki temelji na izmenljivih<br />

parih, in jo še nekoliko <strong>po</strong>splošili. Obstajajo pa tudi druge <strong>po</strong>ti. Tako npr.<br />

Schoutens [118] opiše cel razred operatorjevAskupaj z verjetnostnimi meramiνin<br />

rešitvami <strong>Steinovi</strong>h enačb: ∫<br />

Ag= f− f dν (1.1.9)<br />

TakoE f (W) aproksimiramo z ∫ f dν, izbrati moramo le še par (A,ν), za katerega lahko<br />

EAg(W) najugodneje ocenimo. Nabor <strong>po</strong>razdelitevνje zelo širok in med drugim<br />

obsega večrazsežno normalno, Poissonovo, binomsko in gama <strong>po</strong>razdelitev. Veliko<br />

primerov konstrukcij Steinovega operatorja je zbrano tudi v monografiji [11].<br />

Omenimo naj še, da ni <strong>po</strong>trebno za vsak problem <strong>po</strong>sebej konstruirati Steinovega<br />

operatorja: Steinova metoda se odlikuje <strong>po</strong> tem, da se lahko en in isti operator u<strong>po</strong>rablja<br />

za zelo širok razred problemov. Tako lahko Steinov operator najprej konstruiramo za<br />

razmeroma preprost razred slučajnih spremenljivk, pri katerih Steinova metoda niti ni<br />

najpreprostejši način aproksimacije <strong>po</strong>razdelitve. Svojo pravo moč pa metoda <strong>po</strong>kaže<br />

šele na širšem, zapletenejšem razredu slučajnih spremenljivk, za katere je primeren isti<br />

operator. Pri ocenjevanju napake pri enorazsežni normalni aproksimaciji (centralnem<br />

limitnem izreku) tako navadno vzamemo operator:<br />

Ag(w)= g ′ (w)− g(w)w (1.1.10)


1. IZPELJAVA STEINOVE METODE 9<br />

ki ga v razdelku 1.4 na precej naraven način dobimo iz vsot neodvisnih in enako<br />

<strong>po</strong>razdeljenih slučajnih spremenljivk. Nato pa isti operator pri aproksimaciji vsot<br />

odvisnih slučajnih spremenljivk, pri katerih nam Steinova metoda ne bo dala dosti več<br />

dela kot za vsote neodvisnih slučajnih spremenljivk, druge metode pa od<strong>po</strong>vedo ali pa<br />

se precej zapletejo.<br />

1.2 Konstrukcija Steinovega operatorja<br />

V prejšnjem razdelku smo iskali aproksimacijo težko izračunljivih matematičnih<br />

upanjE f (W) z lažje izračunljivimi matematičnimi upanjiEP f (W). Splošneje, za dan<br />

zapleten element f bi radi <strong>po</strong>iskali tak enostavnejši elementP f , da bi bila dana seminorma<br />

p( f−P f ) majhna. Pri tem smo <strong>po</strong>trebovali operatorA, za katerega je količina<br />

p(Ag) majhna, nič pa nismo <strong>po</strong>vedali, kako ga konstruirati. Ena možnost je, da najprej<br />

konstruiramo operatorÃ, za katerega je p(Ã)=0. Tak operator sam <strong>po</strong> sebi še ni ravno<br />

najprimernejši za Steinov operator: če g reši (1.1.7) zaA=Ã, velja p( f−P f )=0, kar<br />

navadno <strong>po</strong>meni, da jeP f prav tako zapleten kot f (če jeEPf (W)=E f (W), sP f<br />

bržkone nismo nič pridobili). Zato operatorAiščemo kot perturbacijo operatorjaÃ.<br />

Izvirna konstrukcija Steinovega operatorja izkorišča preprosto dejstvo, da za slučajni<br />

spremenljivki W in W ′ , ki sta enako <strong>po</strong>razdeljeni in definirani na istem verjetnostnem<br />

prostoru, velja:<br />

E [ E [ g(W ′ )− g(W) ∣ ∣ ∣ W<br />

]]<br />

= 0 (1.2.1)<br />

OperatorAtako iščemo kot operator, ki zadošča približni enakosti:<br />

Ag(W)≈E [ g(W ′ )− g(W) ∣ ∣ ∣ W<br />

]<br />

(1.2.2)<br />

Za tak operator bo <strong>po</strong>tem p(Ag(W))=|EAg(W)| majhna količina. Če privzamemo<br />

še, da sta slučajni spremenljivki W in W ′ izmenljivi (t. j. slučajni vektor (W, W ′ ) je<br />

<strong>po</strong>razdeljen enako kot (W ′ , W)), lahko zgornjo konstrukcijo še nadgradimo, tako da<br />

konstruiramo operatorT iz prostoraGvprostor antisimetričnih funkcij, za katerega<br />

zahtevamo, da je:<br />

Ag(W)≈E [ T g(W, W ′ ) ∣ ]<br />

∣ W (1.2.3)<br />

Ta konstrukcija je fleksibilnejša in se prevede na prejšnjo, če vzamemoT g(w, w ′ ) :=<br />

g(w ′ )− g(w).<br />

Vendar pa je tudi prejšnja konstrukcija marsikdaj nekoliko nerodna. Barbour [10]<br />

sam priznava, da nam (1.2.2) in (1.2.3) dasta zgolj idejo, dejanska konstrukcija pa<br />

<strong>po</strong>teka nekoliko drugače. V pričujočem delu bomo u<strong>po</strong>rabljali še nekoliko splošnejšo<br />

konstrukcijo, ki <strong>po</strong>teka takole: vzamemo enako <strong>po</strong>razdeljeni slučajni spremenljivki<br />

X in X ′ ter linearni operatorL, ki slika v prostor funkcij, definiranih na prostoru, v<br />

katerega slikata X in X ′ , in za katerega velja približna enakost:<br />

Ag(W)≈E [ Lg(X ′ )−Lg(X) ∣ ]<br />

∣ W (1.2.4)<br />

Ta konstrukcija je res splošnejša od prejšnje: operator iz (1.2.2) dobimo tako, da <strong>po</strong>stavimo<br />

X=Win X ′ = W ′ , zaLpa vzamemo identiteto. Operator iz (1.2.3) pa dobimo


10 1.2 KONSTRUKCIJA STEINOVEGA OPERATORJA<br />

tako, da <strong>po</strong>stavimo X=(W, W ′ ), X ′ = (W ′ , W) in za x=(w, w ′ ) definiramo:<br />

Lg(x) := 1 2 T g(w, w′ ) (1.2.5)<br />

Še splošneje, vzamemo lahko še slučajno spremenljivko Z, ki je <strong>po</strong>razdeljena <strong>po</strong>dobno<br />

kot W,Apa iščemo tako, da velja približna enakost:<br />

Ag(Z)≈E [ Lg(X ′ )−Lg(X) ∣ ∣ ∣ Z<br />

]<br />

(1.2.6)<br />

O<strong>po</strong>mba. Če prostorF obsega dovolj funkcij (npr. vse merljive funkcije f , za<br />

katere jeE| f (W)|


1. IZPELJAVA STEINOVE METODE 11<br />

1.3 Poissonova <strong>aproksimacija</strong><br />

Naj bodo X 1 ,...X n neodvisne slučajne spremenljivke z Bernoullijevo <strong>po</strong>razdelitvijo.<br />

Natančneje, naj bo X i ∼ Be(p i ), t. j. P(X i = 0)=1−p i inP(X i = 1)=p i . Želeli bi<br />

aproksimirati <strong>po</strong>razdelitev slučajne spremenljivke:<br />

W := X 1 + X 2 +···+X n (1.3.1)<br />

V duhu tega, kar smo nakazali na koncu prejšnjega razdelka, konstruirajmo še slučajne<br />

spremenljivke:<br />

W i := W− X i , W ′ i<br />

:= W− X i + X ′ i<br />

(1.3.2)<br />

kjer je X ′ neodvisna kopija slučajne spremenljivke X i i. Očitno ima W ′ enako <strong>po</strong>razdelitev<br />

i<br />

kot W i . Med slučajnimi spremenljivkami definirajmo relacijo∼<strong>po</strong> predpisu:<br />

in za <strong>po</strong>ljubno funkcijo g: N 0 →Rpišimo:<br />

U∼V :⇐⇒E(U|W)=E(V| W) (1.3.3)<br />

g(W ′ i )− g(W)=[ g(W ′ i )− g(W i) ] − [ g(W)− g(W i ) ] =<br />

=∆g(W i )X ′ i −∆g(W− 1)X i∼<br />

(1.3.4)<br />

∼ p i ∆g(W i )−∆g(W− 1)X i ∼<br />

∼ p i ∆g(W)−p i ∆ 2 g(W− 1)X i −∆g(W− 1)X i<br />

kjer je∆g(w)= g(w+1)− g(w). Zdaj pa vse skupaj seštejmo <strong>po</strong> i. Dobimo:<br />

kjer jeASteinov operator, definiran <strong>po</strong> predpisu:<br />

n∑<br />

i=1<br />

[<br />

g(W<br />

′<br />

i )− g(W)] ∼Ag(W)+Rg (1.3.5)<br />

Ag(w)=λ∆g(w)−∆g(w−1)w (1.3.6)<br />

inλ=p 1 +···+p n , R pa je operator iz prostora funkcij v prostor slučajnih spremenljivk,<br />

definiran <strong>po</strong> predpisu:<br />

n∑<br />

Rg :=− p i ∆ 2 g(W− 1)X i (1.3.7)<br />

i=1<br />

Ker sta W i in W ′ i<br />

enako <strong>po</strong>razdeljeni, je matematično upanje leve strani zveze (1.3.5)<br />

enako nič, torej velja:<br />

n∑<br />

|EAg(W)|=|ERg|≤E|Rg|≤‖∆ 2 g‖ ∞ p 2 i<br />

(1.3.8)<br />

kjer smo z‖·‖ ∞ označili supremum normo. Matematično upanjeEAg(W) je torej<br />

majhno, če staλin‖∆ 2 g‖ ∞ v razumnih okvirih, verjetnosti p i pa približno enake (t. j.<br />

reda velikosti 1/n). V tem primeru je tudiEAg(W) reda velikosti 1/n.<br />

i=1


12 1.3 POISSONOVA APROKSIMACIJA<br />

Zdaj ko smo našli operatorA, pa moramo, če želimo aproksimiratiE f (W), v<br />

skladu z razdelkom 1.1 rešiti še Steinovo enačbo (1.1.7). Iskali bomo aproksimacijo<br />

tipa (1.1.1), ki ne bo zahtevala nadaljnjega računanja matematičnih upanj. Rešiti bo<br />

torej treba enačbo:<br />

∆g(w)−∆g(w−1)w= f (w)−Nf (1.3.9)<br />

kjer boN tak linearni funkcional, da bo za primerne funkcije f :N 0 →R norma‖∆ 2 g‖ ∞<br />

v razumnih okvirih.<br />

Postopek pa lahko še nekoliko <strong>po</strong>enostavimo. Ker za vsako funkcijo h obstaja taka<br />

funkcija g, da je∆g(w−1)=h(w), lahko namesto (1.3.8) zapišemo tudi:<br />

Tako je <strong>po</strong>tem dovolj rešiti enačbo:<br />

∣<br />

∣E [ λh(W+ 1)−h(W)W ]∣ n∑<br />

∣ ∣≤‖∆h‖∞ p 2 i<br />

(1.3.10)<br />

λh(w+1)−h(w)w= f (w)−Nf (1.3.11)<br />

in oceniti‖∆h‖ ∞ . Tako lahko tudi zgornjo enačbo razumemo kot Steinovo enačbo, izraz<br />

na njeni levi strani pa kot Steinov operator za Poissonovo <strong>po</strong>razdelitev.<br />

Postavimo:<br />

Tedaj velja:<br />

od koder sledi:<br />

ϕ(w) := f (w)−Nf (1.3.12)<br />

ψ(w) :=<br />

i=1<br />

λ w<br />

h(w), w>0 ; ψ(0) := 0 (1.3.13)<br />

(w−1)!<br />

ψ(w)=<br />

∆ψ(w)= λw<br />

ϕ(w) (1.3.14)<br />

w!<br />

∑w−1<br />

k=0<br />

λ k<br />

k!<br />

h(w)= (w−1)!<br />

λ w<br />

ϕ(k) (1.3.15)<br />

∑w−1<br />

k=0<br />

λ k<br />

k!<br />

ϕ(k) (1.3.16)<br />

Če želimo, da je ∆h omejena, sme biti h največ linearne rasti, torej mora biti<br />

lim w→∞ ψ(w)=0. To pa je mogoče edinole, če velja:<br />

∞∑<br />

λ k<br />

N f= Po(λ){ f}= f (k) (1.3.17)<br />

k!<br />

kar <strong>po</strong>meni, da bomo <strong>po</strong>razdelitev slučajne spremenljivke W aproksimirali s Poissonovo<br />

<strong>po</strong>razdelitvijo Po(λ).<br />

Za primer, ko napako pri Poissonovi aproksimaciji ocenjujemo v metriki totalne<br />

variacije (glej razdelek A.2), t. j. za <strong>po</strong>ljubno <strong>po</strong>dmnožico A⊆N 0 ocenjujemo:<br />

∣<br />

∣P(W∈ A)−Po(λ)(A) ∣ ∣ (1.3.18)<br />

velja naslednja lema.<br />

k=0


1. IZPELJAVA STEINOVE METODE 13<br />

Lema 1.3.1 (Barbour, Eagleson). Naj bo A⊆N 0 <strong>po</strong>ljubna množica. Tedaj obstaja rešitev<br />

h A Steinove enačbe:<br />

λh A (w+1)−h A (w)w= f (w)−Po(λ)(A) (1.3.19)<br />

za katero velja:<br />

‖∆h A ‖≤ 1−e−λ<br />

λ<br />

≤ min { 1, 1 λ<br />

}<br />

(1.3.20)<br />

Če v enačbi (1.3.19) <strong>po</strong>gledamo matematično upanje glede na W in u<strong>po</strong>števamo<br />

(1.3.10), dobimo Le Camov izrek:<br />

Izrek 1.3.2. Če je W tako kot zgoraj, za <strong>po</strong>ljubno množico A⊆N 0 velja:<br />

∣<br />

∣P(W∈ A)−Po(λ)(A) ∣ ∣ ∣≤<br />

1−e −λ<br />

λ<br />

n∑<br />

p 2 i<br />

(1.3.21)<br />

i=1<br />

Če smo natančni, je ta izrek izboljšava Le Camovega izreka, pri čemer pa je izboljšana<br />

le konstanta. Le Cam namreč v članku [37] dokaže oceno:<br />

∣<br />

∣P(W∈ A)−Po(λ)(A) ∣ {<br />

∣≤min 1, 8 } n∑<br />

p 2 i<br />

(1.3.22)<br />

λ<br />

Pri<strong>po</strong>mnimo pa naj, da je Le Cam svoj izrek dokazal s <strong>po</strong><strong>po</strong>lnoma drugačnimi sredstvi.<br />

Steinova metoda se odlikuje <strong>po</strong> tem, da se da razmeroma preprosto <strong>po</strong>splošiti na vsote<br />

slučajnih spremenljivk, ki so na določen način odvisne. Obilo tovrstnih primerov<br />

predstavijo Barbour, Holst in Janson v monografiji [16].<br />

V primeru, ko so vsi parametri p i enaki, dobimo naslednjo oceno:<br />

i=1<br />

∣<br />

∣Bi(n, p)(A)−Po(np)(A) ∣ ∣ ∣≤p(1−e −np )≤p min{1, np}= min{λ,λ2 }<br />

n<br />

(1.3.23)<br />

Drugače <strong>po</strong>vedano, za vsakλ>0 za<strong>po</strong>redje binomskih <strong>po</strong>razdelitev Bi ( n,λ/n ) v metriki<br />

totalne variacije konvergira proti Poissonovi <strong>po</strong>razdelitvi Po(λ) in hitrost konvergence<br />

je velikostnega reda vsaj 1/n.<br />

Dokazati moramo še lemo 1.3.1. Dokaz <strong>po</strong>vzemamo iz Barbourjeve, Holstove in<br />

Jansonove monografije [16], str. 8.<br />

DOKAZLEME 1.3.1. Naj bo najprej f : N 0 →R<strong>po</strong>ljubna funkcija, za katero je<br />

∑ ∞<br />

w=0λ w | f (w)|/w!


14 1.3 POISSONOVA APROKSIMACIJA<br />

Velja:<br />

∆h(w)= w!<br />

λ w+1<br />

w∑<br />

k=0<br />

= w! w!<br />

λw+1ϕ(0)+ λ w+1<br />

λ k (w−1)! ∑w−1<br />

λ k<br />

ϕ(k)−<br />

k! λ w k! ϕ(k)=<br />

k=0<br />

w∑<br />

k=1<br />

= w! (w−1)!<br />

λw+1ϕ(0)+ λ w+1<br />

λ k (w−1)!<br />

ϕ(k)−<br />

k! λ w+1<br />

w∑<br />

k=1<br />

w∑<br />

k=1<br />

λ k ( )<br />

wϕ(k)−kϕ(k−1)<br />

k!<br />

λ k<br />

(k−1)! ϕ(k−1)=<br />

(1.3.26)<br />

Formula (1.3.16) nam <strong>po</strong>ve, da je vrednost h(w) odvisna le odϕ(0),...ϕ(w−1). Potrebovali<br />

pa bomo tudi, da je vrednost h(w) odvisna tudi le odϕ(w),ϕ(w+1),... To sledi<br />

iz dejstva, da je Po(λ){ϕ}=0in zato velja:<br />

h(w)=− (w−1)!<br />

λ w<br />

∞∑<br />

k=w<br />

λ k<br />

ϕ(k) (1.3.27)<br />

k!<br />

Sledi:<br />

∆h(w)= (w−1)!<br />

λ w<br />

= (w−1)!<br />

λ w<br />

= (w−1)!<br />

λ w<br />

∞∑<br />

k=w<br />

∞∑<br />

k=w<br />

∞∑<br />

k=w<br />

λ k w!<br />

ϕ(k)−<br />

k! λ w+1<br />

λ k w!<br />

ϕ(k)−<br />

k! λ w<br />

∞∑<br />

k=w+1<br />

∞∑<br />

k=w<br />

λ k<br />

k! ϕ(k)=<br />

λ k<br />

(k+1)! ϕ(k)=<br />

λ k ( )<br />

(k+1)ϕ(k)−wϕ(k+1)<br />

(k+1)!<br />

(1.3.28)<br />

Naj bo zdaj za <strong>po</strong>ljubno množico A⊆N 0 funkcija f A kar njen indikator. Ustrezno<br />

definirajmo še pripadajoči funkcijiϕ A in h A . Najprej bomo ocenili‖∆h {j} ‖ ∞ . Naj bo<br />

najprej w< j. Tedaj jeϕ(k)=− λj<br />

j! e−λ za vse k=0,...r. Iz verige neenakosti (1.3.26)<br />

sledi:<br />

∆h {j} (w)=− λj w! (w−1)!<br />

⎛⎜<br />

j! e−λ ⎝ λw+1+ λ w+1<br />

V primeru, ko je w= j, prav tako iz (1.3.26) dobimo:<br />

w∑<br />

k=1<br />

λ k<br />

k! (w−k) ⎞⎟ ⎠<br />

≤ 0 (1.3.29)<br />

∆h {j} (j)=− λj j! (j−1)!<br />

⎛⎜<br />

j! e−λ ⎝ λj+1+ λ j+1<br />

j∑<br />

λ<br />

⎞⎟ k<br />

k! (j−k) ⎠<br />

+ (j−1)!<br />

k=1<br />

λ j+1<br />

λ j<br />

j! j (1.3.30)<br />

Drugi člen izraza v oklepaju je večji ali enak 0. Če ga spustimo, dobimo oceno:<br />

∆h {j} (j)≤ 1−e−λ<br />

λ<br />

(1.3.31)


1. IZPELJAVA STEINOVE METODE 15<br />

Če je w> j, pa enakostϕ(k)=− λj<br />

j! e−λ velja za k=w, w+1,... Sledi:<br />

∆h {j} (w)=− λj (w−1)!<br />

e−λ<br />

j! λ w<br />

∞∑<br />

k=w<br />

Dobili smo, da za vsak w∈Nin vsak k∈N 0 velja:<br />

λ k<br />

(k+1−w)≤0 (1.3.32)<br />

(k+1)!<br />

∆h {j} (w)≤0, če je jw (1.3.33)<br />

∆h {j} (j)≤ 1−e−λ<br />

λ<br />

(1.3.34)<br />

Ocenili smo h {j} , zdaj pa ocenimo še h A . Plavzibilno je, da velja:<br />

∑<br />

h A = h {j} (1.3.35)<br />

j∈A<br />

Dokažimo to še rigorozno, in sicer konvergenco <strong>po</strong> točkah. Očitno za vsako množico<br />

A veljaϕ A = ∑ j∈Aϕ {j} . V primeru, ko je A neskončna, vrsta konvergira <strong>po</strong> točkah. Iz<br />

formule (1.3.16) pa je jasno, da je vrednost h A (w) odvisna le odϕ A (0),...ϕ A (w−1), torej<br />

vrsta <strong>po</strong> točkah konvergira tudi v formuli (1.3.35).<br />

Iz formule (1.3.35) zdaj dobimo, da je za oceno diferenc funkcije h A treba le sešteti<br />

ocene (1.3.33) in (1.3.34) <strong>po</strong> vseh j∈A. Pri tem je največ en člen <strong>po</strong>zitiven, pa še ta je<br />

navzgor omejen z (1−e −λ )/λ. Sledi:<br />

∆h A (w)≤ 1−e−λ<br />

λ<br />

(1.3.36)<br />

Če <strong>po</strong>stavimo f= 1, jeϕ=0 in tudi h=0. Zato je h A c=−h A . Dobimo:<br />

∆h A (w)≥− 1−e−λ<br />

λ<br />

(1.3.37)<br />

kar nam skupaj z (1.3.36) da želeni rezultat.<br />

1.4 Enorazsežna normalna <strong>aproksimacija</strong><br />

Podobno kot v razdelku 1.3 bomo tudi tu preučevali vsote neodvisnih slučajnih<br />

spremenljivk, ki pa bodo imele <strong>po</strong>razdelitve drugačnega tipa. Naj bodo X 1 ,...X n<br />

neodvisne slučajne spremenljivke z vrednostmi v realnih številih in naj boE X i = 0 za<br />

vsak i. Spet naj bo:<br />

W= X 1 +···+X n (1.4.1)<br />

in privzemimo še, da je var(W)=1. Začeli bomo <strong>po</strong>dobno kot v prejšnjem razdelku:<br />

spet konstruirajmo slučajne spremenljivke:<br />

W i := W− X i , W ′ i<br />

:= W− X i + X ′ i<br />

(1.4.2)


16 1.4 ENORAZSEŽNA NORMALNA APROKSIMACIJA<br />

kjer je X ′ i neodvisna kopija slučajne spremenljivke X i, in naj bo relacija∼definirana tako<br />

kot v (1.3.3). Nadalje naj bo funkcija g dvakrat zvezno odvedljiva. Taylorjev razvoj<br />

okoli W z ostankom v integralski obliki nam da:<br />

g(W i )− g(W)∼−g ′ (W)X i +θg ′′ (W i +θX i )X 2 i<br />

(1.4.3)<br />

kjer jeθ<strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega. Podobno<br />

dobimo:<br />

g(W ′ i )− g(W i)∼ g ′ (W i )X ′ i + (1−θ)g′′ (W i +θX ′ i )X′ 2 i<br />

∼<br />

(1.4.4)<br />

∼ (1−θ)g ′′ (W i +θX ′ i )X′ 2<br />

i<br />

Ko vse skupaj seštejemo, dobimo:<br />

kjer je:<br />

Velja:<br />

n∑ [<br />

g(W<br />

′<br />

i )− g(W i) ] n∑<br />

∼−g ′ (W)W+θ g ′′ (W i +θX i )Xi+<br />

2<br />

i=1<br />

Rg=θ<br />

+ (1−θ)<br />

∼−g ′ (W)W+ 1 2<br />

i=1<br />

n∑<br />

g ′′ (W i +θX ′ i )X′ 2 i<br />

∼<br />

i=1<br />

n∑ [<br />

g ′′ (W ′ i )X2 i+ g ′′ (W)X ] ′ 2<br />

i<br />

+ Rg<br />

i=1<br />

n∑ [<br />

g ′′ (W i +θX i )− g ′′ (W ′ i )] Xi+<br />

2<br />

i=1<br />

+ (1−θ)<br />

n∑<br />

g ′′ (W)X ′ 2 i<br />

∼<br />

i=1<br />

n∑ [<br />

g ′′ (W i +θX ′ i )− g′′ (W) ] X ′ i<br />

i=1<br />

2<br />

(1.4.5)<br />

(1.4.6)<br />

n∑<br />

g ′′ (W)EXi= 2 g ′′ (W) (1.4.7)<br />

i=1<br />

Za člen z g ′′ (W ′ i )X2 i<br />

ne moremo reči nič <strong>po</strong>dobnega. To težavo bomo odpravili tako, da<br />

bomo spremenili levo stran v (1.4.5). Izkoristili bomo dejstvo, da velja:<br />

Iz (1.4.5) in (1.4.7) dobimo:<br />

kjer je:<br />

n∑<br />

i=1<br />

E g ′′ (W)X ′ i 2 =E g ′′ (W ′ i )X2 i<br />

(1.4.8)<br />

[<br />

g(W<br />

′<br />

i )− g(W i)+ 1 2 g′′ (W)X ′ i 2 − 1 2 g′′ (W ′ i )X2 i<br />

]<br />

∼Ag(W)+Rg (1.4.9)<br />

Ag(w)= g ′′ (w)− g ′ (w)w (1.4.10)<br />

Dobili smo Steinov operator za enorazsežno normalno <strong>po</strong>razdelitev.


1. IZPELJAVA STEINOVE METODE 17<br />

O<strong>po</strong>mba. Leva stran zveze (1.4.5) je v duhu zveze (1.2.2), leva stran zveze (1.4.9)<br />

pa je v duhu zveze (1.2.4), če za <strong>po</strong>samezen i <strong>po</strong>stavimo X=(W, X ′ i ), X′ = (W ′ i , X i) in<br />

Lg(w, x) := g(w)− 1 2 g′′ (w)x 2 .<br />

Ker sta W in W ′ enako <strong>po</strong>razdeljeni ter zaradi (1.4.8) je matematično upanje leve<br />

strani v (1.4.9) enako nič, torej veljaEAg(W)=−ERg. Če je še M 3 (g)


18 1.4 ENORAZSEŽNA NORMALNA APROKSIMACIJA<br />

To pa velja natanko tedaj, ko je:<br />

N f= 1 √<br />

2π<br />

∫ ∞<br />

−∞<br />

f (x) e −x2 /2 dx=N(0, 1){ f} (1.4.17)<br />

kar <strong>po</strong>meni, da bomo <strong>po</strong>razdelitev slučajne spremenljivke W aproksimirali s standardizirano<br />

normalno, rešitev Steinove enačbe pa se bo izražala s formulo:<br />

h(w)=e w2 /2<br />

∫ w<br />

−∞<br />

( ) ∞ ( )<br />

f (x)−Nf e<br />

−x 2 /2 dx=−e<br />

/2∫ w2 f (x)−Nf e<br />

−x 2 /2 dx (1.4.18)<br />

Obnašanje rešitev Steinove enačbe (1.4.14) bomo opisali z naslednjim rezultatom, ki je<br />

<strong>po</strong>splošitev dela Steinove leme iz [125] (drugo <strong>po</strong>glavje, lema 3, stran 25; za <strong>po</strong>splošitev<br />

preostanka pa glej lemo 2.6.2).<br />

Lema 1.4.1. Naj bo f : R→R merljiva funkcija, za katero velja ∫ ∞<br />

w<br />

−∞ | f (x)| e−x2 /2 dx


1. IZPELJAVA STEINOVE METODE 19<br />

Posledica 1.4.3. Naj bodo Y 1 , Y 2 , . . . Y n neodvisne in enako <strong>po</strong>razdeljene slučajne spremenljivke<br />

zE Y i = 0, var(Y i )=1 inγ 3 :=E|Y 3 |


20 1.4 ENORAZSEŽNA NORMALNA APROKSIMACIJA<br />

Zgornjo formulo pa bomo še malo <strong>po</strong>splošili. Najprej tako kot v (C.3.4) induktivno<br />

definirajmo funkcijeΦ r <strong>po</strong> predpisu:<br />

Φ 0 (x) :=φ(x), Φ r+1 (x) :=<br />

∫ x<br />

Φ r (z) dz (1.4.26)<br />

−∞<br />

(torej jeΦ 1 =Φ). Pokažimo sedaj, da za vsak r∈N 0 in vsako merljivo funkcijo f z<br />

M r ( f )


1. IZPELJAVA STEINOVE METODE 21<br />

2N/ √ n (če je n sod) ali pa na (2N+1)/ √ n. Vzemimo zdaj testno funkcijo f n , ki naj bo<br />

na množici 2N/ √ n enaka 1/(2 √ n), na množici (2N+1)/ √ n naj bo enaka−1/(2 √ n) na<br />

<strong>po</strong>sameznem intervalu [2k/ √ n, (2k+1)/ √ n] pa naj bo linearna (graf funkcije f n je torej<br />

žagaste oblike). Očitno je M 1 ( f )=1. Poleg tega jeEf n (W n )=±1/(2 √ n), z integracijo<br />

per partes pa dobimo še:<br />

N(0, 1){ f n }=<br />

∫ ∞<br />

−∞<br />

f n (x)φ(x) dx=−<br />

∫ ∞ ∫ x<br />

−∞ 0<br />

f n (t) dtφ ′ (x) dx (1.4.30)<br />

Ni težko preveriti, da za vsak x velja ∣ ∫ x<br />

∣ f 0<br />

n(t) dt ∣ ∣≤1/(4n). Sledi:<br />

∣<br />

∣N(0, 1){ f n } ∣ ∫ 1 ∞<br />

∣≤ |φ ′ 1<br />

(x)| dx=<br />

4n −∞<br />

2n √ 2π<br />

torej je:<br />

∣<br />

∣E f n (W n )−N(0, 1){ f n } ∣ ∣ ∣≥<br />

1<br />

2 √ n − 1<br />

2n √ 2π<br />

torej v tem primeru konvergenca res ne more biti hitrejša kot O(n −1/2 ).<br />

(1.4.31)<br />

(1.4.32)<br />


22 1.4 ENORAZSEŽNA NORMALNA APROKSIMACIJA


2.<br />

Večrazsežna normalna <strong>aproksimacija</strong><br />

V razdelkih 1.3 in 1.4 smo izpeljali Steinovo metodo za Poissonovo in normalno<br />

aproksimacijo. Namen tega <strong>po</strong>glavja je izpeljati Steinovo metodo za večrazsežno normalno<br />

aproksimacijo. Videli bomo, da se Steinov operator vR d izraža v obliki:<br />

in rešili Steinovo enačbo:<br />

Ag(w) :=∆g(w)−〈grad g(w), w〉 (2.0.1)<br />

Ag(w)= f (w)−E f (Z) (2.0.2)<br />

kjer je Z∼N(0, I) slučajni vektor, <strong>po</strong>razdeljen standardizirano normalno. Pokazali<br />

bomo (glej izrek 2.6.1), da brž ko jeE| f (Z)|


24 2.1 LINDEBERG–BERGSTRÖMOVA METODA<br />

aproksimacijo <strong>po</strong> <strong>Steinovi</strong> <strong>metodi</strong>. Vendar pa naš <strong>po</strong>stopek še zdaleč ni omejen zgolj<br />

na normalno aproksimacijo in v splošnem ni rečeno, da iz njega dobimo Steinovo<br />

metodo. Natančneje, ocenjujemo sicer izraze tipaEAg(W), kjer jeAprimeren operator,<br />

vendar pa zdaj g ni več ena sama funkcija, ki reši Steinovo enačbo, marveč zgornje<br />

izraze ocenjujemo za celo družino funkcij g, ki jih ne dobimo kot rešitve določene<br />

enačbe. To bi bila lahko prednost tam, kjer je reševanje Steinove enačbe slabo <strong>po</strong>gojeno.<br />

To se zgodi pri Edgeworthovem razvoju, ki je <strong>po</strong>splošitev normalne aproksimacije.<br />

Barbour [8] zaobide to težavo z iteracijo, tako da je funkcija g v končni fazi vsota<br />

rešitev več enačb Steinovega tipa; eno <strong>po</strong>membnih <strong>po</strong>splošitev Barbourjevega rezultata<br />

predstavita Rinott in Rotar v članku [107]). Posplošitev ideje, razvite v razdelku 2.5, bi<br />

bila lahko alternativa Barbourjevemu pristopu.<br />

Omenili smo že, da pri normalni aproksimaciji na koncu vendarle dobimo Steinovo<br />

metodo. Vendar pa rešitev Steinove enačbe konstruiramo na <strong>po</strong><strong>po</strong>lnoma drug način,<br />

iz katerega dobimo drugačne ocene odvodov rešitve. Tako npr. tretji odvod rešitve<br />

g Steinove enačbe (2.0.2) v enorazsežnem primeru ocenimo s <strong>po</strong>močjo prvega odvoda<br />

funkcije f (glej izrek 1.4.2); konstrukcija, ki jo u<strong>po</strong>rabimo v večrazsežnem primeru, pa<br />

nam tretje odvode funkcije g oceni s <strong>po</strong>močjo drugih ali tretjih odvodov funkcije f .<br />

V enorazsežnem primeru nam obe konstrukciji dasta (do konstante) isto funkcijo g in<br />

tako lahko njen tretji odvod ocenimo s <strong>po</strong>močjo prvega, drugega ali tretjega odvoda<br />

funkcije f . Nastane vprašanje, ali se dajo tretji odvodi funkcije g tudi v večrazseznem<br />

primeru oceniti s <strong>po</strong>močjo prvih odvodov funkcije f . Videli bomo, da je odgovor na<br />

to negativen (glej trditev 2.8.3). To je <strong>po</strong>membna kvalitativna razlika med obnašanjem<br />

rešitve Steinove enačbe v eno- in v večrazsežnem primeru.<br />

2.1 Lindeberg–Bergströmova metoda<br />

Kot smo že omenili, bomo začeli z metodo, ki sta jo razvila J. W. Lindeberg [74] in<br />

H. Bergström [25]. Temelji na ideji ocenjevanja napake <strong>po</strong> korakih, ki jo v zelo splošni<br />

obliki lahko formuliramo na naslednji način: naj bosta f in f ¯ elementa vektorskega<br />

prostora, na katerem je <strong>po</strong>dana seminorma p. Želeli bi oceniti p( f− f ¯ ). To storimo “<strong>po</strong><br />

korakih”: <strong>po</strong>iščemo take elemente f 0 ,... f n , da je f 0 = f in f n = f ¯ , in ocenimo:<br />

p( f− ¯ f )≤<br />

n∑<br />

p( f i − f i−1 ) (2.1.1)<br />

i=1<br />

Naj bodo zdaj X 1 ,...X n neodvisni slučajni vektorji z vrednostmi vR d in W= X 1 +···+X n .<br />

Privzemimo še, da jeE X i = 0 in Var(W)=I, kjer je I identična matrika naR d , Var pa<br />

<strong>po</strong>meni kovariančno matriko, t. j.:<br />

Var(W)=E WW T (2.1.2)<br />

Zadevo lahko zastavimo še malo bolj abstraktno in privzamemo, da imajo slučajni<br />

vektorji vrednosti v evklidskem prostoru, ki je kovarianten v dualnem paru evklidskih<br />

prostorov (glej razdelek D.7). V tem primeru je Var(W) mešani tenzor tipa (1, 1).


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 25<br />

V razdelku 1.4 smo videli, da je v enorazsežnem primeru v situaciji, ko se tretji<br />

momenti “le<strong>po</strong>” obnašajo, primerna normalna <strong>aproksimacija</strong>. Tako domnevamo, da<br />

bo tukaj primerna večrazsežna normalna <strong>aproksimacija</strong>. Za primerne testne funkcije f<br />

bi torej želeli oceniti: ∣ ∣∣E f (W)−E f (Z)<br />

∣ ∣∣ (2.1.3)<br />

kjer je Z∼N(0, I) slučajni vektor, <strong>po</strong>razdeljen standardizirano normalno.<br />

Vmesne “korake” bomo izbirali tako, da bomo sumande <strong>po</strong>sto<strong>po</strong>ma zamenjevali z<br />

ustreznimi normalnimi slučajnimi vektorji. Naj bodo torej Z 1 ,...Z n slučajni vektorji,<br />

neodvisni tako med seboj kot tudi od X 1 ,...X n , <strong>po</strong>razdeljeni pa normalno N ( 0, Var(X i ) ) .<br />

Za i=0, 1,...n definirajmo:<br />

W i := Z 1 +···+Z i + X i+1 +···+X n (2.1.4)<br />

(definicijo razumemo tako, da je W 0 = W in W n = ∑ n<br />

i=1 Z i ∼ N(0, I)). Privzamemo lahko,<br />

da je kar Z= ∑ n<br />

i=1 Z i . V skladu z Lindeberg–Bergströmovo metodo bomo ocenili:<br />

∣<br />

∣E f (W)−E f (Z) ∣ n∑<br />

∣≤<br />

∣<br />

∣E f (W i )−E f (W i−1 ) ∣ ∣ (2.1.5)<br />

i=1<br />

Privzemimo, da je f dvakrat zvezno odvedljiva funkcija in M 3 ( f )


26 2.1 LINDEBERG–BERGSTRÖMOVA METODA<br />

X 2 = X<br />

i i X TI, kjer jeIfundamentalni kovariantni tenzor). Ker jeE X i iX T = Var(X<br />

i i )=<br />

Var(Z i )=E Z i Z T, tako veljaE i f′′ (W ′ i )Z2 i=E f ′′ (W ′ i )X2. Sledi:<br />

i ∣<br />

∣E f (W i )−E f (W i−1 ) ∣ ∣≤<br />

1<br />

M 6 3( f ) ( E|X i | 3 +E|Z i | 3) (2.1.10)<br />

Na tem mestu bomo <strong>po</strong>trebovali naslednjo lemo, ki jo bomo dokazali malo kasneje.<br />

Lema 2.1.1. Naj bo Z normalno <strong>po</strong>razdeljen slučajni vektor zE Z=0. Tedaj velja:<br />

E|Z| 3 ≤ 4 √<br />

2π<br />

(<br />

E|Z|<br />

2 ) 3/2<br />

(2.1.11)<br />

O<strong>po</strong>mba. Če je Z običajna slučajna spremenljivka, v zgornji oceni velja enakost.<br />

Ker za vsak slučajni vektor Y zE Y=0 velja:<br />

E|Y| 2 =E Y T Y=E sl(YY T )=sl Var(Y) (2.1.12)<br />

mora <strong>po</strong>tem veljatiE|Z i | 2 =E|X i | 2 . Iz leme in Jensenove neenakosti zdaj dobimo:<br />

E|Z i | 3 ≤ 4 √<br />

2π<br />

(<br />

E|Xi | 2) 3/2<br />

≤<br />

4<br />

√<br />

2π<br />

E|X i | 3 (2.1.13)<br />

in iz (2.1.5), (2.1.10) in (2.1.13) končno sledi naslednji izrek.<br />

Izrek 2.1.2. Če je W kot zgoraj, velja:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ∣ ∣≤<br />

(<br />

1<br />

6 + 4 √<br />

2π<br />

)<br />

M 3 ( f )<br />

n∑<br />

E|X i | 3 (2.1.14)<br />

Dobili smo torej <strong>po</strong>dobno oceno kot v 1.4.2, le da se ocena izraža z M 3 ( f ) in ne z<br />

M 1 ( f ). Z drugimi besedami, napako pri normalni aproksimaciji smo ocenili v metriki<br />

d 3 , definirani v razdelku A.8, ocena pa je istega velikostnega reda kot ocena (1.4.20), ki<br />

je bila dobljena za enorazsežni primer in se izraža v Wassersteinovi metriki d 1 = d W .<br />

Nastane vprašanje, ali se tudi v večrazsežnem primeru dobiti oceno v Wassersteinovi<br />

metriki. To se vsekakor da, saj <strong>po</strong> točki (2) trditve A.9.1 velja ocena d W ≤ C d 1/3 ,<br />

3<br />

kjer je C univerzalna konstanta. Toda ta ocena nam da dosti slabšo oceno hitrosti<br />

konvergence v Wassersteinovi metriki kot pa ocena (1.4.20).<br />

V resnici se da tudi v večrazsežnem primeru izpeljati oceno v metrikah d W in d 2 ,<br />

ki je enakega velikostnega reda kot oceni (1.4.20) in (2.1.14) (za oceno v metriki d 2<br />

glej izrek 2.5.3, za oceno v Wassersteinovi metriki pa izrek 3.11.1). Še več, isto hitrost<br />

konvergence se da izpeljati celo za primer, ko so testne funkcije f indikatorji merljivih<br />

konveksnih množic. Vse to se tudi da doseči z Lindeberg–Bergströmovo metodo: za<br />

indikatorje merljivih konveksnih množic in enako <strong>po</strong>razdeljene slučajne vektorje glej<br />

Bentkus [22]. Vendar pa je dokazovanje slednjih ocen <strong>po</strong> Lindeberg–Bergströmovi<br />

<strong>metodi</strong> tehnično precej zahtevno, <strong>po</strong>sebej če slučajni vektorji niso enako <strong>po</strong>razdeljeni.<br />

V nadaljevanju bomo razvili Steinovo metodo za večrazsežno normalno aproksimacijo,<br />

ki sicer na začetku zahteva precej vložka, vendar pa neenakost <strong>po</strong>razdelitev prav nič ne<br />

vpliva na zapletenost <strong>po</strong>stopka. Prav tako obstaja tudi možnost <strong>po</strong>splošitve na vsote<br />

odvisnih slučajnih vektorjev.<br />

i=1


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 27<br />

DOKAZLEME 2.1.1. Naj bodoσ 2 1 ,...σ2 d lastne vrednosti in u 1,...u d pripadajoči ortonormirani<br />

lastni vektorji kovariančne matrike slučajnega vektorja Z. Ker je Z <strong>po</strong>razdeljen<br />

večrazsežno normalno, lahko zapišemo:<br />

Z=<br />

d∑<br />

σ i ζ i u i (2.1.15)<br />

i=1<br />

kjer soζ 1 ,...ζ d neodvisne slučajne spremenljivke, <strong>po</strong>razdeljene standardizirano normalno.<br />

Pišimo:<br />

E|Z| 3 =E [ |Z||Z| 2] d∑<br />

= σ 2 i E[ ]<br />

|Z|ζ 2 i<br />

(2.1.16)<br />

Po Hölderjevi neenakosti lahko ocenimo:<br />

i=1<br />

E|Z| 3 ≤<br />

d∑<br />

σ 2 i<br />

i=1<br />

(<br />

E|Z|<br />

3 ) 1/3(<br />

E|ζi | 3) 2/3<br />

(2.1.17)<br />

Ker soζ i <strong>po</strong>razdeljene standardizirano normalno, jeE|ζ i | 3 = 4/ √ 2π. Sledi:<br />

E|Z| 3 ≤<br />

(<br />

4<br />

√<br />

2π<br />

) 2/3<br />

(<br />

E|Z|<br />

3 ) 1/3<br />

d∑<br />

σ 2 i=<br />

i=1<br />

(<br />

4<br />

√<br />

2π<br />

) 2/3<br />

(<br />

E|Z|<br />

3 ) 1/3<br />

E|Z|<br />

2<br />

(2.1.18)<br />

Ko enačbo delimo z ( E|Z| 3) 1/3<br />

in <strong>po</strong>tenciramo na 3/2, dobimo želeni rezultat.<br />

2.2 Steinova metoda in markovske verige<br />

Postavimo se spet na začetek prejšnjega razdelka, kjer sta dana elementa f in f ¯<br />

nekega prostoraF, ki naj bo linearni to<strong>po</strong>loški prostor, na katerem je <strong>po</strong>dana še zvezna<br />

seminorma p. Pri ocenjevanju količine p( f− f ¯ ) za vmesne korake <strong>po</strong>stavimo:<br />

f k :=B k f (2.2.1)<br />

kjer jeBzvezen linearen operator naF . Obstaja naj še operator:<br />

P= lim<br />

k→∞<br />

B k (2.2.2)<br />

(limita je mišljena <strong>po</strong> točkah glede na to<strong>po</strong>logijo prostora) in naj veljaP f = ¯ f . Ker<br />

zaradi zveznosti velja:<br />

BP=P (2.2.3)<br />

in zato:<br />

jePprojektor. Pišimo:<br />

P 2 = lim<br />

k→∞<br />

B k P=P (2.2.4)<br />

f−P f=−<br />

∞∑ (<br />

B k+1 f−B k f ) (2.2.5)<br />

k=0


28 2.2 STEINOVA METODA IN MARKOVSKE VERIGE<br />

Zaradi (2.2.3) velja tudi:<br />

∞∑<br />

f−P f=− (B−I)(B k f−P f ) (2.2.6)<br />

k=0<br />

Če greB k f tako hitro protiP f , da vrsta ∑ ∞<br />

k=0(B k f−P f ) konvergira, velja:<br />

kjer je:<br />

A=B−I, g=−<br />

f−P f=Ag (2.2.7)<br />

∞∑<br />

(B k f−P f ) (2.2.8)<br />

kar je natanko (1.1.7). Če je torejBoperator, čigar <strong>po</strong>tenceB k dovolj hitro konvergirajo<br />

proti razumnemu operatorjuP, lahko na vso stvar gledamo kot na Steinovo metodo,<br />

konstrukcija pa se odlikuje tudi <strong>po</strong> tem, da je rešitev Steinove enačbe eksplicitno <strong>po</strong>dana.<br />

V razdelku 1.2 smo Steinov operator v najpreprostejšem primeru konstruirali kot<br />

operator, za katerega velja približna enakost (1.2.2). Le-ta zdaj ustreza približni enakosti:<br />

B f (W)≈E[ f (W ′ )|W] (2.2.9)<br />

kjer je W ′ slučajna spremenljivka, ki je <strong>po</strong>razdeljena enako kot W.<br />

Potence operatorjaBimajo naslednjo verjetnostno interpretacijo: par (W, W ′ ) <strong>po</strong>daljšajmo<br />

v markovsko verigo W 0 , W 1 ,..., kjer je W 0 = W in W 1 = W ′ . Iz enačb Chapmana<br />

in Kolmogorova sledi, da mora <strong>po</strong>tem veljati:<br />

k=0<br />

B k f (W 0 )≈E[ f (W k )|W 0 ] (2.2.10)<br />

Če je markovska veriga ergodična v smislu, da velja lim k→∞ E[ f (W k )|W 0 ]=E f (W), bo<br />

veljaloP f (W)≈E f (W), kar <strong>po</strong>meni, da bo v tem primeru operatorPsmiselno izbirati<br />

med operatorji, ki slikajo v prostor konstantnih funkcij.<br />

Za primer, ko je W=X 1 +···+X n vsota neodvisnih slučajnih spremenljivk, smo<br />

v razdelkih 1.3 in 1.4 slučajno spremenljivko W ′ konstruirali tako, da smo enega od<br />

sumandov zamenjali z neodvisno kopijo, in na <strong>po</strong>dlagi tega dobili Steinov operator. Če<br />

želimo iz tega konstruirati markovsko verigo, pa naletimo na dve težavi. Prva težava je,<br />

da smo Steinov operator dobili kot vsoto <strong>po</strong> več slučajnih spremenljivkah W ′ , pri katerih<br />

i<br />

smo i-ti sumand zamenjali z neodvisno kopijo. To lahko obidemo tako, da si predstavljamo,<br />

da z neodvisno kopijo zamenjamo slučajni sumand. Drugi, hujši problem pa je<br />

v tem, da je pri markovski verigi, ki jo dobimo, zelo težko eksplicitno opisati <strong>po</strong>gojne<br />

<strong>po</strong>razdelitve (jedra), zato si z njo ne moremo prav dosti <strong>po</strong>magati. Zaradi tega bomo<br />

pred<strong>po</strong>stavko, da je W 0 , W 1 ,... markovska veriga, opustili. Potem moramo namesto<br />

operatorjaBgledati celo družino operatorjevB k , ki ustrezajo približnim zvezam:<br />

B k f (W 0 )≈E[ f (W k )|W 0 ] (2.2.11)<br />

Zahtevamo še, da jeB 0 =I, za za<strong>po</strong>redje W 0 , W 1 ,... pa ne zahtevamo ničesar, niti tega<br />

ne, da je par (W 0 , W 1 ) enako <strong>po</strong>razdeljen kot (W, W ′ ). Smiselno pa je, da to velja vsaj


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 29<br />

približno. Tudi za<strong>po</strong>redje W 0 , W 1 ,... bo često dobljeno s <strong>po</strong>močjo kakšne markovske<br />

verige, četudi samo <strong>po</strong> sebi ne bo več nujno markovska veriga.<br />

Tu zdaj sicer ne moremo več formulirati Steinove enačbe, lahko pa še vedno zapišemo:<br />

n∑<br />

f−P f=− (B k −B k−1 ) f (2.2.12)<br />

k=1<br />

pri čemer je lahko n končen ali neskončen: v prvem primeru vzamemoP=B n , v<br />

drugem pa tako kot prejP=lim k→∞ B k ). Nato upamo, da se dajo količine:<br />

E(B k −B k−1 ) f (W) (2.2.13)<br />

dobro oceniti.<br />

razdelka 2.1.<br />

Tako soB k f dejansko koraki pri ocenjevanju, opisanem na začetku<br />

O<strong>po</strong>mba. OperatorB k −B k−1 igra vlogo operatorjaAvzvezi (1.2.6), če <strong>po</strong>stavimo<br />

Z := W 0 , X := W i−1 , X ′ := W i inLg := g.<br />

O<strong>po</strong>mba. Če je W 0 enako <strong>po</strong>razdeljena kot W in v (2.2.11) velja enakost, se (2.2.13)<br />

prevede naE f (W k )−E f (W k−1 ).<br />

Vrnimo se zdaj k vsoti neodvisnih slučajnih vektorjev W=X 1 +···+X n . Kako<br />

konstruirati slučajne spremenljivke W k , ki bodo lažje izračunljive kot pa markovska<br />

veriga, ki jo dobimo tako z nadaljevanjem para (W, W ′ ), pri čemer je W ′ dobljen z zamenjavo<br />

enega od sumandov z neodvisno kopijo? Ena od možnosti je, da konstruiramo<br />

markovsko verigo dolgih slučajnih vektorjev:<br />

in <strong>po</strong>stavimo:<br />

X k = ( )<br />

Y (k)<br />

1 ,...Y(k) n<br />

(2.2.14)<br />

W k := Y (k)<br />

1<br />

+···+Y (k)<br />

n (2.2.15)<br />

Markovsko verigo X k pa konstruiramo tako, da najprej za vsako njegovo kom<strong>po</strong>nento<br />

i=1,...n izberemo dve <strong>po</strong>razdelitviµ i inν i naR d . Slučajni vektor X 0 <strong>po</strong>stavimo tako,<br />

da ima i-ta kom<strong>po</strong>nenta <strong>po</strong>razdelitevµ i in so vse kom<strong>po</strong>nente neodvisne. Dinamika<br />

markovske verige pa <strong>po</strong>teka tako, da vsakič slučajno in neodvisno izberemo kom<strong>po</strong>nento<br />

I, ki jo zamenjamo z neodvisnim slučajnim vektorjem, čigar <strong>po</strong>gojna <strong>po</strong>razdelitev<br />

na I je enakaν I . Natančneje, naj bodo X (k) , i=1,...n, k=0, 1,..., neodvisni slučajni<br />

i<br />

vektorji naR d , pri čemer ima X (0) <strong>po</strong>razdelitevµ<br />

i<br />

i , X (k) pa za k≥1 <strong>po</strong>razdelitevν<br />

i<br />

i . Tedaj<br />

za vsak i slučajni vektorji X (0) , X (1) ,... tvorijo markovsko verigo. Postavimo:<br />

i i<br />

Y (k)<br />

i<br />

:= X (K i(k))<br />

i<br />

(2.2.16)<br />

kjer je:<br />

K (k) = ( ) k∑<br />

K (k)<br />

1 ,...K(k) n = L (l) (2.2.17)<br />

l=1


30 2.2 STEINOVA METODA IN MARKOVSKE VERIGE<br />

in kjer so L (l) neodvisni slučajni vektorji z vrednostmi vR n , <strong>po</strong>razdeljeni enakomerno <strong>po</strong><br />

množici standardnih baznih vektorjev. Tako je slučajni vektor ( )<br />

K (k)<br />

1 ,...K(k) n <strong>po</strong>razdeljen<br />

simetrično <strong>po</strong>linomsko s k prostostnimi stopnjami. Če označimo:<br />

je zdaj zahteva (2.2.11) ekvivalentna zahtevi:<br />

Z i := X (0)<br />

i<br />

, Z ′ i<br />

:= X (1)<br />

i<br />

(2.2.18)<br />

[ ( n∑ (<br />

B k f (W 0 )≈E f Zi 1 ( K i (k)=0 ) + Z ′ i 1( K i (k)=1 ))) ∣ ∣∣∣∣ ]<br />

W 0<br />

i=1<br />

(2.2.19)<br />

in <strong>po</strong>sledično:<br />

P f≈E f (Z ′ 1 +···+Z′ n) (2.2.20)<br />

Velja tudi:<br />

(B 1 −B 0 ) f (W 0 )≈ 1 n<br />

n∑<br />

i=1<br />

E [ f ( )<br />

W 0 − X (0) + X (1)<br />

i i − f (W0 )<br />

]<br />

∣ W 0<br />

(2.2.21)<br />

kar s<strong>po</strong>minja na zveze (1.3.5), (1.4.5) in (1.4.9), kjer spet operatorB 1 −B 0 igra vlogo<br />

operatorjaA.<br />

Če so vse <strong>po</strong>razdelitveµ i enake, prav tako tudi <strong>po</strong>razdelitveν i , je ocenjevanje vsote:<br />

ekvivalentno ocenjevanju vsote:<br />

∞∑<br />

∣<br />

∣(B k −B k−1 ) f (w) ∣ ∣ (2.2.22)<br />

k=1<br />

n∑<br />

∣<br />

∣E [ f (W ∗ i )− f (W∗ i−1 )∣ ∣ W0 = w ] ∣ ∣∣∣<br />

(2.2.23)<br />

i=1<br />

kjer je:<br />

W ∗ i<br />

:= Z ′ 1 +···+Z′ i + Z i+1+···+Z n (2.2.24)<br />

kar je znatno enostavneje kot (2.2.22). V <strong>po</strong>sebnem primeru, ko so slučajne spremenljivke<br />

X i enako <strong>po</strong>razdeljene in Z i = X i , Z ′ pa je <strong>po</strong>razdeljen normalno z enakim<br />

i<br />

matematičnim upanjem in varianco kot X i , dobimo natanko Lindeberg–Bergströmovo<br />

metodo. Če pa slučajni vektorji X i niso enako <strong>po</strong>razdeljeni, nam ocenjevanje s <strong>po</strong>močjo<br />

(2.2.15) da nekakšno simetrizacijo Lindeberg–Bergströmove metode, ki je bolj<br />

zapletena. Vendar pa tudi enako obravnavanje vseh sumandov prinaša prednosti, zato<br />

bomo v nadaljevanju ocenjevanje <strong>po</strong>enostavili na drug način. Izkaže se namreč, da je<br />

dosti lažje ocenjevati v zveznem času.


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 31<br />

2.3 Prehod v zvezni čas<br />

V razdelku 2.1 smo opisali Lindeberg–Bergströmovo metodo, ki temelji na ideji, da<br />

razliko med danima vektorjema f in f ¯ ocenimo tako, da med f in f ¯ “vrinemo” še nekaj<br />

funkcij. Zvezna različica tega pa je, da konstruiramo celo <strong>po</strong>t med f in f ¯ . Naj bo torejF<br />

vektorski prostor, na katerem sta <strong>po</strong>dani seminorma p in še preslikava u: [a, b]→F , za<br />

katero je u(a)= f in u(b)= f ¯ . Privzemimo še, da obstaja taka preslikava u ′ : [a, b]→F,<br />

da enakomerno <strong>po</strong> t∈[a, b] velja:<br />

Tedaj velja ocena:<br />

( )<br />

u(t+h)−u(t)<br />

lim p − u ′ (t) = 0 (2.3.1)<br />

h→0 h<br />

∫ b<br />

p( f− f ¯ )≤ p ( u ′ (t) ) dt (2.3.2)<br />

a<br />

Zadevo se da <strong>po</strong>splošiti tudi na neskončne intervale. V tem primeru privzamemo,<br />

da (2.3.1) velja enakomerno na vsakem končnem intervalu, vrednosti funkcije u v<br />

neskončnosti pa razumemo kot limito glede na seminormo p: če je npr. b = ∞,<br />

zahtevamo, da je lim t→∞ p(u(t)− f ¯ )=0.<br />

O<strong>po</strong>mba. Na zgoraj opisani ideji temelji tudi metoda zveznega nadaljevanja v numerični<br />

matematiki (glej Allgower in Georg [2]).<br />

Ocenjevanje <strong>po</strong> (diskretnih) korakih smo prek markovskih verig <strong>po</strong>vezali s Steinovo<br />

metodo. Povezava je delovala v primeru, ko smo vmesne korake dobili s <strong>po</strong>močjo<br />

<strong>po</strong>tenc danega operatorja. Potencam v diskretnem primeru pa odgovarja operatorska<br />

<strong>po</strong>lgrupa. Naj boF Banachov prostor inP t krepko zvezna operatorska <strong>po</strong>lgrupa z<br />

generatorjemA. Privzemimo še, da v dani normi obstajaP = lim t→∞ P t . Zaradi<br />

zveznosti veljaPP t =P, torej jePprojektor, velja pa tudi:<br />

Nadalje iz Dynkinove formule (trditev B.3.1) sledi:<br />

AP=0 (2.3.3)<br />

∫ s<br />

f−P t f=−<br />

=−<br />

0<br />

∫ s<br />

=−A<br />

0<br />

∫ s<br />

AP s f ds=<br />

A(P s f−P f ) ds=<br />

0<br />

(P s f−P f ) ds<br />

(2.3.4)<br />

Če greP s f dovolj hitro protiP f , da velja:<br />

∫ ∞<br />

0<br />

‖P s f−P f‖ ds=0 (2.3.5)


32 2.3 PREHOD V ZVEZNI ČAS<br />

lahko naredimo limito, ko gre t proti neskončno. Ker je operatorAzaprt, velja:<br />

f−P f=Ag (2.3.6)<br />

kjer je:<br />

∫ ∞<br />

g=− (P s f−P f ) ds (2.3.7)<br />

0<br />

kar <strong>po</strong>meni, da lahko naAgledamo tudi kot na Steinov operator, <strong>po</strong>dobno kot v<br />

razdelku 2.2.<br />

Če je operatorAomejen, se operatorjiP t izražajo <strong>po</strong> formuli:<br />

P t = e tA =<br />

∞∑<br />

k=0<br />

t k<br />

k! Ak (2.3.8)<br />

Privzemimo zdaj, da je operatorAdobljen tako kot v (1.2.2), t. j.:<br />

Ag(W)≈E [ g(W ′ )− g(W) ∣ ∣ ∣ W<br />

]<br />

(2.3.9)<br />

Tedaj za operatorB :=I+A velja:<br />

Bg(W)≈E[g(W ′ )|W ] (2.3.10)<br />

OperatorjeP t lahko izrazimo tudi s <strong>po</strong>tencami operatorjaB:<br />

P t = e t(B−I) =<br />

∞∑<br />

k=0<br />

t k<br />

k! e−t B k (2.3.11)<br />

Zgornjo formulo lahko zapišemo tudi verjetnostno: če je N(t) slučajna spremenljivka,<br />

<strong>po</strong>razdeljena <strong>po</strong> Poissonu Po(t), velja:<br />

P t =EB N(t) (2.3.12)<br />

Če zdaj par (W, W ′ ) <strong>po</strong>daljšamo v markovsko verigo W 0 , W 1 ,..., ki je neodvisna od<br />

N(t), iz (2.2.10) dobimo:<br />

P t f (W 0 )≈E[ f (W N(t) )|W 0 ] (2.3.13)<br />

Podobno kot v prejšnjem razdelku lahko tudi tu konstrukcijo <strong>po</strong>splošimo na nemarkovski<br />

primer: vzamemo <strong>po</strong>ljubno za<strong>po</strong>redje slučajnih spremenljivk W 0 , W 1 ,... in<br />

zahtevamo (2.3.13). Pri tem zdaj ne zahtevamo več, da jeP t operatorska <strong>po</strong>lgrupa, zato<br />

nimamo več Steinove enačbe. Lahko pa vseeno zapišemo:<br />

f−P f=−<br />

∫ ∞<br />

0<br />

d<br />

dt P t f dt (2.3.14)<br />

in upamo, da se bodo dala matematična upanjaE d dt P t f (W) preprosto oceniti. V naslednjih<br />

dveh razdelkih bomo to konstrukcijo u<strong>po</strong>rabili pri večrazsežni normalni aproksimaciji<br />

vsot neodvisnih slučajnih vektorjev.


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 33<br />

2.4 Ornstein–Uhlenbeckov proces<br />

Vrnimo se k aproksimaciji <strong>po</strong>razdelitve vsote W= X 1 +···+X n neodvisnih slučajnih<br />

vektorjev, kot smo jo zastavili v razdelku 2.2. Tam smo konstruirali <strong>po</strong>možne slučajne<br />

vektorje:<br />

W k := X (K 1(k))<br />

+···+X (K n(k))<br />

1 n (2.4.1)<br />

kjer za vsak i slučajni vektorji X (0) , X (1) ,... tvorijo markovsko verigo in kjer je slučajni<br />

i i<br />

vektor ( K 1 (k),...K n (k) ) <strong>po</strong>razdeljen simetrično <strong>po</strong>linomsko s k prostostnimi stopnjami<br />

(t. j. vsota kom<strong>po</strong>nent slučajnega vektorja je enaka k).<br />

Omenili smo, da se ocenjevanje napake pri aproksimaciji <strong>po</strong>enostavi, če stvar gledamo<br />

v zveznem namesto v diskretnem času. V skladu z (2.3.13) bomo iskali operatorje<br />

P t , za katere bo približno veljalo:<br />

P t f (W 0 )≈E[ f (W N(nt) )|W 0 ] (2.4.2)<br />

kjer je slučajna spremenljivka N(nt) <strong>po</strong>razdeljena <strong>po</strong> Poissonu Po(nt) in neodvisna od<br />

vsega ostalega. Čas smo n-krat <strong>po</strong>spešili, ker <strong>po</strong>tem pri primernih <strong>po</strong>gojih velja:<br />

d<br />

dt∣ P t f (W N(nt) )≈nE [ f (W 1 )− f (W 0 ) ∣ ]<br />

∣ W0 =<br />

t=0<br />

n∑<br />

= E [ f ( ) W 0 − X (0) + X (1)<br />

] (2.4.3)<br />

i i − f (W0 )<br />

∣ W 0<br />

i=1<br />

kar je istega velikostnega reda kot leve strani v (1.3.5), (1.4.5) in (1.4.9).<br />

Prva prednost zveznega časa je v tem, da so slučajni vektorji W N(nt) na določen<br />

način enostavnejši kot W k : krajši račun namreč <strong>po</strong>kaže, da so slučajne spremenljivke<br />

N i (t) := K i (N(nt)) neodvisne in <strong>po</strong>razdeljene <strong>po</strong> Poissonu Po(t).<br />

Privzemimo zdaj, da jeE X i = 0 in Var(W)=I, za vse slučajne vektorje X (k) pa<br />

i<br />

privzemimo, da so <strong>po</strong>razdeljeni centrirano normalno z enako varianco kot X i – to naj<br />

velja tudi za X (0) . Če bi formula (2.4.2) veljala natančno, bi veljalo:<br />

i<br />

( n∑<br />

P t f (w)=E f Σ(t)w+ ( 1−Σ 2 (t) ) )<br />

1/2<br />

Z<br />

kjer je Z∼N(0, I) neodvisna od vsega ostalega in:<br />

i=1<br />

(2.4.4)<br />

Σ(t)=<br />

n∑<br />

1(N i (t)=0) Var(X i ) (2.4.5)<br />

i=1<br />

Toda če je n velik in se kovariančne matrike slučajnih vektorjev X i ne razlikujejo preveč,<br />

je slučajna matrikaΣ(t) približno enaka:<br />

EΣ(t)=<br />

n∑<br />

P ( N i (t)=0 ) Var(X i )=e −t I (2.4.6)<br />

i=1


34 2.4 ORNSTEIN–UHLENBECKOV PROCES<br />

V duhu tega bomo <strong>po</strong>stavili:<br />

in v skladu z (2.3.14) ocenjevali:<br />

kjer jeP f (w)=lim t→∞ P t f (w).<br />

P t f (w) :=E f ( e −t w+ √ 1−e −2t Z ) (2.4.7)<br />

E f (W)−EPf (W)=−E<br />

∫ ∞<br />

0<br />

d<br />

dt P t f (W) dt (2.4.8)<br />

Oglejmo si operatorjeP t malo <strong>po</strong>bliže. Definiramo jih lahko za kar precej širok<br />

razred funkcij, omejili pa se bomo na funkcije f , za katere jeE| f (Z)|


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 35<br />

Posledica 2.4.2. Brž ko je f zvezna v w inE| f (Z)|


36 2.4 ORNSTEIN–UHLENBECKOV PROCES<br />

kjer jeφ d tako kot v (E.8.1) gostota standardizirane d-razsežne normalne <strong>po</strong>razdelitve:<br />

Potrebovali bomo še nekaj <strong>po</strong>možnih rezultatov.<br />

Lema 2.4.3. Naj bo r∈N 0 .<br />

φ d (x)=(2π) −d/2 e − 1 2 |x|2 (2.4.19)<br />

(1) Obstaja taka konstanta C r ≥ 0, da za <strong>po</strong>ljubna 0≤a


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 37<br />

O<strong>po</strong>mba. ZW 1,1<br />

loc (Rd ) smo označili prostor Soboljeva vseh funkcij, ki imajo lokalno<br />

integrabilen šibki odvod (glej razdelek E.3). Šibki odvod je <strong>po</strong>splošitev odvoda v klasičnem<br />

smislu, tako da trditev in nadaljnji rezultati veljajo tudi za zvezno diferenciabilne<br />

funkcije. Vendar pa so za nas zelo <strong>po</strong>membne (lokalno) Lipschitzeve funkcije, ki niso<br />

nujno <strong>po</strong>vsod diferenciabilne v klasičnem smislu, zato pa imajo definiran šibki odvod.<br />

Čeravno morda v formulaciji glavnih rezultatov <strong>po</strong>jem šibkega odvoda ne nastopa, pa<br />

so dokazi z u<strong>po</strong>rabo le-tega dosti elegantnejši (ni <strong>po</strong>trebno limitiranje).<br />

DOKAZTRDITVE 2.4.4. Brez škode za splošnost lahko privzamemo, da je k=1. Naj<br />

bo U slučajni vektor, enakomerno <strong>po</strong>razdeljen <strong>po</strong> enotski krogli vR d in neodvisen od<br />

Z. Ker je f lokalno integrabilna, jeE| f (U)|


38 2.4 ORNSTEIN–UHLENBECKOV PROCES<br />

Naj bo I d = ∫ 1<br />

1/2 t−d dt. Tedaj velja:<br />

J 1 (x)≤ I d(1+E|Z|)<br />

v d<br />

≤ e2 I d (1+E|Z|)<br />

v d<br />

e − 1 2 |x|2 = (2π)d/2 e 2 I d (1+E|Z|)<br />

v d<br />

φ d (x) (2.4.33)<br />

Pri integralu J 2 (x) pa u<strong>po</strong>števamo, da je M := sup s≥0<br />

(1+s)e − 1 2 s2


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 39<br />

S substitucijo s=(1+(|x|−1)/t) 2 /2 dobimo:<br />

J 2 (x)≤<br />

=<br />

∫<br />

2 d 1<br />

(2π) d/2<br />

0<br />

∫<br />

2 d ∞<br />

(2π) d/2<br />

= 2 d φ d (x)<br />

|x| 2 /2<br />

exp<br />

{<br />

− 1 2<br />

e −s ds=<br />

(<br />

1+ |x|−1<br />

t<br />

) 2<br />

} (<br />

1+ |x|−1 ) |x|−1<br />

dt=<br />

t t 2<br />

(2.4.41)<br />

Če <strong>po</strong>vzamemo, torej obstaja taka univerzalna konstanta C, da je J(x)≤Cφ d (x). S tem<br />

je trditev dokazana.<br />

Lema 2.4.5. Naj bo r, s∈N 0 , f∈W s,1<br />

loc (Rd ), k>0 inE ∣ ∣ ∣ f (s) (kZ) ∣ ∣ ∣∨


40 2.4 ORNSTEIN–UHLENBECKOV PROCES<br />

Naredimo sedaj indukcijski korak z s na s+1. Iz trditve E.6.3 in ocene (2.4.43) sledi:<br />

∂F<br />

∂λ (y,λ)=− d ∫ ( x− y<br />

)<br />

f (x)φ (r) dx−<br />

λ d+1 d<br />

R λ<br />

d<br />

− 1 ∫ ( x− y<br />

)<br />

f (x)φ (r+1) dx (2.4.47)<br />

λ d+2 d<br />

R λ<br />

d<br />

∂F<br />

∂y (y,λ)=− 1 ∫ ( x− y<br />

)<br />

f (x)φ (r+1) dx (2.4.48)<br />

λ d+1 d<br />

λ<br />

R d<br />

in <strong>po</strong> indukcijski pred<strong>po</strong>stavki ti dve funkciji pripadataC (s)( (0, k)×R d) . Od tod pa že<br />

sledi, da je F∈C (s+1)( (0, k)×R d) .<br />

Trditev 2.4.7. Naj bo 0


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 41<br />

Lema 2.4.8. Za vsak r∈N 0 obstaja taka konstanta C r ≥ 0, da za <strong>po</strong>ljubna x, w∈R d in<br />

<strong>po</strong>ljuben 0


42 2.4 ORNSTEIN–UHLENBECKOV PROCES<br />

DOKAZ. Naredimo substitucijo t=− ln cosα in u<strong>po</strong>števamo, da je:<br />

− ln cosα<br />

lim<br />

α→0 sin 2 α = 1 2<br />

(2.4.61)<br />

DOKAZTRDITVE 2.4.1.<br />

(1): U<strong>po</strong>rabimo zapis (2.4.18). Preprost račun <strong>po</strong>kaže:<br />

( ) (<br />

x−cosαw<br />

φ d = exp − 1 ∣ w−cosαx<br />

2 ∣<br />

1<br />

)<br />

+ sinα<br />

2 sinα 2 |w|2 φ d (x) (2.4.62)<br />

Tako lahko ocenimo: ( )<br />

x−cosαw<br />

φ d ≤ e 2 1|w|2 φ d (x) (2.4.63)<br />

sinα<br />

(<strong>po</strong>dobno oceno lahko dobimo tudi iz (2.4.20)). Sledi:<br />

∣<br />

∣U α f (w) ∣ ∣ ∣≤<br />

e 1 2 |w|2<br />

sin d α<br />

E| f (Z)| (2.4.64)<br />

(2): Naj bosta Z in Z ′ neodvisna slučajna vektorja, <strong>po</strong>razdeljena normalno N(0, I d ).<br />

Tedaj velja:<br />

E|P t f (Z)|=E∣<br />

∣E [ f (cosαZ+sinαZ ′ ) ∣ ]∣ ∣∣∣ ∣ Z ≤E| f (cosαZ+sinαZ ′ )|=E| f (Z)|


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 43<br />

(6): Naj bo w∈R d . Obstaja dvakrat zvezno odvedljiva funkcija h: R d → [0, 1] s<br />

kompaktnim nosilcem, za katero je h(x)=1, brž ko je|x−w|≤1. Definirajmo g 1 := gh in<br />

g 2 := g(1−h). Tedaj je g 1 dvakrat zvezno odvedljiva in g 1 , g ′ in g′′<br />

1 2<br />

so omejene funkcije.<br />

Za funkcijo g 2 velja g 2 (x)=0, brž ko je|x−w|≤1, velja pa še g= g 1 + g 2 . Zaradi<br />

linearnosti je dovolj <strong>po</strong>kazati:<br />

Ag 1 (w)=∆g 1 (w)− g ′ 1 (w)w=∆g(w)− g′ (w)w (2.4.68)<br />

Ag 2 (w)=0 (2.4.69)<br />

Enakost (2.4.69) sledi iz leme 2.4.10. Za izpeljavo enakosti (2.4.68) pa generator (2.4.13)<br />

najprej zapišimo z reparametrizirano <strong>po</strong>lgru<strong>po</strong>, pri čemer u<strong>po</strong>števamo (2.4.61):<br />

U α g(w)− g(w)<br />

Ag(w)=2 lim<br />

α↓0 sin 2 α<br />

Taylorjeva formula z ostankom v integralski obliki nam da:<br />

U α g 1 (w)=E g 1 (cosαw+sinαZ)=<br />

(2.4.70)<br />

= g 1 (cosαw)+sinαE g ′ 1 (cosαw)Z+sin2 αE(1−θ)g ′′<br />

1<br />

(cosαw+θ sinαZ)Z2<br />

(2.4.71)<br />

kjer jeθ<strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega. Ker je<br />

E Z=0, od tod sledi:<br />

U α g 1 (w)− g 1 (cosαw)<br />

=E(1−θ)g ′′<br />

1 (cosαw+θ sinαZ)Z2 (2.4.72)<br />

sin 2 α<br />

Za <strong>po</strong>ljubna t in z velja lim α↓0 (1−t)g ′′ (cosαw+t sinαz)=(1−t)g′′<br />

1 1<br />

funkcija, <strong>po</strong> izreku o dominirani konvergenci velja:<br />

lim<br />

α↓0<br />

U α g 1 (w)− g 1 (cosαw)<br />

sin 2 α<br />

(w). Ker je g′′<br />

1 omejena<br />

=E(1−θ)g ′′<br />

1 (w)Z2 = 1 2 g′′ 1 (w)EZ2 (2.4.73)<br />

Ker lahko <strong>po</strong> (D.4.6) tenzor Z 2 oz. Z⊗Z identificiramo z ZZ T in jeE ZZ T = I, je tudi<br />

E Z 2 =I, kjer jeIfundamentalni kovariantni tenzor (ali še drugače, <strong>po</strong> (D.7.17) in<br />

(D.5.19) veljaE Z 2 =E ZZ T I=II=I). Zato <strong>po</strong> (E.1.9) končno velja:<br />

Nadalje velja:<br />

lim<br />

α↓0<br />

U α g 1 (w)− g 1 (cosαw)<br />

sin 2 α<br />

g 1 (cosαw)= g 1 (w 0 )−(1−cosα)E g ′ 1<br />

= 1 2 g′′ 1 (w)I= 1 2 ∆g′′ 1<br />

(<br />

(1−θ(1−cosα))w<br />

)<br />

(w) (2.4.74)<br />

(2.4.75)<br />

Ker je g ′ 1 zvezna, za vsak t velja lim α↓0 g ′ 1(<br />

(1−t(1−cosα))w<br />

)<br />

= g<br />

′<br />

1 (w). Ker je g′ 1 omejena,<br />

spet <strong>po</strong> izreku o dominirani konvergenci velja:<br />

g 1 (cosαw)− g 1 (w) 1−cosα<br />

lim =− lim<br />

α↓0 sin 2 α α↓0 sin 2 α limE<br />

( )<br />

α↓0 g′ 1 (1−θ(1−cosα))w =−<br />

1<br />

2 g′ 1 (w)w<br />

(2.4.76)<br />

Če zdaj seštejemo (2.4.74) in (2.4.75) ter vstavimo v (2.4.70), dobimo (2.4.68).<br />

(7): Sledi iz točk (3), (5) in (6).


44 2.5 APROKSIMACIJA S POMOČJO STEINOVEGA OPERATORJA<br />

2.5 Aproksimacija s <strong>po</strong>močjo Steinovega operatorja<br />

Spet naj bo W=X 1 +···+X n vsota neodvisnih slučajnih vektorjev zE X i = 0 in<br />

Var(W)=I. V prejšnjem razdelku smo dognali, da lahko razlikoE f (W)−E f (Z), kjer<br />

je Z∼N(0, I), ocenimo s <strong>po</strong>močjo Steinovega matematičnega upanja:<br />

E [ ∆g(W)− g ′ (W)W ] (2.5.1)<br />

Preden gremo ocenit Steinovo matematično upanje, uvedimo še nekaj oznak. Najprej<br />

tako kot v (E.5.3)–(E.5.5) z♭ (0) (R d ) označimo prostor vseh omejenih funkcij, z♭ (r) (R d ) pa<br />

prostor vseh funkcij izC (r−1) (R d ), katerih odvod reda r−1 je Lipschitzev. Nadalje tako<br />

kot v (E.5.7) in (E.5.9) označimo:<br />

M 0 ( f ) := sup| f (w)| (2.5.2)<br />

w∈R d ∣ f (r−1) (w)− f (r−1) (z) ∣ ∣∨<br />

M r ( f ) := sup<br />

(2.5.3)<br />

|w−z|<br />

w,z∈R d<br />

wz<br />

kjer je|·| ∨ injektivna tenzorska norma, definirana tako kot v (D.8.4).<br />

Naj bo g∈♭ (3) (R d ). Podobno kot v razdelku 2.1 tudi tukaj z identifikacijo tenzorjev<br />

W 2 in WW T dobimo, da je:<br />

Taylorjev razvoj okoli W i := W− X i nam da:<br />

E [ ∆g(W)− g ′ (W)W ] =<br />

∆g(w)= g ′′ (w)I= g ′′ (w)EW 2 (2.5.4)<br />

=<br />

n∑<br />

E [ ]<br />

g ′′ (W)EXi− 2 g ′ (W)X i =<br />

i=1<br />

n∑<br />

E g ′′ (W i )EXi+ 2 R 1 −<br />

(2.5.5)<br />

i=1<br />

n∑<br />

− E [ ]<br />

g ′ (W i )X i + g ′′ (W i )X 2 i − R2<br />

i=1<br />

kjer sta R 1 in R 2 ostanka. Preden ju ocenimo, opazimo še, da zaradi neodvisnosti velja<br />

E g ′ (W i )X i = 0 inE g ′′ (W i )Xi=E 2 g ′′ (W i )EX 2 . Torej velja kar:<br />

i<br />

Ocenimo zdaj zgornji izraz! Iz trditve E.5.11 sledi:<br />

E [ ∆g(W)− g ′ (W)W ] = R 1 − R 2 (2.5.6)<br />

|R 1 |≤M 3 (g)<br />

n∑<br />

∣<br />

∣E X 2 ∣<br />

i ∧<br />

E|X i | (2.5.7)<br />

i=1<br />

|R 2 |≤ 1 2 M 3(g)<br />

n∑<br />

E|X i | 3 (2.5.8)<br />

i=1


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 45<br />

in kjer je|·| ∧ projektivna norma (glej razdelek D.8). Ker je projektivna norma križna,<br />

velja:<br />

∣<br />

∣E X 2 ∣<br />

i ∧<br />

≤E ∣ ∣X<br />

2<br />

∣ ∧<br />

=E|X i | 2 (2.5.9)<br />

Nadalje <strong>po</strong> Jensenovi neenakosti velja:<br />

i<br />

E|X i |E|X i | 2 ≤ ( E|X i | 3) 1/3(<br />

E|Xi | 3) 2/3<br />

=E|Xi | 3 (2.5.10)<br />

torej velja:<br />

Tako dobimo:<br />

n∑<br />

|R 1 |≤M 3 (g) E|X i | 3 (2.5.11)<br />

i=1<br />

∣<br />

∣E [ ∆g(W)− g ′ (W)W ] ∣ ∣∣∣<br />

≤|R 1 |+|R 2 |≤ 3 n∑<br />

2 M 3(g) E|X i | 3 (2.5.12)<br />

i=1<br />

kar je analogno oceni (1.4.12).<br />

V skladu s Steinovo metodo bi morali zdaj za g vzeti rešitev Steinove enačbe:<br />

∆g(w)− g ′ (w)w= f (w)−E f (Z) (2.5.13)<br />

Po (2.3.7) je plavzibilno, da se rešitev Steinove enačbe izraža s formulo:<br />

g(w)=−<br />

∫ ∞<br />

0<br />

(<br />

Pt f (w)−E f (Z) ) dt (2.5.14)<br />

kjer soP t kot v (2.4.7). Vendar pa se pri eksaktnem dokazovanju le-tega <strong>po</strong>javi kar nekaj<br />

tehničnih težav. Zato bomo formulo (2.5.14) zares izpeljali šele v naslednjem razdelku,<br />

tu pa bomo ubrali nekoliko drugačno <strong>po</strong>t, pri kateri se bomo reševanju Steinove enačbe<br />

izognili. Namesto tega se bomo oprli kar na <strong>po</strong>sledico 2.4.2. Natančneje, <strong>po</strong>trebovali<br />

bomo naslednji rezultat, ki sledi iz <strong>po</strong>sledice 2.4.2 in Fubinijevega izreka.<br />

Trditev 2.5.1. Naj bo f : R d →R zvezna funkcija, za katero veljaE| f (Z)|


46 2.5 APROKSIMACIJA S POMOČJO STEINOVEGA OPERATORJA<br />

Torej bomo v oceno (2.5.12) namesto funkcije g iz (2.5.14) raje vstavljali funkcije<br />

g=U α f . Privzemimo, da je iz<strong>po</strong>lnjen <strong>po</strong>goj (2.5.15). Tedaj iz (2.5.12) in trditve 2.5.1<br />

dobimo:<br />

∣<br />

∣E f (W)−E f (Z) ∣ ∫ π/2<br />

∣≤<br />

∣<br />

∣EAU α f (W) ∣ ∣ tgαdα≤<br />

≤ 3 2<br />

0<br />

n∑ ∫ π/2 (<br />

E|X i | 3 M 3 Uα f ) tgαdα<br />

i=1<br />

0<br />

(2.5.17)<br />

kjer soU α kot v (2.4.17). Na tem mestu bomo <strong>po</strong>trebovali lemo, ki bo prišla prav tudi<br />

še kasneje, zato jo bomo zastavili precej splošno. Preden jo formuliramo, označimo še:<br />

M ∗ 0 ( f ) := 1 2<br />

[<br />

sup<br />

w∈R d f (w)− inf<br />

w∈R d f (w)<br />

in opazimo še, da velja M ∗ 0 ( f )≤M 0( f ). Nadalje označimo še:<br />

c r :=<br />

∫ ∞<br />

∣<br />

∣φ (r)<br />

−∞<br />

]<br />

(2.5.18)<br />

1 (z)∣ ∣ ∣ dz (2.5.19)<br />

kjer jeφ d tako kot v (2.4.19) gostota standardizirane normalne <strong>po</strong>razdelitve; <strong>po</strong>sebej<br />

velja:<br />

φ 1 (z)= 1 √<br />

2π<br />

e − 1 2 |z|2 (2.5.20)<br />

Za r≥1 je c r totalna variacija funkcijeφ (r−1)<br />

1<br />

. Tako za prvih nekaj vrednosti dobimo:<br />

c 0 = 1, c 1 = 2 √<br />

2π<br />

, c 2 = 4 √<br />

2πe<br />

, c 3 =<br />

2+8 e−3/2<br />

√<br />

2π<br />

(2.5.21)<br />

Lema 2.5.2. Naj bo f : R n →Rmerljiva funkcija in naj bo 0


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 47<br />

O<strong>po</strong>mba. Za vsako funkcijo f , ki iz<strong>po</strong>lnjuje katerega koli izmed <strong>po</strong>gojev leme, velja<br />

E| f (Z)|


48 2.5 APROKSIMACIJA S POMOČJO STEINOVEGA OPERATORJA<br />

moremo izpeljati, ker nam lema 2.5.2 da oceno M 3<br />

(<br />

Uα f ) ≤ c 2 M 1 ( f ) cos 3 α/ sin 2 α. Po<br />

(2.5.17) bi se <strong>po</strong>tem napaka izražala z ∫ π/2<br />

cos 2 α/ sinαdα, ki pa divergira.<br />

0<br />

V naslednjem razdelku bomo <strong>po</strong>kazali, da se da zgornji <strong>po</strong>stopek zapisati tudi tako,<br />

da se napaka pri normalni aproksimaciji oceni z M 3 (g), kjer je g rešitev Steinove enačbe<br />

(2.5.13). V enorazsežnem primeru <strong>po</strong> lemi 1.4.1 velja M 3 (g)≤2M 1 ( f ). V večrazsežnem<br />

primeru ne velja nič <strong>po</strong>dobnega: konstruirali bomo primer, ko bo f Lipschitzeva, g ′′<br />

pa ne bo Lipschitzeva za nobeno rešitev g Steinove enačbe 2.5.13 (glej trditev 2.8.3).<br />

Dokazati je treba še lemo 2.5.2. Potrebovali bomo naslednji <strong>po</strong>možni rezultat.<br />

Lema 2.5.4. Za <strong>po</strong>ljubno merljivo omejeno funkcijo f in vsak r∈N velja ocena:<br />

∫ ∣ ∣∣∣∣∨ ∣ f (z)φ (r) (z) dz ≤ c<br />

d r M ∗ 0 ( f ) (2.5.34)<br />

R d<br />

DOKAZ. Naj bo u <strong>po</strong>ljuben enotski vektor. Obstaja transformacija T, kiR d−1 izometrično<br />

preslika na ortogonalni komplement vektorja u. Tedaj velja:<br />

∫ ∫ ∞<br />

f (z)φ (r)<br />

d (z)ur dz= f (tu+Ty)φ<br />

R<br />

∫R (r)<br />

d (tu+Ty)ur dt dy (2.5.35)<br />

d<br />

d−1 −∞<br />

Veljaφ d (tu+Ty)=φ 1 (t)φ d−1 (y). Iz trditve E.2.2 sledi, da <strong>po</strong>tem veljaφ (r) (tu+Ty)=<br />

d<br />

φ (r) (t)φ 1 d−1(y). Sledi:<br />

∫<br />

∫<br />

∣ f (z)φ (r)<br />

d (z)ur dz<br />

∣ ≤ c r ess sup| f (tu+Ty)|φ d−1 (y) dy≤<br />

R d R d−1 t<br />

≤ c r ess sup<br />

y<br />

= c r M 0 ( f )<br />

ess sup<br />

t<br />

Toda ker velja:<br />

∫ ∫ ∞ ∫<br />

φ (r)<br />

d (z)ur dz= φ<br />

R<br />

∫R (r) (tu+Ty) dt dy= d d d−1 −∞<br />

| f (tu+Ty)|=<br />

R d−1 ∫ ∞<br />

−∞<br />

(2.5.36)<br />

φ (r)<br />

1 (t) dtφ d−1(y) dy=0<br />

(2.5.37)<br />

lahko za vsak a∈R d ocenimo tudi:<br />

∫<br />

∣ ∣ f (z)φ (r)<br />

∣∣∣∣<br />

∫<br />

d (z)ur dz<br />

∣ = ( ) f (z)−a φ<br />

(r)<br />

d (z)ur dz<br />

∣ ≤ c r M 0 ( f− a) (2.5.38)<br />

R d R d<br />

Če zdaj vstavimo a := 1 (ess inf f+ ess sup f ), dobimo:<br />

2 ∫<br />

∣ f (z)φ (r)<br />

d (z)ur dz<br />

∣ ≤ c rM ∗ 0 ( f ) (2.5.39)<br />

Naš rezultat zdaj sledi iz <strong>po</strong>sledice D.10.4.<br />

R d<br />

DOKAZLEME 2.5.2. Rezultat sledi iz trditev 2.4.7 in E.5.4 ter leme 2.5.4.


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 49<br />

2.6 Rešitev Steinove enačbe<br />

V prejšnjem razdelku smo že ocenili napako pri večrazsežni normalni aproksimaciji<br />

vsote neodvisnih slučajnih vektorjev, a smo se pri tem od Steinove metode nekoliko<br />

oddaljili, saj nismo zares rešili Steinove enačbe:<br />

∆g(w)− g ′ (w)w= f (w)−E f (Z) (2.6.1)<br />

Čeprav se torej da shajati tudi brez rešitve Steinove enačbe, pa je dostikrat ugodneje, če<br />

jo imamo. Enačba (2.6.1) sodi med eliptične parcialne diferencialne enačbe, natančneje<br />

med Poissonove enačbe, t. j. enačbe tipa:<br />

Lg= f (2.6.2)<br />

kjer jeLeliptični diferencialni operator drugega reda. Take enačbe so tesno <strong>po</strong>vezane s<br />

<strong>po</strong>sebno vrsto markovskih procesov, ki jim rečemo difuzije. Natančneje,Lje generator<br />

operatorske <strong>po</strong>lgrupeP t , ki pripada difuziji (X t ) t≥0 , se praviP t f (x)=E x f (X t ), kjer jeE x<br />

matematično upanje glede na verjetnostno mero, glede na katero je X t ustrezna difuzija<br />

z X 0 = x (za <strong>po</strong>drobnosti glej npr. Rogers in Williams [109]).<br />

Pod določenimi <strong>po</strong>goji ima difuzija, ki jo generiraL, invariantno <strong>po</strong>razdelitev, se<br />

pravi, da obstaja verjetnostna meraν, za katero veljaP f := lim t→∞ P t f = ∫ f dν. Če<br />

privzamemo, da jeP f = 0, ima še <strong>po</strong>d določenimi dodatnimi <strong>po</strong>goji enačba (2.6.2)<br />

rešitev v obliki (2.3.7). Pardoux in Veretennikov v člankih [88]–[90] razdelata splošno<br />

teorijo z najnovejšimi rezultati, ki <strong>po</strong>ve, da je v primeru, ko je f dovolj “lepa”, tudi<br />

rešitev g iz (2.3.7) dovolj “lepa” in da je to do konstante natančno edina “lepa” rešitev.<br />

Teorija, ki jo razdelata Pardoux in Veretennikov [88]–[90], obravnava funkcije f , ki<br />

so <strong>po</strong>linomske rasti. Mi bomo šli še dlje in dokazali obstoj klasičnih rešitev Steinove<br />

enačbe (2.6.1) za praktično vse funkcije f : R d →R, za katere je to sploh smiselno, v<br />

dokajšnji splošnosti pa bomo dokazali tudi enoličnost. Naj bo Z∼N(0, I).<br />

Izrek 2.6.1. Naj bo f : R d →Rmerljiva funkcija, za katero veljaE| f (Z)|


50 2.6 REŠITEV STEINOVE ENAČBE<br />

(4) Če je f zvezna in f∈W 1,p<br />

loc (Rd ), kjer je spet d


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 51<br />

Lotimo se sedaj dokazovanja izreka 2.6.1. Potrebovali bomo še naslednja dva tehnična<br />

rezultata, ki ju bomo dokazali na koncu razdelka.<br />

Lema 2.6.3. Naj bo p≥1in p>d/2 ter f∈ L p loc (Rd ) inE| f (Z)|


52 2.6 REŠITEV STEINOVE ENAČBE<br />

Lema 2.6.5. Naj bo r, s∈N 0 , 1≤p


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 53<br />

Z u<strong>po</strong>rabo Jensenove neenakosti dobimo:<br />

( x−cosαw<br />

∣ φ(r) d<br />

sinα<br />

)∣ ∣∣∣∣∨<br />

≤ D r<br />

(1+2 r−1 |x| r<br />

sin r α + 2r−1 ctg r α|w| r )<br />

( )<br />

x−cosαw<br />

φ d<br />

sinα<br />

(2.6.21)<br />

Pišimo:<br />

( )<br />

x−cosαw<br />

φ d = exp<br />

(− ctg2 α|w| 2<br />

sinα<br />

2<br />

+ cosα<br />

)<br />

sin 2 α 〈x, w〉− ctg2 α|x| 2<br />

φ d (x) (2.6.22)<br />

2<br />

Ker je funkcija t↦→ (1+t r ) e −t2 /2 omejena, lahko ocenimo:<br />

( )∣ x−cosαw∣∣∣∣∨<br />

) ( )<br />

∣ φ(r) ≤ C<br />

d<br />

r<br />

(1+ |x|r cosα<br />

sinα<br />

sin r exp<br />

α sin 2 α 〈x, w〉− ctg2 α|x| 2<br />

φ d (x) (2.6.23)<br />

2<br />

Prvi člen v eks<strong>po</strong>nentni funkciji ocenimo s <strong>po</strong>močjo Cauchy–Schwarzeve neenačbe ter<br />

neenakosti med aritmetično in geometrično sredino:<br />

Torej velja:<br />

∣<br />

∣ φ(r) d<br />

( )(<br />

cosα<br />

√ )<br />

1<br />

sin 2 α 〈x, w〉≤ 2 √2 ctgα|x|<br />

sinα |w| ≤ ctg2 α|x| 2<br />

+ |w|2<br />

4 sin 2 α<br />

( x−cosαw<br />

sinα<br />

Od tod pa že sledi ocena (2.6.19).<br />

DOKAZLEME 2.6.4.<br />

(2.6.24)<br />

)∣ ∣∣∣∣∨ ) )<br />

≤ C r<br />

(1+ |x|r<br />

sin r exp<br />

(− ctg2 α|x| 2<br />

+ |w|2 φ<br />

α<br />

4 sin 2 d (x) (2.6.25)<br />

α<br />

(1): Ekvivalentno je dokazati, da za vsak 0


54 2.6 REŠITEV STEINOVE ENAČBE<br />

in:<br />

)<br />

T 2 (α) := cosr α<br />

sin 2r+d α C rE|Z| r exp<br />

(− ctg2 α|Z| 2<br />

+ ρ2<br />

| f (Z)|≤<br />

4 sin 2 α<br />

( )<br />

C r<br />

≤<br />

sin r+d−2 β exp ρ 2<br />

E ctg r α|Z| r e − 1<br />

sin 2 4 ctg2 α|Z| 1<br />

2<br />

| f (Z)|<br />

β<br />

sin 2 α<br />

(2.6.30)<br />

Očitno je:<br />

∫ π/2<br />

β<br />

T 1 (α) tgαdα


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 55<br />

To pa sledi iz leme 2.6.5.<br />

(2): Iz prejšnje točke sledi, da je dovolj <strong>po</strong>kazati, da za vsak s>0 velja:<br />

Ocenimo:<br />

∫ ∞<br />

s<br />

∣<br />

sup∣P t f (w)−P t f (z) ∣ ∣ dt


56 2.7 ENOLIČNOST REŠITVE<br />

(2) Če je f tako kot v prejšnji točki, velja:<br />

E|g(Z)|


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 57<br />

Da dokažemo, da jeE|g(Z)|=∞, bo dovolj <strong>po</strong>kazati že, da velja ∫ ∞<br />

|g(z)| e − 1 2 z2 dz=∞,<br />

2<br />

zaradi (2.7.9) pa že, da divergira integral:<br />

∫ ∞ ∫ z<br />

2<br />

2<br />

e 1 2 w2<br />

ln w dw e− 1 2 z2 dz=<br />

=<br />

∫ ∞ ∫<br />

e 2 1 w2 ∞<br />

2<br />

∫ ∞<br />

2<br />

e − 1 2 z2 dz dw=<br />

ln w w<br />

(2.7.11)<br />

ψ(−w)<br />

ln w dw<br />

kjer jeψMillsovo razmerje, definirano tako kot v (C.1.3). Iz ocene (C.2.5) sledi, da je<br />

konvergenca integrala (2.7.11) ekvivalentna konvergenci integrala:<br />

∫ ∞<br />

2<br />

dw<br />

w ln w<br />

(2.7.12)<br />

ki divergira.<br />

Tako <strong>po</strong>goj (2.7.2) <strong>po</strong>stane intuitivno jasnejši, saj smo pri prehodu z f na g “pridelali”<br />

natančno faktor ln w.<br />

□<br />

Lotimo se sedaj dokazovanja trditve 2.7.1.<br />

rezultatov.<br />

Potrebovali bomo še nekaj tehničnih<br />

Lema 2.7.4. Naj bosta Z in Z ′ neodvisna slučajna vektorja z vrednostmi vR d , <strong>po</strong>razdeljena<br />

standardizirano normalno N(0, I). Nadalje naj bosta k in l realni števili, ki nista hkrati enaki 0.<br />

Tedaj za <strong>po</strong>ljubno merljivo funkcijo f : R 3d →R, za katero jeE| f (kZ+lZ ′ , Z, Z ′ )|


58 2.7 ENOLIČNOST REŠITVE<br />

DOKAZ. Najprej za vsak 0


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 59<br />

Po eni strani velja:<br />

<strong>po</strong> drugi strani pa velja tudi:<br />

∫ 1<br />

0<br />

s|Z| 2 e − 1 2 (1−k)s2 |Z| 2 ds≤ |Z|2<br />

2<br />

(2.7.24)<br />

∫ 1<br />

0<br />

s|Z| 2 e − 1 2 (1−k)s2 |Z| 2 ds≤<br />

∫ ∞<br />

0<br />

s|Z| 2 e − 1 2 (1−k)s2 |Z| 2 ds= 1<br />

1−k<br />

(2.7.25)<br />

od koder sledi tudi ocena (2.7.18).<br />

DOKAZTRDITVE 2.7.1.<br />

(1): Iz (2.6.3) sledi, da je (2.7.3) dovolj dokazati za w=0. Nadalje iz ocene (2.6.7)<br />

sledi, da je dovolj dokazati, da za vsak 0


60 2.7 ENOLIČNOST REŠITVE<br />

kjer je:<br />

J 1 :=<br />

J 2 :=<br />

J 3 :=<br />

∫ π/2<br />

β<br />

∫ π/2<br />

β<br />

∫ π/2<br />

β<br />

E<br />

∣ f ( √θ 2 cos 2 α+sin 2 α Z ) ∣ ∣∣∣<br />

sinαcosα|Z| 2 dα (2.7.30)<br />

E<br />

∣ f ( √θ 2 cos 2 α+sin 2 α Z ) ∣ ∣∣∣<br />

|Z| dαE|Z ′ | (2.7.31)<br />

E<br />

∣ f ( √θ 2 cos 2 α+sin 2 α Z ) ∣ ∣∣∣<br />

sinαcosαdαE|Z ′ | 2 (2.7.32)<br />

Da je J 3


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 61<br />

Zgoraj smo s črkoIoznačili fundamentalni kovariantni tenzor ter u<strong>po</strong>rabili zveze<br />

(D.7.13), (D.7.17), (E.1.9) in (E.8.4) (lahko pa preverimo tudi <strong>po</strong> kom<strong>po</strong>nentah). Dobimo:<br />

E [ ∆ f (Z)− f ′ (Z)Z ] =−E 〈 f ′ (Z), g ′ (Z) 〉 (2.7.37)<br />

kar je simetrično v f in g. Dokaz je s tem zaključen.<br />

Lema 2.7.7. Za vsak x≥0velja ocena:<br />

− ln cos arctg x≤ 1 2 ln 2+(ln x) + (2.7.38)<br />

DOKAZ. Za x≤1preprosto ocenimo:<br />

− ln cos arctg x≤− ln cos arctg 1= 1 ln 2 (2.7.39)<br />

2<br />

Za x≥1 pa pišemo:<br />

( ) π<br />

− ln cos arctg x=− ln sin<br />

2 − arctg x =− ln sin arctg 1 x<br />

(2.7.40)<br />

Ker je t↦→ sin arctg t konkavna funkcija, lahko za vsak 0≤t≤1 ocenimo:<br />

sin arctg t≥t sin arctg 1= t√ 2<br />

2<br />

(2.7.41)<br />

Sledi:<br />

Ocena (2.7.38) je s tem dokazana.<br />

− ln sin arctg 1 √<br />

2<br />

x ≤− ln 2x = 1 ln 2+ln x (2.7.42)<br />

2<br />

Lema 2.7.8. Za vsako funkcijo h∈C (2)<br />

c (R d ) obstaja rešitev g Steinove enačbe:<br />

z naslednjimi lastnostmi:<br />

∆g(z)− g ′ (z)z=h(z)−E h(Z) (2.7.43)<br />

(1) Obstaja taka konstanta C h,0 , da velja:<br />

|g(z)|≤C h,0<br />

(<br />

1+(ln|z|)+<br />

)<br />

(2.7.44)<br />

(2) Za vsak r∈N obstaja taka konstanta C h,r , da velja:<br />

∣<br />

∣g (r) (z) ∣ ∣ ∣∨ ≤ C h,r<br />

1+|z| r (2.7.45)


62 2.7 ENOLIČNOST REŠITVE<br />

DOKAZ. Po izreku 2.6.1 funkcija:<br />

g(w) :=<br />

∫ π/2<br />

0<br />

[<br />

Uα h(0)−U α h(w) ] tgαdα (2.7.46)<br />

reši Steinovo enačbo (2.7.43). Pokazali bomo, da ta rešitev zadošča (2.7.44) in (2.7.45).<br />

(1): Po (2.5.22) in (2.5.23) lahko ocenimo:<br />

∣<br />

∣U α h(0)−U α h(w) ∣ { ( ) ( ) }<br />

∣≤min 2M0 Uα , M1 Uα |w| ≤ M0 ( f ) min { 2, c 1 |w| ctgα } (2.7.47)<br />

Sledi:<br />

∫ π/2<br />

|g(w)|≤M 0 ( f ) min { 2 tgα, c 1 |w| } dα=<br />

0<br />

[<br />

= M 0 ( f ) −2 ln cos arctg c (<br />

1|w| π<br />

+ c 1 |w|<br />

2 2 − arctg c )]<br />

1|w|<br />

=<br />

2<br />

(<br />

= M 0 ( f ) −2 ln cos arctg c 1|w|<br />

+ c 1 |w| arctg 2 )<br />

2<br />

c 1 |w|<br />

(2.7.48)<br />

Prvi člen lahko ocenimo <strong>po</strong> lemi 2.7.7, za oceno drugega člena pa u<strong>po</strong>rabimo enakost<br />

arctg x≤x. Od tod že sledi (2.7.44).<br />

(2): S<strong>po</strong>mnimo se, da <strong>po</strong> (2.4.49) velja:<br />

∫<br />

(U α h) (r) (w)=cos r α f (r) (cosαw+sinαz)φ d (z) dz (2.7.49)<br />

R d<br />

Ker ima funkcija h kompakten nosilec, obstaja takρ≥0, da je h(x)=0, brž ko je|x|≥ρ.<br />

Sledi:<br />

∣<br />

∣(U α h) (r) (w) ∣ ∫<br />

∣∨ ≤ M r ( f ) cos r α φ d (z) dz (2.7.50)<br />

| cosαw+sinαz|≤ρ<br />

Na območju, <strong>po</strong> katerem integriramo, velja:<br />

Sledi:<br />

〈z, w〉≥〈ctgαw, w〉−〈z+ctgαw, w〉<br />

≥ ctgα|w| 2 −|z+ctgαw||w|<br />

≥ ctgα|w| 2 − ρ|w|<br />

sinα<br />

∣<br />

∣(U α h) (r) (w) ∣ ∫<br />

∣∨ ≤ M r ( f ) cos r α φ d (z) dz=<br />

〈z,w〉≥ctgα|w| 2 −ρ|w|/ sinα<br />

= 1 √<br />

2π<br />

M r ( f ) cos r α<br />

∫ ∞<br />

e − 2 1 t2 dt<br />

(cosα|w|−ρ)/ sinα<br />

(2.7.51)<br />

(2.7.52)<br />

Ker je− 1 2 t2 ≤−t+ 1 , je nadalje:<br />

2<br />

∣<br />

∣(U α h) (r) (w) ∣ ∣ ∣∨ ≤<br />

√ (<br />

e<br />

2π M r( f ) cos r α exp − cosα|w|−ρ )<br />

sinα<br />

(2.7.53)


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 63<br />

Naj bo najprej cosα|w|>2ρ. V tem primeru velja:<br />

∣<br />

∣(U α h) (r) (w) ∣ √ e<br />

∣∨ ≤<br />

2π M r( f ) cos r α e − ctgα|w|/2 (2.7.54)<br />

Sledi:<br />

∫<br />

0


64 2.7 ENOLIČNOST REŠITVE<br />

O<strong>po</strong>mba. Zahteva (2.7.62) je uresničljiva, ker integral ∫ ∞<br />

1/(z ln z) dz divergira.<br />

DOKAZLEME 2.7.9. Brez škode za splošnost lahko privzamemo, da je R>r. Obstaja<br />

funkcija h∈C (∞)<br />

c (R), za katero velja, da je 0≤h(t)≤1 in h(t)=1, brž ko je|t|≤1.<br />

Označimo: ⎧ √ ⎫<br />

⎪⎨ ε ε<br />

η := min⎪⎩<br />

16M 1 (h) , 4 √ M 2 (h) , 1 ⎪⎬<br />

(2.7.64)<br />

ln ln R⎪⎭<br />

in definirajmo:<br />

⎧<br />

⎪⎨ h ( η ln ln|z| ) ;|z|>e<br />

u R,ε (z) := ⎪⎩ 1 ; sicer<br />

a<br />

(2.7.65)<br />

Očitno je h∈C (∞)<br />

c (R d ), iz<strong>po</strong>lnjeni pa sta tudi zahtevi (2.7.60) in (2.7.61). Preverimo<br />

še preostali dve zahtevi! Brez škode za splošnost smemo privzeti, da je|z|>e. Po<br />

odvajanju dobimo:<br />

u ′ R,ε (z)=h′( η ln ln|z| ) η z T<br />

(2.7.66)<br />

|z| ln|z| |z|<br />

Iz ocene|z| ln|z|≥(1+|z| ln|z|)/2, ki velja, brž ko je|z|≥e, zdaj dobimo (2.7.62). Ko še<br />

enkrat odvajamo, dobimo:<br />

u ′′<br />

R,ε (z)=h′′( η ln ln|z| )( η<br />

|z| ln|z|<br />

+ h ′( η ln ln|z| ) η<br />

|z| ln|z|<br />

)<br />

z T 2<br />

− h ′( η ln ln|z| ) ( )<br />

η(1+ln|z|) z<br />

T 2<br />

+<br />

|z|<br />

(|z| ln|z|) 2 |z|<br />

⎛ ( ) 2<br />

I T z<br />

T<br />

(2.7.67)<br />

−<br />

⎜⎝ |z| |z|<br />

⎞⎟ 3 ⎠<br />

kjer ( z T) 2<br />

<strong>po</strong>meni tenzorski (skrčitveni) produkt vektorja z T samega s seboj,Ipa je<br />

fundamentalni kontravariantni tenzor (glej razdelka D.5 in D.7). Podobno kot prej, a z<br />

nekaj več računanja, dobimo še (2.7.63).<br />

DOKAZIZREKA 2.7.2. Glavna ideja dokaza je, da izpeljemo, da za vsako funkcijo<br />

(R d ) velja:<br />

E ( f (Z)−E f (Z) ) h(Z)=0 (2.7.68)<br />

h∈C (∞)<br />

c<br />

Tedaj namreč <strong>po</strong> trditvi E.3.1 res velja, da je f=E f (Z) skoraj <strong>po</strong>vsod.<br />

Iz trditve 2.7.6 dobimo, da za <strong>po</strong>ljubno funkcijo g∈W 2,∞<br />

loc (Rd ) s kompaktnim nosilcem<br />

velja:<br />

E f (Z) [ ∆g(Z)− g ′ (Z)Z ] = 0 (2.7.69)<br />

Če bi bila g rešitev Steinove enačbe∆g(w)− g ′ (w)w=h(w)−Eh(Z), bi od tod že sledilo:<br />

E f (Z) ( h(Z)−E h(Z) ) =E ( f (Z)−E f (Z) ) h(Z)=0 (2.7.70)<br />

Težava pa je v tem, da tudi če ima h kompakten nosilec, to še zdaleč ne velja nujno za<br />

funkcijo g. Vendar pa se da funkcija h−E h(Z) v primerni šibki to<strong>po</strong>logiji aproksimirati<br />

s funkcijami oblike w↦→∆g(w)− g ′ (w)w, kjer je g∈W 2,∞<br />

loc (Rd ) in ima kompakten nosilec.


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 65<br />

Naj bo torej h∈C (∞)<br />

c (R d ) in naj bo g kot v lemi 2.7.8. Izberimo <strong>po</strong>ljubenε>0.<br />

Obstaja tak R≥0, da jeE| f (Z)| 1(|Z|≥R)0, od tod sledi (2.7.70). S tem je dokaz končan.<br />

2.8 Primerjava z enorazsežnim primerom<br />

V razdelku 1.4 smo konstruirali rešitev Steinove enačbe v enorazsežnem, v razdelku<br />

2.6 pa rešitev v večrazsežnem primeru. Natančneje, za rešitev h Steinove enačbe:<br />

smo v formuli (1.4.25) dobili:<br />

h ′ (w)−h(w)w= f (w)−E f (Z) (2.8.1)<br />

h(w)= √ 1 ψ(−w)<br />

2π<br />

=<br />

∫ ∞<br />

−∞<br />

∫ w<br />

−∞<br />

f (x) H 1 (x, w) dx<br />

f (x) e − 1 2 x2 dx−√ 1 ∫ ∞<br />

ψ(w) f (x) e − 1 2 x2 dx=<br />

2π w<br />

(2.8.2)<br />

kjer je:<br />

⎧<br />

⎪⎨ φ(x)ψ(−w)<br />

H 1 (x, w)= ⎪⎩ φ(x)ψ(w)<br />

; xw<br />

(2.8.3)<br />

in:<br />

φ(x)=φ 1 (x)= 1 √<br />

2π<br />

e − 1 2 x2 (2.8.4)


66 2.8 PRIMERJAVA Z ENORAZSEŽNIM PRIMEROM<br />

Po drugi strani pa iz izreka 2.6.1 in zveze (2.4.53) dobimo naslednjo rešitev enačbe<br />

(2.8.1):<br />

kjer je:<br />

h(w)=<br />

=<br />

=<br />

∫ π/2<br />

0<br />

∫ π/2<br />

0<br />

∫ ∞<br />

−∞<br />

H 2 (x, w)=<br />

U α f (w) dα=<br />

∫<br />

1 ∞<br />

sinα −∞<br />

f (x) H 2 (x, w) dx<br />

∫ π/2<br />

0<br />

( )<br />

x−cosαw<br />

f (x)φ ′ dx dα=<br />

sinα<br />

( ) x−cosαw dα<br />

φ ′ sinα sinα<br />

(2.8.5)<br />

(2.8.6)<br />

O<strong>po</strong>mba. Pri zadnjem enačaju v (2.8.5) smo u<strong>po</strong>rabili Fubinijev izrek. Da ga<br />

res smemo u<strong>po</strong>rabiti, se vidi iz dokaza točke (2) leme 2.6.4, brž ko je f ∈ L p (R) in<br />

loc<br />

E| f (Z)|


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 67<br />

Ker pa ima <strong>po</strong> točki (1) leme 1.4.1 Steinova enačba (2.8.1) največ eno omejeno rešitev,<br />

mora biti h 1 = h 2 .<br />

Naj bo w∈R. Dokazali smo, da za <strong>po</strong>ljubno zvezno in omejeno funkcijo f : R→R<br />

velja zveza:<br />

∫ ∞<br />

−∞<br />

f (x) H 1 (x, w) dx=<br />

∫ ∞<br />

−∞<br />

f (x) H 2 (x, w) dx (2.8.10)<br />

Ker sta x↦→ H 1 (x, w) in x↦→ H 2 (x, w) lokalno integrabilni funkciji, se morata <strong>po</strong> trditvi<br />

E.3.1 ujemati skoraj <strong>po</strong>vsod. Toda funkciji H 1 (x, w) in H 2 (x, w) sta <strong>po</strong>vsod, kjer je xw,<br />

zvezni (za H 1 je to očitno, za H 2 pa to velja <strong>po</strong> trditvi 2.8.2). To pa <strong>po</strong>meni, da se H 1 (x, w)<br />

in H 2 (x, w) res ujemata za vse xw.<br />

Različnost konstrukcij je botrovala tudi različnemu ocenjevanju rešitev Steinove<br />

enačbe. Naj bo g rešitev enorazsežne:<br />

oziroma večrazsežne Steinove enačbe:<br />

g ′′ (w)− g ′ (w)w= f (w)−E f (Z) (2.8.11)<br />

∆g(w)− g ′ (w)w= f (w)−E f (Z) (2.8.12)<br />

Denimo, da je f∈♭ (r) (R d ), t. j. M r ( f )1 obstaja Lipschitzeva funkcija f : R d →R, za katero velja, da<br />

za nobeno rešitev g Steinove enačbe (2.8.12) funkcija g ′′ ni Lipschitzeva.<br />

Obstaja pa še ena možnost, da bi napako za Lipschitzeve testne funkcije morda<br />

vendarle ocenili na <strong>po</strong>doben način kot v eni dimenziji. Tam smo s substitucijo h= g ′<br />

reševanje izvirne Steinove enačbe prevedli na reševanje enačbe:<br />

h ′ (w)−h(w)w= f (w)−E f (Z) (2.8.13)<br />

in v resnici pri vsem <strong>po</strong>stopku nismo prav nič <strong>po</strong>trebovali funkcije g, temveč le h.<br />

V večrazsežnem primeru odvod ni več funkcija, temveč vektorsko <strong>po</strong>lje. Če v<br />

Steinovo enačbo (2.8.12) uvedemo h=grad g (glej razdelek E.1), dobimo:<br />

div h(w)−h T (w)w= f (w)−E f (Z) (2.8.14)<br />

Matematično upanjeE [ div h(W)−h T (W)W ] lahko ocenimo na enak način kot upanje<br />

E [ ∆g(W)− g ′ (W)W ] , enačba (2.8.14) pa nam vendarle dopušča več svobode kot enačba<br />

(2.8.12).


68 2.8 PRIMERJAVA Z ENORAZSEŽNIM PRIMEROM<br />

Odprt problem. Ali obstaja taka konstanta C, da za <strong>po</strong>ljubno Lipschitzevo funkcijo<br />

f : R d →Robstaja rešitev h enačbe (2.8.14), za katero velja:<br />

∣<br />

∣(<br />

h ′ (x)−h ′ (y) ) u∣<br />

∣≤C M 1 ( f )|u||x− y| (2.8.15)<br />

za <strong>po</strong>ljubne u, x, y∈R d ? Če je odgovor pritrdilen, kakšna je odvisnost konstante od dimenzije<br />

prostora?<br />

Svoboda, ki jo daje enačba (2.8.14), se res zdi precejšnja, a včasih tudi to ni dovolj.<br />

Predstavili bomo namreč soroden problem, ki ima negativen rezultat. Denimo, da<br />

rešujemo enačbo:<br />

div u= f (2.8.16)<br />

V enorazsežnem primeru je odgovor nedvoumen: odvodi reda r funkcije u ustrezajo<br />

odvodom reda r−1 funkcije f . V večrazsežnem primeru to ne velja: McMullen [79]<br />

dokaže naslednji rezultat.<br />

Izrek 2.8.4 (McMullen). Za vsak d>1 obstaja omejena funkcija f : R d →R, za katero<br />

velja, da nobena rešitev enačbe (2.8.16) ni Lipschitzeva.<br />

Iskanje dovolj gladkih rešitev Steinove enačbe za Lipschitzeve testne funkcije je tako<br />

precej negotovo. Vendar pa bomo v razdelku 3.11 <strong>po</strong>kazali, da se da težava obiti na<br />

malo drugačen način – tako, da drugače ocenimo Steinovo matematično upanje. Videli<br />

bomo, da je dobljena ocena napake v tipičnem primeru še vedno primerljiva s tisto, ki<br />

smo jo dobili za enorazsežni primer.<br />

Dokazati moramo še trditev 2.8.3.<br />

DOKAZTRDITVE 2.8.3. Po izreku 2.7.2, ki nam zagotavlja enoličnost “krotkih” rešitev<br />

Steinove enačbe, je dovolj konstruirati Lipschitzevo funkcijo f in rešitev g enačbe<br />

(2.8.12), ki ni Lipschitzeva in za katero veljaE|g(Z)|


2. VEČRAZSEŽNA NORMALNA APROKSIMACIJA 69<br />

Naj bo g katera od rešitev Steinove enačbe, kot jo narekuje izrek 2.6.1. Najprej <strong>po</strong> trditvi<br />

2.4.7 velja:<br />

∂ 2 ∫<br />

U α f<br />

(w)=− cos2 α ∂ f<br />

(cosαw+sinαz) ∂φ 2<br />

(z) dz (2.8.20)<br />

sinα ∂x 1 ∂z 1<br />

∂w 2 1<br />

R 2<br />

kjer jeφ 2 (x 1 , x 2 )=φ(x 1 )φ(x 2 ) standardna dvorazsežna normalna gostota. Iz (2.8.19)<br />

dobimo:<br />

∂ 2 <br />

U α f<br />

(w 1 , 0)=− cos2 α<br />

φ ′ (z 1 )φ(z 2 ) dz 1 dz 2 =<br />

sinα − sinαz 2 ≤− cosαw 1 +sinαz 1 ≤sinαz 2<br />

∂w 2 1<br />

=− cos2 α<br />

sinα<br />

=− cos2 α<br />

sinα<br />

=− cos2 α<br />

2π sinα<br />

∫ ∞ ∫ ctgαw1 +z 2<br />

S substitucijama t=z 2 ± 1 2 ctgαw 1 dobimo:<br />

∂ 2 U α f<br />

∂w 2 1<br />

Za w≥0 lahko ocenimo:<br />

∂ 2 U α f<br />

∂w 2 1<br />

φ ′ (z 1 ) dz 1 φ(z 2 ) dz 2 =<br />

0 ctgαw 1 −z<br />

∫<br />

2<br />

∞ [<br />

φ(ctgαw1 + z 2 )−φ(ctgαw 1 − z 2 ) ] (2.8.21)<br />

φ(z 2 ) dz 2 =<br />

0<br />

∫ ∞ [ (<br />

exp −z<br />

2<br />

2 − ctgαz 2 w 1 − 1 2 ctg2 α w1) 2 −<br />

0<br />

− exp ( −z 2 2 + ctgαz )]<br />

2 w 1 − 1 2 ctg2 α w 2 1 dz2<br />

(w 1 , 0)= cos2 α<br />

2π sinα e− ctg2 α w 2 1 /4 ∫ ctgαw1 /2<br />

(w 1 , 0)≥ cos2 α<br />

2π sinα e− ctg2 α w 2 1 /2 ∫ ctgαw1 /2<br />

− ctgαw 1 /2<br />

− ctgαw 1 /2<br />

e −t2 dt (2.8.22)<br />

dt= w 1 cos 3 α<br />

2π sin 2 α e− ctg2 α w 2 1 /2 (2.8.23)<br />

Naj bo zdaj 0≤w 1 ≤ 1. Ker je (∂ 2 U α f )/(∂w 2 1 )(0, 0)=0 in (∂2 U α f )/(∂w 2 1 )(w 1, 0)≥0, velja:<br />

∂ 2 ∫<br />

g<br />

(w<br />

∂w 2 1 , 0)− ∂2 g π/2<br />

∂ 2 U α f<br />

(0, 0)=<br />

(w<br />

∂w 2 1<br />

1<br />

0 ∂w 2 1 , 0) tgαdα≥<br />

1<br />

≥ w ∫ π/4<br />

1 cos 2 α<br />

2π arctg w 1<br />

sinα e− ctg2 α w 2 1 /2 dα≥<br />

≥ w 1<br />

4π √ 2e<br />

= w 1 ln w 1<br />

4π √ 2e<br />

∫ π/4<br />

arctg w 1<br />

ctgα dα<br />

cos 2 α =<br />

(2.8.24)<br />

To pa <strong>po</strong>meni, da g ′′ ni Lipschitzeva, se pravi, da je par ( f, g) res ustrezen protiprimer.


70 2.8 PRIMERJAVA Z ENORAZSEŽNIM PRIMEROM


3.<br />

Steinova metoda in odvisnost<br />

V prejšnjih dveh <strong>po</strong>glavjih smo že ocenili napako pri normalni aproksimaciji vsot<br />

neodvisnih slučajnih spremenljivk. Pri tem smo imeli morda nekoliko več dela kot pri<br />

drugih, bolj klasičnih metodah (npr. Lindeberg–Bergströmova metoda, glej razdelek<br />

2.1, ali pa metoda karakterističnih funkcij). Vendar pa se Steinova metoda odlikuje<br />

<strong>po</strong> tem, da so v nasprotju z večino drugih metod <strong>po</strong>splošitve na določene vsote odvisnih<br />

slučajnih spremenljivk razmeroma preproste in nimamo prav dosti več dela kot<br />

pri neodvisnih slučajnih spremenljivkah. Eden izmed razlogov je tudi to, da lahko v<br />

nespremenjeni obliki u<strong>po</strong>rabimo dobršen del izpeljav za neodvisne slučajne spremenljivke.<br />

To je namreč tisti del, ki zadeva obnašanje rešitev Steinove enačbe.<br />

Vse, kar moramo narediti, je oceniti Steinovo matematično upanje. Kot smo izpeljali<br />

v razdelku 1.4, je pri enorazsežni normalni aproksimaciji to izraz:<br />

E [ h ′ (W)−h(W)W ] (3.0.1)<br />

V prvih dveh <strong>po</strong>glavjih smo ta izraz ocenili s <strong>po</strong>močjo konstrukcije, prek katere smo<br />

prišli do njega (t. j. slučajnih spremenljivk W ′ , ki so bile izmenljive z W in blizu W).<br />

V nadaljevanju bomo Steinovo matematično upanje (3.0.1) ocenjevali bolj ne<strong>po</strong>sredno,<br />

saj je zdaj Steinov operator že znan. Še vedno pa si bomo <strong>po</strong>magali s konstrukcijami<br />

<strong>po</strong>možnih slučajnih spremenljivk W ′ , ki bodo definirane na istem verjetnostnem prostoru<br />

kot W (z drugimi besedami, konstruirali bomo sklapljanja), bodo blizu W in bodo<br />

iz<strong>po</strong>lnjevale še dodatne zahteve, ki jih bomo precizirali v <strong>po</strong>sameznih razdelkih.<br />

Pri večini konstrukcij bomo navedli ista dva zgleda: neodvisne slučajne spremenljivke<br />

in slučajne permutacije kot zgled vsot odvisnih slučajnih spremenljivk. Tako bo<br />

primerjava med <strong>po</strong>sameznimi konstrukcijami lažja, več zgledov pa bomo navedli v<br />

kasnejših <strong>po</strong>glavjih.<br />

3.1 Sklapljanje z izmenljivim parom<br />

Najprej bomo obravnavali konstrukcijo, ki je zelo tesno <strong>po</strong>vezana s tisto, s <strong>po</strong>močjo<br />

katere smo v razdelku 1.2 prišli do Steinovega operatorja. To je tudi ena prvih<br />

konstrukcij, za katere je bila Steinova metoda tudi u<strong>po</strong>rabljena. Prav tako kot pri izpeljavi<br />

Steinove metode gre tudi tu za sklapljanja z izmenljivim parom. Denimo, da<br />

71


72 3.1 SKLAPLJANJE Z IZMENLJIVIM PAROM<br />

želimo oceniti napako pri normalni aproksimaciji realne slučajne spremenljivke W z<br />

E W= 0 in var(W)=1. Ideja je, da <strong>po</strong>dobno kot v razdelku 1.2 konstruiramo slučajno<br />

spremenljivko W ′ , izmenljivo z W, ki pa zadošča zvezi:<br />

E(W ′ | W)=(1−λ)W+ R (3.1.1)<br />

kjer jeλ>0 konstanta, slučajna spremenljivka R pa je zelo majhna. Zahteva (3.1.1)<br />

je smiselna, ker je v primeru, ko je slučajni vektor (W, W ′ ) <strong>po</strong>razdeljen dvorazsežno<br />

normalno, <strong>po</strong>gojno matematično upanjeE(W ′ | W) linearna funkcija slučajne spremenljivke<br />

W. V veliko primerih obstaja naravna konstrukcija, pri kateri velja R=0.<br />

Konstrukcija (3.1.1) je prvič omenjena v <strong>Steinovi</strong> monografiji [125], kjer je prikazana<br />

u<strong>po</strong>raba pri slučajnih permutacijah (na katere naletimo npr. pri enostavnem slučajnem<br />

vzorčenju). Ta zgled bomo predstavili tudi v tem razdelku. Rinott in Rotar [105]<br />

u<strong>po</strong>rabita omenjeno konstrukcijo pri t. i. antivoter modelu in uteženih (predvsem<br />

izrojenih) U-statistikah. Za zelo zanimiv primer u<strong>po</strong>rabe pri analizi simulacij pa glej<br />

Stein, Diaconis, Holmes in Reinert [126].<br />

Naj bo torej W slučajna spremenljivka, za katero želimo oceniti ∣ ∣<br />

∣E<br />

∣∣.<br />

f (W)−N(0, 1){ f}<br />

Tedaj moramo oceniti Steinovo matematično upanje (3.0.1), kjer je h rešitev Steinove<br />

enačbe:<br />

h ′ (w)−h(w)w= f (w)−N(0, 1){ f} (3.1.2)<br />

Naj bosta torej W ′ in R tako kot v (3.1.1). Slednjo zvezo lahko zapišemo tudi v obliki:<br />

torej velja:<br />

Ker sta W in W ′ izmenljivi, velja:<br />

E h(W)(W− W ′ )= 1 2<br />

W= 1 λ[<br />

E(W− W ′ | W)+R ] (3.1.3)<br />

E h(W)W= 1 λ E h(W)(W− W′ + R) (3.1.4)<br />

[<br />

E h(W)(W− W ′ )+E h(W ′ )(W ′ − W) ]<br />

= 1 2 E[( h(W ′ )−h(W) ) (W ′ − W) ] (3.1.5)<br />

Sledi:<br />

E h(W)W= 1<br />

2λ E( h(W ′ )−h(W) ) (W ′ − W)+ 1 E h(W)R (3.1.6)<br />

λ<br />

Označimo V := W ′ − W. Tedaj iz Taylorjevega razvoja dobimo:<br />

E [( h(W ′ )−h(W) ) (W ′ − W) ] =E [( h(W+ V)−h(W) ) V ] =<br />

=E h ′ (W)V 2 +E(1−θ)h ′′ (W+θV)V 3 (3.1.7)<br />

kjer jeθ<strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega. Izračunajmo:<br />

E V 2 =E [ W ′2 − 2WE(W ′ | W)+W 2] =<br />

=E [ W 2 − 2(1−λ)W 2 + WR+W 2] =<br />

= 2λ+E WR<br />

(3.1.8)


3. STEINOVA METODA IN ODVISNOST 73<br />

Torej velja:<br />

E [( h(W ′ )−h(W) ) (W ′ − W) ] =E [ h ′ (W) ( V 2 −E V 2 + 2λ+E WR ) + (1−θ)h ′′ (W+θV)V 3]<br />

Skupaj z zvezo (3.1.6) zdaj dobimo:<br />

(3.1.9)<br />

E [ h ′ (W)−h(W)W ] =− 1<br />

2λ E [<br />

h ′ (W) ( V 2 −E V 2 +E WR ) − 1<br />

2λ (1−θ)h′′ (W+θV)V 3 −<br />

− 1 λ h(W)R ]<br />

(3.1.10)<br />

Naj boH <strong>po</strong>ljubnaσ-algebra, glede na katero je slučajna spremenljivka W merljiva. Po<br />

Jensenovi neenakosti ocenimo:<br />

∣<br />

∣E h ′ (W)(V 2 −E V 2 ) ∣ ∣ ∣∣∣ ∣= E h ′ (W) ( E(V 2 |H)−E V 2) ∣ ∣∣∣<br />

≤<br />

≤ M 1 (h)E ∣ ∣ ∣E(V 2 |H)−E V 2∣ ∣ ∣≤<br />

≤ M 1 (h) [ var ( E(V 2 |H) )] 1/2<br />

(3.1.11)<br />

Nadalje <strong>po</strong> Cauchy–Schwarzevi neenakosti ocenimo:<br />

|EWR|≤ ( E W 2 E R 2) 1/2<br />

= (E R 2 ) 1/2 (3.1.12)<br />

Torej velja:<br />

∣<br />

∣E [ h ′ (W)−h(W)W ] ∣ ∣∣∣<br />

≤ M 0(h)<br />

λ E|R|+ M {<br />

1(h) [var (<br />

E(V 2 |H) )] }<br />

1/2<br />

+ (E R 2 ) 1/2 +<br />

2λ<br />

+ M (3.1.13)<br />

2(h)<br />

4λ E|V|3<br />

Iz lem 1.4.1 in 2.6.2 sledi, da obstaja rešitev Steinove enačbe (3.1.2), za katero velja:<br />

M 0 (h)≤M 1 ( f ), M 1 (h)≤ 2 √<br />

2π<br />

M 1 ( f ), M 2 (h)≤2 M 1 ( f ) (3.1.14)<br />

Napako pri normalni aproksimaciji bomo lahko torej spet ocenili v Wassersteinovi<br />

metriki. Ko ocenimo šeE|R|≤(E R 2 ) 1/2 , dobimo naslednji rezultat, ki je različica izreka<br />

1 na strani 34 v tretjem <strong>po</strong>gavju Steinove monografije [125].<br />

Izrek 3.1.1 (Stein). Naj bodo W slučajna spremenljivka zE W=0 in var(W)=1, W ′<br />

slučajna spremenljivka, izmenljiva z W, velja pa naj še zveza (3.1.1). Tedaj za vsako Lipschitzevo<br />

funkcijo f in vsakoσ-algebroH, glede na katero je W merljiva, velja ocena:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ { M 1 ( f ) 1 ∣≤<br />

λ 2 E|V|3 + √ 1 [ (<br />

var E(V 2 |H) )] (<br />

1/2<br />

+ 1+ 1<br />

) }<br />

√ (E R 2 ) 1/2<br />

2π 2π<br />

(3.1.15)<br />

kjer je V := W ′ − W.


74 3.1 SKLAPLJANJE Z IZMENLJIVIM PAROM<br />

V nadaljevanju bomo navedli dva zgleda. Prvi zgled bodo kar neodvisne slučajne<br />

spremenljivke. Ta zgled bo namenjen predvsem temu, da dobimo občutek, kaj <strong>po</strong>samezne<br />

količine <strong>po</strong>menijo in kolikšen je njihov tipičen red velikosti. Drugi zgled, slučajne<br />

permutacije, pa bo naš prvi primer vsot odvisnih slučajnih spremenljivk.<br />

ZGLED 3.1.1. Neodvisne slučajne spremenljivke. Naj bodo X 1 ,...X n neodvisne slučajne<br />

spremenljivke z vsoto W. Kot <strong>po</strong>navadi naj bo šeEX i = 0 za vsak i in še var(W)=1. Naj<br />

bodo še X ′ i<br />

njihove neodvisne kopije in naj bo I slučajna spremenljivka, <strong>po</strong>razdeljena<br />

enakomerno <strong>po</strong>{1,...n} in neodvisna od vsega ostalega. Postavimo:<br />

Tedaj velja:<br />

E(W ′ | W)=W− 1 n<br />

W ′ := W− X I + X ′ I<br />

(3.1.16)<br />

n∑<br />

E(X ′ i − X i| W)=<br />

i=1<br />

(<br />

1− 1 )<br />

W (3.1.17)<br />

n<br />

Zveza (3.1.1) je torej iz<strong>po</strong>lnjena zaλ=1/n in R=0. Po izreku 3.1.1 velja ocena:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ { 1 ∣≤n M1 ( f )<br />

2 E|V|3 + √ 1 [ (<br />

var E(V 2 |H) )] } 1/2<br />

(3.1.18)<br />

2π<br />

kjer je V := X ′ I − X I. Ocenimo:<br />

E|V| 3 = 1 n<br />

n∑<br />

E|X ′ i − X i| 3 ≤ 8 n<br />

i=1<br />

n∑<br />

E|X i | 3 (3.1.19)<br />

(u<strong>po</strong>števali smo, da <strong>po</strong> Jensenovi neenakosti velja|x− y| 3 ≤ (|x|+|y|) 3 ≤ 4(|x| 3 +|y| 3 )). Za<br />

oceno drugega člena v (3.1.18) pa zaH <strong>po</strong>stavimoσ-algebro, ki jo generirajo slučajne<br />

spremenljivke X 1 ,...X n . Dobimo:<br />

E(V 2 |H)= 1 n∑<br />

E ( (X ′ i<br />

n<br />

− X i) 2 |H ) = 1 n∑<br />

(X 2<br />

n i+E X 2 i ) (3.1.20)<br />

i=1<br />

Zaradi neodvisnosti <strong>po</strong>tem velja:<br />

var ( E(V 2 |H) ) = 1 n 2<br />

i=1<br />

i=1<br />

n∑<br />

var(X 2 i ) (3.1.21)<br />

Iz (3.1.18), (3.1.19) in (3.1.21) končno dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ⎧<br />

n∑<br />

⎪⎨ ∣≤M1 ( f ) ⎪⎩ 4 E|X i | 3 + √ 1 n∑<br />

⎛⎜ ⎝ var(X 2 i<br />

⎞⎟ ⎫ 1/2 ) ⎪ ⎬⎪⎭<br />

⎠ (3.1.22)<br />

2π<br />

i=1<br />

Če to primerjamo z oceno (1.4.20), vidimo, da je zgornja ocena slabša, saj je že prvi člen<br />

v (3.1.22) večji od celotne ocene (1.4.20). Poleg tega pa dobimo še člene, ki vključujejo<br />

četrte momente slučajnih spremenljivk X i . Njihovi četrti koreni so lahko <strong>po</strong>ljubnokrat<br />

večji od tretjih korenov tretjih absolutnih momentov. Je pa res, da v tipičnem primeru<br />

velja var(X 2) = i O(n−2 ), torej je drugi člen reda velikosti n −1/2 , to pa je tudi tipični<br />

velikostni red prvega člena. Skratka, v tipičnem primeru je ocena (3.1.22) še vedno<br />

istega velikostnega reda kot ocena (1.4.20). □<br />

i=1<br />

i=1


3. STEINOVA METODA IN ODVISNOST 75<br />

ZGLED 3.1.2. Slučajne permutacije. Dana naj bo matrika realnih števil a(i, j), 1≤i, j≤<br />

N. Oglejmo si slučajno spremenljivko:<br />

W :=<br />

N∑<br />

a(i,π(i)) (3.1.23)<br />

i=1<br />

kjer jeπenakomerno <strong>po</strong>razdeljena slučajna permutacija števil 1, 2,...N. Pokazali<br />

bomo, da je slučajna spremenljivka W <strong>po</strong>d primernimi <strong>po</strong>goji <strong>po</strong>razdeljena približno<br />

normalno.<br />

Slučajna spremenljivka W je prav tako kot prej vsota slučajnih spremenljivk X i :=<br />

a(i,π(i)), le da so tokrat slučajne spremenljivke X i odvisne (je pa res, da večji kot je N,<br />

manj sta <strong>po</strong>samezni dve slučajni spremenljivki odvisni; <strong>po</strong> drugi strani pa se za vsak N<br />

za tabelo, ki je “v splošni legi”, <strong>po</strong>samezna slučajna spremenljivka X i deterministično<br />

izraža z ostalimi).<br />

Tovrstne slučajne spremenljivke nastopajo pri statistikah končnih <strong>po</strong>pulacij in jih<br />

bomo preučevali tudi v naslednjih razdelkih, še <strong>po</strong>drobneje pa si jih bomo ogledali v<br />

razdelku 5.2. Omenimo še, da v limitnem primeru, ko za neki fiksen n velja a(i, j)=0<br />

za vsak i>n in vsak j, N pa gre proti neskončno, dobimo vsote neodvisnih slučajnih<br />

spremenljivk.<br />

Za začetek si oglejmo matematično upanje in varianco slučajne spremenljivke W.<br />

Očitno je:<br />

E W= 1 N∑ N∑<br />

a(i, j) (3.1.24)<br />

N<br />

Izračunajmo še varianco! Očitno je:<br />

i=1<br />

j=1<br />

E X 2 i= 1 N<br />

N∑<br />

a(i, j) 2 (3.1.25)<br />

i=1<br />

Nadalje za ikvelja:<br />

E X i X k =<br />

=<br />

1<br />

N(N− 1)<br />

1<br />

N(N− 1)<br />

∑<br />

a(i, j) a(k, l)=<br />

⎛<br />

⎜⎝<br />

jl<br />

N∑<br />

j=1<br />

N∑<br />

a(i, j) a(k, l)−<br />

l=1<br />

⎞<br />

N∑<br />

a(i, j) a(k, j) ⎟⎠<br />

j=1<br />

(3.1.26)<br />

Sledi:<br />

∑<br />

E X i X k =<br />

ik<br />

⎛<br />

1<br />

N(N− 1) ⎜⎝<br />

−<br />

N∑<br />

i=1<br />

N∑<br />

i=1<br />

N∑<br />

j=1<br />

N∑ N∑ N∑<br />

N∑ N∑ N∑<br />

a(i, j) a(k, l)− a(i, j) a(k, j)−<br />

j=1 k=1 l=1<br />

i=1 j=1 k=1<br />

N∑<br />

N∑<br />

a(i, j) a(i, l)+<br />

l=1<br />

i=1 j=1<br />

(3.1.27)<br />

N∑<br />

a(i, j)<br />

⎞⎟ 2 ⎠


76 3.1 SKLAPLJANJE Z IZMENLJIVIM PAROM<br />

Z u<strong>po</strong>števanjem (3.1.24), (3.1.25) in (3.1.27) končno dobimo:<br />

⎛ ⎞2<br />

var(W)= 1 N∑ N∑<br />

a(i, j) 2 1<br />

N∑ N∑<br />

−<br />

a(i, j) −<br />

N− 1<br />

N(N− 1) ⎜⎝ ⎟⎠<br />

i=1 j=1<br />

i=1 j=1<br />

⎛ ⎞2<br />

⎛<br />

1<br />

N∑ N∑<br />

1<br />

N∑<br />

−<br />

N(N− 1)<br />

⎜⎝<br />

a(i, j) ⎟⎠<br />

+<br />

N 2 (N− 1) ⎜⎝<br />

j=1<br />

i=1<br />

i=1<br />

⎞ (3.1.28)<br />

2<br />

N∑<br />

a(i, j) ⎟⎠<br />

V nadaljevanju bomo brez škode za splošnost privzeli, da jeE W=0 in var(W)=1.<br />

Konstruirajmo zdaj slučajno spremenljivko W ′ ! Povzeli bomo kar Steinovo konstrukcijo<br />

iz [125], tretje <strong>po</strong>glavje, stran 39. Novo slučajno spremenljivko bomo konstruirali tako,<br />

da bomo permutacijoπzamenjali z izmenljivo permutacijo, ki se bo le malo razlikovala<br />

od nje. Perturbacija, ki jo bomo naredili, bo desni kom<strong>po</strong>zitum s slučajno trans<strong>po</strong>zicijo.<br />

Naj bo torejτ i,k trans<strong>po</strong>zicija, ki zamenja indeksa i in k. Nadalje naj bo (I, K) par slučajnih<br />

indeksov, neodvisen odπin <strong>po</strong>razdeljen enakomerno <strong>po</strong> množici vseh parov (i, k), za<br />

katere je ik. Definirajmo:<br />

π ′ :=π◦τ I,K , W ′ :=<br />

j=1<br />

N∑<br />

a(i,π ′ (i)) (3.1.29)<br />

Kom<strong>po</strong>zitum s fiksno trans<strong>po</strong>zicijo predstavlja bijektivno preslikavo iz množice vseh<br />

permutacij samo vase. Zato je <strong>po</strong>gojno na (I, K) tudi permutacijaπ ′ <strong>po</strong>razdeljena<br />

enakomerno, torej par (I, K) ni neodvisen le odπ, temveč tudi odπ ′ (seveda pa ni<br />

neodvisen od (π,π ′ )). Ker jeπ = π ′ ◦τ I,K , se <strong>po</strong>gojna <strong>po</strong>razdelitev permutacijeπ<br />

glede naπ ′ ujema s <strong>po</strong>gojno <strong>po</strong>razdelitvijo permutacijeπ ′ glede naπ. Poleg tega sta<br />

permutacijiπinπ ′ enako <strong>po</strong>razdeljeni (obe enakomerno). To pa <strong>po</strong>meni, da staπinπ ′<br />

izmenljivi, z njima pa tudi W in W ′ .<br />

O<strong>po</strong>mba. Prav tako bi lahko zaπ ′ vzeli tudi levi kom<strong>po</strong>zitum s slučajno trans<strong>po</strong>zicijo.<br />

Velja:<br />

Označimo V := W ′ − W. Ni težko preveriti, da velja:<br />

i=1<br />

V=−a(I,π(I))−a(K,π(K))+a(I,π(K))+a(K,π(I)) (3.1.30)<br />

E [ a(I,π(I)) ∣ ∣ ∣π<br />

]<br />

=<br />

1<br />

N<br />

Podobno je tudiE [ a(K,π(K)) ∣ ∣ ∣π<br />

]<br />

= W/N. Nadalje je:<br />

N∑<br />

a(i,π(i))= W N<br />

i=1<br />

E [ a(I,π(K)) ∣ ∣ ∣π<br />

]<br />

=<br />

1<br />

N(N− 1)<br />

Toda ker jeE W= ∑ N<br />

i=1∑ N<br />

k=1 a(i, j)=0, velja:<br />

E [ a(I,π(K)) ∣ ∣ ∣π<br />

]<br />

=−<br />

1<br />

N(N− 1)<br />

(3.1.31)<br />

∑<br />

a(i,π(k)) (3.1.32)<br />

ik<br />

∑<br />

W<br />

a(i,π(i))=−<br />

N(N− 1)<br />

i=1<br />

(3.1.33)


3. STEINOVA METODA IN ODVISNOST 77<br />

Podobno je tudiE [ a(K,π(I)) ∣ ∣ ∣π<br />

]<br />

=−W/(N(N− 1)). Sledi:<br />

E(W ′ | W)=<br />

(<br />

1− 2 )<br />

W (3.1.34)<br />

N− 1<br />

torej zveza (3.1.1) velja zaλ=2/(N−1) in R=0. Po izreku 3.1.1 torej velja (če zaH<br />

<strong>po</strong>stavimoσ-algebro, ki jo generiraπ):<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ { 1 ∣≤(N− 1) M1 ( f )<br />

4 E|V|3 + 1 [ (<br />

2 √ var E(V 2 |π) )] } 1/2<br />

(3.1.35)<br />

2π<br />

Po Jensenovi neenakosti lahko ocenimo:<br />

E|V| 3 ≤ 16E[ ∣∣∣a(I,π(I)) ∣ ∣∣ 3<br />

+<br />

∣ ∣∣a(K,π(K))<br />

∣ ∣∣ 3<br />

+<br />

∣ ∣∣a(I,π(K))<br />

∣ ∣∣ 3<br />

+<br />

∣ ∣∣a(K,π(I))<br />

∣ ∣∣ 3 ] =<br />

= 64<br />

N 2<br />

N∑<br />

i=1<br />

N∑<br />

(3.1.36)<br />

|a(i, j)| 3<br />

j=1<br />

Ocena drugega člena pa bo tokrat precej zahtevnejša. Oceniti je treba varianco slučajne<br />

spremenljivke:<br />

E(V 2 |π)=<br />

1<br />

N(N− 1)<br />

∑[ ] 2<br />

−a(i,π(i))−a(k,π(k))+a(i,π(k))+a(k,π(i)) (3.1.37)<br />

ik<br />

ki je <strong>po</strong>splošitev slučajnih spremenljivk takega tipa, kot je W: medtem ko je W vsota<br />

slučajnih spremenljivk, ki so odvisne le od ene vrednostiπ(i), so <strong>po</strong>samezni sumandi<br />

priE(V 2 |π) odvisni od vrednostiπvdveh indeksih. Gre torej za dvojno indeksirano<br />

permutacijsko statistiko (DIPS), s katerimi se bomo ukvarjali v razdelku 5.2. Tovrstne<br />

statistike lahko zapišemo tudi v obliki:<br />

∑<br />

g α (π) (3.1.38)<br />

α⊆{1,...N}<br />

|α|=2<br />

kjer je <strong>po</strong>samezna funkcija g α odvisna le od vrednosti permutacijeπna množiciα, z|α|<br />

pa smo označili moč množice. V našem primeru bi tako <strong>po</strong>stavili:<br />

g {i,k} (π) :=<br />

2 [ ] 2<br />

−a(i,π(i))−a(k,π(k))+a(i,π(k))+a(k,π(i)) (3.1.39)<br />

N(N− 1)<br />

Naslednji rezultat, ki ga bomo dokazali na koncu razdelka, nam da oceno variance<br />

takih statistik.<br />

Lema 3.1.2. Naj boπenakomerno <strong>po</strong>razdeljena slučajna permutacija na{1,...N}, 1≤r≤<br />

n in W statistika tipa: ∑<br />

W := g α (π) (3.1.40)<br />

α⊆{1,...N}<br />

|α|=r


78 3.1 SKLAPLJANJE Z IZMENLJIVIM PAROM<br />

kjer je <strong>po</strong>samezna funkcija g α odvisna le od vrednosti permutacijeπna množiciα. Tedaj velja<br />

ocena: ( )<br />

N− 1<br />

∑<br />

var(W)≤3r 3 E g α (π) 2 (3.1.41)<br />

r−1<br />

|α|=r<br />

Za funkcije g {i,k} iz (3.1.39) zdaj dobimo:<br />

var ( E(V 2 |π) ) ∑<br />

≤ 24(N− 1) E g {i,k} (π) 2 =<br />

in, kjer je n


3. STEINOVA METODA IN ODVISNOST 79<br />

le <strong>po</strong> tehnični zahtevnosti. Po drugi strani pa je med neodvisnostjo in odvisnostjo<br />

velik kvalitativni preskok, tehnično zahtevne izračune pa bomo v naslednjih razdelkih<br />

olajšali.<br />

□<br />

Dolžni smo dokazati še lemo 3.1.2. Dokaz bo temeljil na naslednjem rezultatu.<br />

Lema 3.1.3. Naj boπenakomerno <strong>po</strong>razdeljena slučajna permutacija na{1,...N}. Nadalje<br />

naj bostaαinβdisjunktni <strong>po</strong>dmnožici množice{1,...N}, dani pa naj bosta še funkciji g α in g β ,<br />

za kateri velja, da je g α (π) odvisna le od vrednostiπnaα, g β pa le od vrednostiπnaβ. Tedaj<br />

velja ocena:<br />

∣<br />

∣cov ( g α (π), g β (π) ) ∣ ∣∣∣<br />

≤ |α||β| [<br />

E gα (π) 2 +Eg β (π) 2] (3.1.45)<br />

N<br />

DOKAZ. Naj boρneodvisna kopija slučajne permutacijeπ. Tedaj velja:<br />

E g α (π)E g β (π)=E g α (π)g β (ρ) (3.1.46)<br />

E g α (π)g β (π)= 1<br />

1−p E g α(π)g β (ρ) 1 [ π(α)∩ρ(β)=∅ ] (3.1.47)<br />

kjer je p :=P(π(α)∩ρ(β)∅). Ko odštejemo obe enakosti, <strong>po</strong> nekaj računanja dobimo:<br />

cov ( g α (π), g β (π) ) = p<br />

1−p E g α(π)g β (ρ) 1 [ π(α)∩ρ(β)=∅ ] −E g α (π)g β (ρ) 1 [ π(α)∩ρ(β)∅ ]<br />

(3.1.48)<br />

Po Jensenovi neenakosti lahko ocenimo|g α (π) g β (ρ)|≤ 2[ 1 gα (π) 2 + g β (ρ) 2] . Toda slučajni<br />

spremenljivki g α (π) in g β (ρ) sta vsaka zase neodvisni od dogodkaπ(α)∩ρ(β)=∅. Od<br />

tod spet <strong>po</strong> nekaj računanja dobimo:<br />

∣<br />

∣cov ( g α (π), g β (π) ) ∣ ∣∣∣<br />

≤ p [ E g α (π) 2 +Eg β (π) 2] (3.1.49)<br />

Dokaz zaključimo s preprosto oceno p≤ ∑ i∈αP[π(i)∈ρ(β)]=|α||β|/N.<br />

DOKAZLEME 3.1.2. Pišimo:<br />

∑<br />

var(W)= cov ( g α (π), g β (π) ) +<br />

|α|,|β|=r<br />

α∩β∅<br />

∑<br />

|α|,|β|=r<br />

α∩β=∅<br />

Zaα∩β∅ kar ne<strong>po</strong>sredno u<strong>po</strong>rabimo Jensenovo neenakost:<br />

| cov(X, Y)|=E(X−E X)(Y−E Y)≤ 1 2<br />

[<br />

E(X−E X) 2 +E(Y−E Y) 2 ≤ 1 2<br />

cov ( g α (π), g β (π) ) (3.1.50)<br />

[<br />

E X 2 +E Y 2] (3.1.51)<br />

Ker je število množicβmoči r, ki imajo z dano množicoαprav tako moči r neprazen<br />

presek, manjše ali enako r 2( N<br />

r) /N, velja ocena:<br />

∑<br />

|α|,|β|=r<br />

α∩β∅<br />

cov ( g α (π), g β (π) ) ≤ r2<br />

N(<br />

N<br />

r<br />

) ∑<br />

E g α (π) 2 (3.1.52)<br />

|α|=r


80 3.2 PREMA UTEŽITEV<br />

Zaα∩β=∅ pa u<strong>po</strong>rabimo lemo 3.1.3. Dobimo:<br />

∑<br />

|α|,|β|=r<br />

α∩β=∅<br />

cov ( g α (π), g β (π) ) ≤ 2r2<br />

N<br />

( )<br />

N<br />

∑<br />

E g α (π) 2 (3.1.53)<br />

r<br />

|α|=r<br />

Sledi:<br />

( ) ( )<br />

var(W)≤ 3r2 N N− 1 ∑<br />

E g α (π) 2 = 3r 3 E g α (π) 2 (3.1.54)<br />

N r<br />

r−1<br />

|α|=r<br />

3.2 Prema utežitev<br />

Omenili smo že, da je ocena Steinovega matematičnega upanja vsot odvisnih slučajnih<br />

spremenljivk (in s tem ocena napake pri normalni aproksimaciji) tesno <strong>po</strong>vezana s<br />

konstrukcijo <strong>po</strong>možnih slučajnih spremenljivk (sklapljanjem). Pri konstrukciji iz prejšnjega<br />

razdelka je <strong>po</strong>možna slučajna spremenljivka W ′ zadoščala zvezi (3.1.1). V tem<br />

in naslednjem razdelku pa bomo za <strong>po</strong>možno slučajno spremenljivko zahtevali, da ima<br />

določeno <strong>po</strong>razdelitev, ki bo odvisna od <strong>po</strong>razdelitve prvotne slučajne spremenljivke<br />

W.<br />

DEFINICIJA. Naj bo W slučajna spremenljivka, ki naj bo <strong>po</strong>vsod istega predznaka<br />

(t. j. bodisi <strong>po</strong>vsod <strong>po</strong>zitivna bodisi <strong>po</strong>vsod negativna). Nadalje naj W ne bo skoraj<br />

<strong>po</strong>vsod identično enaka nič in naj boE|W|


3. STEINOVA METODA IN ODVISNOST 81<br />

bo enako nič, zato bomo morali Steinov operator nekoliko prilagoditi. Naj boE W=λ<br />

in ˜W := W−λ. Velja:<br />

E [ h ′ ( ˜W)−h( ˜W) ˜W ] =E [ h ′ (W−λ)−h(W−λ)(W−λ) ] =<br />

=E [˜h′ ] (3.2.2)<br />

(W)− ˜h(W)(W−λ)<br />

kjer je ˜h(w) := h(w−λ). Tako vidimo, da bomo namesto običajnega Steinovega matematičnega<br />

upanja morali ocenjevatiE [ h ′ (W)−h(W)(W−λ) ] . Na vso stvar pa lahko<br />

<strong>po</strong>gledamo še malo drugače. Zveza (3.2.2) še vedno velja, če W zamenjamo s <strong>po</strong>ljubno<br />

spremenljivko w, matematično upanje odstranimo, parameterλpa je <strong>po</strong>ljuben. Zato<br />

ocene iz točk (2) in (3) leme 1.4.1 še vedno veljajo, če enačbo (1.4.19) zamenjamo z<br />

enačbo:<br />

h ′ (w)−h(w)(w−λ)= f (w)−N(λ, 1){ f} (3.2.3)<br />

Naj bo torej W slučajna spremenljivka, ki naj bo <strong>po</strong>vsod istega predznaka,E W=λ in<br />

var(W)=1. Nadalje naj bo W ∗ prema uteženka slučajne spremenljivke W, defirana na<br />

istem verjetnostnem prostoru kot W. Velja:<br />

E [ h ′ (W)−h(W)(W−λ) ] =E [ h ′ (W)−λ ( h(W ∗ )−h(W) )] (3.2.4)<br />

Označimo V := W ∗ − W. Iz Taylorjevega razvoja dobimo:<br />

E [ h ′ (W)−h(W)(W−λ) ] =E [ h ′ (W)(1−λV)−λ(1−θ)h ′′ (W+θV)V 2] (3.2.5)<br />

kjer jeθ<strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega. Ker je:<br />

lahko to zapišemo v obliki:<br />

λEV=λ(E W ∗ −λ)=E W 2 −λ 2 = 1 (3.2.6)<br />

E [ h ′ (W)−h(W)(W−λ) ] =−λE [ h ′ (W)(V−E V)+(1−θ)h ′′ (W+θV)V 2] (3.2.7)<br />

Izraz na desni strani bomo ocenili <strong>po</strong>dobno kot v prejšnjem razdelku. Naj bo spetH<br />

<strong>po</strong>ljubnaσ-algebra, glede na katero je slučajna spremenljivka W merljiva. Tedaj <strong>po</strong><br />

(3.1.11) velja:<br />

∣<br />

∣E h ′ (W)(V−E V) ∣ ∣≤M1 (h) [ var ( E(V|H) )] 1/2<br />

(3.2.8)<br />

Videli smo, da ima tudi enačba (3.2.3) rešitev, za katero veljajo ocene (3.1.14). Tako smo<br />

dokazali naslednji rezultat, ki je modifikacija Baldijevega, Rinottovega in Steinovega<br />

rezultata iz [4].<br />

Izrek 3.2.1. Naj bo W ∗ prema uteženka slučajne spremenljivke W zE W=λ in var(W)=<br />

1. Tedaj za vsako Lipschitzevo funkcijo f in vsakoσ-algebroH, glede na katero je W merljiva,<br />

velja ocena:<br />

∣<br />

∣E f (W)−N(λ, 1){ f} ∣ ∣ ∣≤λ M1 ( f )<br />

kjer je V := W ∗ − W.<br />

{<br />

E V 2 + 2 √<br />

2π<br />

[<br />

var<br />

(<br />

E(V|H)<br />

)] 1/2<br />

}<br />

(3.2.9)


82 3.2 PREMA UTEŽITEV<br />

Baldi, Rinott in Stein [4] u<strong>po</strong>rabijo različico zgornjega izreka pri lokalnih maksimumih<br />

slučajnih funkcij na grafih. Nadalje Goldstein in Rinott [63] u<strong>po</strong>rabita večrazsežno<br />

različico tega izreka pri statistikah na stopnjah točk v slučajnih grafih in še pri vsotah<br />

funkcij slučajnih spremenljivk, katerih navzkrižna <strong>po</strong>razdelitev je večrazsežna normalna<br />

ali <strong>po</strong>linomska. Še več zgledov je predstavljenih v Goldsteinovem članku [61].<br />

V naslednjem razdelku bomo obravnavali konstrukcijo sklapljanj s premimi utežitvami,<br />

na kateri temeljijo vsi zgoraj navedeni primeri. Končne ocene napake pa<br />

vendarle ne bomo izpeljali prav s premo utežitvijo, temveč na bolj ne<strong>po</strong>sreden način,<br />

ki je bolj ali manj ekvivalenten. Prav s premo utežitvijo pa bomo tu ocenili napako<br />

za vsote neodvisnih nenegativnih slučajnih spremenljivk. Konstrukcija sklapljanja s<br />

premo utežitvijo bo temeljila na naslednjem preprostem dejstvu.<br />

Trditev 3.2.2. Naj bodo X 1 ,...X n neodvisne nenegativne slučajne spremenljivke z vsoto<br />

W. Označimoλ i :=E X i inλ :=E W. Privzemimo, da jeλ i > 0 (t. j. da X i niso skoraj<br />

<strong>po</strong>vsod enake nič). Nadalje naj bodo X ∗ i<br />

preme uteženke slučajnih spemenljivk X i , neodvisne od<br />

(X 1 ,...X n ), I pa naj bo slučajni indeks, neodvisen od vsega skupaj in <strong>po</strong>razdeljen <strong>po</strong>{1,...n}<br />

sorazmerno zλ i , t. j.P(I=i)=λ i /λ. Tedaj je slučajna spremenljivka:<br />

prema uteženka slučajne spremenljivke W.<br />

W ∗ := W− X I + X ∗ I<br />

(3.2.10)<br />

DOKAZ. Naj bo f omejena in merljiva funkcija. Označimo še W i := W− X i . Tedaj<br />

zaradi neodvisnosti velja:<br />

E f (W)W=<br />

n∑<br />

E f (W i + X i )X i =<br />

i=1<br />

n∑<br />

λ i E f (W i + X ∗ i )=λE f (W I+ X ∗ I ) (3.2.11)<br />

i=1<br />

torej je W ∗ = W I + X ∗ I<br />

res prema uteženka.<br />

O<strong>po</strong>mba. V konstrukciji smo <strong>po</strong>trebovali le neodvisnost <strong>po</strong>sameznih slučajnih<br />

spremenljivk X ∗ od (X<br />

i 1 ,...X n ), nismo pa <strong>po</strong>trebovali neodvisnosti celotnega slučajnega<br />

vektorja (X ∗ 1 ,...X∗ n). Prav tako nismo <strong>po</strong>trebovali navzkrižnih <strong>po</strong>razdelitev med<br />

slučajnimi spremenljivkami X ∗.<br />

i<br />

Naj bodo torej X i , W,λ i ,λ, X ∗ i , I in W∗ tako kot v trditvi 3.2.2. Če je torej V=<br />

W ∗ − W= X ∗ I − X I, velja:<br />

n∑<br />

E V 2 λ i<br />

=<br />

λ E(X∗ i − X i) 2 ≤<br />

i=1<br />

n∑<br />

λ i<br />

( )<br />

≤ 2 E(X<br />

∗<br />

i<br />

λ<br />

)2 +E X 2 i =<br />

i=1<br />

= 2 n∑ ( )<br />

E X<br />

3<br />

λ<br />

i+λ i E X 2 i ≤<br />

i=1<br />

n∑<br />

(3.2.12)<br />

≤ 4 λ<br />

i=1<br />

E X 3 i


3. STEINOVA METODA IN ODVISNOST 83<br />

Pri zadnji oceni smo u<strong>po</strong>rabili Jensenovo neenakost. Oceniti moramo še drugi člen v<br />

(3.2.9). Naj boHσ-algebra, ki jo generirajo slučajne spremenljivke X 1 ,...X n . Tedaj<br />

velja:<br />

E(V|H)=<br />

=<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

λ i<br />

λ E(X∗ i − X i|H)=<br />

λ i<br />

(<br />

E X<br />

∗<br />

i<br />

λ<br />

− X )<br />

i<br />

(3.2.13)<br />

Členi zE X ∗ i<br />

so konstantni in prav nič ne vplivajo na varianco. Za preostanek pa z<br />

u<strong>po</strong>števanjem neodvisnosti dobimo:<br />

var ( E(V|H) ) = 1 λ 2<br />

n∑<br />

λ 2 i var(X i) (3.2.14)<br />

Če zdaj (3.2.12) in (3.2.14) vstavimo v (3.2.9) ter privzamemo še, da je var(W)=1,<br />

končno dobimo:<br />

∣<br />

∣E f (W)−N(λ, 1){ f} ∣ { n∑<br />

∣≤M1 ( f ) 4 E Xi+ 3 √ 2<br />

⎤<br />

n∑<br />

1/2} ⎡⎢ ⎣ λ 2 i var(X i) ⎥⎦ (3.2.15)<br />

2π<br />

i=1<br />

Dobljena ocena ne zahteva četrtih momentov in je torej <strong>po</strong> velikostnem redu enaka ali<br />

boljša od ocene (3.1.22). Je pa lahko še vedno slabša od ocene (1.4.20). To se zgodi v<br />

primeru, ko ena izmed slučajnih spremenljivk <strong>po</strong> velikosti zelo odstopa od ostalih. Če<br />

je var(W)=1, so X i tipično velikostnega reda n −1/2 . Naj zdaj to velja za vse sumande<br />

razen za enega, ki naj bo velikostnega reda n −1/6 . Tedaj je desna stran ocene (1.4.20)<br />

še vedno velikostnega reda n −1/2 , medtem ko je desna stran ocene (3.1.22) velikostnega<br />

reda n −1/3 .<br />

i=1<br />

i=1<br />

3.3 Konstrukcija premih uteženk<br />

Vse konstrukcije premih uteženk, ki so znane avtorju in so bile u<strong>po</strong>rabljene za ocenjevanje<br />

napake pri normalni aproksimaciji <strong>po</strong> <strong>Steinovi</strong> <strong>metodi</strong> (vključno s konstrukcijo<br />

iz trditve 3.2.2), so izhajale iz ene in iste ideje, to pa je, da premo uteženko sestavimo iz<br />

relativnih premih uteženk.<br />

DEFINICIJA. Naj bosta W in X slučajni spremenljivki. Slučajna spremenljivka W<br />

naj ima vrednosti na <strong>po</strong>ljubnem merljivem prostoru, slučajna spremenljivka X naj bo<br />

realna in <strong>po</strong>vsod istega predznaka, naj ne bo skoraj <strong>po</strong>vsod identično enaka nič in naj bo<br />

E|X|


84 3.3 KONSTRUKCIJA PREMIH UTEŽENK<br />

Če je zdaj denimo X i ≥ 0 za vsak i in W=X 1 +···+X n ter je W ∗ prema uteženka<br />

i<br />

slučajne spremenljivke W glede na X i , premo uteženko W ∗ slučajne spremenljivke W<br />

glede samo nase konstruiramo <strong>po</strong>dobno kot v trditvi 3.2.2: naj bo I slučajni indeks,<br />

neodvisen od vsega ostalega, za katerega veljaP(I=i)=E X i /EW; tedaj ni težko<br />

preveriti, da slučajna spremenljivka W ∗ := W ∗ I<br />

ustreza zvezi (3.2.1).<br />

Ni pa nujno, da iz relativnih premih uteženk sploh konstruiramo enotno premo<br />

uteženko. V resnici se izkaže za ugodneje, da napako pri normalni aproksimaciji<br />

izpeljemo kar ne<strong>po</strong>sredno iz sklapljanj z relativnimi premimi uteženkami. Razloga<br />

za to sta vsaj dva. Prvi je, da na ta način ni nujno, da je slučajna spremenljivka<br />

W <strong>po</strong>vsod istega predznaka; to mora veljati le za sumande X i , ki pa so lahko eni<br />

<strong>po</strong>zitivni, drugi pa negativni. Drugi <strong>po</strong>memben razlog pa je, da lahko na ta način<br />

izpeljavo <strong>po</strong>splošimo tudi na več dimenzij (s<strong>po</strong>mnimo naj, da ima v definiciji relativne<br />

preme utežitve slučajna spremenljivka W vrednosti na <strong>po</strong>ljubnem merljivem prostoru).<br />

Tako Goldstein in Rinott [63] ocenita napako pri večrazsežni normalni aproksimaciji s<br />

<strong>po</strong>močjo slučajnih vektorjev, ki imajo premo utežene <strong>po</strong>razdelitve glede na kom<strong>po</strong>nente<br />

slučajnega vektorja W.<br />

Oglejmo si zdaj še konstrukcijo sklapljanj z relativnimi premimi uteženkami. Naj<br />

bosta torej W in X slučajni spremenljivki, od katerih je X realna in <strong>po</strong>vsod istega<br />

predznaka. Za začetek privzemimo, da je slučajna spremenljivka X diskretna. Za vsak<br />

x, za katerega jeP(X=x)>0, konstruirajmo slučajno spremenljivko W x , definirano<br />

na istem verjetnostnem prostoru kot W in katere <strong>po</strong>razdelitev se ujema s <strong>po</strong>gojno<br />

<strong>po</strong>razdelitvijo slučajne spremenljivke W pri X=x. Definirajmo slučajno spremenljivko<br />

W ∗ tako, da bo enaka W x z verjetnostjo xP(X=x)/EX, pri čemer ustrezne x izbiramo<br />

neodvisno od vsega ostalega (delamo torej sklapljanja s <strong>po</strong>gojnimi <strong>po</strong>razdelitvami). Tedaj<br />

ni težko preveriti, da ima tako definirana slučajna spremenljivka W ∗ res premo uteženo<br />

<strong>po</strong>razdelitev slučajne spremenljivke W glede na X.<br />

Sklapljanja s <strong>po</strong>gojnimi <strong>po</strong>razdelitvami so s Steinovo metodo zelo tesno <strong>po</strong>vezana.<br />

U<strong>po</strong>rabljena so že v Chenovem članku [38], v katerem je bila Steinova metoda prvič<br />

opisana za Poissonovo aproksimacijo. Na njih temeljijo vse izpeljave ocen napake<br />

pri Poissonovi aproksimaciji v Barbourjevi, Holstovi in Jansonovi monografiji [16]. V<br />

zvezi z normalno aproksimacijo pa se, kolikor je avtorju znano, prvič <strong>po</strong>javijo v že<br />

omenjenem Baldijevem, Rinottovem in Steinovem članku [4], ki v Steinovo metodo<br />

uvede preme utežitve.<br />

Slučajne spremenljivke W x , ki so blizu W, lahko konstruiramo, če X nosi “malo”<br />

informacije. Slednjega ne bomo precizirali, v resnici bomo na vso stvar gledali obratno:<br />

merilo za to, koliko informacije nosi dogodek X=x, bo prav to, kako blizu W se da<br />

konstruirati slučajna spremenljivka W x .<br />

Opišimo konstrukcijo slučajnih spremenljivk W x na primeru obeh zgledov, ki smo<br />

jih navedli v razdelku 3.1. Pri prvem je bila W vsota neodvisnih slučajnih spremenljivk<br />

X 1 ,...X n . Recimo, da vsaka od njih nosi le majhen prispevek k celotni vsoti. Tedaj<br />

se za dani i <strong>po</strong>razdelitev slučajne spremenljivke W i,x := W− X i + x ujema s <strong>po</strong>gojno<br />

<strong>po</strong>razdelitvijo slučajne spremenljivke W glede na X i = x, obenem pa je W i,x razmeroma<br />

blizu slučajne spremenljivke W.


3. STEINOVA METODA IN ODVISNOST 85<br />

V drugem primeru pa je bila W statistika na slučajnih permutacijah:<br />

W := w(π) :=<br />

N∑<br />

a(i,π(i)) (3.3.2)<br />

Dogodki, da je X i = x, so unije dogodkov, da jeπ(i)= j. Definirajmo slučajno permutacijoπ<br />

ij <strong>po</strong> predpisu:<br />

π i→j :=τ π(i),j ◦π (3.3.3)<br />

kjer smo sτspet označili trans<strong>po</strong>zicijo. Tedaj se <strong>po</strong>razdelitev slučajne spremenljivke<br />

W ij := w(π i→j ) ujema s <strong>po</strong>gojno <strong>po</strong>razdelitvijo slučajne spremenljivke W glede naπ(i)=<br />

j, obenem pa je W ij spet razmeroma blizu W.<br />

O<strong>po</strong>mba. Namesto levega kom<strong>po</strong>zituma v (3.3.3) bi lahko vzeli tudi desni kom<strong>po</strong>zitum<br />

s primerno trans<strong>po</strong>zicijo.<br />

Konstrukcijo preme uteženke W ∗ slučajne spremenljivke W glede na X smo do zdaj<br />

opisali za primer, ko je slučajna spremenljivka X diskretno <strong>po</strong>razdeljena. V splošnem<br />

primeru pa vzamemo najprej premo uteženko X ∗ slučajne spremenljivke X, slučajno<br />

spremenljivko W ∗ pa konstruiramo tako, da se njena <strong>po</strong>gojna <strong>po</strong>razdelitev glede na<br />

X ∗ = x ujema s prehodno <strong>po</strong>razdelitvijo slučajne spremenljivke W glede na X=x. To<br />

<strong>po</strong>meni, da za <strong>po</strong>ljubno omejeno in merljivo funkcijo f velja:<br />

E f (W, X)X<br />

E f (W ∗ , X ∗ )= (3.3.4)<br />

E X<br />

od koder sledi, da je W ∗ res prema uteženka slučajne spremenljivke W glede na X.<br />

Steinovo matematično upanje se s premimi uteženkami oceni <strong>po</strong>dobno kot v prejšnjem<br />

razdelku. Naj bo torej W=X 1 +···+X n . Označimoλ i :=E X i inλ :=E W ter<br />

privzemimo še, da je var(W)=1. Nadalje naj bo za vsak i dana prema uteženka W ∗ i<br />

slučajne spremenljivke W glede na X i . Tedaj velja:<br />

E [ h ′ (W)−h(W)(W−λ) ] n∑<br />

= E [ h ′ (W) cov(X i , W)−h(W)(X i −λ i ) ] =<br />

=<br />

=<br />

n∑<br />

i=1<br />

i=1<br />

i=1<br />

E [ h ′ (W) cov(X i , W)−λ i<br />

(<br />

h(W<br />

∗<br />

i )−h(W))] =<br />

n∑<br />

E [ ( )]<br />

h ′ (W) cov(X i , W)−λ i h ′ (W)V i + (1−θ)h ′′ (W+θV i )V 2 i<br />

i=1<br />

(3.3.5)<br />

kjer je V i := W ∗ i− W,θpa je <strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega<br />

ostalega. Ker je:<br />

lahko končno zapišemo:<br />

λ i E V i =E X i (E W ∗ i−E W)=E X i W−E X i E W= cov(X i , W) (3.3.6)<br />

E [ h ′ (W)−h(W)(W−λ) ] =−<br />

n∑<br />

λ i E [ ]<br />

h ′ (W)(V i −E V i )+(1−θ)h ′′ (W+θV i )V 2 i (3.3.7)<br />

i=1<br />

kar lahko ocenimo <strong>po</strong>dobno kot (3.2.7).


86 3.4 OCENE, DOBLJENE NEPOSREDNO IZ SKLAPLJANJ<br />

3.4 Ocene, dobljene ne<strong>po</strong>sredno iz sklapljanj<br />

V prejšnjem razdelku smo s<strong>po</strong>znali, kako lahko s <strong>po</strong>močjo sklapljanj s <strong>po</strong>gojnimi<br />

<strong>po</strong>razdelitvami konstruiramo preme uteženke. Iz slednjih smo <strong>po</strong>tem dobili oceno<br />

napake pri normalni aproksimaciji. Napako pa lahko ocenimo tudi ne<strong>po</strong>sredno iz sklapljanj<br />

s <strong>po</strong>gojnimi <strong>po</strong>razdelitvami, brez u<strong>po</strong>rabe premih uteženk. To prinaša določene<br />

prednosti. Ni npr. več <strong>po</strong>trebno, da so slučajne spremenljivke <strong>po</strong>vsod istega predznaka.<br />

Konstrukcijo iz prejšnjega razdelka spremenimo tako, da namesto premih uteženk<br />

X ∗ vzamemo kar neodvisne kopije X ′ slučajnih spremenljivk X<br />

i i i , dane pa naj bodo še<br />

slučajne spremenljivke W i , ki nosijo vlogo prejšnjih slučajnih spremenljivk W ∗ , t. j.<br />

i<br />

katerih <strong>po</strong>gojna <strong>po</strong>razdelitev slučajne spremenljivke W i glede na X ′ = x se ujema s<br />

i<br />

<strong>po</strong>gojno <strong>po</strong>razdelitvijo slučajne spremenljivke W glede na X i = x. Z drugimi besedami,<br />

slučajni vektor (W i , X ′) naj bo preprosto enako <strong>po</strong>razdeljen kot (W, X i i).<br />

O<strong>po</strong>mba. Konstrukcija, ki smo jo pravkar opisali, je različica konstrukcije, ki<br />

nastopa v XIV. <strong>po</strong>glavju Steinove monografije [125].<br />

Ker zdaj ni več <strong>po</strong>trebno privzeti, da so X i <strong>po</strong>vsod istega predznaka, lahko brez<br />

škode za splošnost privzamemo tudi, da jeE X i = 0. Zadevo lahko zapišemo tudi za<br />

večrazsežni primer in dobimo naslednji rezultat.<br />

Izrek 3.4.1. Naj bodo X i , X ′, W in W i i tako kot zgoraj. Privzemimo še, da je var(W)=1,<br />

in naj boH <strong>po</strong>ljubnaσ-algebra, glede na katero je slučajna spremenljivka W merljiva. Tedaj za<br />

vsako Lipschitzevo funkcijo f velja:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ⎧<br />

⎪⎨<br />

n∑<br />

∣≤M1 ( f ) E|X ⎪⎩<br />

′ i |R2 i+ √ 2<br />

⎛ ⎞⎤<br />

n∑<br />

⎡⎢ ⎫ ⎣ var⎜⎝<br />

E(X ′ i R ⎪ ⎬⎪⎭<br />

i|H) ⎟⎠⎥⎦1/2 (3.4.1)<br />

2π<br />

i=1<br />

kjer je R i := W i − W.<br />

Če pa so X i , X ′, W in W i i slučajni vektorji z vrednostmi vR d , ki ustrezajo istim pred<strong>po</strong>stavkam<br />

kot ustrezne slučajne spremenljivke zgoraj (namesto var(W)=1 privzamemo Var(W)=I),<br />

za vsako funkcijo f∈♭ (2) (R d ) velja ocena:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ⎧√ ⎪⎨ 2π<br />

n∑<br />

∣≤M2 ( f ) E|X ⎪⎩<br />

′ i<br />

8<br />

||R i| 2 + 1 ⎡ ⎞⎤<br />

n∑<br />

2<br />

⎢⎣<br />

⎛⎜ ⎫ 1/2 d sl Var ⎝ E(X ′ i R ⎪ ⎬⎪⎭<br />

i|H) ⎟⎠⎥⎦<br />

i=1<br />

i=1<br />

(3.4.2)<br />

O<strong>po</strong>mba. V oceni (3.4.2) izraz X ′ R i i predstavlja slučajni kovariantni 2-tenzor. Tako je<br />

Var( ∑ n<br />

i=1E(X ′ R i i|H)) mešani (2, 2)-tenzor, njegova sled pa je skalar, dobljen z ustrezno<br />

skrčitvijo (glej razdelek D.5).<br />

O<strong>po</strong>mba. V izreku ni <strong>po</strong>trebna nobena pred<strong>po</strong>stavka o navzkrižnih <strong>po</strong>razdelitvah<br />

med slučajnimi spremenljivkami X ′ . Potrebno je le, da je <strong>po</strong>samezna slučajna spremenljivka<br />

X ′ neodvisna od (X<br />

i<br />

i i , W), ni pa npr. <strong>po</strong>trebno, da bi bil cel slučajni vektor<br />

(X ′ 1 ,...X′ n) neodvisna kopija slučajnega vektorja (X 1 ,...X n ). O navzkrižnih <strong>po</strong>razdelitvah<br />

je smiselno govoriti, ker sta oceni na desnih straneh (3.4.1) in (3.4.2) odvisni od<br />

njih.<br />

i=1


3. STEINOVA METODA IN ODVISNOST 87<br />

DOKAZIZREKA 3.4.1. Naj bo g katera od rešitev Steinove enačbe:<br />

∆g(w)− g ′ (w)w= f (w)−N(0, I){ f} (3.4.3)<br />

iz izreka 2.6.1. S<strong>po</strong>mnimo se, da tako kot v (2.5.4) velja:<br />

∆g(w)= g ′′ (w)I= g ′′ (w)EW 2 (3.4.4)<br />

Tedaj velja:<br />

E [ ∆g(W)− g ′ (W)W ] =<br />

=<br />

=<br />

n∑<br />

E [ ]<br />

g ′′ (W)EX i W−g ′ (W)X i =<br />

i=1<br />

n∑<br />

E [ g ′′ (W)EX i W− ( g ′ (W i )− g ′ (W) ) X i] ′ =<br />

i=1<br />

n∑<br />

E [ g ′′ (W)EX i W− ( g ′′ (W)X ′ i R )]<br />

i+ (1−θ)g ′′′ (W+θR i )X ′ i R2 i<br />

i=1<br />

(3.4.5)<br />

kjer je R i := W i − W, inθtako kot <strong>po</strong>navadi <strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in<br />

neodvisna od vsega ostalega. Ker jeE X ′ R i i=E X ′ i W′ i=E X i W, končno velja:<br />

E [ ∆g(W)− g ′ (W)W ] =−<br />

n∑<br />

E [ g ′′ (W)(X ′ i R i−EX ′ i R ]<br />

i)+(1−θ)g ′′′ (W+θR i )X ′ i R2 i (3.4.6)<br />

i=1<br />

Ocenimo:<br />

n∑<br />

∣ E g ′′ (W)(X ′ i<br />

∣<br />

R i−E X ′ i R ∣∣∣∣∣∣ n∑<br />

i)<br />

∣ = (<br />

E g ′′ (W) E(X<br />

′<br />

i R i|H)−E X ′ i R i) ∣ ∣∣∣∣∣<br />

≤<br />

i=1<br />

i=1<br />

n∑<br />

(<br />

≤ M 2 (g)E<br />

E(X<br />

′<br />

i<br />

∣<br />

R i|H)−E X ′ i R i) ∣ ∣∣∣∣∣∧<br />

≤<br />

i=1<br />

⎡ ∣ ∣∣∣∣∣∣ n∑<br />

≤ M 2 (g) ⎢⎣ E (<br />

E(X<br />

′<br />

i R i|H)−E X ′ i R ) ∣ 2⎤<br />

∣∣∣∣∣<br />

i ⎥⎦<br />

i=1<br />

∧<br />

1/2<br />

(3.4.7)<br />

kjer je|·| ∧ projektivna norma (glej razdelek D.8) Označimo:<br />

Ξ :=<br />

n∑<br />

i=1<br />

(<br />

E(X<br />

′<br />

i R i|H)−E X ′ i R )<br />

i<br />

(3.4.8)<br />

Po trditvi D.9.1 velja:<br />

E|Ξ| 2 ∧≤ dE〈Ξ,Ξ〉=dEsl(ΞΞ T )=d sl Var(Ξ) (3.4.9)


88 3.4 OCENE, DOBLJENE NEPOSREDNO IZ SKLAPLJANJ<br />

Sledi:<br />

∣<br />

∣E f (W)−N(0, I){ f}≤ 1 2 M 3(g)<br />

⎡ ⎞⎤<br />

n∑<br />

n∑<br />

E|X i ||R i | 2 + ⎢⎣<br />

⎛⎜ d sl Var ⎝ E(X i R i |H) ⎟⎠⎥⎦<br />

i=1<br />

i=1<br />

1/2<br />

(3.4.10)<br />

Za enorazsežni primer iz lem 1.4.1 in 2.6.2 ocenimo:<br />

M 2 (g)≤ 2 √<br />

2π<br />

M 1 ( f ), M 3 (g)≤2 M 1 ( f ) (3.4.11)<br />

v večrazsežnem primeru pa iz leme 2.6.2 sledi ocena:<br />

Dokaz je s tem končan.<br />

M 2 (g)≤ 1 2 M 2( f ), M 3 (g)≤<br />

√<br />

2π<br />

4 M 2( f ) (3.4.12)<br />

O<strong>po</strong>mba. V dokazu bi se lahko namesto na izrek 2.6.1 oprli tudi na trditev 2.5.1.<br />

ZGLED 3.4.1. Neodvisne slučajne spremenljivke. Vzemimo vsoto neodvisnih slučajnih<br />

spremenljivk W := X 1 +···+X n zE X i = 0 in Var(W)=1. Za u<strong>po</strong>rabo izreka 3.4.1<br />

<strong>po</strong>trebujemo še njihove neodvisne kopije X ′ . Privzeli bomo, da je kar celotni slučajni<br />

i<br />

vektor (X ′ 1 ,...X′ n) neodvisna kopija slučajnega vektorja (X 1 ,...X n ). Tedaj slučajne spremenljivke<br />

W i := W− X i + X ′ zagotovo zadoščajo <strong>po</strong>gojem izreka, torej velja R i i= X ′ − X i i.<br />

Iz Jensenove neenakosti dobimo oceno:<br />

E|X ′ i |R2 i≤ 4E|X i | 3 (3.4.13)<br />

Naj bo šeH karσ-algebra, ki jo generira W. Tedaj je očitnoE(X ′ R i i|H)=E X 2 , kar je<br />

i<br />

konstanta, torej je celoten drugi člen v oceni (3.4.1) enak nič. Za <strong>po</strong>ljubno Lipschitzevo<br />

funkcijo f torej dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣ ∣≤4 M1 ( f )<br />

n∑<br />

E|X i | 3 (3.4.14)<br />

kar je nekje vmes med (1.4.20) in (3.1.22). Podobno v večrazsežnem primeru (ob<br />

pred<strong>po</strong>stavki, da je Var(W)=I) dobimo oceno:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ∣ ∣≤<br />

√<br />

2π<br />

2 M 2( f )<br />

i=1<br />

n∑<br />

E|X i | 3 (3.4.15)<br />

Videli smo, da se je pri neodvisnih slučajnih spremenljivkah člen z varianco <strong>po</strong>gojnih<br />

matematičnih upanj v ocenah (3.4.1) in (3.4.2) enostavno izničil. To je prej izjema<br />

kot pravilo, v splošnem ta člen nadalje ocenimo s četrtimi momenti, <strong>po</strong>dobno kot v<br />

(3.1.22), (3.5.7) in (3.5.9) ter tudi v naslednjem zgledu, ki <strong>po</strong>novno obravnava slučajne<br />

permutacije.<br />

i=1<br />


3. STEINOVA METODA IN ODVISNOST 89<br />

ZGLED 3.4.2. Slučajne permutacije. Podobno kot v zgledu 3.1.2 naj bo spet dana<br />

kvadratna matrika realnih števil a(i, j), 1≤i, j≤N(zadeva bi se dala gledati tudi v<br />

večrazsežnem primeru, a tu bomo zaradi enostavnosti obravnali le enorazsežni primer;<br />

več v razdelku 5.2). Naj bo spetπenakomerno <strong>po</strong>razdeljena slučajna permutacija in:<br />

W :=<br />

N∑<br />

a(i,π(i)) (3.4.16)<br />

i=1<br />

V zgledu 3.1.2 smo brez škode za splošnost privzeli, da jeE W=0. Tu bomo šli še<br />

nekoliko dlje. Če <strong>po</strong>samezni vrstici ali stolpcu naše matrike prištejemo kako konstanto,<br />

se tudi statistika W spremeni le za konstanto. Zato smemo brez škode za splošnost<br />

privzeti, da za vsak i velja:<br />

N∑<br />

a(i, j)=0 (3.4.17)<br />

in da za vsak j velja:<br />

Prav tako bomo brez škode za splošnost privzeli, da je:<br />

j=1<br />

N∑<br />

a(i, j)=0 (3.4.18)<br />

i=1<br />

var(W)= 1<br />

N− 1<br />

N∑<br />

i=1<br />

N∑<br />

a(i, j) 2 = 1 (3.4.19)<br />

j=1<br />

Slučajna spremenljivka W je definirana kot vsota slučajnih spremenljivk: velja W=<br />

∑ N<br />

i=1 X i , kjer je:<br />

X i = a(i,π(i)) (3.4.20)<br />

Če želimo u<strong>po</strong>rabiti izrek 3.4.1, moramo konstruirati slučajne spremenljivke X ′ in W<br />

i i ,<br />

za katere bo veljalo, da je slučajni vektor (W i , X ′) <strong>po</strong>razdeljen enako kot (W, X i i). V<br />

(3.3.3) smo že nakazali, kako to gre. Vzemimo najprej neodvisno kopijoπ ′ slučajne<br />

permutacijeπin definirajmo:<br />

X ′ i<br />

:= a(i,π ′ (i)) (3.4.21)<br />

Nadalje <strong>po</strong>stavimo:<br />

W i :=<br />

N∑<br />

a(k,π i→π ′ (i)(k))=<br />

k=1<br />

N∑<br />

a ( k,τ π(i),π ′ (i)(π(k)) ) (3.4.22)<br />

Tedaj ni težko preveriti, da X ′ i in W i ustrezata našim zahtevam.<br />

Zdaj moramo le še oceniti desno stran ocene (3.4.1). Najprej opazimo, da velja:<br />

R i = W i − W=−a ( i,π(i) ) − a ( π −1 (π ′ (i)),π ′ (i) ) + a ( i,π ′ (i) ) + a ( π −1 (π ′ (i)),π(i) ) (3.4.23)<br />

Iz Jensenove neenakosti med aritmetično in geometrično sredino sledi:<br />

[<br />

R 2 i≤ 4 a ( i,π(i) ) 2 (<br />

+ a π −1 (π ′ (i)),π ′ (i) ) 2 (<br />

+ a i,π ′ (i) ) 2 (<br />

+ a π −1 (π ′ (i)),π(i) )] 2<br />

(3.4.24)<br />

k=1


90 3.4 OCENE, DOBLJENE NEPOSREDNO IZ SKLAPLJANJ<br />

Ko u<strong>po</strong>števamo še neenakost xy 2 ≤ 1 3 x3 + 2 3 y3 , ki velja za <strong>po</strong>ljubna x, y≥0, nadalje<br />

dobimo:<br />

|X ′ i |R2 i≤ 16 ∣<br />

∣a ( i,π ′ (i) ) ∣ ∣∣∣ 3 8<br />

+ ∣<br />

∣a ( i,π(i) ) ∣ ∣∣∣ 3 8<br />

+ ∣<br />

∣a ( π −1 (π ′ (i)),π ′ (i) ) ∣ ∣∣∣ 3<br />

+<br />

3<br />

3<br />

3<br />

+ 8 ∣<br />

∣a ( i,π ′ (i) ) ∣ ∣∣∣ 3 8<br />

+ ∣<br />

∣a ( π −1 (π ′ (i)),π(i) ) ∣ (3.4.25) ∣∣∣ 3<br />

3<br />

3<br />

Ob u<strong>po</strong>števanju simetrije iz tega dobimo naslednjo oceno prvega člena v (3.4.1):<br />

N∑<br />

i=1<br />

E|X ′ i |R2 i≤ 16<br />

N<br />

N∑<br />

i=1<br />

N∑<br />

∣<br />

∣a(i, j) ∣ 3<br />

∣<br />

j=1<br />

(3.4.26)<br />

Oceniti moramo še drugi člen v (3.4.1). Pri neodvisnih slučajnih spremenljivkah je le-ta<br />

prišel enak nič, tukaj pa bo njegova ocena <strong>po</strong>dobno zahtevna kot v zgledu 3.1.2. Naj<br />

boHσ-algebra, ki jo generiraπ. Ob u<strong>po</strong>števanju (3.4.17) in (3.4.18) izračunamo:<br />

N∑<br />

E(X ′ i R i|π)=− 1 N<br />

i=1<br />

N∑<br />

i=1<br />

N∑<br />

a(i, j) 2 + 1 N<br />

j=1<br />

N∑<br />

i=1<br />

N∑<br />

a(i, j) a(π −1 (j),π(i)) (3.4.27)<br />

Prvi člen je konstanten in zato nič ne vpliva na varianco. Sledi:<br />

⎛ ⎞<br />

N∑<br />

var⎜⎝<br />

E(X ′ i R i|π) ⎟⎠ = 1 var(t(π)) (3.4.28)<br />

N2 kjer je:<br />

t(π)=<br />

N∑<br />

i=1<br />

i=1<br />

N∑<br />

a(i, j) a(π −1 (j),π(i))=<br />

j=1<br />

N∑<br />

i=1<br />

j=1<br />

N∑<br />

a(i,π(k)) a(k,π(i)) (3.4.29)<br />

Tako kot v zgledu 3.1.2 smo tudi tu dobili dvojno indeksirano permutacijsko statistiko.<br />

Njeno varianco bomo ocenili precej na grobo. Pišimo t(π)=t 1 (π)+t 2 (π), kjer je:<br />

t 1 (π)=<br />

in preprosto ocenimo:<br />

Obe varianci ocenimo <strong>po</strong> lemi 3.1.2. Dobimo:<br />

k=1<br />

N∑ ∑<br />

a(i,π(i)) 2 , t 2 (π)=2 a(i,π(k)) a(k,π(i)) (3.4.30)<br />

i=1<br />

i


3. STEINOVA METODA IN ODVISNOST 91<br />

Iz Jensenove neenakosti sledi:<br />

var(t(π))≤96N<br />

≤ 48N<br />

= 96N<br />

N∑<br />

i=1<br />

i=1<br />

i=1<br />

N∑<br />

E a(i,π(k)) 2 a(k,π(i)) 2 ≤<br />

Iz (3.4.1), (3.4.26), (3.4.28) in (3.4.32) končno dobimo:<br />

⎧<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ⎪⎨ 16<br />

N∑ N∑<br />

∣≤M1<br />

∣<br />

( f ) ∣a(i, j) ∣ 3 2 6 ∣ + √<br />

⎪⎩ N<br />

⎡⎢ 2π⎣ N<br />

kar je tako kot v (3.1.44), le da je drugi člen ocenjen bolje.<br />

k=1<br />

N∑ N∑<br />

E [ a(i,π(k)) 4 + a(k,π(i)) 4] =<br />

(3.4.32)<br />

k=1<br />

N∑ N∑<br />

a(i, j) 4<br />

i=1<br />

j=1<br />

j=1<br />

N∑<br />

i=1<br />

N∑<br />

a(i, j)<br />

⎤⎥ ⎫ 1/2<br />

⎪ 4 ⎬<br />

(3.4.33) ⎦ ⎪ ⎭<br />

Sklapljanje s <strong>po</strong>gojnimi <strong>po</strong>razdelitvami je torej dalo <strong>po</strong>dobne rezultate kot sklapljanje<br />

z izmenljivim parom. Pomembnejša od rezultatov samih pa je njegova ideja, saj<br />

vodi do novih, bolj rafiniranih načinov ocenjevanja, ki jih bomo obravnavali v naslednjih<br />

razdelkih. Z njihovo <strong>po</strong>močjo bomo lahko napako ocenili brez četrtih momentov,<br />

kar je <strong>po</strong>membna kakovostna izboljšava.<br />

3.5 Razčlenitve prvega reda<br />

Kot <strong>po</strong>navadi se bomo tudi tu ukvarjali z vsotami oblike W := X 1 +···+X n . V<br />

prejšnjem razdelku smo konstruirali slučajne spremenljivke W i , za katere je veljalo, da<br />

je slučajni vektor (X ′ i , W i) <strong>po</strong>razdeljen enako kot (X i , W), X ′ i<br />

pa je bila neodvisna od<br />

(X 1 ,...X n ). Vse konstrukcije, ki smo jih navedli za zgled, pa so iz<strong>po</strong>lnjevale še dodaten<br />

<strong>po</strong>goj: ne le, da se je <strong>po</strong>gojna <strong>po</strong>razdelitev slučajne spremenljivke W i pri X ′ i= x ujemala s<br />

<strong>po</strong>gojno <strong>po</strong>razdelitvijo slučajne spremenljivke W pri X=x, to je veljalo tudi za <strong>po</strong>gojno<br />

<strong>po</strong>razdelitev slučajne spremenljivke W i pri X ′ i= x in X i = y. Z drugimi besedami, W i je<br />

bila <strong>po</strong>gojno na X ′ i neodvisna od X i. Zaradi neodvisnosti slučajne spremenljivke X ′ i od<br />

X i pa to <strong>po</strong>meni, da je bila tudi W i neodvisna od X i .<br />

Izkaže se, da je ta preprosta zahteva dovolj, da lahko izpeljemo še eno oceno Steinovega<br />

matematičnega upanja. Slučajno spremenljivko W smo torej razčlenili na slučajno<br />

spremenljivko W i , neodvisno od X i , in ostanek, s <strong>po</strong>močjo katerega se bo izražala ocena<br />

napake pri normalni aproksimaciji.<br />

Izrek 3.5.1. Naj bodo X 1 ,...X n slučajne spremenljivke z vsoto W ter naj veljaE X i = 0<br />

in var(W)=1. Za vsak i naj bo dana še slučajna spremenljivka W i , neodvisna od X i . Naj bo<br />

šeH <strong>po</strong>ljubnaσ-algebra, glede na katero je slučajna spremenljivka W merljiva. Tedaj za vsako<br />

Lipschitzevo funkcijo f velja:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣≤M1 ( f )<br />

⎧<br />

⎪⎨<br />

n∑<br />

E|X ⎪⎩<br />

i |R 2 i+ √ 2<br />

⎛ ⎞⎤<br />

n∑<br />

⎡⎢ ⎫ ⎪ ⎬⎪⎭<br />

⎣ var⎜⎝<br />

E(X i R i |H) ⎟⎠⎥⎦1/2 (3.5.1)<br />

2π<br />

i=1<br />

i=1<br />

j=1<br />


92 3.5 RAZČLENITVE PRVEGA REDA<br />

kjer je R i := W i − W.<br />

Če pa so X i , W in W i slučajni vektorji z vrednostmi vR d , ki ustrezajo istim pred<strong>po</strong>stavkam<br />

kot ustrezne slučajne spremenljivke zgoraj (namesto var(W)=1 privzamemo Var(W)=I), za<br />

vsako funkcijo f∈♭ (2) (R d ) velja ocena:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ⎧√ ⎪⎨ 2π<br />

n∑<br />

∣≤M2 ( f ) E|X ⎪⎩<br />

i ||R i | 2 + 1 ⎡ ⎞⎤<br />

n∑<br />

8<br />

2<br />

⎢⎣<br />

⎛⎜ ⎫ 1/2 d sl Var ⎪ ⎬⎪⎭<br />

⎝ E(X i R i |H) ⎟⎠⎥⎦<br />

i=1<br />

i=1<br />

(3.5.2)<br />

O<strong>po</strong>mba. Razčlenitve prvega reda so <strong>po</strong>seben primer konstrukcije, ki nastopa v X.<br />

<strong>po</strong>glavju Steinove monografije [125] in enorazsežni del izreka 3.5.1 je <strong>po</strong>seben primer<br />

izreka 1 v omenjenem <strong>po</strong>glavju na strani 147.<br />

DOKAZIZREKA 3.5.1. Začnemo tako kot pri dokazu izreka 3.4.1. Spet naj bo g katera<br />

od rešitev Steinove enačbe:<br />

iz izreka 2.6.1. Velja:<br />

∆g(w)− g ′ (w)w= f (w)−N(0, I){ f} (3.5.3)<br />

E [ ∆g(W)− g ′ (W)W ] =<br />

Ker je W i neodvisna od X i in šeE X i = 0, nadalje velja:<br />

E [ ∆g(W)− g ′ (W)W ] =−<br />

=<br />

n∑<br />

E [ ]<br />

g ′′ (W)EX i W−g ′ (W)X i<br />

i=1<br />

n∑<br />

E [ g ′′ (W)EX i R i + ( g ′ (W)− g ′ (W i ) ) ]<br />

X i =<br />

i=1<br />

(3.5.4)<br />

n∑<br />

E [ g ′′ (W)(X ′ i R i−E X ′ i R ] (3.5.5)<br />

i)+(1−θ)g ′′′ (W+θR i )X ′ i R2 i<br />

i=1<br />

kjer je spetθ<strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega. Preostanek<br />

dokaza je enak kot pri izreku 3.4.1.<br />

ZGLED 3.5.1. Neodvisne slučajne spremenljivke. Vzemimo spet vsoto neodvisnih<br />

slučajnih spremenljivk W := X 1 +···+X n zE X i = 0 in Var(W)=1. Tokrat preprosto<br />

<strong>po</strong>stavimo W i := W−X i , torej je kar R i =−X i . Toda drugi člen v oceni (3.5.1) zdaj ni enak<br />

nič. Če zaH <strong>po</strong>stavimoσ-algebro, ki jo generirajo slučajne spremenljivke X 1 ,...X n ,<br />

dobimoE(X i R i |H)=−X 2 , torej velja:<br />

i<br />

⎛ ⎞ ⎞<br />

n∑<br />

n∑<br />

n∑<br />

n∑<br />

var⎜⎝<br />

E(X i R i |H) ⎟⎠<br />

⎛⎜ = var ⎝ X 2 i⎟⎠ = var(X 2 i )≤ E X 4 i<br />

(3.5.6)<br />

i=1<br />

i=1<br />

Iz izreka 3.5.1 torej sledi:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ⎧<br />

⎪⎨<br />

n∑<br />

∣≤M1 ( f ) E|X ⎪⎩<br />

i | 3 + √ 2<br />

⎤<br />

n∑<br />

⎡⎢ ⎫ ⎪<br />

⎣ E X 4 ⎬⎪⎭<br />

i⎥⎦1/2 (3.5.7)<br />

2π<br />

i=1<br />

i=1<br />

i=1<br />

i=1


3. STEINOVA METODA IN ODVISNOST 93<br />

kar je <strong>po</strong>dobno kot (3.1.22), le z boljšo konstanto pri členu s tretjimi momenti, a slabšo<br />

pri členu s četrtimi.<br />

Podobno lahko tudi v večrazsežnem primeru ocenimo:<br />

⎛ ⎞<br />

n∑<br />

n∑<br />

n∑<br />

n∑<br />

sl Var⎜⎝<br />

E(X i R i |H) ⎟⎠ = sl Var(X 2 i )= E|Xi−E 2 X 2 i |2 ≤ E|X i | 4 (3.5.8)<br />

i=1<br />

i=1<br />

(z|·| smo označili evklidsko normo, tako na vektorjih kot tudi na kovariantnih<br />

2-tenzorjih). Sledi:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ⎧√ ⎪⎨ 2π<br />

n∑<br />

∣≤M2 ( f ) E|X ⎪⎩<br />

i | 3 + 1 ⎡ n∑<br />

8<br />

2<br />

⎢⎣ d E|X i |<br />

⎤⎥ ⎫ 1/2<br />

⎪ 4 ⎬⎪⎭<br />

⎦ (3.5.9)<br />

i=1<br />

ZGLED 3.5.2. Slučajne permutacije. Naj bo spet W= ∑ N<br />

i=1 a(i,π(i)), kjer jeπenakomerno<br />

<strong>po</strong>razdeljena slučajna permutacija. Slučajno spremenljivko W i , neodvisno od<br />

X i = a(i,π(i)), konstruiramo tako, daπnadomestimo sπ i→J , kjer je J enakomerno <strong>po</strong>razdeljen<br />

slučajni indeks, neodvisen od vsega ostalega. Z drugimi besedami, definirajmo:<br />

N∑<br />

W i := a ( k,τ π(i),J (π(k)) ) (3.5.10)<br />

k=1<br />

Druga možnost pa je, da namesto levega vzamemo desni kom<strong>po</strong>zitum, tako da <strong>po</strong>stavimo:<br />

N∑<br />

W i := a ( k,π(τ i,I (k)) ) (3.5.11)<br />

k=1<br />

kjer je spet I enakomerno <strong>po</strong>razdeljen in neodvisen od vsega ostalega. V obeh primerih<br />

ni težko preveriti, da je W i neodvisna od X i . Napako pri normalni aproksimaciji<br />

ocenimo na <strong>po</strong>doben način kot v prejšnjem razdelku. Podrobnosti so prepuščene<br />

bralcu.<br />

□<br />

ZGLED 3.5.3. Lokalna odvisnost. Naj bo W = ∑ i∈I X i , kjer jeIkončna indeksna<br />

množica (obravnavati bi se sicer dalo tudi neskončne indeksne množice, a se bomo<br />

zaradi enostavnosti omejili zgolj na končne). Za vsak i∈I naj obstaja taka množica<br />

J i ⊆I, da je družina{X j ; j∈I\J i } neodvisna od i. Pravimo, da jeJ i okolica odvisnosti<br />

za indeks i, za slučajne spremenljivke X i pa, da so lokalno odvisne.<br />

Lokalna odvisnost se naravno <strong>po</strong>javlja v veliko primerih. Največ primerov je pri<br />

statistikah na grafih (glej 6. <strong>po</strong>glavje), <strong>po</strong>memben primer lokalne odvisnosti pa so tudi<br />

U-statistike na vzorcih, pri katerih so elementi med seboj neodvisni (glej razdelek 5.1).<br />

Povezava med Steinovo metodo in lokalno odvisnostjo je zelo tesna. Obravnava jo<br />

že Stein [125] (glej o<strong>po</strong>mbo na koncu), <strong>po</strong>membne rezultate pa so dosegli tudi Barbour,<br />

Karoński in Ruciński [17] (več o njihovem prispevku v razdelku 3.9) ter še Rinott [103],<br />

Rinott in Rotar [104] ter Chen in Shao [41].<br />

Lokalno odvisnost lahko predstavimo tudi z usmerjenim grafom. Množica njegovih<br />

oglišč naj bo kar i, <strong>po</strong>vezava od i do j pa naj obstaja, če je j∈J i . V tem delu pa se bomo<br />

omejili na nekoliko enostavnejši koncept lokalne odvisnosti, ki ga je vpeljal Rinott [103]<br />

in v večini primerov zadošča, temelji pa na neusmerjenih grafih.<br />

i=1<br />

i=1<br />

i=1<br />


94 3.5 RAZČLENITVE PRVEGA REDA<br />

DEFINICIJA. Neusmerjen grafΓna množici ogliščIje graf odvisnosti za družino<br />

slučajnih spremenljivk{X i ; i∈I}, če za <strong>po</strong>ljubni <strong>po</strong>dmnožiciK,L⊆I, med katerima<br />

ne obstaja nobena <strong>po</strong>vezava, velja, da sta družini slučajnih spremenljivk{X k ; i∈K} in<br />

{X l ; l∈L} neodvisni.<br />

Razčlenitve so pri lokalni odvisnosti očitne: če jeΓgraf odvisnosti za družino<br />

{X i ; i∈I}, preprosto <strong>po</strong>stavimo: ∑<br />

R i := X j (3.5.12)<br />

kjer smo z∼označili relacijo sosednosti (pri čemer vzamemo, da je i∼i). Kot <strong>po</strong>navadi<br />

privzemimo še, da jeE X i = 0 za vse i in še, da je var(W)=1 (zaradi enostavnosti<br />

se bomo omejili le za enorazsežni primer; na več dimenzij <strong>po</strong>splošimo brez težav).<br />

Ocenimo sedaj desno stran neenačbe (3.5.1). Najprej <strong>po</strong> Jensenovi neenakosti ocenimo:<br />

∑<br />

E|X i |R 2 i≤<br />

i∈I<br />

∑<br />

i∼j,i∼k<br />

E|X i ||X j ||X k |≤ 1 3<br />

j;j∼i<br />

∑( E|Xi | 3 +E|X j | 3 +E|X k | 3) (3.5.13)<br />

i∼j,i∼k<br />

Naj bo D maksimalna stopnja <strong>po</strong>sameznega oglišča v grafuΓ, <strong>po</strong>večana za ena (t. j.<br />

maksimalno število sosedov <strong>po</strong>sameznega oglišča vključno s samim sabo). Tedaj je za<br />

vsak i∈I število parov (j, k), za katere velja i∼ j∼k, manjše ali enako D 2 . Podobno<br />

velja tudi za indeksa j in k. Torej velja:<br />

∑<br />

i |R<br />

i∈IE|X 2 i≤ D 2∑ E|X i | 3 (3.5.14)<br />

i∈I<br />

Ocenimo še drugi člen na desni strani ocene (3.5.1). ZaH <strong>po</strong>stavimo karσ-algebro,<br />

ki jo generirajo vse slučajne spremenljivke X i . Tedaj velja:<br />

⎛ ⎞<br />

∑ ∑ ∑<br />

var⎜⎝<br />

E(X i R i |H) ⎟⎠ = var X i X j = cov(X i X j , X k X l ) (3.5.15)<br />

i∈I<br />

i∼j<br />

Za dani <strong>po</strong>dmnožici A, B⊆I označimo A∼B, če med A in B obstaja vsaj ena <strong>po</strong>vezava<br />

ali pa je njun presek neprazen. Brž ko je{i, j}{k, l}, je očitno cov(X i X j , X k X l )=0. Torej<br />

velja:<br />

⎛ ⎞<br />

∑ ∑<br />

var⎜⎝<br />

E(X i R i |H) ⎟⎠ = cov(X i X j , X k X l ) (3.5.16)<br />

i∈I<br />

i∼j<br />

k∼l<br />

{i,k}∼{k,l}<br />

Zdaj pa kovariance ocenimo <strong>po</strong> (3.1.51), <strong>po</strong>tem pa u<strong>po</strong>rabimo še ocenoEUV≤ 1(E 2 U2 +<br />

E V 2 ). Dobimo:<br />

⎛ ⎞<br />

∑<br />

var⎜⎝<br />

E(X i R i |H) ⎟⎠ ≤ 1 ∑ (<br />

E X<br />

4<br />

4<br />

i+E X 4 j +E X4 k +E )<br />

X4 l<br />

(3.5.17)<br />

i∈I<br />

i∼j<br />

k∼l<br />

{i,k}∼{k,l}<br />

i∼j<br />

k∼l


3. STEINOVA METODA IN ODVISNOST 95<br />

Podobno kot prej je za vsak indeks i število trojic (j, k, l), za katere je i∼ j, k∼l in še<br />

{i, j}∼{k, l}, manjše ali enako 4D 3 . Podobne ocene veljajo tudi za indekse j, k in l. Tako<br />

dobimo: ⎛ ⎞<br />

∑<br />

var⎜⎝<br />

E(X i R i |H) ⎟⎠ ≤ 4D3∑ X<br />

i∈IE 4 i<br />

(3.5.18)<br />

i∈I<br />

Iz (3.5.1), (3.5.14) in (3.5.18) zdaj končno dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ⎧ ⎤<br />

⎪⎨<br />

n∑<br />

n∑<br />

∣≤M1 ( f ) E|X i | 3 + 4D3/2<br />

√<br />

⎡⎢ ⎫ ⎪<br />

⎣ E X 4 ⎬⎪⎭<br />

i⎥⎦1/2 (3.5.19)<br />

2π<br />

⎪⎩ D2<br />

i=1<br />

O<strong>po</strong>mba. Ocena (3.5.19) je <strong>po</strong>seben primer <strong>po</strong>sledice 2 na strani 110 v X. <strong>po</strong>glavju<br />

Steinove monografije [125].<br />

O<strong>po</strong>mba. Pri D=1 se lokalna odvisnost zreducira na primer, ko so slučajne<br />

spremenljivke X i neodvisne. Tudi ocena (3.5.19) se prevede na oceno (3.5.7), le da je<br />

konstanta pri členu s četrtimi momenti dvakrat prevelika. Slabšo konstanto smo dobili<br />

zato, ker smo za dani i pregrobo ocenili število trojic (j, k, l), za katere je i∼ j, k∼l in<br />

{i, j}∼{k, l}. Res pa je, da se z naraščajočim D to vse manj <strong>po</strong>zna.<br />

i=1<br />

□<br />

3.6 Kumulativna prema utežitev<br />

Kumulativna prema utežitev (angl. zero biassed transformation) izhaja iz preme utežitve<br />

in odpravlja nekatere njene hibe. Prva in najhujša je, da je prema utežitev omejena<br />

na nenegativne slučajne spremenljivke. Z u<strong>po</strong>rabo relativnih premih uteženk se da ta<br />

hiba precej omiliti, a je treba slučajne spremenljivke še vedno razdeliti na <strong>po</strong>zitivni in<br />

negativni del. Tudi to se da odpraviti, tako da se napaka pri normalni aproksimaciji<br />

oceni ne<strong>po</strong>sredno z u<strong>po</strong>rabo sklapljanj s <strong>po</strong>gojnimi <strong>po</strong>razdelitvami. Še vedno pa je, kot<br />

smo videli, nadaljnje ocenjevanje splošnih meja za napako pri normalni aproksimaciji<br />

lahko precej zahtevno in zahteva četrte momente. Kumulativna prema utežitev to hibo<br />

odpravi, v splošnem so <strong>po</strong>trebni le tretji momenti. Je pa res, da je njena konstrukcija<br />

malo zahtevnejša.<br />

Pri premi utežitvi od slučajne spremenljivke W ∗ zahtevamo, da za vsako omejeno<br />

in merljivo funkcijo f velja zvezaE f (W)W =E WE f (W ∗ ); pri kumulativni premi<br />

utežitvi pa bomo zahtevali, da za neko konstanto c veljaE f (W)W=cE f ′ (W ∗ ), brž<br />

ko je f zvezno odvedljiva, in ima omejen odvod. Seveda moramo tedaj za slučajno<br />

spremenljivko W zahtevati, da jeE W 2


96 3.6 KUMULATIVNA PREMA UTEŽITEV<br />

O<strong>po</strong>mba. Pogoj, da jeE W=0, je <strong>po</strong>treben; prav tako faktorjaE W 2 na desni ne<br />

moremo zamenjati z nobenim drugim. V to se zlahka prepričamo, če v enačbo vstavimo<br />

f (w)=1in f (w)=w.<br />

U<strong>po</strong>raba kumulativne preme utežitve pri <strong>Steinovi</strong> <strong>metodi</strong> se prvič <strong>po</strong>javi v članku,<br />

katerega avtorja sta Goldstein in Reinert [62] in ki kot zgled obravnava enostavno<br />

slučajno vzorčenje. Še več zgledov pa obravnavata nadaljnja Goldsteinova članka [61]<br />

in [60].<br />

O<strong>po</strong>mba. Kumulativno premo utežitev smo definirali le za enorazsežni primer. V<br />

članku [62] so nakazane tudi <strong>po</strong>splošitve na večrazsežni primer, ki pa je mi ne bomo<br />

obravnavali, zato pa bomo v naslednjem razdelku napako pri večrazsežni normalni<br />

aproksimaciji ocenili na bolj ne<strong>po</strong>sreden način, ki izhaja iz konstrukcije sklapljanj s<br />

kumulativnimi premimi utežitvami.<br />

V definiciji smo že navedli dva <strong>po</strong>trebna <strong>po</strong>goja za obstoj kumulativnih premih<br />

utežitev. Nastane vprašanje, ali sta tudi zadostna. Odgovor je pritrdilen. Označimo<br />

zµ<strong>po</strong>razdelitev slučajne spremenljivke W, za katero naj veljaE W 2


3. STEINOVA METODA IN ODVISNOST 97<br />

strani v (3.6.4) za vsako zvezno funkcijo s kompaktnim nosilcem. To pa zagotovo velja<br />

za mero, določeno s predpisom:<br />

∫ ∫ z<br />

µ ∗ (A) :=− wµ(dw) dz (3.6.5)<br />

A −∞<br />

Meraµ ∗ je absolutno zvezna glede na Lebesguovo mero, njena gostota pa je enaka<br />

kumulativi preme utežitve <strong>po</strong>razdelitve slučajne spremenljivke W. To tudi upravičuje<br />

izraz kumulativna prema utežitev.<br />

Ni se težko prepričati, da jeµ ∗ (R)=E W 2


98 3.6 KUMULATIVNA PREMA UTEŽITEV<br />

Izrek 3.6.3 (Goldstein, Reinert). Naj bo W slučajna spremenljivka, za katero velja<br />

E W=0 in var(W)=1, W ∗ pa naj bo njena kumulativna prema uteženka. Tedaj za vsako<br />

Lipschitzevo funkcijo f velja:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣ ∣≤2 M1 ( f )E|W ∗ − W| (3.6.7)<br />

DOKAZ. Naj bo h rešitev Steinove enačbe:<br />

iz leme 1.4.1. Tedaj velja:<br />

h ′ (w)−h(w)w= f (w)−N(0, 1){ f} (3.6.8)<br />

∣<br />

∣E [ h ′ (W)−h(W)W ] ∣ ∣∣∣ = ∣<br />

∣E [ h ′ (W)−h ′ (W ∗ ) ] ∣ ∣∣∣<br />

≤ M 2 (h)E|W ∗ − W| (3.6.9)<br />

Dokaz zaključimo z opažanjem, da iz točke (3) leme 1.4.1 sledi M 2 (h)≤2 M 1 ( f ).<br />

Glede konstrukcij sklapljanj s kumulativnimi premimi utežitvami pa bomo naredili<br />

<strong>po</strong>dobno kot pri premih utežitvah. V naslednjem razdelku bomo konstrukcijo sicer<br />

prikazali, napako pri normalni aproksimaciji pa ocenili bolj ne<strong>po</strong>sredno, brez dejanske<br />

konstrukcije kumulativnih premih uteženk. Še eno konstrukcijo kumulativne preme<br />

utežitve bomo opisali tudi v (3.9.14). Spet pa bomo na tem mestu s kumulativno premo<br />

utežitvijo izpeljali ceno napake za vsote neodvisnih slučajnih spremenljivk. U<strong>po</strong>rabili<br />

bomo različico trditve 3.2.2.<br />

Trditev 3.6.4. Naj bodo X 1 ,...X n neodvisne nenegativne slučajne spremenljivke z vsoto<br />

W ter naj boE X 2 0 (t. j. da X i niso skoraj <strong>po</strong>vsod enake nič). Nadalje naj bodo X ∗ i<br />

kumulativne preme uteženke slučajnih spemenljivk X i , neodvisne od (X 1 ,...X n ), I pa naj bo<br />

slučajni indeks, neodvisen od vsega skupaj in <strong>po</strong>razdeljen <strong>po</strong>{1,...n} sorazmerno sσ 2 , t. j.<br />

i<br />

P(I=i)=σ 2 i /σ2 . Tedaj je slučajna spremenljivka:<br />

kumulativna prema uteženka slučajne spremenljivke W.<br />

W ∗ := W− X I + X ∗ I<br />

(3.6.10)<br />

DOKAZ. Naj bo f Lipschitzeva funkcija. Označimo še W i := W− X i . Tedaj zaradi<br />

neodvisnosti velja:<br />

E f (W)W=<br />

n∑<br />

E f (W i + X i )X i =<br />

i=1<br />

n∑<br />

σ 2 i E f′ (W i + X ∗ i )=σ2 E f ′ (W I + X ∗ I ) (3.6.11)<br />

i=1<br />

torej je W ∗ = W I + X ∗ I<br />

res prema uteženka.<br />

O<strong>po</strong>mba. Podobno kot pri trditvi 3.2.2 smo tudi tu <strong>po</strong>trebovali le neodvisnost<br />

<strong>po</strong>sameznih slučajnih spremenljivk X ∗ od (X<br />

i 1 ,...X n ).


3. STEINOVA METODA IN ODVISNOST 99<br />

Naj bodo torej X i , W,σ i ,σ, X ∗ i , I in W∗ tako kot v trditvi 3.2.2. Privzemimo še, da je<br />

σ=1. Tedaj velja:<br />

E|W ∗ − W|=<br />

n∑<br />

σ 2 i E|X∗ i − X i|≤<br />

i=1<br />

n∑<br />

i=1<br />

σ 2 i<br />

(<br />

E|X<br />

∗<br />

i |+E|X i| ) (3.6.12)<br />

Če v formulo (3.6.1) vstavimo f (x) := x|x|, dobimo, da jeσ 2 i E|X∗ i |=E|X i| 3 /2. Poleg tega<br />

iz Jensenove neenakosti sledi, da jeσ 2 E|X i |≤E|X i | 3 . Dobili smo torej:<br />

E|W ∗ − W|≤ 3 2<br />

n∑<br />

E|X i | 3 (3.6.13)<br />

i=1<br />

torej nam izrek 3.6.3 da:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣ ∣≤3 M1 ( f )<br />

n∑<br />

E|X i | 3 (3.6.14)<br />

kar je isto kot v (1.4.20). Kumulativna prema utežitev je torej prva konstrukcija, ki nam<br />

je za vsote neodvisnih slučajnih spremenljivk dala isto oceno kot ne<strong>po</strong>sredna izpeljava.<br />

i=1<br />

3.7 Konstrukcija kumulativnih premih uteženk<br />

Sklapljanje s kumulativno premo utežitvijo se da konstruirati s <strong>po</strong>močjo sklapljanja<br />

z izmenljivim parom iz razdelka 3.1. Ta konstrukcija je opisana v Goldsteinovem članku<br />

[61] in je različica konstrukcije iz starejšega članka [62], katerega avtorja sta Goldstein<br />

in Reinert. Ideja pravzaprav izhaja iz začetka izpeljave (3.6.2), s <strong>po</strong>močjo katere smo<br />

<strong>po</strong>kazali obstoj kumulativnih premih utežitev. Začnemo tako kot pri izpeljavi (3.6.2),<br />

le da vse skupaj pišemo bolj v duhu slučajnih spremenljivk. Naj bo f Lipschitzeva<br />

funkcija, W slučajna spremenljivka zE W= 0 in var(W)=1,θpa naj bo kot <strong>po</strong>navadi<br />

<strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega. Tedaj velja:<br />

E f (W)W=E ( f (W)− f (0) ) W=E f ′ (θW)W 2 (3.7.1)<br />

Naj bo zdaj W † prema uteženka slučajne spremenljivke W glede na W 2 . Tedaj velja:<br />

E f (W)W=E f ′ (θW † )EW 2 =E f ′ (θW † ) (3.7.2)<br />

torej jeθW † kumulativna prema uteženka slučajne spremenljivke W.<br />

Tipično je težko konstruirati slučajno spremenljivko W † , ki bi bila blizu W, saj W 2<br />

nosi peveč informacije. Zato je smiselno iskati <strong>po</strong>splošitve, ki bi zahtevale sklapljanja<br />

s premimi utežitvami glede na slučajne spremenljivke, ki nosijo malo informacije.<br />

Tu bomo <strong>po</strong>kazali, da se to da narediti z utežitvijo glede na slučajno spremenljivko<br />

(W ′ − W) 2 , kjer je W ′ v grobem tako kot v razdelku (3.1.1).


100 3.8 OCENE, DOBLJENE NEPOSREDNO IZ DVOJNIH SKLAPLJANJ<br />

Trditev 3.7.1. Naj bosta W in W ′ izmenljivi slučajni spremenljivki, za kateri za nekiλ>0<br />

velja zveza:<br />

E(W ′ | W)=(1−λ)W (3.7.3)<br />

Če jeE W= 0 in (W † , W ‡ ) prema uteženka slučajnega vektorja (W, W ′ ) glede na (W ′ − W) 2 ,θ<br />

pa enakomerno <strong>po</strong>razdeljena <strong>po</strong> [0, 1] in neodvisna od vsega ostalega, je slučajna spremenljivka:<br />

kumulativna prema uteženka slučajne spremenljivke W.<br />

(1−θ)W † +θW ‡ (3.7.4)<br />

O<strong>po</strong>mba. Zahteva (3.7.3) je strožja od zahteve (3.1.1), ki dopušča še dodaten člen<br />

R. Če bi namesto (3.7.3) vzeli (3.1.1), bi konstruirali le “približno” kumulativno premo<br />

uteženko, tako da bi za oceno napake pri normalni aproksimaciji morali ustrezno<br />

prilagoditi tudi izrek 3.6.3. Pač pa bomo v nadaljevanju <strong>po</strong>kazali, da se da napaka<br />

pri normalni aproksimaciji oceniti tudi ne<strong>po</strong>sredno, brez konstrukcije uteženk; taka<br />

ne<strong>po</strong>sredna pa bi se dala lažje prilagoditi, tako da bi u<strong>po</strong>števala še dodatni člen R.<br />

DOKAZTRDITVE 3.7.1. Iz zveze (3.1.6) in Taylorjevega razvoja okoli W sledi, da za<br />

<strong>po</strong>ljubno Lipschitzevo funkcijo f velja:<br />

E f (W)W= 1<br />

2λ E( f (W ′ )− f (W) ) (W ′ − W)=<br />

= 1<br />

2λ E f′( (1−θ)W+θW ′) (W ′ − W) 2 =<br />

(3.7.5)<br />

= 1<br />

2λ E f′( (1−θ)W † +θW ‡) E(W ′ − W) 2<br />

Če vstavimo f (w)=w, dobimo, da jeE(W ′ − W) 2 /(2λ)=E W 2 in trditev je dokazana.<br />

Ocenjevanje napake pri normalni aproksimaciji bi torej lahko <strong>po</strong>tekalo takole: najprej<br />

konstruiramo ustrezno izmenljivo slučajno spremenljivko W ′ , nato pa ustrezno<br />

relativno premo uteženko, ki bi jo tako kot v razdelku 3.3 konstruirali s <strong>po</strong>močjo sklapljanj<br />

s <strong>po</strong>gojnimi <strong>po</strong>razdelitvami. Nato bi vse skupaj vstavili v izrek 3.6.3. Vendar<br />

pa bomo v naslednjem razdelku <strong>po</strong>kazali, da se da napaka pri normalni aproksimaciji<br />

oceniti tudi ne<strong>po</strong>sredno, brez konstrukcije uteženk, <strong>po</strong>dobno kot smo to storili tudi v<br />

razdelku 3.4.<br />

3.8 Ocene, dobljene ne<strong>po</strong>sredno iz dvojnih sklapljanj<br />

V razdelku 3.4 smo konstrukcijo premih uteženk modificirali tako, da smo namesto<br />

premih uteženk sumandov vzeli kar njihove neodvisne kopije. Tudi konstrukcija<br />

kumulativnih premih uteženk iz prejšnjega razdelka je vključevala preme utežitve. Če<br />

namesto ustreznih premih uteženk spet vzamemo neodvisne kopije, dobimo naslednji<br />

rezultat.


3. STEINOVA METODA IN ODVISNOST 101<br />

Izrek 3.8.1. Naj bosta W in W ′ izmenljivi slučajni spremenljivki zEW= 0 in var(W)=1,<br />

za kateri za nekiλ>0 veljaE(W ′ | W)=(1−λ)W. Označimo V := W ′ − W in naj bo<br />

ˆV slučajna spremenljivka, <strong>po</strong>razdeljena enako kot V in neodvisna od (W, W ′ ). Nadalje naj<br />

bo še Ŵ taka slučajna spremenljivka, da se <strong>po</strong>razdelitev slučajnega vektorja ( ˆV, Ŵ) ujema s<br />

<strong>po</strong>razdelitvijo slučajnega vektorja (V, W). Tedaj za <strong>po</strong>ljubno Lipschitzevo funkcijo f velja ocena:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣ ∣≤<br />

M 1 ( f )<br />

2λ E ˆV 2( |Ŵ− W|+|Ŵ+ ˆV− W| ) (3.8.1)<br />

Če pa so W, W ′ , V, ˆV in Ŵ slučajni vektorji z vrednostmi vR d in z istimi lastnostmi, le da<br />

namesto var(W)=1 privzamemo Var(W)=I, za <strong>po</strong>ljubno funkcijo f∈♭ (2) (R d ) velja:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ √ 2π M 2 ( f ) ∣≤<br />

16 λ E| ˆV| 2( |Ŵ− W|+|Ŵ+ ˆV− W| ) (3.8.2)<br />

DOKAZ. Naj bo g katera od rešitev Steinove enačbe:<br />

iz izreka 2.6.1. Podobno kot v (3.7.5) izpeljemo:<br />

∆g(w)= g ′ (w)w= f (w)−N(0, I){ f} (3.8.3)<br />

E g ′ (W)W= 1<br />

2λ E( g ′ (W ′ )− g ′ (W) ) V=<br />

= 1<br />

2λ E g′′( (1−θ)W+θW ′) V 2 =<br />

(3.8.4)<br />

= 1<br />

2λ E g′′( (1−θ)Ŵ+θŴ ′) ˆV 2<br />

kjer je Ŵ ′ := Ŵ+ ˆV,θpa <strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega<br />

ostalega. Nadalje je:<br />

torej je:<br />

Sledi:<br />

E V 2 =E(W 2 − 2WW ′ + W ′2 )=E W 2 − 2(1−λ)EW 2 +E W 2 = 2λI (3.8.5)<br />

E∆g(W)=E g ′′ (W)I= 1<br />

2λ E g′′ (W)EV 2 = 1<br />

2λ E g′′ (W) ˆV 2 (3.8.6)<br />

∣<br />

∣E [ ∆g(W)− g ′ (W)W ] ∣ ∣∣∣<br />

= 1<br />

∣<br />

∣E [ g ′′ (W)− g ′′( (1−θ)Ŵ+θŴ ′)] ∣ ∣∣∣<br />

V 2 ≤<br />

2λ<br />

≤ M 3(g)<br />

2λ E[ (1−θ)|Ŵ− W|+θ|Ŵ ′ − W| ] |V| 2 ≤ (3.8.7)<br />

≤ M 3(g)<br />

4λ E[ |Ŵ− W|+|Ŵ ′ − W| ] |V| 2<br />

Ker v enorazsežnem primeru <strong>po</strong> točki (3) leme 1.4.1 velja M 3 (g)≤2 M 1 ( f ), v večrazsežnem<br />

primeru pa <strong>po</strong> točki (3) leme 2.6.2 velja M 3 (g)≤( √ 2π/4) M 2 ( f ), od tod že sledita<br />

oceni (3.8.1) in (3.8.2).


102 3.8 OCENE, DOBLJENE NEPOSREDNO IZ DVOJNIH SKLAPLJANJ<br />

ZGLED 3.8.1. Neodvisne slučajne spremenljivke. Spet naj bo W=X 1 +···+X n vsota<br />

neodvisnih slučajnih spremenljivk zE X i = 0 in var(W)=1 (zaradi enostavnosti se<br />

omejimo na enorazsežni primer). Tako kot v zgledu 3.1.1 <strong>po</strong>stavimo W ′ := W− X I + X ′ I ,<br />

kjer je I slučajni indeks, enakomerno <strong>po</strong>razdeljen <strong>po</strong>{1,...n}, X ′ pa neodvisna kopija<br />

i<br />

slučajne spremenljivke X i . Očitno sta W in W ′ izmenljivi, v zgledu 3.1.1 pa smo še<br />

izračunali, da veljaE(W ′ | W)=(1−1/n)W.<br />

Naj bosta zdaj še ˆX i in ˆX ′ nadaljnji neodvisni kopiji slučajnih spremenljivke X<br />

i i , ki<br />

naj bosta neodvisni tudi druga od druge in od celega vektorja (X 1 ,...X n , X ′ 1 ,...X′ n).<br />

Tedaj je ˆV := ˆX ′ I − ˆX I neodvisna kopija slučajne spremenljivke V=X ′ I − X I. Ni težko<br />

preveriti, da slučajna spremenljivka Ŵ := W− X I + ˆX i zadošča <strong>po</strong>gojem izreka. Z<br />

u<strong>po</strong>rabo neodvisnosti in Jensenove neenakosti ocenimo:<br />

E ˆV 2 |Ŵ− W|=E( ˆX ′ I − ˆX I ) 2 | ˆX I − X I |≤<br />

≤E ( ( ˆX ′ I )2 − 2E ˆX ′ I ˆX I + ˆX 2 I)(<br />

| ˆX I |+|X I | ) =<br />

=E ( ( ˆX ′ I )2 − 2E ˆX ′ ˆX I I + ˆX I) 2 | ˆX I |+E ( ( ˆX ′ I )2 + ˆX I) 2 |XI |≤<br />

(3.8.8)<br />

≤ 6E|X I | 3 =<br />

= 6 n∑<br />

E|X i | 3<br />

n<br />

i=1<br />

Podobno tudi za slučajno spremenljivko Ŵ+ ˆV= W− X I + ˆX ′ I<br />

velja ocena:<br />

Iz izreka 3.8.1 zdaj dobimo:<br />

E ˆV 2 |Ŵ+ ˆV− W|≤ 6 n<br />

n∑<br />

E|X i | 3 (3.8.9)<br />

i=1<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ n∑<br />

∣≤3 E|X i | 3 (3.8.10)<br />

kar je isto kot v oceni (3.6.14), ki smo jo dobili z u<strong>po</strong>rabo kumulativnih premih utežitev.<br />

□<br />

ZGLED 3.8.2. Slučajne permutacije. Naj bo spet a(i, j), 1 ≤ i, j ≤ N, kvadratna<br />

matrika realnih števil,πpa naj bo enakomerno <strong>po</strong>razdeljena slučajna permutacija.<br />

Obravnavamo normalno aproksimacijo slučajne spremenljivke:<br />

W := w(π), w(ρ) :=<br />

i=1<br />

N∑<br />

a(i,ρ(i)) (3.8.11)<br />

V zgledu 3.1.2 smo že izračunali matematično upanje in varianco slučajne spremenljivke<br />

W. Seveda bomo privzeli, da jeE W=0 in var(W)=1, drugih stvari pa ne bomo<br />

privzemali.<br />

Tako kot v zgledu 3.1.2 definirajmo:<br />

i=1<br />

W ′ := w(π◦τ I,K ) (3.8.12)


3. STEINOVA METODA IN ODVISNOST 103<br />

kjer jeτtrans<strong>po</strong>zicija, (I, K) pa je par slučajnih indeksov, neodvisen odπin enakomerno<br />

<strong>po</strong>razdeljen <strong>po</strong> vseh parih (i, k), za katere je ik. V zgledu 3.1.2 smo že izračunali, da<br />

je:<br />

(<br />

1− 2<br />

E(W ′ | W)=<br />

N− 1<br />

Konstruirajmo neodvisno kopijo slučajne spremenljivke:<br />

)<br />

W (3.8.13)<br />

V := W ′ − W=−a(I,π(I))−a(K,π(K))+a(I,π(K))+a(K,π(I)) (3.8.14)<br />

na naslednji način: naj bosta (Î, ˆK) in (Ĵ, ˆL) neodvisni kopiji slučajnega vektorja (I, K),<br />

neodvisni tako med seboj kot tudi odπ. Tedaj je:<br />

ˆV :=−a(Î, Ĵ)−a( ˆK, ˆL)+a(Î, ˆL)+a( ˆK, Ĵ) (3.8.15)<br />

zagotovo neodvisna kopija slučajne spremenljivke V.<br />

Potrebujemo še slučajno spremenljivko Ŵ, za katero velja, da je par ( ˆV, Ŵ) enako<br />

<strong>po</strong>razdeljen kot (V, W). To bo zagotovo veljalo, če se bo <strong>po</strong>gojna <strong>po</strong>razdelitev slučajnega<br />

vektorja Ŵ pri Î=i, Ĵ= j, ˆK=k in ˆL=l ujemala s <strong>po</strong>gojno <strong>po</strong>razdelitvijo slučajne spremenljivke<br />

W pri I=i,π(i)= j, K=kinπ(k)=l. Podobno kot permutacijeπ i→j v (3.3.3)<br />

bomo tu konstruirali slučajne permutacijeπ i→j,k→l , ki se bodo le malo razlikovale odπ,<br />

njihova <strong>po</strong>razdelitev pa se bo ujemala s <strong>po</strong>gojno <strong>po</strong>razdelitvijo slučajne permutacijeπ<br />

glede na dogodekπ(i)= j,π(k)=l. Tedaj bo slučajna spremenljivka:<br />

Ŵ :=<br />

N∑<br />

i=1<br />

a(i,πÎ→Ĵ, ˆK→ˆL (i)) (3.8.16)<br />

zagotovo iz<strong>po</strong>lnjevala zahtevani <strong>po</strong>goj.<br />

Naj bo torej ik, jl. Konstruirajmo slučajno permutacijoρ :=π i→j,k→l . Ločimo<br />

več možnosti:<br />

1.{j, l}={π(i),π(k)}. V tem primeru naj boρ(i)= j,ρ(k)=l, drugje pa naj seρujema<br />

sπ.<br />

2.π(i)= j,π(k)l. V tem primeru vzamemoρ :=π k→l =τ π(k),l ◦π.<br />

3.π(k)=l,π(i) j. V tem primeru vzamemoρ :=π i→j =τ π(i),j ◦π.<br />

4.π(i)=l,π(k) j. V tem primeru vzamemoρ(i) := j,ρ(k) := l,ρ(π −1 (j)) :=π(k),<br />

drugje pa naj seρujema sπ.<br />

5.π(k)= j,π(i)l. V tem primeru vzamemoρ(i) := j,ρ(k) := l,ρ(π −1 (l)) :=π(i),<br />

drugje pa naj seρujema sπ.<br />

6. ik, jl,{j, l}∩{π(i),π(k)}=∅. V tem primeru pa vzamemoρ(i) := j,ρ(k)=l,<br />

ρ(π −1 (j)) :=π(i),ρ(π −1 (l)) :=π(k), drugje pa naj seρujema sπ.<br />

Recimo, da jeπ(i)=q inπ(k)=s. Tedaj se da preveriti, da je (π i→j,k→l ) i→q,k→s =π.<br />

Naša transformacija torej vse permutacije, za katere jeπ(i)=q inπ(k)=s, bijektivno<br />

preslika v permutacije, za katere jeπ(i) = j inπ(k) = l. To pa <strong>po</strong>meni, da se, če<br />

jeπ<strong>po</strong>razdeljena enakomerno, <strong>po</strong>razdelitev slučajne permutacijeπ i→j,k→l res ujema s<br />

<strong>po</strong>gojno <strong>po</strong>razdelitvijo slučajne permutacijeπglede naπ(i)= j,π(k)=l.


104 3.8 OCENE, DOBLJENE NEPOSREDNO IZ DVOJNIH SKLAPLJANJ<br />

O<strong>po</strong>mba. Na <strong>po</strong>dobnih konstrukcijah temeljijo mnogi rezultati, ki obravnavajo<br />

slučajne permutacije v <strong>po</strong>vezavi s Steinovo metodo (glej Bolthausen [34], Schneller<br />

[116], [117], Barbour [9] ter Bolthausen in Götze [35]).<br />

Ne glede na to, katera od zgornjih možnosti pride v <strong>po</strong>štev, seπÎ→Ĵ, ˆK→ˆL razlikuje od<br />

π kvečjemu v točkah Î, ˆK,π −1 (Ĵ) inπ −1 (ˆL). Sledi:<br />

Ŵ− W=−a(Î,π(Î))−a( ˆK,π( ˆK))−a(π −1 (Ĵ), Ĵ)−a(π −1 (ˆL), ˆL)+<br />

+ a(Î, Ĵ)+a( ˆK, ˆL)+a(π −1 (Ĵ),πÎ→Ĵ, ˆK→ˆL (π−1 (Ĵ)))+<br />

+ a(π −1 (ˆL),πÎ→Ĵ, ˆK→ˆL (π−1 (ˆL)))<br />

(3.8.17)<br />

iz (3.8.14) pa še:<br />

Ŵ+ ˆV− W=−a(Î,π(Î))−a( ˆK,π( ˆK))−a(π −1 (Ĵ), Ĵ)−a(π −1 (ˆL), ˆL)+<br />

+ a(Î, ˆL)+a( ˆK, Ĵ)+a(π −1 (Ĵ),πÎ→Ĵ, ˆK→ˆL (π−1 (Ĵ)))+<br />

+ a(π −1 (ˆL),πÎ→Ĵ, ˆK→ˆL (π−1 (ˆL)))<br />

(3.8.18)<br />

Ocena (3.8.1) nam torej da:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ (N− 1) M 1 ( f ) ∣≤ E (∣ ∣ ∣ ∣a(Î, ∣<br />

Ĵ) ∣+<br />

∣∣a( ˆK, ˆL) ∣ ∣<br />

∣+<br />

∣∣a(Î, ˆL) ∣ ∣<br />

∣+<br />

∣∣a( ˆK, Ĵ) ∣ ) 2× ∣<br />

4<br />

× (∣ ∣ ∣ ∣2a(Î,π(Î)) ∣<br />

∣+2<br />

∣∣a( ˆK,π( ˆK)) ∣ ∣<br />

∣+2<br />

∣∣a(π −1 (Ĵ), Ĵ) ∣ ∣<br />

∣+2<br />

∣∣a(π −1 (ˆL), ˆL) ∣ ∣+<br />

+ ∣ ∣ ∣a(Î, Ĵ) ∣ ∣ ∣+<br />

∣ ∣∣a( ˆK, ˆL) ∣ ∣ ∣+<br />

∣ ∣∣a(Î, ˆL) ∣ ∣ ∣+<br />

∣ ∣∣a( ˆK, Ĵ) ∣ ∣ ∣+<br />

+ 2 ∣ ∣ ∣a(π −1 (Ĵ),πÎ→Ĵ, ˆK→ˆL (π−1 (Ĵ))) ∣ ∣ ∣+<br />

+ 2 ∣ ∣ ∣a(π −1 (ˆL),πÎ→Ĵ, ˆK→ˆL (π−1 (ˆL))) ∣ ∣ ∣<br />

)<br />

(3.8.19)<br />

Izraz na desni zmnožimo in dobimo vsoto samih produktov oblike cXYZ, kjer je c<br />

konstanta, X, Y in Z pa so slučajne spremenljivke oblike|a(R, S)|, kjer sta R in S primerna<br />

slučajna indeksa. Če ocenimo XYZ≤ 1 3 (X3 + Y 3 + Y 3 ), dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ (N− 1) M 1 ( f ) ∣≤ E [ 36 ∣ ∣ ∣a(Î, 3<br />

∣<br />

Ĵ) ∣<br />

∣∣a(<br />

+ 36 ˆK, ˆL) ∣ 3<br />

∣ +<br />

3<br />

+ 36 ∣ ∣ ∣a(Î, ˆL) ∣ ∣ ∣<br />

3<br />

+ 36<br />

∣ ∣∣a( ˆK, Ĵ) ∣ ∣ ∣<br />

3<br />

+<br />

+ 8 ∣ ∣ ∣a(Î,π(Î)) 3<br />

∣<br />

∣<br />

∣∣a(<br />

+ 8 ˆK,π( ˆK)) ∣ 3<br />

∣ +<br />

+ 8 ∣ ∣a(π −1 (Ĵ), Ĵ) ∣ 3<br />

∣<br />

∣<br />

∣∣a(π<br />

+ 8 −1 (ˆL), ˆL) ∣ (3.8.20)<br />

3<br />

∣ +<br />

+ 8 ∣ ∣a(π −1 (Ĵ),πÎ→Ĵ, ˆK→ˆL (π−1 (Ĵ))) ∣ 3<br />

∣ +<br />

+ 8 ∣ ∣a(π −1 (ˆL),πÎ→Ĵ, ˆK→ˆL (π−1 (ˆL))) ∣ 3 ] ∣<br />

Desna stran se zdaj izraža s slučajnimi spremenljivkami oblike|a(R, S)| 3 , kjer sta R in S<br />

spet primerna slučajna indeksa. Zaradi simetrije mora za vse pare (R, S), ki pridejo v


3. STEINOVA METODA IN ODVISNOST 105<br />

<strong>po</strong>štev, veljatiE|a(R, S)| 3 = N −2∑ N<br />

i=1∑ N<br />

j=1|a(i, j)| 3 . Tako končno dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣ ∣≤<br />

64<br />

N M 1( f )<br />

N∑<br />

i=1<br />

N∑<br />

|a(i, j)| 3 (3.8.21)<br />

j=1<br />

To je prva ocena za slučajne permutacije, ki ne vsebuje četrtih momentov. Tudi ocenjevanje<br />

samo je bilo enostavnejše kot prej. Sklapljanje z izmenljivim parom v kombinaciji<br />

s sklapljanji s <strong>po</strong>gojnimi <strong>po</strong>razdelitvami se je torej izkazalo za obetaven način ocenjevanja<br />

napake pri normalni aproksimaciji vsot odvisnih slučajnih spremenljivk. V<br />

naslednjem razdelku pa bomo razvili še enostavnejši pristop, ki prav tako ne zahteva<br />

četrtih momentov.<br />

□<br />

3.9 Razčlenitve drugega reda<br />

V razdelku 3.2 smo predstavili premo utežitev. Sklapljanja s premimi uteženkami<br />

smo v razdelku 3.4 prevedli na sklapljanja s <strong>po</strong>gojnimi <strong>po</strong>razdelitvami, nato pa smo<br />

v razdelku 3.5 dognali, da se le-ta navadno dajo nadomestiti z enostavnejšimi razčlenitvami.<br />

Podobno smo v razdelku 3.6 predstavili kumulativno premo utežitev, v<br />

prejšnjem razdelku pa smo sklapljanja s kumulativnimi premimi uteženkami konstruirali<br />

s kombinacijo sklapljanj z izmenljivim parom in s <strong>po</strong>gojnimi <strong>po</strong>razdelitvami. A<br />

tudi ta koncept se da navadno nadomestiti z razčlenitvami, le da bo <strong>po</strong>trebno iti še<br />

korak dlje: <strong>po</strong>trebovali bomo razčlenitve drugega reda.<br />

Naj boIindeksna množica in W= ∑ i∈I X i . Tako kot pri razčlenitvah prvega reda<br />

naj bo za vsak i∈I dana razčlenitev W= W i +R i , kjer je R i neodvisna od X i . Nadalje naj<br />

bo še R i = ∑ j∈J i<br />

in za vsak j∈J i naj bo dana še razčlenitev drugega reda W i = W ij + R ij ,<br />

kjer je W ij neodvisna od para (X i , X ij ).<br />

Tovrstne razčlenitve so definirane v članku Barbourja, Karońskega in Rucińskega<br />

[17] in so <strong>po</strong> avtorjevem mnenju najobetavnejši koncept odvisnosti v <strong>po</strong>vezavi z normalno<br />

aproksimacijo <strong>po</strong> <strong>Steinovi</strong> <strong>metodi</strong>. Njihova konstrukcija je običajno preprosta<br />

in kot bomo videli, ocena napake ne zahteva četrtih momentov, ki ne le da ne obstajajo<br />

vedno, temveč se običajno tudi ocena člena s četrtimi momenti izkaže za precej<br />

zahtevno.<br />

Tu bomo obravnavali še nekoliko modificirane razčlenitve Barnourja, Karońskega<br />

in Rucińskega, in sicer bomo privzeli še, da obstaja dodatna razčlenitev W= ˜W ij + ˜R ij ,<br />

kjer je ˜W ij enako <strong>po</strong>razdeljena kot W ij . Seveda lahko vedno <strong>po</strong>stavimo kar ˜W ij := W ij ,<br />

toda včasih nam kakšna druga izbira da boljšo konstanto. Tako lahko npr. v primeru,<br />

ko je slučajna spremenljivka W ij enako <strong>po</strong>razdeljena kot W, <strong>po</strong>stavimo ˜W ij := W.<br />

Naslednji izrek je ustrezna modifikacija rezultata Barbourja, Karońskega in Rucińskega<br />

[17] skupaj z večrazsežno različico.<br />

Izrek 3.9.1. Naj bodo W, X i , R i , X ij , R ij in ˜R ij kot zgoraj. Privzemimo še, daE X i = 0 in<br />

var(W)=1. Nadalje naj velja:<br />

∑ ∑ ∑<br />

E|X i |


106 3.9 RAZČLENITVE DRUGEGA REDA<br />

Tedaj za vsako Lipschitzevo funkcijo f velja:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∑<br />

∣≤M1 ( f )<br />

i∈I<br />

∑<br />

j∈J i<br />

E|X i X ij | ( |R ij |+|R i + R ij |+2E|˜R ij | ) (3.9.2)<br />

Če pa so W, X i , R i , X ij in R ij slučajni vektorji z vrednostmi vR d , ki ustrezajo istim pred<strong>po</strong>stavkam<br />

kot ustrezne slučajne spremenljivke zgoraj (namesto var(W)=1 privzamemo Var(W)=I),<br />

za vsako funkcijo f∈♭ (2) (R d ) velja ocena:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ √ 2π<br />

∑<br />

∣≤<br />

8 M 2( f )<br />

i∈I<br />

∑<br />

j∈J i<br />

E|X i X ij | ( |R ij |+|R i + R ij |+2E|˜R ij | ) (3.9.3)<br />

Zahteva (3.9.1) je <strong>po</strong>trebna, ker tokrat nismo privzeli, da je indeksna množicaI<br />

končna. Za primer, ko jeIneskončna, bomo namreč <strong>po</strong>trebovali naslednji tehnični<br />

rezultat, ki ga bomo dokazali na koncu razdelka.<br />

Lema 3.9.2. Naj bodo W, X i in R i tako kot zgoraj in naj velja še (3.9.1). Tedaj v L 1 velja:<br />

∑<br />

W 2 = X i W (3.9.4)<br />

i∈I<br />

O<strong>po</strong>mba. Vrste na Banachovih prostorih, indeksirane <strong>po</strong> <strong>po</strong>ljubni množici, interpretiramo<br />

tako, da konvergirajo, če konvergirajo absolutno. V primeru, ki je indeksna<br />

množica neštevna, sme biti torej kvečjemu števno mnogo členov različnih od nič.<br />

DOKAZIZREKA 3.9.1. Dokaz bomo najprej napisali za primer, ko je indeksna množica<br />

končna, na koncu pa <strong>po</strong>gledali še, na kaj moramo biti <strong>po</strong>zorni, če jeIneskončna.<br />

Začnemo tako kot pri dokazu izrekov 3.4.1 in 3.5.1. Naj bo g katera od rešitev<br />

Steinove enačbe:<br />

∆g(w)− g ′ (w)w= f (w)−N(0, I){ f} (3.9.5)<br />

iz izreka 2.6.1. Pišimo:<br />

E [ ∆g(W)− g ′ (W)W ] ∑<br />

= E [ ]<br />

g ′′ (W)EX i W−g ′ (W)X i<br />

i∈I<br />

(3.9.6)<br />

Zaradi neodvisnosti jeE X i W i = 0, torej jeE X i W = E X i R i . Poleg tega je tudi<br />

E g ′ (W i )X i = 0, zato velja:<br />

E g ′ (W)X i =E ( g ′ (W)− g ′ (W i ) ) X i =E g ′′ (W i +θR i )X i R i (3.9.7)<br />

kjer jeθkot <strong>po</strong>navadi <strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega osta-


3. STEINOVA METODA IN ODVISNOST 107<br />

lega. Sledi:<br />

E [ ∆g(W)− g ′ (W)W ] ∑<br />

= E [ ]<br />

g ′′ (W)EX i R i − g ′ (W)X i =<br />

i∈I<br />

∑∑<br />

= E [ ]<br />

g ′′ (W)EX i X ij − g ′′ (W i +θR i )X i X ij =<br />

i∈I j∈J<br />

∑∑<br />

i<br />

= E ( g ′′ (W)− g ′′ ( ˜W ij ) ) E X i X ij −<br />

i∈I j∈J i<br />

∑∑<br />

− E ( g ′′ (W i +θR i )− g ′′ (W ij ) ) (3.9.8)<br />

X i X ij =<br />

i∈I j∈J<br />

∑∑<br />

i<br />

= E g ′′′ ( ˜W ij +η ˜R ij )(E X i X ij ) ˜R ij −<br />

i∈I j∈J i<br />

∑∑<br />

− E g ′′′ (W ij +ηR ij +ηθR i )X i X ij (R ij +θR i ) ]<br />

j∈J i<br />

i∈I<br />

kjer jeηspet <strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega (spet<br />

smo u<strong>po</strong>števali neodvisnost). Iz zgornje verige enakosti in še ocene|EX i X ij | ∧ ≤<br />

E|X i X ij | ∧ =E|X i ||X ij |, kjer je|·| ∧ projektivna norma (glej razdelek D.8), dobimo:<br />

∣<br />

∣E [ ∆g(W)− g ′ (W)W ] ∣ ∣∣∣ ∑∑<br />

≤ M 3 (g) E|X i ||X ij |(|R ij +θR i |+E|˜R ij |) (3.9.9)<br />

j∈J i<br />

Naj boH ij σ-algebra, generirana z X i , X ij , R i in R ij . Ocenimo:<br />

E ( |R ij +θR i | ∣ ) (<br />

∣Hij =E |(1−θ)Rij +θ(R i + R ij )| ∣ )<br />

∣Hij ≤<br />

i∈I<br />

≤E ( (1−θ)|R ij |+θ|R i + R ij | ∣ ∣ ∣Hij<br />

)<br />

=<br />

= 1 2 E( |R ij |+|R i + R ij | ∣ ∣ ∣Hij<br />

)<br />

(3.9.10)<br />

Preostanek izpeljave ocen (3.9.2) in (3.9.3) je enak kot pri dokazu izreka 3.4.1.<br />

Izrek smo za zdaj dokazali za primer, ko je indeksna množicaIkončna. V primeru,<br />

ko je neskončna, ni izpeljava čisto nič drugačna, dodatno je treba preveriti le enakost<br />

(3.9.6). Brez škode za splošnost lahko privzamemo, da je desna stran v oceni (3.9.2) oz.<br />

(3.9.3) končna. Iz leme 3.9.2 sledi, da je ∑ i∈IE X i W=E W 2 = var(W)=I (fundamentalni<br />

kovariantni tenzor smo tokrat izjemoma označili z I, ker je oznakaIže zasedena<br />

z indeksno množico). Po lemi 2.6.2 je M 2 (g)


108 3.9 RAZČLENITVE DRUGEGA REDA<br />

Recimo, da je X i X ij ≥ 0. Naj bo Y ∗ prema uteženka slučajne spremenljivke X ij iX ij , R ∗ pa ij<br />

slučajna spremenljivka, katere <strong>po</strong>gojna <strong>po</strong>razdelitev glede na Y ∗ = y, W= w se ujema<br />

ij<br />

s <strong>po</strong>gojno <strong>po</strong>razdelitvijo slučajne spremenljivke R ij +θR i glede na X i X ij = y, W ij = w.<br />

Tedaj za vsako omejeno in merljivo funkcijo F velja zveza:<br />

torej velja tudi:<br />

E F(R ∗ ij , W, Y∗ ij )E X iX ij =E F(R ij +θR i , W ij , X i X ij )X i X ij (3.9.12)<br />

E f ′ (W ij + R ij +θR i )X i X ij =E f ′ (W+ R ∗ ij )E X iX ij (3.9.13)<br />

Naj bo (I, J) par slučajnih indeksov, <strong>po</strong>razdeljen pro<strong>po</strong>rcionalno zE X i X ij in neodvisen<br />

od vsega ostalega (ker je ∑ ∑<br />

i∈I j∈J i<br />

E X i X ij = var(W)=1, to <strong>po</strong>meni, da je v resnici kar<br />

P(I=i, J= j)=E X i X ij ). Tedaj lahko zvezo (3.9.11) zapišemo tudi v obliki:<br />

E f (W)W=E f ′ (W+ R ∗ IJ ) (3.9.14)<br />

torej je slučajna spremenljivka W ∗ := W+ R ∗ IJ<br />

kumulativna prema uteženka slučajne<br />

spremenljivke W, ki v primeru, ko so X i , X ij in R ij majhne, ni daleč od W.<br />

Oglejmo si sedaj, kako razčlenitve drugega reda delujejo na naših standardnih<br />

zgledih.<br />

ZGLED 3.9.1. Neodvisne slučajne spremenljivke. Vzemimo vsoto neodvisnih slučajnih<br />

spremenljivk W= ∑ i∈I X i , za katere velja ∑ i∈IE|X i |


3. STEINOVA METODA IN ODVISNOST 109<br />

Po Jensenovi neenakosti lahko spet ocenimoE|X i ||X j ||X k |≤ 1(E|X 3 i| 3 +E|X j | 3 +E|X k | 3 ).<br />

Če namesto slučajne spremenljivke X k vzamemo njeno neodvisno kopijo, dobimo še<br />

E|X i ||X j |E|X k |≤ 1(E|X 3 i| 3 +E|X j | 3 +E|X k | 3 ). Tako dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣≤<br />

≤ M 1( f )<br />

3<br />

[∑<br />

E|X i | 3( 3 ∣ ∣<br />

∣{(j,<br />

∣∣+<br />

∣ ∣∣{(j,<br />

∣ ∣∣<br />

)<br />

k) ; j∼i, k∼{i, j}} k) ; j∼i, k∼ j, ki}} +<br />

i∈I<br />

∑<br />

+ E|X j | 3( 3 ∣ ∣<br />

∣{(i,<br />

∣∣+<br />

∣ ∣∣{(i,<br />

∣ ∣∣<br />

)<br />

k) ; j∼i, k∼{i, j}} k) ; j∼i, k∼ j, ki}} +<br />

j∈I<br />

∑<br />

+ E|X k | 3( 3 ∣ ∣<br />

∣{(i,<br />

∣∣+<br />

∣ ∣∣{(i,<br />

∣ ∣∣<br />

) ]<br />

j) ; j∼i, k∼{i, j}} j) ; j∼i, k∼ j, ki}}<br />

k∈I<br />

(3.9.17)<br />

pri čemer smo z|·| označili moč množice, z∼pa enako kot pri zgledu 3.5.3 relacijo<br />

sosednosti ali enakosti (oz. da med množicama obstaja vsaj ena <strong>po</strong>vezava ali pa imata<br />

neprazen presek).<br />

Naj bo D spet maksimalno število indeksov, ki so sosedni ali enaki <strong>po</strong>sameznemu<br />

indeksu. Tedaj lahko ocenimo:<br />

∣<br />

∣{(j, k) ; j∼i, k∼{i, j}} ∣ ∣≤2(D−1) 2 ∣<br />

+ D, ∣{(j, k) ; j∼i, k∼ j, ki}} ∣ ∣≤(D−1)(D−2)<br />

∣<br />

∣{(i, k) ; j∼i, k∼{i, j}} ∣ ∣≤2(D−1) 2 ∣<br />

+ D, ∣{(i, k) ; j∼i, k∼ j, ki}} ∣ ∣≤(D−1)(D−2)<br />

∣<br />

∣{(i, j) ; j∼i, k∼{i, j}} ∣ ∣<br />

∣≤2D(D−1)+D,<br />

∣∣{(i,<br />

∣ ∣∣≤(D−1)(D−2)<br />

j) ; j∼i, k∼ j, ki}}<br />

(3.9.18)<br />

Sledi: ∣ ∣∣E<br />

∣ ∣∣≤(7D f (W)−N(0, 1){ f} 2 − 10D+6)M 1 ( f )∑<br />

E|X i | 3 (3.9.19)<br />

Podobno za večrazsežni primer dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣ ∣≤(7D 2 − 10D+6)<br />

√<br />

2π<br />

8 M 2( f )<br />

i∈I<br />

∑<br />

E|X i | 3 (3.9.20)<br />

O<strong>po</strong>mba. Če vzamemo neodvisne slučajne spremenljivke, torej D=1, se ocena<br />

(3.9.19) prevede natančno na oceno (3.9.15).<br />

ZGLED 3.9.3. Slučajne permutacije. Naj bo spetπenakomerno <strong>po</strong>razdeljena slučajna<br />

permutacija na{1,...N} in W := ∑ N<br />

i=1 X i , kjer je X i = a(i,π(i)). V razdelku 3.5 smo<br />

že konstruirali slučajno permutacijoπ i→J , ki je bila neodvisna od sumanda X i . Tu<br />

bomo morali iti še korak dlje in konstruirati slučajne permutacije, neodvisne od zožitve<br />

permutacijeπna neko <strong>po</strong>dmnožico. Tu bomo v resnici <strong>po</strong>trebovali le dvoelementne<br />

<strong>po</strong>dmnožice in za slednje bi si lahko <strong>po</strong>magali s konstrukcijo iz zgleda 3.8.2. Vendar<br />

pa bomo konstrukcijo, ki jo bomo definirali tu, <strong>po</strong>trebovali tudi pri statistikah končnih<br />

<strong>po</strong>pulacij v razdelku 5.2, zato jo bomo <strong>po</strong>dali kar v splošnem.<br />

i∈I<br />


110 3.9 RAZČLENITVE DRUGEGA REDA<br />

DEFINICIJA. Naj bosta A⊆M končni množici. Za slučajno permutacijoρ A na<br />

množici M bomo rekli, da je slepa premestitev množice A, če je <strong>po</strong>razdeljena tako, da<br />

<strong>po</strong>samezne elemente množice A na sle<strong>po</strong> preslika v elemente množice M (t. j. vse izbire<br />

so enako verjetne). Če z B označimo tako dobljeno sliko množice A, najρ A nadalje vse<br />

elemente iz B\A spet na sle<strong>po</strong> preslika v elemente množice A\B.<br />

Trditev 3.9.3.<br />

množici M.<br />

Naj bosta A⊆M končni množici,ρ A pa slepa premestitev množice A na<br />

(1) Permutacijaρ A miruje <strong>po</strong>vsod razen morda na A∪ρ(A), ki je invariantna množica za<br />

ρ A .<br />

(2) Naj boπslučajna permutacija na M, ki je enakomerno <strong>po</strong>razdeljena in neodvisna odρ A .<br />

Tedaj jeπ◦ρ −1 prav tako enakomerno <strong>po</strong>razdeljena in neodvisna od zožitve permutacije<br />

A<br />

π na množico A.<br />

DOKAZ.<br />

(1): Očitno.<br />

(2): Naj bo A={i 1 ,...i r }. Dokazati moramo, da je <strong>po</strong>gojno na vsak dogodek oblike<br />

π(i 1 ) = j 1 ,...π(i r ) = j r permutacijaπ◦ρ −1 <strong>po</strong>razdeljena enakomerno. Pa recimo,<br />

A<br />

da veljaρ A (i 1 ) = k 1 ,...ρ A (i r ) = k r . Tedaj predpisσ ↦→ σ◦ρ −1 množico permutacijσ,<br />

za katere jeσ(i 1 )= j 1 ,...σ(i r )= j r , bijektivno preslika na množico permutacij<br />

A<br />

σ, za katere jeσ(k 1 ) = j 1 ,...σ(k r ) = j r . To pa <strong>po</strong>meni, da je <strong>po</strong>gojno na dogodek<br />

ρ A (i 1 )=k 1 ,...ρ A (i r )=k r ,π(i 1 )= j 1 ,...π(i r )= j r slučajna permutacijaπ◦ρ −1 <strong>po</strong>razdeljena<br />

enakomerno <strong>po</strong> množici vseh permutacijσ, za katere jeσ(k 1 )= j 1 ,...σ(k r )= j r . Ker<br />

A<br />

je variacija (ρ A (i 1 ),...ρ A (i r )) <strong>po</strong>razdeljena enakomerno <strong>po</strong> množici vseh variacij reda r<br />

na M, naša trditev res velja.<br />

Vrnimo se zdaj k naši slučajni spremenljivki W. Za razčlenitve prvega reda <strong>po</strong>stavimo:<br />

N∑<br />

W i := a ( N∑<br />

j,π(ρ −1<br />

{i} (j))) = a(ρ {i} (j),π(j)) (3.9.21)<br />

j=1<br />

kjer jeρ {i} , i=1,...N, družina slepih premestitev enoelementnih množic{i}, neodvisnih<br />

odπ. Iz točke (2) leme 3.9.3 sledi, da je W i res neodvisna od X i .<br />

O<strong>po</strong>mba. Zgornja konstrukcija ni nič novega. Ker slepa premestitev enoelementne<br />

množice ni nič drugega kot trans<strong>po</strong>zicija, ki dani element i zamenja z naključnim<br />

enakomerno <strong>po</strong>razdeljenim elementom I, je konstrukcija (3.9.21) enaka konstrukciji<br />

(3.5.11).<br />

Pišimo R i = W− W i = ∑ N<br />

j=1 X ij , kjer je:<br />

j=1<br />

X ij := a(j,π(j))−a(ρ {i} (j),π(j)) (3.9.22)<br />

Par (X i , X ij ) je odvisen le odρ {i} in od zožitve permutacijeπna{i, j}. Za razčlenitve<br />

drugega reda bomo torej <strong>po</strong>trebovali družino slepih premestitevρ ′ , kjer je A eno- ali<br />

A


3. STEINOVA METODA IN ODVISNOST 111<br />

dvoelementna množica, za katero bomo zahtevali še, da je neodvisna od vsega ostalega.<br />

Nato <strong>po</strong>stavimo:<br />

W ij :=<br />

N∑<br />

a ( k,π((ρ ′ {i,j} )−1 (k)) ) =<br />

k=1<br />

N∑<br />

j=1<br />

a(ρ ′ {i,j}(k),π(k)) (3.9.23)<br />

Po točki (2) trditve 3.9.3 je W ij neodvisna od para (X i , X ij ) in enako <strong>po</strong>razdeljena kot W,<br />

zato lahko <strong>po</strong>stavimo ˜W ij := W in velja ˜R ij = 0.<br />

Ocenimo zdaj desno stran v (3.9.2). Iz točke (1) trditve 3.9.3 sledijo ocene:<br />

|X ij |≤1 [ j∈{i,ρ {i} (i)} ]( |a(j,π(j))|+|a(ρ {i} (j),π(j))| ) (3.9.24)<br />

N∑<br />

|R i + R ij |≤ 1 [ k∈{i, j,ρ ′ {i,j} (i),ρ′ {i,j} (j)}]( |a(k,π(k))|+|a(ρ ′ {i,j} (k),π(k))|) (3.9.25)<br />

|R ij |≤<br />

k=1<br />

N∑<br />

1 [ k∈{i, j,ρ {i} (i),ρ ′ {i,j} (i),ρ′ {i,j} (j)}]( |a(ρ {i} (k),π(k))|+|a(ρ ′ {i,j} (k),π(k))|)<br />

k=1<br />

(3.9.26)<br />

Iz izreka 3.9.1 zdaj dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣ ∣≤M1 ( f )<br />

≤ M 1 ( f )<br />

N∑<br />

i=1<br />

∑<br />

j∈{i,ρ {i} (i)}<br />

N∑<br />

i=1<br />

N∑<br />

E|X i X ij | ( |R ij |+|R i + R ij | ) ≤<br />

j=1<br />

∑<br />

k∈{i,ρ {i} (i),ρ ′ {i,j} (i),ρ′ {i,j} (j)} E|a(i,π(i))| ( |a(j,π(j))|+|a(ρ {i} (j),π(j))| ) ×<br />

× ( |a(ρ {i} (k),π(k))|+|a(ρ ′ {i,j} (k),π(k))|) +<br />

N∑ ∑ ∑<br />

+ M 1 ( f ) E|a(i,π(i))| ( |a(j,π(j))|+|a(ρ {i} (j),π(j))| ) ×<br />

i=1 j∈{i,ρ {i} (i)} k∈{i,j,ρ ′ {i,j} (i),ρ′ {i,j} (j)}<br />

× ( |a(k,π(k))|+|a(ρ ′ {i,j} (k),π(k))|) (3.9.27)<br />

Ko smo v (3.9.2) vstavljali oceno za R ij , smo lahko izpustili možnost, da je k = j,<br />

saj je bodisi j=i bodisi j=ρ {i} (i). Sedaj pa u<strong>po</strong>rabimo Jensenovo neenakost xyz≤<br />

1<br />

3 (x3 + y 3 + z 3 ) in dejstvo, da so slučajne spremenljivkeπ(i),π(j) inπ(k) vsaka zase<br />

neodvisne od slučajnih permutacijρ {i} inρ ′ . Poleg tega bomo namesto sumacijskega<br />

{i,j}<br />

indeksa i u<strong>po</strong>rabili slučajni indeks I, <strong>po</strong>razdeljen enakomerno <strong>po</strong>{1,...N} in neodvisen


112 3.9 RAZČLENITVE DRUGEGA REDA<br />

od vsega ostalega. Po krajšem računu dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣≤<br />

≤ M 1( f )<br />

3<br />

∑<br />

j∈{I,ρ {I} (I)}<br />

∑<br />

k∈{I,ρ {I} (I),ρ ′ {I,j} (I),ρ′ {I,j} (j)} N∑<br />

l=1<br />

E [ 4|a(I, l)| 3 + 2|a(j, l)| 3 +<br />

+ 2|a(ρ {I} (j), l)| 3 + 2|a(ρ {I} (k), l)| 3 + 2|a(ρ ′ {I,j} (k), l)|3] + (3.9.28)<br />

+ M 1( f ) ∑ ∑ N∑<br />

E [ 4|a(I, l)| 3 + 2|a(j, l)| 3 +<br />

3<br />

j∈{I,ρ {I} (I)} k∈{I,j,ρ ′ {I,j} (I),ρ′ {I,j} (j)} l=1<br />

+ 2|a(ρ {I} (j), l)| 3 + 2|a(k, l)| 3 + 2|a(ρ ′ {I,j} (k), l)|3]<br />

Zdaj pa za j in k vstavimo ustrezne vrednosti, ki nastopajo v vsotah. Tako dobimo<br />

neko vsoto, kjer namesto (slučajnih) indeksov I, j, k,ρ {I} (j),ρ {I} (k),ρ ′ (k),ρ {I,j} {I}(ρ {I} (i))=I<br />

inρ ′ (ρ {I,j} {I}(I)) nastopajo slučajni indeksi I,ρ {I} (I),ρ ′ {I} (I),ρ′ {I,ρ {I}<br />

(I) itd. Zaradi simetrije<br />

(I)}<br />

morajo biti vsi ti slučajni indeksi <strong>po</strong>razdeljeni enakomerno <strong>po</strong>{1,...N}. Ko vse skupaj<br />

seštejemo, končno dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ 64<br />

N∑ N∑<br />

∣≤<br />

N M 1( f ) |a(i, j)| 3 (3.9.29)<br />

Dobili smo oceno, enako oceni (3.8.21). Izpeljava je bila tokrat res nekoliko zahtevnejša<br />

kot v razdelku 3.8, vendar pa so razčlenitve drugega reda v splošnem robustnejše od<br />

sklapljanj z izmenljivimi pari in <strong>po</strong>gojnimi <strong>po</strong>razdelitvami. Pri slednjih se namreč<br />

zahteva linearnost <strong>po</strong>gojnega matematičnega upanja (glej (3.7.3)), medtem ko pri razčlenitvah<br />

to ni <strong>po</strong>trebno. Še drugače <strong>po</strong>vedano, razčlenitve drugega reda je v splošnem<br />

lažje konstruirati kot sklapljanja z izmenljivimi pari in <strong>po</strong>gojnimi <strong>po</strong>razdelitvami, zato<br />

pa je včasih nekoliko zahtevneje oceniti desno stran v (3.9.2) oz. (3.9.3). □<br />

Dolžni smo še dokazati lemo 3.9.2. Dokaz bo temeljil na naslednjem rezultatu.<br />

Lema 3.9.4. Naj bo f n , n∈N, za<strong>po</strong>redje merljivih funkcij na merljivem prostoru z meroµ,<br />

ki v L 1 (µ) konvergira proti funkciji f . Dana naj bo še funkcija g, za katero velja, da je za<strong>po</strong>redje<br />

funkcij f n g konvergentno v L 1 (µ). Tedaj za<strong>po</strong>redje funkcij f n g v L 1 (µ) konvergira proti f g.<br />

DOKAZ. Merljivi prostor razdelimo na dva prostora: A := [|g|≤1] in B := [|g|>1].<br />

Dovolj je <strong>po</strong>kazati, da konvergenca f n g→ f g velja <strong>po</strong>sebej na A in <strong>po</strong>sebej na B.<br />

Na prostoru A konvergenca funkcij f n proti f očitno implicira konvergenco funkcij<br />

f n g proti f g. Na prostoru B pa funkcije f n g konvergirajo proti neki funkciji f ∗ g.<br />

Ocenimo:<br />

∫ ∫ ∫<br />

| f ∗ − f| dµ≤ | f ∗ − f n | dµ+ | f−f n | dµ≤<br />

B<br />

B<br />

B<br />

∫ ∫<br />

(3.9.30)<br />

≤<br />

| f ∗ g− f g| dµ+<br />

B<br />

i=1<br />

j=1<br />

| f−f n | dµ<br />

B<br />

Ker oba sumanda konvergirata proti nič, se morata f in f ∗ skoraj <strong>po</strong>vsod ujemati. Lema<br />

je tako dokazana.


3. STEINOVA METODA IN ODVISNOST 113<br />

Posledica 3.9.5. Naj boIindeksna množica in naj bodo dane funkcije f i , i∈I, definirane<br />

na merljivem prostoru z meroµ. V L 1 (µ) naj velja ∑ ∫ i∈I f n = f , <strong>po</strong>leg tega pa naj bo še<br />

fn g dµε)=0.<br />

i<br />

= 0 in var(W (n) )=1. Tedaj<br />

(2) Velja lim n→∞ sup i∈I (n) var(X (n) )=0 in za<strong>po</strong>redje <strong>po</strong>razdelitev slučajnih spremenljivk<br />

i<br />

W (n) šibko konvergira proti standardizirani normalni <strong>po</strong>razdelitvi.<br />

Pogoju (1) pravimo Lindebergov <strong>po</strong>goj. Zadostnost tega <strong>po</strong>goja je dokazal Lindeberg<br />

[74], <strong>po</strong>trebnost pa Feller [58]. Za klasičen dokaz izreka glej tudi Širjajev [122],<br />

III. <strong>po</strong>glavje, 4. razdelek. V nadaljevanju pa bomo s Steinovo metodo dokazali <strong>po</strong>splošitev<br />

Lindebergovega dela izreka (t. j. zadostnosti) na lokalno odvisne slučajne<br />

spremenljivke.


114 3.10 OCENE LINDEBERGOVEGA TIPA<br />

Posledica 3.10.2 (klasični CLI). Če so Y 1 , Y 2 ,... neodvisne in enako <strong>po</strong>razdeljene slučajne<br />

spremenljivke zE Y i = 0 in var(Y i )=1, za<strong>po</strong>redje <strong>po</strong>razdelitev slučajnih spremenljivk:<br />

W (n) := Y 1+···+Y n<br />

√ n<br />

(3.10.1)<br />

šibko konvergira proti standardizirani normalni <strong>po</strong>razdelitvi.<br />

Lindebergov izrek nam nič ne <strong>po</strong>ve o hitrosti konvergence. Nastane vprašanje, ali<br />

se da formulirati izrek, ki bi dal eskplicitno oceno napake pri normalni aproksimaciji,<br />

iz katere bi sledil Lindebergov izrek. Tudi taki rezultati obstajajo in kolikor je avtorju<br />

znano, je tovrsten izrek za vsote neodvisnih slučajnih spremenljivk prvi formuliral<br />

Katz [68]. Različico tega izreka, ki je formulirana s<strong>po</strong>daj, sta s <strong>po</strong>močjo Steinove<br />

metode dokazala Chen in Shao [40] (glej tudi Feller [59] in Petrov [92]).<br />

Izrek 3.10.3. Naj bodo X 1 ,...X n neodvisne slučajne spremenljivke z vsoto W. Privzemimo,<br />

da veljaE X i = 0 in var(W)=1. Tedaj za vse x∈Rvelja ocena:<br />

∣<br />

∣P[W≤ x]−Φ(x) ∣ n∑<br />

∣≤4,1 E X 2 i<br />

min{1,|X i |} (3.10.2)<br />

kjer sΦkot <strong>po</strong>navadi označimo standardno normalno <strong>po</strong>razdelitveno funkcijo.<br />

Konvergenca proti nič izrazov tipa, kot je desna stran v (3.10.2), v splošnem implicira<br />

rezultate Lindebergovega tipa. Ključ do te implikacije je s<strong>po</strong>dnja lema (za izpeljavo<br />

Lindebergovega izreka iz izreka 3.10.3 <strong>po</strong>trebujemo še trditev A.10.1).<br />

Lema 3.10.4. Naj boI n , n∈N, za<strong>po</strong>redje indeksnih množic. Za vsak n∈N in vsak<br />

i∈I n naj bosta dani števili a ni , b ni ≥ 0 in še slučajna spremenljivkaξ ni . Če za vsakε>0 velja:<br />

i=1<br />

∑ [<br />

lim a ni Eξ 2<br />

n→∞<br />

ni 1 ξ ni > ε ]=0 (3.10.3)<br />

v n<br />

i∈I n<br />

kjer je:<br />

velja tudi:<br />

∑<br />

lim<br />

n→∞<br />

∑<br />

v n := a ni b ni Eξ 2 ni<br />

(3.10.4)<br />

i∈I n<br />

i∈I n<br />

a ni Eξ 2 ni min{1, b niξ ni }=0 (3.10.5)<br />

DOKAZ. Prav lahko preverimo, da velja ocena:<br />

Zdaj pa <strong>po</strong>šljemo najprej n→∞, nato pa šeε→0.<br />

min{1, b ni ξ ni }≤1<br />

[ξ ni > ε ]<br />

+ b ni<br />

ε (3.10.6)<br />

v n v n


3. STEINOVA METODA IN ODVISNOST 115<br />

Tu bomo izpeljali ocene takega tipa, kot je desna stran v (3.10.2), le da za Lipschitzeve<br />

oz. gladke testne funkcije, a zato za vsote odvisnih slučajnih spremenljivk z danimi<br />

razčlenitvami drugega reda iz prejšnjega razdelka.<br />

Naj bo torej spet W= ∑ i∈I X i in za vsak i naj bo W= W i + R i , kjer je W i neodvisna od<br />

X i , in še R i = ∑ j∈J i<br />

X ij . Nadalje naj bosta za vsak j∈J i dani še razčlenitvi drugega reda<br />

W i = W ij + R ij in W= ˜W ij + ˜R ij , kjer je W ij neodvisna od (X i , X ij ) in enako <strong>po</strong>razdeljena<br />

kot ˜W ij . Kot <strong>po</strong>navadi privzemimo še, da jeE X i = 0 in var(W)=1 (oz. v večrazsežnem<br />

primeru Var(W)=I). Naslednji izrek, katerega različica je objavljena tudi v avtorjevem<br />

članku [96], je izboljšava izreka 3.9.1.<br />

Izrek 3.10.5. Naj bo W kot zgoraj. Tedaj v enorazsežnem primeru velja ocena:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∑∑<br />

∣≤M1 ( f ) E|X i X ik |×<br />

i∈I j∈J i<br />

[ { } { }] (3.10.7)<br />

2<br />

2<br />

× min √ ,|R ij |+|R i + R ij | +E min √ , 2|˜R ij |<br />

2π 2π<br />

V večrazsežnem primeru pa velja ocena:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ∑∑<br />

∣≤M2 ( f ) E|X i ||X ij |×<br />

i∈I j∈J i<br />

[ { √<br />

2π (<br />

× min 1, |Rij |+|R i + R ij | )} √ }] (3.10.8)<br />

2π<br />

+E min{<br />

1,<br />

8<br />

4 | ˜R ij |<br />

DOKAZ. Naj bo g katera od rešitev Steinove enačbe:<br />

∆g(w)− g ′ (w)w= f (w)−N(0, I){ f} (3.10.9)<br />

iz izreka 2.6.1. Podobno kot v (3.9.8) izračunamo:<br />

E [ ∑∑<br />

∆g(W)− g ′ (W)W]= E( ˜T ij − T ij )X i X ij (3.10.10)<br />

j∈J i<br />

kjer je:<br />

i∈I<br />

˜T ij :=E[g ′′ (W)− g ′′ ( ˜W ij )] (3.10.11)<br />

T ij :=E[g ′′ (W i +θR i )− g ′′ (W ij )|H ij ] (3.10.12)<br />

SH ij smo označiliσ-algebro, ki jo generirajo X i , X ij , R i in R ij ,θpa je kot <strong>po</strong>navadi<br />

<strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega. Ocenimo:<br />

| ˜T ij | ∨ ≤E min { 2 M 2 (g), M 3 (g)|˜R ij | } (3.10.13)<br />

Z|·| ∨ smo označili injektivno tenzorsko normo (glej razdelek D.8). Podobno ocenimo:<br />

|T ij | ∨ ≤E [ min { 2 M 2 (g), M 3 (g)|θR i + R ij | }∣ ∣ ∣Hij<br />

]<br />

≤<br />

≤E [ min { 2 M 2 (g), M 3 (g) ( (1−θ)|R ij |+θ|R i + R ij | )}∣ ∣ ∣Hij<br />

]<br />

≤<br />

≤ min { 2 M 2 (g), M 3 (g)E [ (1−θ)|R ij |+θ|R i + R ij | ∣ ]} (3.10.14)<br />

∣Hij =<br />

{<br />

= min 2 M 2 (g), M 3(g) (<br />

|Rij |+|R i + R ij | )} 2


116 3.10 OCENE LINDEBERGOVEGA TIPA<br />

Dokaz zaključimo z ocenami:<br />

M 2 (g)≤ 1 2 M 2( f ), M 2 (g)≤ 2 √<br />

2π<br />

M 1 ( f ), M 3 (g)≤<br />

ki sledijo iz leme 2.6.2, in ocene:<br />

ki v enorazsežnem primeru sledi iz točke (3) leme 1.4.1.<br />

√<br />

2π<br />

4 M 2( f ) (3.10.15)<br />

M 3 (g)≤2 M 1 ( f ) (3.10.16)<br />

ZGLED 3.10.1. Neodvisne slučajne spremenljivke. Naj bodo X i , i ∈ I, neodvisne<br />

slučajne spremenljivke ali vektorji z vsoto W, velja pa najE X i = 0 in var(W)=1 oz. v<br />

večrazsežnem primeru Var(W)=I. Razčlenitve konstruiramo tako kot v zgledu 3.9.1.<br />

t. j. R i = X i0 = ˜R i0 = X i in R i0 = 0. Po izreku 3.10.5 v enorazsežnem primeru velja ocena:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∑<br />

∣≤M1 ( f )<br />

i∈I<br />

[ { } 2<br />

E X 2 i<br />

min √ ,|X i |<br />

2π<br />

Za nadaljnje ocenjevanje <strong>po</strong>trebujemo še naslednji preprost rezultat.<br />

{ 2<br />

+E min √ , 2|X i |} ] (3.10.17)<br />

2π<br />

Lema 3.10.6. Naj bo X slučajna spremenljivka z vrednostmi na neki linearno urejeni<br />

množiciA, dani pa naj bosta še naraščajoči funkciji f, g:A→R. Tedaj velja cov[ f (X), g(X)]≥<br />

0.<br />

DOKAZ. Brez škode za splošnost lahko privzamemo, da obstaja neodvisna kopija Y<br />

slučajne spremenljivke X. Očitno je:<br />

0≤E [( f (X)− f (Y) )( g(X)− g(Y) )] =<br />

=E [ f (X) g(X)− f (X) g(Y)− f (Y) g(X)+ f (Y) g(Y) ] =<br />

= 2 [ E f (X) g(X)−E f (X)E g(X) ] =<br />

= 2 cov[ f (X), g(X)]<br />

(3.10.18)<br />

Naš rezultat je s tem dokazan.<br />

Iz ocene 3.10.17 in leme 3.10.6 zdaj dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∑<br />

[ { }<br />

2 ∣≤M1 ( f ) E X 2 i<br />

min √ ,|X i |<br />

2π<br />

i∈I<br />

∑<br />

≤ 3 M 1 ( f )<br />

Podobno tudi v večrazsežnem primeru dobimo:<br />

i∈I<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ∣ ∣≤3 M2 ( f )<br />

{ 2<br />

+ min √ , 2|X i |} ] ≤<br />

2π<br />

{ } (3.10.19)<br />

2<br />

E X 2 i min √ ,|X i |<br />

2π<br />

∑<br />

i∈I<br />

{<br />

E|X i | 2 min 1,<br />

√ } 2π<br />

8 |X i|<br />

(3.10.20)<br />


3. STEINOVA METODA IN ODVISNOST 117<br />

ZGLED 3.10.2. Lokalna odvisnost. Naj bodo X i , i ∈ I, lokalno odvisne slučajne<br />

spremenljivke oz. vektorji, in sicer naj boΓgraf njihove odvisnosti v skladu z definicijo<br />

iz zgleda 3.5.3. Iz izreka 3.10.5 za enorazsežni primer dobimo:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣≤<br />

∑∑<br />

[ {<br />

2<br />

∑<br />

}<br />

≤ M 1 ( f ) E|X i X j | E min √ , 2 |X k | +<br />

i∈I j∈J i 2π<br />

k∈J i ∪J j<br />

{<br />

2<br />

∑ ∑ ) }] (3.10.21)<br />

+ min √ , |X k |+ |X k |<br />

2π<br />

k∈J i ∪J j k∈J j \J i<br />

kjer <strong>po</strong>dobno kot v zgledu 3.9.2 zJ i označimo množico točk, ki so sosedne ali enake<br />

i. Za nadaljnje ocenjevanje bomo <strong>po</strong>trebovali naslednji tehnični rezultat, ki ga bomo<br />

dokazali na koncu razdelka.<br />

Lema 3.10.7. Naj bodo x, y, a ter b j in z j , j∈J, nenegativna števila ter še ∑ j∈J b j ≤ b0. Tedaj velja:<br />

{<br />

∑<br />

xy min a, b j z j<br />

}≤L ( x, y, (z j ) j∈J , a, (b j ) j∈J , b ) :=<br />

j∈J<br />

:= x2<br />

3 min { 3a<br />

2 , bx }<br />

+ y2<br />

3 min { 3a<br />

2 , by }+ 1 3b<br />

r∑<br />

j=1<br />

{ } (3.10.22)<br />

3a<br />

b j z 2 j min 2 , bz j<br />

O<strong>po</strong>mba. Za velike a se desna stran (3.10.22) ujema z izrazom, ki ga dobimo, če na<br />

levi strani u<strong>po</strong>rabimo Jensenove neenakosti xyz j ≤ 1 3 (x3 + y 3 + z 3 j ).<br />

Posledica 3.10.8. Naj bodo X, Y in Z j , j∈J, nenegativne slučajne spremenljivke, števila<br />

a, b in b j pa tako kot v lemi 3.10.7. Tedaj velja:<br />

{<br />

E XY min a,<br />

{<br />

E XY·E min a,<br />

r∑<br />

b j Z j<br />

}≤E L ( X, Y, (Z j ) j∈J , a, (b j ) j∈J , b ) (3.10.23)<br />

j=1<br />

r∑<br />

b j Z j<br />

}≤E L ( X, Y, (Z j ) j∈J , a, (b j ) j∈J , b ) (3.10.24)<br />

j=1<br />

DOKAZ. Ocena (3.10.23) sledi ne<strong>po</strong>sredno iz leme 3.10.7. Oceno (3.10.24) pa izpeljemo<br />

iz ocene (3.10.23), tako da vzamemo, da je par (X, Y) neodvisen od (Z j ) j∈J .<br />

Vrnimo se sedaj k oceni (3.10.21). U<strong>po</strong>rabili bomo <strong>po</strong>sledico 3.10.8. Če privzamemo,<br />

da ima vsako oglišče v grafu odvisnosti vključno s samim sabo kvečjemu D sosedov,


118 3.10 OCENE LINDEBERGOVEGA TIPA<br />

lahko <strong>po</strong>stavimo b := 4D. Sledi:<br />

∣<br />

∣E f (W)−N(0, 1){ f} ∣ ∣≤<br />

∑∑<br />

[ { }<br />

2 3<br />

≤ M 1 ( f )<br />

3 E X2 i min √ , 4D|X i | +<br />

j∈J i 2π<br />

i∈I<br />

+ 2 3 E X2 j min { 3<br />

√<br />

2π<br />

, 4D|X j |<br />

+ 1<br />

(<br />

3<br />

12D<br />

∑<br />

≤ 2D M 1 ( f )<br />

∑ ∑<br />

)<br />

+<br />

k∈J i ∪J j k∈J j \J i<br />

i∈I<br />

}<br />

+<br />

E X 2 i min { 3<br />

√<br />

2π<br />

, 4D|X i |<br />

E X 2 k min { 3<br />

√<br />

2π<br />

, 4D|X k |} ] ≤<br />

}<br />

(3.10.25)<br />

Dobili smo torej <strong>po</strong>splošitev ocen (3.9.19) in (3.10.19). Podobno tudi v večrazsežnem<br />

primeru dobimo:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ∑<br />

∣≤D M2 ( f ) E|X i | 2 min { 3, √ 2π D|X i | } (3.10.26)<br />

i∈I<br />

Iz leme 3.10.4, ocene (3.10.26) ter trditve A.8.1 in točke (4) trditve A.9.1 pa dobimo še<br />

naslednji rezultat.<br />

Trditev 3.10.9. Naj bo X (n) , n∈N, i∈I<br />

i<br />

n , trikotna tabela slučajnih vektorjev z vrednostmi<br />

vR d . Za vsak n naj za družino X (n) , i∈I<br />

i n , obstaja graf odvisnosti, v katerem ima vsako oglišče<br />

s samim seboj vred največ D n sosedov. Za vsak n∈N naj bo še W (n) := ∑ i∈I n<br />

X (n) in kot<br />

i<br />

<strong>po</strong>navadi privzemimo, da jeE X (n) = 0 in Var(W (n) )=I. Nadalje naj za vsakε>0 velja:<br />

i<br />

kjer je:<br />

lim<br />

n→∞ D n<br />

∑<br />

E ∣ ∣X<br />

(n)<br />

i<br />

i∈I n<br />

∣ 2 1<br />

[ ∣∣∣X (n) ∣<br />

∣> ε ]=0 (3.10.27)<br />

v n<br />

i<br />

∑<br />

v n := D 2 n E ∣ ∣X<br />

(n)<br />

∣ 2 (3.10.28)<br />

i<br />

i∈I n<br />

Tedaj za<strong>po</strong>redje W (n) šibko konvergira proti standardni normalni <strong>po</strong>razdelitvi N(0, I m ).<br />

Zgornja trditev je ne<strong>po</strong>sredna <strong>po</strong>splošitev Lindebergovega izreka na lokalno odvisnost.<br />

□<br />

Dolžni smo dokazati še lemo 3.10.7. Potrebovali bomo še naslednji tehnični rezultat.<br />

Lema 3.10.10. Za <strong>po</strong>ljubne u, v≥0in p≥1velja:<br />

min { 1, (u+v) p} ≤ u p + pv (3.10.29)<br />

DOKAZ. Pišimo s := u+v. Tedaj neenakost (3.10.29) takoj sledi iz zveze min 0≤u≤s (u p +<br />

p(s−u))=min{1, s p }, ki je ni težko preveriti.


3. STEINOVA METODA IN ODVISNOST 119<br />

DOKAZLEME 3.10.7. Najprej iz ocene xy≤(x 2 + y 2 )/2 sledi, da je dovolj dokazati<br />

neenakost:<br />

{<br />

∑<br />

} {<br />

x 2 min a, b j z j ≤ 2x2 3a<br />

}+<br />

3 min 2 , bx 1 ∑ { } 3a<br />

b j z 2 j<br />

3b<br />

min 2 , bz j (3.10.30)<br />

j∈J<br />

Ločimo dva primera. V primeru, ko je x≥(3a)/(2b), preprosto ocenimo:<br />

{<br />

∑<br />

} { }<br />

x 2 min a, a j z j ≤ ax 2 = 2x2 3a<br />

3 min 2 , bx<br />

j∈J<br />

V primeru, ko je x


120 3.11 LIPSCHITZEVE TESTNE FUNKCIJE V VEČ DIMENZIJAH<br />

3.11 Lipschitzeve testne funkcije v več dimenzijah<br />

Oceno napake pri normalni aproksimaciji smo do sedaj med drugim izpeljali tudi<br />

za Lipschitzeve funkcije, a le v eni dimenziji. V razdelku 2.8 smo ugotovili, da se<br />

taki rezultati ne dajo preprosto <strong>po</strong>splošiti na več dimenzij. Tu pa bomo videli, da se<br />

za Lipschitzeve testne funkcije (t. j. v Wassersteinovi metriki) tudi v več dimenzijah<br />

dajo izpeljati ocene, ki so tipično istega velikostnega reda kot v eni dimenziji, le da je<br />

<strong>po</strong>trebno gledati razčlenitve enega reda več.<br />

Začeli bomo tako kot pri razčlenitvah drugega reda. Naj bo:<br />

∑<br />

W= X i , W= W i + X i (3.11.1)<br />

i∈I<br />

kjer je W i neodvisen od X i . Kot <strong>po</strong>navadi privzemimo, da jeE X i = 0 in Var(W)=I.<br />

Nadalje naj bo:<br />

∑<br />

R i = X ij , W i = W ij + R ij , W= ˜W ij + ˜R ij (3.11.2)<br />

i∈J i<br />

kjer je W ij enako <strong>po</strong>razdeljen kot ˜W ij in neodvisen odσ-algebreH ij , pri čemer sta X i in<br />

X ij merljiva glede naH ij . Razčlenitve tretjega reda pa naj bodo <strong>po</strong>dane takole:<br />

kjer je W (0)<br />

ijk<br />

˜R ij =<br />

R i + R ij =<br />

R ij =<br />

∑<br />

k∈K (0)<br />

ij<br />

∑<br />

k∈K (1)<br />

ij<br />

∑<br />

k∈K (2)<br />

ij<br />

X (0)<br />

ijk , ˜W ij = W (0)<br />

ijk + R(0) ijk<br />

(3.11.3)<br />

X (1)<br />

ijk , W ij= W (1)<br />

ijk + R(1) ijk<br />

(3.11.4)<br />

X (2)<br />

ijk , W ij= W (2)<br />

ijk + R(2) ijk<br />

(3.11.5)<br />

neodvisen od X(0) , ijk W(1) odσ-algebre, generirane sH ijk ij in X (1) , ijk W(2) pa od<br />

ijk<br />

. Končno naj bodo za r=0, 1, 2 <strong>po</strong>dane še razčlenitve:<br />

σ-algebre, generirane sH ij in X (2)<br />

ijk<br />

W= ˜W (r)<br />

ijk + ˜R (r)<br />

ijk<br />

(3.11.6)<br />

kjer je ˜W ijk <strong>po</strong>razdeljen enako kot W ijk . Zgornje razčlenitve delno <strong>po</strong>nazarja naslednji<br />

diagram:


3. STEINOVA METODA IN ODVISNOST 121<br />

R (1)<br />

ijk<br />

R i R ij R (2)<br />

ijk<br />

W W i W ij W (r)<br />

˜R ij R (0)<br />

ijk<br />

ijk<br />

˜R (r)<br />

ijk<br />

˜W ij<br />

˜W (r)<br />

ijk<br />

Slika 3.11.1<br />

Izrek 3.11.1. Če je W slučajni vektor z vrednostmi vR d in ima <strong>po</strong>dane razčlenitve tako kot<br />

zgoraj, za vsako Lipschitzevo funkcijo f : R d →Rvelja ocena:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ∣≤<br />

[ (2,9+0,28 )∑∑<br />

ln d<br />

kjer je:<br />

in:<br />

≤ M 1 ( f )<br />

˜Ξ ij =<br />

Ξ ij =<br />

E|X i ||X ij | ( 2E ∣ ∣<br />

∣<br />

∣∣+<br />

∣ ∣∣Rij<br />

∣ ∣∣+<br />

∣ ∣∣Ri<br />

∣ ∣∣<br />

)<br />

˜R ij + R ij +<br />

i∈I j∈J i<br />

∑∑<br />

(√<br />

+ 3,5 E|X i ||X ij | ˜Ξ ij +<br />

i∈I j∈J i<br />

∑<br />

k∈K (0)<br />

ij<br />

2∑<br />

r=1<br />

∑<br />

k∈K (r)<br />

ij<br />

+<br />

+<br />

√<br />

Ξ ij<br />

) ] (3.11.7)<br />

[<br />

E ∣ ∣X<br />

(0) ∣<br />

∣E ∣ ∣ ˜R (0) ∣<br />

∣+ 1 2 E∣ ∣ ∣X<br />

(0)<br />

∣ ∣ ∣R<br />

(0) ∣<br />

∣+ 1 2 E∣ ∣ ∣X<br />

(0)<br />

∣ ∣ ]<br />

∣ ˜R ij + R (0)<br />

∣<br />

ijk<br />

ijk<br />

[ ∣∣∣X (<br />

(r)<br />

E ∣E ∣ ijk ∣ ˜R (r) ∣<br />

∣+ 1 ∣<br />

ijk<br />

4<br />

∑<br />

k∈K (1)<br />

ij<br />

∑<br />

k∈K (2)<br />

ij<br />

ijk<br />

∣R (r)<br />

ijk<br />

ijk<br />

)∣ ] ∣∣∣∣ ∣ H ij +<br />

[ ∣∣∣X (1)<br />

( E ∣<br />

12∣ 1 ∣<br />

∣R<br />

ijk ij + R (1) ∣<br />

∣+ 1 ∣<br />

∣R<br />

ijk i + R ij + R (1)<br />

)∣ ] ∣∣∣∣ ∣<br />

6<br />

H ijk ij +<br />

[ ∣∣∣X (2)<br />

( E ∣<br />

6∣ 1 ∣<br />

∣R<br />

ijk ij + R (2) ∣<br />

∣+ 1<br />

∣<br />

∣R<br />

ijk<br />

i + R ij + R (2)<br />

)∣ ] ∣∣∣∣ ∣<br />

12<br />

H ijk ij<br />

ijk<br />

ijk<br />

(3.11.8)<br />

(3.11.9)<br />

O<strong>po</strong>mba. Konstanta na desni strani ocene (3.11.7) raste z logaritmom dimenzije.<br />

Kasneje bomo videli, da odvisnost konstante od dimenzije ni nič nenavadnega (glej<br />

razdelek 4.3).<br />

Preden dokažemo izrek 3.11.1, <strong>po</strong>dajmo še dva standardna zgleda: neodvisne slučajne<br />

spremenljivka in lokalno odvisnost.


122 3.11 LIPSCHITZEVE TESTNE FUNKCIJE V VEČ DIMENZIJAH<br />

Trditev 3.11.2. Naj bo W= ∑ i∈I X i , kjer so X i neodvisni slučajni vektorji zE X i = 0 in<br />

Var(W)=I. Tedaj velja ocena:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ( ) ∑<br />

∣≤ 17+0,84 ln d M1 ( f ) E|X i | 3 (3.11.10)<br />

DOKAZ. Razčlenitve prvega in drugega reda konstruiramo tako kot pri zgledih 3.9.1<br />

in 3.10.1: <strong>po</strong>stavimo R i := X i ,J i ={0} in X i0 = ˜R i0 = X i in R i0 = 0 (velja torej W i = W i0 =<br />

˜W i0 = W−X i ). Pri razčlenitvah tretjega reda pa <strong>po</strong>stavimoH i0 :=σ(X i ),K (0) =K (1) ={0}<br />

i0 i0<br />

= 0 (<strong>po</strong>dobno kot pri razčlenitvah drugega reda<br />

torej velja W (r)<br />

Ocena (3.11.7) se sedaj prevede na:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ∣≤M1 ( f ) [ ]<br />

(2,9+0,28 ln d)S 1 + 3,5 S 2<br />

inK (2)<br />

i0<br />

kjer je:<br />

in:<br />

in še:<br />

=∅ ter X (r) = ˜R (r) = X i00 i00 i in R (r)<br />

i00 = ˜W (r) = W− X i00 i00 i).<br />

i∈I<br />

i∈I<br />

(3.11.11)<br />

∑<br />

S 1 := E|X i | 2( 2E|X i |+|X i | ) ∑<br />

≤ 3 E|X i | 3 (3.11.12)<br />

i∈I<br />

∑<br />

S 2 := E|X i | 2(√ ˜Ξ i + √ ) ∑( Ξ i ≤ E|Xi | 3) [ 2/3 ( ) 1/3+ ( )<br />

E ˜Ξ 3/2 EΞ<br />

3/2 1/3<br />

]<br />

i<br />

Očitno je:<br />

i∈I<br />

i<br />

i∈I<br />

(3.11.13)<br />

˜Ξ i := ( E|X i | ) 2 1 +<br />

2 E|X i| 2 ≤ 3 2 E|X i| 2 (3.11.14)<br />

Ξ i :=E<br />

[|X i |E|X i |+ 1 ∣ ∣∣∣<br />

]<br />

6 |X i| 2 X i =|X i |E|X i |+ 1 6 |X i| 2 (3.11.15)<br />

E ˜Ξ 3/2<br />

i<br />

( ) 3 3/2<br />

≤ E|X i | 3 (3.11.16)<br />

2<br />

Pri oceni matematičnega upanjaEΞ 3/2 pa si <strong>po</strong>magamo z oceno:<br />

i<br />

( ∑<br />

( ∑<br />

a i x i<br />

)p≤<br />

)p−1 ∑<br />

a i a i x p (3.11.17)<br />

i<br />

i∈I<br />

i∈I<br />

ki velja za <strong>po</strong>ljubne nenegativne a i in x i ter p≥1, izpeljemo pa jo lahko iz Hölderjeve<br />

ali Jensenove neenakosti (<strong>po</strong>drobnosti so prepuščene bralcu). Tako dobimo še:<br />

EΞ 3/2<br />

i<br />

( 7<br />

≤<br />

6<br />

i∈I<br />

) 1/2 [ (|Xi<br />

|E|X i | ) ] ( )<br />

3/2 1 7 3/2<br />

+<br />

6 |X i| 3 ≤ E|X i | 3 (3.11.18)<br />

6<br />

Ocena (3.11.10) zdaj <strong>po</strong> nekaj numeričnega ocenjevanja sledi iz ocen (3.11.11), (3.11.12),<br />

(3.11.13), (3.11.16) in (3.11.18).<br />

Naslednja trditev je, z izjemo konstante, <strong>po</strong>splošitev trditve 3.11.2 na lokalno odvisnost.


3. STEINOVA METODA IN ODVISNOST 123<br />

Trditev 3.11.3. Naj bo W= ∑ i∈I X i , kjer so X i lokalno odvisni slučajni vektorji, za katere<br />

obstaja graf odvisnosti, definiran tako kot v zgledu 3.5.3 in v katerem ima vsako oglišče s samim<br />

seboj vred največ D sosedov. Če privzamemo še, da jeE X i = 0 in Var(W)=I, velja ocena:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ( ) ∑<br />

∣≤ 42+2 ln d D 2 M 1 ( f ) E|X i | 3 (3.11.19)<br />

Trditev 3.11.3 bomo dokazali na koncu razdelka, sedaj pa se bomo najprej lotili<br />

dokazovanja izreka 3.11.1. Ker se tretjih odvodov rešitve g Steinove enačbe:<br />

∆g(w)− g ′ (w)w= f (w)−N(0, I){ f} (3.11.20)<br />

v večrazsežnem primeru ne da oceniti kar z Lipschitzevo konstanto funkcije f , ocene<br />

napake pri normalni aproksimaciji za dano Lipschitzevo testno funkcijo f ne bomo<br />

mogli preprosto prevesti na oceno Steinovega matematičnega upanja funkcije g, ki reši<br />

(3.11.20). Namesto tega bomo funkcijo f zamenjali z gladko funkcijo f ε , ki se bo le malo<br />

razlikovala od f . Natančneje, definirajmo:<br />

f ε (x) :=E f (x+εZ) (3.11.21)<br />

kjer je spet Z∼N(0, I). Funkcije f ε imajo vse odvode omejene in to velja tudi za ustrezne<br />

rešitve pripadajočih <strong>Steinovi</strong>h enačb. Potrebovali bomo naslednje eksplicitne ocene.<br />

Lema 3.11.4. Naj bo f ε tako kot v (3.11.21),U α pa tako kot v (2.4.17). Tedaj za vsak r≥2<br />

veljajo ocene:<br />

cos r α<br />

M r (U α f ε )≤c r−1<br />

sin r−1 α M 1( f ) (3.11.22)<br />

M r (U α f ε )≤ c 1c r−2 cos r α<br />

ε sin r−2 α M 1( f ) (3.11.23)<br />

∣<br />

∣E(U α f ε ) (r) (Z) ∣ ∣∨ ≤ c r−1 cos r α M 1 ( f ) (3.11.24)<br />

kjer so konstante c r definirane tako kot v (2.5.19),|·| ∨ pa je injektivna tenzorska norma (glej<br />

razdelek D.8).<br />

DOKAZ. Očitno je M 1 ( f ε )≤M 1 ( f ). Poleg tega z odvajanjem enakosti:<br />

∫ (<br />

f ε(x)=<br />

′ f ′ (x+εz)φ d (z) dz= f<br />

∫R ′ (εy)φ d y− x )<br />

dy (3.11.25)<br />

ε<br />

d<br />

R d<br />

kjer jeφ d standardna d-razsežna normalna gostota, dobimo:<br />

f ε ′′ (x)=− 1 ∫ (<br />

f ′ (εy)φ ′ d<br />

y− x )<br />

dy=− 1 ∫<br />

f ′ (x+εz)φ ′ d<br />

(z) dz (3.11.26)<br />

ε R ε ε<br />

d R d<br />

(vsa odvajanja <strong>po</strong>d integralskim znakom upravičimo s trditvijo E.6.2). Iz leme 2.5.4<br />

zdaj dobimo oceno M 2 ( f ε )≤c 1 M 1 ( f )/ε. Iz dobljenih ocen za M 1 ( f ε ) in M 2 ( f ε ) ter ocene<br />

(2.5.24) dobimo oceni (3.11.22) in (3.11.23).<br />

i∈I


124 3.11 LIPSCHITZEVE TESTNE FUNKCIJE V VEČ DIMENZIJAH<br />

Izpeljimo še oceno (3.11.24). Naj bosta Z in Z ′ neodvisna standardna d-razsežna<br />

normalna slučajna vektorja. Tedaj velja:<br />

EU α f ε (x+Z)=E f ( cosα(x+Z)+sinαZ ′) =E f (cosαx+Z) (3.11.27)<br />

Sledi:<br />

∫<br />

E(U α f ε ) ′ (x+Z)=cosα<br />

Z nadaljnjim odvajanjem dobimo:<br />

∫<br />

E(U α f ε ) (r) (x+Z)=(−1) r−1 cos r α<br />

∫<br />

= (−1) r−1 cos r α<br />

R d<br />

∫<br />

f ε(cosαx+z)φ ′ d (z) dz=cosα<br />

R d<br />

R d<br />

R d<br />

f ε(y)φ ′ (r−1) (y−cosαx) dy=<br />

d<br />

f ε(cosαx+z)φ ′ (r−1) (z) dz<br />

d<br />

S <strong>po</strong>novno u<strong>po</strong>rabo leme 2.5.4 dobimo še oceno (3.11.24).<br />

f ′ ε(y)φ d (y−cosαx) dy<br />

(3.11.28)<br />

(3.11.29)<br />

in:<br />

Lema 3.11.5. Za <strong>po</strong>ljubne A, B in C≥0 velja:<br />

DOKAZ. Velja:<br />

∫ ∞<br />

0<br />

∫ ∞<br />

0<br />

∫ ∞<br />

0<br />

∫ ∞<br />

0<br />

min<br />

min<br />

{A, C }<br />

ds=2 √ AC (3.11.30)<br />

s 2<br />

{A, B s , C } [ (<br />

ds≤B 2+ ln AC ]<br />

s 2 B<br />

)+<br />

2<br />

(3.11.31)<br />

min<br />

{A, C } ∫ √ C/A ∫ ∞<br />

C<br />

ds= A ds+<br />

s 2 √<br />

0<br />

C/A s ds=2√ AC (3.11.32)<br />

2<br />

min<br />

{A, B s , C } ∫ B/A<br />

ds≤<br />

s 2<br />

= B<br />

0<br />

[<br />

2+<br />

A ds+<br />

(<br />

ln AC<br />

B 2 )+<br />

(∫ C/B<br />

∫ ∞<br />

B<br />

B/A s<br />

)+<br />

ds C<br />

+<br />

C/B s ds= 2<br />

] (3.11.33)<br />

DOKAZIZREKA 3.11.1. Naj bo Z∼N(0, I). Najprej trivialno ocenimo:<br />

∣<br />

∣E f (W)−E f (Z) ∣ ∣<br />

∣=<br />

∣∣(<br />

∣ ∣∣≤<br />

f (W)− f (0))−( f (Z)− f (0))<br />

≤ M 1 ( f )(E|W|+E|Z|)≤<br />

≤ M 1 ( f ) ( (E|W| 2 ) 1/2 + (E|Z| 2 ) 1/2) =<br />

= M 1 ( f ) ( (sl Var(W)) 1/2 + (sl Var(Z)) 1/2) =<br />

= 2 √ d M 1 ( f )<br />

(3.11.34)


3. STEINOVA METODA IN ODVISNOST 125<br />

To oceno smo izpeljali zato, ker bomo <strong>po</strong>trebovali, da je:<br />

δ := sup<br />

f∈♭ (1) (R d )<br />

M 1 ( f )>0<br />

|E f (W)−E f (Z)|<br />

M 1 ( f )<br />


126 3.11 LIPSCHITZEVE TESTNE FUNKCIJE V VEČ DIMENZIJAH<br />

Po drugi strani pa zaradi neodvisnosti velja:<br />

˜T ij (α)=E g ′′′ ( ˜W ij +η ˜R ij ) ˜R ij =<br />

∑<br />

= E g ′′′ ( ˜W ij +η ˜R ij )X (0) = ijk<br />

k∈K (0)<br />

ij<br />

=E g ′′′ (W)E ˜R ij −<br />

+<br />

∑<br />

k∈K (0)<br />

ij<br />

∑<br />

k∈K (0)<br />

ij<br />

E ( g ′′′ (W)− g ′′′ ( ˜W (0)<br />

ijk )) E X (0)<br />

ijk +<br />

E ( g ′′′ ( ˜W ij +η ˜R ij )− g ′′′ (W (0)<br />

ijk )) X (0)<br />

ijk<br />

(3.11.45)<br />

kjer jeηše ena slučajna spremenljivka, ki je <strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in<br />

neodvisna od vsega ostalega. Z u<strong>po</strong>rabo (3.11.22) ocenimo:<br />

in <strong>po</strong>dobno:<br />

∣<br />

∣g ′′′ (W)− g ′′′ ( ˜W (0) )∣ ∣ ∣∨ ≤ M<br />

ijk 4 (g) ∣ ∣ ˜R (0) ∣ cos<br />

∣≤c 3 α<br />

ijk 3<br />

sin 2 α M 1( f ) ∣ ∣ ˜R (0)<br />

∣ (3.11.46)<br />

ijk<br />

∣<br />

∣g ′′′ ( ˜W ij +η ˜R ij )− g ′′′ (W (0) )∣ ∣ cos 3 α<br />

∣∨ ≤ c<br />

ijk 3<br />

sin 2 α M 1( f ) ( (1−η) ∣ ∣R<br />

(0) ∣<br />

∣+η ∣ ijk ∣ ˜R ij + R (0)<br />

∣ ) (3.11.47)<br />

ijk<br />

Ocenimo še|E g ′′′ (W)| ∨ . Po eni strani z ne<strong>po</strong>sredno u<strong>po</strong>rabo leme 3.11.4 dobimo:<br />

{ c<br />

2<br />

}<br />

|E g ′′′ (W)| ∨ ≤ M 3 (g)≤cos 2 1<br />

α min<br />

ε , c 2<br />

M 1 ( f ) (3.11.48)<br />

sinα<br />

Po drugi strani pa lahko zapišemo:<br />

|E g ′′′ (W)| ∨ ≤|E g ′′′ (Z)| ∨ +|E g ′′′ (W)−Eg ′′′ (Z)| ∨ ≤<br />

( )<br />

≤ c 2 cos 2 cos 3 α<br />

α sinα+c 3<br />

sin 2 α δ M 1 ( f )<br />

(3.11.49)<br />

O<strong>po</strong>mba. Pri zgornji oceni smo u<strong>po</strong>rabili sklicevanje nase (angl. bootstrapping): pri<br />

ocenjevanju količineδsi <strong>po</strong>magamo prav s sklicevanjem na količinoδsamo. To deluje,<br />

čeδu<strong>po</strong>rabimo le v delu ocene, <strong>po</strong>membno pa je tudi, da smo se <strong>po</strong>prej prepričali,<br />

da je količinaδkončna. Na sklicevanju nase bodo temeljili tudi rezultati naslednjega<br />

<strong>po</strong>glavja.<br />

Iz ocen (3.11.48) in (3.11.49) sledi:<br />

(<br />

|Eg ′′′ (W)| ∨ ≤<br />

c 2 cos 2 α sinα+cosαmin<br />

{ c<br />

2<br />

})<br />

1<br />

ε , c 2<br />

sinα , c 3 δ<br />

M<br />

sin 2 1 ( f ) (3.11.50)<br />

α<br />

in iz (3.11.43), (3.11.45), (3.11.46), (3.11.47) in (3.11.50) zdaj dobimo:<br />

∣ ˜T ij (α) ∣ ( })<br />

∣∨ ≤ c 2 cos 2 α sinα+cosαmin<br />

+ min<br />

{<br />

c 3<br />

2c 1 ,<br />

sin 2 α<br />

{ c<br />

2<br />

1<br />

ε , c 2<br />

sinα , c 3 δ<br />

sin 2 α<br />

˜Ξ ij<br />

}<br />

cosαM 1 ( f )<br />

E ∣ ∣ ∣ ˜R ij<br />

∣ ∣∣M1<br />

( f )+<br />

(3.11.51)


3. STEINOVA METODA IN ODVISNOST 127<br />

kjer je:<br />

˜Ξ ij :=<br />

∑<br />

[<br />

E ∣ ∣X<br />

(0) ∣<br />

∣E ∣ ∣ ˜R (0) ∣<br />

∣+E ∣ ∣X<br />

(0)<br />

∣ ( (1−η) ∣ ∣R<br />

(0) ∣<br />

∣+η ∣ ∣ ˜R ij + R (0)<br />

∣ )] (3.11.52)<br />

k∈K (0)<br />

ij<br />

ijk<br />

ijk<br />

ijk<br />

ijk<br />

ijk<br />

(preprost izračun <strong>po</strong>kaže, da se količine ˜Ξ ij ujemajo s tistimi iz (3.11.8)). S substitucijo<br />

s=sinα v integral in u<strong>po</strong>rabo leme 3.11.5 dobimo:<br />

∫ π/2<br />

0<br />

∣ ˜T ij (α) ∣ ∣∨ dα≤M 1 ( f )E ∣ [ ∣<br />

∣<br />

∣∣ 1<br />

˜R ij<br />

3 c 2+<br />

≤<br />

{[<br />

7<br />

3 + (<br />

∫ ∞<br />

+ M 1 ( f )<br />

0<br />

ln c2 1 c 3δ<br />

c 2 2 ε )+<br />

∫ ∞<br />

0<br />

{ c<br />

2<br />

1<br />

min<br />

ε , c 2<br />

s , c } ]<br />

3δ<br />

ds +<br />

s 2<br />

{<br />

2c 1 , c }<br />

3<br />

s ˜Ξ 2 ij ds≤<br />

min<br />

]<br />

c 2 E ∣ }<br />

∣<br />

∣<br />

∣∣+2 ˜R ij<br />

√2c 1 c 3 ˜Ξ ij<br />

M 1 ( f )<br />

(3.11.53)<br />

Na <strong>po</strong>doben način lahko ocenimo tudi|T ij (α)| ∨ . Velja:<br />

T ij (α)=E<br />

[g ′′′( )(<br />

W ij +ηR ij +ηθR i (1−θ)Rij +θ(R i + R ij ) ) ∣ ∣∣∣<br />

]<br />

H ij<br />

(3.11.54)<br />

Brez škode za splošnost lahko privzamemo, da sta indeksni množiciK (1) inK (2) disjunktni.<br />

OznačimoK ∗ (1)<br />

ij ij<br />

:=K ∪K (2) . Za k∈K (1) definirajmo:<br />

ij ij ij ij<br />

X ∗ ijk :=θX(1),<br />

ijk R∗ ijk<br />

:= R(1) , ˜R ∗ ijk ijk := ˜R (1) , ijk W∗ ijk<br />

:= W(1) , ˜W ∗ ijk ijk := ˜W (1) (3.11.55)<br />

ijk<br />

Podobno za k∈K (2)<br />

ij<br />

X ∗ ijk<br />

<strong>po</strong>stavimo:<br />

:= (1−θ)X(2) , ijk R∗ ijk<br />

:= R(2) , ˜R ∗ ijk ijk := ˜R (2) , ijk W∗ ijk<br />

:= W(2) , ˜W ∗ ijk ijk := ˜W (2) (3.11.56)<br />

ijk<br />

Tedaj lahko zapišemo:<br />

[<br />

T ij (α)=E g ′′′( )<br />

W ij +ηR ij +ηθR i X<br />

∗<br />

ijk<br />

]<br />

∣<br />

∣H ij<br />

(3.11.57)<br />

in spet zaradi neodvisnosti velja:<br />

T ij (α)=E g ′′′ (W)E ( (1−θ)R ij +θ(R i + R ij ) ∣ )<br />

∣Hij −<br />

∑<br />

− E ( g ′′′ (W)− g ′′′ ( ˜W ∗ ijk )) E(X ∗ ijk |H ij)+<br />

k∈K ∗ ij<br />

∑ (g + E( ′′′ (W ij +ηR ij +ηθR i )X ∗ ijk − g′′′ (W ∗ ijk )) X ∗ )<br />

∣<br />

ijk∣H ij<br />

(3.11.58)<br />

k∈K ∗ ij


128 3.11 LIPSCHITZEVE TESTNE FUNKCIJE V VEČ DIMENZIJAH<br />

Podobno kot pri oceni integrala ∫ π/2<br />

| ˜T ij (α)| ∨ dα tudi tu ocenimo:<br />

kjer je:<br />

in:<br />

Ξ ij =<br />

∫ π/2<br />

0<br />

0<br />

∣<br />

∣T ij (α) ∣ {[ (<br />

7<br />

∣∨ dα≤<br />

3 + ln c2c ] }<br />

1 3δ<br />

c 2ε c 2 Y ij + 2<br />

√2c 1 c 3 Ξ ij M 1 ( f ) (3.11.59)<br />

2<br />

)+<br />

Y ij :=E ( (1−θ)|R ij |+θ|R i + R ij |<br />

k∈K ∗ ij<br />

ijk<br />

ijk<br />

ijk<br />

∣<br />

∣H ij<br />

)<br />

=<br />

1<br />

2 E( |R ij |+|R i + R ij |<br />

ijk<br />

∣<br />

)<br />

∣H ij<br />

(3.11.60)<br />

∑<br />

[ ∣∣∣X ∗ ∣<br />

E ∣E ∣ ∣R<br />

∗ ∣<br />

∣+ ∣ (<br />

∣X<br />

∗<br />

∣ (1−η) ∣ ∣R<br />

∗ ∣<br />

∣+η(1−θ) ∣ ∣Rij + R ∗ ∣<br />

ijk∣+ηθ ∣ ∣Ri + R ij + R ∗ )∣ ] ∣∣∣∣ ∣<br />

ijk<br />

H ij<br />

(3.11.61)<br />

Spet se lahko s krajšim računom prepričamo, da se slučajne spremenljivke÷ ij ujemajo<br />

s tistimi iz (3.11.9).<br />

Iz (3.11.42), (3.11.53) in (3.11.59) dobimo oceno:<br />

∣<br />

∣E f ε (W)−E f ε (Z) ∣ {[ (<br />

7 ∣≤<br />

3 + ln c2c ]<br />

1 3δ<br />

c 2ε c 2 β 1 + 2<br />

2<br />

)+<br />

√ }<br />

2c 1 c 3 β 2 M 1 ( f ) (3.11.62)<br />

kjer je:<br />

∑∑<br />

(<br />

β 1 := E|X i ||X ij | E|˜R ij |+ 1 2 |R ij|+ 1 )<br />

2 |R i+ R ij |<br />

i∈I j∈J i<br />

∑∑<br />

β 2 := E|X i ||X ij | (√ )<br />

˜Ξ ij +<br />

√Ξ ij<br />

j∈J i<br />

i∈I<br />

(3.11.63)<br />

(3.11.64)<br />

Če u<strong>po</strong>števamo še (3.11.37) in naredimo supremum <strong>po</strong> vseh testnih funkcijah f , dobimo:<br />

δ≤2ε √ [ (<br />

7<br />

d+<br />

3 + ln c2c ]<br />

1 3δ<br />

c 2ε c 2 β 1 + 2<br />

2<br />

)+<br />

√ 2c 1 c 3 β 2 (3.11.65)<br />

Količinoεlahko zaenkrat še <strong>po</strong>ljubno izbiramo. Če <strong>po</strong>stavimoε :=δ/(18 √ d) (lahko bi<br />

vzeli kar koli, kar je strogo manjše odδ/(2 √ d)), dobimo:<br />

δ≤ δ 9 + [<br />

7<br />

3 + ln 18c2 1 c 3<br />

c 2 2<br />

+ 1 2 ln d ]<br />

c 2 β 1 + 2 √ 2c 1 c 3 β 2 (3.11.66)<br />

Ker jeδ


3. STEINOVA METODA IN ODVISNOST 129<br />

DOKAZTRDITVE 3.11.2. Podobno kot pri zgledih 3.9.1 in 3.10.1 naj boJ i množica<br />

indeksov, ki so v grafu odvisnosti sosedni ali enaki i. Postavimo X ij := X j , pri razčlenitvah<br />

drugega reda paK (0) :=K (1) :=J<br />

ij ij i ∪J j inK (2) :=J<br />

ij j \J i ter ˜R ij := ∑ X<br />

k∈K (0) k in<br />

ij<br />

R ij := ∑ X<br />

k∈K (2) k (velja torej W ij = ˜W ij = ∑ k∈I\(J i ∪J j ) X k ).<br />

ij<br />

Konstruirati moramo še razčlenitve tretjega reda. ZaH ij vzemimo karσ-algebro, ki<br />

jo generirata X i in X j . Nato <strong>po</strong>stavimo:<br />

∑ ∑ ∑<br />

˜R (0) := X<br />

ijk l , R (0) := X<br />

ijk l − X l (3.11.68)<br />

l∈J k l∈J k l∈J i ∪J j<br />

(torej velja W (0)<br />

ijk = ˜W (0)<br />

ijk =∑ l∈I\J k<br />

X l ), za r=1, 2 pa <strong>po</strong>stavimo:<br />

∑ ∑<br />

˜R (r) := X<br />

ijk l , R (r) := ijk<br />

l∈J i ∪J j ∪J k<br />

l∈J k<br />

X l (3.11.69)<br />

(torej velja W (r) = ˜W (0) =∑ ijk ijk l∈I\(J i ∪J j ∪J k ) X l ). Ocena (3.11.7) se tako prevede na:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ∣≤M1 ( f ) [ ]<br />

(2,9+0,28 ln d)S 1 + 3,5 S 2<br />

(3.11.70)<br />

kjer je:<br />

∑∑<br />

(<br />

∑ ∑ ∑<br />

)<br />

S 1 := E|X i ||X j | 2 E|X k |+ |X k |+ |X k |<br />

j∈J i k∈J i ∪J j k∈J i ∪J j k∈J j \J i<br />

i∈I<br />

(3.11.71)<br />

in: ∑∑<br />

S 2 := E|X i ||X j | (√ )<br />

˜Ξ ij +<br />

√Ξ ij<br />

j∈J i<br />

i∈I<br />

(slučajne) spremenljivke ˜Ξ ij inΞ ij pa so definirane <strong>po</strong> predpisih:<br />

∑<br />

( ∑<br />

˜Ξ i := E|X k | E|X l |+ 1 ∑ ∑<br />

)<br />

|X l |+ |X l |<br />

2<br />

k∈J i ∪J j l∈J k l∈J k l∈J i ∪J j ∪J k<br />

(3.11.72)<br />

(3.11.73)<br />

in:<br />

Ξ i :=<br />

( ∑<br />

∑<br />

)<br />

+<br />

k∈J i ∪J j k∈J j \J i<br />

∑<br />

(<br />

1<br />

+<br />

4<br />

k∈J i ∪J j<br />

∑<br />

(<br />

1<br />

+<br />

4<br />

k∈J j \J i<br />

∑<br />

E|X k |E ( |X l | ∣ )<br />

∣Hij +<br />

l∈J i ∪J j ∪J k<br />

∑<br />

+ 1 ∑<br />

+ 1 12<br />

6<br />

l∈(J j ∪J k )\J i<br />

∑<br />

+ 1 ∑<br />

+ 1 6<br />

12<br />

l∈(J j ∪J k )\J i<br />

l∈J k \(J i ∪J j )<br />

l∈J k \(J i ∪J j )<br />

∑<br />

)<br />

E [ |X k ||X l |<br />

l∈J i ∪J j ∪J k<br />

∑<br />

)<br />

E [ |X k ||X l |<br />

l∈J i ∪J j ∪J k<br />

∣<br />

∣H ij<br />

]<br />

+<br />

∣<br />

]<br />

∣H ij<br />

(3.11.74)


130 3.11 LIPSCHITZEVE TESTNE FUNKCIJE V VEČ DIMENZIJAH<br />

Z u<strong>po</strong>rabo Jensenove neenakosti xyz≤ 1 3 (x3 + y 3 + z 3 ) <strong>po</strong>dobno kot v zgledu 3.9.2 (le<br />

malo bolj na grobo) ocenimo:<br />

S 1 ≤ 7D 2∑ i∈IE|X i | 3 (3.11.75)<br />

Z u<strong>po</strong>rabo iste neenakosti ocenimo tudi S 2 , le da pišemo:<br />

∑∑<br />

S 2 = E ( (3D) 1/3 |X i | )( (3D) 1/3 |X j | )[ (3D) −2/3(√ √ ) ] ˜Ξ ij + Ξ ij ≤<br />

i∈I j∈J i<br />

∑∑[<br />

≤ 2DE|X i | 3 + 2DE|X j | 3 + 1<br />

27D 2E ˜Ξ 3/2 + 1 ]<br />

ij<br />

27D 2EΞ3/2 ij<br />

i∈I j∈J i<br />

≤ 4D 2∑ E|X i | 3 + 1 ∑∑( )<br />

E ˜Ξ 3/2 +EΞ 3/2<br />

27D 2 ij ij<br />

i∈I<br />

i∈I j∈J i<br />

Z u<strong>po</strong>rabo neenakosti (3.11.17) in nato še Jensenove neenakosti ocenimo:<br />

E ˜Ξ 3/2<br />

ij<br />

≤<br />

(3.11.76)<br />

[ ∑ ( 3 ∣<br />

≤ ∣J k \ (J i ∪J j ) ∣ 1<br />

∣+<br />

∣<br />

∣) ]1/2<br />

∣∣<br />

∣J i ∪J j ∪J k ×<br />

2<br />

2<br />

k∈J i ∪J j<br />

∑<br />

[<br />

∑ (<br />

× E|Xk |E|X l | ) (<br />

3/2 1<br />

∑ ∑<br />

) (E|Xk<br />

+ + ||X l | ) 3/2]<br />

≤<br />

2<br />

k∈J i ∪J j l∈J k \(J i ∪J j )<br />

l∈J i ∪J j ∪J k l∈J k \(J i ∪J j )<br />

≤ √ ∑<br />

(<br />

3<br />

∑<br />

6 D + 1 ∑<br />

) (E|Xk<br />

| 3 +E|X l | 3) 4<br />

4<br />

k∈J i ∪J j l∈J k \(J i ∪J j ) l∈J i ∪J j ∪J k<br />

(3.11.77)<br />

Sledi:<br />

Podobno ocenimo:<br />

( ) 35 1/2<br />

(<br />

1<br />

EΞ 3/2 ≤<br />

ij<br />

3 8<br />

in sledi:<br />

+ 1 8<br />

∑<br />

∑<br />

∑∑<br />

i∈I<br />

∑<br />

k∈J i ∪J j l∈J k \(J i ∪J j )<br />

∑<br />

k∈J j \J i l∈J k \(J i ∪J j )<br />

+ 1 12<br />

∑∑<br />

i∈I<br />

j∈J i<br />

E ˜Ξ 3/2<br />

ij<br />

≤ 6 3/2 D 4∑ i∈IE|X i | 3 (3.11.78)<br />

+ 1 ∑ ∑<br />

+ 7 ∑ ∑<br />

+<br />

24<br />

12<br />

k∈J i ∪J j l∈(J j ∪J k )\J i k∈J i ∪J j l∈J i ∪J j ∪J k<br />

∑ ∑<br />

+ 13 ∑ ∑<br />

) (E|Xk<br />

| 3 +E|X l | 3)<br />

24<br />

l∈(J j ∪J k )\J i l∈J i ∪J j ∪J k<br />

k∈J j \J i<br />

EΞ 3/2<br />

ij<br />

j∈J i<br />

k∈J j \J i<br />

(3.11.79)<br />

( ) 35 3/2<br />

≤ D 4∑ E|X i | 3 (3.11.80)<br />

3<br />

i∈I<br />

Iz (3.11.76), (3.11.78) in (3.11.80) sedaj dobimo oceno:<br />

[<br />

S 2 ≤ 4+ 1 ( ( ) 35 3/2<br />

)]<br />

6 3/2 + D 2∑ i |<br />

27 3<br />

i∈IE|X 3 (3.11.81)


3. STEINOVA METODA IN ODVISNOST 131<br />

in iz (3.11.70), (3.11.81) in (3.11.81) <strong>po</strong> nekaj numeričnega ocenjevanja končno dobimo<br />

oceno (3.11.19).


132 3.11 LIPSCHITZEVE TESTNE FUNKCIJE V VEČ DIMENZIJAH


4.<br />

Ocene Berry–Esséenovega tipa<br />

4.1 Klasični Berry–Esséenov izrek<br />

V prejšnjem <strong>po</strong>glavju smo dobro razdelali u<strong>po</strong>rabo Steinove metode za vsote odvisnih<br />

slučajnih spremenljivk, oceno napake pa smo <strong>po</strong>dali bodisi v Wassersteinovi<br />

metriki bodisi v metriki, ki temelji na drugih odvodih testnih funkcij. Izpeljevali smo<br />

torej ocene tipa: ∣ ∣∣E f (W)−N(0, 1){ f}<br />

∣ ∣∣≤δ Mr ( f ) (4.1.1)<br />

ali ekvivalentno:<br />

d r<br />

(<br />

L(W), N(0, 1)<br />

)<br />

≤δ (4.1.2)<br />

za r=1, 2 (zL(W) smo označili <strong>po</strong>razdelitev slučajne spremenljivke W, d r pa so metrike<br />

iz (A.9.2)).<br />

V praksi (npr. v statistiki pri konstrukciji intervalov zaupanja) pa navadno dosti<br />

bolj prav pridejo ocene v metriki Kolmogorova, t. j. ocene količin:<br />

( ) ∣<br />

d K L(W), N(0, 1) = sup ∣P(W≤ x)−Φ(x) ∣ ∣ (4.1.3)<br />

kjer kot <strong>po</strong>navadi definiramo:<br />

x∈R<br />

Φ(x) := 1 √<br />

2π<br />

∫ x<br />

−∞<br />

e −z2 /2 dz (4.1.4)<br />

V razdelku A.8 smo dokazali, da konvergenca v metrikah d r implicira šibko konvergenco<br />

in v razdelku A.7 smo <strong>po</strong>kazali, da je šibka konvergenca proti normalni <strong>po</strong>razdelitvi<br />

ekvivalentna konvergenci v metriki Kolmogorova. Še več: v razdelku A.10<br />

smo razdaljo Kolmogorova eksplicitno ocenili z razdaljami d r – v (A.10.8) smo dokazali<br />

oceno:<br />

( ) ( ( ) ) 1/(r+1)<br />

d K L(W), N(0, 1) ≤ Cr d r L(W), N(0, 1) (4.1.5)<br />

Če smo torej za vsote neodvisnih slučajnih spremenljivk v Wassersteinovi metriki izpeljali<br />

hitrost konvergence O(n −1/2 ) (ki je, kot smo <strong>po</strong>kazali v zgledu 1.4.2, tudi dosežena),<br />

bi od tod sledilo, da je hitrost konvergence v metriki Kolmogorova vsaj reda O(n −1/4 ).<br />

133


134 4.1 KLASIČNI BERRY–ESSÉENOV IZREK<br />

Dobro pa je znano, da je za vsote neodvisnih slučajnih spremenljivk ta ocena hitrosti<br />

konvergence pregroba: tudi v metriki Kolmogorova se da izpeljati ocene, ki so istega<br />

velikostnega reda kot tiste v Wassersteinovi metriki. Natančneje, velja Berry–Esséenov<br />

izrek.<br />

Izrek 4.1.1 (Berry, Esséen). Naj bodo X i , i∈I, neodvisne slučajne spremenljivke, za<br />

katere velja ∑ i∈IE|X i |


4. OCENE BERRY–ESSÉENOVEGA TIPA 135<br />

Potrebovali bomo <strong>po</strong>splošeni Riemann–Stieltjesov integral ∫ ∞<br />

g d f , ki ga definiramo<br />

−∞<br />

kot ustrezno limito Riemann–Stieltjesovih vsot:<br />

n∑<br />

g(ξ i ) ( f ∗ (x i )− f ∗ (x i−1 ) ) (4.1.8)<br />

i=1<br />

kjer za x i jemljemo le točke, kjer se leva in desna limita funkcije f ujemata (take pa<br />

so vse razen kvečjemu števno mnogo); vrednost f ∗ (x) definiramo prav kot levo oz.<br />

desno limito funkcije f v točki x, če se ujemata. Obstoj in vrednost tako definiranega<br />

Riemann–Stieltjesovega integrala sta tako odvisna le od levih in desnih limit funkcije<br />

f .<br />

Tako definirani <strong>po</strong>splošeni Riemann–Stieltjesov integral obstaja, brž ko ima f omejeno<br />

totalno variacijo, funkcija g pa ima kvečjemu končno mnogo točk nezveznosti in<br />

v vseh se leva in desna limita funkcije f ujemata. Velja ocena:<br />

∫ ∞<br />

∣ g d f<br />

∣ ≤ M 0(g) V( f ) (4.1.9)<br />

Lema 4.1.2. Naj bo C>0. Naslednje trditve so ekvivalentne:<br />

−∞<br />

(1) Za <strong>po</strong>ljubne neodvisne slučajne spremenljivke X i , i∈I z vsoto W, za katere velja<br />

∑<br />

i∈IE|X i |


136 4.1 KLASIČNI BERRY–ESSÉENOV IZREK<br />

V lemi 1.4.1 smo <strong>po</strong>kazali, da za vsako zvezno funkcijo f z ∫ ∞<br />

f (x) /2<br />

−∞ e−x2 dx0 označimo:<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ ∣<br />

K α := sup<br />

α+ ∑ (4.1.16)<br />

i∈IE|X i | 3<br />

kjer supremum teče <strong>po</strong> vseh x∈R in vseh možnih vsotah W= ∑ i∈I X i neodvisnih<br />

slučajnih spremeljivk zE X i = 0 in var(W)=1. Očitno je K α ≤ 1/α


4. OCENE BERRY–ESSÉENOVEGA TIPA 137<br />

1<br />

f a,b (x)<br />

Slika 4.1.1<br />

a b x<br />

Velja:<br />

0≤N(0, 1){ f a,b }−Φ(a)=<br />

0≤Φ(b)−N(0, 1){ f a,b }=<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

b−x b−a<br />

φ(x) dx≤<br />

b−a 2 √ 2π<br />

x−a b−a<br />

φ(x) dx≤<br />

b−a 2 √ 2π<br />

(4.1.18)<br />

(4.1.19)<br />

Naj bo zdaj W= ∑ i∈I X i tako kot zgoraj in naj bo šeε>0. Tedaj lahko za vsak x∈R<br />

ocenimo:<br />

P(W≤ x)−Φ(x)≤E f x,x+ε (W)−N(0, 1){ f x,x+ε }+ ε<br />

2 √ 2π<br />

P(W≤ x)−Φ(x)≥E f x−ε,x (W)−N(0, 1){ f x−ε,x }− ε<br />

2 √ 2π<br />

(4.1.20)<br />

(4.1.21)<br />

Torej velja:<br />

∣<br />

sup∣P(W≤ x)−Φ(x) ∣ { ∣∣∣E<br />

∣≤sup fx,x+ε (W)−N(0, 1){ f x,x+ε } ∣ }<br />

∣<br />

x∈R<br />

x∈R<br />

+ ε<br />

2 √ 2π<br />

(4.1.22)<br />

Naj bo torej x∈Rin naj bo h rešitev Steinove enačbe:<br />

h ′ (w)−h(w)w= f x,x+ε (w)−N(0, 1){ f x,x+ε } (4.1.23)<br />

tako kot v lemah 1.4.1 in 4.1.3. Označimo W i := W− X i . Tedaj velja:<br />

E f x,x+ε (W)−N(0, 1){ f x,x+ε }=E [ h ′ (W)−h(W)W ] =<br />

∑<br />

= E [ ]<br />

h ′ (W i + X i )EXi− 2 h(W i + X i )X i<br />

i∈I<br />

(4.1.24)<br />

Taylorjev razvoj okoli W i nam da:<br />

∑<br />

E f x,x+ε (W)−N(0, 1){ f x,x+ε }= E [ h ′ (W i )EXi+ 2 h ′′ (W i +θX i )X i E Xi−<br />

2<br />

i∈I<br />

]<br />

− h(W i )X i − h ′ (W i )Xi− 2 (1−θ)h ′′ (W i +θX i )X 3 i<br />

(4.1.25)


138 4.1 KLASIČNI BERRY–ESSÉENOV IZREK<br />

kjer jeθtako kot <strong>po</strong>navadi <strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega<br />

ostalega. Zaradi neodvisnosti velja:<br />

∑ ( )<br />

E f x,x+ε (W)−N(0, 1){ f x,x+ε }= E T i Xi E Xi− 2 (1−θ)X 3 i<br />

(4.1.26)<br />

kjer je:<br />

i∈I<br />

T i :=E [ h ′′ (W i +θX i ) ∣ ∣ ∣ Xi ,θ ] (4.1.27)<br />

Pri oceni slučajnih spremenljivk T i bomo <strong>po</strong>dobno kot v razdelku 3.11 u<strong>po</strong>rabili razširjeno<br />

sklicevanje nase, le da bo to <strong>po</strong>tekalo v še širši obliki: medtem ko smo se v razdelku<br />

3.11 sklicevali le na slučajno spremenljivko W, se bomo tukaj sklicevali na celo družino<br />

vsot neodvisnih slučajnih spremenljivk.<br />

Pogojno na X i inθje W i +θX i tudi vsota neodvisnih slučajnih spremenljivk, zato<br />

<strong>po</strong> (4.1.16) in točki (3) leme 4.1.2 velja:<br />

∣<br />

∣T i − N ( θX i , var(W i ) ) ( )<br />

{h ′′ } ∣<br />

∣≤K α V(h ′′ ) α+var(W i ) −3/2∑ E|X i | 3 (4.1.28)<br />

i∈I\{i}<br />

Velja V( f x,x+ε )=2/ε, torej <strong>po</strong> lemi 4.1.3 velja V(h ′′ )≤4/ε. Ker je var(W i )=1−var(X i ),<br />

lahko nadalje ocenimo:<br />

∣<br />

∣T i − N ( θX i , var(W i ) ) {h ′′ } ∣<br />

∣≤ 4K (<br />

α α+(1−β 2/3 ) 3/2 β ) (4.1.29)<br />

ε<br />

kjer jeβ := ∑ i∈IE|X i | 3 , <strong>po</strong>d <strong>po</strong>gojem, da jeβ


4. OCENE BERRY–ESSÉENOVEGA TIPA 139<br />

Iz (4.1.26) ter ocen (4.1.29), (4.1.31) in (4.1.32) dobimo:<br />

∣<br />

∣E f x,x+ε (W)−N(0, 1){ f x,x+ε } ∣ [<br />

3 ∣≤<br />

2 √ α+β<br />

2π (1−β2/3 ) −1/2 + 6K α (1−β 2/3 )<br />

]β −3/2 (4.1.33)<br />

ε<br />

Zdaj pa pišimoε := (α+β)s in vse skupaj vstavimo v (4.1.22). Poleg tega bomo 1−β 2/3<br />

navzdol ocenili z neko fiksno konstanto. Natančneje, izberimo neki 0


140 4.1 KLASIČNI BERRY–ESSÉENOV IZREK<br />

2. Ocena var(W i )≥1−β 2/3 je razmeroma groba, <strong>po</strong>sebej če so slučajne spremenljivke<br />

X i <strong>po</strong>razdeljene enako. To je oceno konstante znatno <strong>po</strong>slabšalo, saj velja<br />

k 0 < 5,93 (Stein v IX. <strong>po</strong>glavju svoje monografije [125] dokaže Berry–Esséenov<br />

izrek za neodvisne in enako <strong>po</strong>razdeljene slučajne spremenljivke s konstanto 6).<br />

A tudi če ostanemo pri oceni z 1−β 2/3 , se da izboljšati konstanta v pavšalni oceni<br />

(4.1.35) (spet glej Chen in Shao [40]). Prav tako bi lahko u<strong>po</strong>rabili ocene, ki jih dobimo<br />

tako, da razdaljo Kolmogorova <strong>po</strong> trditvi A.10.2 ocenimo z Wassersteinovo<br />

razdaljo (tako v metriki Kolmogorova dobimo oceno oblike C √ β).<br />

3. V oceni (4.1.32) smo absolutno vrednost razlike ocenili kar z vsoto absolutnih<br />

vrednosti. Če bi u<strong>po</strong>števali, da gre dejansko za razliko, bi prav tako lahko izboljšali<br />

konstanto. Res pa je, da bi bila tovrstna izboljšava bolj ali manj omejena le na<br />

vsote neodvisnih slučajnih spremenljivk.<br />

4. Verjetno bi se dala konstanta izboljšati tudi z u<strong>po</strong>rabo bolj zapletene definicije<br />

konstant K α . V našem dokazu smo se sklicevali na totalno variacijo. Najboljše<br />

konstante so zaenkrat dale karakteristične funkcije. Tako bi konstante K α lahko<br />

definirali tudi s <strong>po</strong>močjo testnih funkcij oblike x↦→ e itx . Povezava med Steinovo<br />

metodo in karakterističnimi funkcijami je nakazana v članku, ki so ga napisali<br />

Bentkus, Götze in Tihomirov [23].<br />

5. Oba Steinova dokaza, omenjena na začetku razdelka, se v celoti izogneta glajenju.<br />

Posebno zanimiv je dokaz, opisan v Hojevem in Chenovem članku [66] (glej<br />

tudi avtorjevo magistrsko delo [94]), ki namesto na sklicevanju nase temelji na<br />

koncentracijski neenakosti, t. j. zgornji oceni verjetnostiP(a≤W≤ b) , kjer sta a in b<br />

blizu skupaj. Ta pristop sta u<strong>po</strong>rabila tudi Chen in Shao v člankih [40] in [41].<br />

kjer je:<br />

Dolžni smo še dokazati lemo 4.1.3.<br />

DOKAZLEME 4.1.3. Izhajali bomo iz naslednje različice formule (1.4.27):<br />

h (r+1) (w)=<br />

∫ ∞<br />

−∞<br />

⎧<br />

⎪⎨ −ψ (r+1) (w)Φ r+1 (−x)<br />

G(w, x) := ⎪⎩ ψ (r+1) (−w)Φ r+1 (x)<br />

G(w, x) d f (r) (x) (4.1.39)<br />

; wx<br />

(4.1.40)<br />

(za primer, ko je w=x, pustimo izraz G(x, w) nedefiniran). Formulo (4.1.39) <strong>po</strong>dobno<br />

kot v dokazu leme 1.4.1 izpeljemo iz formule (1.4.28) z integracijo per partes, velja pa<br />

<strong>po</strong>vsod, kjer je odvod h (r+1) definiran (če ima odvod dane absolutno zvezne funkcije<br />

omejeno totalno variacijo, je zvezen <strong>po</strong>vsod, kjer obstaja).<br />

Ocenimo:<br />

∣<br />

∣h (r+1) (w) ∣ ∣≤V( f (r) ;−∞, w)ψ (r+1) (−w)Φ r+1 (w)+V( f (r) ; w,∞)ψ (r+1) (w)Φ r+1 (−w) (4.1.41)<br />

kjer smo z V( f ; a, b) označili totalno variacijo funkcije f na intervalu (a, b). Iz zgornje<br />

ocene in še iz trditve C.3.4 že sledi (4.1.14).<br />

Iz formule (C.3.9) pa sledi, da ima funkcija w↦→ G(w, x) za vsak x totalno variacijo<br />

2. Od tod zdaj sledi tudi ocena (4.1.15).


4. OCENE BERRY–ESSÉENOVEGA TIPA 141<br />

4.2 Posplošitev na odvisne slučajne spremenljivke<br />

V prejšnjem razdelku smo videli, da se da <strong>po</strong> <strong>Steinovi</strong> <strong>metodi</strong> izpeljati tudi ocene v<br />

metriki Kolmogorova, ki so enake kakovosti kot ocene v Wassersteinovi metriki in so<br />

pravega velikostnega reda. Glavna odlika Steinove metode pa je, da se da preprosto<br />

<strong>po</strong>splošiti tudi na vsote slučajnih spremenljivk z določeno vrsto odvisnosti.<br />

Posplošitev Berry–Esséenovega izreka na vsote lokalno odvisnih slučajnih spremenljivk<br />

je izpeljal že Stein [124], in sicer za stacionarna za<strong>po</strong>redja slučajnih spremenljivk<br />

s končnimi osmimi momenti. Naslednji preboj je dosežen v Rinottovem članku [103],<br />

kjer je izpeljana <strong>po</strong>splošitev Berry–Esséenovega izreka na vsote slučajnih spremenljivk,<br />

ki morajo sicer biti omejene, zato pa imajo lahko splošnejšo strukturo lokalne odvisnosti<br />

in tudi ni nujno, da so enako <strong>po</strong>razdeljene. Chen in Shao [41] <strong>po</strong>data <strong>po</strong>splošitev<br />

na slučajne spremenljivke s končnimi tretjimi momenti, vendar pa njun rezultat na<br />

primeru vsot slučajnih spremenljivk, ki jih obravnava Rinott [103], da slabšo odvisnost<br />

konstante od stopnje grafa odvisnosti (v splošnem D 5 namesto D 2 ; je pa res, da v mnogih<br />

<strong>po</strong>membnih <strong>po</strong>sebnih primerih pride optimalna odvisnost, t. j. reda D 2 ). Chen in<br />

Shao <strong>po</strong>data tudi neenakomerne ocene.<br />

Veliko <strong>po</strong>splošitev je bilo izpeljanih tudi za primere, ko odvisnost ni lokalna. Barbour<br />

[7] izpelje ocene v metriki Kolmogorova za določene statistike na slučajnih grafih,<br />

Bolthausen [34] pa za slučajne permutacije. Nadalje Rinott in Rotar [105] izpeljeta<br />

oceno napake za t. i. antivoter model in utežene (predvsem izrojene) U-statistike. Goldstein<br />

[61] pa izpelje precej splošen izrek za slučajne spremenljivke, za katere je <strong>po</strong>dano<br />

sklapljanje s kumulativno premo utežitvijo.<br />

Tu pa bomo <strong>po</strong>dali oceno napake za slučajne spremenljivke z razčlenitvami drugega<br />

reda iz razdelka 3.9, a z določenimi omejitvami. Ponekod bomo namreč zahtevali<br />

omejenost. Z drugimi besedami, izpeljali bomo <strong>po</strong>splošitev Rinottovega rezultata [103].<br />

Rezultat, ki ga bomo izpeljali, je <strong>po</strong>seben primer avtorjevega rezultata iz [97], ki obravnava<br />

tudi velike odklone.<br />

Glavna težava pri dokazovanju Berry–Esséenovega izreka je bila ocena slučajnih<br />

spremenljivk:<br />

T i :=E [ h ′′ (W i +θX i ) ∣ ∣ ∣ Xi ,θ ] (4.2.1)<br />

iz (4.1.27). Te slučajne spremenljivke smo ocenili s <strong>po</strong>močjo razširjenega sklicevanja<br />

nase. Le-to pa pri vsotah odvisnih slučajnih spremenljivk <strong>po</strong>stane izjemno zapleteno,<br />

zato se bomo omejili na klasično sklicevanje nase (t. j. sklicevali se bomo le na približno<br />

normalnost slučajne spremenljivke W, ne pa tudi na približno normalnost drugih<br />

slučajnih spremenljivk). Tu pa <strong>po</strong>trebujemo omejenost. Natančneje, sklicali se bomo<br />

na dejstvo, da se, če slučajni spremenljivki W, ki je <strong>po</strong>razdeljena približno normalno,<br />

prištejemo slučajno spremenljivko R, ki je <strong>po</strong> absolutni vrednosti omejena zδ, razdalja<br />

Kolmogorova do normalne <strong>po</strong>razdelitve <strong>po</strong>veča za red velikostiδ. Tega ne moremo<br />

trditi za primer, ko ima R omejen le določen moment reda p, saj se v tem primeru<br />

razdalja lahko <strong>po</strong>veča za red velikosti (E|R| p ) 1/(p+1) (glej zgled 4.2.1). Sklicevanje nase<br />

nam bi torej pri slučajnih spremenljivkah s končnimi momenti določenega reda dalo<br />

slabšo oceno hitrosti konvergence.


142 4.2 POSPLOŠITEV NA ODVISNE SLUČAJNE SPREMENLJIVKE<br />

ZGLED 4.2.1. Naj bo kar W∼ N(0, 1), p>0inε>0. Definirajmo:<br />

⎧<br />

⎪⎨ −W ;|W|≤ε<br />

R := ⎪⎩ 0 ; sicer<br />

(4.2.2)<br />

Tedaj ni težko preveriti, da jeE|R| p velikostnega redaε p+1 . Po drugi strani pa je<br />

P(W+ R = 0) redaεin to je tudi red velikosti razdalje Kolmogorova od slučajne<br />

spremenljivke W+ R do standarne normalne <strong>po</strong>razdelitve. Skratka, ko greεproti nič,<br />

je ustrezna razdalja reda velikosti (E|R| p ) 1/(p+1) . □<br />

Opišimo zdaj različico razčlenitev, ki jih bomo <strong>po</strong>trebovali. Tako kot v razdelku 3.9<br />

naj bo W= ∑ i∈I X i in za vsak i∈I naj bo <strong>po</strong>dana slučajna spremenljivka W i , neodvisna<br />

od X i . Nadalje naj bo W− W i = ∑ j∈J i<br />

X ij in za vsak j∈J i naj bo <strong>po</strong>danaσ-algebra<br />

H ij , v kateri sta X i in X ij merljivi, in še slučajna spremenljivka W ij , neodvisna odH ij .<br />

Končno naj bosta <strong>po</strong>dani še slučajni spremenljivki ˜W ij in ¯W ij , pri čemer naj bo ˜W ij enako<br />

<strong>po</strong>razdeljena kot W ij .<br />

Razlike med zgoraj <strong>po</strong>danimi slučajnimi spremenljivkami naj bodo omejene na<br />

naslednji način: najprej naj za vsak i ∈ I in j ∈ J i obstajataH ij -merljivi slučajni<br />

spremenljivki U ′ ij<br />

in U′′<br />

ij<br />

, za kateri velja:<br />

|W i − W ij |≤U ′ ij , |W− W ij|≤U ′′<br />

ij<br />

(4.2.3)<br />

Nadalje naj obstajata taka konstanta ˜B ij in taka slučajna spremenljivka U ij , neodvisna<br />

od ¯W ij , da velja:<br />

| ˜W ij − ¯W ij |≤ ˜B ij , |W− ¯W ij |≤U ij (4.2.4)<br />

Končno naj bo dana še taka konstanta B ij , da jeP(U ij ≤ B ij )>0.<br />

Izrek 4.2.1. Naj bo W razčlenjena tako kot zgoraj in naj bo šeE X i = 0 in var(W)=1.<br />

Tedaj za vsak x∈Rvelja ocena:<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ ∑∑<br />

[<br />

∣≤2,33 E|X i X ij | U ′ ij + U′′ ij + 2 ˜B ij + 4B ij+ 2U<br />

]<br />

ij<br />

(4.2.5)<br />

P(U ij ≤ B ij )<br />

j∈J i<br />

i∈I<br />

O<strong>po</strong>mba. Če je razlika W− ˜W ij omejena, je najugodneje <strong>po</strong>staviti kar ¯W ij := W, tako<br />

da je <strong>po</strong>tem U ij = B ij = 0. Zgornji koncept pa dopušča, da je lahko razlika W− ˜W ij tudi<br />

neomejena, toda z neko slučajno spremenljivko, ki je neodvisna od ¯W ij . Opisana “neodvisna<br />

neomejenost” je <strong>po</strong>splošitev ideje, ki jo je u<strong>po</strong>rabil Barbour [7] pri izpeljevanju<br />

Berry–Esséenove ocene napake pri normalni aproksimaciji števila izoliranih dreves v<br />

slučajnem grafu.<br />

Slučajnih grafov se bomo dotaknili v 7. <strong>po</strong>glavju in tam bomo tudi <strong>po</strong>trebovali prej<br />

opisano “neodvisno neomejenost”. Razlika W− ˜W ij bo namreč neomejena, čeprav bodo<br />

sumandi X i omejeni.<br />

Izrek 4.2.1 bomo dokazali malo kasneje. Prej pa si oglejmo še <strong>po</strong>seben primer<br />

– končne družine enakomerno omejenih lokalno odvisnih slučajnih spremenljivk v<br />

skladu z definicijo iz zgleda 3.5.3. Naslednji izrek je različica Dembovega in Rinottovega<br />

[47] rezultata.


4. OCENE BERRY–ESSÉENOVEGA TIPA 143<br />

Izrek 4.2.2. Naj bo W= ∑ n<br />

i∈I X i in naj za družino X 1 ,...X n obstaja graf odvisnosti, v<br />

katerem ima vsako oglišče s samim seboj vred največ D sosedov. Poleg tega naj obstaja taka<br />

konstanta B, da za vsak i velja|X i |≤B. Če je šeE X i = 0 in var(W)=1, za vsak x∈R velja<br />

ocena:<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ ∑<br />

∣≤16,5 D 2 B E X 2 i<br />

(4.2.6)<br />

O<strong>po</strong>mba. Dembo in Rinott [47] izpeljeta oceno:<br />

i∈I<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ ∣ ∣≤7D 2 B 2∑ i∈IE|X i | (4.2.7)<br />

Znatno boljšo konstanto dosežeta z u<strong>po</strong>rabo razčlenitev prvega reda (glej razdelek 3.5).<br />

Je pa <strong>po</strong> drugi strani tudi res, da jeE X 2 ≤ BE|X<br />

i<br />

i |, in v resnici ocena (4.2.7) ni vedno<br />

boljša od ocene (4.2.6).<br />

DOKAZIZREKA 4.2.2. Za vsak i∈I:={1,...n} naj boJ i množica indeksov, ki so kot<br />

oglišča v grafu odvisnosti sosedni ali pa enaki i. Za vsak j∈J i <strong>po</strong>stavimo X ij := X j ,<br />

tako da je <strong>po</strong>tem W i = ∑ j∈I\J i<br />

X j . Nadalje za vsak i∈I in vsak j∈J i definirajmo<br />

H ij kotσ-algebro, ki jo generirata X i in X j . Postavimo še W ij := ˜W ij := ∑ k∈I\(J i ∪J j ) X k in<br />

¯W ij := W. Tedaj oceni (4.2.3) in (4.2.4) gotovo veljata za U ′ := DB, U′′ := ˜B<br />

ij ij ij := 2DB in<br />

U ij := B ij := 0. Če to zdaj vstavimo v (4.2.5), dobimo:<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ ∑<br />

∣≤16,5 DB<br />

i∈I<br />

∑<br />

Z u<strong>po</strong>rabo neenakosti xy≤(x 2 + y 2 )/2 pa že dobimo (4.2.6).<br />

j∈J i<br />

E|X i X j | (4.2.8)<br />

Lotimo se sedaj dokazovanja izreka 4.2.1. Potrebovali bomo še naslednji rezultat, ki<br />

nam bo omogočil sklicevanje nase.<br />

Lema 4.2.3. Naj bo f : R→[0,∞) merljiva funkcija in W taka slučajna spremenljivka,<br />

da za vsak t∈R velja ocenaE f (W+ t)≤1. Nadalje naj bosta dani še slučajni spremenljivki<br />

¯W in ˜W, za kateri velja:<br />

|W− ¯W|≤U, | ˜W− ¯W|≤ ˜B (4.2.9)<br />

kjer je ˜B konstanta, U pa slučajna spremenljivka, neodvisna od ¯W. Dana naj bo še konstanta B,<br />

za katero veljaP(U≤B)>0. Tedaj velja ocena:<br />

∫ W<br />

∣ E f (s) ds<br />

∣ ≤ ˜B+ 2B+E U<br />

P(U≤B)<br />

˜W<br />

(4.2.10)


144 4.2 POSPLOŠITEV NA ODVISNE SLUČAJNE SPREMENLJIVKE<br />

DOKAZ. Najprej za <strong>po</strong>ljubna R, S∈Rocenimo:<br />

∫ ¯W+S<br />

E f (s) ds=<br />

¯W+R<br />

≤<br />

=<br />

∫<br />

1<br />

¯W+S<br />

P(U≤B) E<br />

¯W+R<br />

∫<br />

1<br />

W+S+B<br />

P(U≤B) E<br />

1<br />

P(U≤B)<br />

W+R−B<br />

∫ S+B<br />

R−B<br />

≤ 2B+(S−R) +<br />

P(U≤B)<br />

f (s) ds 1(U≤B)≤<br />

f (s) ds=<br />

E f (W+ t) dt≤<br />

(4.2.11)<br />

Če zamenjamo R in S, dobimo še oceno:<br />

∫ ¯W+S<br />

E f (s) ds≥− 2B+(R−S) +<br />

¯W+R P(U≤B)<br />

(4.2.12)<br />

Namesto števil R in S pa lahko vzamemo <strong>po</strong>ljubni slučajni spremenljivki, ki sta skupno<br />

neodvisni od ¯W. Dobimo:<br />

Zdaj pa ocenimo:<br />

− 2B+E(R−S) +<br />

P(U≤B)<br />

∫ ¯W+S<br />

≤E f (s) ds≤ 2B+E(R−S) +<br />

¯W+R P(U≤B)<br />

(4.2.13)<br />

∫ W<br />

E<br />

˜W<br />

in <strong>po</strong>dobno:<br />

∫ ˜W<br />

E<br />

W<br />

∫ W ∫ ¯W+U− ˜B ∫ W<br />

f (s) ds≤E f (s) ds≤E f (s) ds+E f (s) ds≤ ¯B+ 2B+E U<br />

¯W− ˜B<br />

¯W− ˜B<br />

W− ˜B P(U≤B)<br />

(4.2.14)<br />

∫ ¯W+ ˜B ∫ W+ ˜B ∫ ¯W+ ˜B<br />

f (s) ds≤E f (s) ds≤E f (s) ds+E f (s) ds≤ ¯B+ 2B+E U<br />

W<br />

W<br />

¯W−U+ ˜B P(U≤B)<br />

(4.2.15)<br />

Ocena (4.2.10) je s tem dokazana.<br />

DOKAZIZREKA 4.2.1. Označimo:<br />

∣<br />

δ := sup∣P(W≤ x)−Φ(x) ∣ ∣ (4.2.16)<br />

x∈R<br />

Očitno jeδ≤1, torej jeδkončna količina. Nadaljujemo tako kot v dokazu klasičnega<br />

Berry–Esséenovega izreka. Tako kot v (4.1.22) za vsakε>0velja:<br />

∣<br />

δ≤sup∣E f x,x+ε (W)−N(0, 1){ f x,x+ε } ∣ ε ∣+<br />

x∈R<br />

2 √ (4.2.17)<br />

2π<br />

kjer je funkcija f x,x+ε definirana tako kot v (4.1.17). Naj bo zdaj h rešitev Steinove enačbe:<br />

h ′ (w)−h(w)w= f x,x+ε (w)−N(0, 1){ f x,x+ε } (4.2.18)


4. OCENE BERRY–ESSÉENOVEGA TIPA 145<br />

tako kot v lemah 1.4.1 in 4.1.3. Iz (3.9.8) dobimo:<br />

∑∑<br />

E f x,x+ε (W)−N(0, 1){ f x,x+ε }= E ( h ′ (W)−h ′ ( ˜W ij ) ) E X i X ij −<br />

i∈I j∈J i<br />

∑∑<br />

− E ( h ′ (W i +θR i )−h ′ (W ij ) ) (4.2.19)<br />

X i X ij<br />

j∈J i<br />

i∈I<br />

kjer jeθkot <strong>po</strong>navadi <strong>po</strong>razdeljena enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega.<br />

Združimo dobljeni vsoti v eno samo! Brez škode za splošnost lahko privzamemo,<br />

da obstaja slučajni vektor ( ˜W ∗, ¯W ∗, ij ij W∗, ij U∗ ), čigar <strong>po</strong>gojna <strong>po</strong>razdelitev glede naH ij ij<br />

inθse ujema z brez<strong>po</strong>gojno <strong>po</strong>razdelitvijo slučajnega vektorja ( ˜W ij , ¯W ij , W, U ij ). Tedaj<br />

velja: ∑∑<br />

E f x,x+ε (W)−N(0, 1){ f x,x+ε }= E T ij X i X ij (4.2.20)<br />

j∈J i<br />

kjer je:<br />

[∫ W ∗<br />

]<br />

ij<br />

T ij :=E h ′′ (s) ds<br />

∣ H ij,θ<br />

(4.2.21)<br />

W i +θR i<br />

Po lemi 4.1.3 je‖h ′′ ‖ 1 ≤ 2V( f x,x+ε )=2 in V(h ′′ )≤2V( f x,x+ε)/ε=4/ε. ′ Naj bo g z desne<br />

zvezna razširitev funkcije h ′′ . Tedaj je še vedno‖g‖ 1 ≤ 2 in V(|g|)=V(g)≤4/ε. Iz<br />

(4.2.16) in leme 4.1.2 dobimo:<br />

E [ |g(W ∗ ij + t)|∣ ∣ ∣Hij ,θ ] ≤ N(t, 1){|g|}+<br />

∣ E[ |g(W ∗ ij + t)|∣ ∣ ∣Hij ,θ ] − N(t, 1){|g|}<br />

∣ ≤<br />

i∈I<br />

≤ ‖g‖ 1<br />

√<br />

2π<br />

+δ V(|g|)≤<br />

(4.2.22)<br />

≤ 2 √<br />

2π<br />

+ 4δ<br />

ε<br />

Zdaj pa u<strong>po</strong>rabimo <strong>po</strong>gojno različico leme 4.2.3 glede naH ij inθter z W ∗ , ¯W ∗ , W ij ij i+θR i ,<br />

˜B ij + (1−θ)U ′ ij +θU′′ , ij U∗ in B ij ij v vlogah W, ¯W, ˜W, ˜B, U in B. Dobimo:<br />

)( )<br />

Torej velja:<br />

kjer je:<br />

|T ij |≤<br />

Iz (4.2.17) zdaj sledi:<br />

(<br />

2<br />

√<br />

2π<br />

+ 4δ<br />

ε<br />

(1−θ)U ′ ij +θU′′ ij + ˜B ij + 2B ij+E U ij<br />

P(U ij ≤ B ij )<br />

(4.2.23)<br />

∣<br />

∣E f x,x+ε (W)−N(0, 1){ f x,x+ε } ∣ ( 1 ∣≤ √ + 2δ<br />

)<br />

β (4.2.24)<br />

2π ε<br />

∑∑<br />

(<br />

β := E|X i X ij | U ′ ij + U′′ ij + 2 ˜B ij + 4B )<br />

ij+ 2U ij<br />

P(U ij ≤ B ij )<br />

j∈J i<br />

i∈I<br />

δ≤<br />

(<br />

1<br />

√ + 2δ<br />

)<br />

β+ ε<br />

2π ε 2 √ 2π<br />

(4.2.25)<br />

(4.2.26)


146 4.3 POSPLOŠITEV NA VEČRAZSEŽNI PRIMER<br />

Optimizacija <strong>po</strong>εnam da:<br />

δ≤√ β<br />

√<br />

βδ<br />

+ 2 4√ (4.2.27)<br />

2π 2π<br />

Iz zgornje kvadratne neenačbe in dejstva, da jeδkončna količina, pa <strong>po</strong> nekaj računanja<br />

dobimo ocenoδ≤2,33β, od koder sledi naš rezultat.<br />

4.3 Posplošitev na večrazsežni primer<br />

V tem razdelku bomo Berry–Esséenov izrek <strong>po</strong>splošili na več dimenzij. Natančneje,<br />

ocenjevali bomo količine:<br />

∣<br />

∣P(W∈ A)−N(0, I){A} ∣ ∣ (4.3.1)<br />

kjer je W vsota neodvisnih d-razsežnih slučajnih vektorjev zE W=0 in Var(W)=I,<br />

A⊆R d pa je dovolj lepa (npr. konveksna) množica.<br />

Oceno napake pri večrazsežni normalni aproksimaciji vsot neodvisnih slučajnih<br />

vektorjev so med drugim obravnavali Esséen [54], Bergström [26], von Bahr [3], Ranga<br />

Rao [98], [99], Sazonov [113], [114], Paulauskas [91] in Bhattacharya [28]. Pri tem<br />

so večinoma u<strong>po</strong>rabljali karakteristične funkcije. Dober splošen pregled večrazsežne<br />

normalne aproksimacije s <strong>po</strong>močjo karakterističnih funkcij je <strong>po</strong>dan v Bhattacharyevi<br />

in Ranga Raovi monografiji [29].<br />

Ocenjevanje napake s <strong>po</strong>močjo karakterističnih funkcij je v večrazsežnem primeru<br />

neprimerno bolj zapleteno kot v enorazsežnem. Bistveno bolje se v večrazsežnem primeru<br />

obnaša Lindeberg–Bergströmova metoda, še manj pa se v večrazsežnem primeru<br />

zaplete Steinova metoda, <strong>po</strong>sebej v primeru, ko slučajni vektorji niso enako <strong>po</strong>razdeljeni.<br />

Poleg tega so tako kot v enorazsežnem primeru možne tudi <strong>po</strong>splošitve na vsote<br />

odvisnih slučajnih vektorjev.<br />

Kolikor je avtorju znano, je Steinovo metodo za večrazsežno normalno aproksimacijo<br />

prvi u<strong>po</strong>rabil Götze [64]. V Bolthausnovem in Götzejevem članku [35] je <strong>po</strong>dana<br />

<strong>po</strong>splošitev na statistike slučajnih permutacij, a njun rezultat je v taki obliki, kot je<br />

formuliran, žal napačen (za protiprimer glej Chen in Shao [42]). Po avtorjevem mnenju<br />

se rezultat sicer da preformulirati v pravilno obliko, a dokazati bi ga bilo treba nekoliko<br />

drugače. Rinott in Rotar [104] pa sta izpeljala oceno napake za vsote lokalno odvisnih<br />

slučajnih spremenljivk, a z nekoliko slabšo hitrostjo konvergence (n −1/2 log n namesto<br />

n −1/2 ).<br />

Pri oceni napake je <strong>po</strong>membna tudi odvisnost konstante od dimenzije d. Rezultate<br />

z eksplicitno odvisnostjo od dimenzije, in sicer reda d, so izpeljali Nagajev [83], Senatov<br />

[119], Sazonov [115] in tudi Götze [64]. Pomemben napredek je dosegel Bentkus [21],<br />

ki je odvisnost konstante od dimenzije prevedel na velikost Gaussovega perimetra<br />

konveksne množice. Glede na dotlej znano oceno je tako dobil odvisnost reda d 1/2 .<br />

Zdaj vemo, da maksimalni Gaussov perimeter konveksne množice raste z d 1/4 (glej<br />

dodatek H) in temu primerno se je izboljšala tudi odvisnost konstante od dimenzije<br />

(glej Bentkus [22]).<br />

Bentkus izpelje svoj rezultat z Lindeberg–Bergströmovo metodo, in sicer za enako


4. OCENE BERRY–ESSÉENOVEGA TIPA 147<br />

<strong>po</strong>razdeljene slučajne vektorje. Tu bomo s Steinovo metodo dokazali različico za primer,<br />

ko slučajni vektorji niso nujno enako <strong>po</strong>razdeljeni.<br />

Izrek 4.3.1. Naj bodo X i , i∈I, neodvisni slučajni vektorji z vrednostmi vR d , za katere<br />

veljaE X i = 0 in var(W)=I, kjer je W= ∑ i∈I X i . Tedaj za vsako merljivo konveksno množico<br />

C⊆R d velja ocena:<br />

∣<br />

∣P(W∈ C)−N(0, I){C} ∣ ( ) ∑<br />

∣≤ 47+42 d<br />

1/4<br />

E|X i | 3 (4.3.2)<br />

Zgornji izrek sledi iz splošnejšega izreka 4.3.2, ki ga bomo formulirali v nadaljevanju,<br />

ter še zgleda 4.3.2.<br />

O<strong>po</strong>mba. Izrek 4.3.1 je <strong>po</strong>splošitev Bentkusovega [22] izreka na primer, ko slučajni<br />

vektorji niso nujno enako <strong>po</strong>razdeljeni. Nekoliko je izboljšana tudi konstanta: Bentkus<br />

sicer izpelje oceno s konstanto 400 d 1/4 , a slednja temelji na Ballovi [5] konstanti v<br />

oceni Gaussovih perimetrov konveksnih množic. Če grobo Ballovo oceno zamenjamo<br />

z oceno iz izreka H.1.3, nam Bentkusov <strong>po</strong>stopek da konstanto 64+59 d 1/4 , ki je še<br />

vedno nekoliko slabša od tiste v (4.3.2).<br />

O<strong>po</strong>mba. Kot smo že omenili, bi bila možna tudi <strong>po</strong>splošitev na odvisne slučajne<br />

vektorje, ki pa je tu ne bomo razdelali. Z u<strong>po</strong>rabo razčlenitev drugega reda bi dobili<br />

oceno reda n −1/2 log n, <strong>po</strong>dobno kot v Rinottovem in Rotarjevem članku [104]. Za oceno<br />

brez logaritemskega faktorja pa bi <strong>po</strong>trebovali razčlenitve tretjega reda, <strong>po</strong>dobno kot v<br />

razdelku 3.11.<br />

Odvisnost konstante od dimenzije v izreku 4.3.1 izvira iz rasti Gaussovih perimetrov<br />

konveksnih množic (izrek H.1.3). Ocena iz izreka H.1.3 da v splošnem pravi velikostni<br />

red; vseeno pa obstajajo <strong>po</strong>membne družine konveksnih množic, katerih perimetri<br />

rastejo <strong>po</strong>časneje ali pa se dajo sploh oceniti neodvisno od dimenzije (glej zgled 4.3.3).<br />

Zato bomo izrek 4.3.1 <strong>po</strong>splošili. Za formulacijo bomo <strong>po</strong>trebovali:<br />

• družinoAmerljivih, a ne nujno konveksnih množic vR d , ki je zaprta za translacije<br />

in raztege;<br />

• za vsako neprazno množico A∈Anaj bo <strong>po</strong>dana funkcijaδ A : A→[0,∞);<br />

• za vsako neprazno množico A∈A in vsakε>0 naj bosta <strong>po</strong>dani <strong>po</strong>dmnožici<br />

A ε , A −ε ∈A; <strong>po</strong>stavimo še∅ ε :=∅ −ε :=∅.<br />

Poleg tega bomo za vsak neprazen A∈Aprivzeli še naslednje:<br />

(P1) Za vsak x∈Anaj boδ A (x)=0.<br />

(P2) Funkcijaδ A naj bo neraztezna, t. j.|δ A (x)−δ A (y)|≤|x− y|.<br />

(P3) Za vsakε>0naj velja{x ;δ A (x)0naj bo bodisi A −ε =∅ bodisi naj velja{x ;δ A −ε(x)


148 4.3 POSPLOŠITEV NA VEČRAZSEŽNI PRIMER<br />

(P5) Množica{(x,ε)∈R d × (0,∞) ; x∈A ε } naj bo merljiva.<br />

(P6) Obstaja naj taka konstanta L 1 , da za <strong>po</strong>ljubenµ ∈ R d in <strong>po</strong>ljubno <strong>po</strong>zitivno<br />

definitno matrikoΣznajmanjšo lastno vrednostjoλ 2 , pri čemer jeλ>0, velja:<br />

{<br />

N(µ,Σ){A ε \ A}≤L 1 ε max 1, 1 } {<br />

in N(µ,Σ){A\A −ε }≤L 1 ε max 1, 1 }<br />

(4.3.3)<br />

λ λ<br />

(P7) Odvodδ ′ A naj bo na množici{x ;δ A(x)>0} lokalno Lipschitzev in obstaja naj taka<br />

konstanta L 2 , da velja:<br />

za vsak x, kjer jeδ ′ A odvedljiva.<br />

|δ ′′<br />

A (x)| ∨≤ L 2<br />

δ A (x)<br />

(4.3.4)<br />

Izrek 4.3.2. Naj bo W= ∑ i∈I X i tako kot v izreku 4.3.1 in naj boAdružina merljivih<br />

množic, ki iz<strong>po</strong>lnjuje zgornje zahteve. Tedaj za vsak A∈Avelja ocena:<br />

∣<br />

∣P(W∈ A)−N(0, I){A} ∣ { √ }∑<br />

∣≤max 27, 1+55L1 1+L2 E|X i | 3 (4.3.5)<br />

Če pa je družinaAzaprta tudi za afine transformacije, velja še nekoliko boljša ocena:<br />

∣<br />

∣P(W∈ A)−N(0, I){A} ∣ { √ }∑<br />

∣≤max 27, 1+50L1 1+L2 E|X i | 3 (4.3.6)<br />

Preden gremo dokazat zgornji izrek, si oglejmo še nekaj konkretnih primerov družin<br />

množic, za katere pride v <strong>po</strong>štev. Zahteve (P1)–(P7) so <strong>po</strong>trebne za konstrukcijo glajenja<br />

indikatorjev množic izA. Potrebujemo namreč funkcije, ki se bodo le malo razlikovale<br />

od indikatorjev, obenem pa bodo imele ustrezno omejene prve in druge odvode. Naša<br />

konstrukcija je <strong>po</strong>splošitev Bentkusove [21] ideje, pri kateri je kar:<br />

δ A (x)=dist(x, A) := inf|x− y| (4.3.7)<br />

y∈A<br />

Zgornja izbira je primerna za konveksne množice, saj velja naslednji rezultat, ki ga<br />

bomo dokazali kasneje.<br />

Lema 4.3.3. Naj bo C⊆R d konveksna množica inδ C tako kot v (4.3.7). Tedaj je funkcija<br />

δ C neraztezna, njen odvodδ ′ C pa je na to<strong>po</strong>loški zunanjosti množice C (Rd \ C) Lipschitzeva<br />

funkcija in za vsak x∈R d \ C, kjer je odvedljiva, velja:<br />

|δ ′′<br />

C (x)| ∨≤ 1<br />

δ C (x)<br />

i∈I<br />

i∈I<br />

(4.3.8)<br />

Posledica 4.3.4. Naj boAdružina merljivih konveksnih množic vR d , zaprta za translacije<br />

in raztege. Postavimoδ A tako kot v (4.3.7). Privzemimo še, da za vsakε>0 velja bodisi A ε :=<br />

{x ;δ A (x)≤ε}∈A bodisi A ε :={x ;δ A (x)ε}∈A. Nadalje naj velja še:<br />

N(0, I){A ε \ A}≤Lε in N(0, I){A\A −ε }≤Lε (4.3.9)<br />

Tedaj družinaAiz<strong>po</strong>lnjuje zahteve (P1)–(P7) za L 1 = L in L 2 = 1.


4. OCENE BERRY–ESSÉENOVEGA TIPA 149<br />

O<strong>po</strong>mba. Če je A konveksna, sta <strong>po</strong> trditvi H.1.1 tudi množici{x ; dist(x, A)≤ε}<br />

in{x ; dist(x,R d \ A)≥ε} konveksni. Podobno lahko to dokažemo tudi za množici<br />

{x ; dist(x, A)ε}.<br />

DOKAZPOSLEDICE 4.3.4. Zahtevi (P1) in (P3) sta očitni, zahtevi (P2) in (P4) sledita<br />

iz trikotniške neenakosti, zahteva (P5) pa sledi iz zveznosti razdalje. Nadalje zahteva<br />

(P7) sledi iz leme 4.3.3. Tako moramo preveriti le še, da iz (4.3.9) sledi (P6). Vzemimo<br />

neodvisna slučajna vektorja Z∼N(0, I) in R∼N(µ,Σ−λ 2 I). Tedaj je očitnoλ Z+R∼<br />

N(µ,Σ), zato je:<br />

N(µ,Σ){A ε \ A}=P ( λ Z+R∈A ε \ A ) =<br />

=P [ Z∈ ( λ −1 (A−R) ) ε/λ∖(<br />

λ −1 (A−R) )] ≤<br />

≤ Lε<br />

λ<br />

(4.3.10)<br />

Podobno dobimo tudi N(µ,Σ){A\A −ε }≤Lε/λ in rezultat je dokazan.<br />

Oglejmo si zdaj nekaj zgledov družinA.<br />

ZGLED 4.3.1. Družina vseh <strong>po</strong>ltrakov na realni osi iz<strong>po</strong>lnjuje zahteve (P1)–(P7) za<br />

L 1 = 1/ √ 2π in L 2 = 0, pri čemerδ A , A ε in A −ε <strong>po</strong>stavimo tako kot v <strong>po</strong>sledici 4.3.4.<br />

Podobno velja tudi za zaprte intervale, le s konstanto L 1 = 2/ √ 2π. □<br />

ZGLED 4.3.2. Po izreku H.1.3 družina vseh merljivih konveksnih množic vR d<br />

iz<strong>po</strong>lnjuje <strong>po</strong>goje (P1)–(P7) za L 1 = 0,64+0,59 d 1/4 in L 2 = 1. □<br />

ZGLED 4.3.3. Družina vseh krogel vR d iz<strong>po</strong>lnjuje <strong>po</strong>goje (P1)–(P7) za konstanto L 1 ,<br />

ki je neodvisna od dimenzije (glej Sazonov [114], [115]). □<br />

ZGLED 4.3.4. Pri elipsoidih funkcijeδ A ne moremo <strong>po</strong>staviti tako kot v (4.3.7),<br />

ker epsilonska okolica elipsoida v splošnem ni elipsoid. Pač pa lahko <strong>po</strong>stavimo<br />

δ A (x) := dist(Qx, A), kjer je Q primerna linearna transformacija. □<br />

Zgornji zgled je smiselno obravnavati splošneje.<br />

Trditev 4.3.5. Naj družinaAskupaj s funkcijamiδ A , množicamiA ±ε ter konstantama<br />

L 1 in L 2 iz<strong>po</strong>lnjuje <strong>po</strong>goje (P1)–(P7). Nadalje naj bo Q neizrojena linearna transformacija na<br />

R d . Tedaj tudi družina à :={QA ; A∈A} skupaj s primernimi funkcijami ˜δ à in množicami<br />

˜Υ ±ε Ã, ki igrajo vlogo množic A ±ε , iz<strong>po</strong>lnjuje <strong>po</strong>goje (P1)–(P7) za konstanti ˜L 1 :=‖Q‖‖Q −1 ‖ L 1<br />

in ˜L 2 := L 2 .<br />

DOKAZ. Označimo B :=‖Q‖ in b := 1/‖Q −1 ‖. Zaradi zaprtosti razredaAza raztege<br />

smemo brez škode za splošnost privzeti, da je B≥1. Postavimo:<br />

˜δ Ã (x) := bδ Q −1 Ã(Q −1 x), ˜Υ ±ε Ã := Q(Q −1 Ã) ±ε/b (4.3.11)


150 4.3 POSPLOŠITEV NA VEČRAZSEŽNI PRIMER<br />

Tedaj ni težko preveriti, da novi razredÃiz<strong>po</strong>lnjuje <strong>po</strong>goje (P1)–(P5). Naj bo zdaj<br />

µ∈R d ,Σpa <strong>po</strong>zitivno definitna matrika z najmanjšo lastno vrednostjoλ 2 , pri čemer<br />

naj boλ>0. Velja:<br />

N(µ,Σ) { ˜Υ ε Ã\Ã } = N(µ,Σ) { Q(Q −1 Ã) ε/b \ Ã } = N ( Q −1 µ, Q −1 Σ(Q −1 ) T){ (Q −1 Ã) ε/b \ Q −1 Ã }<br />

(4.3.12)<br />

Očitno je najmanjša lastna vrednost simetrične matrike Q −1 Σ(Q −1 ) T navzdol omejena z<br />

λ 2 /B 2 . Sledi:<br />

N(µ,Σ) { ˜Υ ε Ã\Ã } ε<br />

≤ L 1<br />

{1,<br />

b min B }<br />

≤ BL 1<br />

{1,<br />

λ b ε min 1 }<br />

λ<br />

(4.3.13)<br />

Podobno lahko izpeljemo tudi za Ã\ ˜Υ −ε Ã, torej razredÃiz<strong>po</strong>lnjuje <strong>po</strong>goj (P6) za<br />

˜L 1 = BL 1 /b=‖Q‖‖Q −1 ‖ L 1 . Končno velja še:<br />

∣ ˜δ ′′ Ã (x)∣ ∣ ∣∨ ≤<br />

δ ′′ Q −1Ã(Q−1 x)<br />

b<br />

≤<br />

L 2<br />

bδ Q −1 Ã(Q −1 x) = L 2<br />

˜δ Ã (x)<br />

(4.3.14)<br />

torej je iz<strong>po</strong>lnjen tudi <strong>po</strong>goj (P7) za ˜L 2 = L 2 .<br />

Podajmo še primer družine nekonveksnih množic.<br />

ZGLED 4.3.5. Naj boAdružina vseh unij intervalov na realni osi, katerih sredine so<br />

si narazen vsaj za∆>0. Ker elementi te družine niso nujno konveksne množice, ni<br />

rečeno, da je (4.3.7) primerna izbira za funkcijeδ A . To tudi v resnici ni primerna izbira,<br />

saj brž ko množica A∈A vsebuje vsaj dva intervala, funkcija x→dist(x, A) na sredini<br />

med njima ni zvezno odvedljiva.<br />

Funkcijoδ A bomo morali izbrati nekoliko bolj gladko. Kot že rečeno, je množica A<br />

unija intervalov od a i do b i , kjer je i=1, 2,...m ali pa i∈Z, <strong>po</strong>leg tega pa še a i ≤ b i ≤ a i+1<br />

in (a i+1 + b i+1 )/2≥(a i + b i )/2+∆. Za x∈[a i , b i ] mora bitiδ A (x)=0. Za b i ≤ x≤a i+1<br />

<strong>po</strong>stavimo:<br />

( ) 2 (<br />

1 ai+1 − b i<br />

δ A (x) :=<br />

⎡⎢<br />

a i+1 − b ⎣ − x− b ) 2<br />

i+ a i+1<br />

⎤⎥<br />

i 2<br />

2 ⎦ (4.3.15)<br />

Končno, če gre za končno unijo, za xb n pa<br />

δ A (x) := x−b m .


4. OCENE BERRY–ESSÉENOVEGA TIPA 151<br />

a 1 b 1 a 2 b 2 a 3 b 3 x<br />

Slika 4.3.1: konstrukcija funkcijeδ A za unijo treh intervalov<br />

Ni težko preveriti, da je funkcijaδ A neraztezna in da za b i < xb, <strong>po</strong>stavimo [a, b] :=∅). Ker<br />

pri konstrukcijah množic A ε in A −ε sredine intervalov ostanejo enake ali pa intervali<br />

bodisi izginejo bodisi se združijo, je še vedno A ε , A −ε ∈A.<br />

Preveriti je treba le še točko (P6). Velja:<br />

N(µ,σ 2 )(A ε \ A)≤ 1 ∫ 2ε ∑<br />

[ ( ai − t−µ<br />

) ( )]<br />

bi + t−µ<br />

φ +φ<br />

dt (4.3.16)<br />

σ 0 σ σ<br />

i<br />

N(µ,σ 2 )(A\A −ε )≤ 1 ∫ 0 ∑<br />

[ ( ai − t−µ<br />

) ( )]<br />

bi + t−µ<br />

φ +φ<br />

dt (4.3.17)<br />

σ σ σ<br />

−2ε<br />

i<br />

kjer jeφkot <strong>po</strong>navadi standardna normalna gostota, t. j.φ(x) := (1/ √ 2π)e −x2 /2 . Vsote<br />

izrazovφ((a i −t−µ)/σ) inφ((b i +t−µ)/σ) pa najprej razdelimo na vsote <strong>po</strong> indeksih, kjer<br />

so izrazi a i − t−µ in b i + t−µ <strong>po</strong>zitivni oziroma negativni. Ob u<strong>po</strong>števanju monotonosti<br />

funkcijeφter ocen:<br />

a i+n −a i ≥ a i+n−1+ b i+n−1<br />

2<br />

− a i+ b i<br />

2<br />

≥ (n−1)∆, b i+n −b i ≥ a i+n+ b i+n<br />

2<br />

<strong>po</strong> nekaj računanja končno dobimo oceno:<br />

max { N(µ,σ 2 )(A ε \ A), N(µ,σ 2 )(A\A −ε ) } ⎛<br />

4<br />

∞∑<br />

≤<br />

σ √ ⎜⎝<br />

2π<br />

2+ n=1<br />

( ∫<br />

4 ∞<br />

≤<br />

σ √ 2+<br />

2π 0<br />

8<br />

=<br />

σ √ 2π + 2 ∆ ≤<br />

(<br />

8<br />

≤ √ + 2 ) {<br />

max 1, 1 }<br />

2π ∆ σ<br />

− a i+1+ b i+1<br />

2<br />

e −n2 ∆ 2 /(2σ 2 )<br />

⎞<br />

e −∆2 x 2 /(2σ 2 )<br />

⎟⎠ ≤<br />

)<br />

=<br />

≥ (n−1)∆<br />

(4.3.18)<br />

(4.3.19)<br />

iz katere sledi tudi točka (P6).<br />

Lotimo se sedaj dokazovanja izreka 4.3.2. Pred tem formulirajmo še dve lemi. Prva<br />

zadeva glajenje indikatorjev konveksnih množic, druga pa bo ključna pri razširjenem<br />

sklicevanju nase.<br />


152 4.3 POSPLOŠITEV NA VEČRAZSEŽNI PRIMER<br />

Lema 4.3.6. Naj boAdružina množic, ki iz<strong>po</strong>lnjuje zahteve (P1)–(P5) in še (P7). Tedaj<br />

za vsak A∈Ain vsakε>0 obstajata funkciji f ε, A f−ε A<br />

∈♭(2) (R d ), za kateri velja:<br />

(1) 0≤ f ε A , f−ε A ≤ 1.<br />

(2) Za vsak x∈Aje f ε A (x)=1in za vsak x∈Aε je f ε A (x)=0.<br />

(3) Za vsak x∈A −ε je f −ε<br />

A<br />

(4) Veljajo ocene:<br />

= 1 in za vsak x∈Rd \ A je f −ε<br />

A (x)=0.<br />

M 1 ( f ε A )≤ 2 ε , M 1( f −ε<br />

A )≤ 2 ε , M 2( f ε A )≤ 4(1+L 2)<br />

, M<br />

ε 2<br />

2 ( f −ε<br />

A )≤ 4(1+L 2)<br />

(4.3.20)<br />

ε 2<br />

(5) Funkciji f ε in f−ε lahko zapišemo v obliki A A<br />

fε A (x)=P(x∈Aζ ) in f −ε(x)=P(x∈<br />

A<br />

(A −ε ) ζ ), kjer jeζprimerna slučajna spremenljivka.<br />

Lema 4.3.7. Naj boAdružina merljivih množic vR d , ki iz<strong>po</strong>lnjujejo zahteve (P1)–(P7).<br />

Nadalje naj bo W slučajni vektor z vrednostmi vR d , za katerega za vsak A∈A velja ocena:<br />

∣<br />

∣P(W∈ A)−N(µ,Σ)(A) ∣ ∣≤δ (4.3.21)<br />

kjer jeµ∈R d ,Σpa je <strong>po</strong>zitivno definitna matrika (oz. (1, 1)-tenzor). Tedaj tudi za vsakε>0<br />

in vsak 00.<br />

DOKAZIZREKA 4.3.2. Najprej dokažimo izrek za primer, ko je družinaAzaprta za<br />

afine transformacije. V tem primeru <strong>po</strong>dobno kot v (4.1.16) za vsakα>0definirajmo:<br />

∣<br />

∣P(W∈ A)−N(0, I){A} ∣ ∣<br />

K α := sup<br />

α+ ∑ (4.3.24)<br />

i∈IE|X i | 3<br />

kjer supremum teče <strong>po</strong> vseh A∈A in vseh možnih vsotah W= ∑ i∈I X i neodvisnih<br />

slučajnih vektorjev zE X i = 0 in Var(W)=I. Iz leme 4.3.6 in (4.3.3) sledi:<br />

0≤N(0, I){ f ε A }−N(0, I){A}≤N(0, I){Aε }−N(0, I){A}≤L 1 ε (4.3.25)<br />

0≤N(0, I){A}−N(0, I){ f −ε<br />

A }≤N(0, I){A}−N(0, I){A−ε }≤L 1 ε (4.3.26)


4. OCENE BERRY–ESSÉENOVEGA TIPA 153<br />

Naj bo zdaj W= ∑ i∈I X i tako kot zgoraj. Tedaj velja:<br />

Torej velja:<br />

P(W∈ A)−N(0, I){A}≤E f ε A (W)−N(0, I){ fε A }+L 1ε (4.3.27)<br />

P(W∈ A)−N(0, I){A}≥E f −ε<br />

A<br />

(W)−N(0, I){ f−ε<br />

A }−L 1ε (4.3.28)<br />

∣<br />

∣P(W∈ A)−N(0, I){A} ∣ ∣ ∣≤max<br />

{∣ ∣∣E f (W)−N(0, I){ f}<br />

∣ ∣∣ ; f∈{ f<br />

ε<br />

A , f−ε A }} + L 1 ε (4.3.29)<br />

Količino ∣ ∣<br />

∣E<br />

∣∣,<br />

f (W)−N(0, I){ f} kjer je f∈{ f<br />

ε<br />

, }<br />

A f−ε A , bomo ocenili z u<strong>po</strong>rabo trditve 2.5.1.<br />

Tehnični <strong>po</strong>goj (2.5.15) je iz<strong>po</strong>lnjen, ker iz trditve 2.5.2 in leme 4.3.6 sledi:<br />

∫ π/2<br />

0<br />

∫ π/2<br />

0<br />

M 1<br />

(<br />

Uα f ) tgαdα≤<br />

M 2<br />

(<br />

Uα f ) tgαdα≤<br />

∫ π/2<br />

0<br />

∫ π/2<br />

0<br />

M 1 ( f ) sinαdα≤ 2 ε<br />

(4.3.30)<br />

M 2 ( f ) sinαcosαdα≤ 2(1+L 2)<br />

ε 2 (4.3.31)<br />

Za oceno Steinovega matematičnega upanja najprej <strong>po</strong>dobno kot v (4.1.24)–(4.1.26)<br />

izpeljemo:<br />

E [ ∆U α f (W)−(U α f ) ′ (W)W ] ∑<br />

= E T i (α) ( )<br />

X i E Xi− 2 (1−θ)X 3 i<br />

i∈I<br />

(4.3.32)<br />

kjer so operatorjiU α definirani tako kot v (2.4.17),θje kot <strong>po</strong>navadi <strong>po</strong>razdeljena<br />

enakomerno <strong>po</strong> [0, 1] in neodvisna od vsega ostalega ter še:<br />

T i (α) :=E [ (U α f ) ′′′ (W i +θX i ) ∣ ∣ ∣ Xi ,θ ] (4.3.33)<br />

Količine T i (α) bomo ocenili z u<strong>po</strong>rabo <strong>po</strong>gojne različice leme 4.3.7 in sklicevanja nase.<br />

Slučajni vektor W i +θX i je <strong>po</strong>gojno na X i inθprav tako vsota neodvisnih slučajnih<br />

vektorjev, le da nima nujno matematičnega upanja nič in variance (kovariančne matrike)<br />

I. OznačimoΣ i := Var(W i )=Var(W i | X i ,θ) in privzemimo, da jeΣ i > 0 (za primer,<br />

ko je matrikaΣ i izrojena, bomo stvar dokazali <strong>po</strong>sebej). Ker je razredAzaprt za afine<br />

transformacije, iz (4.3.24) sledi:<br />

∣<br />

∣P(W i +θX i ∈ A|X i ,θ)−N(θX i ,Σ i ){A} ∣ ∣=<br />

= ∣<br />

∣P ( Σ −1/2 W<br />

i i ∈Σ −1/2 (A−θX<br />

i i )|X i ,θ ) − N(0, I) { Σ −1/2 (A−θX<br />

i i ) } ∣ ( ∣∣∣<br />

≤ K α α+ β )<br />

λ 3 i<br />

(4.3.34)<br />

kjer jeβ= ∑ i∈IE|X i | 3 ,λ 2 i<br />

pa je najmanjša lastna vrednost matrikeΣ i , pri čemer jeλ i > 0.<br />

Ker lahko za vsak enotski vektor u∈R d ocenimo:<br />

〈Σ i u, u〉=u T Σ i u=u T (I−E X i X T i )u=1−E〈X i, u〉 2 ≥ 1−E|X i | 2 ≥ 1−β 2/3 (4.3.35)


154 4.3 POSPLOŠITEV NA VEČRAZSEŽNI PRIMER<br />

velja tudiλ 2 i≥ 1−β 2/3 . Iz <strong>po</strong>gojne različice leme 4.3.7 dobimo:<br />

∫ π/2<br />

0<br />

|T i (α)| ∨ tgαdα≤ √ [<br />

2(1+L 2 )c 1 c 3 L 1 (1−β 2/3 ) −1/2 + 4K (<br />

α α+(1−β 2/3 ) −3/2 β )] +<br />

ε<br />

+ c 3<br />

6 (1−β2/3 ) −3/2 (4.3.36)<br />

seveda <strong>po</strong>d <strong>po</strong>gojem, da jeβ


4. OCENE BERRY–ESSÉENOVEGA TIPA 155<br />

Obravnavati moramo še primer, ko razredAni nujno zaprt za afine transformacije<br />

(še vedno pa mora biti zaprt za translacije in raztege). V tem primeru moramo biti<br />

previdnejši. Za <strong>po</strong>ljubneα>0in l 1 , l 2 ≥ 0 <strong>po</strong>stavimo:<br />

∣<br />

∣P(W∈ A)−N(0, I){A} ∣ ∣<br />

K(α, l 1 , l 2 ) := sup √ ∑<br />

(4.3.42)<br />

α+L 1 1+L2 i∈IE|X i | 3<br />

kjer supremum teče <strong>po</strong> vseh vsotah W = ∑ i∈I X i neodvisnih slučajnih vektorjev z<br />

E X i = 0 in var(W) = I, vseh množicah A ∈ A ter še vseh trojicah (A, L 1 , L 2 ), ki<br />

iz<strong>po</strong>lnjujejo <strong>po</strong>goje (P1)–(P7) in za katere velja L 1 ≥ l 1 in L 2 ≥ l 2 . Očitno je spet<br />

K(α, l 1 , l 2 )≤1/α0, A∈A in f∈{ f ε, A f−ε }. Nadaljnje<br />

A<br />

ocenjevanje <strong>po</strong>teka tako kot v primeru, ko smo privzeli zaprtost razredaAza afine<br />

transformacije. Prva razlika nastopi pri ocenjevanju količin T i (α) s <strong>po</strong>močjo leme 4.3.7,<br />

kjer u<strong>po</strong>rabimo sklicevanje nase. Pri ocenah količin:<br />

∣<br />

∣P ( Σ −1/2 W<br />

i i ∈Σ −1/2 (A−θX<br />

i i )|X i ,θ ) − N(0, I) { Σ −1/2 (A−θX<br />

i i ) } ∣ ∣∣∣<br />

(4.3.43)<br />

namreč zdaj razredAne zadošča. Toda <strong>po</strong> trditvi 4.3.5 razredà :={Σ −1/2 A ; A∈A}<br />

i<br />

iz<strong>po</strong>lnjuje zahteve (P1)–(P7) za konstanti ˜L 1 =Λ i L 1 /λ i in ˜L 2 = L 2 , kjer jeλ 2 najmanjša,<br />

i<br />

Λ 2 pa največja lastna vrednost matrikeΣ<br />

i i . Ocenimo lahkoΛ i ≤ (1+β 2/3 ) 1/2 . Tako<br />

namesto ocene (4.3.37) zdaj dobimo:<br />

∣<br />

∣E f (W)−N(0, I){ f} ∣ ∣ ∣≤<br />

c 3<br />

4 (1−β2/3 ) −3/2 β+<br />

+β √ [<br />

3L1<br />

2(1+L 2 )c 1 c 3<br />

2 (1−β2/3 ) −1/2 + 6K(α, l 1, l 2 )<br />

ε<br />

(<br />

)]<br />

√ (1+β 2/3 ) 1/2 β<br />

α+L 1 1+L2<br />

(1−β 2/3 ) 2<br />

(4.3.44)<br />

Spet izberimo 0


156 4.3 POSPLOŠITEV NA VEČRAZSEŽNI PRIMER<br />

√<br />

Oceni (4.3.45) in (4.3.46) delimo zα+βL 1 1+L2 in naredimo supremum <strong>po</strong> vseh vsotah<br />

W, vseh množicah A∈A in vseh družinahA. Ob u<strong>po</strong>števanju (4.3.42) in dejstva, da je<br />

K(α, l 1 , l 2 )


•<br />

•<br />

•<br />

•<br />

4. OCENE BERRY–ESSÉENOVEGA TIPA 157<br />

x<br />

p C (x)<br />

y<br />

Slika 4.3.2<br />

p C (y)<br />

Sledi:<br />

|x− y| 2 − ∣ ∣x− y−(pC (x)−p C (y)) ∣ 2<br />

∣ =|pC (x)−p C (y)| 2 + 2〈x−p C (x), p C (x)−p C (y)〉+<br />

+ 2〈y−p C (y), p C (y)−p C (x)〉≥<br />

≥ 0<br />

(4.3.50)<br />

Torej je:<br />

kjer je:<br />

|x− y|≥ ∣ ∣ ∣(x−pC (x))−(y−p C (y)) ∣ ∣ ∣=<br />

∣ ∣∣δC<br />

(x)u−δ C (y)v ∣ ∣ ∣ (4.3.51)<br />

u := gradδ C (x)= x−p C(x)<br />

|x−p C (x)| , v := gradδ C(y)= y−p C(y)<br />

|y−p C (y)|<br />

(4.3.52)<br />

Označimo r := min{δ C (x),δ C (y)}. Ker sta vektorja u in v enotska, velja:<br />

∣<br />

∣δ C (x)u−δ C (y)v ∣ ∣ ∣<br />

2<br />

− r 2 |u−v| 2 =δ 2 C (x)+δ2 C (y)−2r2 − 2 ( δ C (x)δ C (y)−r 2) 〈u, v〉≥<br />

≥δ 2 C (x)+δ2 C (y)−2r2 − 2 ( δ C (x)δ C (y)−r 2) =<br />

= ( δ C (x)−δ C (y) ) 2<br />

≥<br />

≥ 0<br />

(4.3.53)<br />

Torej je tudi:<br />

|x− y|≥r ∣ ∣gradδC (x)−gradδ C (y) ∣ ∣ (4.3.54)<br />

od koder že sledi naš rezultat.<br />

DOKAZLEME 4.3.6. Konstruirajmo najprej funkcijo f ε . Če je množica A prazna, vzemimo<br />

kar f ε≡ 0. Sicer pa bomo A fε konstruirali s <strong>po</strong>močjo funkcije:<br />

A<br />

A<br />

⎧<br />

1 ; x≤0<br />

⎪⎨ 1−2x 2 ; 0≤x≤1/2<br />

g(x) :=<br />

(4.3.55)<br />

2(1−x) 2 ; 1/2≤x≤1<br />

⎪⎩ 0 ; x≥1


158 4.3 POSPLOŠITEV NA VEČRAZSEŽNI PRIMER<br />

1<br />

g(x)<br />

−1 1<br />

Slika 4.3.3<br />

x<br />

Definirajmo:<br />

( )<br />

f ε A (x) := g δA (x)<br />

ε<br />

(4.3.56)<br />

Tedaj sta zahtevi (1) in (2) naše leme očitno iz<strong>po</strong>lnjeni. Pišemo lahko tudi:<br />

∫ 1<br />

[ ( )]<br />

f ε A (x)= δA (x)<br />

1 u< g du=P ( δ A (x)


4. OCENE BERRY–ESSÉENOVEGA TIPA 159<br />

Lema 4.3.8. Naj bo f : R d →R merljiva in omejena funkcija, 00. Tedaj<br />

za vsak r∈Nvelja ocena:<br />

∣<br />

∣N(µ,Σ) { (U α f ) (r)} ∣ ∣∣∣∨<br />

≤ M ∗ 0 ( f ) c r cos r α max{1,λ −r } (4.3.61)<br />

kjer je M ∗ 0 ( f ) := (sup f− inf f )/2, konstante c r pa so definirane tako kot v (2.5.19).<br />

DOKAZ. Naj bosta Z in Z ′ neodvisna standardna normalna vektorja vR d . Tedaj iz<br />

(2.4.17) dobimo:<br />

EU α f (Σ 1/2 Z+µ)=E f ( cosα(Σ 1/2 Z+µ)+sinαZ ′) =<br />

∫<br />

= f (cosαµ+Q α z)φ d (z) dz<br />

R d<br />

(4.3.62)<br />

kjer je Q α := (cos 2 αΣ+sin 2 α I) 1/2 ,φ d pa standardna d-razsežna normalna gostota. S<br />

substitucijo dobimo:<br />

∫<br />

(<br />

EU α f (Σ 1/2 Z+µ)= f (Q α y)φ d y−cosαQ<br />

−1<br />

αµ ) dy (4.3.63)<br />

in odvajanje <strong>po</strong>µnam da:<br />

R d<br />

E(U α f ) (r) (Σ 1/2 Z+µ)u 1 ...u r =<br />

∫<br />

= (−1) r cos r α<br />

R<br />

∫<br />

d<br />

= (−1) r cos r α<br />

R d<br />

f (Q α y)φ (r)<br />

d<br />

(<br />

y−cosαQ<br />

−1<br />

αµ ) (Q −1<br />

α u 1 )...(Q −1<br />

α u r ) dy=<br />

f (cosαµ+Q α z)φ (r)<br />

d (z)(Q−1 α u 1 )...(Q −1<br />

α u r ) dz<br />

(4.3.64)<br />

Torej velja:<br />

∣<br />

∣N(µ,Σ) { (U α f ) (r)} ∣ ∣∣∣∨<br />

= ∣ ∣E(Uα f ) (r) (Σ 1/2 Z+µ) ∣ ∣∨ ≤<br />

≤ cos r α ∥ ∣<br />

∥Q<br />

−1<br />

∣∣∣∣<br />

∫ ∣<br />

α∥ r ∣∣∣∣∨ (4.3.65)<br />

f (cosαµ+Q α z)φ (r) (z) dz d<br />

R d<br />

Z u<strong>po</strong>rabo ocene:<br />

∥<br />

∥Q −1<br />

α<br />

∥<br />

∥=(cos 2 αλ 2 + sin 2 α) −1/2 ≤ max{1,λ −1 } (4.3.66)<br />

in še leme 2.5.4 dobimo želeni rezultat.<br />

DOKAZLEME 4.3.7. Naj bo 0


160 4.3 POSPLOŠITEV NA VEČRAZSEŽNI PRIMER<br />

kjer je:<br />

Po lemi 4.3.6 velja:<br />

F(z) :=E( f ε A )′′ (cosαW+ sinαz) (4.3.68)<br />

Iz (4.3.3) sledi:<br />

|F(z)| ∨ ≤ 4(1+L 2)<br />

ε 2 P ( cosαW+ sinαz∈A ε \ A ) (4.3.69)<br />

N ( cosαµ+sinαz, cos 2 αΣ ) { }<br />

{A ε 1<br />

\A}≤L 1 ε max 1, ≤ L 1ε<br />

λ cosα cosα max{1,λ−1 } (4.3.70)<br />

Iz (4.3.21), zaprtosti razredaAza translacije, raztege in transformacije A ↦→ A ε in<br />

dejstva, da je A⊆A ε , pa sledi:<br />

∣<br />

∣P ( cosαW+ sinαz∈A ε \ A ) − N ( cosαµ+sinαz, cos 2 αΣ ) ∣ ∣∣∣<br />

≤ 2δ (4.3.71)<br />

Iz (4.3.69), (4.3.70) in (4.3.71) tako dobimo:<br />

|F(z)| ∨ ≤ 4(1+L 2)<br />

ε<br />

in iz leme 2.5.4 sledi:<br />

(<br />

L1<br />

cosα max{1,λ−1 }+ 2δ )<br />

≤ 4(1+L (<br />

2)<br />

L 1 max{1,λ −1 }+ 2δ<br />

ε ε cosα ε<br />

∣<br />

∣E(U α f ε A )′′′ (W) ∣ ∣∨ ≤ 4(1+L 2)c 1 cos 2 (<br />

α<br />

L 1 max{1,λ −1 }+ 2δ )<br />

ε sinα ε<br />

)<br />

(4.3.72)<br />

(4.3.73)<br />

Zaα≥βpaE(U α f ε A )′′′ (W) ocenimo drugače. Najprej <strong>po</strong> lemi 4.3.8 velja:<br />

∣<br />

∣N(µ,Σ) { ∣<br />

(U α f ε A )′′′} ∣∣∣∨<br />

≤ c 3 cos 3 α<br />

max{1,λ −3 } (4.3.74)<br />

2<br />

Za oceno ostanka spet u<strong>po</strong>rabimo trditev 2.4.7, a tokrat pišimo:<br />

∫<br />

(U α f ε A )′′′ (w)=− ctg 3 α f ε A (cosαw+sinαz)φ′′′ (z) dz (4.3.75)<br />

R d<br />

Sledi:<br />

E(U α f ε A )′′′ (W)−N(µ,Σ) { ∫<br />

(U α f ε A )′′′} =− ctg 3 α G(z)φ ′′′ (z) dz (4.3.76)<br />

R d<br />

kjer je:<br />

G(z) :=E f ε A (cosαW+ sinαz)−N( cosαµ+sinαz, cos 2 αΣ ) { f ε A } (4.3.77)<br />

Ker lahko <strong>po</strong> točki (5) leme 4.3.6 funkcijo f ε izrazimo z indikatorji samih merljivih<br />

A<br />

množic izA, lahko pred<strong>po</strong>stavko (4.3.21) u<strong>po</strong>rabimo tudi na funkcijah f ε . Če zraven<br />

A


4. OCENE BERRY–ESSÉENOVEGA TIPA 161<br />

u<strong>po</strong>števamo še zaprtost razredaAza translacije in raztege, dobimo|G(z)| ≤ δ.<br />

u<strong>po</strong>rabo (4.3.74), (4.3.76) in leme 2.5.4 tako dobimo:<br />

Z<br />

∣<br />

∣(U α f ε A )′′′ (w) ∣ ∣ ∣∨ ≤ c 3 cos 3 α<br />

2<br />

Iz (4.3.73) in (4.3.78) <strong>po</strong> integraciji dobimo:<br />

∫ π/2<br />

0<br />

∣<br />

∣E ( ∣ U α f ε A (W)) ′′′ ∣∣∨ tgαdα≤<br />

∫ β<br />

0<br />

≤ 4(1+L 2)c 1 tgβ<br />

ε<br />

max{1,λ −3 }+c 3 δ ctg 3 α (4.3.78)<br />

(<br />

4(1+L 2 )c 1 cosα<br />

L 1 max{1,λ −1 }+ 2δ )<br />

dα+<br />

ε ε<br />

∫ π/2<br />

( )<br />

cos 2 α sinα<br />

+ c 3 max{1,λ −3 }+δ ctg 2 α dα≤<br />

β 2<br />

(<br />

L 1 max{1,λ −1 }+ 2δ )<br />

+<br />

ε<br />

+ c 3<br />

6 max{1,λ−3 }+c 3 δ ctgβ<br />

(4.3.79)<br />

Zdaj pa kotβizberimo tako, da bo vsota členov zδoptimalna. To se zgodi, če <strong>po</strong>stavimo:<br />

β := arctg<br />

(<br />

ε<br />

√<br />

c3<br />

8(1+L 2 )c 1<br />

)<br />

(4.3.80)<br />

Če zdaj to vstavimo v (4.3.79), dobimo tisti del ocene (4.3.22), ki zadeva f ε A<br />

. Na čisto<br />

enak način pa dobimo tudi del, ki zadeva f −ε<br />

A .


162 4.3 POSPLOŠITEV NA VEČRAZSEŽNI PRIMER


II. del:<br />

Zgledi<br />

163


5.<br />

U<strong>po</strong>raba v statistiki<br />

Statistika na vzorcuξ 1 ,...ξ n je funkcija slučajnega vektorja (ξ 1 ,...ξ n ). Tu bomo<br />

obravnavali statistike, razčlenjene na naslednji način:<br />

∑<br />

W= X α (5.0.1)<br />

α⊆N n<br />

kjer jeN n ={1,...n}, <strong>po</strong>samezna slučajna spremenljivka X α pa je funkcija slučajnih<br />

spremenljivkξ i , i∈α. Seveda bi lahko vzeli kar trivialno razčlenitev X α = W za<br />

α=N n in X α = 0, a taka razčlenitev je v večini primerov neu<strong>po</strong>rabna. Mišljeno je, da<br />

je razčlenitev skoncentrirana na vsote slučajnih spremenljivk X α za majhne množiceα.<br />

Pomemben primer takih statistik so U-statistike, pri katerih so slučajne spremenljivke<br />

X α različne od nič le za množiceαdoločene moči: U-statistika reda r je statistika<br />

oblike: ∑<br />

W=<br />

F(ξ i1 ,...ξ ir ) (5.0.2)<br />

1≤i 1


166 5.1 NEODVISNO IZBIRANJE<br />

Pri študiju statistik (5.0.1) je bila u<strong>po</strong>rabljena tudi Steinova metoda. Tako Rinott in<br />

Rotar [105] obravnavata normalno aproksimacijo uteženih in izrojenih U-statistik vzorcev<br />

z neodvisnimi elementi, Zhao, Bai, Chao in Liang [131] pa izpeljejo Berry–Esséenov<br />

izrek za dvojno indeksirane permutacijske statistike (DIPS), t. j. statistike tipa (5.0.1),<br />

pri katerih so X α različni od nič le za množiceαmoči dve,ξ i pa tvorijo enostavni slučajni<br />

vzorec brez <strong>po</strong>navljanja. Avtorjeva prispevka [96] in [97] obravnavata statistike (5.0.1)<br />

v razmeroma splošni obliki: prvi izpelje ocene Lindebergovega tipa v več dimenzijah,<br />

a za gladke testne funkcije, drugi pa obravnava velike odklone.<br />

Čeprav so statistike (5.0.1) že dodobra raziskane, je, kolikor je avtorju znano, še<br />

vedno kar nekaj stvari, ki so vredne obravnave. Večina dosedanjih rezultatov je izpeljana<br />

za statistike, ki so simetrične statistike slučajnih spremenljivkξ 1 ,...ξ n , ki imajo<br />

vrednosti v realnih številih, močnejši rezultati pa so razdelani v glavnem le za U- in<br />

V-statistike, pa še to v glavnem le reda dve. Nobena od teh omejitev za Steinovo<br />

metodo ni bistvena ovira. Poleg tega se pri obravnavi statistik (5.0.1) večinoma u<strong>po</strong>rabljajo<br />

Hoeffdingove razčlenitve, pri katerih morajo biti vsote W (r) := ∑ |α|=r X α med seboj<br />

ortogonalne. Videli bomo, da pri <strong>Steinovi</strong> <strong>metodi</strong> to ni <strong>po</strong>trebno, kar obravnavo znatno<br />

olajša. Skratka, u<strong>po</strong>raba Steinove metode v statistiki <strong>po</strong> avtorjevem mnenju nikakor ni<br />

izčrpana do konca.<br />

V tem delu se bomo omejili le na ocene Berry–Esséenovega tipa za primer, ko so statistike<br />

omejene. To bomo storili z u<strong>po</strong>rabo izreka 4.2.1. Za Lipschitzeve testne funkcije<br />

bi lahko z u<strong>po</strong>rabo izrekov 3.9.1 in 3.10.5 izpeljali tudi ocene za neomejene statistike,<br />

natančneje ocene, ki bi se izražale s tretjimi momenti, in ocene Lindebergovega tipa.<br />

Prav tako bi lahko ocene <strong>po</strong>splošili na več dimenzij. Izpeljava sicer ne bi zahtevala nobene<br />

<strong>po</strong>sebne dodatne ideje, bila pa bi razmeroma tehnično zahtevna (glej npr. avtorjev<br />

prispevek [96]).<br />

Po avtorjevem mnenju bi bilo možno izpeljati tudi ocene Berry–Esseéenovega tipa,<br />

ki bi se izražale s tretjimi momenti, in celo večrazsežne ocene, kot nastopajo v izrekih<br />

4.3.1 in 4.3.2. Na ta način bi dobili široki <strong>po</strong>splošitvi Callaertovega in Janssenovega [36],<br />

Zhaovega in Chenovega [129] ter Zhaovega, Baijevega, Chaovega in Liangovega [131]<br />

rezultata. Za ta namen pa bi bilo <strong>po</strong>trebno tehniko dokazovanja iz razdelkov 4.1 in 4.3<br />

<strong>po</strong>splošiti na odvisne slučajne spremenljivke. Glavna težava pri tem bi bila formulacija<br />

indukcijske hi<strong>po</strong>teze, prav tako pa bi bilo ocenjevanje tehnično izjemno zahtevno.<br />

5.1 Neodvisno izbiranje<br />

Naj bo W tako kot v (5.0.1), kjer soξ 1 ,...ξ n neodvisne in enako <strong>po</strong>razdeljene slučajne<br />

spremenljivke. V tem primeru gre v resnici za lokalno odvisnost, ker sta slučajni<br />

spremenljivki X α in X β neodvisni, brž ko jeα∩β=∅. Vendar pa velikost okolic odvisnosti<br />

ni omejena, zato ne bomo mogli u<strong>po</strong>rabiti izrekov, ki smo jih izpeljali <strong>po</strong>sebej za<br />

lokalno odvisnost.<br />

Izrek 5.1.1. Privzemimo, da obstajajo take konstante B 1 ,...B n , da za vsakα⊆N n velja<br />

|X α |≤B |α| , kjer smo z|α| označili moč množiceα. Nadalje naj bo šeE X α = 0 in var(W)=1.


5. UPORABA V STATISTIKI 167<br />

Tedaj za vsak x∈Rvelja ocena:<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ ∣ ∣≤<br />

16,5 S 2 1 S 2<br />

n 2 (5.1.1)<br />

kjer je:<br />

S k :=<br />

n∑<br />

( )<br />

n<br />

r k B r (5.1.2)<br />

r<br />

r=1<br />

DOKAZ. U<strong>po</strong>rabili bomo izrek 4.2.1, in sicer na <strong>po</strong>doben način kot v dokazu izreka<br />

4.2.2 (ker gre prav tako kot v izreku 4.2.2 za lokalno odvisnost). Za vsakα⊆N n naj bo<br />

J α :={β⊆N n ;α∩β∅} in za vsakβ∈J β <strong>po</strong>stavimo X αβ := X β , tako da je <strong>po</strong>tem<br />

W α := ∑ β;α∩β=∅ X β res neodvisna od X α . Poleg tega definirajmoH αβ kotσ-algebro, ki jo<br />

generirajoξ γ ,γ∈α∪β. Postavimo še W αβ := ˜W αβ := ∑ γ;(α∪β)∩γ=∅ X γ in ¯W αβ := W. Ker<br />

je število s-elementnih <strong>po</strong>dmnožic množiceN n , ki imajo z dano r-elementno množico<br />

neprazen presek, navzgor omejeno z rs ( n<br />

s) /n, oceni (4.2.3) in (4.2.4) veljata za:<br />

U ′ αβ :=|β| n S 1, U ′′<br />

αβ := ˜B αβ := |α|+|β| S 1 , U αβ := B αβ := 0 (5.1.3)<br />

n<br />

Če to zdaj vstavimo v (4.2.5), dobimo:<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ ∣ ∣≤2,33 S1<br />

n∑<br />

(<br />

n<br />

r)<br />

r=1<br />

B r<br />

n∑<br />

s=1<br />

( )<br />

rs(3r+4s) n<br />

B<br />

n 2<br />

s = 2,33·7· S2S 1 2<br />

≤ 16,5 S2S 1 2<br />

s<br />

n 2 n 2 (5.1.4)<br />

Izrek je tako dokazan.<br />

Kot <strong>po</strong>seben primer u<strong>po</strong>rabe izreka 5.1.1 si oglejmo U-statistike. Zaα={i 1 , i 2 ,...i r },<br />

kjer so i 1 ,...i r sama različna števila, naj bo torej:<br />

X α := F(ξ i1 ,ξ i2 ,...ξ ir ) (5.1.5)<br />

kjer je F simetrična funkcija r spremenljivk (funkciji F pravimo jedro U-statistike); za<br />

|α|r pa naj bo X α := 0. Brez škode za splošnost bomo privzeli, da jeE X α = 0. Ni<br />

težko preveriti, da se varianca slučajne spremenljivke W izraža s formulo:<br />

( )<br />

n<br />

∑ r ()( )<br />

r n−r<br />

var(W)= κ l (5.1.6)<br />

r l r−l<br />

l=1<br />

kjer jeκ l =E X α X β , pri čemer je|α∩β|=l. Kovarianceκ l so odvisne le od jedra F in<br />

<strong>po</strong>razdelitve slučajnih spremenljivkξ i . S <strong>po</strong>gojevanjem na{ξ i ; i∈α∩β} se zlahka<br />

prepričamo, da jeκ l ≥ 0 za vsak l. Privzemimo še, da je naša U-statistika neizrojena, t. j.<br />

κ 1 > 0. Naslednja trditev je različica Callaertovega in Janssenovega [36] rezultata.


168 5.2 IZBIRANJE BREZ PONAVLJANJA<br />

Trditev 5.1.2. Naj bo W U-statistika, ki iz<strong>po</strong>lnjuje zgornje pred<strong>po</strong>stavke, in naj bo|F|≤B<br />

za neko konstanto B. Tedaj za vsak x∈Rvelja:<br />

∣<br />

∣P ( var(W) −1/2 W≤ x ) −Φ(x) ∣ 16,5 B3<br />

∣≤ √ (5.1.7)<br />

n<br />

DOKAZ. Iz izreka 5.1.1 sledi:<br />

∣<br />

∣P ( var(W) −1/2 W≤ x ) −Φ(x) ) ∣ ∣∣∣<br />

≤ 16,5 ( ) r3 B 3 3<br />

n<br />

(5.1.8)<br />

n 2 var(W) 3/2 r<br />

Toda ker jeκ l ≥ 0 za vsak l, iz (5.1.6) sledi:<br />

Od tod pa že sledi naš rezultat.<br />

κ 3/2<br />

1<br />

( )( ) ( ) 2<br />

n n−1<br />

var(W)≥r κ 1 = r2 n<br />

κ 1 (5.1.9)<br />

r r−1 n r<br />

5.2 Izbiranje brez <strong>po</strong>navljanja<br />

Oglejmo si še primer, ko jeξ 1 ,...ξ n enostavni vzorec brez <strong>po</strong>navljanja, vzet iz<br />

<strong>po</strong>pulacije velikosti N (opravka bomo torej imeli s statistikami končnih <strong>po</strong>pulacij). To<br />

je <strong>po</strong>splošitev zgledov iz slučajnih permutacij, ki smo jih navajali v 3. <strong>po</strong>glavju (le-te<br />

dobimo, če je X α = 0, brž ko je|α|>1). Dokazali bomo, da velja <strong>po</strong>doben rezultat kot<br />

izrek 5.1.1.<br />

Izrek 5.2.1. Če obstajajo take konstante B 1 ,...B n , da za vsakα⊆N n velja|X α |≤B |α| , ter<br />

če je šeE X α = 0 in var(W)=1, za vsak x∈Rvelja ocena:<br />

kjer so količine S k definirane tako kot v (5.1.2).<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ ∣ ∣≤<br />

159 S 2 1 S 2<br />

n 2 (5.2.1)<br />

DOKAZ. Pišemo lahko X α = h α (π), kjer jeπenakomerno <strong>po</strong>razdeljena slučajna permutacija<br />

naN N = {1,...N}, <strong>po</strong>samezna funkcija h α (π) pa je odvisna le od zožitve<br />

permutacijeπna množicoα. Razčlenitve bomo konstruirali tako kot v zgledu 3.9.3, t. j.<br />

na <strong>po</strong>dlagi slepih premestitev. Za vsakα⊆N n naj bo torejρ α slepa premestitev množice<br />

α v okviru množiceN N in cela družina{ρ α ;α⊆N n } naj bo neodvisna odπ. Po točki<br />

(2) trditve 3.9.3 je tedaj slučajna spremenljivka:<br />

∑ ∑<br />

W α := h β (π◦ρ −1<br />

α )= h ρα (β)(π◦ρ −1<br />

α ) (5.2.2)<br />

β⊆N n β⊆N N<br />

neodvisna od X α (za primer, koγni <strong>po</strong>dmnožicaN n , <strong>po</strong>stavimo h γ ≡ 0). Velja tudi<br />

W− W α = ∑ β⊆N N<br />

X αβ , kjer je:<br />

X αβ := h β (π)−h ρα (β)(π◦ρ −1<br />

α ) (5.2.3)


5. UPORABA V STATISTIKI 169<br />

Ni težko preveriti, da je <strong>po</strong>samezna slučajna spremenljivka X αβ merljiva glede naσalgebroH<br />

αβ , ki jo generirajo zožitev slučajne permutacijeπnaα∪β in slučajne premestitveρ<br />

α . Če zdaj vzamemo še eno družino slučajnih premestitevρ ′ β ,β⊆N N, ki je<br />

neodvisna odπin družine{ρ α ;α⊆N n }, je slučajna spremenljivka:<br />

W αβ :=<br />

∑<br />

γ⊆N n<br />

h γ<br />

(<br />

π◦(ρ<br />

′<br />

α∪β )−1) (5.2.4)<br />

neodvisna odH αβ .<br />

Po točki (1) trditve 3.9.3 se slučajna spremenljivka h γ (π◦(ρ ′ α∪β )−1 ) od slučajne spremenljivke<br />

h γ (π) razlikuje kvečjemu v primeru, ko jeγ∩(α∪β∪ρ ′ α∪β<br />

(α∪β))∅. Takih<br />

množicγ⊆N n dane moči t pa je kvečjemu 2(|α|+|β|)t ( n<br />

t) /n. Podobno se hγ (π◦(ρ ′ α∪β )−1 ) od<br />

slučajne spremenljivke h γ (π◦ρ −1<br />

α ) razlikuje, kvečjemu če jeγ∩(α∪ρ α (α)∪β∪ρ ′ α∪β (α∪β))<br />

∅, takih množic moči t pa je kvečjemu (3|α|+2|β|)t ( n<br />

t) /n. Če torej <strong>po</strong>stavimo še ˜W αβ := W αβ<br />

in ¯W αβ := W, oceni (4.2.3) in (4.2.4) veljata za:<br />

U ′ αβ<br />

6|α|+4|β|<br />

:= S 1 , U ′′<br />

αβ<br />

n<br />

:= ˜B αβ := 4(|α|+|β|) S 1 , U αβ := B αβ := 0 (5.2.5)<br />

n<br />

Če to zdaj vstavimo v (4.2.5), dobimo|P(W≤ x)−Φ(x)|≤2,33 S, kjer je:<br />

∑∣ ∣∣hα<br />

S := S 1 (π) ∣ ∑<br />

∣<br />

∣<br />

∣∣hβ<br />

(π)−h ρα (β)(π◦ρ −1<br />

α ) ∣ 18|α|+16|β| ∣<br />

n<br />

α⊆N n β⊆N N<br />

(5.2.6)<br />

Tudi slučajna spremenljivka h β (π) se od slučajne spremenljivke h ρα (β)(π◦ρ −1<br />

α ) razlikuje<br />

kvečjemu v primeru, ko jeβ∩(α∩ρ α (α))∅; takih množicβ⊆N n dane moči s pa je<br />

kvečjemu 2|α|s ( n<br />

s) /n, prav tako tudi tovrstnih množic moči s, za katere jeρα (β)⊆N n .<br />

Sledi:<br />

Izrek je tako dokazan.<br />

S≤S 1<br />

n∑<br />

(<br />

n<br />

r)<br />

r=1<br />

B r<br />

n∑<br />

s=1<br />

rs(36r+32s)<br />

n 2<br />

(<br />

n<br />

s<br />

)<br />

B s = 68 S2 1 S 2<br />

n 2 (5.2.7)<br />

O<strong>po</strong>mba. Konstanta v oceni (5.2.1) je znatno slabša od tiste v oceni (5.1.1). S<br />

pazljivejšim ocenjevanjem bi se jo dalo izboljšati, tako da bi v primeru, ko gre n/N proti<br />

nič, dobili oceno (5.1.1).<br />

Podobno kot v prejšnjem razdelku si tudi tu oglejmo U-statistike, t. j. primer, ko za<br />

|α|r velja X α = 0, zaα={i 1 ,...i r }, kjer so i 1 ,...i r sama različna števila, pa velja:<br />

X α = F(ξ i1 ,...ξ ir ) (5.2.8)<br />

kjer je F simetrična funkcija. Spet bomo brez škode za splošnost privzeli, da jeE X α = 0.<br />

Varianca naše U-statistike se prav tako izraža s formulo (5.1.6). Razlika pa je v tem,<br />

da so lahko kovarianceκ l tudi negativne. Ker je ocenjevanje variance var(W) navzdol<br />

razmeroma zapleteno, bomo oceno pri normalni aproksimaciji slučajne spremenljivke<br />

W <strong>po</strong>dali v manj eksplicitni obliki: obravnavali bomo za<strong>po</strong>redja W (k) = ∑ |α|=r X (k)<br />

α U-<br />

statistik enostavnih slučajnih vzorcev brez <strong>po</strong>navljanja velikosti n k iz <strong>po</strong>pulacij velikosti<br />

N k , ki iz<strong>po</strong>lnjujejo še naslednje <strong>po</strong>goje:


170 5.2 IZBIRANJE BREZ PONAVLJANJA<br />

(P1) Obstaja taka konstanta B, da je ∣ ∣X<br />

(k) ∣<br />

∣≤Bza vse k.<br />

(P2) lim inf k→∞ κ (k) > 0, kjer jeκ (k) =E X (k)<br />

1 l<br />

(P3) lim k→∞ n k =∞;<br />

α<br />

α X (k)<br />

β<br />

, pri čemer je|α∩β|=l.<br />

(P4) Obstaja taka konstanta b 0.<br />

l<br />

O<strong>po</strong>mba. Obravnavati bi se dalo tudi primer, ko je n k sicer blizu N k , toda še vseeno<br />

lim k→∞ (N k − n k )=∞. Bloznelis in Götze [30] namreč <strong>po</strong>kažeta, da se da vsaka U-<br />

statistika reda r, ki temelji na enostavnem slučajnem vzorcu brez <strong>po</strong>navljanja velikosti<br />

n, vzetem iz <strong>po</strong>pulacije velikosti N, zapisati kot linearna kombinacija U-statistik reda<br />

največ r, ki temeljijo na vzorcih velikosti N− n.<br />

Naslednji rezultat bomo dokazali malo kasneje.<br />

Lema 5.2.2. Pod <strong>po</strong>goji (P1)–(P4) velja:<br />

lim inf<br />

k→∞ n−(2r−1) k<br />

var(W (k) )>0 (5.2.9)<br />

Iz izreka 5.2.1 in zgornje leme takoj sledi naslednja različica Zhaovega in Chenovega<br />

[129] rezultata.<br />

Trditev 5.2.3. Naj bo W (k) za<strong>po</strong>redje U-statistik, ki temeljijo na enostavnih slučajnih<br />

vzorcih brez <strong>po</strong>navljanja velikosti n k , vzetih iz <strong>po</strong>pulacij velikosti N k . Velja najE W (k) = 0 in<br />

naj bodo iz<strong>po</strong>lnjeni še <strong>po</strong>goji (P1)–(P4). Tedaj obstaja taka konstanta C, da za dovolj velike k<br />

velja:<br />

∣<br />

∣P ( var(W) −1/2 W≤ x ) −Φ(x) ∣<br />

∣≤√ C<br />

(5.2.10)<br />

nk<br />

DOKAZLEME 5.2.2. Pišemo lahko X (k)<br />

α = F (k) (π (k) (α)), kjer jeπ (k) enakomerno <strong>po</strong>razdeljena<br />

slučajna injekcija izN nk vN Nk . Tedaj velja:<br />

κ (k)<br />

l<br />

=<br />

( Nk<br />

r<br />

1<br />

)( r Nk −r<br />

l)(<br />

r−l<br />

)<br />

∑<br />

A,B⊆N Nk<br />

|A|=|B|=r<br />

|A∩B|=l<br />

F (k) (A)F (k) (B) (5.2.11)<br />

Ker je ∑ B⊆N Nk<br />

F (k) (B)=0, velja:<br />

κ (k)<br />

0<br />

=−<br />

( Nk<br />

r<br />

1<br />

)( Nk −r<br />

r<br />

)<br />

r∑<br />

l=1<br />

∑<br />

A,B⊆N Nk<br />

|A|=|B|=r<br />

|A∩B|=l<br />

F (k) (A)F (k) (B)=−<br />

r∑<br />

l=1<br />

∑<br />

A,B⊆N Nk<br />

|A|=|B|=r<br />

|A∩B|=l<br />

( r Nk −r)<br />

l)(<br />

r−l<br />

) κ (k) (5.2.12)<br />

l<br />

( Nk −r<br />

r


5. UPORABA V STATISTIKI 171<br />

Torej velja:<br />

var ( W (k)) =<br />

(<br />

nk<br />

r<br />

)<br />

∑ r<br />

⎡( r<br />

⎢⎣ l<br />

l=1<br />

)( )<br />

nk − r<br />

−<br />

r−l<br />

( nk −r<br />

r<br />

)( r Nk −r)<br />

⎤<br />

l)(<br />

( Nk −r<br />

r<br />

Preprost račun <strong>po</strong>kaže, da lahko to prepišemo na naslednji način:<br />

kjer je:<br />

var ( W (k)) =<br />

R k =<br />

(<br />

nk<br />

r<br />

l=2<br />

)( ) (<br />

nk − r<br />

r<br />

r−1<br />

l−1<br />

( nk −2r+l<br />

l−1<br />

<strong>po</strong>d <strong>po</strong>gojem, da je n k > 2r−1. Ker je ∣ ∣ ∣κ<br />

(k)<br />

l<br />

|R k |≤<br />

)<br />

r−l<br />

)<br />

N k − n k<br />

N k − 2r+1 κ(k) + R<br />

1 k<br />

r∑<br />

( r r−1<br />

) ⎡ ( nk −2r+l)<br />

⎤<br />

l)(<br />

) ⎢⎣ 1− l<br />

)<br />

r∑<br />

l=2<br />

r!(r−1)!<br />

l! [ (r−l)! ] 2<br />

( Nk −2r+l<br />

l<br />

∣<br />

∣≤B 2 , lahko ocenimo:<br />

⎥⎦ κ(k) l<br />

(5.2.13)<br />

(5.2.14)<br />

⎥⎦ κ(k) l<br />

(5.2.15)<br />

B 2<br />

(n k − 2r+1) l−1 (5.2.16)<br />

Ker je lim inf k→∞ κ (k) > 0, obstaja tak a>0, da za dovolj velike k veljaκ (k) > a. Iz (5.2.14)<br />

1 1<br />

in (5.2.16) tako sledi:<br />

var ( W (k)) ≥ a(1−b)<br />

[<br />

(r−1)!<br />

] 2<br />

(n k − 2r+1) 2r−1 −<br />

−<br />

r∑<br />

l=2<br />

(5.2.17)<br />

B 2<br />

l! [ (r−l)! ] (n 2 k− 2r+1) 2r−l<br />

Od tod pa že sledi naš rezultat.


172 5.2 IZBIRANJE BREZ PONAVLJANJA


6.<br />

Statistike na grafih<br />

6.1 Število <strong>po</strong>vezav s krajiščema iste barve<br />

Naj boΓneusmerjen D-regularen graf z N oglišči (t. j. vsako oglišče ima natanko<br />

D sosedov, pri čemer oglišče samo ni vključeno). Oglišča grafa slučajno in neodvisno<br />

<strong>po</strong>barvamo z barvami iz končne ali števno neskončne množiceC, pri čemer <strong>po</strong>samezno<br />

oglišče <strong>po</strong>barvamo z i-to barvo z verjetnostjo p i ( ∑ i∈C p i = 1). Želeli bo oceniti napako<br />

pri normalni aproksimaciji slučajne spremenljivke W, ki predstavlja število <strong>po</strong>vezav, ki<br />

imajo obe krajišči iste barve.<br />

Širši problem (večrazsežno normalno aproksimacijo slučajnega vektorja, katerega<br />

i-ta kom<strong>po</strong>nenta predstavlja število <strong>po</strong>vezav, katerih obe krajišči sta i-te barve) obravnavata<br />

Goldsteinov in Rinottov [63] ter Rinottov in Rotarjev članek [104]. V prvem<br />

članku so <strong>po</strong>dane ocene za gladke testne funkcije, v drugem pa ocene <strong>po</strong>dobnega tipa<br />

kot v izreku 4.3.2, le z dodatnim faktorjem ln n in neraziskano odvisnostjo konstante<br />

od dimenzije. Še širše zastavljen problem pa obravnava tudi Goldstein [61].<br />

Izračunajmo najprej matematično upanje in varianco slučajne spremenljivke W.<br />

Pišimo W= ∑ e∈E(Γ) X e , kjer jeE(Γ) množica vseh <strong>po</strong>vezav grafaΓ, slučajna spremenljivka<br />

X<br />

∑ e pa je enaka ena, če sta krajišči <strong>po</strong>vezave e iste barve, sicer pa nič. Očitno jeE X e =<br />

i∈C p 2. Označimo: i<br />

S k :=∑<br />

p k i<br />

(6.1.1)<br />

Ker ima grafΓzaradi regularnosti natanko ND/2 <strong>po</strong>vezav, velja:<br />

i∈C<br />

E W= NDS 2<br />

2<br />

(6.1.2)<br />

Očitno za vsak e∈E(Γ) velja var(X e )=S 2 − S 2 ; za različni <strong>po</strong>vezavi e in f , ki imata<br />

2<br />

skupno krajišče, pa velja cov(X e , X f )=S 3 − S 2 . Ker spet zaradi regularnosti za vsako<br />

2<br />

<strong>po</strong>vezavo obstaja natanko 2(D−1) <strong>po</strong>vezav, ki so od dane <strong>po</strong>vezave različne, a imajo<br />

z njo skupno krajišče, od tod sledi:<br />

var(W)= ND [<br />

S2 − S 2 2<br />

2<br />

+ 2(D−1)( S 3 − S2)]<br />

2<br />

173<br />

(6.1.3)


174 6.2 LOKALNI MAKSIMUMI<br />

Očitno je S 2 ≥ S 3 . Torej velja:<br />

var(W)≥ ND(2D−1)(S 3− S 2 2 )<br />

2<br />

(6.1.4)<br />

O<strong>po</strong>mba. Desna stran v oceni (6.1.4) je vedno nenegativna, saj iz Cauchy–Schwarzeve<br />

neenačbe sledi:<br />

⎛ ⎞1/2<br />

∑ ∑ ∑ ∑<br />

S 2 = p 2 i= p 1/2 p 3/2 ≤<br />

i i ⎜⎝<br />

p i<br />

⎞⎟ ⎠<br />

1/2⎛⎜ ⎝<br />

p 3 i⎟⎠<br />

= S 1/2 (6.1.5)<br />

3<br />

i∈C<br />

i∈C<br />

Enakost velja natanko tedaj, ko vsa oglišča z verjetnostjo ena <strong>po</strong>barvamo z eno samo<br />

barvo.<br />

Slučajne spremenljivke X e so lokalno odvisne v skladu z definicijo iz razdelka 3.5.3,<br />

in sicer sta <strong>po</strong>vezavi e, f∈E(Γ) v grafu odvisnosti sosedni, če imata skupno krajišče.<br />

Vsaka <strong>po</strong>vezava e∈E(Γ) ima torej kot oglišče v grafu odvisnosti s samo seboj vred<br />

natanko 2D−1 sosed. Iz izreka 4.2.2 tako dobimo:<br />

∣<br />

∣P ( var(W) −1/2 (W−E W)≤x ) −Φ(x) ∣<br />

∣≤ 33(S 2− S 2)<br />

2<br />

√ ( 3/2<br />

(6.1.6)<br />

N S3 − S2) 2<br />

i∈C<br />

i∈C<br />

6.2 Lokalni maksimumi<br />

Naj boΓneusmerjen graf na n ogliščih, ki jih slučajno uredimo <strong>po</strong> velikosti, pri čemer<br />

so vse raz<strong>po</strong>reditve enako verjetne. Z drugimi besedami, naj boπenakomerno <strong>po</strong>razdeljena<br />

slučajna permutacija naN n :={1,...n}. Želeli bi oceniti napako pri normalni<br />

aproksimaciji slučajne spremenljivke W, ki označuje število lokalnih maksimumov slučajne<br />

permutacijeπ, t. j. število vseh oglišč i, za katere jeπ(i)>π(j), brž ko je oglišče j<br />

sosedno oglišču i.<br />

Normalno aproksimacijo števila lokalnih maksimumov obravnavajo Baldi, Rinott<br />

in Stein [4], Goldstein [61] ter Chen in Shao [41], vsi s <strong>po</strong>močjo Steinove metode.<br />

Pišemo lahko W= ∑ i∈I X i , kjer jeImnožica oglišč grafaΓ, slučajna spremenljivka<br />

X i pa je enaka ena, če je v i lokalni maksimum, sicer pa nič. Slučajne spremenljivke X i<br />

so lokalno odvisne: če zδ(i, j) označimo grafovsko razdaljo med ogliščema i in j, t. j.<br />

minimalno število <strong>po</strong>vezav, ki jih moramo prehoditi, da pridemo od i do j, sta nabora<br />

slučajnih spremenljivk{X i ; i∈A} in{X j ; j∈B} neodvisna, brž ko za <strong>po</strong>ljubna i∈A in<br />

j∈B veljaδ(i, j)>2. To je <strong>po</strong>sledica znanega dejstva, da za <strong>po</strong>ljubne različne indekse<br />

i 1 ,...i r in j 1 ,... j s velja, da je slučajni vektor (π(i 1 ),...π(i r )) neodvisen od dogodka, da<br />

jeπ(j 1 )


6. STATISTIKE NA GRAFIH 175<br />

Izračunati in oceniti moramo še matematično upanje in varianco. Omejili se bomo le<br />

na primer, ko je grafΓregularen (torej (D−1)-regularen). V tem primeru je očitno<br />

E X i = 1/D in var(X i )=(D−1)/D 2 . Izračun variance cele vsote W pa je nekoliko težji.<br />

Lema 6.2.1. Pri zgornjih <strong>po</strong>gojih velja:<br />

var(W)=<br />

∑<br />

i,j;δ(i,j)=2<br />

s(i, j)<br />

D 2 (2D−s(i, j)) ≥ (6.2.2)<br />

≥ n(D−1)(D−2)−6T<br />

2D 3 (6.2.3)<br />

kjer smo z s(i, j) označili število skupnih sosedov oglišč i in j (brez oglišč i in j samih), s T pa<br />

število trikotnikov v grafu.<br />

Iz ocene (6.2.1) in zgornje leme <strong>po</strong> krajšem računu dobimo, da za D>2 velja:<br />

∣<br />

∣P ( var(W) −1/2 (W−E W)≤x ) −Φ(x) ∣<br />

√ n<br />

∣≤ 47D9/2<br />

( ) D−1 3/2<br />

( ) −3/2<br />

6T<br />

1−<br />

D−2 n(D−1)(D−2)<br />

(6.2.4)<br />

O<strong>po</strong>mba. Primer, ko je D=2, je trivialen, saj je tak graf unija ne<strong>po</strong>vezanih daljic in<br />

število lokalnih maksimumov je konstantno.<br />

DOKAZLEME 6.2.1. Zaradi lokalne odvisnosti lahko pišemo:<br />

∑ ∑ ∑<br />

var(W)= var(X i )+ cov(X i , X j )+ cov(X i , X j ) (6.2.5)<br />

i∈I<br />

i,j;δ(i,j)=1<br />

i,j;δ(i,j)=2<br />

Očitno je var(X i )=(D−1)/D 2 . Če jeδ(i, j)=1, torej če sta točki i in j različni in sosedni, ne<br />

moreta biti obe hkrati lokalna maksimuma. Torej jeE X i X j = 0 oz. cov(X i , X j )=−1/D 2 .<br />

Po krajšem računu tako dobimo:<br />

∑ ∑<br />

var(X i )+ cov(X i , X j )=0 (6.2.6)<br />

i∈I<br />

i,j;δ(i,j)=1<br />

Kovarianco moramo izračunati le še za primer, ko jeδ(i, j)=2. Za ta primer moramo<br />

torej izračunati verjetnost, da sta oglišči i in j obe lokalna maksimuma. To bo dvakratna<br />

verjetnost dogodka, da sta oglišči i in j obe lokalna maksimuma ter šeπ(i)


176 6.3 NASHEVA RAVNOTEŽJA<br />

verjetnost za zadnje oglišče iz B je enaka (2D−s(i, j)−1)(2D−s(i, j)), za preostala oglišča<br />

pa je vseeno, kam pridejo. Ko vse skupaj zmnožimo, dobimo, da je verjetnost dogodka,<br />

da sta oglišči i in j obe lokalna maksimuma, enaka 2/(D(2D−s(i, j))). Po krajšem računu<br />

sledi:<br />

s(i, j)<br />

cov(X i , X j )=<br />

(6.2.7)<br />

D 2 (2D−s(i, j))<br />

od koder dobimo (6.2.2). Ocenimo var(W)≥S/(2D 3 ), kjer je:<br />

∑ ∑<br />

S := s(i, j)= 1 ( i∼ j∼k, oglišča i, j, k so različna in ne tvorijo trikotnika )<br />

i,j;δ(i,j)=2<br />

i,k,j<br />

(6.2.8)<br />

kjer smo z∼označili relacijo sosednosti. Ni težko videti, da je S=n(D−1)(D−2)−6T<br />

in lema je dokazana.<br />

6.3 Nasheva ravnotežja<br />

Denimo, da p igralcev igra igro, v kateri vsak izmed njih lahko igra z eno izmed s<br />

t. i. čistih strategij. Označimo z i={i 1 ,...i p }∈N p s, kjer jeN s ={1,...s}, vektor njihovih<br />

strategij, z V (k) pa dobiček k-tega igralca pri danem vektorju strategij i. Pravimo, da je<br />

i<br />

v i doseženo Nashevo ravnotežje, če za vsak vektor j=(i 1 ,...i k−1 , j, i k+1 ,...i p ), j∈N s , in<br />

za vse k∈N p velja V (k) ≥ V (k) . Tovrstna ravnotežja je Nash uvedel v člankih [85] in [86]<br />

i j<br />

(glej tudi npr. Černe [44]).<br />

Tu bomo obravnavali<br />

)<br />

igre s slučajnimi dobitki, in sicer takimi, da so vektorji dobič-<br />

p<br />

, i∈N<br />

kov V i = ( V (1) ,...V (p)<br />

i i<br />

s=:I, neodvisni in enako <strong>po</strong>razdeljeni. Zanimala nas bo<br />

<strong>po</strong>razdelitev števila Nashevih ravnotežij. Asimptotično obnašanje <strong>po</strong>razdelitve tega<br />

števila izčrpno obravnavata Rinott in Scarsini [108]. Tu bomo <strong>po</strong>vzeli enega izmed<br />

njunih rezultatov.<br />

Naj bo torej W število Nashevih ravnotežij. Pišimo W= ∑ i∈I X i , kjer je <strong>po</strong>samezna<br />

slučajna spremenljivka X i enaka ena, če je v i doseženo Nashevo ravnovesje, sicer pa<br />

nič. Podobno kot v prejšnjem razdelku so slučajne spremenljivke X i lokalno odvisne<br />

glede na graf odvisnosti, v katerem sta vektorja strategij sosedna, če se razlikujeta v<br />

največ dveh kom<strong>po</strong>nentah. Graf odvisnosti ima s p oglišč in je regularen: vsako oglišče<br />

ima (brez njega samega) natanko (s−1)p+ ( p<br />

2) (s−1) 2 ≤ (sp) 2 − 1 sosedov.<br />

Označimo s Q verjetnost, da je v <strong>po</strong>sameznem vektorju strategij doseženo Nashevo<br />

ravnotežje. Tedaj iz izreka 4.2.2 dobimo:<br />

∣<br />

∣P ( var(W) −1/2 (W−E W)≤x ) −Φ(x) ∣<br />

∣≤ 16,5 (sp)4 s p Q(1−Q)<br />

(6.3.1)<br />

var(W) 3/2<br />

Rinott in Scarsini [108] nadalje ocenjujeta Q in var(W) za primer, ko je <strong>po</strong>razdelitev<br />

vektorjev dobičkov V i večrazsežna normalna z izmenljivimi kom<strong>po</strong>nentami. Tako<br />

med drugim iz zgornje ocene izpeljeta, da v primeru, ko je produkt sp dovolj velik,<br />

kom<strong>po</strong>nente vektorjev V i pa <strong>po</strong>zitivno korelirane, velja ocena:<br />

∣<br />

∣P ( var(W) −1/2 (W−E W)≤x ) −Φ(x) ∣<br />

∣≤ C (sp)4 (6e) p/2 (log s) (1+ρ(p2 −1))/(4+4ρ(p−1))<br />

(6.3.2)<br />

s ρp(p−1)/(2+2ρ(p−1))


6. STATISTIKE NA GRAFIH 177<br />

kjer jeρkorelacijski koeficient med <strong>po</strong>sameznima kom<strong>po</strong>nentama vektorja dobičkov.<br />

Tako lahko za najrazličnejše primere, ko gre sp proti neskončno, izpeljemo konvergenco<br />

proti standardni normalni <strong>po</strong>razdelitvi.


178 6.3 NASHEVA RAVNOTEŽJA


7.<br />

Slučajni grafi<br />

7.1 Splošna obravnava<br />

Naj boΓneusmerjen slučajni graf z n oglišči, v katerem so dogodki, da sta <strong>po</strong>samezni<br />

dve oglišči sosedni, med seboj neodvisni. Obravnavali bomo statistike na takih<br />

grafih, ki so v anglosaksonski terminologiji znane kot semi-induced properties: to so statistike,<br />

ki so odvisne od <strong>po</strong>vezav, ki izhajajo iz oglišč danih množicα⊆N n ={1,...n}.<br />

Natančneje, <strong>po</strong>dobno kot v 5. <strong>po</strong>glavju bomo obravnavali statistike oblike:<br />

W=<br />

∑<br />

α⊆N n<br />

h α (Γ) (7.1.1)<br />

kjer je, kot že rečeno, funkcija h α (Γ) odvisna le od <strong>po</strong>vezav iz množice J α , ki jo definiramo<br />

kot množico <strong>po</strong>vezav, ki izhajajo iz množiceα, in <strong>po</strong>vezav med oglišči izα.<br />

Statistike zgornjega tipa izčrpno obravnavajo Barbour, Karoński in Ruciński [17], ki<br />

s <strong>po</strong>močjo Steinove metode in razčlenitev drugega reda (tistih iz razdelka 3.9) izpeljejo<br />

oceno napake pri normalni aproksimaciji slučajne spremenljivke W za Lipschitzeve<br />

testne funkcije. Oceno nato u<strong>po</strong>rabijo za štetje izoliranih dreves in oglišč z dano stopnjo<br />

(vključno z izoliranimi oglišči). Konieczna [71] u<strong>po</strong>rabi rezultat Barbourja, Karońskega<br />

in Rucińskega pri štetju oglišč z dano stopnjo v slučajnih <strong>po</strong>dgrafih kocke. Tu pa bomo<br />

z u<strong>po</strong>rabo izreka 4.2.1 izpeljali oceno Berry–Esséenovega tipa in jo nato u<strong>po</strong>rabili za<br />

stopnje oglišč (kar bo vključevalo tudi štetje oglišč z dano stopnjo). Rezultati bodo<br />

u<strong>po</strong>rabni predvsem za primer, ko sta <strong>po</strong>samezni oglišči sosedni z verjetnostjo reda 1/n.<br />

Izrek 7.1.1. Naj obstajajo take konstante B 1 ,...B n , da za vsakα⊆N n velja|h α |≤B |α| ,<br />

kjer smo z|α| označili moč množiceα. Nadalje naj bo šeE X α = 0 in var(W)=1. Tedaj za<br />

vsak x∈Rvelja ocena:<br />

∣<br />

∣P(W≤ x)−Φ(x) ∣ ∣ ∣≤(66+569λ+401λ 2 ) S2 1 S 2<br />

n 2 (7.1.2)<br />

179


180 7.1 SPLOŠNA OBRAVNAVA<br />

kjer je:<br />

S k :=<br />

n∑<br />

( )<br />

n<br />

r k B r (7.1.3)<br />

r<br />

r=1<br />

λ := max<br />

i∈N n<br />

∑<br />

j∈N n<br />

P(i in j sosedni) (7.1.4)<br />

O<strong>po</strong>mba. S pazljivejšim ocenjevanjem bi se dalo konstante znatno izboljšati.<br />

Za dokaz izreka 7.1.1 bomo <strong>po</strong>trebovali še naslednjo lemo.<br />

Lema 7.1.2. Naj boλtako kot v (7.1.4). Tedaj za <strong>po</strong>ljubni množiciα,β⊆N n velja:<br />

E|J α |≤λ|α| (7.1.5)<br />

E|J α ||J β |≤(λ 2 +λ)|α||β| (7.1.6)<br />

DOKAZ. Zaradi subaditivnosti je rezultat dovolj dokazati za enoelementne množice.<br />

Ocena (7.1.5) je očitna. Dokažimo še drugo neenakost. Pišimoα={j} inβ={j}. Nadalje<br />

s p ij označimo verjetnost, da sta oglišči i in j sosedni. Označimo še u := ∑ k∈N n \{i,j} p ik in<br />

v := ∑ k∈N n \{i,j} p jk . Tedaj velja:<br />

E|J {i} ||J {j} |=(1−p ij )uv+p ij (1+u)(1+v)=<br />

= uv+p ij (1+u+v)≤<br />

≤ (u+p ij )(v+p ij )+p ij ≤<br />

≤λ 2 +λ<br />

(7.1.7)<br />

Tako smo dokazali tudi oceno (7.1.6).<br />

DOKAZIZREKA 7.1.1. Spet bomo u<strong>po</strong>rabili izrek 4.2.1. Pišimo W= ∑ α∈I X α , kjer jeI<br />

družina vseh nepraznih <strong>po</strong>dmnožic množiceN n in X α = h α (Γ). Nadalje za vsakα⊆N n<br />

zΓ α označimo slučajni graf, ki ga dobimo tako, da grafuΓodstranimo vse <strong>po</strong>vezave iz<br />

J α . Očitno je grafΓ α neodvisen od X α , zato to velja tudi za slučajno spremenljivko:<br />

∑<br />

W α := h β (Γ α ) (7.1.8)<br />

β∈I<br />

Tako lahko definiramoJ α :=I in X αβ := h β (Γ)−h β (Γ α ). Nadalje definirajmoH αβ kot<br />

σ-algebro, ki jo generirajo vse <strong>po</strong>vezave iz J α . Postavimo:<br />

∑<br />

W αβ := ˜W αβ := h γ (Γ α∪β ), ¯W αβ :=<br />

γ∈I<br />

∑<br />

γ∩(α∪β)∅<br />

h γ (Γ)+<br />

∑<br />

γ∩(α∪β)=∅<br />

h γ (Γ α∪β ) (7.1.9)<br />

Slučajni spremenljivki h β (Γ) in h β (Γ α ) se razlikujeta kvečjemu v primeru, ko množicaβ<br />

bodisi seka množicoαbodisi obstaja oglišče izβ, ki je sosedno kakemu oglišču izα.


7. SLUČAJNI GRAFI 181<br />

Takih množicβdane moči r pa je največ (|α|+|J α |)r ( n<br />

r) /n. Zato oceni (4.2.3) in (4.2.4)<br />

veljata za:<br />

U ′ αβ := 2( |β|+|J β | )<br />

S 1 , U ′′<br />

αβ<br />

n<br />

:= 2( |α|+|β|+|J α∪β | )<br />

S 1 , ˜B αβ := 2( |α|+|β| )<br />

S 1 , U αβ := 2|J α∪β|<br />

S 1<br />

n<br />

n<br />

n<br />

(7.1.10)<br />

Če <strong>po</strong>stavimo B αβ := 4λ(|α|+|β|)S 1 /n, iz ocene (7.1.5) sledi, da je B αβ ≥ 2EU αβ . Po<br />

neenačbi Markova je torejP(U αβ ≤ B αβ )≥1/2. Če zdaj vse skupaj vstavimo v oceno<br />

(4.2.5), dobimo: ∣ ∣∣P(W≤<br />

∣ ∣∣≤2,33 x)−Φ(x) S (7.1.11)<br />

kjer je:<br />

S= 4S 1<br />

n 2<br />

∑ ∑ [<br />

B |α| E(|α|+|J α |)|β| B |β| 3|α|+4|β|+|Jβ |+5|J α∪β |+16λ(|α|+|β|) ] (7.1.12)<br />

α∈I<br />

α∈I<br />

Zdaj pa u<strong>po</strong>rabimo lemo 7.1.2. Po nekaj računanja dobimo:<br />

S≤ 4S 1<br />

n 2<br />

n∑<br />

(<br />

n<br />

r)<br />

r=1<br />

B r<br />

n∑<br />

(<br />

n [ ( ) ]<br />

B s (1+λ)rs 3r+4s+λ(21r+22s) +λrs(5r+6s) =<br />

s)<br />

s=1<br />

= 4S2 1 S 2<br />

n 2 (7+61λ+43λ 2 )<br />

Od tod pa že sledi ocena 7.1.1.<br />

(7.1.13)<br />

7.2 Stopnje oglišč<br />

Naj bo dan slučajni grafΓtako kot v prejšnjem razdelku, le da se bomo omejili<br />

na primer, ko so vse verjetnosti, da sta <strong>po</strong>samezni oglišči sosedni, enake denimo p.<br />

Z drugimi besedami, veljaΓ=K(n, p). Preučevali bomo statistike stopenj oglišč za<br />

primer, ko gre n proti neskončno, p pa proti nič. Označimo zδ i stopnjo oglišča i v grafu<br />

Γ, t. j. število njenih sosedov brez njega samega. Nadalje naj bo h: N 0 →R omejena<br />

funkcija in naj bo:<br />

n∑<br />

W := h(δ i ) (7.2.1)<br />

i=1<br />

Izračunajmo matematično upanje in varianco slučajne spremenljivke W. Stopnjeδ i so<br />

očitno <strong>po</strong>razdeljene binomsko Bi(n−1, p). Če z B m,p označimo slučajno spremenljivko,<br />

ki je <strong>po</strong>razdeljena binomsko Bi(m, p), torej očitno veljaE W= nEh(B n−1,p ).<br />

Naj bo i j. Tedaj velja:<br />

cov ( h(δ i ), h(δ j ) ) = (1−p) [ E h(B n−2,p ) ] 2<br />

+ p<br />

[<br />

E h(1+Bn−2,p ) ] 2<br />

−<br />

− [ (1−p)Eh(B n−2,p )+pEh(1+B n−2,p ) ] 2<br />

=<br />

= p(1−p) [ E h(B n−2,p )−E h(1+B n−2,p ) ] 2<br />

(7.2.2)


182 7.2 STOPNJE OGLIŠČ<br />

Torej velja:<br />

{<br />

var(W)=n var ( h(B n−1,p ) ) +λ(1−p) [ E h(B n−2,p )−E h(1+B n−2,p ) ]} 2<br />

(7.2.3)<br />

kjer smo označiliλ := (n−1)p (kar je isto kot v (7.1.4)).<br />

Ko gre p proti nič, se binomska <strong>po</strong>razdelitev približuje Poissonovi. Najprej veljaE<br />

h(B n−1,p )−E h(B n−2,p ) = p(E h(1+B n−2,p )−E h(B n−2,p )). Če je torej|h| ≤ A, velja<br />

∣ ∣E h(Bn−1,p )−E h(B n−2,p ) ∣ ∣ ≤ 2Ap. Poleg tega iz ocene (1.3.23) sledi, da je tudi<br />

∣<br />

∣E h(B n−1,p )−E h(Π) ∣ ∣≤2Ap, kjer smo sΠoznačili slučajno spremenljivko, <strong>po</strong>razdeljeno<br />

<strong>po</strong> Poissonu Po(λ). Torej velja:<br />

var(W)=n<br />

{var ( h(Π) ) +λ [ E h(Π)−E h(1+Π) ] }<br />

2<br />

+ O(p)<br />

(7.2.4)<br />

Če zdaj u<strong>po</strong>rabimo izrek 7.1.1, dobimo, da za dovolj velike n in dovolj majhne p velja<br />

ocena:<br />

∣<br />

∣P ( var(W) −1/2 (W−E W)≤x ) −Φ(x) ∣<br />

C(1+λ 2 )<br />

∣≤<br />

√ n<br />

{var ( h(Π) ) +λ [ E h(Π)−E h(1+Π) ]} 3/2<br />

2<br />

kjer je C konstanta, odvisna le od funkcije h.<br />

(7.2.5)


III. del:<br />

Dodatki<br />

183


Dodatek A<br />

Konvergenca <strong>po</strong>razdelitev<br />

A.1 Metrike iz testnih funkcij<br />

Dostikrat nas zanima, ali za<strong>po</strong>redje <strong>po</strong>razdelitev (µ n ) n∈N na danem merljivem prostoru<br />

(S,S) konvergira k dani <strong>po</strong>razdelitviµ. Za ta namen pa moramo na prostoru<br />

Pr(S,S) vseh <strong>po</strong>razdelitev na (S,S) najprej definirati to<strong>po</strong>logijo. To bomo storili tako,<br />

da bomo <strong>po</strong>razdelitve “otipavali” s primernimi testnimi funkcijami: <strong>po</strong>razdelitviµinν<br />

sta si “blizu”, če sta za primeren nabor testnih funkcij f blizu integralaµ( f ) inν( f ), kjer<br />

označimo: ∫<br />

µ( f ) := f dµ<br />

(A.1.1)<br />

O<strong>po</strong>mba. Če so testne funkcije neomejene, z njimi ne moremo “otipati” vsh<br />

možnih <strong>po</strong>razdelitev. V tem primeru moramo pač Pr(S,S) zamenjati s primernim<br />

<strong>po</strong>dprostorom, ki ga bomo navadno označevali zM.<br />

Eden od načinov, kako iz prostora testnih funkcij, ki ga označimo zF , konstruirati<br />

to<strong>po</strong>logijo, je, da definiramo kar metriko:<br />

d(µ,ν)=sup|ν( f )−µ( f )|<br />

f∈F<br />

(A.1.2)<br />

Preveriti moramo, ali je desna stran sploh dobro definirana in ali predstavlja metriko.<br />

Najprej mora za <strong>po</strong>ljubenµ∈M in vsak f ∈F veljatiµ(| f|)


186 A.2 METRIKA TOTALNE VARIACIJE<br />

Trditev A.1.2. Naj boPπ-sistem, ki generiraS, in naj za vsak A∈P obstaja enakomerno<br />

omejeno za<strong>po</strong>redje funkcij f n ∈ LinF , ki <strong>po</strong> točkah konvergira k indikatorju 1 A množice A.<br />

TedajF loči vse <strong>po</strong>razdelitve iz Pr(S,S).<br />

DOKAZ. Naj bostaµ,ν ∈ Pr(S,S) in naj boµ( f ) = ν( f ) za vsak f ∈ F . Zaradi<br />

linearnosti to <strong>po</strong>tem velja tudi za vse f ∈ LinF . Iz izreka o dominirani konvergenci<br />

takoj dobimo, da jeµ(A)=ν(A) za vsak A∈P. Družina vseh množic A, za katere je<br />

µ(A)=ν(A), pa jeλ-sistem. Pravkar smo dokazali, da taλ-sistem vsebujeπ-sistemP,<br />

ki generiraS. Po Dynkinovi lemi mora biti <strong>po</strong>temµ(A)=ν(A) za vsak A∈S, torej<br />

mora veljatiµ=ν.<br />

A.2 Metrika totalne variacije<br />

Razred testnih funkcij, ki ga lahko definiramo v vsakem primeru, so seveda indikatorji.<br />

Le-ta nam določa metriko totalne variacije. Za dani <strong>po</strong>razdelitviµinνtorej<br />

definiramo:<br />

d TV (µ,ν) := sup|ν(A)−µ(A)|<br />

(A.2.1)<br />

A∈S<br />

Očitno indikatorji množic ločijo vse <strong>po</strong>razdelitve, torej je d TV res metrika. Definiramo<br />

jo lahko še malce drugače, in sicer tako, da za testne funkcije vzamemo kar vse merljive<br />

funkcije, ki slikajo v [0, 1].<br />

Metrika totalne variacije je zelo močna. Primerna je predvsem za <strong>po</strong>razdelitve, ki so<br />

skoncentrirane na neki diskretni množici: Le Camov izrek (izrek 1.3.2) nam da oceno<br />

napake pri Poissonovi aproksimaciji v metriki totalne variacije. V splošnem pa je ta<br />

metrika navadno premočna, kar ilustrirata naslednja dva zgleda.<br />

ZGLED A.2.1. Naj bo S to<strong>po</strong>loški prostor z Borelovoσ-algebro in za<strong>po</strong>redje točk<br />

x n , ki niso enake x, konvergira k x. Tedaj za<strong>po</strong>redje Diracovih merδ xn ne konvergira<br />

kδ x . Torej niti skoraj gotova konvergenca (ki je zelo močna) ne implicira konvergence<br />

metriki totalne variacije.<br />

□<br />

ZGLED A.2.2. Naj bo 0 < p < 1 in naj bodo X n ∼ Bi(n, p), n ∈ N, binomsko<br />

<strong>po</strong>razdeljene slučajne spremenljivke. Definirajmo:<br />

Y n := var(X n ) −1/2( X n − EX n<br />

)<br />

=<br />

X n − np<br />

√<br />

np(1−p)<br />

(A.2.2)<br />

Tedaj za<strong>po</strong>redje slučajnih spremenljivk Y n v metriki totalne variacije ne konvergira k<br />

standardni normalni <strong>po</strong>razdelitvi N(0, 1). Če namreč označimo A :={k/ √ n ; k∈Z, n∈<br />

N}, za vsak n∈N veljaP(Y n ∈ A)=1, medtem ko je N(0, 1){A}=0. □<br />

V naslednjih razdelkih bomo definirali nekaj to<strong>po</strong>logij in metrik, ki bodo sicer<br />

šibkejše od metrike totalne variacije, a še vseeno dovolj močne, da bo konvergenca<br />

glede nanje nekaj <strong>po</strong>menila.


Dodatek A: KONVERGENCA PORAZDELITEV 187<br />

A.3 Šibke to<strong>po</strong>logije v splošnem<br />

V razdelku A.1 smo iz danega razreda testnih funkcij konstruirali metriko. Obstaja<br />

pa še ena, “šibkejša” konstrukcija to<strong>po</strong>logije.<br />

DEFINICIJA. Šibka to<strong>po</strong>logija na množici merMglede na razred testnih funkcijF je<br />

najšibkejša to<strong>po</strong>logija, v kateri so funkcionali oblikeµ↦→µ( f ) zvezni za vse f∈F . Z<br />

drugimi besedami, to je to<strong>po</strong>logija, ki ima za <strong>po</strong>dbazo množice oblike:<br />

kjer je f∈F , U pa je odprta množica vR.<br />

G( f, U) :={ν ;ν( f )∈U} (A.3.1)<br />

O<strong>po</strong>mba. Brez težav preverimo, da v tej to<strong>po</strong>logiji za vsako <strong>po</strong>razdelitevµmnožice<br />

oblike:<br />

N(µ; f 1 ,... f n ;ε 1 ,...ε n ) := { ν ;|ν( f i )−µ( f i )| 0, sestavljajo bazični sistem okolic <strong>po</strong>razdelitveµ. Od<br />

tod dobimo, da v tako definirani to<strong>po</strong>logiji za<strong>po</strong>redje <strong>po</strong>razdelitevµ n konvergira proti <strong>po</strong>razdelitvi<br />

µ natanko tedaj, ko za vsako funkcijo f∈F za<strong>po</strong>redjeµ n ( f ) konvergira protiµ( f ). Pravimo,<br />

da za<strong>po</strong>redje <strong>po</strong>razdelitevµ n šibko konvergira protiµ.<br />

Če pravkar vpeljano to<strong>po</strong>logijo primerjamo z metrično to<strong>po</strong>logijo iz razdelka A.1,<br />

dobimo naslednji rezultat.<br />

Trditev A.3.1. Naj boF razred testnih funkcij na danem prostoru verjetnostnih mer<br />

M. Tedaj je šibka to<strong>po</strong>logija iz (A.3.1) šibkejša od to<strong>po</strong>logije, ki jo inducira metrika iz formule<br />

(A.1.2).<br />

DOKAZ. Označimo s K(µ, r) odprto kroglo okrog <strong>po</strong>razdelitveµs<strong>po</strong>lmerom r. Velja<br />

torej K(µ, r) = {ν ; d(µ,ν) < r}. Tedaj je dovolj dokazati, da za vsako množico<br />

N(µ; f 1 ,... f n ;ε 1 ,...ε n ) obstaja odprta krogla oblike K(µ, r), ki je vsebovana v njej. To pa<br />

je gotovo res, če <strong>po</strong>stavimo r := min{ε 1 ,...ε n }.<br />

Metrična to<strong>po</strong>logija, ki jo dobimo iz danega razreda testnih funkcij, je navadno kar<br />

strogo močnejša od šibke. To bomo na kratko ilustrirali z naslednjim zgledom.<br />

ZGLED A.3.1. Naj bo S normalen to<strong>po</strong>loški prostor z Borelovoσ-algebro,F pa<br />

razred vseh zveznih funkcij S→[0, 1]. Šibki to<strong>po</strong>logiji, ki jo dobimo izF , pravimo<br />

običajna šibka to<strong>po</strong>logija (glej razdelek A.5). Pokažimo še, daF določa tudi metriko. Iz<br />

Urisonove leme sledi, da za vsako zaprto množico F obstaja za<strong>po</strong>redje funkcij f n ∈F ,<br />

ki <strong>po</strong> točkah konvergira k indikatorju 1 F množiceF . Po trditvi A.1.2 razredF loči<br />

<strong>po</strong>razdelitve, torejF <strong>po</strong> trditvi A.1.1 določa tudi metriko.<br />

Vzemimo zdaj za<strong>po</strong>redje točk x n , ki konvergira proti x, in privzemimo še, da je<br />

x n x za vsak x. Tedaj za<strong>po</strong>redje Diracovih merδ xn gotovo šibko konvergira protiδ x .<br />

Po drugi strani pa <strong>po</strong> Urisonovi lemi za vsak n obstaja funkcija f ∈F , za katero je<br />

f (x)=0 in f (x n )=1, zato je tudi d F (δ x ,δ xn )=1 in za<strong>po</strong>redje v metrični to<strong>po</strong>logiji ne<br />

konvergira.<br />


188 A.4 ZAMENJAVA RAZREDA TESTNIH FUNKCIJ<br />

Zgornji zgled nam da dober razlog, zakaj je smiselno obravnavati šibko to<strong>po</strong>logijo:<br />

v veliko primerih je metrična to<strong>po</strong>logija premočna.<br />

Za to<strong>po</strong>logijo, ki jo vpeljemo, je vedno <strong>po</strong>membno, kakšne lastnosti ima. Naslednja<br />

trditev govori o dveh lastnostih, ki ju imajo vsi metrični prostori. Dokaz prepuščamo<br />

bralcu.<br />

Trditev A.3.2.<br />

(1) To<strong>po</strong>logija, vpeljana v (A.3.1), je Hausdorffova natanko tedaj, ko prostor testnih funkcij<br />

F loči <strong>po</strong>razdelitve izM.<br />

(2) Če je množicaF števna, to<strong>po</strong>logija zadošča prvemu aksiomu števnosti.<br />

A.4 Zamenjava razreda testnih funkcij<br />

Včasih je ugodno vedeti, kaj se zgodi, če pri metriki, definirani v razdelku A.1, ali<br />

šibki to<strong>po</strong>logiji, definirani v razdelku A.3, zamenjamo razred testnih funkcij. Ogledali<br />

si bomo tri primere: inkluzijo, linearne kombinacije in limite. Prvi primer, inkluzija, je<br />

očiten.<br />

Trditev A.4.1. Naj bostaF inGrazreda testnih funkcij inF⊆G.<br />

(1) Če sta d F in d G metriki, dobljeni izF oz.G <strong>po</strong> prepisu (A.1.2), je d F ≤ d G , torej je<br />

metrika d F enakomerno šibkejša od metrike d G .<br />

(2) Šibka to<strong>po</strong>logija, ki jo določaF , je šibkejša od tiste, ki jo določaG.<br />

Trditev A.4.2. Naj boF razred testnih funkcij.<br />

(1) Če je:<br />

¯F=<br />

⎧<br />

⎪⎨<br />

⎪⎩<br />

n∑<br />

α i f i ; f i ∈F,<br />

i=1<br />

⎫<br />

n∑ ⎪⎬<br />

|α i |≤1, n∈N⎪⎭<br />

se metrika, dobljeni <strong>po</strong> (A.1.2) izF , ujema s tisto, dobljeno iz ¯F .<br />

i=1<br />

(A.4.1)<br />

(2) Šibka to<strong>po</strong>logija, ki jo določaF , se ujema s šibko to<strong>po</strong>logijo, ki jo določa linearna<br />

ogrinjača LinF razredaF .<br />

Posledica A.4.3. Brž ko jeF ⊆G⊆ ¯F , se metrika, dobljena <strong>po</strong> (A.1.2) izG, ujema z<br />

metriko, dobljeno izF . Podobno, brž ko jeF⊆G⊆LinF , se šibka to<strong>po</strong>logija, ki jo določaG,<br />

ujema s tisto, ki jo določaF .


Dodatek A: KONVERGENCA PORAZDELITEV 189<br />

DOKAZTRDITVE A.4.2.<br />

(1): Označimo ustrezni metriki z d F in d ¯F in naj bostaµinν<strong>po</strong>ljubni verjetnostni<br />

meri iz prostora, ki ga gledamo. Očitno je d F (µ,ν)≤d ¯F (µ,ν). Toda za vsak f∈ ¯F velja<br />

tudi|ν( f )−µ( f )|≤d F (µ,ν), torej je tudi d ¯F (µ,ν)≤d F (µ,ν).<br />

(2): Dovolj je dokazati, da je šibka to<strong>po</strong>logija, ki jo določa LinF , šibkejša od tiste, ki<br />

jo določaF . Za to pa je dovolj <strong>po</strong>kazati, da je vsaka množica G( f, U), definirana tako<br />

kot v (A.3.1), za vsak f ∈ LinF odprta v šibki to<strong>po</strong>logiji, določeni zF . Naj bo torej<br />

f = ∑ n<br />

i=1α i f i ∈ LinF , kjer je f i ∈F . Če jeµ∈G( f, U), se praviµ( f )= ∑ n<br />

i=1α i µ( f i )∈<br />

U, kjer je U⊆R odprta množica, zaradi zveznosti preslikave (x 1 ,...x n )↦→ ∑ n<br />

i=1α i x i<br />

∑<br />

obstajajo take odprte množice U i ⊆R, da jeµ( f i )∈U i in da za <strong>po</strong>ljubne x i ∈ U i velja<br />

n<br />

i=1α i x i ∈ U. Slediµ∈ ⋂ n<br />

i=1 G( f i , U i )⊆G( f, U). To pa <strong>po</strong>meni, da je G( f, U) res odprta<br />

v šibki to<strong>po</strong>logiji, ki jo določa razredF , in trditev je dokazana.<br />

Trditev A.4.4. Naj bo S to<strong>po</strong>loški prostor z Borelovoσ-algebroS,M⊆Pr(S,S) in naj<br />

bostaF inGrazreda merljivih testnih funkcij S→R.<br />

(1) Označimo z d F in d G metriki, dobljeni izF oziromaG<strong>po</strong> (A.1.2). Če za vsak f∈F<br />

obstaja tako za<strong>po</strong>redje testnih funkcij f n ∈G, da za vsakµ∈M velja lim n→∞ µ( f n )=<br />

µ( f ), velja d F ≤ d G .<br />

(2) Če za vsak f ∈F in vsakµ∈M obstajata za<strong>po</strong>redji funkcij f + n, f − n ∈G, za kateri<br />

velja f − n ≤ f≤f + n in lim n→∞ µ( f + n )=lim n→∞ µ( f − n )=µ( f ), je šibka to<strong>po</strong>logija naM,<br />

določena zG, močnejša od tiste, ki jo določaF .<br />

Posledica A.4.5. Če privzamemo pred<strong>po</strong>stavke zgornje leme in še, da jeG⊆F , se tako<br />

metriki kot tudi šibki to<strong>po</strong>logiji, dobljeni izF inG, ujemata.<br />

O<strong>po</strong>mbi.<br />

(1) Pogoji točke (1) so iz<strong>po</strong>lnjeni, če za<strong>po</strong>redje funkcij f n <strong>po</strong> točkah konvergira k f<br />

in je bodisi monotono bodisi enakomerno omejeno.<br />

(2) Pogoji točke (2) so iz<strong>po</strong>lnjeni, če za<strong>po</strong>redji f + n in f − n <strong>po</strong> točkah konvergirata k f<br />

in sta bodisi enakomerno omejeni, bodisi je za<strong>po</strong>redje f n<br />

+<br />

pa naraščajoče.<br />

padajoče, za<strong>po</strong>redje f − n<br />

DOKAZTRDITVE A.4.4.<br />

(1): Očitno.<br />

(2): Dovolj je za vsakµ∈M, vsak f∈F in vsakε>0 konstruirati okolico mereµv<br />

šibki to<strong>po</strong>logiji, določeni zG, ki bo vsebovana v množici N(µ; f ;ε), definirani tako kot<br />

v (A.3.2). Vzemimo zdaj ustrezni za<strong>po</strong>redji f + n in f − n . Tedaj za vsakε>0 obstaja tak n,<br />

da jeµ( f + n )−ε/2


190 A.5 OBIČAJNA ŠIBKA TOPOLOGIJA<br />

Očitno jeµ∈U, <strong>po</strong>leg tega pa za vsakν∈Uvelja:<br />

ν( f )≤ν( f + n )=ν( f + n )−µ( f + n )+µ( f + n )µ( f )−ε (A.4.4)<br />

Torej je tudi U⊆N(µ; f ;ε) in trditev je dokazana.<br />

Kot preprost zgled si oglejmo naslednjo karakterizacijo metrike totalne variacije.<br />

Trditev A.4.6. Velja:<br />

d TV (µ,ν)= sup<br />

f merljiva<br />

0≤ f≤1<br />

|ν( f )−µ( f )|<br />

(A.4.5)<br />

O<strong>po</strong>mba.<br />

metriko:<br />

Nekateri avtorji za metriko totalne variacije jemljejo tudi naslednjo<br />

d(µ,ν)= sup<br />

f merljiva<br />

−1≤ f≤1<br />

|ν( f )−µ( f )|=2 d TV (µ,ν)<br />

(A.4.6)<br />

DOKAZTRDITVE A.4.6. Po točki (1) trditve A.4.2 lahko razred indikatorjev merljivih<br />

množic zamenjamo z razredom vseh merljivih stopničastih funkcij iz S v [0, 1]. Toda ker<br />

za vsako merljivo funkcijo obstaja monotono za<strong>po</strong>redje stopničastih funkcij, ki konvergira<br />

k njej, smemo <strong>po</strong> točki (1) trditve A.4.4 pred<strong>po</strong>stavko, da so funkcije stopničaste,<br />

izpustiti.<br />

A.5 Običajna šibka to<strong>po</strong>logija<br />

DEFINICIJA. Naj bo S to<strong>po</strong>loški prostor inSBorelovaσ-algebra. Običajna šibka<br />

to<strong>po</strong>logija na prostoru Pr(S,S) je šibka to<strong>po</strong>logija, definirana v razdelku A.3, pri kateri<br />

za testne funkcije vzamemo vse zvezne in omejene funkcije S→R.<br />

O<strong>po</strong>mba.<br />

to<strong>po</strong>logija”.<br />

Navadno bomo namesto “običajna šibka to<strong>po</strong>logija” pisali kar “šibka<br />

Trditev A.5.1.<br />

variacije.<br />

Šibka to<strong>po</strong>logija je strogo šibkejša od tiste, ki jo <strong>po</strong>rodi metrika totalne<br />

DOKAZ. Da je to<strong>po</strong>logija šibkejša, sledi iz trditev A.4.1 in A.4.6. Pokažimo še, da<br />

to<strong>po</strong>logiji nista enaki. Vzemimo za<strong>po</strong>redje Diracovih merδ xn . Le-to vedno šibko<br />

konvergira protiδ x , če le x n konvergira proti x. V metriki totalne variacije pa to<br />

za<strong>po</strong>redje konvergira le, če za dovolj velike n velja x n = x.


Dodatek A: KONVERGENCA PORAZDELITEV 191<br />

Trditev A.5.2. Naj bo S regularen to<strong>po</strong>loški prostor s števno bazo (<strong>po</strong> Urisonovem<br />

metrizacijskem izreku je tak prostor metrizabilen) in Borelovoσ-algebroS. Tedaj je šibka<br />

to<strong>po</strong>logija na Pr(S,S) Hausdorffova.<br />

DOKAZ. Iz točke (1) trditve A.3.2 sledi, da je dovolj dokazati, da obstaja takπ-sistem<br />

P, ki generiraSin za katerega velja, da za vsak A∈P obstaja enakomerno omejeno<br />

za<strong>po</strong>redje zveznih funkcij, ki konvergirajo k indikatorju 1 A . To pa dokažemo tako, da<br />

zaπ-sistem vzamemo družino vseh zaprtih množic, za funkcije pa primerne Urisonove<br />

funkcije.<br />

Hausdorffova lastnost je vse, kar bomo <strong>po</strong>trebovali od lastnosti šibke to<strong>po</strong>logije na<br />

prostoru <strong>po</strong>razdelitev. Kot zanimivost pa naj omenimo, da velja še precej več.<br />

Izrek A.5.3. Naj bo S separabilen metrični prostor z Borelovoσ-algebroS. Tedaj je prostor<br />

Pr(S,S) s šibko to<strong>po</strong>logijo metrizabilen.<br />

Dokaz bomo opustili. Za primer, ko je prostor S <strong>po</strong>ln, glej npr. Rogers in Williams<br />

[109], strani 205–209. Ta dokaz je zelo <strong>po</strong>sreden (skliče se npr. na Banach–Alaoglujev<br />

izrek). Vendar pa se da izrek dokazati tudi ne<strong>po</strong>sredno, in sicer tako, da prostor Pr(S,S)<br />

opremimo z metriko Prohorova:<br />

ρ(µ,ν) := inf{ε≥0;µ(A)≤ν(A ε )+ε za vsako zaprto množico A}<br />

(A.5.1)<br />

kjer je A ε :={x∈S;d(x, A)


192 A.6 ZADOSTNI POGOJI ZA ŠIBKO KONVERGENCO<br />

Posledica A.6.2. Če je S metrični prostor, se običajna šibka to<strong>po</strong>logija ujema s šibko<br />

to<strong>po</strong>logijo, določeno z razredom omejenih Lipschitzevih funkcij.<br />

DOKAZ. Dokazali bomo, da je iz<strong>po</strong>lnjen <strong>po</strong>goj (2). Če je namreč F zaprta množica,<br />

lahko <strong>po</strong>stavimo:<br />

f n (x) := ( 1−n dist(x, F) ) (A.6.1)<br />

+<br />

(držimo se dogovora, da je dist(x,∅)=∞).<br />

DOKAZTRDITVE A.6.1. Najprej opazimo, da smemo <strong>po</strong> točki (2) trditve A.4.2 brez<br />

škode za splošnost privzeti, da jeF vektorski prostor in da vsebuje konstante. Med<br />

drugim to <strong>po</strong>meni tudi, da za vsak f∈F velja tudi 1− f∈F , torej sta <strong>po</strong>goja (1) in (2)<br />

ekvivalentna. Privzeti smemo torej, da sta iz<strong>po</strong>lnjena oba.<br />

U<strong>po</strong>rabili bomo točko (2) trditve A.4.4: <strong>po</strong>kazali bomo, da za vsak f∈F in vsakµ∈<br />

M obstajata za<strong>po</strong>redji funkcij f + n, f − n ∈G, za kateri velja f − n ≤ f≤f + n in lim n→∞ µ( f + n )=<br />

lim n→∞ µ( f − n )=µ( f ). Brez škode za splošnost privzamemo, da f slika v [0, 1]. Za<br />

<strong>po</strong>ljuben t∈Roznačimo:<br />

F t :={x ; f (x)≥t}, G t :={x ; f (x)>t}<br />

(A.6.2)<br />

Ni se težko prepričati, da za vsak n∈N velja:<br />

f− 1 n ≤ 1 ∑n−1<br />

1 Gk/n ≤ f≤ 1 ∑n−1<br />

1 Fk/n ≤ f+ 1 n<br />

n<br />

n<br />

k=1<br />

k=0<br />

(A.6.3)<br />

Iz pred<strong>po</strong>stavke (1) in izreka o dominirani konvergenci sledi, da obstajajo take funkcije<br />

f −,... n,1 f− ∈F , da za vsak k velja n,n−1 f− ≤ 1 n,k G k/n<br />

inµ( f − )>µ(G n,k k/n)−1/n. Podobno iz<br />

(2) sledi, da obstajajo take funkcije f + n,0 ,... f+ ∈F , da za vsak k velja n,n−1 f+ ≥ 1 n,k F k/n<br />

in<br />

µ( f + )


Dodatek A: KONVERGENCA PORAZDELITEV 193<br />

Tedaj za<strong>po</strong>redje njihovih <strong>po</strong>razdelitev šibko konvergira proti <strong>po</strong>razdelitvi slučajne spremenljivke<br />

X.<br />

DOKAZ.<br />

(1): Sledi iz izreka o dominirani konvergenci.<br />

(2): Po <strong>po</strong>sledici A.6.2 je dovolj dokazati, da za vsako omejeno Lipschitzevo funkcijo<br />

f velja lim n→∞ E f (X n )=E f (X). Brez škode za splošnost lahko privzamemo, da je f<br />

kar neraztezna in| f|≤1. Naj boε>0. Obstaja tak n 0 ∈N, da za vsak n≥n 0 velja<br />

P(|X n − X|≥ε/3)


194 A.7 ZADOSTNI POGOJI ZA KONVERGENCO V METRIKI<br />

za testne funkcije vzamemo indikatorje <strong>po</strong>ltrakov (−∞, x]; glej razdelek A.10). Za vsak<br />

ε>0 definirajmo:<br />

Υ + ε f (x) := sup<br />

|y|


Dodatek A: KONVERGENCA PORAZDELITEV 195<br />

prostora S z odprtimi kroglami okrog točkαzradijemδ/2. Očitno za največ števno<br />

mnogo indeksovαvelja, da jeν(g α )>0 (sicer bi obstajal tak m>0, da bi za neštevno<br />

mnogoαveljalo, da jeν(g α )>m, torej bi obstajala tudi števno neskončna množica<br />

A ′ ⊂Asto lastnostjo, <strong>po</strong>tem pa bi veljalo ∑ α∈A ′ν(g α)=∞, kar je protislovje).<br />

Obstaja končna množicaB⊆A, za katero velja, da je ∑ α∈A\Bν(g α )


196 A.8 WASSERSTEINOVA METRIKA<br />

Definiramo sedaj:<br />

{<br />

U := µ ; (∀α∈B)|µ(g α )−ν(g α )|< ε }<br />

(A.7.17)<br />

3m<br />

kjer je m moč množiceB. Očitno je U šibka okolica mereν, iz ocen (A.7.9), (A.7.14),<br />

(A.7.15) in (A.7.16) pa sledi, da je U⊆V. Trditev je s tem dokazana.<br />

A.8 Wassersteinova metrika<br />

Ugotovili smo že, da je to<strong>po</strong>logija, ki jo <strong>po</strong>rodi metrika totalne variacije, precej<br />

močna, in definirali šibko to<strong>po</strong>logijo, ki se v večini primerov zdi primernejša. Čeprav<br />

je šibka to<strong>po</strong>logija metrizabilna in se da metrika eksplicitno konstruirati (metrika Prohorova),<br />

pa vendarle ni neke “naravne” metrike. Po drugi strani pa smo videli, da<br />

lahko pri šibki to<strong>po</strong>logiji za testne funkcije vzamemo že Lipschitzeve in omejene funkcije.<br />

Če pred<strong>po</strong>stavko o omejenosti izpustimo, moramo na drugi strani skrčiti razred<br />

<strong>po</strong>razdelitev.<br />

DEFINICIJA. Naj bo (S, d) metrični prostor z Borelovoσ-algebroS. Rekli bomo, da<br />

<strong>po</strong>razdelitevµna (S,S) pripada razredu L 1 (glede na metriko d), če za kako (vsako) točko<br />

x∈Svelja: ∫<br />

d(x, y)µ(dy)


Dodatek A: KONVERGENCA PORAZDELITEV 197<br />

Iz trditve A.1.2 sledi, da Lipschitzeve funkcije ločijo <strong>po</strong>razdelitve, torej je <strong>po</strong> trditvi A.1.1<br />

d W res metrika. Natančneje, <strong>po</strong>goji trditve A.1.2 so iz<strong>po</strong>lnjeni, ker lahko indikator vsake<br />

zaprte množice aproksimiramo z Lipschitzevimi funkcijami, zaprte množice pa tvorijo<br />

π-sistem, ki generira Borelovoσ-algebro. Da je to<strong>po</strong>logija, ki jo <strong>po</strong>rodi Wassersteinova<br />

metrika, močnejša od šibke, pa sledi iz trditve A.3.1.<br />

ZGLED A.8.1. Pokažimo, da je na neomejenih metričnih prostorih to<strong>po</strong>logija, ki jo<br />

<strong>po</strong>rodi Wassersteinova metrika, v resnici strogo močnejša od šibke. Vzemimo za<strong>po</strong>redje<br />

točk x n , za katere velja d(x n , x 0 )≥n, in definirajmo <strong>po</strong>razdelitveµ n kot:<br />

( )<br />

µ n :=<br />

x 0<br />

1− 1 n<br />

x n<br />

1<br />

n<br />

(A.8.5)<br />

Naj bo šeµ 0 Diracova mera za točko x 0 . Tedaj za<strong>po</strong>redjeµ n konvergira protiµ 0 celo<br />

v metriki totalne variacije; če pa vzamemo testno funkcijo f (x) := d(x, x 0 ), dobimo,<br />

da jeµ n ( f )≥1, medtem ko jeµ 0 ( f )=0, torej za<strong>po</strong>redje v Wassersteinovi metriki ne<br />

konvergira protiµ 0 (kot tudi ne proti kaki drugi <strong>po</strong>razdelitvi, ker je to<strong>po</strong>logija, ki jo<br />

<strong>po</strong>rodi Wassersteinova metrika, močnejša od šibke, slednja pa je Hausdorffova). □<br />

Wassersteinovo metriko pa lahko definiramo tudi drugače. Zelo <strong>po</strong>membna je<br />

karakterizacija s sklapljanji (za dokaz naslednjega izreka glej Račev [93]).<br />

Izrek A.8.2. Za <strong>po</strong>ljubni Borelovi <strong>po</strong>razdelitviµ,ν iz razreda L 1 na separabilnem metričnem<br />

prostoru (M, d) velja:<br />

d W (µ,ν)=infEd(X, Y)<br />

(A.8.6)<br />

kjer infimum teče <strong>po</strong> vseh parih slučajnih spremenljivk X in Y, pri čemer ima X <strong>po</strong>razdelitevµ,<br />

Y pa <strong>po</strong>razdelitevν.<br />

O<strong>po</strong>mba. Karakterizacija s sklapljanji je tesno <strong>po</strong>vezana s Steinovo metodo, še<br />

<strong>po</strong>sebej z u<strong>po</strong>rabo kumulativne preme utežitve. Tako lahko v skladu z zgornjim<br />

izrekom izrek 3.6.3 preprosto formuliramo kot oceno:<br />

d W<br />

(<br />

µ, N(0, 1)<br />

)<br />

≤ 2 dW (µ,µ ∗ )<br />

(A.8.7)<br />

kjer jeµ ∗ kumulativna prema utežitev <strong>po</strong>razdelitveµ.<br />

O<strong>po</strong>mba. Desna stran v (A.8.6) je <strong>po</strong>seben primer Kantorovičevega funkcionala,<br />

ki meri različnost dveh <strong>po</strong>zitivnih mer in pri katerem namesto razdalje d vzamemo<br />

<strong>po</strong>ljubno zvezno nenegativno funkcijo na M×M.<br />

Če je M=R z običajno metriko in je Kantorovičev funkcional tako kot v (A.8.6),<br />

dobljenemu izrazu pravimo Ginijev indeks.<br />

Na realni osi pa Wassersteinova razdalja ni nič drugega kot L 1 -razdalja med <strong>po</strong>razdelitvenima<br />

funkcijama.<br />

Izrek A.8.3. Za <strong>po</strong>ljubni <strong>po</strong>razdelitviµinνna realni osi iz razreda L 1 velja:<br />

d W (µ,ν)=<br />

∫ ∞<br />

−∞<br />

∣<br />

∣µ ( (−∞, x] ) −ν ( (−∞, x] ) ∣ ∣∣∣<br />

dx (A.8.8)


198 A.9 POSPLOŠITVE WASSERSTEINOVE METRIKE<br />

O<strong>po</strong>mba. Da se desna stran v (A.8.8) ujema s Kantorovičevim funkcionalom, sta<br />

dokazala že Salvemini [112] (za diskretne <strong>po</strong>razdelitve) in Dall’Aglio [45] (za splošni<br />

primer).<br />

DOKAZIZREKA A.8.3. Označimo s F in G ustrezni <strong>po</strong>razdelitveni funkciji, t. j. F(x)=<br />

µ ( (−∞, x] ) in G(x)=ν ( (−∞, x] ) . Nadalje naj bo h <strong>po</strong>ljubna Lipschitzeva (torej absolutno<br />

zvezna) funkcija. Tedaj iz integracije per partes sledi, da za <strong>po</strong>ljubni točki a in b, v<br />

katerih je razlika F−G zvezna, velja:<br />

∫ b<br />

h(x) ( dF(x)−dG(x) ) = h(b) ( F(b)−G(b) ) − h(a) ( F(a)−G(a) ) ∫ b<br />

− h ′ (x) ( F(x)−G(x) ) dx<br />

a<br />

(A.8.9)<br />

Pošljimo a proti minus neskončno, b pa proti plus neskončno! Ker <strong>po</strong>razdelitviµinν<br />

pripadata razredu L 1 , je:<br />

∫ ∞<br />

|h(x)| ( dF(x)+dG(x) ) ∫ ∞ ( )( )<br />

≤ |h(0)|+|x| dF(x)+dG(x)


Dodatek A: KONVERGENCA PORAZDELITEV 199<br />

(za notacijo v zvezi z odvodi funkcij več spremenljivk glej dodatek E).<br />

Iz trditve E.5.11 sledi, da za vsako verjetnostno meroµ, za katero je ∫ |x| r µ(dx)


200 A.9 POSPLOŠITVE WASSERSTEINOVE METRIKE<br />

∫ Lema A.9.2. Naj bo r∈N in naj bostaµinνverjetnostni meri naR d , za kateri velja<br />

|x| r µ(dx)


Dodatek A: KONVERGENCA PORAZDELITEV 201<br />

• Za<strong>po</strong>redjeµ n v metriki d r ne konvergira protiµ.<br />

Polinomi 1, x,...x r−1 tvorijo bazo prostora <strong>po</strong>linomov stopnje r−1 ali manj. Naj<br />

bo{p 0 , p 1 ,...p r−1 } njena dualna baza glede na običajni integralski skalarni produkt na<br />

[0, 1]. Z drugimi besedami, za <strong>po</strong>ljubna 0≤i, j


202 A.9 POSPLOŠITVE WASSERSTEINOVE METRIKE<br />

Po <strong>po</strong>sledici E.5.10 funkcija f pripada tudi prostoru SoboljevaW s,∞ (R d ) in vsem prostorom♭<br />

(k)<br />

loc (Rd ) za k≤s, velja pa še M s ( f )=ess sup‖ f (s) ‖ (za <strong>po</strong>drobnosti v zvezi z<br />

notacijo glej razdelka E.3 in E.5). Od tod sledi, da so iz<strong>po</strong>lnjeni <strong>po</strong>goji za s-kratno<br />

u<strong>po</strong>rabo trditve E.6.2, <strong>po</strong> kateri smemo odvajati <strong>po</strong>d integralskim znakom. Dobimo:<br />

∫<br />

(Υ ε f ) (s) (x)= f (s) (x+εz) h(z) dz=<br />

R<br />

∫<br />

d<br />

(<br />

= f (s) (εy) h y− x )<br />

(A.9.13)<br />

dy<br />

ε<br />

R d<br />

Z nadaljnjo (r−s)-kratno u<strong>po</strong>rabo trditve E.6.2 dobimo:<br />

∫<br />

(Υ ε f ) (r) (x)= (−1)r−s f (s) (εy) h<br />

(y− (r−s) x )<br />

dy=<br />

ε r−s R ε<br />

∫<br />

d<br />

= (−1)r−s f (s) (x+εz) h (r−s) (z) dz<br />

ε r−s<br />

R d<br />

(A.9.14)<br />

Torej velja:<br />

M r (Υ ε f )≤ M ∫<br />

s( f ) ∣ ∣∣h (r−s) (z) ∣ ∣ dz<br />

(A.9.15)<br />

ε r−s R d<br />

Naj bosta zdajµinνverjetnostni meri. Pisali bomo kar d s := d s (µ,ν). Najprej velja:<br />

ν( f )−µ( f )=(ν−µ)( f−Υ ε f )+(ν−µ)(Υ ε f ) (A.9.16)<br />

Po (A.9.15) lahko ocenimo:<br />

Nadalje velja:<br />

|(ν−µ)(Υ ε f )|≤d r M r (Υ ε f )≤d r<br />

M s ( f )<br />

ε r−s<br />

∫<br />

R d ∣ ∣∣h (r−s) (z) ∣ ∣ ∣ dz<br />

(A.9.17)<br />

(ν−µ)( f−Υ ε f )=ε<br />

∫R d ∫R d ∫ 1<br />

0<br />

f ′ (x+tεz) dt h(z) dz (ν−µ)(dx)<br />

(A.9.18)<br />

Od tod naprej ločimo dva primera. Pravzaprav bomo naš rezultat dokazali z indukcijo<br />

<strong>po</strong> s. Za s=1 ocenimo kar:<br />

|(ν−µ)( f−Υ ε f )|≤2ε M 1 ( f )<br />

Iz (A.9.17) in (A.9.19) dobimo, da za <strong>po</strong>ljubenε>0 velja:<br />

[ ∫ ]<br />

dr<br />

|ν( f )−µ( f )|≤ h (r−1) (z) dz+2ε M<br />

ε r−1 1 ( f )<br />

R d<br />

(A.9.19)<br />

(A.9.20)<br />

Torej velja tudi:<br />

d 1 ≤ d r<br />

ε r−1 ∫<br />

R d h (r−1) (z) dz+2ε<br />

(A.9.21)


Dodatek A: KONVERGENCA PORAZDELITEV 203<br />

Optimizacija <strong>po</strong>εnam <strong>po</strong> nekaj računanja da:<br />

d 1 ≤ C 1,r d 1/r<br />

r<br />

(A.9.22)<br />

Narediti moramo še indukcijski korak z r−1 na r. V tem primeru pa ocenimo:<br />

∫<br />

∣ f ′ (x+tεz) (ν−µ)(dx)<br />

∣ ≤ d s−1 M s ( f )<br />

(A.9.23)<br />

R d<br />

Iz te ocene ter iz (A.9.17) in (A.9.18) dobimo:<br />

[ ∫ ]<br />

dr<br />

|ν( f )−µ( f )|≤ h (r−s) (z) dz+ε d<br />

ε r−s s−1 M 1 ( f )<br />

R d<br />

(A.9.24)<br />

Torej velja:<br />

d s ≤ d ∫<br />

r<br />

h (r−s) (z) dz+ε d<br />

ε r−s s−1<br />

(A.9.25)<br />

R d<br />

Razdaljo d s−1 lahko ocenimo <strong>po</strong> indukcijski pred<strong>po</strong>stavki. Dobimo:<br />

d s ≤ d ∫<br />

r<br />

h (r−s) (z) dz+C<br />

ε r−s s−1,r d (s−1)/r<br />

r ε (A.9.26)<br />

R d<br />

Optimizacija <strong>po</strong>εnam spet <strong>po</strong> nekaj računanja da d s ≤ C s,r d s/r<br />

r , to pa je bilo <strong>po</strong>trebno<br />

dokazati.<br />

(3) in (4): Sledi iz točk (1) in (2) ter dejstva, da je d 1 = d W res metrika (trditev A.8.1).<br />

A.10 Metrika Kolmogorova in <strong>po</strong>splošitve<br />

Metrika Kolmogorova temelji na <strong>po</strong>razdelitvenih funkcijah, ki marsikje igrajo ključno<br />

vlogo, npr. v statistiki pri konstrukciji intervalov zaupanja.<br />

DEFINICIJA. Metriko Kolmogorova na prostoru vseh Borelovih verjetnostnih mer na<br />

R definiramo kot:<br />

∣<br />

d K (µ,ν) := sup∣ν ( (−∞, x] ) −µ ( (−∞, x] )∣ ∣ (A.10.1)<br />

x∈R<br />

To je torej metrika iz (A.1.2), pri čemer za testne funkcije vzamemo indikatorje vseh<br />

<strong>po</strong>ltrakov (−∞, x].<br />

O<strong>po</strong>mbi.<br />

(1) Ni se težko prepričati, da je to res metrika. Iz razlik indikatorjev <strong>po</strong>ltrakov<br />

namreč lahko tvorimo indikatorje vseh intervalov oblike (a, b], le-ti pa tvorijoπsistem,<br />

ki generira Borelovoσ-algebro naR. Po trditvi A.1.2 <strong>po</strong>tem indikatorji<br />

<strong>po</strong>ltrakov ločijo verjetnostne mere naRin <strong>po</strong> trditvi A.1.1 je d K res metrika.


204 A.10 METRIKA KOLMOGOROVA IN POSPLOŠITVE<br />

(2) Namesto <strong>po</strong>ltrakov oblike (−∞, x] bi lahko vzeli tudi <strong>po</strong>ltrake oblike (−∞, x).<br />

Indikatorje enih namreč lahko dobimo kot monotone limite indikatorjev drugih<br />

in <strong>po</strong> točki (1) trditve A.4.4 se morata ustrezni metriki ujemati.<br />

Podobno kot metrika Kolmogorova se obnaša še vrsta metrik, ki temeljijo na omejenih<br />

testnih funkcijah, ki pa ne smejo biti “predivje” (za preciznejšo formulacijo le-tega<br />

glej s<strong>po</strong>daj). Pomembna je npr. metrika, ki jo dobimo iz indikatorjev vseh konveksnih<br />

množic naR d . Zanimivo metriko dobimo tudi, če za testne funkcije vzamemo<br />

indikatorje vseh unij intervalov naR, daljših od ena.<br />

Trditev A.10.1. Metrika Kolmogorova <strong>po</strong>rodi to<strong>po</strong>logijo, močnejšo od šibke. Splošneje, to<br />

velja za vsako metriko naR d , ki jo dobimo <strong>po</strong> (A.1.2), če testne funkcije zajemajo indikatorje<br />

kartezijskih produktov oblike (−∞, x 1 ]×···×(−∞, x d ].<br />

DOKAZ. U<strong>po</strong>rabili bomo trditev A.6.1. Označimo zF razred testnih funkcij, ki<br />

določa našo metriko. Najprej iz trditve A.3.1 sledi, da je to<strong>po</strong>logija, ki jo <strong>po</strong>rodi naša<br />

metrika, močnejša od šibke to<strong>po</strong>logije glede naF . Nadalje iz točke (2) trditve A.4.2<br />

sledi, da lahko razredF zamenjamo z njegovo linearno ogrinjačo. Le-ta pa vsebuje<br />

indikatorje vseh končnih disjunktnih unij pravokotnikov oblike (a 1 , b 1 ]×···×(a d , b d ].<br />

Ni težko preveriti, da le-ti iz<strong>po</strong>lnjujejo <strong>po</strong>goj (1) trditve A.6.1 in rezultat je dokazan.<br />

Metrika Kolmogorova ni primerljiva z nobeno od metrik d r iz razdelka A.8. To<br />

<strong>po</strong>kažeta naslednja dva zgleda.<br />

ZGLED A.10.1. Naj bo r∈N in naj bodoµ n inµtako kot v zgledu A.9.2. Za<strong>po</strong>redje<br />

µ n torej v metriki d r ne konvergira kµ, pač pa konvergira v metriki Kolmogorova, saj<br />

velja:<br />

∣<br />

∣(µ n −µ) ( (−∞, x] )∣ ⎛<br />

∣ 1<br />

∑r−1<br />

∣≤<br />

n<br />

⎜⎝ δ n 1/r+ n i/r ν i<br />

⎞⎟ ⎠<br />

≤<br />

i=0<br />

(A.10.2)<br />

≤ 1 ∑r−1<br />

∫ 1<br />

n + n i/r−1<br />

i=0<br />

0<br />

|p i (t)| dt−−−→<br />

n→∞<br />

0<br />

ZGLED A.10.2. Naj bo spet r∈N. Konstruirali bomo za<strong>po</strong>redje <strong>po</strong>razdelitevµ n , ki<br />

bo v metriki d r konvergiralo proti <strong>po</strong>razdelitviµ, v metriki Kolmogorova pa to ne bo<br />

veljalo. Naj boεenakomerna <strong>po</strong>razdelitev na [0, 1]. Definirajmo najprej:<br />

µ := 1 2 (δ 0+ε) (A.10.3)<br />

Nadalje naj bo spet{p 0 ,...p r−1 } baza prostora <strong>po</strong>linomov stopnje, manjše od r, ki je dualna<br />

bazi{1, x,...x r−1 } glede na običajni integralski skalarni produkt na [0, 1]. Označimo<br />

spetν i (dx) := p i (x) 1(0≤x≤1) dx in definirajmo:<br />

⎛<br />

µ n := 1 ∑r−1<br />

2<br />

⎜⎝ δ 1/n+ε− n −i ν i<br />

⎞⎟ ⎠<br />

(A.10.4)<br />

i=1<br />


Dodatek A: KONVERGENCA PORAZDELITEV 205<br />

Za dovolj velike n jeµ n res verjetnostna mera in ni težko preveriti, da ima vse momente,<br />

manjše od r, enake kotµ. Po lemi A.9.2 velja:<br />

d r (µ,µ n )≤ 1 ∫ ⎞<br />

∑r−1<br />

x<br />

⎛⎜ r 2 r! R ⎝<br />

δ 0 +δ 1/n + n −i |ν i | ⎟⎠ (dx)=<br />

i=1<br />

⎛<br />

= 1 ∑r−1<br />

∫ ⎞<br />

(A.10.5)<br />

1<br />

2 r!<br />

⎜⎝ n−r + n −i |p i (t)| dt⎟⎠ −−−→ 0<br />

n→∞<br />

i=1<br />

torej za<strong>po</strong>redjeµ n v metriki<br />

(<br />

d r res konvergira<br />

)<br />

protiµ. V metriki<br />

(<br />

Kolmogorova<br />

)<br />

pa to ne<br />

drži, ker za vsak n veljaµ n (−∞, 0] = 0, medtem ko jeµ (−∞, 0] = 1/2. □<br />

Zadnji zgled <strong>po</strong>kaže, da za<strong>po</strong>redje, ki konvergira v metriki d r , še ne konvergira<br />

nujno v metriki Kolmogorova. Po drugi strani pa smo v razdelku A.7 videli, da <strong>po</strong>d<br />

določenimi <strong>po</strong>goji že šibka konvergenca proti določenim meram implicira konvergenco<br />

v metrikah, ki so <strong>po</strong>splošitve metrike Kolmogorova. Tu pa bomo razdaljo v teh metrikah<br />

še ekslicitno ocenili z razdaljami d r .<br />

Podobno kot v razdelku A.7 naj boF razred testnih funkcijR d → [0, 1]. Tako kot v<br />

(A.7.1) za vsakε>0 definirajmo:<br />

Υ + ε f (x) := sup<br />

|y|


206 A.10 METRIKA KOLMOGOROVA IN POSPLOŠITVE<br />

ZGLED A.10.4. Naj boF razred indikatorjev vseh unij intervalov naR, katerih<br />

dolžine so vsaj ena,νpa naj bo standardizirana normalna <strong>po</strong>razdelitev. Tedaj zveza<br />

(A.10.7) velja za:<br />

⎧<br />

⎪⎨<br />

∑( K := sup φ(ai )+φ(b ⎪⎩<br />

i ) ) ⎫<br />

⎪⎬⎪⎭<br />

; (∀i) a i + 1≤b i ≤ a i+1 =<br />

i∈Z<br />

∑<br />

(A.10.9)<br />

= 2 sup φ(x+i)


Dodatek A: KONVERGENCA PORAZDELITEV 207<br />

Če pa za f vstavimo funkcije iz♭ (r) (R d ), dobimo:<br />

Torej velja:<br />

d r (µ n ,ν)= 1<br />

n r+1 d r(µ 1 ,ν)<br />

d K (µ n ,ν)=c r<br />

(<br />

dr (µ n ,ν) ) 1/(r+1)<br />

(A.10.14)<br />

(A.10.15)<br />

kjer je c r = d K (µ 1 ,ν)/ ( d r (µ 1 ,ν) ) 1/(r+1)<br />

. Zgornja meja v (A.10.8) je torej vsaj glede velikostnega<br />

reda dosežena.<br />

□<br />

DOKAZTRDITVE A.10.2. Naj bosta h inΥ ε f tako kot v (A.9.12). Očitno je f≤Υ ε Υ + ε f≤<br />

Υ 2ε f . Sledi:<br />

µ( f )−ν( f )≤(µ−ν)(Υ ε Υ + ε f )+ν(Υ ε Υ + ε f−f )≤<br />

≤ (µ−ν)(Υ ε Υ ε + f )+ν(Υ + 2ε<br />

f−f )≤<br />

≤ (µ−ν)(Υ ε Υ ε + f )+2Kε<br />

(A.10.16)<br />

Podobno izpeljemo:<br />

µ( f )−ν( f )≥(µ−ν)(Υ ε Υ − ε f )−ν( f−Υ ε Υ − ε f )≥<br />

≥ (µ−ν)(Υ ε Υ − ε f )−ν( f−Υ + 2ε f )≥<br />

≥ (µ−ν)(Υ ε Υ − ε f )−2Kε<br />

(A.10.17)<br />

Po (A.9.15) velja ocena:<br />

Sledi:<br />

M r (Υ ε f )≤ 1 ε r ∫R d ∣ ∣∣h (r) (z) ∣ ∣ ∣ dz (A.10.18)<br />

|µ( f )−ν( f )|≤ d r(µ,ν)<br />

ε r<br />

∫<br />

R d ∣ ∣∣h (r) (z) ∣ ∣ ∣ dz+2Kε<br />

(A.10.19)<br />

Če zdaj vzamemo supremum <strong>po</strong> f∈F in optimiziramo <strong>po</strong>ε, dobimo ravno (A.10.8)<br />

in trditev je dokazana.


208 A.10 METRIKA KOLMOGOROVA IN POSPLOŠITVE


Dodatek B<br />

Operatorske <strong>po</strong>lgrupe<br />

B.1 Definicija in osnovne lastnosti<br />

DEFINICIJA. Operatorska <strong>po</strong>lgrupa je družina omejenih linearnih operatorjevP t na<br />

Banachovem prostoru L, kjer je t≥0in velja:<br />

(1)P 0 =I(t. j. identiteta na L).<br />

(2)P t+s =P t P s .<br />

Polgrupa je krepko zvezna, če za vsak f∈ L velja lim t↓0 P t f=f . Polgrupa je kontrakcijska,<br />

če so njeni operatorji kontrakcije, t. j. če je‖P t ‖≤1.<br />

Do konca razdelka bo oznaka L <strong>po</strong>menila Banachov prostor.<br />

O<strong>po</strong>mba. Kontrakcijske <strong>po</strong>lgrupe so <strong>po</strong>membne, ker nastopajo v verjetnosti: če je<br />

(X t ) t≥0 markovski proces, operatorjiP t , definirani <strong>po</strong> predpisu:<br />

P t (X 0 )=E [ f (X t )|X 0<br />

]<br />

(B.1.1)<br />

tvorijo kontrakcijsko operatorsko <strong>po</strong>lgru<strong>po</strong>. Natančneje, obstajajo verzije operatorjev<br />

P t , ki tvorijo kontrakcijsko operatorsko <strong>po</strong>lgru<strong>po</strong>. Za <strong>po</strong>drobnosti glej npr. Rogers in<br />

Williams [109].<br />

Trditev B.1.1. Naj bo (P t ) t≥0 krepko zvezna operatorska <strong>po</strong>lgrupa. Tedaj obstajata tak<br />

M>0 in takω∈R, da za vsak t≥0velja:<br />

‖P t ‖≤Me ωt<br />

(B.1.2)<br />

O<strong>po</strong>mba. Pri kontrakcijskih operatorskih <strong>po</strong>lgrupah zgornja trditev seveda avtomatično<br />

velja. Vendar pa nam trditev <strong>po</strong>ve tudi, da med krepko zveznimi operatorskimi<br />

<strong>po</strong>lgrupami kontrakcijske niso prav zelo <strong>po</strong>seben primer. Brž ko je (P t ) t≥0 krepko zvezna<br />

operatorska <strong>po</strong>lgrupa in velja‖P t ‖≤Me ωt , operatorjiP ′ t := e−ωt P t tvorijo krepko<br />

zvezno operatorsko <strong>po</strong>lgru<strong>po</strong>, za katero velja ocena‖P ′ t<br />

‖≤M. Če normo na prostoru<br />

L zamenjamo z enakomerno ekvivalentno normo, definirano <strong>po</strong> predpisu:<br />

‖ f‖ ′ := sup‖P ′ t f‖<br />

t≥0<br />

pa <strong>po</strong>stane operatorska <strong>po</strong>lgrupa (P ′ t ) t≥0 kontrakcijska.<br />

209<br />

(B.1.3)


210 B.1 DEFINICIJA IN OSNOVNE LASTNOSTI<br />

DOKAZTRDITVE B.1.1. Najprej bomo <strong>po</strong>kazali, da obstajata tak t 0 > 0 in tak M>0,<br />

da za vsak t∈[0, t 0 ] velja‖P t ‖≤M. Če to ne bi bilo res, bi obstajalo tako za<strong>po</strong>redje<br />

t n , ki pada proti 0, da bi veljalo lim n→∞ ‖P tn ‖=∞. Toda zaradi krepke zveznosti je za<br />

vsak f∈ L za<strong>po</strong>redjeP tn f omejeno in pridemo v protislovje s princi<strong>po</strong>m enakomerne<br />

omejenosti.<br />

Definirajmoω := 1 t 0<br />

log M. Naj bo t≥0. Obstajata tak k∈N 0 in tak s∈[0, t 0 ], da je<br />

t=kt 0 + s. Sledi:<br />

‖P t ‖≤‖P k t P s‖≤M M t/t 0<br />

= M e ωt<br />

(B.1.4)<br />

Trditev B.1.2. Naj bo (P t ) t∈≥0 krepko zvezna operatorska <strong>po</strong>lgrupa. Tedaj je za vsak f∈ L<br />

funkcija t↦→P t f zvezna funkcija iz [0,∞) v L.<br />

DOKAZ. Naj bo t≥0 in naj bosta M inωkot v trditvi B.1.1. Za h≥0velja:<br />

‖P t+h f−P t f‖=‖P t (P h f−f )‖≤Me ωt ‖P h f−f‖<br />

(B.1.5)<br />

za 0≤h≤t pa velja:<br />

‖P t−h f−P t f‖=‖P t−h (P h f−f )‖≤Me ωt ‖P h f−f‖<br />

(B.1.6)<br />

Od tod pa že sledi zveznost.<br />

DEFINICIJA.<br />

(1) Linearni operator v Banachovem prostoru L je (lahko tudi neomejen) linearni operatorAizD(A)<br />

v L, kjer je definicijsko območjeD(A) linearni <strong>po</strong>dprostor v L.<br />

(2) OperatorAje gosto definiran, če je <strong>po</strong>dprostorD(A) gost v L.<br />

(3) Graf linearnega operatorjaA: D(A) → L ′ , kjer jeD(A) ⊆ L, je množica<br />

Γ :={( f,Af ) ; f∈D(A)}. OperatorAje zaprt, če je njegov graf zaprt v L×L ′ s<br />

produktno to<strong>po</strong>logijo.<br />

(4) Zaloga vrednosti linearnega operatorjaAje množicaR(A) :={A f ; f∈D(A)}.<br />

(5) Omejen linearni operator na L je omejen linearni operator iz L v L.<br />

O<strong>po</strong>mba. Vsak omejen in <strong>po</strong>vsod definiran linearni operator je zaprt. Drugače<br />

pa je linearni operator zaprt natanko tedaj, ko za vsako za<strong>po</strong>redje ( f n ) n∈N elementov iz<br />

D(A), ki konvergira k f , velja: če za<strong>po</strong>redje (A f n ) n∈N konvergira h g, je f∈D(A) in<br />

A f= g.<br />

DEFINICIJA. (Infinitezimalni) generator operatorske <strong>po</strong>lgrupe (P t ) t≥0 je (navadno<br />

neomejen) linearni operatorA, definiran <strong>po</strong> predpisu:<br />

A f := lim<br />

h↓0<br />

P h f−f<br />

h<br />

(B.1.7)<br />

Definicijsko območjeD(A) operatorjaAso vsi elementi f∈ L, za katere zgornja limita<br />

obstaja.


Dodatek B: OPERATORSKE POLGRUPE 211<br />

Trditev B.1.3. Naj bo (P t ) t≥0 krepko zvezna operatorska <strong>po</strong>lgrupa z generatorjemA. Če je<br />

f∈D(A), je za vsak t tudiP t f∈D(A) in velja:<br />

d<br />

dt P t f=AP t f=P t A f<br />

Pri tem gre pri t=0le za desni, pri t>0 pa za obojestranski odvod.<br />

(B.1.8)<br />

DOKAZ. Za vsak h>0 definirajmoA h := 1 h (P h−I). Velja:<br />

A h P t f= 1 h (P t+h−P t ) f=P t A h f<br />

(B.1.9)<br />

Ker je f∈D(A) in je operatorP t omejen, desna stran konvergira protiP t A f , ko gre h<br />

proti 0. Od tod pa že dobimo to, kar smo iskali, le da smemo namesto obojestranskega<br />

pisati le desni odvod. Da dokažemo, da smemo pisati tudi levi odvod, zgornjo enačbo<br />

zapišemo malo drugače. Če je t>0, za 00 obstaja takδ>0, da za <strong>po</strong>ljubno delitev D,<br />

za katero je diam D


212 B.2 RIEMANNOV INTEGRAL V BANACHOVIH PROSTORIH<br />

O<strong>po</strong>mba. Riemannov integral preslikave u obstaja natanko tedaj, ko za vsakε > 0<br />

obstaja takδ>0, da za <strong>po</strong>ljubni delitvi D 1 in D 2 , za kateri je diam D 1


Dodatek B: OPERATORSKE POLGRUPE 213<br />

Naj bo∆interval na realni osi. SC(∆; L) označimo prostor vseh zveznih preslikav<br />

iz∆vL, sC (1) (∆; L) pa prostor vseh preslikav iz∆vL, ki so zvezne na∆in zvezno<br />

odvedljive v notranjosti intervala∆.<br />

Trditev B.2.3.<br />

(1) Če je u∈C(∆; L) in je ∫ ‖u(t)‖ dt


214 B.3 DYNKINOVA FORMULA<br />

(3): Dovolj je dokazati za primer, ko je u odvedljiva na vsem intervalu [a, b] (t. j. v a<br />

obstaja desni, v b pa levi odvod); splošni primer dobimo od tod z limitiranjem. Dokaz je<br />

spet malo bolj zoprn kot v realnem primeru, ker ne moremo u<strong>po</strong>rabiti Lagrangeevega<br />

izreka. Naj boε>0 inδ>0. Za vsak x∈[a, b] obstaja takδ x > 0, da za vsak t, za<br />

katerega je|t−x|


Dodatek B: OPERATORSKE POLGRUPE 215<br />

DOKAZ. Iz točke (2) trditve B.2.3 in še trditve B.2.2 sledi, da za vsak h>0 velja:<br />

1<br />

h (P h−I)<br />

∫ t<br />

0<br />

P s f ds= 1 h<br />

= 1 h<br />

= 1 h<br />

∫ t<br />

0<br />

(∫ t+h<br />

h<br />

∫ t+h<br />

t<br />

(P s+h f−P s f ) ds=<br />

P s f ds−<br />

P s f ds− 1 h<br />

∫ t<br />

0<br />

∫ h<br />

0<br />

P s f ds<br />

)<br />

P s f ds<br />

=<br />

(B.3.3)<br />

Ko gre h proti 0, iz definicije generatorja in točke (4) trditve B.2.3 sledi (B.3.1). Zveza<br />

(B.3.2) pa takoj sledi iz trditve B.1.3 in točke (3) trditve B.2.3.<br />

O<strong>po</strong>mba. Na prvi <strong>po</strong>gled bi se zdelo, da lahko drugi del trditve izpeljemo kar iz<br />

točke (2) trditve B.2.3. Vendar pa tega ne moremo storiti, ker še ne vemo, da je generator<br />

A zaprt. To pa je naslednja stvar, ki jo bomo izpeljali.<br />

Posledica B.3.2. Generator krepko zvezne operatorske <strong>po</strong>lgrupe je gosto definiran in zaprt.<br />

DOKAZ. Iz točke (1) trditve B.2.3 sledi, da je f t := ∫ t<br />

P 0<br />

s f ds∈D(A) za vsak t>0<br />

in vsak f ∈ L. Ker je lim t↓0 f t /t= f , jeAres gosto definiran. Naj zdaj za<strong>po</strong>redje f n<br />

konvergira proti f , za<strong>po</strong>redjeA f n pa proti g. Po točki (2) trditve B.2.3 jeP t f n − f n =<br />

∫ t<br />

P 0<br />

sA f n ds. Pošljimo najprej n proti neskončno! Leva stran očitno konvergira proti<br />

P t f−f . Iz enakomerne omejenosti operatorjevP s (trditev B.1.1) in ocene (B.2.2) pa<br />

dobimo, da gre desna stran proti ∫ t<br />

P 0<br />

sg ds. Zdaj pa enačboP t f−f= ∫ t<br />

P 0<br />

sg ds delimo<br />

s t, <strong>po</strong>šljemo t proti 0 in ob u<strong>po</strong>števanju točke (4) trditve B.2.3 dobimo, da jeA f= g,<br />

od tod pa sledi, da je generatorAres zaprt.<br />

B.4 Resolventa, Hille–Yosidov izrek<br />

DEFINICIJA. Naj boAzaprt linearni operator v Banachovem prostoru L. Operator<br />

A je obrnljiv, če jeAbijektivna preslikava izD(A) na L. Resolventna množicaρ(A)<br />

operatorjaAje množica tistih realnih številλ, za katera je operatorλI−A obrnljiv.<br />

Pripadajočim inverzom (λI−A) −1 pravimo resolventa.<br />

O<strong>po</strong>mba. Iz izreka o zaprtem grafu sledi, da je inverz obrnljivega operatorja omejen<br />

linearni operator na L.<br />

Trditev B.4.1. Naj bo (P t ) t≥0 krepko zvezna operatorska <strong>po</strong>lgrupa z generatorjemA. Tedaj<br />

obstaja takλ 0 > 0, da je (λ 0 ,∞)⊆ρ(A), za vsak f∈ L in vsakλ>λ 0 pa velja:<br />

(λI−A) −1 f=<br />

∫ ∞<br />

0<br />

e −λt P t f dt<br />

(B.4.1)<br />

Natančneje, če za vsak t≥0 velja‖P t ‖≤M e ωt , lahko <strong>po</strong>stavimoλ 0 =ω. Če je torej <strong>po</strong>lgrupa<br />

kontrakcijska, je (0,∞)⊆ρ(A).


216 B.4 RESOLVENTA, HILLE–YOSIDOV IZREK<br />

O<strong>po</strong>mba. Integral na desni ni nič drugega kot Laplaceova transformiranka preslikave<br />

t↦→P t f .<br />

Dokaz bomo opustili, za dokaz glej npr. Ethier in Kurtz [55] ali Rudin [111]. Pri<br />

<strong>Steinovi</strong> <strong>metodi</strong> pa nas bo bolj zanimal primer, ko je <strong>po</strong>lgrupa kontrakcijska inλ=0.<br />

Tu trditev, tako kot je napisana, ne velja, <strong>po</strong>trebno je <strong>po</strong>staviti dodatne <strong>po</strong>goje tako pri<br />

operatorski <strong>po</strong>lgrupi kot tudi pri elementu f .<br />

Posledica B.4.2. Naj bo (P t ) t≥0 krepko zvezna operatorska <strong>po</strong>lgrupa z generatorjemAin<br />

naj za vsak t≥0 velja‖P t ‖≤M e ωt . Tedaj za vsak n∈Nin vsakλ>ωvelja:<br />

in:<br />

(λI−A) −n f=<br />

∫<br />

1 ∞<br />

t n−1 e −λt P t f dt<br />

(n−1)! 0<br />

∥<br />

∥(λI−A) −n∥ ∥ ∥≤<br />

M<br />

(λ−ω) n<br />

(B.4.2)<br />

(B.4.3)<br />

SKICADOKAZA. Formulo (B.4.2) dokažemo z indukcijo <strong>po</strong> n in zamenjavo vrstnega<br />

reda integracije. Da res smemo menjati vrstni red integracije, dokažemo tako, da<br />

elemente Banachovega prostora “otipavamo” z omejenimi linearnimi funkcionali (ki<br />

jih <strong>po</strong> Hahn–Banachovem izreku natančno določajo). Tako s <strong>po</strong>močjo točke (2) trditve<br />

B.2.3 Riemannov integral v Banachovem prostoru prevedemo na običajni Riemannov<br />

integral.<br />

Izkaže se, da so lastnosti generatorjev, ki smo jih izpeljali do zdaj, že zadosten <strong>po</strong>goj<br />

za to, da je dani operator generator krepko zvezne operatorske <strong>po</strong>lgrupe.<br />

Izrek B.4.3 (Hille, Yosida). Naj boAlinearni operator v Banachovem prostoru ter M>0<br />

inω∈R. Naslednji dve trditvi sta ekvivalentni.<br />

(1) OperatorAgenerira operatorsko <strong>po</strong>lgru<strong>po</strong>P t , za katero velja‖P t ‖≤M e ωt .<br />

(2) Za vsakλ>ω jeλI−A obrnljiv in za vsak n∈N velja ocena (B.4.3).<br />

Poleg tega vsak linearni operator generira največ eno operatorsko <strong>po</strong>lgru<strong>po</strong>.<br />

Dokaz tega izreka bomo opustili, za dokaz glej npr. Rudin [111], izrek 13.37, stran<br />

380.


Dodatek C<br />

O Millsovem razmerju<br />

C.1 Definicija in osnovne lastnosti<br />

DEFINICIJA. Označimo sφstandardizirano Gaussovo gostoto naR:<br />

φ(x)= 1 √<br />

2π<br />

e − 1 2 x2<br />

(C.1.1)<br />

in definirajmo Gaussov verjetnostni integral na naslednji način:<br />

Φ(x) :=<br />

∫ x<br />

φ(z) dz<br />

−∞<br />

(C.1.2)<br />

Millsovo razmerje je razmerje med zgornjima funkcijama, ki ga definiramo na naslednji<br />

način:<br />

ψ(x) := Φ(x) ∫ x<br />

φ(x) = e 2 1 x2 e − 2 1 z2 dz<br />

(C.1.3)<br />

O<strong>po</strong>mba. V literaturi je Millsovo razmerje dostikrat definirano nekoliko drugače,<br />

tako da se namestoψ(x) vzameψ(−x). To je zato, ker jeψ, definiran v (C.1.3), “krotka”<br />

funkcija za negativne x. Vendar pa ima tudi definicija (C.1.3) svoje prednosti.<br />

Millsovo razmerje je <strong>po</strong>membno, ker se z njim izražajo rešitve Steinove enačbe. Ni<br />

težko preveriti, da Millsovo razmerje reši enačbo:<br />

−∞<br />

ψ ′ (x)=xψ(x)+1<br />

(C.1.4)<br />

ki je varianta Steinove enačbe (1.4.14). Z za<strong>po</strong>rednim odvajanjem lahko izračunamo<br />

tudi nekaj višjih odvodov:<br />

ψ ′′ (x)=(x 2 + 1)ψ(x)+x<br />

ψ ′′′ (x)=(x 3 + 3x)ψ(x)+x 2 + 2<br />

ψ (4) (x)=(x 4 + 6x 2 + 3)ψ(x)+x 3 + 5x<br />

(C.1.5)<br />

(C.1.6)<br />

(C.1.7)<br />

217


218 C.2 NEKAJ NEENAKOSTI<br />

C.2 Nekaj neenakosti<br />

V tem razdelku bomo raziskali obnašanje funkcijeψin njenih odvodov.<br />

Trditev C.2.1. Za vsak r∈N 0 in za vsak x∈Rveljaψ (r) (x)>0.<br />

DOKAZ. S substitucijo t=x−z v integral v (C.1.3) dobimo:<br />

ψ(x)=<br />

∫ ∞<br />

0<br />

e tx− 1 2 t2 dt<br />

(C.2.1)<br />

Po odvajanju <strong>po</strong>d integralskim znakom (ni težko preveriti, da so iz<strong>po</strong>lnjeni <strong>po</strong>goji<br />

trditve E.6.3) dobimo:<br />

ψ (r) (x)=<br />

∫ ∞<br />

0<br />

t r e tx− 1 2 t2 dt>0<br />

(C.2.2)<br />

Trditev C.2.2. Za vsak r∈N 0 in vsak x>0 velja ocena:<br />

DOKAZ. Iz (C.2.2) dobimo:<br />

ψ (r) (−x)< r!<br />

x r+1<br />

(C.2.3)<br />

ψ (r) (−x)=<br />

∫ ∞<br />

0<br />

t r e −tx− 1 2 t2 dt<<br />

∫ ∞<br />

0<br />

t r e −tx dt= r!<br />

x r+1<br />

(C.2.4)<br />

Tako smo za negativna števila odvode Millsovega razmerja omejili navzgor in navzdol.<br />

Samo Millsovo razmerje pa bomo ocenili še ostreje.<br />

Trditev C.2.3. Za vsak x≥0velja:<br />

1<br />

√ ≤ψ(−x)≤<br />

2<br />

+ x x+<br />

π<br />

2<br />

√<br />

x 2 + 8 π<br />

≤ min<br />

{√<br />

π<br />

2 , 1 x}<br />

(C.2.5)<br />

O<strong>po</strong>mba. Notranji oceni funkcijeψsta razmeroma ostri. Za x=0 in x→∞ sta<br />

točni, sicer pa numerični izračuni <strong>po</strong>kažejo:<br />

√<br />

2<br />

max<br />

⎛⎜ ψ(−x)<br />

x≥0 ⎝<br />

⎞⎟<br />

π + x ⎠ < 1,19, max<br />

x≥0<br />

2<br />

(<br />

ψ(−x) x+<br />

√ )< 1,06 (C.2.6)<br />

x 2 + 8 π<br />

Zunanja ocena na desni pa je malo bolj groba. Za x=0 in x→∞ je še vedno točna,<br />

sicer pa velja:<br />

min { √ π , }<br />

1<br />

2 x<br />

< 1,72 (C.2.7)<br />

ψ(−x)


Dodatek C: O MILLSOVEM RAZMERJU 219<br />

O<strong>po</strong>mba. Da je desna stran v (C.2.5) zgornja meja zaψ(−x), takoj sledi iz ocene<br />

(C.2.4) ter dejstva, da jeψ<strong>po</strong> trditvi C.2.1 naraščajoča funkcija inψ(0)= √ π/2.<br />

DOKAZTRDITVE C.2.3. Za prvo neenakost v (C.2.5) je ekvivalentno dokazati, da za<br />

vsak x≥0velja:<br />

F 1 (x) :=<br />

∫ ∞<br />

Po odvajanju in nekaj računanja dobimo:<br />

x<br />

e − 1 2 z2 dz− e− 1 2 x2<br />

√<br />

2<br />

π + x ≥ 0<br />

(C.2.8)<br />

F ′ 1 (x)= e 1 2 x2<br />

(√<br />

2<br />

π + x ) 2<br />

⎛⎜ ⎝ 1− 2 π − √<br />

2<br />

π x ⎞⎟ ⎠<br />

(C.2.9)<br />

Torej obstaja tak x 1 > 0, da za 0≤x≤x 1 velja F ′ (x)≥0, za x≥x 1 1 pa F ′ (x)≤0. Ker je<br />

1<br />

tudi F 1 (0)=lim x→∞ F 1 (x)=0, res velja (C.2.8).<br />

Podobno je za drugo neenakost ekvivalentno dokazati, da za vsak x≥0 velja:<br />

F 2 (x) :=<br />

2 e − 1 2 x2<br />

√ −<br />

x+ x 2 + 8 π<br />

∫ ∞<br />

x<br />

e − 1 2 z2 dz≥0<br />

(C.2.10)<br />

Spet <strong>po</strong> odvajanju in nekaj računanja dobimo:<br />

F ′ 2 (x)=<br />

√<br />

x 2 + 8 π<br />

e − 1 2 x2<br />

(<br />

x+<br />

√<br />

x 2 + 8 π<br />

8<br />

8<br />

) 2<br />

⎛⎜ ⎝ π − 2− √<br />

π<br />

1+<br />

1+ 8<br />

πx 2 ⎞⎟ ⎠<br />

(C.2.11)<br />

in spet ni težko videti, da obstaja tak x 2 > 0, da za 0≤x≤x 2 velja F ′ 2 (x)≥0, za x≥x 2<br />

pa F ′ 2<br />

(x)≤0. Torej velja tudi (C.2.10). S tem sta prvi dve neenakosti v (C.2.5) dokazani,<br />

zadnja pa je očitna.<br />

C.3 Nekaj enakosti<br />

Dokazali bomo nekaj zvez, ki zadevajo višje odvode Millsovega razmerjaψ, prav<br />

tako pa tudi večkratne integrale standardizirane Gaussove gostoteφ.<br />

Z za<strong>po</strong>rednim odvajanjem lahko vse višje odvode Millsovega razmerja izrazimo z<br />

njim samim in <strong>po</strong>linomi. To lahko storimo tudi s <strong>po</strong>močjo rekurentnih formul.<br />

Trditev C.3.1. Za vsak r∈N in vsak x∈Rvelja zveza:<br />

ψ (r+1) (x)=xψ (r) (x)+rψ (r−1) (x)<br />

(C.3.1)<br />

DOKAZ. Za r=1 zveza takoj sledi iz (C.1.4) in (C.1.5). Indukcijski korak z r na r+1<br />

pa naredimo tako, da zvezo (C.3.1) odvajamo. Dobimo:<br />

ψ (r+2) (x)=xψ (r+1) (x)+(r+1)ψ (r) (x)<br />

kar je natančno zveza (C.3.1), pri kateri r nadomestimo z r+1.<br />

(C.3.2)


220 C.3 NEKAJ ENAKOSTI<br />

Posledica C.3.2. Za vsak r∈N velja zveza:<br />

ψ (r) (x)=P r (x)ψ(x)+Q r (x)<br />

(C.3.3)<br />

kjer je P r <strong>po</strong>linom stopnje r, Q r pa <strong>po</strong>linom stopnje r−1.<br />

Odvodi Millsovega razmerja so tesno <strong>po</strong>vezani z večkratnimi integrali standardizirane<br />

Gaussove gostoteφ. Induktivno definirajmo:<br />

Φ 0 (x) :=φ(x), Φ r+1 (x) :=<br />

∫ x<br />

Φ r (z) dz<br />

−∞<br />

(C.3.4)<br />

Trditev C.3.3. FunkcijeΦ r so dobro definirane (t. j. vsi integrali v (C.3.4) konvergirajo)<br />

in za vsak r∈N 0 velja:<br />

Φ r+1 (x)= 1 r! φ(x)ψ(r) (x)<br />

(C.3.5)<br />

DOKAZ. Za r=0 zveza (C.3.5) sledi ne<strong>po</strong>sredno iz definicije Millsovega razmerja.<br />

Naredimo indukcijski korak z r−1 na r. Za r∈N torej privzemimo:<br />

Φ r (x)=<br />

1<br />

(r−1)! φ(x)ψ(r−1) (x)<br />

(C.3.6)<br />

Najprej iz ocene (C.2.4) sledi, da je funkcijaΦ r integrabilna na intervalih (−∞, x] in<br />

da zveza (C.3.5) velja za x→−∞. Tako je dovolj dokazati odvod zveze (C.3.5). Po<br />

indukcijski pred<strong>po</strong>stavki (C.3.6) velja:<br />

[<br />

d<br />

Φ r+1 (x)− 1 ]<br />

dx r! φ(x)ψ(r) (x) =Φ r (x)− 1 r! φ′ (x)ψ (r) (x)− 1 r! φ(x)ψ(r+1) (x)=<br />

= 1 r! φ(x)[ rψ (r−1) (x)+xψ (r) (x)−ψ (r+1) (x) ] (C.3.7)<br />

Toda <strong>po</strong> rekurentni formuli (C.3.1) je zgornji izraz enak nič.<br />

dokazana.<br />

S tem je naša trditev<br />

Trditev C.3.4. Za vsak r∈N 0 in vsak x∈Rvelja:<br />

in še:<br />

lim Φ r(x)ψ (r) (−x)=0<br />

x→∞<br />

Φ r (−x)ψ (r) (x)+Φ r (x)ψ (r) (−x)=1<br />

(C.3.8)<br />

(C.3.9)<br />

DOKAZ. Če je r=0 ali r=1, (C.3.8) takoj sledi iz ocene (C.2.3). Za r≥2 pa iz (C.3.3)<br />

in (C.3.5) sledi:<br />

1 (<br />

Φ r (x)= Pr−1 (x)Φ(x)+Q r−1 (x)φ(x) ) (C.3.10)<br />

(r−1)!<br />

kjer je P r−1 <strong>po</strong>linom stopnje r−1, Q r−1 pa stopnje r−2. Torej obstaja konstanta C, da za<br />

vsak x≥0velja:<br />

Φ r (x)≤C(1+x r−1 )<br />

(C.3.11)


Dodatek C: O MILLSOVEM RAZMERJU 221<br />

in (C.3.8) spet sledi iz (C.2.3) .<br />

Zvezo (C.3.9) pa spet izpeljemo z indukcijo <strong>po</strong> r. Za r=0 se (C.3.9) prevede na<br />

zvezoΦ(x)+Φ(−x)=1, ki očitno drži. Za r∈N pa je <strong>po</strong> trditvi C.3.3 zveza (C.3.9)<br />

ekvivalentna zvezi:<br />

J r (x) :=φ(x) [ ψ (r−1) (−x)ψ (r) (x)+ψ (r−1) (x)ψ (r) (−x) ] = (r−1)!<br />

(C.3.12)<br />

Za r=1 <strong>po</strong> (C.1.4) velja:<br />

J 1 (x)=φ(x) [ ψ(−x)ψ ′ (x)+ψ(x)ψ ′ (−x) ] =<br />

=φ(x) [ ψ(−x) ( xψ(x)+1 ) +ψ(x) ( −xψ(−x)+1 )] =<br />

=φ(x) ( ψ(−x)+ψ(x) ) =<br />

= 1<br />

(C.3.13)<br />

Naredimo zdaj indukcijski korak z r na r+1.<br />

rekurentno formulo (C.3.1). Dobimo:<br />

Tokrat namesto (C.1.4) u<strong>po</strong>števamo<br />

J r+1 (x)=φ(x) [ ψ (r) (−x)ψ (r+1) (x)+ψ (r) (x)ψ (r+1) (−x) ] =<br />

=φ(x) [ ψ (r) (−x) ( xψ (r) (x)+rψ (r−1) (x) ) +<br />

+ψ (r) (x) ( −xψ (r) (−x)+rψ (r−1) (−x) )] =<br />

= rJ r (x)=<br />

= r!<br />

(C.3.14)<br />

Trditev je s tem dokazana.


222 C.3 NEKAJ ENAKOSTI


Dodatek D<br />

Tenzorski račun<br />

D.1 Multilinearne preslikave<br />

V tem razdelku bomo definirali multilinearne preslikave in jih za končnorazsežne<br />

prostore karakterizirali z linearnimi. Prostor vseh linearnih preslikav iz V v W bomo<br />

označili zL(V, W).<br />

DEFINICIJA. Naj bodo V 1 ,...V r in W vektorski prostori nad <strong>po</strong>ljemF. Preslikava<br />

Φ: V 1 ×···×V r → W je multilinearna, če je linearna v vsakem argumentu <strong>po</strong>sebej, t. j.,<br />

če je za vsak i in <strong>po</strong>ljubne fiksne v j ∈ V j , kjer je j=1,...i−1, i+1,...r, preslikava<br />

v i ↦→Φ(v 1 ,...v r )<br />

(D.1.1)<br />

linearna. Za r=2 bomo taki preslikavi rekli bilinearna. V primeru, ko je kar W=F,<br />

bomo preslikavi rekli multilinearni oz. bilinearni funkcional. Multilinearnemu (rlinearnemu)<br />

funkcionalu na produktu enakih vektorskih prostorov bomo rekli multilinearna<br />

oz. r-linearna forma (ali krajše r-forma).<br />

Prostor multilinearnih preslikav iz V 1 ×···×V r v vektorski prostor W bomo označevali<br />

zM(V 1 ,...V r ; W), prostor vseh r-form na V pa zM r (V)<br />

Vektorski prostor multilinearnih preslikav lahko preprosto izrazimo s prostori linearnih<br />

preslikav. Bolj ali manj očitna je namreč naslednja trditev.<br />

Trditev D.1.1. Naj bodo U, V in W vektorski prostori nad istim obsegom. Tedaj predpis:<br />

Φ↦→ (u↦→ (v↦→Φ(u, v)))<br />

predstavlja linearni izomorfizem izM(U, V; W) vL(U,L(V, W)).<br />

Posledica D.1.2. Predpis<br />

Φ↦→ ( v 1 ↦→ (v 2 ↦→...(v r ↦→Φ(v 1 ,...v r )...) )<br />

predstavlja linearni izomorfizem medM(V 1 ,...V r ; W) inL(V 1 ,L(V 2 ,...L(V r , W)...)).<br />

(D.1.2)<br />

(D.1.3)<br />

Tako lahko za multilinearno preslikavoΦ, ki jo v skladu s <strong>po</strong>sledico D.1.2 identificiramo<br />

z ustrezno linearno preslikavo, izrazΦ(v 1 ,...v r ) pišemo tudi kot:<br />

Φv 1 v 2 ...v r−1 v r := (...((Φv 1 )v 2 )...v r−1 )v r<br />

223<br />

(D.1.4)


224 D.2 DUALNI PARI VEKTORSKIH PROSTOROV<br />

D.2 Dualni pari vektorskih prostorov<br />

DEFINICIJA. Dualni par vektorskih prostorov je trojica (U, V,〈·,·〉), kjer sta U in V<br />

vektorska prostora nad istim obsegom, predpis (u, v)↦→〈u, v〉 pa predstavlja neizrojen<br />

bilinearni funkcional na U×V vF, t. j.:<br />

(1) za vsak u∈U\{0} obstaja tak v∈V, da je〈u, v〉0;<br />

(2) za vsak v∈V\{0} obstaja tak u∈U, da je〈u, v〉0.<br />

ZGLED D.2.1. Realni vektorski prostor s skalarnim produktom tvori dualni par sam<br />

s seboj. Kompleksni skalarni produkt pa ni bilinearni funkcional. □<br />

ZGLED D.2.2. Če je V ′ algebraični dual prostora V, prostora V ′ in V skupaj z<br />

bilinearnim funkcionalom〈ϕ, v〉 :=ϕ(v) tvorita dualni par. □<br />

ZGLED D.2.3. Iz Hahn–Banachovega izreka sledi, da tudi normiran prostor skupaj<br />

s svojim normiranim dualom tvori dualni par. □<br />

Trditev D.2.1. Naj bo (U, V,〈·,·〉) dualni par vektorskih prostorov in naj bosta U ′ in V ′<br />

algebraična duala prostorov U in V. Če je vsaj eden izmed prostorov U in V končnorazsežen,<br />

predpisa:<br />

u↦→ ( v↦→〈u, v〉 ) in v↦→ ( v↦→〈u, v〉 ) (D.2.1)<br />

predstavljata izomorfizma iz U v V ′ in iz V v U ′ .<br />

DOKAZ. Po definiciji dualnega para sta obe preslikavi injektivni. Sledi:<br />

dim U≤dim V ′ = dim V≤ dim U ′ = dim U<br />

(D.2.2)<br />

torej <strong>po</strong>vsod velja enačaj in vse dimenzije so končne. Monomorfizem, ki slika v prostor<br />

iste dimenzije, pa je pri končnorazsežnih prostorih že izomorfizem.<br />

Trditev D.2.2. Naj bosta U in V končnorazsežna vektorska prostora iste dimenzije nad<br />

istim obsegomFin naj bo〈·,·〉 bilinearni funkcional na U×V. Tedaj vsak izmed <strong>po</strong>gojev (1)<br />

in (2) implicira tudi drugega. Z drugimi besedami, že eden izmed obeh <strong>po</strong>gojev zadošča, da je<br />

(U, V,〈·,·〉) dualni par vektorskih prostorov.<br />

DOKAZ. Zaradi simetrije zadošča dokazati, da iz <strong>po</strong>goja (1) sledi <strong>po</strong>goj (2). Naj bo<br />

V ′ algebraični dual prostora V. Iz <strong>po</strong>goja (1) sledi, da prvi predpis v (D.2.1) predstavlja<br />

injektivno linearno preslikavo (monomorfizem) iz U v V ′ . Ker pa imata prostora U in<br />

V ′ isto dimenzijo, je ta preslikava tudi surjektivna. Zato za vsak linearni funkcional<br />

ϕ∈V ′ obstaja tak u∈U, da za vsak v∈Vveljaϕ(v)=〈u, v〉.<br />

Naj bo v∈V\{0}. Obstaja takϕ∈V ′ , da jeϕ(v)0, torej obstaja tudi tak u∈U, da<br />

je〈u, v〉0. To pa že <strong>po</strong>meni, da je iz<strong>po</strong>lnjen tudi <strong>po</strong>goj (2).<br />

DEFINICIJA. Bazi{ f 1 ,... f n } in{e 1 ,...e n } končnorazsežnih vektorskih prostorov U in<br />

V, ki tvorita dualni par, sta dualni, če za <strong>po</strong>ljubna i in j velja:<br />

〈 f j , e i 〉=<br />

{<br />

1 ; i= j<br />

0 ; i j<br />

(D.2.3)


Dodatek D: TENZORSKI RAČUN 225<br />

Trditev D.2.3. Če je (U, V) dualni par končnorazsežnih vektorskih prostorov, za vsako bazo<br />

prostora V obstaja natanko ena baza prostora U, ki ji je dualna.<br />

DOKAZ. Po trditvi D.2.1 lahko brez škode za splošnost privzamemo, da je U kar<br />

dualni prostor prostora V. Za ta primer pa je trditev očitna.<br />

D.3 Tenzorji<br />

Dostikrat imamo opravka z izrazi tipa:<br />

∑<br />

Φ(v i1 , v i2 ,...v ir )<br />

i<br />

(D.3.1)<br />

kjer jeΦmultilinearna preslikava. Včasih bi želeli argumente preslikaveΦgledati<br />

<strong>po</strong>sebej, tako da bi bila preslikavaΦdelovala na vsoti nekih izrazov, <strong>po</strong>vezanih z v ij .<br />

Kakšen objekt bi bila <strong>po</strong>tem ta vsota? Vsekakor bi bilaΦlinearna preslikava na prostoru<br />

takih objektov, ki jim bomo rekli tenzorji.<br />

DEFINICIJA. Naj bodo V 1 ,...V r vektorski prostori nad istim obsegom. Tenzorski<br />

produkt vektorskih prostorov V 1 ,...V r je vektorski prostor W 0 skupaj z multilinearno<br />

preslikavoΦ 0 ∈M(V 1 ,...V r ; W 0 ), pri čemer mora za vsak vektorski prostor W in multilinearno<br />

preslikavoΦ∈M(V 1 ,...V r ; W) obstajati natanko ena taka linearna preslikava<br />

L: W 0 → W, da naslednji diagram komutira:<br />

V 1 ×···×V r<br />

Φ 0<br />

W 0<br />

L<br />

Φ<br />

W<br />

(D.3.2)<br />

Prostor W 0 navadno označimo z V 1 ⊗···⊗V r , če so prostori V i vsi enaki nekemu prostoru<br />

V, pa kar z V ⊗r . Elementom prostora W 0 pravimo tenzorji, vrednostimΦ 0 (v 1 ,...v r ) pa<br />

razcepni tenzorji. Slednje navadno označujemo z v 1 ⊗···⊗v r .<br />

O<strong>po</strong>mba. Če so prostori V 1 ,...V r končnorazsežni, se je v zgornji definiciji dovolj<br />

omejiti na primer, ko je tudi prostor W končnorazsežen. Če so V 1 ,...V r končnorazsežni,<br />

je namreč zaloga vrednosti preslikaveΦvsebovana v nekem končnorazsežnem<br />

<strong>po</strong>dprostoru prostora W.<br />

O<strong>po</strong>mba. Vsaka linearna preslikava, ki slika iz tenzorskega produkta, je enolično<br />

določena z vrednostmi na razcepnih tenzorjih. Od tod sledi tudi, da je vsak tenzor<br />

linearna kombinacija razcepnih.<br />

O<strong>po</strong>mba. Preslikava:<br />

L↦→ ( (v 1 ,...v r )↦→ L(v 1 ⊗···⊗v r ) )<br />

(D.3.3)<br />

predstavlja izomorfizem medL(V 1 ⊗···⊗V r , W) inM(V 1 ,...V r ; W).


226 D.3 TENZORJI<br />

Porodi se seveda vprašanje, ali tenzorski produkti sploh obstajajo in koliko se med<br />

seboj razlikujejo. Odgovor na prvo vprašanje je pritrdilen, obstajajo celo tenzorski<br />

produkti modulov (glej npr. Blyth [32]). V tem delu bomo <strong>po</strong>trebovali le tenzorske<br />

produkte končnorazsežnih prostorov, ki jih bomo konstruirali v naslednjem razdelku.<br />

Na drugo vprašanje pa odgovarja naslednja trditev.<br />

Trditev D.3.1. Vsi tenzorski produkti danih vektorskih prostorov V 1 ,...V r so si izomorfni.<br />

Natančneje, za <strong>po</strong>ljubna tenzorska produkta W 1 in W 2 s pripadajočima preslikavamaΦ 1 inΦ 2<br />

obstaja tak izomorfizem L: W 1 → W 2 , da naslednji diagram komutira:<br />

W 1<br />

V 1 ×···×V r<br />

Φ 1 Φ 2<br />

L<br />

<br />

W 2<br />

(D.3.4)<br />

DOKAZ. Obstajata taki linearni preslikavi L: W 1 → W 2 in L ′ : W 2 → W 1 , da komutira<br />

naslednji diagram:<br />

W 1<br />

Torej komutira tudi naslednji diagram:<br />

V 1 ×···×V r<br />

Φ 1<br />

Φ 2<br />

Φ 1<br />

L<br />

W 2<br />

L ′ W 1<br />

(D.3.5)<br />

V 1 ×···×V r<br />

Φ 1 Φ 2<br />

(D.3.6)<br />

W 1<br />

L ′ ◦L<br />

Ta diagram pa komutira tudi, če preslikavo L ′ ◦ L zamenjamo z identiteto. Zaradi<br />

enoličnosti mora biti torej L ′ ◦ L kar identiteta na W 1 . Podobno vidimo, da je L◦L ′<br />

identiteta na W 2 . Od tod pa sledi, da je L izomorfizem.<br />

Trditev D.3.2.<br />

tenzorjev.<br />

Vsak element tenzorskega produkta je linearna kombinacija razcepnih<br />

DOKAZ. Naj bo W 0 skupaj s preslikavoΦ 0 tenzorski produkt vektorjev V 1 ,...V r in<br />

naj bo W F linearna ogrinjača razcepnih tenzorjev v W 0 0. OčitnoΦ 0 slika v W F. Označimo<br />

0<br />

zιnaravno vložitev prostora W F v W 0 0. Po definiciji vložitve in tenzorskega produkta<br />

obstaja taka preslikava p: W 0 → W F , da naslednji diagram komutira:<br />

0<br />

V 1 ×···×V r<br />

Φ 1<br />

Φ 2<br />

Φ 1<br />

W 0 p<br />

W F 0 ι<br />

W 0<br />

(D.3.7)<br />

Podobno kot pri prejšnjem dokazu se mora zaradi enoličnostiι◦p ujemati z identiteto<br />

na W 0 . Od tod pa že sledi, da je W F 0 = W 0.<br />

Pri študiju tenzorskih produktov se je dovolj omejiti le na tenzorske produkte dveh<br />

prostorov in faktorje lahko <strong>po</strong> <strong>po</strong>trebi menjamo: ni težko dokazati naslednje trditve.<br />

W 1


Dodatek D: TENZORSKI RAČUN 227<br />

Trditev D.3.3. Naj bodo U, V in W vektorski prostori in U⊗V, V⊗U, V⊗W, (U⊗V)⊗W,<br />

U⊗(V⊗ W) in U⊗V⊗ W ustrezni tenzorski produkti. Tedaj je s predpisom:<br />

u⊗v↦→ v⊗u<br />

enolično določen izomorfizem med U⊗V in V⊗ U, s predpisoma:<br />

u⊗v⊗w↦→ (u⊗v)⊗w<br />

u⊗v⊗w↦→ u⊗(v⊗w)<br />

pa sta enolično določena izomorfizma med U⊗V⊗ W in (U⊗V)⊗W oz. U⊗(V⊗ W).<br />

(D.3.8)<br />

(D.3.9)<br />

(D.3.10)<br />

D.4 Tenzorski produkti končnorazsežnih prostorov<br />

Naj bosta U in V končnorazsežna vektorska prostora nad <strong>po</strong>ljemFzbazama<br />

{e 1 ,...e m } in{ f 1 ,... f n }. Ker je <strong>po</strong> trditvi D.3.2 vsak element tenzorskega produkta U⊗ V<br />

linearna kombinacija razcepnih tenzorjev, se mora dati tudi zapisati v obliki:<br />

m∑<br />

i=1<br />

n∑<br />

α ij e i ⊗ f j<br />

j=1<br />

(D.4.1)<br />

Tenzorski produkt končnorazsežnih prostorov je torej (če obstaja) spet končnorazsežen.<br />

Zapis (D.4.1) nam namiguje, da je to (mn)-razsežen prostor z bazo, ki jo sestavljajo e i ⊗ f j ,<br />

i=1,...m, j=1,...n.<br />

Če želimo zgoraj <strong>po</strong>vedano eksaktno utemeljiti, moramo vso stvar <strong>po</strong>gledati v<br />

luči definicije tenzorskega produkta. Vsaka bilinearna preslikavaΦ ∈ M(U, V; W)<br />

natančno določena z vektorji w ij :=Φ(e i , f j ). Vzemimo zdaj vektorja u= ∑ m<br />

i=1α i e i ∈ U<br />

in v= ∑ n<br />

j=1β j f j ∈ V. Tedaj velja:<br />

Φ(u, v)=<br />

m∑<br />

i=1<br />

n∑<br />

α i β j w ij<br />

j=1<br />

(D.4.2)<br />

Izraz na desni pa lahko gledamo kot linearno preslikavo na matriki [α i β j ] i,j ∈F m×n . Natančneje,<br />

če definiramo bilinearno preslikavoΦ 0 ∈M(U, V;F m×n ) in linearno preslikavo<br />

L: F m×n → W <strong>po</strong> predpisu:<br />

naslednji diagram komutira:<br />

m∑<br />

Φ 0<br />

⎛⎜ α ⎝ i e i ,<br />

i=1<br />

m∑<br />

β j f j<br />

⎞⎟ := [α ⎠ i β j ] i,j<br />

j=1<br />

L ( [γ ij ] i,j<br />

)<br />

:=<br />

m∑<br />

U×V<br />

Φ 0<br />

F m×n<br />

Φ<br />

L<br />

i=1<br />

W<br />

n∑<br />

γ ij w ij<br />

j=1<br />

(D.4.3)<br />

(D.4.4)<br />

(D.4.5)


228 D.4 TENZORSKI PRODUKTI KONČNORAZSEŽNIH PROSTOROV<br />

Če sta preslikaviΦinΦ 0 predpisani, je preslikava L je tudi edina taka preslikava, da<br />

zgornji diagram komutira, saj je enolično določena na elementarnih matrikah [δ ij ] i,j ,<br />

kjer jeδ ij Kroneckerjev delta (t. j. enak ena, če je i= j, sicer pa nič). To pa <strong>po</strong>meni, da je<br />

(<br />

F m×n ,Φ 0<br />

)<br />

tenzorski produkt prostorov U in V.<br />

Tenzorski produkt m- in n-razsežnega prostora je torej res (mn)-razsežen prostor in<br />

tenzorje si <strong>po</strong> zgornji konstrukciji lahko predstavljamo kot matrike. Če sta U=F m×1 in<br />

V=F n×1 kar prostora m in n-razsežnih stolpcev, velja:<br />

Φ 0 (u,v)=u⊗v=uv T<br />

Tako tudi za <strong>po</strong>ljubneu∈F m×1 inv 1 ,v 2 ∈F n×1 velja:<br />

(u⊗v 1 )v 2 =uv T 1 v 2= (v T 1 v 2)u<br />

(D.4.6)<br />

(D.4.7)<br />

ProstoraF 1×n inF n×1 pa skupaj s predpisom〈v ′ ,v〉 :=v ′ v tvorita dualni par. To nam<br />

da navdih za konstrukcijo tenzorskega produkta, ki je neodvisna od baze. Naslednja<br />

trditev se da dokazati brez težav.<br />

Trditev D.4.1. Naj bodo U, V in V ′ končnorazsežni vektorski prostori ter naj V in V ′<br />

tvorita dualni par. Tedaj predpis:<br />

u⊗v↦→ (v ′ ↦→〈v, v ′ 〉u)<br />

enolično določa izomorfizem med U⊗V inL(V ′ , U).<br />

(D.4.8)<br />

O<strong>po</strong>mba. Trditev D.4.1 se da <strong>po</strong>splošiti na neskončnorazsežne prostore: če je<br />

V dualni prostor prostora V ′ , je tenzorski produkt U⊗V ′ izomorfen prostoru vseh<br />

linearnih operatorjev končnega ranga iz V v U (glej npr. Defant in Floret [46], str.<br />

20); prostor U⊗ V pa je izomorfen nekemu <strong>po</strong>dprostoru prostora linearnih operatorjev<br />

končnega ranga iz V ′ v U (vložitev konstruiramo s <strong>po</strong>močjo vložitve prostora V v<br />

njegov drugi dual).<br />

Elemente tenzorskega produkta dveh prostorov lahko torej identificiramo z linearnimi<br />

preslikavami. Splošneje, elemente tenzorskega produkta več prostorov lahko<br />

identificiramo z multilinearnimi funkcionali.<br />

Trditev D.4.2. Naj bodo (U ′, U 1 1),...(U r, ′ U r ) dualni pari končnorazsežnih vektorskih<br />

prostorov nad <strong>po</strong>ljemF. Tedaj je s predpisom:<br />

u 1 ⊗···⊗u r ↦→ ( (u ′ r,...u ′ 1 )↦→〈u′ 1 , u 1〉...〈u ′ r, u r 〉 )<br />

(D.4.9)<br />

enolično določen izomorfizem iz U 1 ⊗···⊗U r vM(U ′ r,...U ′ 1 ;F).<br />

Posledica D.4.3. S predpisom:<br />

u 1 ⊗···⊗u r ↦→ ( u ′ r⊗···⊗u ′ 1 ↦→〈u′ 1 , u 1〉...〈u ′ r, u r 〉 )<br />

(D.4.10)<br />

je enolično določen izomorfizem iz U 1 ⊗···⊗U r vL(U r⊗···⊗U ′ ′ ;F). Tenzorska produkta<br />

1<br />

U 1 ⊗···⊗U r in U r⊗···⊗U ′ ′ torej skupaj s predpisom:<br />

1<br />

〈u ′ r⊗···⊗u ′ 1 , u 1⊗···⊗u r 〉=〈u ′ 1 , u 1〉...〈u ′ r, u r 〉 (D.4.11)<br />

tvorita dualni par.


Dodatek D: TENZORSKI RAČUN 229<br />

DOKAZTRDITVE D.4.2. Z večkratno u<strong>po</strong>rabo trditve D.4.1 dobimo:<br />

U 1 ⊗···⊗U r L(U r, ′ U 1 ⊗···⊗U r−1 )<br />

L(U r,L(U ′ ′ r−1 , U 1⊗···⊗U r−2 ))...<br />

...L(U r,L(U ′ ′ r−1 ,...L(U′ 2 , U 1)...))<br />

L(U r,L(U ′ ′ r−1 ,...L(U′ 2 ,L(U′ 1 ,F))...))<br />

(D.4.12)<br />

Iz <strong>po</strong>sledice D.1.2 končno sledi, da je slednji prostor izomorfenM(U r,...,U ′ ′ ;F) in ni se<br />

1<br />

težko prepričati, da s kom<strong>po</strong>niranjem ustreznih izomorfizmov res dobimo izomorfizem<br />

(D.4.9).<br />

D.5 Skrčitve tenzorjev<br />

DEFINICIJA. Naj bodo U 1 , U 2 ,...U r (končnorazsežni) vektorski prostori, pri čemer<br />

naj za za neka i< j prostora V i in V j tvorita dualni par. Skrčitev tenzorskega produkta<br />

U 1 ⊗···⊗U r glede na indeksa i in j je preslikava:<br />

κ: U 1 ⊗···⊗U r → U 1 ⊗···⊗U i−1 ⊗ U i+1 ⊗···⊗U j−1 ⊗ U j+1 ⊗···⊗U r (D.5.1)<br />

ki deluje <strong>po</strong> predpisu:<br />

u 1 ⊗···⊗u r ↦→〈u i , u j 〉u 1 ⊗···⊗u i−1 ⊗ u i+1 ⊗···⊗u j−1 ⊗ u j+1 ⊗···⊗u r<br />

(D.5.2)<br />

ZGLED D.5.1. Oglejmo si, kaj <strong>po</strong>meni skrčitev tenzorskega produktaF n ⊗F n , pri<br />

čemer je ustrezen bilinearni funkcional <strong>po</strong>dan na standardni način, <strong>po</strong> kom<strong>po</strong>nentah<br />

(v primeru, ko jeF=R, je to kar običajni skalarni produkt). Vsakemu tenzorjuu⊗v<br />

<strong>po</strong> (D.4.6) pripada matrikauv T (vektorje izF n identificiramo s stolpci izF n×1 ) in le-ta se<br />

skrči v〈u,v〉. Matrika:<br />

n∑ n∑<br />

A=[α ij ] i,j = α ij e i e T j<br />

(D.5.3)<br />

kjer soe i vektorji standardne baze, se tako skrči v:<br />

i=1<br />

j=1<br />

n∑<br />

n∑<br />

α ij 〈e i ,e j 〉=<br />

n∑<br />

α ii =slA<br />

(D.5.4)<br />

i=1<br />

j=1<br />

i=1<br />

□<br />

To nam da navdih za naslednjo definicijo.<br />

DEFINICIJA. Naj bo (U ′ , U) dualni par vektorskih prostorov. Sled sl A tenzorja<br />

A∈U⊗U ′ je njegova skrčitev. Z drugimi besedami, sled je linearni funkcional, ki<br />

deluje <strong>po</strong> predpisu:<br />

sl(u⊗u ′ )=〈u ′ , u〉<br />

(D.5.5)


230 D.5 SKRČITVE TENZORJEV<br />

ZGLED D.5.2. Vzemimo zdaj dvakratno skrčitev tenzorskega produktaF m ⊗F n ⊗<br />

F m ⊗F n , pri čemer za ustrezna dualna para vzamemo prvi in tretji prostor ter drugi<br />

in četrti prostor. Naš tenzorski produkt lahko prek (D.4.6) identificiramo s tenzorskim<br />

produktomF m×n ⊗F m×n in elementu 1 v T⊗u 1 2v T 2 se skrči v〈u 1,u 2 〉〈v 1 ,v 2 〉. Če označimo<br />

A=[α ij ] i,j inB=[β ij ] i,j , se:<br />

A⊗B=<br />

m∑<br />

n∑<br />

m∑<br />

n∑<br />

α ij β kl e i e T j ⊗e ke T l<br />

(D.5.6)<br />

i=1<br />

j=1<br />

k=1<br />

l=1<br />

skrči v:<br />

m∑ n∑ m∑ n∑<br />

m∑ n∑<br />

α ij β kl 〈e i ,e k 〉〈e j ,e l 〉= α ij β ij =sl(AB T ) (D.5.7)<br />

i=1 j=1 k=1 l=1<br />

i=1 j=1<br />

kar je standardni skalarni produkt dolgih vektorjev, ki pripadata matrikamaAinB. □<br />

ZGLED D.5.3. Vzemimo r-kratno skrčitev produkta:<br />

U ′ r⊗···⊗U ′ 1 ⊗ U 1⊗···⊗U r<br />

(D.5.8)<br />

glede na dualne pare (U ′, U i i), i=1,...r. Dobimo dualni par tenzorskih produktov<br />

U r⊗···⊗U ′ ′ in U 1 1⊗···⊗U r , pri čemer je ustrezni bilinearni funkcional <strong>po</strong>dan tako kot<br />

v <strong>po</strong>sledici D.4.3.<br />

□<br />

V nadaljevanju bomo obravnavali tenzorske produkte prostorov, ki bodo razdeljeni<br />

v dve skupini: prvim, ki jih bomo označevali z U 1 ,...U r , bomo rekli kovariantni, drugim,<br />

ki jih bomo označevali z U ′ r<br />

,...U ′ , pa kontravariantni. Gledali bomo produkte oblike:<br />

′ 1<br />

U 1 ⊗···⊗U r ⊗ U ′ r ′⊗···⊗U′ 1<br />

(D.5.9)<br />

Elementom zgornjega produkta bomo rekli mešani tenzorji tipa (r, r ′ ). Tenzorje tipa<br />

(0, 0) pa bomo identificirali s skalarji.<br />

Tenzorske produkte kovariantnih tenzorjev bomo vedno šteli navzgor, tenzorske<br />

produkte kontravariantnih tenzorjev pa navzdol: tako bomo u 1 ⊗···⊗u 2 interpretirali<br />

kot u 1 ⊗ u 2 , u ′ 1 ⊗···⊗u′ 2<br />

pa kot prazen tenzor, t. j. skalar 1.<br />

DEFINICIJA. Naj bodo U 1 ,...U r in V 1 ,...V s kovariantni, U ′ r<br />

,...U ′ in ′ 1 V′ s<br />

,...V ′ pa ′ 1<br />

kontravariantni prostori. Za vsak i=1,...min{r ′ , s} naj prostora U ′ in V i i tvorita dualni<br />

par. Skrčitveni produkt med prostoroma:<br />

U=U 1 ⊗···⊗U r ⊗ U ′ r ′⊗···⊗U′ 1<br />

(D.5.10)<br />

V= V 1 ⊗···⊗V s ⊗ V ′ s ′⊗···⊗V′ 1<br />

(D.5.11)<br />

je bilinearna operacija, pri kateri se par (U, V), kjer je:<br />

U=u 1 ⊗···⊗u r ⊗ u ′ r ′⊗···⊗u′ 1 ∈ U<br />

V=v 1 ⊗···⊗v r ⊗ v ′ s ′⊗···⊗v′ 1 ∈ V<br />

(D.5.12)<br />

(D.5.13)


Dodatek D: TENZORSKI RAČUN 231<br />

preslika v element:<br />

{ 〈u<br />

′<br />

1<br />

UV :=<br />

, v 1〉...〈u ′ r<br />

, v ′ r ′〉u 1 ⊗···⊗u r ⊗ v r ′ +1⊗···⊗v s ⊗ v ′ s<br />

⊗···⊗v ′ ; r ′ ≤ s ′ 1<br />

〈u ′, v 1 1〉...〈u ′ s, v s 〉u 1 ⊗···⊗u r ⊗ u ′ r<br />

⊗···⊗u ′ ⊗ ′ s+1 v′ s<br />

⊗···⊗v ′ ; r ′ ≥ s ′ 1<br />

(D.5.14)<br />

To je torej skrčitev tenzorskega produkta U⊗V, in sicer glede na dualne pare (U ′, V i i),<br />

i=1,...min{r ′ , s}.<br />

Trditev D.5.1. Skrčitveni produkt je asociativen. Natančneje, naj bosta dana nabora<br />

kovariantnih in kontravariantnih vektorskih prostorov, U, V in W pa naj bodo tenzorji iz<br />

tenzorskih produktov teh prostorov, pri čemer so vsi kovariantni prostori pred kontravariantnimi.<br />

Tedaj se dualni pari, ki jih <strong>po</strong>trebujejo za računanje skrčitvenih produktov UV in (UV)W,<br />

ujemajo z dualnimi pari, <strong>po</strong>trebnimi za računanje skrčitvenih produktov VW in U(VW). Velja<br />

tudi (UV)W=U(VW).<br />

Preden dokažemo trditev, si oglejmo nekaj zgledov, ki kažejo, kaj vse se da izraziti<br />

s skrčitvenim množenjem.<br />

ZGLED D.5.4. Če so prostori U 1 ,...U r bodisi vsi kovariantni bodisi vsi kontravariantni<br />

in u i ∈ U i , velja:<br />

u 1 u 2 ...u r = u 1 ⊗ u 2 ⊗···⊗u r<br />

(D.5.15)<br />

ZGLED D.5.5. Naj bosta (U ′ , U) in (V ′ , V) dualna para končnorazsežnih vektorskih<br />

prostorov, pri čemer prostora U in V proglasimo za kovariantna, U ′ in V ′ pa za<br />

kontravariantna. Če tenzorje iz U⊗V ′ prek zveze:<br />

u⊗v ′ ←→ ( v↦→〈v ′ , v〉u )<br />

□<br />

(D.5.16)<br />

identificiramo z linearnimi preslikavami iz V v U in je na tak način tenzor A identificiran<br />

z linearno preslikavo A, imata zapisa Av in Av enak <strong>po</strong>men, če je v prvem primeru<br />

mišljen skrčitveni produkt, v drugem primeru pa evaluacija. Podobno, če element u ′ ∈<br />

U ′ prek ustreznega bilinearnega funkcionala identificiramo z linearnim funkcionalom<br />

ϕ na prostoru U, se kontravariantni vektor, ki je <strong>po</strong>dan kot skrčitveni produkt u ′ A<br />

identificira z linearnim funkcionalom, ki je <strong>po</strong>dan kot kom<strong>po</strong>zitumϕA.<br />

Podobno, če je <strong>po</strong>dan še dualni par kontravariantnega prostora W ′ in kovariantnega<br />

prostora W ter če dan tenzor B∈V⊗ W ′ prek zveze (D.5.16) identificiramo z linearno<br />

preslikavo B iz W v V, se tenzor, ki je <strong>po</strong>dan kot skrčitveni produkt AB, identificira z<br />

linearno preslikavo, ki je <strong>po</strong>dana kot kom<strong>po</strong>zitum AB.<br />

Zgornje ugotovitve lahko zapišemo tudi v jeziku matrik. Prek ustreznega sistema<br />

dualnih baz lahko kovariantne vektorje identificiramo s stolpci, kontravariantne z<br />

vrsticami, tenzorje tipa (1, 1) pa z matrikami prek zveze:<br />

[α ij ] i,j ←→<br />

m∑<br />

n∑<br />

α ij e i ⊗ f ′ j<br />

(D.5.17)<br />

i=1<br />

j=1


232 D.5 SKRČITVE TENZORJEV<br />

kjer sta{e 1 ,...e m } in{ f ′ 1 ,... f′ n} ustrezna kovariantna in kontravariantna baza. Če tako<br />

kovarianten vektor v identificiramo s stolpcemv, kontravarianten vektor u ′ z vrstico<br />

u ′ , tenzorja A in B pa z matrikamaAinB, zapisi Av, u ′ A in AB, izraženi s skrčitvenim<br />

množenjem, ustrezajo zapisomAv,u ′ A inAB, izraženimi z običajnim matričnim<br />

množenjem.<br />

Identiteti na danem kovariantnem prostoru, ki tvori dualni par z nekim kontravariantnim<br />

prostorom, v tem smislu pripada identični mešani (1, 1)-tenzor:<br />

I=<br />

n∑<br />

e i e ′ i<br />

i=1<br />

(D.5.18)<br />

kjer sta e 1 ,...e n in e ′ 1 ,...e′ n izbrani dualni bazi. Slednji je enota tudi v splošnem: za<br />

<strong>po</strong>ljuben mešani tenzor A velja:<br />

AI=A in IA=A (D.5.19)<br />

ZGLED D.5.6. Če so U 1 ,...U r kovariantni, U r,...U ′ ′ pa kontravariantni prostori ter<br />

1<br />

u i ∈ U i in u ′ i∈ U ′, velja: i<br />

□<br />

u ′ r...u ′ 2 u′ 1 u 1u 2 ...u r−1 u r =〈u ′ 1 , u 1〉〈u ′ 2 , u 2〉...〈u ′ r, u r 〉<br />

(D.5.20)<br />

Če je nadalje še u ′ ∈ U r⊗···⊗U ′ ′ 2 ⊗ U′ , ima zapis:<br />

1<br />

u ′ u 1 u 2 ...u r<br />

(D.5.21)<br />

enak <strong>po</strong>men, če ga interpretiramo v smislu zgornje definicije ali pa u ′ v smislu trditev<br />

D.4.2 in D.1.2 interpretiramo kot element prostoraL(U,L(U,...L(U,F)...)), pri čemer<br />

izraz (D.5.21) računamo tako kot v (D.1.4). □<br />

DOKAZTRDITVE D.5.1. Brez škode za splošnost lahko privzamemo, da je:<br />

U=u⊗u ′ r ′⊗···⊗u′ 1<br />

V=v 1 ⊗···⊗v s ⊗ v ′ s ′⊗···⊗v 1<br />

W=w 1 ⊗···⊗w t ⊗ w ′<br />

(D.5.22)<br />

(D.5.23)<br />

(D.5.24)<br />

kjer u, v 1 ,...v s in w 1 ,...w t pripadajo kovariantnim, u ′ r ′ ,...u ′ 1 , v′ s ′ ,...v ′ 1 in w′ pa kontravariantnim<br />

prostorom. Ločimo pet primerov.<br />

Prvi primer: r ′ ≤ s, s ′ ≥ t. V tem primeru velja:<br />

(UV)W=U(VW)=〈u ′ 1 , v 1〉...〈u ′ r ′, v r ′〉〈v′ 1 , w 1〉...〈v ′ t , w t〉×<br />

× u⊗v r ′ +1⊗···⊗v s ⊗ v ′ s ′⊗···⊗v′ t+1 ⊗ w′ (D.5.25)<br />

Drugi primer: r ′ ≥ s, s ′ ≥ t. V tem primeru velja:<br />

(UV)W=U(VW)=〈u ′ 1 , v 1〉...〈u ′ s, v s 〉〈v ′ 1 , w 1〉...〈v ′ t , w t〉×<br />

× u⊗u ′ r ′⊗···⊗u′ s+1 ⊗ v′ s ′⊗···⊗v′ t+1 ⊗ w′ (D.5.26)


Dodatek D: TENZORSKI RAČUN 233<br />

Tretji primer: r ′ ≤ s, s ′ ≤ t. V tem primeru velja:<br />

(UV)W=U(VW)=〈u ′ 1 , v 1〉...〈u ′ r ′, v r ′〉〈v′ 1 , w 1〉...〈v ′ s ′, w s ′〉×<br />

× u⊗v r ′ +1⊗···⊗v s ⊗ w s ′ +1⊗···⊗w t ⊗ w ′ (D.5.27)<br />

Četrti primer: r ′ ≥ s, s ′ ≤ t, r ′ + s ′ ≤ s+t. V tem primeru velja:<br />

(UV)W=U(VW)=〈u ′ 1 , v 1〉...〈u ′ s, v s 〉〈v ′ 1 , w 1〉...〈v ′ s ′, w s ′〉×<br />

×〈u ′ s+1 , w s ′ +1〉...〈u ′ r ′, w r ′ +s ′ −s〉u⊗w r ′ +s ′ −s+1⊗···⊗w t ⊗ w ′ (D.5.28)<br />

Peti primer: r ′ ≥ s, s ′ ≤ t, r ′ + s ′ ≥ s+t. V tem primeru velja:<br />

(UV)W=U(VW)=〈u ′ 1 , v 1〉...〈u ′ s, v s 〉〈v ′ 1 , w 1〉...〈v ′ s ′, w s ′〉×<br />

×〈u ′ s+1 , w s ′ +1〉...〈u ′ s+t−s ′, w t〉u⊗u ′ r ′⊗···⊗u′ s+t−s ′ +1 ⊗ w′<br />

(D.5.29)<br />

D.6 Tenzorski produkti evklidskih prostorov<br />

Naj bosta U in V evklidska prostora. Zanima nas, ali se da smiselno uvesti skalarni<br />

produkt na tenzorski produkt U⊗V. Skalarni produkt ni nič drugega kot neizrojen<br />

bilinearni funkcional, ki zadošča še določenim drugim lastnostim. Z drugimi besedami,<br />

evklidski prostor sam s seboj tvori dualni par. Tenzorske produkte dualnih parov pa<br />

smo že obravnavali v <strong>po</strong>sledici D.4.3. Tako je skalarni produkt na tenzorskem produktu<br />

smiselno definirati na naslednji način.<br />

DEFINICIJA. Tenzorski produkt evklidskih prostorov U in V je vektorski prostor U⊗V,<br />

na katerega uvedemo bilinearni funkcional〈·,·〉 <strong>po</strong> predpisu:<br />

〈u 1 ⊗ v 1 , u 2 ⊗ v 2 〉 :=〈u 1 , u 2 〉〈v 1 , v 2 〉 (D.6.1)<br />

Trditev D.6.1. Zgoraj definirana bilinearna operacija je tudi skalarni produkt. Z drugimi<br />

besedami, tenzorski produkt evklidskih prostorov je tudi evklidski prostor.<br />

DOKAZ. Simetričnost <strong>po</strong>dane bilinearne operacije je očitna. Preveriti moramo le še,<br />

da za <strong>po</strong>ljuben w∈U⊗ V velja〈w, w〉≥0 in da enakost velja natanko tedaj, ko je w=0.<br />

Naj bosta{e 1 ,...e m } in{ f 1 ,... f n } ortonormirani bazi prostorov U in V. Po (D.4.1) lahko<br />

pišemo:<br />

m∑ n∑<br />

w= α ij e i ⊗ f j<br />

(D.6.2)<br />

Torej je:<br />

〈w, w〉=<br />

m∑<br />

i=1<br />

n∑<br />

j=1<br />

m∑<br />

k=1<br />

i=1<br />

j=1<br />

n∑<br />

α ij α kl 〈e i , e k 〉〈 f j , f l 〉=<br />

l=1<br />

m∑<br />

i=1<br />

n∑<br />

α 2 ij ≥ 0<br />

in enakost velja natanko tedaj, ko jeα ij = 0 za vse i in j, to pa je takrat, ko je w=0.<br />

j=1<br />

(D.6.3)


234 D.7 DVIGANJE IN SPUŠČANJE INDEKSOV<br />

D.7 Dviganje in spuščanje indeksov<br />

Omenili smo že, da vsak evklidski prostor tvori dualni par sam s seboj. Včasih pa<br />

je vendarle ugodno, če sta prostora, ki tvorita dualni par, “fizično” ločena: v razdelku<br />

D.5 smo vektorske prostore razdelili na kovariantne in kontravariantne ter definirali<br />

skrčitveni produkt, ki je bil odvisen od tega, ali smo dani prostor proglasili za kovarianten<br />

ali kontravarianten. Tako bomo vzeli dve kopiji evklidskega prostora, enega<br />

bomo proglasili za kovariantnega, drugega pa za kontravariantnega, prostora pa bosta<br />

<strong>po</strong>vezana z izomorfizmom. Če jeΦ: U→Vizomorfizem ločenih evklidskih prostorov,<br />

bomo navadno označevali:<br />

Φ(u)=u T , Φ −1 (v)=v T<br />

(D.7.1)<br />

Zgornja notacija izhaja iz matričnega računa, ko za U vzamemo prostor vrsticF 1×n , za<br />

V pa prostor stolpcevF n×1 . Tako jeΦkar trans<strong>po</strong>niranje (v nadaljevanju bomo navedli<br />

še nekaj vz<strong>po</strong>rednic z matričnim računom). Zgornja izvajanja <strong>po</strong>vzamemo v naslednjo<br />

definicijo.<br />

DEFINICIJA. Dualni par evklidskih prostorov je par ločenih evklidskih prostorov U<br />

in V, med katerima je <strong>po</strong>dan izomorfizem. Če le-ta preslika u∈U v v∈V, bomo<br />

pisali u=v T in v=u T . Ustrezni bilinearni funkcional med prostoroma je določen s<br />

predpisom:<br />

〈u, v〉 :=〈u, v T 〉=〈u T , v〉<br />

(D.7.2)<br />

Če prostor U proglasimo za kontravariantnega, V pa za kovariantnega, pravimo preslikavi<br />

u↦→ u T spust indeksa, preslikavi v↦→ v T pa dvig indeksa.<br />

O<strong>po</strong>mba. Izraza dvig in spust indeksa izvirata iz tradicije zapisovanja baznih<br />

vektorjev, kjer se kovariantni se zapisujejo z indeksi s<strong>po</strong>daj, t. j. e 1 , e 2 ,..., kontravariantni<br />

pa z indeksi zgoraj, t. j. e 1 , e 2 ....<br />

O<strong>po</strong>mba. Če je{e 1 ,...e n } ortonormirana baza katerega od prostorov, je{e T 1 ,...eT n}<br />

njej dualna baza.<br />

O<strong>po</strong>mba. Zvezo (D.7.2) lahko zapišemo tudi s skrčitvenim produktom: če sta v 1 in<br />

v 2 kovariantna vektorja, velja:<br />

〈v 1 , v 2 〉=v T 1 v 2 (D.7.3)<br />

kar je enako kot pri matričnem računu.<br />

DEFINICIJA. Naj bosta (U 1 , V 1 ) in (U 2 , V 2 ) dualna para evklidskih prostorov, pri<br />

čemer prostora U 1 in U 2 proglasimo za kontravariantna, prostora V 1 in V 2 pa za kovariantna.<br />

Tenzorski produkt dualnih parov evklidskih prostorov je dualni par evklidskih<br />

prostorov, ki ga sestavljajo kovariantni prostor V 1 ⊗ V 2 , kontravariantni prostor U 2 ⊗ U 1<br />

in izomorfizem:<br />

(v 1 ⊗ v 2 ) T := v T 2 ⊗ vT 1<br />

(D.7.4)


Dodatek D: TENZORSKI RAČUN 235<br />

Vrstni red pri kontravariantnih faktorjih smo obrnili zato, ker se <strong>po</strong>tem bilinearni<br />

funkcional na produktu prostorov U 2 ⊗ U 1 in V 1 ⊗ V 2 ujema s skrčitvenim množenjem,<br />

saj velja:<br />

〈u 2 ⊗ u 1 , v 1 ⊗ v 2 〉=〈(u 2 ⊗ u 1 ) T , v 1 ⊗ v 2 〉=〈u T 1 ⊗ uT 2 , v 1⊗ v 2 〉=〈u T 1 , v 1〉〈u T 2 , v 2〉=<br />

=〈u 1 , v 1 〉〈u 2 , v 2 〉=u 2 u 1 v 1 v 2<br />

Poleg tega <strong>po</strong>dobno kot pri matričnem računu velja formula:<br />

(D.7.5)<br />

(v 1 v 2 ) T = v T 2 vT 1<br />

(D.7.6)<br />

(to je le formula (D.7.4), zapisana s skrčitvenim produktom). Zgornja trditev velja še<br />

splošneje: z definicijo tenzorskega produkta dualnih parov evklidskih prostorv <strong>po</strong>stane<br />

zapis U T smiselno definiran za vsak tenzor U; če je U tenzor tipa (r, s), je U T tenzor tipa<br />

(s, r). V <strong>po</strong>sebnem primeru, ko je s=r=0 in je U skalar, <strong>po</strong>stavimo kar U T = U. Brez<br />

težav dokažemo naslednjo trditev.<br />

Trditev D.7.1. Naj bosta U in V tenzorja, med katerima obstaja skrčitveni produkt UV.<br />

Tedaj obstaja tudi skrčitveni produkt V T U T in velja:<br />

(UV) T = V T U T<br />

(D.7.7)<br />

Navedli bomo še eno <strong>po</strong>membno vz<strong>po</strong>rednico z matričnim računom.<br />

ZGLED D.7.1. Naj bosta (U, V) in (X, Y) dualna para evklidskih prostorov ter naj<br />

bosta{e 1 ,...e m } in{ f 1 ,... f n } ortonormirani bazi prostorov V in Y. Tedaj sta{e T 1 ,...eT m} in<br />

{ f T,... f T 1 n}ortonormirani bazi prostorov U in X. Vzemimo <strong>po</strong>ljuben tenzor:<br />

A=<br />

Le-tega <strong>po</strong> zvezi (D.5.17) identificiramo z matriko:<br />

m∑ n∑<br />

A=[α ij ] i,j = α ij e i e T j∈R m×n<br />

m∑<br />

i=1<br />

n∑<br />

α ij e i ⊗ f T j<br />

∈ V⊗ X (D.7.8)<br />

kjer soe i ∈R n×1 standardni bazni stolpci. Tenzor:<br />

m∑ n∑<br />

n∑ m∑<br />

A T = α ij f j ⊗ e T i<br />

= α ji f i ⊗ e T j∈ Y⊗U<br />

i=1<br />

j=1<br />

pa se prav tako <strong>po</strong> zvezi (D.5.17) identificira z matriko:<br />

n∑ m∑<br />

[α ji ] i,j = α ji e i e T j=A T ∈R n×m<br />

i=1<br />

j=1<br />

i=1<br />

j=1<br />

j=1<br />

i=1<br />

j=1<br />

(D.7.9)<br />

(D.7.10)<br />

(D.7.11)<br />

Skratka, če tenzorje tipa (1, 1) <strong>po</strong> zvezi (D.5.17) identificiramo z matrikami, tenzorsko<br />

trans<strong>po</strong>niranje ustreza matričnemu.<br />


236 D.7 DVIGANJE IN SPUŠČANJE INDEKSOV<br />

Zdaj, ko imamo definiran tenzorski produkt, lahko tudi oba skalarna produkta<br />

na kontravariantnem prostoru U in kovariantnem prostoru V, ki tvorita dualni par<br />

evklidskih prostorov, opišemo s tenzorjema: obstaja natanko en tenzorJ tipa (2, 0), za<br />

katerega za <strong>po</strong>ljubna v 1 , v 2 ∈ V velja:<br />

〈J, v 1 ⊗ v 2 〉=Jv 1 v 2 =〈v 1 , v 2 〉<br />

(D.7.12)<br />

Podobno obstaja natanko en tenzorItipa (0, 2), za katerega za <strong>po</strong>ljubna u 1 , u 2 ∈ U<br />

velja:<br />

〈u 1 ⊗ u 2 ,I〉=u 1 u 2 I=〈u 1 , u 2 〉 (D.7.13)<br />

TenzorjemaIinJ pravimo fundamentalna tenzorja ali fundamentalna funkcionala.<br />

Trditev D.7.2. Naj bo (U, V) dualni par evklidskih prostorov in naj bo{e 1 ,...e n } ortonormirana<br />

baza prostora V. Tedaj se fundamentalna tenzorja izražata v obliki:<br />

n∑<br />

n∑<br />

I= e i ⊗ e i , J= e T i<br />

⊗ e T i<br />

=I T (D.7.14)<br />

i=1<br />

DOKAZ. Dovolj je dokazati, da, čeIinJ definiramo kot v (D.7.14), velja (D.7.12) in<br />

(D.7.13). Računajmo:<br />

〈<br />

∑ n n∑<br />

n∑<br />

〈J, v 1 ⊗ v 2 〉= e T i<br />

⊗ e T i, v 1 ⊗ v 2<br />

〉= 〈e i ⊗ e i , v 1 ⊗ v 2 〉= 〈v 1 , e i 〉〈v 2 , e i 〉=<br />

i=1<br />

=〈v 1 , v 2 〉<br />

Podobno dobimo zahtevano zvezo tudi zaI.<br />

i=1<br />

i=1<br />

i=1<br />

(D.7.15)<br />

Potrebovali bomo še nekaj zvez, ki <strong>po</strong>vezujejo skrčitveni produkt, trans<strong>po</strong>niranje in<br />

fundamentalni tenzor.<br />

Trditev D.7.3. Naj boIfundamentalni kovariantni tenzor in v kovariantni vektor. Tedaj<br />

velja:<br />

Nadalje za vsak tenzor A tipa (1, 1) velja:<br />

I T v=v T<br />

v T I=v<br />

I T AI=sl A<br />

DOKAZ. Za <strong>po</strong>ljuben kovarianten vektor w velja:<br />

(D.7.16)<br />

(D.7.17)<br />

(D.7.18)<br />

〈I T v, w〉=I T vw=〈v, w〉=〈v T , w〉 (D.7.19)<br />

od koder sledi (D.7.16). Podobno za <strong>po</strong>ljuben kontravarianten vektor u velja:<br />

〈u, v T I〉=uv T I=〈u, v T 〉=〈u, v〉<br />

(D.7.20)<br />

od koder sledi (D.7.17). Zvezo (D.7.18) pa je dovolj dokazati za primer, ko je A=vu,<br />

kjer je v kovarianten, u pa kontravarianten vektor. Iz (D.7.16) in (D.7.17) sledi:<br />

S tem je dokaz končan.<br />

I T vuI=v T u T = (uv) T = uv=sl(vu)<br />

(D.7.21)


Dodatek D: TENZORSKI RAČUN 237<br />

D.8 Norme tenzorjev<br />

Definirali smo tenzorske produkte vektorskih prostorov. Pa recimo, da so ti prostori<br />

normirani. Nastane vprašanje, ali tudi na njihovem tenzorskem produktu obstaja<br />

kakšna norma, ki bi se računsko ujemala z normami na faktorjih. Obravnavali bomo<br />

dve normi: projektivno in njej dualno injektivno normo.<br />

DEFINICIJA. Naj bo (U ′ , U) dualni par končnorazsežnih vektorskih prostorov. Normi<br />

|·| ′ in|·| na U ′ in U sta dualni glede na dani bilinearni funkcional, če velja:<br />

|u ′ | ′ = sup{|〈u ′ , u〉| ;|u|≤1} (D.8.1)<br />

|u|=sup{|〈u ′ , u〉| ;|u ′ | ′ ≤ 1}<br />

(D.8.2)<br />

Dualni par vektorskih prostorov, opremljenih z dualnima normama, bomo imenovali<br />

dualni par normiranih prostorov.<br />

O<strong>po</strong>mba. Zgornji enakosti sta si ekvivalentni, dovolj je, da dokažemo le eno izmed<br />

njih. To namreč sledi iz dejstva, da je naravna vložitev normiranega prostora v drugi<br />

dual izometrična.<br />

O<strong>po</strong>mba. Norma na evklidskem prostoru je sama sebi dualna.<br />

Injektivno normo motivira identifikacija tenzorjev z multilinearnimi funkcionali. Natančneje,<br />

če so (U ′, U 1 1),...(U r, ′ U r ) dualni pari končnorazsežnih vektorskih prostorov,<br />

lahko <strong>po</strong> trditvi (D.4.10) tenzorje iz U r⊗···⊗U ′ ′ identificiramo z linearnimi funkcionali<br />

1<br />

na U 1 ⊗···⊗U r , le-te pa z multilinearnimi funkcionali. Normo multilinearne preslikave<br />

Φ definiramo kot:<br />

‖Φ‖ := sup{Φ(u 1 ,...u r ) ; (∀i)|u i |≤1}<br />

(D.8.3)<br />

V skladu s tem definiramo injektivno normo na naslednji način.<br />

DEFINICIJA. Naj bodo (U ′ i ,|·|′, U i i,|·| i ), i=1,...r dualni pari normiranih prostorov.<br />

Injektivna norma na tenzorskem produktu U r⊗···⊗U ′ ′ je definirana <strong>po</strong> predpisu:<br />

1<br />

|u ′ | ∨ := sup{〈u ′ , u 1 ⊗···⊗u r 〉 ; (∀i)|u i | i ≤ 1} (D.8.4)<br />

kjer je ustrezni bilinearni funkcional〈·,·〉 definiran tako kot v (D.4.11).<br />

O<strong>po</strong>mba. Definicija je neodvisna od izbire prostorov U 1 ,...U r .<br />

V razdelku D.4 (trditev D.4.1) smo s<strong>po</strong>znali, da je tenzorski produkt končnorazsežnih<br />

prostorov U in V izomorfen prostoruL(V ′ , U), če prostora V in V ′ tvorita dualni<br />

par. Ustrezni izomorfizem vsak razcepni tenzor w := u⊗v preslika v linearno preslikavo<br />

W, ki deluje <strong>po</strong> predpisu Wv ′ :=〈v ′ , v〉u. Če dualni par tvorita tudi prostora U in<br />

U ′ , velja tudi:<br />

〈u ′ , Wv ′ 〉=〈u ′ , u〉〈v ′ , v〉=〈u ′ ⊗ v ′ , u⊗v〉 (D.8.5)<br />

Toda zaradi linearnosti se mora <strong>po</strong>tem vsak tenzor w∈U⊗V preslikati v linearno<br />

preslikavo, ki deluje <strong>po</strong> predpisu:<br />

Od tod pa brž dobimo naslednji rezultat.<br />

〈u ′ , Wv ′ 〉=〈u ′ ⊗ v ′ , w〉 (D.8.6)


238 D.8 NORME TENZORJEV<br />

Trditev D.8.1. Če elemente tenzorskega produkta U⊗V <strong>po</strong> trditvi D.4.1 identificiramo<br />

z linearnimi preslikavami iz V ′ v U, se injektivna norma tenzorja ujema z operatorsko normo<br />

ustrezne linearne preslikave.<br />

Omenimo naj še naslednjo <strong>po</strong>splošitev na neskončnorazsežne prostore (za dokaz<br />

glej npr. Konvalinka [72]).<br />

Trditev D.8.2. Če sta U in V Banachova prostora in V ′ prostor vseh omejenih linearnih<br />

funkcionalov nad V, pa je U⊗ V z injektivno normo izometrično izomorfen prostoru vseh šibko<br />

∗-zveznih linearnih operatorjev končnega ranga iz V ′ v U, ki ga opremimo z običajno operatorsko<br />

normo.<br />

Oglejmo si še projektivno normo.<br />

DEFINICIJA. Naj bodo U 1 ,...U r normirani prostori z normami|·| 1 ,...|·| r in U ′ 1 ,...U′ r<br />

njihovi dualni prostori, opremljeni z dualnimi normami|·| ′ 1 ,...|·|′ r. Projektivna norma<br />

|·| ∧ na tenzorskem produktu U 1 ⊗···⊗U r je norma, ki je dualna injektivni normi na<br />

prostoru U r⊗···⊗U ′ ′ glede na bilinearni funkcional iz (D.4.10).<br />

1<br />

O<strong>po</strong>mba. Tudi tu lahko za prostore U ′ vzamemo <strong>po</strong>ljubne vektorske prostore, ki s<br />

i<br />

<strong>po</strong>sameznimi prostori U i tvorijo dualne pare normiranih prostorov.<br />

Trditev D.8.3. Če tenzorski produkt U 1 ⊗···⊗U r opremimo s projektivno normo, se v<br />

diagramu (D.3.2) norma preslikave L ujema z normo preslikaveΦ.<br />

O<strong>po</strong>mba. Navadno se trditev D.8.3 vzame prav za definicijo projektivne norme;<br />

v končnorazsežnih prostorih je oboje ekvivalentno, v neskončnorazsežnih pa ne nujno<br />

(glej Defant in Floret [46]).<br />

DOKAZTRDITVE D.8.3. Za W=R to sledi iz definicije projektivne norme ter ekvivalentnosti<br />

(D.8.1) in (D.8.2). Za splošen končnorazsežen prostor W to sledi iz dejstva, da<br />

za vsak w∈Wvelja:<br />

|w|=sup{w ′ w ; w ′ ∈ W ′ ,|w ′ |≤1}<br />

(D.8.7)<br />

kjer je W ′ dualni prostor prostora W z normo|·| ′ , dualno normi|·|. Normi preslikav<br />

Φ in L pa se ujemata, tudi če je prostor W neskončnorazsežen, saj je zaloga vrednosti<br />

preslikavΦin L vsebovana v nekem končnorazsežnem <strong>po</strong>dprostoru.<br />

Trditev D.8.4. Normi|·| ∧ in|·| ∨ sta križni: za <strong>po</strong>ljubne končnorazsežne vektorske prostore<br />

U 1 ,...U r z normami|·| 1 ,...|·| r in <strong>po</strong>ljubne vektorje u i ∈ U i velja:<br />

|u 1 ⊗···⊗u r | ∧ =|u 1 | 1 ...|u r | r (D.8.8)<br />

Podobno za <strong>po</strong>ljubne končnorazsežne vektorske prostore U r,...U ′ ′ z 1 normami|·|′ 1 ,...|·|′ r in<br />

<strong>po</strong>ljubne vektorje u ′ i∈ U ′ velja: i<br />

|u ′ r⊗···⊗u ′ 1 | ∨=|u ′ r| ′ r...|u ′ 1 |′ 1<br />

(D.8.9)


Dodatek D: TENZORSKI RAČUN 239<br />

DOKAZ. Najprej <strong>po</strong>kažimo (D.8.9). Naj bodo U 1 ,...U r normirani prostori, dualni<br />

prostorom U ′ 1 ,...U′ r. Če je|u i | i ≤ 1 za vsak i, velja tudi:<br />

|〈u ′ r⊗···⊗u ′ 1 , u 1⊗···⊗u r 〉|=|〈u ′ 1 , u 1〉...〈u ′ r, u r 〉|≤|u ′ 1 |′ 1 ...|u′ r| ′ r<br />

(D.8.10)<br />

torej je|u ′ r⊗···⊗u ′ 1 | ∨≤|u ′ 1 |′ 1 ...|u′ r| ′ r. Enakost <strong>po</strong>kažemo tako, da vzamemo take u i , da je<br />

〈u ′ i , u i〉=|u ′ i |′ i .<br />

Podobno, če želimo <strong>po</strong>kazati (D.8.8), najprej vzamemo normirane prostore U ′ 1 ,...U′ r,<br />

dualne prostorom U 1 ,...U r . Če je u ′ ∈ U ′ r⊗···⊗U ′ 1 in|u′ | ∨ ≤ 1, očitno velja tudi:<br />

|〈u ′ , u 1 ⊗···⊗u r 〉|≤|u 1 | 1 ...|u r | r<br />

(D.8.11)<br />

Enakost pa <strong>po</strong>kažemo tako, da vzamemo u ′ = u ′ r⊗···⊗u ′ 1 , in sicer za take vektorje u′ i ,<br />

da je〈u ′ i , u i〉=|u i | i . Nato u<strong>po</strong>števamo (D.8.9).<br />

Projektivno normo je mogoče zapisati nekoliko bolj “konstruktivno”. Znano je, da<br />

se da vsak vektor zapisati kot končna linearna kombinacija razcepnih tenzorjev. Po<br />

trikotniški neenakosti in (D.8.8) velja:<br />

∣ n∑ ∣∣∣∣∣∣∧ n∑<br />

u i1 ⊗···⊗u ir ≤ |u i1 |...|u ir | (D.8.12)<br />

∣<br />

i=1<br />

Trditev D.8.5. Za vsak vektor u∈U 1 ⊗···⊗U r velja:<br />

⎧ ⎫<br />

⎪⎨<br />

n∑<br />

n∑ ⎪⎬⎪⎭<br />

|u| ∧ = inf |u ⎪⎩ 1 | 1 ...|u r | r ; u= u 1 ⊗···⊗u r<br />

i=1<br />

i=1<br />

i=1<br />

(D.8.13)<br />

DOKAZ. Ni težko preveriti, da je desna stran v (D.8.13) sama zase norma, označimo<br />

jo z‖·‖. Iz definicije injektivne norme in trikotniške neenakosti sledi, da za vsak tenzor<br />

u ′ ∈ U ′ r⊗···⊗U ′ 1 , kjer so U′ 1 ,...U′ r dualni normirani prostori prostorov U 1 ,...U r , velja:<br />

Ker sta enakosti (D.8.1) in (D.8.2) ekvivalentni, velja tudi:<br />

|u ′ | ∨ = sup{|〈u ′ , u〉| ;‖u‖≤1} (D.8.14)<br />

‖u‖=sup{|〈u ′ , u〉| ;|u ′ | ∨ ≤ 1}<br />

To pa <strong>po</strong> definiciji projektivne norme <strong>po</strong>meni, da mora biti‖u‖=|u| ∧ .<br />

(D.8.15)<br />

ZGLED D.8.1. Projektivna in injektivna norma fundamentalnih tenzorjev. Naj bostaIin<br />

I T fundamentalni ko- in kontravariantni tenzor v dualnem paru n-razsežnih evklidskih<br />

prostorov, definirana tako kot v prejšnjem razdelku. Ker je:<br />

∣<br />

∣I T uv ∣ ∣<br />

∣=<br />

∣∣〈u,<br />

∣ ∣∣≤|u||v| v〉 (D.8.16)<br />

je ∣ ∣ ∣I<br />

T ∣∨ ≤ 1. Ker pa jeI T u 2 =〈u, u〉=|u| 2 , mora biti ∣ ∣ ∣I<br />

T ∣∨ = 1.<br />

Za izračun projektivne norme fundamentalnega kovariantnega tenzorjaIpa se<br />

s<strong>po</strong>mnimo, da jeI=e 2 1 +···+e2 n, kjer je{e 1 ,...e n } ortonormirana baza. Zaradi križnosti<br />

projektivne norme (trditev D.8.4) in trikotniške neenakosti je <strong>po</strong>tem|I| ∧ ≤ n. Toda ker<br />

jeI T I=n, mora biti|I| ∧ = n. Dokazali smo:<br />

∣<br />

∣I T∣ ∣ ∣∨ = 1, |I| ∧ = n<br />

(D.8.17)<br />


240 D.9 NORME NA TENZORSKIH PRODUKTIH EVKLIDSKIH PROSTOROV<br />

D.9 Norme na tenzorskih produktih evklidskih prostorov<br />

Evklidski prostor je sam sebi dualen, torej to velja tudi za tenzorski produkt evklidskih<br />

prostorov. Tako lahko na slednjem definiramo injektivno, projektivno in seveda<br />

še evklidsko normo. Če sta torej U in V evklidska prostora in z|·| označimo običajno<br />

normo na njiju, za <strong>po</strong>ljuben w∈U⊗V označimo:<br />

|w| ∨ = sup { |〈w, u⊗v〉| ;|u|,|v|≤1 }<br />

(D.9.1)<br />

|w| ∧ = sup { 〈w, z〉 ;|z| ∨ ≤ 1 }<br />

(D.9.2)<br />

|w|= √ 〈w, w〉<br />

(D.9.3)<br />

Namen tega razdelka je primerjava zgornjih norm. Natančneje, dokazali bomo naslednji<br />

rezultat.<br />

Trditev D.9.1. Naj bosta U in V evklidska prostora dimenzij m in n. Tedaj za vsak<br />

w∈U⊗V velja:<br />

|w|<br />

√<br />

min{m, n}<br />

≤|w| ∨ ≤|w|≤|w| ∧ ≤ √ min{m, n}|w|<br />

(D.9.4)<br />

O<strong>po</strong>mba. Nobena od zgornjih ocen se ne da izboljšati. Najprej vidimo, da v<br />

primeru, ko je tenzor w razcepen, velja|w| ∨ =|w|=|w| ∧ . Da sta doseženi tudi zunanji<br />

oceni, pa <strong>po</strong>kaže naslednji primer: naj bosta{e 1 ,...e m } in{ f 1 ,... f n } ortonormirani bazi<br />

prostorov U in V. Denimo, da je m≥n. Definirajmo w := ∑ n<br />

i=1 e i ⊗ f i . Tedaj se <strong>po</strong>dobno<br />

kot v zgledu D.8.1 prepričamo, da je|w| ∨ = 1 in|w| ∧ = n, očitno pa je tudi|w|= √ n.<br />

DOKAZTRDITVE D.9.1. Iz definicije injektivne in projektivne norme takoj sledi, da je<br />

|w| ∨ ≤|w| ∧ . Nadalje velja:<br />

|w|=sup { 〈w, z〉 ;|z|≤1 } ≥<br />

≥ sup { 〈w, u⊗v〉 ;|u⊗v|≤1}=<br />

= sup { 〈w, u⊗v〉 ;|u|,|v|≤1 } =<br />

(D.9.5)<br />

=|w| ∨<br />

Ni se težko prepričati, da dualnost obrne neenakosti med normami. Natančneje, če sta<br />

normi|·| ′ 1 in|·|′ 2 dualni normama|·| 1 in|·| 2 in je|·| 1 ≤|·| 2 , velja|·| ′ 1 ≥|·|′ 2<br />

. Tako dobimo<br />

še, da je|w|≤|w| ∧ .<br />

Naj bosta{e 1 ,...e m } in{ f 1 ,... f n } ortonormirani bazi prostorov U in V. V razdelku<br />

D.4 smo videli, da lahko vsak tenzor w= ∑ m n<br />

i=1∑<br />

j=1α ij e i ⊗ f j identificiramo z matriko<br />

W := [α ij ] i,j . Nadalje se <strong>po</strong> trditvi D.8.1 injektivna norma tenzorja W ujema z običajno<br />

matrično normo matrikeW. Sledi:<br />

|w| 2 ∨=‖W‖ 2 =‖W ∗ W‖≥ sl(W∗ W)<br />

= 1 m∑ n∑<br />

α 2 ij<br />

n n<br />

=|w|2 (D.9.6)<br />

n<br />

i=1<br />

j=1


Dodatek D: TENZORSKI RAČUN 241<br />

in <strong>po</strong>dobno:<br />

|w| 2 ∨=‖WW ∗ ‖≥ |w|2<br />

m<br />

(D.9.7)<br />

Tako smo dokazali, da je|w| ∨ ≥|w|/ √ min{m, n}. Iz dualnosti projektivne in injektivne<br />

norme pa sledi še, da je|w| ∧ ≤ √ min{m, n}|w|.<br />

D.10 Injektivna norma simetričnega tenzorja<br />

V tem delu bomo imeli dosti opravka z injektivnimi normami simetričnih tenzorjev,<br />

ali ekvivalentno, normami simetričnih multilinearnih form. Na tem mestu bomo<br />

predstavili izrek, ki nekoliko olajša njihovo računanje.<br />

DEFINICIJA. Multilinearna formaΦ∈M(U, U,...U;F) je simetrična, če za <strong>po</strong>ljubna i<br />

in j ter vektorje u 1 ,...u r ∈ U velja (če je i< j):<br />

Φ(u 1 ,...u i−1 , u i , u i+1 ,...u j−1 , u j , u j+1 ,...u j )=<br />

=Φ(u 1 ,...u i−1 , u j , u i+1 ,...u j−1 , u i , u j+1 ,...u j )<br />

(D.10.1)<br />

Tenzor u ′ ∈ (U ′ ) ⊗r je simetričen, če za <strong>po</strong>ljubno linearno preslikavo L ′ ij : (U′ ) ⊗r → (U ′ ) ⊗r ,<br />

definirano <strong>po</strong> predpisu:<br />

L ′ ij (u′ 1 ⊗···⊗u′ i−1 ⊗ u′ i ⊗ u′ i+1 ⊗···⊗u′ j−1 ⊗ u′ j ⊗ u′ j+1 ⊗···⊗u′ r)=<br />

= u ′ 1 ⊗···⊗u′ i−1 ⊗ u′ j ⊗ u′ i+1 ⊗···⊗u′ j−1 ⊗ u′ i ⊗ u′ j+1 ⊗···⊗u′ r<br />

(D.10.2)<br />

velja L ′ ij u′ = u ′ .<br />

Trditev D.10.1. Naj bo (U ′ , U) dualni par končnorazsežnih vektorskih prostorov. Tedaj za<br />

<strong>po</strong>ljubno multilinearno formoΦ∈M(U, U,...U;F) in tenzor u ′ ∈ (U ′ ) ⊗r , ki sta <strong>po</strong>vezna prek<br />

izomorfizma:<br />

u ′ 1 ⊗···⊗u′ r↦→ ( (u r ,...u 1 )↦→〈u ′ 1 , u 1〉...〈u ′ r, u r 〉 )<br />

(D.10.3)<br />

iz trditve D.4.2, velja, da jeΦsimetrična natanko tedaj, ko je u ′ simetričen.<br />

DOKAZ. Naj bo L ij : U ⊗r → U ⊗r linearna preslikava, definirana <strong>po</strong> predpisu:<br />

L ij (u 1 ⊗···⊗u i−1 ⊗ u i ⊗ u i+1 ⊗···⊗u j−1 ⊗ u j ⊗ u j+1 ⊗···⊗u r )=<br />

= u 1 ⊗···⊗u i−1 ⊗ u j ⊗ u i+1 ⊗···⊗u j−1 ⊗ u i ⊗ u j+1 ⊗···⊗u r<br />

(D.10.4)<br />

Zahteva, da je formaΦsimetrična, je ekvivalentna zahtevi, da za <strong>po</strong>ljubna i< j in<br />

<strong>po</strong>ljuben u∈U ⊗r velja〈u ′ , L ij u〉=〈u ′ , u〉. Ker sta preslikavi L in L ′ dualni, je to<br />

ekvivalentno zahtevi〈L ′ ij u′ , u〉=〈u ′ , u〉. To pa je ekvivalentno zahtevi, da je tenzor u ′<br />

simetričen.<br />

Glavna ugotovitev tega razdelka je naslednji Banachov [6] izrek.


242 D.10 INJEKTIVNA NORMA SIMETRIČNEGA TENZORJA<br />

Izrek D.10.2. Za vsako simetrično multilinearno formoΦna evklidskem prostoru U velja:<br />

sup {∣ ∣ ∣Φ(u1 , u 2 ,...u r ) ∣ ∣ ∣ ;|u1 |,|u 2 |,...|u r |≤1 } = sup {∣ ∣ ∣Φ(u, u,...u)<br />

∣ ∣∣ ;|u|≤1<br />

}<br />

(D.10.5)<br />

Posledica D.10.3. Vsaka simetrična multilinearna formaΦje natančno določena že z<br />

vrednostmiΦ(u, u,...u).<br />

Posledica D.10.4. Naj bo U evklidski prostor in U ′ njegova kopija. Tedaj za vsak simetričen<br />

tenzor u ′ ∈ (U ′ ) ⊗r velja:<br />

|u ′ | ∨ = sup{|u ′ u r | ;|u|≤1} (D.10.6)<br />

kjer je izraz na desni definiran tako kot v razdelku D.5, in sicer glede na bilinearni funkcional<br />

med U ′ in U, ki ga dobimo iz skalarnega produkta na U.<br />

Dokaz izreka D.10.2, ki ga bomo predstavili tu, ni izvirni Banachov. Njegov avtor je<br />

S. Łojasiewicz, <strong>po</strong>vzemamo pa ga iz Bochnakovega in Siciakovega članka [33]. Najprej<br />

bomo dokazali naslednjo lemo.<br />

Lema D.10.5. Naj boΦsimetrična 2-forma na evklidskem prostoru U in naj za neka<br />

enotska vektorja u in v velja|Φ(u, v)|=‖Φ‖, kjer je norma‖Φ‖ definirana tako kot v (D.8.3).<br />

Tedaj velja tudi:<br />

|Φ(u+v, u+v)|=‖Φ‖|u+v| 2<br />

|Φ(u−v, u−v)|=‖Φ‖|u−v| 2<br />

(D.10.7)<br />

(D.10.8)<br />

O<strong>po</strong>mba. Iz zgornje leme že sledi, da izrek D.10.2 velja za r=2.<br />

DOKAZLEME D.10.5. Velja:<br />

‖Φ‖=|Φ(u, v)|= 1 ∣<br />

∣Φ(u+v, u+v)−Φ(u−v, u−v) ∣ 4 ∣≤<br />

)<br />

≤ 4( 1 |Φ(u+v, u+v)|+|Φ(u−v, u−v)| ≤<br />

≤ 1‖Φ‖( |u+v| 2 +|u−v| 2) =<br />

4<br />

= 1‖Φ‖( |u| 2 +|v| 2) =<br />

2<br />

=‖Φ‖<br />

(D.10.9)<br />

To pa <strong>po</strong>meni, da <strong>po</strong>vsod velja enakost. Lema je s tem dokazana.<br />

DOKAZIZREKA D.10.2. Obstajajo taki vektorji ũ 1 ,...ũ r ∈ U, da je|ũ i |=1 za vsak i in<br />

|Φ(ũ 1 ,...ũ r )|=‖Φ‖. Prav gotovo obstaja tudi tak vektor a, da je〈u i , a〉0 za vsak i. Od<br />

tod pa sledi, da obstaja takδ>0, da množica:<br />

A := { (u 1 ,...u r )∈U r ;|Φ(u 1 ,...u r )|=‖Φ‖,|u i |=1,〈u i , a〉≥δza i=1,...r } (D.10.10)<br />

ni prazna. Ker je kompaktna, obstaja taka r-terica (û 1 ,...û r )∈A, da je:<br />

⎧ ⎫<br />

r∑ ⎪⎨<br />

r∑ ⎪⎬<br />

〈û k , a〉=max 〈u ⎪⎩ k , a〉 ; (u 1 ,...u r )∈A⎪⎭ =: M<br />

k=1<br />

k=1<br />

(D.10.11)


Dodatek D: TENZORSKI RAČUN 243<br />

Zdaj bomo <strong>po</strong>kazali, da so vsi vektorji û 1 ,...û r enaki. Naj bo i, j∈{1,...r}. Ker sta<br />

〈û i , a〉 in〈û j , a〉 strogo <strong>po</strong>zitivna, je gotovo û i + û j 0. Definirajmo:<br />

û<br />

⎧⎪ i + û j<br />

u ′ ⎨<br />

k := |û<br />

⎪ i + û j |<br />

⎩<br />

û k<br />

; k=i, j<br />

; sicer<br />

(D.10.12)<br />

Pa recimo, da je û i û j . Ker je tudi û i −û j , velja|û i + û j |<br />

|û i + û j |<br />

> 1 2(<br />

〈ûi , a〉+〈û j , a〉 ) ><br />

> 0<br />

(D.10.13)<br />

Iz tega in leme D.10.5 sledi, da je (u ′ 1 ,...u′ r)∈A, <strong>po</strong>leg tega pa še:<br />

r∑<br />

r∑<br />

〈u ′ k , a〉> 〈û k , a〉=M (D.10.14)<br />

kar je protislovje.<br />

k=1<br />

k=1


244 D.10 INJEKTIVNA NORMA SIMETRIČNEGA TENZORJA


Dodatek E<br />

Diferencialni račun v več<br />

spremenljivkah<br />

E.1 Odvodi funkcij več spremenljivk<br />

DEFINICIJA. Naj bo D odprta <strong>po</strong>dmnožica realnega končnorazsežnega vektorskega<br />

prostora V. Preslikava f : D→W, kjer je W tudi končnorazsežen vektorski prostor, je<br />

diferenciabilna oziroma odvedljiva v točki x∈D v klasičnem smislu, če obstaja taka linearna<br />

preslikava A: V→ W, da velja:<br />

| f (x+h)− f (x)−Ah|<br />

lim<br />

h→0 |h|<br />

= 0 (E.1.1)<br />

pri čemer prostora V in W opremimo z normama|·|. Definicija je neodvisna od<br />

izbire norm, ker so vse norme na končnorazsežnih prostorih ekvivalentne. Preslikavi<br />

A pravimo odvod preslikave f v točki x in pišemo A= f ′ (x).<br />

Tako smerni odvod preslikave f v x v smeri vektorja v pišemo kar kot f ′ (x)v. Brez<br />

težav preverimo, da velja:<br />

f ′ (x)v= d 1[ ]<br />

dt∣ f (x+tv)=lim f (x+tv)− f (x) (E.1.2)<br />

t=0 t→0 t<br />

Če je V=R d , W=Rin so e 1 ,...e n standardni bazni vektorji, je:<br />

f ′ (x)e i = ∂ f<br />

∂x i<br />

(E.1.3)<br />

parcialni odvod v i-ti spremenljivki.<br />

Odvod f ′ je torej preslikava, ki slika vL(V, W). Če je f diferenciabilna na neki<br />

okolici točke x in je tudi f ′ diferenciabilna v x, lahko definiramo drugi odvod f ′′ , ki<br />

slika vL(V,L(V, W)). Induktivno lahko definiramo, da je f r-krat diferenciabilna v točki<br />

x, če je (r−1)-krat diferenciabilna v okolici točke x in f (r−1) diferenciabilna v x. Tako je<br />

r-ti odvod f (r) (x)= ( f (r−1)) ′<br />

(x) element prostora:<br />

L(V,L(V,...L(V, W)...))<br />

(E.1.4)<br />

245


246 E.1 ODVODI FUNKCIJ VEČ SPREMENLJIVK<br />

in v dani točki x∈Dlahko definiramo r-ti odvod v smereh v 1 ,...v r kot izraz:<br />

f (r) (x)v 1 v 2 ...v r−1 v r<br />

(E.1.5)<br />

ki ga računamo tako kot v (D.1.4).<br />

Če je V=R n in W=R, lahko višji smerni odvod izrazimo s parcialnimi odvodi. Če<br />

je v i = ∑ n<br />

j=1α ij e j , kjer je{e 1 ,...e n } standardna baza, velja:<br />

f (r) (x)v 1 ...v n =<br />

n∑<br />

···<br />

i 1 =1<br />

n∑<br />

α 1i1 ...α rir<br />

i r =1<br />

∂ r f<br />

∂x i1 ...∂x ir<br />

(x)<br />

(E.1.6)<br />

Izraz (E.1.5) pa lahko gledamo tudi kot skrčitev tenzorja. V primeru, ko je W=R,<br />

namreč iz <strong>po</strong>sledic D.1.2 in D.4.2 sledi, da lahko f (r) (x) identificiramo s tenzorjem iz<br />

(V ′ ) ⊗r , kjer je V ′ dualni prostor prostora V. Tako lahko (E.1.5) gledamo kot skrčitveni<br />

produkt, kjer je V kovariantni, V ′ pa kontravariantni prostor. Podobno velja tudi v<br />

primeru, ko je W <strong>po</strong>ljuben vektorski prostor. V tem primeru lahko f (r) (x) identificiramo<br />

s tenzorjem iz W⊗ (V ′ ) ⊗r .<br />

S <strong>po</strong>močjo operacij na tenzorjih lahko definiramo nekaj znanih operacij, <strong>po</strong>vezanih<br />

z odvodi.<br />

DEFINICIJA. Naj bo f : D→R, kjer je D odprta <strong>po</strong>dmnožica končnorazsežnega<br />

vektorskega prostora V, diferenciabilna funkcija. Če V proglasimo za kovarianten<br />

prostor in je V ′ njegov dualni prostor, je odvod f ′ kontravariantno vektorsko <strong>po</strong>lje,<br />

t. j. preslikava, ki slika iz D v V ′ . Če je V evklidski prostor, V ′ in V tvorita dualni par<br />

evklidskih prostorov in lahko definiramo še gradient:<br />

grad f := ( f ′ ) T<br />

(E.1.7)<br />

ki je kovariantno vektorsko <strong>po</strong>lje.<br />

DEFINICIJA. Naj bo u: D→Vdiferenciabilno kovariantno vektorsko <strong>po</strong>lje. Divergenco<br />

<strong>po</strong>lja u definiramo kot:<br />

div u := sl u ′<br />

(E.1.8)<br />

DEFINICIJA. Naj bo f : D→R dvakrat diferenciabilna funkcija. Laplaceov operator<br />

definiramo <strong>po</strong> predpisu:<br />

∆ f (x) := f ′′ (x)I<br />

(E.1.9)<br />

kjer jeIfundamentalni kovariantni tenzor.<br />

O<strong>po</strong>mba. Če je V=R n z običajnim skalarnim produktom, se vse tri operacije<br />

ujemajo s klasično definiranim gradientom, divergenco in Laplaceovim operatorjem.<br />

Če so e 1 ,...e n standardni bazni vektorji, <strong>po</strong> (D.7.17), trditvi D.7.2 in (E.1.3) velja:<br />

grad f (x)= ( f ′ (x) ) T<br />

= f ′ (x)I=<br />

n∑<br />

i=1<br />

f ′ (x)e 2 i= ∂ f<br />

∂x i<br />

(x)e i<br />

(E.1.10)


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 247<br />

Nadalje naj bo u= ∑ n<br />

i=1 u i e i kovariantno vektorsko <strong>po</strong>lje. Po trditvah D.7.1, D.7.3 in<br />

D.7.2 ter (E.1.3) velja:<br />

div u=sl u ′ =I T u ′ I=<br />

n∑<br />

i=1<br />

n∑<br />

j=1<br />

(<br />

e<br />

T<br />

j<br />

) 2u ′ e 2 i=<br />

n∑<br />

i=1<br />

n∑<br />

j=1<br />

(<br />

e<br />

T<br />

j<br />

) 2 ∂u<br />

∂x i<br />

e i =<br />

Za Laplaceov operator pa <strong>po</strong> trditvi D.7.2 in (E.1.3) dobimo:<br />

∆ f (x)= f ′′ (x)I=<br />

n∑<br />

f ′′ (x)e 2 i=<br />

i=1<br />

n∑ ∂ 2 f<br />

i=1<br />

∂x 2 i<br />

n∑<br />

i=1<br />

e T i<br />

∂u<br />

∂x i<br />

=<br />

in vse desne strani se ujemajo s klasičnimi definicijami ustreznih operatorjev.<br />

O<strong>po</strong>mba. Velja:<br />

∆ f= div grad f<br />

n∑<br />

i=1<br />

∂u i<br />

∂x i<br />

(E.1.11)<br />

(E.1.12)<br />

(E.1.13)<br />

To lahko utemeljimo na dva načina. Prvič to velja zato, ker to velja za klasične operatorje<br />

naR d . Drugič pa to lahko utemeljimo z računom:<br />

div grad f= sl [ ( f ′ ) T] =I T[ ( f ′ ) T] ′<br />

I=<br />

[<br />

I T ( f ′ ) T] ′<br />

I=<br />

[<br />

( f ′ ) TT] ′<br />

I= f ′′ I=∆ f<br />

(E.1.14)<br />

E.2 Taylorjeva formula<br />

Zapis odvodov s tenzorji, kot smo ga <strong>po</strong>dali v prejšnjem razdelku, nam omogoča<br />

pregleden zapis Taylorjeve formule za funkcije več spremenljivk: ugotovili bomo, da<br />

jo lahko zapišemo tako kot za funkcije ene spremenljivke. Najprej bomo izpeljali nekaj<br />

<strong>po</strong>možnih rezultatov.<br />

Trditev E.2.1. Naj bosta U in V končnorazsežna vektorska prostora, D⊆V odprta množica<br />

in funkcija f : D→R. Dani naj bosta še točka y 0 ∈ V in linearna preslikava A: U→V.<br />

Definirajmo T(x) = y 0 + Ax. Tedaj za <strong>po</strong>ljuben x ∈ U, za katerega velja, da je f r-krat<br />

diferenciabilna v T(x), in <strong>po</strong>ljubne vektorje u 1 ,...u r ∈ U velja:<br />

( f◦ T) (r) (x)u 1 ...u r = f (r)( T(x) ) (Au 1 )...(Au r ) (E.2.1)<br />

DOKAZ. Trditev bomo dokazali s <strong>po</strong><strong>po</strong>lno indukcijo. Za r=1 trditev sledi iz verižnega<br />

pravila. Naredimo indukcijski korak z r−1 na r. Definirajmo funkciji:<br />

g(x) := ( f◦ T) (r−1) (x)u 2 ...u r<br />

h(y) := f (r−1) (y)(Au 2 )...(Au r )<br />

(E.2.2)<br />

(E.2.3)<br />

Po indukcijski pred<strong>po</strong>stavki je g(x)=h ( T(x) ) . Po verižnem pravilu je <strong>po</strong>tem g ′ (x)u=<br />

h ′( T(x) ) (Au). Sledi:<br />

( f◦ T) (r) (x)u 1 ...u r = g ′ (x)u 1 = h ′( T(x) ) (Au 1 )= f (r)( T(x) ) (Au 1 )...(Au r ) (E.2.4)


248 E.3 ŠIBKI ODVODI<br />

Trditev E.2.2. Naj bo D odprta <strong>po</strong>dmnožica končnorazsežnega vektorskega prostora V in<br />

f : D→R, funkcija, ki naj bo r-krat zvezno odvedljiva v neki točki x 0 ∈ D. Naj bo še v∈V.<br />

Definirajmo funkcijo realne spremenljivkeϕ<strong>po</strong> predpisu:<br />

Tedaj velja:<br />

ϕ(t) := f (x 0 + tv)<br />

ϕ (r) (0)= f (r) (x 0 )v r<br />

(E.2.5)<br />

(E.2.6)<br />

DOKAZ. V trditev E.2.1 vstavimo T(t) := x 0 + tv.<br />

S <strong>po</strong>močjo zgornje trditve lahko izpeljemo Taylorjevo formulo za funkcije več spremenljivk.<br />

V tem delu bomo <strong>po</strong>trebovali obliko z integralskim ostankom. Če je f<br />

(r+1)-krat zvezno odvedljiva funkcija ene spremenljivke, velja:<br />

f (x+h)= f (x)+ f′ (x)<br />

1!<br />

h+···+ f (r) (x)<br />

r!<br />

h r +<br />

∫ 1<br />

Iz prejšnje trditve zdaj sledi naslednja ugotovitev.<br />

0<br />

(1−θ) r f (r+1) (x+θh)<br />

r!<br />

h r+1 dθ (E.2.7)<br />

Trditev E.2.3. Zapis (E.2.7) velja tudi, če je f (r+1)-krat zvezno odvedljiva funkcija več<br />

spremenljivk, definirana na neki okolici daljice od x do x+h.<br />

E.3 Šibki odvodi<br />

Določene vrste izpeljav pri diferencialnem računu, <strong>po</strong>sebej pri funkcijah več spremenljivk,<br />

imajo smisel, če so funkcije primernokrat zvezno odvedljive. To je predvsem<br />

tedaj, ko zahtevamo veljavnost “<strong>po</strong> točkah”, denimo pri Taylorjevi formuli (E.2.7). Včasih<br />

pa glede veljavnosti nismo tako zahtevni, zato pa želimo imeti nekoliko splošnejšo<br />

obliko rezultata. Tako denimo želimo <strong>po</strong>znati le vrednost kakšnega integrala, <strong>po</strong>vezanega<br />

z odvodi, za katere pa ni nujno, da so zvezni ali pa celo sploh ni nujno, da je<br />

funkcija <strong>po</strong>vsod diferenciabilna.<br />

Tako bomo na tem mestu uvedli <strong>po</strong>jem šibkega odvoda in funkcij Soboljeva, ki temelji<br />

na tem, da za dano funkcijo f : R n →Rgledamo integrale:<br />

∫<br />

R n f (x) h(x) dx (E.3.1)<br />

kjer je h <strong>po</strong>ljubnokrat zvezno odvedljiva funkcija s kompaktnim nosilcem. Nanizali<br />

bomo le osnovne lastnosti, za splošno teorijo pa glej npr. Evans in Gariepy [56].<br />

Najprej se bomo prepričali, da lahko funkcijo dovolj dobro opišemo z “otipavanjem”<br />

z neskončno gladkimi funkcijami s kompaktnim nosilcem. Seveda obstaja nekaj<br />

omejitev: najprej morajo biti integrali (E.3.1) sploh dobro definirani. To pa bodo, če bo<br />

funkcija f lokalno integrabilna.


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 249<br />

V splošnem bomo gledali preslikave iz odprte <strong>po</strong>dmnožice D prostoraR n v končnorazsežen<br />

vektorski prostor V. Definirajmo:<br />

L p (D; V) := { ∫<br />

f : D→V ; f merljiva, | f (x)| p dx


250 E.3 ŠIBKI ODVODI<br />

DEFINICIJA. Naj bo D odprta množica vR n in V končnorazsežen vektorski prostor.<br />

Preslikava f : D→Vje šibko odvedljiva, če je f∈ L 1 (D; V) in če obstaja taka preslikava<br />

( loc<br />

D;L(R n , V) ) , da za vsak h∈C (1) (D) velja:<br />

g∈L 1 loc<br />

Funkciji g pravimo šibki odvod preslikave f .<br />

∫<br />

D<br />

c<br />

∫<br />

g(x) h(x) dx=− f (x) h ′ (x) dx<br />

D<br />

(E.3.11)<br />

O<strong>po</strong>mba. Za šibko odvedljivost je dovolj, da obstaja taka baza{u 1 ,...u n } in take<br />

preslikave g i , da je:<br />

∫ ∫<br />

g i (x) h(x) dx=− f (x) h ′ (x)u i dx<br />

(E.3.12)<br />

D<br />

D<br />

(preslikavam g i pravimo šibki smerni odvodi). Med drugim je torej za šibko odvedljivost<br />

dovolj, da obstajajo šibki parcialni odvodi.<br />

O<strong>po</strong>mba. Zgoraj definirani <strong>po</strong>jem šibkega odvoda je <strong>po</strong>seben primer odvoda v<br />

distribucijskem smislu. Ideja je v osnovi ista kot pri distribucijah (ki so definirane kot<br />

funkcionali iz (E.3.1), tako da vsaka lokalno integrabilna funkcija določa distribucijo;<br />

za <strong>po</strong>drobnosti glej npr. Rudin [111]). Funkcija je šibko odvedljiva, če je njen odvod v<br />

distribucijskem smislu funkcija (in ne le distribucija).<br />

Videli bomo, da šibki odvod v dobršni meri ustreza temu, kar pričakujemo od<br />

odvoda. Pokazali bomo, da določena računska pravila (odvod produkta, odvajanje<br />

<strong>po</strong>d integralskim znakom, integracija per partes) veljajo tako kot za klasični odvod,<br />

<strong>po</strong>goji, <strong>po</strong>d katerimi veljajo, pa so šibkejši in bolj v skladu z intuicijo. Za še več<br />

rezultatov glej npr. Evans in Gariepy [56].<br />

Najprej bomo <strong>po</strong>dali dva zgleda.<br />

ZGLED E.3.1. Naj bo f (x) :=|x|. Ker za <strong>po</strong>ljubno funkcijo h∈C (∞)<br />

c (R) velja:<br />

∫ ∞<br />

−∞<br />

∫ 0<br />

f (x) h ′ (x) dx=− x h ′ (x) dx+<br />

−∞<br />

=<br />

=<br />

∫ 0<br />

−∞<br />

∫ ∞<br />

−∞<br />

h(x) dx−<br />

∫ ∞<br />

0<br />

sgn(x) h(x) dx<br />

∫ ∞<br />

0<br />

x h ′ (x) dx<br />

h(x) dx=<br />

(E.3.13)<br />

je funkcija sgn šibki odvod funkcije f .<br />

Šibki odvod smo tu izračunali <strong>po</strong> definiciji in dobili tisto, kar smo pričakovali.<br />

Kasneje bomo videli, da to velja za dokaj velik razred funkcij (glej <strong>po</strong>sledico E.5.7). □


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 251<br />

ZGLED E.3.2. Vzemimo zdaj funkcijo f (x)=sgn(x). Videli bomo, da f ni šibko<br />

odvedljiva. Če bi bila, bi moralo za vsako funkcijo h∈C (∞) (R) veljati:<br />

∫ ∞<br />

−∞<br />

f ′ (x) h(x) dx=−<br />

=<br />

∫ ∞<br />

−∞<br />

∫ 0<br />

f (x) h ′ (x) dx=<br />

h ′ (x) dx−<br />

−∞<br />

c<br />

∫ ∞<br />

0<br />

h ′ (x) dx=<br />

(E.3.14)<br />

=−2h(0)<br />

( ) ∫<br />

Torej bi za vsako funkcijo h∈C (∞) ∞<br />

c R\{0} veljalo<br />

−∞ f′ (x) h(x) dx=0. Po trditvi E.3.1<br />

bi <strong>po</strong>tem veljalo f ′ (x)=0 za skoraj vsak x∈R\{0}, torej za skoraj vsak x∈R. Od<br />

to pa bi sledilo, da tudi za vsako funkcijo h∈C (∞)<br />

c<br />

protislovje.<br />

Šibki odvod odlikujejo naslednje lastnosti:<br />

(R) velja ∫ ∞<br />

−∞ f′ (x) h(x) dx=0, kar je<br />

□<br />

• Natančna določenost. Iz trditve E.3.1 sledi, da je šibki odvod natančno določen do<br />

ujemanja skoraj <strong>po</strong>vsod. Zato ga označujemo kar s f ′ . Če smo natančni, je f ′<br />

pravzaprav ekvivalenčni razred funkcij.<br />

• Lokalnost. Če je D ′ ⊆ D in f : D→Všibko odvedljiva, je šibko odvedljiva tudi<br />

zožitev funkcije f na D ′ in šibki odvod zožitve se ujema z zožitvijo šibkega odvoda<br />

prvotne funkcije f .<br />

• Ujemanje s klasično zvezno odvedljivostjo. Iz trditve E.3.2 sledi, da je funkcija, ki je<br />

zvezno odvedljiva na D, tam tudi šibko odvedljiva in oba odvoda se ujemata.<br />

Zadnja lastnost ima tudi naslednji obrat, ki pa ga bomo spet dokazali malo kasneje.<br />

Trditev E.3.3. Naj bo f šibko odvedljiva in naj ima njen šibki odvod zvezno verzijo. Tedaj<br />

ima f zvezno odvedljivo verzijo.<br />

Seveda lahko definiramo tudi višje šibke odvode: funkcija f je r-krat šibko odvedljiva,<br />

če je (r−1)-krat šibko odvedljiva in f (r−1) šibko odvedljiva; njen šibki odvod je<br />

<strong>po</strong>tem f (r) , r-kratni šibki odvod funkcije f . Definicija je seveda neodvisna od verzije<br />

f (r−1) . Višji šibki odvodi so karakterizirani s formulo:<br />

∫ ∫<br />

f (r) (x) h(x) dx=(−1) r f (x) h (r) (x) dx<br />

(E.3.15)<br />

D<br />

ki spet velja za vse h∈C (∞)<br />

c (D).<br />

Pomembno je, v kolikšni meri so šibki odvodi integrabilni. To opisujejo prostori<br />

Soboljeva:<br />

W r,p (D; V) :={ f : D→V ; f je r-krat šibko odvedljiva<br />

D<br />

in f (s) ∈ L p (D; V) za vse 0≤s≤r}<br />

Podobno kot pri prostorih L p lahko tudi tu definiramo lokalne različice:<br />

(E.3.16)<br />

W r,p<br />

loc (D; V) :={ f : D→V ; f∈W r,p (D ′ ; V), brž ko je D ′ kompaktno vsebovana v D}<br />

(E.3.17)


252 E.3 ŠIBKI ODVODI<br />

O<strong>po</strong>mbi.<br />

(1) Če je p≤q, je tudiW r,q (D; V)⊆W r,q<br />

(D; V)⊆Wr,p (D; W).<br />

loc<br />

(2) Če je s≤r, jeW r,p (D; V)⊆W s,p (D; V) inW r,p<br />

(D; V)⊆Ws,p(D; V).<br />

loc<br />

Šibki odvodi imajo dosti lepih lastnosti. Kljub temu pa moramo biti pri računanju<br />

z njimi malo previdnejši. Naslednji dve trditvi opisujeta Taylorjevo formulo za šibke<br />

odvode.<br />

Trditev E.3.4. Naj bo D⊆R n odprta množica, r∈N 0 in f∈W r+1,1 (D). Tedaj za vsak<br />

loc<br />

u∈R d velja, da za skoraj vsak x∈R n , za katerega je daljica od x do x+u vsebovana v D, velja:<br />

f (x+u)= f (x)+ f′ (x)<br />

1!<br />

u+···+ f (r) (x)<br />

r!<br />

u r +<br />

∫ 1<br />

0<br />

loc<br />

loc<br />

(1−θ) r f (r+1) (x+θu)<br />

r!<br />

u r+1 dθ (E.3.18)<br />

Z drugimi besedami, množica točk x∈R n , za katere je daljica od x do x+u vsebovana v D,<br />

formula (E.3.18) pa ne velja, ima Lebesguovo mero nič.<br />

DOKAZ. Naj bo U množica vseh točk x, za katere je daljica od x do x+u vsebovana<br />

v D. Očitno je U odprta. Naj bo h∈C (∞)<br />

c (U). Definirajmo:<br />

∫ ⎛<br />

r∑<br />

J := ⎜⎝ f (x+u)− f (k) ∫<br />

(x)<br />

1<br />

u k − (1−θ) f ⎞<br />

(r+1) (x+θu)<br />

r u r+1 dθ<br />

k!<br />

r!<br />

⎟⎠<br />

h(x) dx (E.3.19)<br />

U<br />

k=0<br />

0<br />

Če z ničlo razširimo funkciji f in h na vesR n , je zdaj f ∈W r+1,1 (R d ) in h∈C (∞)<br />

loc<br />

c (R d ).<br />

Z zamenjavo vrstnega reda integracije in substitucijo y=x+u oziroma y=x+θu<br />

dobimo:<br />

J=<br />

∫ 1<br />

( ∫R n<br />

0<br />

f (y) h(y−u)−<br />

− (1−θ) r f (r+1) (y)<br />

r!<br />

r∑<br />

k=0<br />

f (k) (y)<br />

k!<br />

u r+1 h(y−θu)<br />

u k h(y)−<br />

)<br />

dy dθ<br />

(E.3.20)<br />

Nadalje iz (E.3.15) sledi:<br />

J=<br />

∫ 1<br />

0<br />

∫<br />

R n<br />

f (y)<br />

(<br />

h(y−u)−<br />

r∑<br />

(−1) r h(k) (y)<br />

u k −<br />

k!<br />

k=0<br />

− (−1) r+1 (1−θ) r f (r+1) (y−θu)<br />

r!<br />

u r+1 )<br />

dx dθ<br />

(E.3.21)<br />

Če zdaj spet zamenjamo vrstni red integracije in u<strong>po</strong>rabimo klasično Taylorjevo formulo<br />

(trditev E.2.3) za funkcijo h, dobimo, da je J=0. Iz trditve E.3.1 zdaj sledi, da enakost<br />

(E.3.18) res velja za skoraj vsak x∈U. Naša trditev je tako dokazana.


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 253<br />

Trditev E.3.5. Naj bodo D, r in f tako kot v prejšnji trditvi. Tedaj za skoraj vsaka x in<br />

y∈R n , za katera je daljica od x do y vsebovana v D, velja:<br />

f (y)= f (x)+ f′ (x)<br />

(y−x)+···+ f (r) (x)<br />

(y−x) r +<br />

1!<br />

r!<br />

∫ 1<br />

+ (1−θ) f (r+1)( (1−θ)x+θy )<br />

r (y−x) r+1 dθ<br />

r!<br />

0<br />

(E.3.22)<br />

DOKAZ. Trditev takoj sledi iz trditve E.3.4 in dejstva, da preslikava (x, u)↦→ (x, x+u)<br />

ohranja Lebesguovo mero naR 2n .<br />

Dolžni smo še dokazati nekaj trditev od prej. Najprej dokažimo naslednjo lemo, ki<br />

opisuje odvod konvolucije in ki jo bomo kasneje še <strong>po</strong>splošili (glej lemi E.5.8 in E.7.4).<br />

Lema E.3.6. Naj bo D⊆R n odprta množica ter f∈C (1) (D) in g∈L 1 (D). Ena od funkcij<br />

loc<br />

naj ima kompakten nosilec. Definirajmo:<br />

∫<br />

F(w) := f (w+z) g(z) dz<br />

(E.3.23)<br />

z∈D<br />

w+z∈D<br />

Tedaj je F v neki okolici izhodišča v klasičnem smislu diferenciabilna in velja:<br />

∫<br />

F ′ (w)= f ′ (w+z) g(z) dz<br />

z∈D<br />

w+z∈D<br />

(E.3.24)<br />

DOKAZ. Naj bo K⊆D kompaktni nosilec ene od funkcij. Obstajata takρ>0 in taka<br />

kompaktna množica D ′ , da za vsak w z|w|


254 E.3 ŠIBKI ODVODI<br />

DOKAZTRDITVE E.3.2. Dovolj je dokazati za primer, ko je V=R. Podobno kot v lemi<br />

E.3.6 definirajmo: ∫<br />

F(w) := f (w+z) h(z) dz<br />

(E.3.29)<br />

z∈D<br />

z+w∈D<br />

Po lemi E.3.6 velja: ∫<br />

F ′ (0)= f ′ (z) h(z) dz<br />

(E.3.30)<br />

Toda F lahko zapišemo tudi v obliki:<br />

∫<br />

F(w)= f (x) h(x−w) dz<br />

x∈D<br />

x−w∈D<br />

in tokrat nam lema E.3.6 da:<br />

od koder že sledi zahtevani rezultat.<br />

D<br />

∫<br />

F ′ (0)=− f (z) h(z) dz<br />

D<br />

(E.3.31)<br />

(E.3.32)<br />

Izrek E.3.7. Naj boµRadonova mera na odprti množici D⊆R n in 1≤p


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 255<br />

kjer jeµmera na D, definirana zµ(dx)=| f (x)| dx. FunkcionalΦje očitno omejen glede<br />

na normo prostora L 1 (µ) in naC (∞)<br />

c (D) enak nič. Ker jeµRadonova mera, je <strong>po</strong> izreku<br />

E.3.7 prostorC (∞)<br />

c (D) gost v L 1 (µ), Torej jeΦvresnici <strong>po</strong>vsod enak nič. Med drugim to<br />

<strong>po</strong>meni tudi, da je: ∫<br />

Φ sgn( f )= | f (x)| dx=0 (E.3.36)<br />

D<br />

To pa <strong>po</strong>meni, da je funkcija f skoraj <strong>po</strong>vsod na D enaka nič. S tem je dokaz končan.<br />

DOKAZTRDITVE E.3.3. Zaradi lokalnosti šibkega odvoda lahko brez škode za splošnost<br />

privzamemo, da je definicijsko območje D funkcije f konveksna relativno kompaktna<br />

množica, šibki odvod pa ima verzijo f ′ , ki se da zvezno razširiti na ¯D. Iz trditve<br />

E.3.5 sledi, da za skoraj vsak par (x, y)∈D×D velja Newton–Leibnizeva formula:<br />

Definirajmo:<br />

f (y)− f (x)=<br />

∫ 1<br />

0<br />

f ′( (1−θ)x+θy ) (y−x) dθ<br />

(E.3.37)<br />

A :={x∈D;zveza (E.3.37) velja za skoraj vsak y∈D}<br />

(E.3.38)<br />

Pokažimo sedaj, da zveza (E.3.37) velja za <strong>po</strong>ljubna x, y∈A. Obstaja za<strong>po</strong>redje točk<br />

y k ∈ D, ki konvergira proti y in za katere velja:<br />

f (y k )− f (x)=<br />

f (y)− f (y k )=<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

f ′( (1−θ)x+θy k<br />

)<br />

(yk − x) dθ<br />

f ′( (1−θ)y k +θy ) (y− y k ) dθ<br />

(E.3.39)<br />

(E.3.40)<br />

Zaradi enakomerne zveznosti funkcije f ′ integral v (E.3.39) konvergira proti integralu<br />

v (E.3.37), integral v (E.3.40) pa konvergira proti nič. Tako, če seštejemo (E.3.39) in<br />

(E.3.40) in <strong>po</strong>šljemo k proti neskončno, dobimo (E.3.37).<br />

Po Fubinijevem izreku ima množica D\A mero nič, torej je med drugim tudi A gosta<br />

v D. Poleg tega je funkcija f enakomerno zvezna na A (celo Lipschitzeva), saj zaradi<br />

kompaktnosti velja M := sup x∈D<br />

‖ f ′ (x)‖


256 E.5 ODVODI LIPSCHITZEVIH FUNKCIJ<br />

E.4 Šibka odvedljivost in absolutna zveznost<br />

Klasična analiza pravi, da sta pri funkcijah ene spremenljivke odvajanje in integriranje<br />

inverzni operaciji, če je funkcija, ki jo integriramo, zvezna, funkcija, ki jo odvajamo,<br />

pa zvezno odvedljiva. To je možno <strong>po</strong>splošiti na primer, ko je funkcija, ki jo integriramo,<br />

lokalno integrabilna (t. j. pripada L 1 ), funkcija, ki jo odvajamo, pa absolutno<br />

loc<br />

zvezna (ali, ekvivalentno, skoraj <strong>po</strong>vsod odvedljiva v klasičnem smislu, odvod pa je lokalno<br />

integrabilen; za <strong>po</strong>drobnosti glej npr. Rudin [110]). V prejšnjem razdelku pa smo<br />

definirali še eno <strong>po</strong>splošitev, t. j. šibko odvedljivost. Izkaže se, da se obe <strong>po</strong>splošitvi v<br />

največji možni meri ujemata.<br />

Trditev E.4.1. Naj bo a


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 257<br />

DEFINICIJA. Naj bosta V in W metrična prostora. Preslikava f : V→Wje Lipschitzeva,<br />

če obstaja taka konstanta M, da za <strong>po</strong>ljubna x, y∈Vvelja:<br />

d ( f (x), f (y) ) ≤ M d(x, y)<br />

(E.5.1)<br />

Preslikava je lokalno Lipschitzeva, če za vsak x∈Vobstaja taka okolica U točke x, da je<br />

zožitev preslikave f na U Lipschitzeva.<br />

O<strong>po</strong>mba. Če je preslikava lokalno Lipschitzeva, je vsaka njena zožitev na kompaktno<br />

množico Lipschitzeva. Če je prostor, iz katerega slika preslikava, lokalno kompakten,<br />

velja tudi obrat.<br />

Če je <strong>po</strong>dana zvezno diferenciabilna preslikava f : D→W, kjer je D⊆Vkonveksna<br />

odprta množica, V in W pa normirana prostora, in je‖ f ′ (x)‖≤M za vsak x∈D, iz<br />

Newton–Leibnizeve formule sledi, da je| f (x)− f (y)|≤M|x− y|, torej je f Lipschitzeva.<br />

Tako je med drugim vsaka zvezno diferenciabilna preslikava tudi lokalno Lipschitzeva.<br />

Ocena, ki smo jo izpeljali, pa velja tudi v obratni smeri.<br />

Trditev E.5.1. Naj bo D⊆R n odprta množica, V končnorazsežen normiran prostor,<br />

f : D→Vpa taka preslikava, da je| f (x)− f (y)|≤M|x− y| za <strong>po</strong>ljubna x, y∈D. Če je f<br />

diferenciabilna v x, je <strong>po</strong>tem tudi‖ f ′ (x)‖≤M, kjer je‖·‖ standardna norma naL(R n , V),<br />

<strong>po</strong>rojena iz norm naR n in V.<br />

DOKAZ. U<strong>po</strong>rabimo formulo (E.1.2).<br />

Posledica E.5.2. Če je f∈C (1) (D; V), kjer je D⊆R n konveksna odprta množica, je njen<br />

odvod omejen natanko tedaj, ko je f Lipschitzeva, in velja:<br />

| f (x)− f (y)|<br />

sup<br />

x,y∈D |x− y|<br />

xy<br />

= sup∥ f ′ (x) ∥ ∥<br />

x∈D<br />

(E.5.2)<br />

Presenetljivo pa je, da že iz pred<strong>po</strong>stavke, da je f lokalno Lipschitzeva, sledi tudi<br />

diferenciabilnost.<br />

Izrek E.5.3 (Rademacher). Naj bo D⊆R n odprta množica, V končnorazsežen vektorski<br />

prostor in f : D→Vlokalno Lipschitzeva preslikava. Tedaj je f skoraj <strong>po</strong>vsod diferenciabilna<br />

v klasičnem smislu.<br />

Dokaz opuščamo, za dokaz glej npr. Evans in Gariepy [56], razdelek 3.1.2, izrek 2,<br />

stran 81.<br />

O<strong>po</strong>mba. Če je f zvezna preslikava, ni težko preveriti, da je množica točk, kjer je<br />

diferenciabilna, merljiva in da je njen odvod tam, kjer obstaja, merljiva preslikava.


258 E.5 ODVODI LIPSCHITZEVIH FUNKCIJ<br />

Naj bo D⊆R n odprta množica in V končnorazsežen vektorski prostor. Označimo:<br />

♭ (0) (D; V) :={ f : D→W ; f je omejena}<br />

♭ (1) (D; V) :={ f : D→W ; f je Lipschitzeva}<br />

♭ (r) (D; V) :={ f∈C (r−1) (D; V) ; f (r−1) je Lipschitzeva}<br />

(E.5.3)<br />

(E.5.4)<br />

(E.5.5)<br />

Kot <strong>po</strong>navadi, označimo še lokalne različice:<br />

♭ (r)<br />

loc (D; V) :={ f : D→V ; f∈♭ (r) (D ′ ; V), brž ko je D ′ kompaktno vsebovana v D}<br />

(E.5.6)<br />

Naj bo zdaj dana preslikava f : D→V. Če je f omejena, označimo:<br />

Če je f Lipschitzeva, označimo:<br />

M 0 ( f ) := sup| f (x)| (E.5.7)<br />

x∈D<br />

| f (x)− f (y)|<br />

M 1 ( f ) := sup<br />

x,y∈D |x− y|<br />

xy<br />

(E.5.8)<br />

Za r>1 in f∈♭ (r) (D) pa označimo:<br />

(<br />

M r ( f ) := M ) ‖ f (r−1) (x)− f (r−1) (y)‖<br />

1 f<br />

(r−1)<br />

= sup<br />

x,y∈D |x− y|<br />

xy<br />

(E.5.9)<br />

pri čemer se s<strong>po</strong>mnimo, da je f (r) (x) <strong>po</strong> definiciji element prostora:<br />

L(V,L(V,...L(V, W)...))<br />

(E.5.10)<br />

in prostorL(V, W) opremimo s standardno normo, ki izhaja iz norm na V in W. Če je<br />

W=R in višje odvode identificiramo s tenzorji, tako definirana norma ustreza injektivni<br />

tenzorski normi.<br />

Z zgoraj definiranimi oznakami lahko <strong>po</strong>sledico E.5.2 zapišemo še za višje odvode.<br />

Trditev E.5.4. Če je f∈C (r) (D; V), kjer je D⊆R n konveksna odprta množica, je njen r-ti<br />

odvod omejen natanko tedaj, ko je njen (r−1)-ti odvod Lipschitzev, in velja:<br />

M r ( f )=sup∥ f (r) (x) ∥ ∥<br />

x∈D<br />

(E.5.11)<br />

Trditev E.5.5. Za 0≤s≤rvelja♭ (r) (D; V)⊆♭ (r) (D; V)⊆♭(s) (D; V).<br />

loc loc


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 259<br />

DOKAZ. Prva inkluzija je očitna. Za drugo inkluzijo pa je dovolj dokazati, da za<br />

<strong>po</strong>ljubno omejeno konveksno območje D velja♭ (r+1) (D; V)⊆♭ (r) (D; V). Naj bo torej<br />

f∈♭ (r+1) (D; V). Izberimo neko točko x 0 ∈ D in naj bo R diameter množice D. Tedaj <strong>po</strong><br />

<strong>po</strong>sledici E.5.4 velja:<br />

M r ( f )=sup∥ f (r) (x) ∥ ∥<br />

∥≤<br />

∥∥<br />

f (r) (x 0 ) ∥ ∥+R Mr+1 ( f )


260 E.5 ODVODI LIPSCHITZEVIH FUNKCIJ<br />

Trditev E.5.9. Naj bo D⊆R n konveksna odprta množica in V končnorazsežen normiran<br />

prostor. Dana naj bo preslikava f : D→V.<br />

(1) Preslikava f pripadaW 1,∞ (D; V) natanko tedaj, ko ima Lipschitzevo verzijo.<br />

(2) Če je f Lipschitzeva, velja:<br />

M 1 ( f )=ess sup‖ f ′ ‖=sup { ‖ f ′ (x)‖ ; f je klasično diferenciabilna v x } (E.5.17)<br />

Tako dobimo naslednjo <strong>po</strong>splošitev trditve E.5.4.<br />

Posledica E.5.10. Naj bo D⊆R n odprta množica in V končnorazsežen normiran prostor.<br />

Tedaj funkcija f : D→VpripadaW r,∞ (D; V) natanko tedaj, ko ima verzijo v♭(r) (D; V). Če je<br />

loc loc<br />

D konveksna, pa velja še:<br />

M r ( f )=ess sup‖ f (r) ‖<br />

(E.5.18)<br />

DOKAZTRDITVE E.5.9. Dovolj je dokazati, da so naslednje trditve ekvivalentne:<br />

(A) Preslikava f ima tako verzijo ˜ f , da za <strong>po</strong>ljubna x, y∈D velja| f (x)− f (y)|≤M|x−y|.<br />

(B) Preslikava f ima verzijo f ˜ , ki je lokalno Lipschitzeva in za vsak x, kjer je f klasično<br />

diferenciabilna, velja‖ f ˜′<br />

(x)‖≤M.<br />

(C) Preslikava f ima verzijo f ˜ , ki je lokalno Lipschitzeva in za njen klasični odvod<br />

velja ess sup‖ f ˜′<br />

‖≤M.<br />

(D) Preslikava f pripadaW 1,∞ (D) in za njen šibki odvod velja ess sup‖ f ′ ‖≤M.<br />

(A)⇒(B): Sledi iz trditve E.5.1.<br />

(B)⇒(C): Očitno.<br />

(C)⇒(D): Sledi iz trditve E.5.7.<br />

(D)⇒(A): Ravnamo <strong>po</strong>dobno kot pri dokazu trditve E.3.3. Iz trditve E.3.5 sledi,<br />

da za skoraj vsak par (x, y)∈D×D velja Newton–Leibnizeva formula:<br />

Definirajmo:<br />

f (y)− f (x)=<br />

∫ 1<br />

0<br />

f ′( (1−θ)x+θy ) (y−x) dθ<br />

(E.5.19)<br />

A :={x∈D;zveza (E.5.19) velja za skoraj vsak y∈D}<br />

(E.5.20)<br />

Pokažimo sedaj, da za <strong>po</strong>ljubna x, y∈A velja, da je| f (x)− f (y)|≤M|x− y|. Obstaja<br />

za<strong>po</strong>redje točk y k ∈ D, ki konvergira proti y in za katere velja:<br />

f (y k )− f (x)=<br />

f (y)− f (y k )=<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

f ′( (1−θ)x+θy k<br />

)<br />

(yk − x) dθ<br />

f ′( (1−θ)y k +θy ) (y− y k ) dθ<br />

(E.5.21)<br />

(E.5.22)


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 261<br />

Sledi:<br />

| f (x)− f (y)|≤| f (x)− f (y k )|+| f (y k )− f (y)|≤M ( |x− y k |+|y k − y| ) (E.5.23)<br />

V limiti, ko gre k proti neskončno, <strong>po</strong>tem res dobimo, da za <strong>po</strong>ljubna x, y∈A velja<br />

| f (x)− f (y)|≤M|x− y|.<br />

Nadaljujemo spet <strong>po</strong>dobno kot v dokazu trditve E.3.3. Po Fubinijevem izreku ima<br />

množica D\A mero nič, torej je A gosta v D. Ker je f na A enakomerno zvezna, se<br />

da njena zožitev na A zvezno razširiti na cel D. Ta razširitev je <strong>po</strong>tem iskana verzija<br />

funkcije f .<br />

Za konec razdelka bomo <strong>po</strong>dali majhno ilustracijo – oceno ostanka pri Taylorjevi<br />

formuli.<br />

Trditev E.5.11. Naj bo D⊆R n odprta konveksna množica in f∈♭ (r+1) (D; V). Tedaj za<br />

<strong>po</strong>ljubna x∈D in tak u∈R n , da je tudi x+u∈D, velja:<br />

kjer je:<br />

f (x+u)= f (x)+ f′ (x)<br />

1!<br />

u+···+ f (r) (x)<br />

r!<br />

|R|≤ M r+1( f )<br />

(r+1)! |u|r+1<br />

DOKAZ. Trditev bomo dokazali na dva načina.<br />

u r + R<br />

(E.5.24)<br />

(E.5.25)<br />

Prvi način: z u<strong>po</strong>rabo šibkih odvodov Lipschitzevih funkcij. Fiksirajmo u. Po trditvi E.3.4<br />

za skoraj vsak x∈D, za katerega je tudi x+u∈D, velja:<br />

R=<br />

∫ 1<br />

0<br />

(1−θ) r f (r+1) (x+θu)<br />

r!<br />

u r+1 dθ<br />

Toda ker je f zvezna, enakost velja za vsak x. Po trditvi E.5.9 lahko ocenimo:<br />

|R|≤ M r+1( f )<br />

r!<br />

∫ 1<br />

|u| r+1 (1−θ) r dθ= M r+1( f )<br />

0<br />

(r+1)! |u|r+1<br />

(E.5.26)<br />

(E.5.27)<br />

Drugi način: brez u<strong>po</strong>rabe šibkih odvodov. Ker je f r-krat zvezno odvedljiva, lahko<br />

u<strong>po</strong>rabimo trditev E.2.3, a za en člen manj. Dobimo:<br />

Ocenimo:<br />

R=<br />

=<br />

∫ 1<br />

0<br />

(1−θ) f (r) (x+θu)<br />

r−1 u r dθ− f (r) (x)<br />

(r−1)!<br />

r!<br />

1<br />

(r−1)!<br />

∫ 1<br />

|R|≤ M ∫<br />

r+1( f )<br />

1<br />

(r−1)! |u|r+1<br />

0<br />

u r =<br />

(1−θ) r−1[ f (r) (x+θu)− f (r) (x) ] u r dθ<br />

0<br />

θ(1−θ) r−1 dθ= M r+1( f )<br />

(r+1)! |u|r+1<br />

(E.5.28)<br />

(E.5.29)


262 E.6 ODVAJANJE INTEGRALOV<br />

E.6 Odvajanje integralov<br />

Naj boΩmerljiv prostor sσ-končno <strong>po</strong>zitivno meroµ, D pa to<strong>po</strong>loški prostor. Dana<br />

naj bo merljiva preslikava f : D×Ω→V, kjer je V končnorazsežen vektorski prostor.<br />

Preučevali bomo zveznost in gladkost preslikave:<br />

∫<br />

F(w)= f (w, x)µ(dx)<br />

(E.6.1)<br />

Naslednja trditev takoj sledi iz izreka o dominirani konvergenci.<br />

Ω<br />

Trditev E.6.1. Naj bo prostor D 1-števen, preslikava w↦→ f (w, x) naj bo zvezna za vsak<br />

x. Nadalje naj za vsak w 0 ∈ W obstaja taka okolica U točke w 0 , da za vsako končno ali števno<br />

neskončno <strong>po</strong>dmnožico C⊆Uvelja:<br />

∫<br />

sup∣ f (w, x) ∣ ∣µ(dx)


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 263<br />

Trditev E.6.3. Naj bo preslikava w↦→ f (w, x) za skoraj vsak x∈Ω zvezno diferenciabilna<br />

z odvodom ∂ f<br />

. Nadalje naj za vsako kompaktno množico K⊆D velja:<br />

∂w<br />

∫<br />

sup∣ f (w, x) ∣ ∫<br />

∣<br />

∣µ(dx)


264 E.7 INTEGRACIJA PER PARTES, ODVOD PRODUKTA<br />

oziroma:<br />

∫<br />

D<br />

∫ ∫<br />

f (x) g(x) h ′ (x) dx=− f ′ (x) g(x) h(x) dx− f (x) g ′ (x) h(x) dx<br />

D<br />

D<br />

(E.7.4)<br />

od koder <strong>po</strong> definiciji šibkega odvoda že sledi (E.7.2). V splošnem primeru pa prav<br />

tako naredimo račun (E.7.3), le da zdaj u<strong>po</strong>rabimo formulo (E.7.1) in produktno pravilo<br />

za prej obravnavani primer.<br />

Za dokaz trditve E.7.1 bomo <strong>po</strong>trebovali nekaj <strong>po</strong>možnih rezultatov.<br />

Lema E.7.3. Naj bosta 1≤p, q≤∞ konjugirana eks<strong>po</strong>nenta ter f∈ L p (R n ) in g∈L q (R n ).<br />

Tedaj je funkcija: ∫<br />

F(w)= f (w+z) g(z) dz (E.7.5)<br />

R n<br />

zvezna.<br />

DOKAZ. Ker lahko pišemo tudi F(w)= ∫ f (x) g(x−w) dx, smemo brez škode za<br />

R<br />

splošnost privzeti, da je p0. Ker so zvezne funkcije s<br />

kompaktnim nosilcem goste v L p (R n ), obstaja taka funkcija f∈C ¯ c (R n )∩L p (R n ), da je:<br />

‖ ¯ f−f‖ p ‖g‖ q < ε 3<br />

(E.7.6)<br />

Naj bo K kompaktni nosilec funkcije ¯ f . Označimo:<br />

K 1 :={w+z ; z∈K,|w−w 0 |≤1}<br />

Tudi množica K 1 je kompaktna in ker je g∈L q (R n )⊆L q loc (Rn )⊆L 1 loc (Rn ), je:<br />

∫<br />

M := |g(x)| dx


Dodatek E: DIFERENCIALNI RAČUN V VEČ SPREMENLJIVKAH 265<br />

Lema E.7.4. Naj bosta 1≤p, q≤∞ konjugirana eks<strong>po</strong>nenta, D⊆R n odprta množica ter<br />

f∈W 1,p<br />

(D) in loc g∈Lq (D). Ena od funkcij naj ima kompakten nosilec. Definirajmo:<br />

loc<br />

∫<br />

F(w) := f (w+z) g(z) dz<br />

(E.7.10)<br />

z∈D<br />

w+z∈D<br />

Tedaj je F v neki okolici izhodišča zvezno diferenciabilna in velja:<br />

∫<br />

F ′ (w)= f ′ (w+z) g(z) dz<br />

z∈D<br />

w+z∈D<br />

(E.7.11)<br />

DOKAZ. Podobno kot v dokazu trditve E.3.6 lahko za dovolj majhne w pišemo:<br />

∫<br />

F(w) := f (w+z) g(z) dz<br />

(E.7.12)<br />

D ′<br />

kjer je D ′ ⊆ D primerna kompaktna množica. Rezultat zdaj sledi iz trditve E.6.2 in leme<br />

E.7.3 (funkciji f ′ in g z ničlo razširimo na celR n ).<br />

DOKAZTRDITVE E.7.1. Trditev sledi iz leme E.7.4, <strong>po</strong>dobno kot trditev E.3.2 sledi iz<br />

leme E.3.6.<br />

E.8 O odvodih Gaussove gostote<br />

Cilj tega razdelka je obravnavati odvode gostote standardizirane n-razsežne normalne<br />

<strong>po</strong>razdelitve:<br />

φ n (x)=(2π) −n/2 e − 1 2 |x|2<br />

(E.8.1)<br />

Če je x=(x 1 ,...x n ) in so e 1 ,...e n standardni bazni vektorji (tako da je <strong>po</strong>tem tudi<br />

x= ∑ n<br />

i=1 x i e i ), velja:<br />

Torej za vsak vektor u∈R n velja:<br />

φ ′ n(x)e i = ∂φ n<br />

∂x i<br />

(x)=−φ n (x)x i<br />

(E.8.2)<br />

φ ′ n(x)u=−φ n (x)〈x, u〉=−φ n (x)x T u<br />

ali še drugače <strong>po</strong>vedano:<br />

φ ′ (x)=−φ n (x)x T<br />

Zveza (E.8.4) ima naslednjo <strong>po</strong>splošitev na višje odvode.<br />

(E.8.3)<br />

(E.8.4)<br />

Trditev E.8.1. Za vsak r∈N 0 , vsak x∈R n in vsak enotski vektor u∈R n velja zveza:<br />

( )<br />

φ (r)<br />

d (x)ur =φ d (x) φ(r) 1 〈x, u〉<br />

( )<br />

(E.8.5)<br />

φ 1 〈x, u〉


266 E.8 O ODVODIH GAUSSOVE GOSTOTE<br />

O<strong>po</strong>mba. Iz <strong>po</strong>sledice D.10.3 sledi, da so odvodi funkcijeφsformulo (E.8.5)<br />

natančno določeni: brž ko za kontravariantni tenzor u ′ reda r velja, da je skrčitveni<br />

produkt u ′ u r za vsak u enak desni strani v (E.8.5), mora biti u ′ =φ (r) (x). d<br />

DOKAZTRDITVE E.8.1. Obstaja izometrična vložitev T, kiR n−1 preslika v ortogonalni<br />

komplement vektorja u. Poleg tega obstajata taka y∈R n−1 in tak t∈R, da je x=tu+Ty<br />

(velja t=〈x, u〉). Očitno jeφ d (x)=φ 1 (t)φ d−1 (y). Iz trditve E.2.2 zdaj sledi:<br />

( )<br />

φ (r)<br />

d (x)ur =φ (r) (t)φ 1 d−1(y)=φ d (x) φ(r) 1 〈x, u〉<br />

( )<br />

(E.8.6)<br />

φ 1 〈x, u〉<br />

Posledica E.8.2.<br />

ocena:<br />

Za vsak r obstaja taka konstanta C r , neodvisna od dimenzije, da velja<br />

∣ ∣∣φ (r)<br />

n (x) ∣ ∣ ∣∨ ≤ C r<br />

(<br />

1+|x|<br />

r ) φ n (x)<br />

(E.8.7)<br />

DOKAZ. Po <strong>po</strong>sledici D.10.4 zadošča ocenitiφ (r)<br />

n (x)u r , kjer je u enotski vektor. Toda <strong>po</strong><br />

(E.8.5) je nadalje dovolj ocenitiφ (r) (〈x, u〉)/φ 1 1(〈x, u〉). Funkcija H r (t) :=φ (r) (t)/φ 1 1(t) pa<br />

je <strong>po</strong>linom stopnje r (natančneje Hermitov <strong>po</strong>linom, <strong>po</strong>množen z (−1) r ). To pa <strong>po</strong>meni,<br />

da lahko ocenimo|H r (t)|≤C r (1+|t| r ) in ocena (E.8.7) je dokazana.


Dodatek F<br />

O Hausdorffovi meri<br />

Volumen množic vR n lahko opišemo z Lebeguovo mero. Kako pa definirati dolžino<br />

ali <strong>po</strong>vršino? Za množice, vsebovane v kakšnem afinem <strong>po</strong>dprostoru, lahko<br />

definiramo Lebesguovo mero ustrezne dimenzije. Kaj pa, če množica ni vsebovana v<br />

nobenem afinem <strong>po</strong>dprostoru želene dimenzije (ali števni uniji takih <strong>po</strong>dprostorov)?<br />

Na razmeroma preprost način se lahko “izmažemo”, če je množica vsebovana v števni<br />

uniji gladkih <strong>po</strong>dmnogoterosti. Včasih pa <strong>po</strong>trebujemo še splošnejši primer ali pa je<br />

s <strong>po</strong>dmnogoterostmi nerodno delati. Ena izmed možnosti <strong>po</strong>splošitve je Hausdorffova<br />

mera, ki jo bomo definirali v razdelku F.2. S Hausdorffovo mero se izraža tudi precej<br />

močan izrek, ki je <strong>po</strong>splošitev tako Fubinijevega izreka kot tudi izreka o vpeljavi<br />

nove spremenljivke v Riemannov integral. To je krivočrtni Fubinijev izrek (angl. coarea<br />

formula), ki ga bomo formulirali v razdelku F.3.<br />

F.1 O zunanjih merah<br />

Osrednji <strong>po</strong>jem teorije mere je seveda mera, t. j. števno aditivna funkcija naσ-algebri.<br />

Večino zanimivih mer, prav gotovo pa vse, ki jih bomo v tem delu <strong>po</strong>trebovali, pa<br />

lahko konstruiramo z u<strong>po</strong>rabo Carathéodoryjevega koncepta zunanjih mer, ki so števno<br />

subaditivne, zato pa jih lahko definiramo na vseh <strong>po</strong>dmnožicah danega prostora.<br />

DEFINICIJA. Zunanja meraµ na množici W je preslikava iz vseh <strong>po</strong>dmnožic množice<br />

W v [0,∞], za katero velja:<br />

(1)µ(∅)=0;<br />

(2) če je A⊆ ⋃ ∞<br />

i=1 A i , je tudi:<br />

⎛ ∞⋃<br />

µ ⎜⎝ A i<br />

⎞⎟ ⎠ ≤<br />

i=1<br />

∞∑<br />

µ(A i )<br />

i=1<br />

(F.1.1)<br />

Pokazali bomo, da je v dovolj lepih primerih ekvivalentno, ali delamo s pravimi ali<br />

zunanjimi merami. Iz vsake zunanje mereµdobimo mero naσ-algebri vseh množic,<br />

ki so merljive glede naµ.<br />

267


268 F.1 O ZUNANJIH MERAH<br />

DEFINICIJA. Množica A je merljiva glede na zunanjo meroµ, če za vsako množico E<br />

velja:<br />

µ(E)=µ(E∩A)+µ(E\A)<br />

(F.1.2)<br />

Trditev F.1.1. Naj boµzunanja mera. Tedaj je družina vseh množic, ki so merljive glede<br />

naµ,σ-algebra, zožitev zunanje mereµna toσ-algebro pa je mera.<br />

DOKAZ. Glej Halmos [65], Federer [57] ali Evans in Gariepy [56].<br />

Naredimo pa lahko tudi obratno: iz mereµ, definirane naσ-algebriM, konstruiramo<br />

zunanjo mero ¯µ <strong>po</strong> predpisu:<br />

¯µ(A) := infµ(B)<br />

(F.1.3)<br />

B∈M<br />

B⊇A<br />

O<strong>po</strong>mba. Iz lastnostiσ-algeber sledi, da je infimum v (F.1.3) v resnici dosežen: za<br />

vsako množico A obstaja taka množica B∈M, da je B⊇Ain ¯µ(A)=µ(B).<br />

Nastane vprašanje, ali sta prej opisana <strong>po</strong>stopka inverzna. Dokaz naslednje trditve<br />

je prepuščen bralcu.<br />

Trditev F.1.2. Naj boµmera naσ-algebriMin naj bo ¯µ zunanja mera, definirana tako<br />

kot v (F.1.3). Tedaj je vsaka množica izMtudi merljiva glede na ¯µ. Če mero ¯µ zožimo naM,<br />

dobimoµ.<br />

Druga možnost pa je, da vzamemo zunanjo mero, jo zožimo na merljive množice<br />

in iz te mere v skladu z (F.1.3) znova naredimo zunanjo mero. V tem primeru pa ne<br />

dobimo vedno prvotne zunanje mere. Odgovor pa je pritrdilen za regularne zunanje<br />

mere.<br />

DEFINICIJA.<br />

(1) Zunanja meraµje regularna, če za vsako množico A obstaja množica B⊇A, ki<br />

je merljiva glede naµin za katero veljaµ(B)=µ(A).<br />

(2) Zunanja mera na to<strong>po</strong>loškem prostoru je Borelova, če so vse Borelove množice<br />

merljive glede naµ.<br />

(3) Zunanja mera na to<strong>po</strong>loškem prostoru je Borelovo regularna, če je Borelova in če<br />

za vsako množico A obstaja Borelova množica B⊇A, za katero jeµ(B)=µ(A).<br />

Tudi naslednjo trditev dokažemo brez težav.<br />

Trditev F.1.3.<br />

(1) Naj boµmera na nekiσ-algebri. Tedaj je zunanja mera ¯µ, konstruirana tako kot v<br />

(F.1.3), regularna.<br />

(2) Naj boµregularna zunanja mera in naj bo ¯µ zunanja mera, konstruirana tako kot v<br />

(F.1.3) iz zožitve zunanje mereµna merljive množice. Tedaj je ¯µ=µ.<br />

Če <strong>po</strong>vzamemo, iz trditev F.1.2 in F.1.3 sledi, da je ekvivalentno, ali delamo s pravimi<br />

ali z regularnimi zunanjimi merami. Včasih pa je s slednjimi lepše delati. Tako se npr.<br />

v Federerjevi [57] ter Evansovi in Gariepyjevi monografiji [56] v celoti dela z zunanjimi<br />

merami (za katere se u<strong>po</strong>rablja kar izraz mera).


Dodatek F: O HAUSDORFFOVI MERI 269<br />

F.2 Definicija in osnovne lastnosti<br />

Hausdorffova mera je <strong>po</strong>splošitev Lebesguove mere naR n in jo lahko definiramo<br />

na <strong>po</strong>ljubnem metričnem prostoru. Motivirana je z dejstvom, da lahko vsako Lebesguovo<br />

merljivo množico vR n <strong>po</strong>ljubno natančno (t. j. s <strong>po</strong>ljubno malo prekrivanja<br />

in <strong>po</strong>krivanja območja izven dane množice) <strong>po</strong>krijemo s samimi kroglami. Drugače<br />

<strong>po</strong>vedano, velja naslednji izrek (o dokazu bo beseda kasneje, ko bomo formulirali še<br />

nekoliko močnejšo različico, izrek F.2.8).<br />

Izrek F.2.1. Zunanja Lebesguova mera vsake množice A⊆R n je enaka:<br />

⎧ ⎫<br />

⎪⎨<br />

∞∑ ∞⋃<br />

L n (A)=inf⎪⎩ v ⎪⎬<br />

n r n i<br />

; A⊆ B(x i , r i ) ⎪⎭<br />

i=1<br />

i=1<br />

(F.2.1)<br />

kjer je B(x, r) zaprta krogla okoli točke x s <strong>po</strong>lmerom r, v n pa je Lebesguova mera enotske krogle<br />

vR n , t. j.:<br />

v n :=<br />

π n/2<br />

O<strong>po</strong>mba. Skozi vse <strong>po</strong>glavje se držimo dogovora inf∅=∞.<br />

Γ ( (F.2.2)<br />

n+ 1)<br />

2<br />

Krogla pa je nekaj, kar <strong>po</strong>znamo tudi v metričnem prostoru. Osnovna ideja je torej,<br />

da krogli B(x, r) okoli točke x in s <strong>po</strong>lmerom r, ki se nahaja v metričnem prostoru (M, d),<br />

predpišemo tako mero, kot je Lebesguova mera enako “velike” krogle vR n . Tako bi<br />

lahko za vsako množico A⊆M definirali njeno zunanjo mero tako kot v (F.2.1). Izrek<br />

F.2.1 nam zagotavlja, da za M=R n res dobimo zunanjo Lebesguovo mero.<br />

Ker dimenzija metričnega prostora ni nekaj vnaprej predpisanega, se moramo pri<br />

definiciji take mere najprej odločiti, kateri n bi vzeli. Tako dobimo celo družino mer.<br />

Poleg tega sploh ni nujno, da je n celo število. A kot bomo videli kasneje, metrika sama<br />

<strong>po</strong>ve, kateri n je za <strong>po</strong>samezno množico smiselno vzeti. Pravimo mu Hausdorffova<br />

dimenzija (glej s<strong>po</strong>daj) in to res ni vedno nujno celo število.<br />

Zunanja mera, definirana tako kot v (F.2.1), pa ima to <strong>po</strong>manjkljivost, da ne u<strong>po</strong>števa<br />

lokalne geometrije.<br />

ZGLED F.2.1. Oglejmo si zunanjo mero, opisano v (F.2.1), na “križu”:<br />

(<br />

[−1, 1]×{0}<br />

)<br />

∪<br />

(<br />

{0}×[−1, 1]<br />

)<br />

(F.2.3)<br />

pri čemer vzamemo n=1 (kar je smiselno, ker gre za enodimenzionalen objekt). Očitno<br />

lahko cel prostor <strong>po</strong>krijemo s kroglo <strong>po</strong>lmera ena, torej je mera celega prostora enaka<br />

1. Toda ker je diameter prostora enak 2, ga ne moremo <strong>po</strong>kriti z družino krogel, ki bi<br />

imele vsoto <strong>po</strong>lmerov manjšo od 1. Zato je mera celega prostora enaka 1. Toda enako<br />

lahko sklepamo tudi za oba “kraka” [−1, 1]×{0} in{0}×[−1, 1]. Ker je mera preseka<br />

krakov očitno enaka nič, to <strong>po</strong>meni, da kraka ne moreta biti merljivi množici, kar ni<br />

smiselno.<br />

□<br />

Pomanjkljivost zunanje mere iz (F.2.1) odpravimo tako, da se omejimo le na krogle<br />

z majhnimi <strong>po</strong>lmeri. Izkaže pa se tudi, da je namesto krogel ugodneje vzeti množice z<br />

omejenimi diametri, ki so fleksibilnejše.


270 F.2 DEFINICIJA IN OSNOVNE LASTNOSTI<br />

DEFINICIJA.<br />

definirajmo:<br />

Naj bo (M, d) metrični prostor ter n∈R in n≥0. Zaδ>0 in A⊆M<br />

H n δ (A) := inf ⎧<br />

⎪⎨⎪⎩<br />

v n<br />

∞∑ ( ) diam n Ai<br />

; A⊆<br />

2<br />

i=1<br />

⎫<br />

∞⋃ ⎪⎬<br />

A i , diam A i ≤δ⎪⎭<br />

i=1<br />

(F.2.4)<br />

Očitno zaδ 1 ≥δ 2 veljaH n δ 1<br />

(A)≤H n δ 2<br />

(A). Definirajmo n-dimenzionalno zunanjo Hausdorffovo<br />

mero kot:<br />

H n (A) := supH n δ (A)<br />

(F.2.5)<br />

δ>0<br />

O<strong>po</strong>mba. Če je prostor M primerno “zavit”, se čisto lahko zgodi, da je n-dimenzionalna<br />

zunanja Hausdorffova mera množice z diametromδvečja od (δ/2) n .<br />

O<strong>po</strong>mba. Konstrukcija Hausdorffove mere, opisana v (F.2.4) in (F.2.5), je <strong>po</strong>seben<br />

primer Carathéodoryjeve konstrukcije, pri kateri množice <strong>po</strong>krivamo z množicami iz<br />

vnaprej predpisane družine (npr. kroglami), ki imajo omejene diametre, seštevamo pa<br />

<strong>po</strong>ljubne nenegativne funkcije na teh množicah. Zunanja mera, ki jo na ta način dobimo<br />

iz <strong>po</strong>kritij s kroglami (pri čemer seštevamo ustrezne <strong>po</strong>tence njihovih diametrov,<br />

<strong>po</strong>množene s primernim faktorjem), se imenuje zunanja sferična mera. Za <strong>po</strong>drobnosti<br />

glej Federer [57], razdelek 2.10.<br />

Zunanja Hausdorffova mera ima vrsto lepih lastnosti.<br />

Trditev F.2.2. Zunanja Hausdorffova mera je Borelovo regularna.<br />

DOKAZ. Glej Evans in Gariepy [56], razdelek 2.1, izrek 1.<br />

Dokaz naslednjih dveh trditev je prepuščen bralcu.<br />

Trditev F.2.3.<br />

merljive).<br />

Trditev F.2.4.<br />

g: M→M ′ .<br />

Zunanja Hausdorffova meraH 0 je kar mera, ki šteje (vse množice so<br />

Naj bosta (M, d) in (M ′ , d ′ ) metrična prostora. Dana naj bo preslikava<br />

(1) Če za <strong>po</strong>ljubna x, y∈M velja d ′( g(x), g(y) ) ≤ c d(x, y) (t. j. g je Lipschitzeva s<br />

konstanto c), za <strong>po</strong>ljubno množico A⊆M velja:<br />

H n( g(A) ) ≤ c n H n (A)<br />

(F.2.6)<br />

(2) Če za <strong>po</strong>ljubna x, y∈M velja d ′( g(x), g(y) ) ≥ c d(x, y), kjer je c>0, za <strong>po</strong>ljubno<br />

množico A⊆M velja:<br />

H n( g(A) ) ≥ c −n H n (A)<br />

(F.2.7)<br />

in za <strong>po</strong>ljubno množico B⊆M ′ velja:<br />

H n( g −1 (B) ) ≤ c n H n (B)<br />

(F.2.8)


Dodatek F: O HAUSDORFFOVI MERI 271<br />

O<strong>po</strong>mba. Prav zaradi lastnosti (2) je ugodno, da smo s krogel prešli na množice<br />

z omejenimi diametri. Trditev F.2.4 je eden izmed <strong>po</strong>membnih korakov pri dokazu<br />

osrednjega rezultata, krivočrtnega Fubinijevega izreka (izrek F.3.2) (<strong>po</strong>trebujemo jo, ko<br />

diferenciabilne preslikave aproksimiramo z linearnimi).<br />

Posledica F.2.5.<br />

množico A veljaH n( g(A) ) = c n H n (A).<br />

Če za <strong>po</strong>ljubna x, y velja d ′( g(x), g(y) ) = c d(x, y), tudi za <strong>po</strong>ljubno<br />

Posledica F.2.6. Naj bosta (M, d) in (M ′ , d ′ ) metrična prostora. Dani naj bosta merljivi<br />

preslikavi f : M ′ → [0,∞] in g: M→M ′ .<br />

(1) Če je g surjektivna in za <strong>po</strong>ljubna x, y velja d ′( g(x), g(y) ) ≤ c d(x, y), velja tudi:<br />

∫M ′ f (y)H n (dy)≤c n ∫<br />

M<br />

f ( g(x) ) H n (dx)<br />

(F.2.9)<br />

(2) Če za <strong>po</strong>ljubna x, y velja d ′( g(x), g(y) ) ≥ c d(x, y), velja tudi:<br />

∫<br />

f (y)H<br />

∫M n (dy)≥c n f ( g(x) ) H n (dx)<br />

′<br />

M<br />

(F.2.10)<br />

DOKAZ.<br />

(1): Naj bo najprej B⊆M ′ merljiva množica in f= 1 B , t. j. indikator množice B. Ker<br />

je g surjektivna, je g ( g −1 (B) ) = B. Iz (F.2.6) dobimo:<br />

∫M ′ f (y)H n (dy)=H n (B)=H n( g ( g −1 (B) )) ≤ c n H n( g −1 (B) ) = c n ∫<br />

M<br />

f ( g(x) ) H n (dx)<br />

(F.2.11)<br />

Iz linearnosti sledi, da neenakost (F.2.9) velja tudi za primer, ko je f stopničasta funkcija,<br />

iz izreka o monotoni konvergenci pa, da velja tudi za splošni primer.<br />

(2): Dokažemo tako kot točko (1), le da namesto neenakosti (F.2.6) u<strong>po</strong>rabimo neenakost<br />

(F.2.8).<br />

Pri Hausdorffovi meri moramo določiti dimenzijo, glede na katero merimo. Omenili<br />

pa smo že, da je za <strong>po</strong>samezno množico smiselno vzeti le eno dimenzijo. To sledi iz<br />

naslednje trditve, katere dokaz je prav tako prepuščen bralcu.<br />

Trditev F.2.7. Naj bo A <strong>po</strong>dmnožica metričnega prostora.<br />

(1) Če jeH n (A)n, jeH m (A)=0.<br />

(2) Če jeH n (A)>0 in m


272 F.2 DEFINICIJA IN OSNOVNE LASTNOSTI<br />

DEFINICIJA. Hausdorffova dimenzija dane <strong>po</strong>dmnožice A metričnega prostora je<br />

število:<br />

dim H (A) := inf{n≥0;H n (A)=0}=sup{n≥0;H n (A)=∞}<br />

(F.2.12)<br />

Mera, definirana v (F.2.1), ki je služila kot motivacija za Hausdorffovo mero, se <strong>po</strong><br />

izreku F.2.1 naR n ujema z zunanjo Lebesguovo mero. Hausdorffovo mero pa smo<br />

definirali nekoliko drugače in nastane vprašanje, ali je to še vedno <strong>po</strong>splošitev zunanje<br />

Lebesguove mere. Prehod na <strong>po</strong>kritje z majhnimi množicami ne predstavlja težav, saj<br />

velja naslednja močnejša različica izreka F.2.1 (za dokaz glej npr. Evans in Gariepy [56],<br />

razdelka 1.5 in 2.2).<br />

Izrek F.2.8. Za vsakδ>0 je zunanja Lebesguova mera vsake množice A⊆R n enaka:<br />

⎧ ⎫<br />

⎪⎨<br />

∞∑ ∞⋃<br />

L n (A)=inf⎪⎩ v ⎪⎬<br />

n r n i<br />

; A⊆ B(x i , r i ), (∀i)r i ≤δ<br />

(F.2.13) ⎪⎭<br />

i=1<br />

i=1<br />

Da lahko s krogel preidemo na množice z omejenimi diametri, pa sledi iz naslednjega<br />

geometrijskega dejstva.<br />

Izrek F.2.9 (izodiametrična neenakost). Za vsako množico A⊆R n velja:<br />

( ) diam A n<br />

L n (A)≤v n (F.2.14)<br />

2<br />

O<strong>po</strong>mba. Izrek <strong>po</strong>ve, da ima med vsemi množicami z danim diametrom krogla<br />

največji volumen. Rezultat je <strong>po</strong>sebej zanimiv zato, ker ni vsaka množica A⊆R d<br />

vsebovana v krogli s premerom, enakim diam A.<br />

IDEJADOKAZAIZREKA F.2.9. Izrek dokažemo z geometrijsko konstrukcijo, imenovano<br />

Steinerjeva simetrizacija, pri kateri merljivi množici A z diametromδpriredimo množico,<br />

ki ima enako zunanjo Lebesguovo mero kot A in je vsebovana v krogli s premeromδ<br />

(brez škode za splošnost lahko izrek dokažemo le za zaprte množice, ki so merljive).<br />

Za <strong>po</strong>drobnosti glej Evans in Gariepy [56].<br />

Posledica F.2.10. Za vsak A⊆R n veljaH n (A)=L n (A).<br />

DOKAZ. Vzemimo <strong>po</strong>ljubno <strong>po</strong>kritje množice A s števno mnogo kroglami, katerih<br />

premer ne presegaδ. To je tudi <strong>po</strong>kritje množice A z množicami, katerih diameter ne<br />

presegaδ. Ker se za tako <strong>po</strong>kritje vsoti iz (F.2.4) in (F.2.13) ujemata, <strong>po</strong> izreku F.2.8 velja<br />

H n δ (A)≤Ln (A). Ker to velja za vsakδ>0, je tudiH n (A)≤L n (A).<br />

Naj bo zdaj A⊆ ⋃ ∞<br />

i=1 A i , A i zaprte in diam A i ≤ 1. Po izreku F.2.9 velja:<br />

∞∑<br />

n∑ ( ) diam n<br />

L n (A)≤ L n Ai<br />

(A i )≤v n<br />

(F.2.15)<br />

2<br />

i=1<br />

Če vzamemo infimum <strong>po</strong> vseh <strong>po</strong>kritjih, dobimoL n (A)≤H n 1<br />

(A) (desna stran (F.2.4)<br />

ostane nespremenjena, če se omejimo le na zaprta <strong>po</strong>kritja). Torej je tudiL n (A)≤H n (A).<br />

i=1


Dodatek F: O HAUSDORFFOVI MERI 273<br />

F.3 Krivočrtni Fubinijev izrek<br />

Krivočrtni Fubinijev izrek je <strong>po</strong>splošitev tako Fubinijevega izreka (v okviru Hausdorffovih<br />

mer naR n ) kot tudi izreka o uvedbi nove spremenljivke v Riemannov integral,<br />

ki pravi, da <strong>po</strong>d določenimi <strong>po</strong>goji velja formula:<br />

∫<br />

f ( g(x) ) ∫<br />

Jg(x) dx= f (y)dy<br />

(F.3.1)<br />

A<br />

kjer je Jg absolutna vrednost Jacobijeve determinante ali krajše jacobiana:<br />

g(A)<br />

Jg(x) :=| det g ′ (x)|<br />

(F.3.2)<br />

Tu preslikava g slika izR n spet vR n , pri <strong>po</strong>splošitvi pa to ne bo nujno res: preslikava<br />

g bo v splošnem slikala izR n vR m , pri čemer pa tudi vR m ne bomo nujno gledali<br />

Lebesguove, temveč Hausdorffovo mero. Za ta namen bomo definirali r-dimenzionalno<br />

jacobiano, ki bo pripadala (0,∞) za vse linearne preslikave ranga r (oz. preslikave,<br />

katerih odvod v dani točki ima rang r).<br />

DEFINICIJA.<br />

(1) Naj bosta U in V evklidska prostora, A: U→Vlinearna preslikava in r∈N 0 .<br />

Definirajmo r-dimenzionalno jacobiano preslikave A na naslednji način:<br />

⎧<br />

0 ; rang Ar<br />

(F.3.3)<br />

⎪⎩ | det B| ; rang A=r, A=ΦBP<br />

kjer je P: U→R r je ortogonalna projekcija,Φ: R r → V pa izometrična vložitev.<br />

(2) Naj bo f : U→Vpreslikava, diferenciabilna v x. Tedaj definiramo r-dimenzionalno<br />

jacobiano preslikave f v x kar kot:<br />

J r f (x)=[[ f ′ (x)]] r<br />

(F.3.4)<br />

O<strong>po</strong>mba. Jacobiano bi lahko definirali tudi s <strong>po</strong>močjo singularnega razcepa matrike<br />

A (angl. singular value decom<strong>po</strong>sition ali krajše SVD), ki je take oblike kot v (F.3.3), le<br />

da za matriko B zahtevamo, da je diagonalna z nenegativnimi lastnimi vrednostmi (za<br />

<strong>po</strong>drobnosti glej npr. Demmel [48]).<br />

O<strong>po</strong>mba. Zgornja definicija je dobra. Z drugimi besedami, jacobiana je neodvisna<br />

od izbire preslikav P, B inΦ. Naj bo A=Φ 1 B 1 P 1 =Φ 2 B 2 P 2 . Ker je ker P 1 = ker A=<br />

ker P 2 , obstaja taka izometrija R: R r →R r , da je P 2 = RP 1 . Podobno, ker je imΦ 1 =<br />

im A=imΦ 2 , obstaja taka izometrija S: R r →R r , da jeΦ 2 =Φ 1 S. Torej v diagramu:<br />

R r B 1<br />

R<br />

r<br />

P 1 Φ 1<br />

U R S V<br />

(F.3.5)<br />

P 2 Φ 2<br />

R r R r B 2


274 F.3 KRIVOČRTNI FUBINIJEV IZREK<br />

komutirata levi in desni trikotnik, komutira pa tudi diagram, ki mu odstranimo puščici<br />

z R in S. Od tod pa že sledi, da komutira tudi osrednji kvadrat in z njim celoten<br />

diagram. Velja namreč:<br />

SB 2 R=Φ ∗ 1 Φ 1SB 2 RP 1 P ∗ 1 =Φ∗ 1 Φ 2B 2 P 2 P ∗ 1 =Φ∗ 1 AP∗ 1 =Φ∗ 1 Φ 1B 1 P 1 P ∗ 1 = B 1<br />

(F.3.6)<br />

Ker sta R in S izometriji, mora <strong>po</strong>tem veljati tudi| det B 1 |=| det B 2 |.<br />

Trditev F.3.1.<br />

(1) Velja [[A]] r ≤‖A‖ r , kjer je‖·‖ evklidska norma.<br />

(2) Če ima A rang 0 ali 1, velja [[A]] 1 =‖A‖.<br />

(3) Za vsak c∈Rvelja [[cA]] r =|c| r [[A]] r .<br />

(4) Velja [[A 1 A 2 ]] r ≤ [[A 1 ]] r [[A 2 ]] r .<br />

(5) Če je P ortogonalna projekcija, velja [[AP]] r = [[A]] r .<br />

(6) Če jeΦizometrična vložitev, velja [[ΦA]] r = [[A]] r .<br />

(7) Če A slika izR n vR m , velja [[A]] m = det(AA ∗ ) 1/2 in [[A]] n = det(A ∗ A) 1/2 .<br />

DOKAZ.<br />

(1): Naj bo A=ΦBP, kjer je P ortogonalna projekcija, B avtomorfizem,Φpa izometrična<br />

vložitev. Tedaj velja‖A‖=‖B‖, torej je tudi [[A]] r =| det B|≤‖B‖ r =‖A‖ r .<br />

(2): Za primer, ko je rang A=0, je trditev očitna. Naj bo rang A=1 in B tako kot v<br />

dokazu prejšnje točke. Toda B je sedaj linearna preslikavaR→R, se pravi preprosto<br />

množenje z določenim številom, torej je| det B|=‖B‖.<br />

(3): Če je A=ΦBP, je cA=Φ(cB)P, torej je [[cA]] r =| det(cB)|=|c| r | det B|=|c| r [[A]] r .<br />

(4): Brez škode za splošnost smemo privzeti, da je rang A 1 = rang A 2 = rang(A 1 A 2 )=<br />

r. Pišimo A 1 =Φ 1 B 1 P 1 in A 2 =Φ 2 B 2 P 2 . Ker ima preslikava A 1 A 2 =Φ 1 B 1 P 1 Φ 2 B 2 P 2<br />

rang r, to velja tudi za preslikavo C := B 1 P 1 Φ 2 B 2 , torej je ta preslikava avtomorfizem.<br />

Dobili smo torej razcep preslikave A 1 A 2 , se pravi, da je [[A 1 A 2 ]]=| det C|. Toda ker je<br />

‖P 1 Φ 2 ‖≤1, je| det C|≤| det B 1 ||det B 2 |.<br />

(5) in (6): Očitno.<br />

(7): Brez škode za splošnost lahko privzamemo, da ima preslikava A rang m oziroma<br />

n. Naj bo torej A=ΦBP, kjer je P ortogonalna projekcija,Φpa izometrična vložitev. Če<br />

računamo [[A]] m , velja:<br />

AA ∗ =ΦBPP ∗ B ∗ Φ ∗ =ΦBB ∗ Φ ∗<br />

(F.3.7)<br />

in ker jeΦ ∗ ortogonalna projekcija (v resnici staΦinΦ ∗ kar izometriji), velja:<br />

det(AA ∗ )=[[AA ∗ ]] m = det(BB ∗ )=(det B) 2 = [[A]] 2 m<br />

(F.3.8)


Dodatek F: O HAUSDORFFOVI MERI 275<br />

Podobno, če računamo [[A]] n , velja:<br />

A ∗ A=P ∗ B ∗ BΦ ∗ ΦBP=P ∗ B ∗ BP<br />

(F.3.9)<br />

in ker je P ∗ izometrična vložitev (v resnici sta P in P ∗ kar izometriji), od tod sledi:<br />

det(A ∗ A)=[[A ∗ A]] m = det(B ∗ B)=(det B) 2 = [[A]] 2 n<br />

(F.3.10)<br />

Zdaj lahko formuliramo glavni rezultat tega <strong>po</strong>glavja.<br />

Izrek F.3.2 (krivočrtni Fubinijev izrek). Naj bo A ⊆ R n merljiva množica, f :<br />

A → R integrabilna glede naL n , g: A → R m pa lokalno Lipschitzeva preslikava. Naj<br />

bo še r∈N 0 in r≤n. Tedaj za skoraj vsak y glede naH r velja, da je f ∣ ∣g integrabilna glede<br />

−1 (y)<br />

naH n−m , velja pa še formula:<br />

∫ ∫<br />

f (x) J r g(x) dx=<br />

f dH<br />

∫R n−r H r (dy) (F.3.11)<br />

m<br />

{x∈A;H n−r ( f −1 ({ f (x)}))>0}<br />

DOKAZ. Glej Federer [57], <strong>po</strong>sledica 3.2.32.<br />

g −1 ({y})<br />

O<strong>po</strong>mba. Integrand na levi je definiran za skoraj vsak x∈A, ker je <strong>po</strong> Rademacherjevem<br />

izreku (izrek E.5.3) funkcija g skoraj <strong>po</strong>vsod diferenciabilna.<br />

O<strong>po</strong>mba. Pogoj, da je:<br />

H n−r( f −1 ({ f (x)}) ) > 0<br />

(F.3.12)<br />

izključi množenje ničle z neštevno neskončnostjo, ki nastopa npr. v primeru, ko je<br />

m=n, r0 (t. j. g ′ (x) ima <strong>po</strong>ln rang), namreč (F.3.12)<br />

sledi iz izreka o implicitni funkciji.


276 F.3 KRIVOČRTNI FUBINIJEV IZREK<br />

ZGLED F.3.1. Površina sfere. Izračunajmo:<br />

s n :=H n−1 (S n−1 )<br />

(F.3.15)<br />

kjer je S n−1 :={x∈R n ;|x|=1} enotska sfera. To bomo izračunali s <strong>po</strong>močjo volumna<br />

v n enotske krogle B n :={x∈R n ;|x|≤1} (glej F.2.2). Definirajmo preslikavo g: B n →R<br />

<strong>po</strong> predpisu:<br />

g(x) :=|x|<br />

(F.3.16)<br />

Očitno je g ′ (x)=x T /|x|. Po točki (2) trditve F.3.1 je <strong>po</strong>tem J 1 g(x)=1, brž ko je x0.<br />

Formula (F.3.11) za f (x) := 1, nam da:<br />

v n =L n (B n )=L n( B n \{0} ) =<br />

∫ 1<br />

0<br />

H n−1( g −1 ({y}) ) dy<br />

(F.3.17)<br />

Po <strong>po</strong>sledici F.2.5 veljaH n−1( g −1 ({y}) ) =H n−1 (y S n−1 )= y n−1 s n . Po integraciji dobimo:<br />

s n = n v n = 2 πn/2<br />

Γ ( ) (F.3.18)<br />

n<br />

2<br />

ZGLED F.3.2. Naj bo B⊆R n merljiva množica in naj bo dana preslikava g: B→R m .<br />

V formulo (F.3.11) vstavimo f (x)=1 in:<br />

A := { x∈B; g ni diferenciabilna v x ali J r g(x)=0 }<br />

(F.3.19)<br />

□<br />

Po Rademacherjevem izreku je leva stran v (F.3.11) enaka nič. Od tod dobimo:<br />

∫<br />

R m H n−r( A∩ g −1 ({y}) ) H r (dy)=0<br />

(F.3.20)<br />

od koder sledi tudi:<br />

H r{ y∈R m ;H n−r( A∩ g −1 ({y}) ) > 0 } = 0<br />

(F.3.21)<br />

To je nekakšna šibka različica Morse–Sardovega izreka, ki pravi, da za vsako preslikavo<br />

g∈C (n−m+1) (B;R m ), kjer je B⊆R n odprta množica in m≤n, velja:<br />

L m{ y∈R m ; (∃x∈B) [ g(x)= y in J m g(x)=0 ]} = 0<br />

(F.3.22)<br />

(glej npr. Sternberg [127], stran 47). Formula (F.3.21) je sicer res šibkejši rezultat od<br />

(F.3.22), zato pa velja ob šibkejših pred<strong>po</strong>stavkah. □


Dodatek G<br />

O konveksnih množicah<br />

Namen tega dodatka je izpeljati nekaj osnovnih dejstev o konveksnih množicah v<br />

R n , ki jih bomo <strong>po</strong>trebovali v naslednjem dodatku.<br />

G.1 Definicija in osnovne lastnosti<br />

DEFINICIJA. Naj bo A <strong>po</strong>dmnožica realnega vektorskega prostora.<br />

(1) Množica A je afin <strong>po</strong>dprostor, če za <strong>po</strong>ljubna x, y∈A in <strong>po</strong>ljuben t∈R velja<br />

(1−t)x+ty∈A.<br />

(2) Množica A je konveksna, če za <strong>po</strong>ljubna x, y∈A in <strong>po</strong>ljuben t∈[0, 1] velja<br />

(1−t)x+ty∈A.<br />

V nadaljevanju se bomo omejili le na prostoreR n .<br />

ZGLED G.1.1. Poljuben afin <strong>po</strong>dprostor je konveksna množica.<br />

□<br />

ZGLED G.1.2. Polprostor je konveksna množica, ni pa afin <strong>po</strong>dprostor. Polprostori<br />

vR n bodo za nas množice oblike{x ;〈x, u〉


278 G.1 DEFINICIJA IN OSNOVNE LASTNOSTI<br />

DEFINICIJA. Naj bodo x 0 ,...x m točke (vektorji),α 0 ,...α m pa skalarji. Izraz:<br />

m∑<br />

α i x i<br />

i=0<br />

(G.1.1)<br />

je afina kombinacija točk x 0 ,...x m , če je ∑ m<br />

i=0α i = 1. Afina kombinacija točk je konveksna<br />

kombinacija, če je šeα i ≥ 0 za vse i.<br />

Dokaz naslednje trditve prepuščamo bralcu.<br />

Trditev G.1.2.<br />

(1) Množica A je afin <strong>po</strong>dprostor (konveksna) natanko tedaj, ko vsaka afina (konveksna)<br />

kombinacija <strong>po</strong>ljubnih točk iz A tudi pripada A.<br />

(2) Afina (konveksna) ogrinjača množice A je množica vseh afinih (konveksnih) kombinacij<br />

končno mnogo točk iz A.<br />

DEFINICIJA.<br />

(1) Točke x 0 ,...x m so afino neodvisne, če se <strong>po</strong>ljubna točka iz njihove afine ogrinjače<br />

da izraziti kot njihova afina kombinacija na en sam način. Če je x= ∑ m<br />

i=0α i x i<br />

taka afina kombinacija, skalarjemα 0 ...α m pravimo baricentrične koordinate točke<br />

x glede na x 1 ...x m .<br />

(2) Simpleks je konveksna ogrinjača afino neodvisnih točk.<br />

O<strong>po</strong>mba. Afini <strong>po</strong>dprostori in simpleksi so zaprte množice. To pa ne velja za vse<br />

konveksne množice.<br />

Tudi dokaz naslednje trditve je prepuščen bralcu.<br />

Trditev G.1.3. Če za x=(ξ 1 ,...ξ n )∈R n označimo ˜x := (1,ξ 1 ,...ξ n )∈R n+1 , velja:<br />

(1) Izraz x= ∑ m<br />

i=0α i x i je afina kombinacija točk x i natanko tedaj, ko je ˜x= ∑ m<br />

i=0 ˜x i.<br />

(2) Množica A⊆R n je afin <strong>po</strong>dprostor natanko tedaj, ko je množica:<br />

{<br />

(ξ,ξ1 ,...ξ n ) ;ξ∈R, (ξ 1 ,...ξ n )∈A } ⊆R n+1 (G.1.2)<br />

linearni <strong>po</strong>dprostor.<br />

(3) Točke x 0 ,...x m so afino neodvisne natanko tedaj, ko so vektorji ˜x 0 ,... ˜x m linearno<br />

neodvisni.


Dodatek G: O KONVEKSNIH MNOŽICAH 279<br />

Posledica G.1.4.<br />

(1) Vsak afin <strong>po</strong>dprostor prostoraR n je afina ogrinjača največ n+1 točk.<br />

(2) Afina ogrinjača <strong>po</strong>ljubnih n+1 afino neodvisnih točk izR n je cel prostorR n .<br />

Trditev G.1.5.<br />

(1) Množica vseh (n+1)-teric (x 0 ,...x n )∈(R n ) n+1 , ki so afino neodvisne, je odprta.<br />

(2) Preslikava, ki (n+2)-terici (x, x 0 ,...x n )∈(R n ) n+2 priredi baricentrične koordinate<br />

točke x glede na (x 0 ,...x n ), je zvezna.<br />

DOKAZ. Rezultat sledi iz trditve G.1.3 in zveznosti preslikave (A, x)↦→ A −1 x.<br />

DEFINICIJA. Dimenzija konveksne množice C je maksimalno število afino neodvisnih<br />

točk iz C, zmanjšano za ena.<br />

O<strong>po</strong>mba. Definicijo bi sicer lahko <strong>po</strong>splošili na <strong>po</strong>ljubne <strong>po</strong>dmnožice prostoraR n ,<br />

vendar pa ne bi dobili tega, kar navadno razumemo s <strong>po</strong>jmom dimenzija.<br />

Brez težav dokažemo naslednjo trditev.<br />

Trditev G.1.6.<br />

(1) Dimenzija afinega <strong>po</strong>dprostora L je enaka za ena zmanjšanemu minimalnemu številu<br />

točk iz L, katerih afina ogrinjača je cel L.<br />

(2) Dimenzija konveksne množice se ujema z dimenzijo njene afine ogrinjače.<br />

G.2 Notranjost in rob konveksne množice<br />

Pri notranjosti in robu konveksne množice vR n ločimo dve vrsti notranjosti in<br />

roba: glede na cel prostorR n in glede na afino ogrinjačo množice. Notranjost množice<br />

C glede na cel prostor bomo označevali z Int C, glede na afino ogrinjačo pa z int C.<br />

Podobno bomo njen rob (mejo) glede na cel prostor označevali s Fr C, glede na njeno<br />

afino ogrinjačo pa z∂C. Zaprtje C množice C pa je v obeh primerih enako, saj je afin<br />

<strong>po</strong>dprostor zaprta množica.


280 G.2 NOTRANJOST IN ROB KONVEKSNE MNOŽICE<br />

Trditev G.2.1.<br />

(1) Notranjost konveksne množice (tako glede na njeno afino ogrinjačo kot tudi glede na<br />

cel prostor) je konveksna množica. Še več, če je C konveksna množica, x∈C, y∈Int C<br />

(int C) in 00, da za<br />

vsak u z|u|0 obstaja tak w z|w|


Dodatek G: O KONVEKSNIH MNOŽICAH 281<br />

DOKAZ.<br />

(G.2.2): Dovolj je dokazati, da je Int C ⊆ C. Naj bo x ∈ Int C. Obstaja tak n-<br />

dimenzionalen simpleks∆ = Conv{x 0 ,...x n }, da je x ∈ Int∆ ⊂ ∆ ⊆ C. Ker točke<br />

x 0 ,...x n pripadajo C, obstajajo taka za<strong>po</strong>redja točk x ij ∈ C, da za vsak i = 0,...n<br />

velja lim j→∞ x ij = x i . Iz točke (1) trditve G.1.5 sledi, da za dovolj velike j velja, da so<br />

točke x ij ; i=0,...n afino neodvisne, torej ima x glede na njih baricentrične koordinate.<br />

Natančneje, za dovolj velike j obstajajo taki skalarjiα ij , da je x= ∑ n<br />

i=0α ij x ij in ∑ n<br />

i=0α ij = 1.<br />

Po točki (2) za vsak i velja lim j→∞ α ij =α i , kjer so (α 0 ,...α n ) baricentrične koordinate<br />

točke x glede na (x 0 ,...x n ). Toda ker je x∈Int∆, jeα i > 0 za vse i, torej za vse i in vse<br />

dovolj velike j velja tudiα ij ≥ 0. To pa <strong>po</strong>meni, da je x konveksna kombinacija točk<br />

x ij ∈ C, se pravi, da mora biti tudi x∈C. Enakost je s tem dokazana.<br />

(G.2.3): Sledi iz (G.2.2).<br />

(G.2.2): Spet je dovolj dokazati, da je C⊆Int C. Naj bo torej x∈C. Dokazati<br />

moramo, da za vsakε>0 obstaja tak y∈Int C, da je|x− y|


•<br />

282 G.3 OPORNI POLPROSTORI IN PRAVOKOTNA PROJEKCIJA<br />

Π<br />

C<br />

x<br />

Slika G.3.1<br />

Zgornja definicija je bolj geometrijska, naslednja tudi precej očitna trditev pa nam<br />

da računsko karakterizacijo.<br />

Trditev G.3.1. Naj bo C⊆R n konveksna množica in naj bo dan <strong>po</strong>lprostorΠ={y ;<br />

〈y, u〉≤a}, kjer je u0.<br />

(1) PolprostorΠje o<strong>po</strong>rni <strong>po</strong>lprostor množice C natanko tedaj, ko je sup y∈C<br />

〈y, u〉=a.<br />

(2) PolprostorΠje o<strong>po</strong>rni <strong>po</strong>lprostor množice C v točki x∈Fr C natanko tedaj, ko je<br />

〈y, u〉≤a za vsak y∈Cin še〈x, u〉=a.<br />

Na komplementu notranjosti konveksne množice lahko dobro definiramo pravokotno<br />

projekcijo. Da lahko to res storimo, sledi iz naslednjih nekaj <strong>po</strong>možnih rezultatov.<br />

Lema G.3.2. Naj bo C⊂R d <strong>po</strong>ljubna množica, xCin y∈C točka, ki je najbližje x.<br />

(1) Velja y∈Fr C.<br />

(2) Če označimo:<br />

za vsak t∈[0, 1] velja:<br />

δ := dist(x, C) := inf<br />

z∈C |x−z|<br />

dist ( (1−t)y+tx, C ) = tδ<br />

(G.3.1)<br />

(G.3.2)<br />

O<strong>po</strong>mbi.<br />

(1) Točka y∈C, ki je najbližje x, vedno obstaja.<br />

(2) Velja dist(x, C)=dist(x, C).<br />

DOKAZLEME G.3.2.<br />

(2): Označimo z := (1−t)y+tx. Očitno je|z− y|=tδ, torej je dist(z, C)≤tδ. Toda<br />

če bi obstajala kaka točka w∈C, ki bi bila točki z še bližje kot tδ, bi bila ta točka <strong>po</strong><br />

trikotniški neenakosti tudi točki x bližje kotδ, to pa ni res. Zato mora biti dist(z, C)=tδ.<br />

(1): Sledi iz dejstva, da <strong>po</strong> (G.3.2) za vsakε>0 obstaja taka točka z, da je 0


•<br />

•<br />

•<br />

•<br />

Dodatek G: O KONVEKSNIH MNOŽICAH 283<br />

Lema G.3.3. Naj bo C⊆R n konveksna množica in x∈R n .<br />

(1) Obstaja natanko ena točka y∈C, ki je najbližje x.<br />

(2) Za vsak z∈Cje〈x− y, z− y〉≤0.<br />

(3) Če je xC, je <strong>po</strong>lprostor{z ;〈x− y, z− y〉≤0} o<strong>po</strong>rni <strong>po</strong>lprostor množice C v točki<br />

y.<br />

DOKAZ. Naj bo y∈C kaka točka, ki je najbližje x.<br />

(2) in (3): Za <strong>po</strong>ljuben t∈[0, 1] označimoζ(t) := (1−t)y+tz.<br />

x<br />

C<br />

z<br />

ζ(t)<br />

y<br />

Slika G.3.2<br />

Ker je C konveksna, jeζ(t)∈Cza vsak t∈[0, 1]. Velja:<br />

|x−ζ(t)| 2 = ∣ ∣ ∣x− y−t(z− y)<br />

∣ ∣∣ 2<br />

=|x− y| 2 − 2t〈x− y, z− y〉+t 2 |z− y| 2<br />

(G.3.3)<br />

Če bi veljalo〈x− y, z− y〉>0, bi za dovolj majhne t veljalo|x−ζ(t)| 2


•<br />

•<br />

•<br />

•<br />

284 G.3 OPORNI POLPROSTORI IN PRAVOKOTNA PROJEKCIJA<br />

Trditev G.3.4. Vsaka zaprta konveksna <strong>po</strong>dmnožica je presek zaprtih <strong>po</strong>lprostorov.<br />

DOKAZ. Naj bo C zaprta konveksna množica in D presek vseh njenih o<strong>po</strong>rnih <strong>po</strong>lprostorov.<br />

Očitno je C⊆D. Naj bo xC. Po točki (3) leme G.3.3 je <strong>po</strong>lprostor<br />

{z ;〈x−p C (x), z−p C (x)〉≤0} o<strong>po</strong>rni <strong>po</strong>lprostor množice C. Temu <strong>po</strong>lprostoru pa x ne<br />

pripada, torej je tudi xD. Iz vsega tega pa sledi, da mora biti tudi C⊇D.<br />

Trditev G.3.5. Pravokotna projekcija na konveksno množico je neraztezna, t. j. za <strong>po</strong>ljubna<br />

x, y∈R n velja|p C (x)−p C (y)|≤|x− y|.<br />

DOKAZ. Brez škode za splošnost smemo privzeti, da je p C (x)p C (y). Po točki (2)<br />

leme G.3.3 velja〈x−p C (x), p C (y)−p C (x)〉≤0in〈y−p C (y), p C (x)−p C (y)〉≤0:<br />

x<br />

p C (x)<br />

y<br />

Slika G.3.3<br />

p C (y)<br />

Iz Cauchy–Schwarzeve neenačbe in zgoraj opaženega sklepamo:<br />

|x− y|≥ 〈x− y, p C(x)−p C (y)〉<br />

|p C (x)−p C (y)|<br />

=<br />

=|p C (x)−p C (y)|+ 〈x−p C(x), p C (x)−p C (y)〉+〈p C (y)− y, p C (x)−p C (y)〉<br />

|p C (x)−p C (y)|<br />

≥|p C (x)−p C (y)|<br />

≥<br />

(G.3.5)<br />

Izrek G.3.6. V vsaki robni točki konveksne množice vR n obstaja o<strong>po</strong>rni <strong>po</strong>lprostor.<br />

DOKAZ. Naj bo C⊆R n konveksna množica in x∈Fr C. Po (G.2.3) lahko brez škode<br />

za splošnost privzamemo, da je množica C zaprta. Ker je x∈Fr C, obstaja za<strong>po</strong>redje<br />

točk x i C, ki konvergira proti x. Označimo y i := p C (x i ). Ker je x i C, je y i x i , torej<br />

lahko definiramo še:<br />

u i := x i−y i<br />

(G.3.6)<br />

|x i − y i |<br />

Vektorji u i pripadajo enotski sferi, ki je kompakten prostor, zato obstaja konvergentno<br />

<strong>po</strong>dza<strong>po</strong>redje u ij z limito u. Nadalje <strong>po</strong> točki (2) trditve G.3.3 za vsak z∈C velja<br />

〈z− y ij , u ij 〉≤0.<br />

Ker je projekcija p C <strong>po</strong> trditvi G.3.5 neraztezna in zato zvezna, za<strong>po</strong>redje y i konvergira<br />

proti p C (x)=x. Torej mora za vsak z∈C veljati tudi〈z−x, u〉≤0. Od tod pa <strong>po</strong><br />

točki (2) trditve G.3.1 že sledi, da je{z ;〈z−x, u〉≤0} iskani o<strong>po</strong>rni <strong>po</strong>lprostor.


•<br />

•<br />

•<br />

Dodatek G: O KONVEKSNIH MNOŽICAH 285<br />

Trditev G.3.7. Naj bo C konveksna množica, x∈Fr C in u zunanji normalni vektor<br />

o<strong>po</strong>rnega <strong>po</strong>lprostora. Tedaj za vsak t≥0velja p C (x+tu)=x.<br />

DOKAZ. Dokazati moramo, da za vsako točko y∈Cvelja|x+tu− y|≤t|u|.<br />

x+tu<br />

C<br />

y<br />

u<br />

x<br />

Slika G.3.4<br />

Iz točke (2) leme G.3.3 sledi:<br />

|x+tu− y| 2 = t 2 |u| 2 + 2t〈u, x− y〉+|x− y| 2 ≥ t 2 |u| 2<br />

(G.3.7)<br />

Posledica G.3.8. Naj bosta C ⊆ D ⊆ R d omejeni konveksni množici. Tedaj velja<br />

p C (Fr D)=Fr C.<br />

DOKAZ. Ker je Fr D⊆R n \ Int D⊆R d \ Int C, je p C (Fr D)⊆Fr C. Preostane nam le<br />

še dokazati, da za vsak y∈Fr C obstaja tak x∈Fr D, da je p C (x)= y. Naj bo u zunanji<br />

normalni vektor kakega o<strong>po</strong>rnega <strong>po</strong>lprostora, ki vsebuje točko y. Ker je množica D<br />

omejena, je tudi t 0 := sup{t≥0; y+tu∈C}0;r x } {<br />

|x| ∈ C = inf r>0;r x }<br />

|x| C (G.4.1)<br />

(2) S <strong>po</strong>jmom radialna projekcija bomo razumeli preslikavo g C : {x ;ρ C (x)


•<br />

•<br />

•<br />

286 G.4 RADIALNA PROJEKCIJA<br />

C<br />

x<br />

g C (x)<br />

O<br />

Slika G.4.1<br />

O<strong>po</strong>mbe.<br />

(1) Za vsak x∈R n \{0} velja g C (x)∈Fr C.<br />

(2) Če je x∈Fr C, jeρ C (x)=|x| in g C (x)=x.<br />

(3) Za vsak x∈R n \{0} in vsakα>0veljaρ C (αx)=ρ C (x) in g C (αx)= g C (x).<br />

( )<br />

(4) Če je x∈Fr C, je g −1<br />

C {x} ={αx ;α>0}.<br />

(5) Če je C⊆D, je tudiρ C ≤ρ D .<br />

ZGLED G.4.1. Dan naj bo <strong>po</strong>lprostor:<br />

Π :={x∈R n ;〈x, u〉≤a}<br />

kjer je u0 in a>0. Tedaj ni težko preveriti, da velja:<br />

⎧<br />

a|x|<br />

⎪⎨ ;〈x, u〉>0<br />

ρ Π (x)= 〈x, u〉<br />

⎪⎩ ∞ ; sicer<br />

(G.4.3)<br />

(G.4.4)<br />

Trditev G.4.1. Naj bo C konveksna množica, ki vsebuje odprto kroglo okoli izhodišča z<br />

radijem r 0 > 0. Nadalje naj bo x∈Fr C in naj bo u normalni vektor o<strong>po</strong>rnega <strong>po</strong>lprostora<br />

množice C. Če sθoznačimo kot med vektorjema x in u, velja cosθ≥r 0 /|x|.<br />


•<br />

•<br />

•<br />

Dodatek G: O KONVEKSNIH MNOŽICAH 287<br />

Π<br />

u<br />

r 0 θ θ<br />

O<br />

x<br />

C<br />

Slika G.4.2<br />

DOKAZ. Po točki (2) trditve G.3.1 lahko o<strong>po</strong>rni <strong>po</strong>lprostor zapišemo v oblikiΠ=<br />

{y ;〈y, u〉≤〈x, u〉}. Brez škode za splošnost lahko privzamemo, da je|u|=1. Tedaj je<br />

gotovo r 0 u∈C⊆Π, torej je r 0 =〈r 0 u, u〉≤〈x, u〉. Od tod pa že sledi naš rezultat.<br />

Lema G.4.2. Naj bo C konveksna množica, ki vsebuje odprto kroglo okoli izhodišča z<br />

radijem r 0 > 0. Dana naj bo še točka x∈C\{0}.<br />

(1) Če je|x|≤ρ C (x) in|y|≤r 0<br />

(<br />

1−<br />

|x|<br />

ρ C (x))<br />

, velja x+ y∈C. V primeru, ko jeρC (x)=∞,<br />

za vsak y z|y|≤r 0 velja x+ y∈C.<br />

(2) Če je|x|


•<br />

•<br />

•<br />

•<br />

288 G.4 RADIALNA PROJEKCIJA<br />

r 0<br />

O<br />

z<br />

x<br />

x+ y<br />

w<br />

C<br />

••<br />

g C (x)<br />

Slika G.4.4<br />

Ker je|z|≤r 0 , je z∈C. Ker w leži na istem <strong>po</strong>ltraku kot x in je|w|≤ρ C (x), je tudi<br />

w∈C. Ker je C konveksna, je tudi:<br />

x+ y= |x|<br />

r w+ (<br />

1− |x|<br />

r<br />

)<br />

z∈C<br />

(G.4.6)<br />

Če jeρ C (x)ρ C (x). Tedaj je tudi:<br />

∣ ρ C(x) x<br />

(<br />

|x| ∣ =ρ C(x)


•<br />

•<br />

•<br />

Dodatek G: O KONVEKSNIH MNOŽICAH 289<br />

z<br />

r 0<br />

O<br />

C<br />

g C (x)<br />

w<br />

•• •<br />

x<br />

x+ y<br />

Slika G.4.5<br />

Očitno je z∈C. Ker je w konveksna kombinacija točk x+ y in z, je tudi w∈C. Toda<br />

w leži na istem <strong>po</strong>ltraku kot x in velja:<br />

|w|><br />

r 0<br />

r 0 + r 0<br />

( |x|<br />

ρ C (x) − 1)|x|=ρ C(x)=ρ C<br />

(x)<br />

(G.4.10)<br />

To pa bi <strong>po</strong>menilo, da je wC, kar je protislovje.<br />

Trditev G.4.4.<br />

(1) Množica točk, kjer je radialna funkcija končna, je odprta.<br />

(2) Radialna funkcija je lokalno Lipschitzeva <strong>po</strong>vsod tam, kjer je končna.<br />

Iz Rademacherjevega izreka (izrek E.5.3) dobimo še naslednji rezultat.<br />

Posledica G.4.5. Radialna funkcija je odvedljiva skoraj <strong>po</strong>vsod tam, kjer je končna, pri<br />

čemer je skoraj <strong>po</strong>vsod mišljeno glede na Lebesguovo mero.<br />

DOKAZTRDITVE G.4.4. Naj bo x, y∈R n \{0}. Tedaj zagotovo velja:<br />

g C (x+ y)=ρ C (x+ y) x+ y<br />

|x+ y|<br />

∈ Fr C=C\Int C<br />

(G.4.11)<br />

Iz dejstva, da je g C (x+ y)Int C, in točke (2) leme G.4.2 sledi, da velja ena izmed<br />

naslednjih neenakosti:<br />

|x|<br />

ρ C (x+ y)<br />

|x+ y| ≥ρ C(x)<br />

(<br />

|y|<br />

ρ C (x+ y)<br />

|x+ y| ≥ r 0<br />

1− ρ C(x+ y)<br />

ρ C (x)<br />

)<br />

|x|<br />

|x+ y|<br />

(G.4.12)<br />

(G.4.13)<br />

Če velja (G.4.12), velja:<br />

ρ C (x+ y)≥ρ C (x)<br />

|x+ y|<br />

|x|<br />

(<br />

≥ρ C (x) 1− |y| )<br />

|x|<br />

(G.4.14)


290 G.4 RADIALNA PROJEKCIJA<br />

oziroma:<br />

ρ C (x+ y)−ρ C (x)≥−ρ C (x) |y|<br />

|x|<br />

Če velja (G.4.13), pa z razrešitvijo neenačbe naρ C (x+ y) dobimo:<br />

Sledi:<br />

ρ C (x+ y)≥ r 0ρ C (x)|x+ y|<br />

r 0 |x|+ρ C (x)|y|<br />

ρ C (x+ y)−ρ C (x)≥ r 0ρ C (x)|x+ y|−ρ C (x) 2 |y|−r 0 ρ C (x)|x|<br />

r 0 |x|+ρ C (x)|y|<br />

Z u<strong>po</strong>števanjem neenakosti|x+ y|≥|x|−|y| <strong>po</strong> nekaj računanja dobimo:<br />

ρ C (x+ y)−ρ C (x)≥− ρ C(x)+r 0<br />

r 0 |x|+ρ C (x)|y| ρ C(x)|y|<br />

(G.4.15)<br />

(G.4.16)<br />

(G.4.17)<br />

(G.4.18)<br />

od koder sledi tudi:<br />

ρ C (x+ y)−ρ C (x)≥− ρ C(x)+r 0<br />

r 0 |x|<br />

ρ C (x)|x|<br />

(G.4.19)<br />

Ker jeρ C (x)≥r 0 , pa ta neenakost sledi tudi iz (G.4.15), torej (G.4.19) zagotovo velja.<br />

Iz dejstva, da je g C (x+ y)∈C, in točke (1) leme G.4.2 pa sledi, da velja ena izmed<br />

naslednjih neenakosti:<br />

|x|<br />

ρ C (x+ y)<br />

|x+ y| ≤ρ C(x)<br />

(<br />

|y|<br />

ρ C (x+ y)<br />

|x+ y| ≥ r ρC (x+ y)<br />

0<br />

ρ C (x)<br />

)<br />

|x|<br />

|x+ y| − 1<br />

(G.4.20)<br />

(G.4.21)<br />

Če velja (G.4.20), velja:<br />

ρ C (x+ y)≤ρ C (x)<br />

|x+ y|<br />

|x|<br />

(<br />

≤ρ C (x) 1+ |y| )<br />

|x|<br />

(G.4.22)<br />

oziroma:<br />

Če velja (G.4.21), pa velja:<br />

ρ C (x+ y)<br />

ρ C (x+ y)−ρ C (x)≤ρ C (x) |y|<br />

|x|<br />

(<br />

r 0<br />

ρ C (x)<br />

|x|<br />

|x+ y| − |y| )<br />

≤ r 0<br />

|x+ y|<br />

(G.4.23)<br />

(G.4.24)<br />

Privzemimo sedaj, da je:<br />

|y|< r 0<br />

ρ C (x) |x|<br />

(G.4.25)


Dodatek G: O KONVEKSNIH MNOŽICAH 291<br />

Tedaj velja:<br />

Sledi:<br />

ρ C (x+ y)≤ r 0ρ C (x)|x+ y|<br />

r 0 |x|−ρ C (x)|y|<br />

ρ C (x+ y)−ρ C (x)≤ r 0ρ C (x)|x+ y|+ρ C (x) 2 |y|−r 0 ρ C (x)|x|<br />

r 0 |x|−ρ C (x)|y|<br />

Z u<strong>po</strong>števanjem neenakosti|x+ y|≤|x|+|y| spet <strong>po</strong> nekaj računanja dobimo:<br />

(G.4.26)<br />

(G.4.27)<br />

ρ C (x+ y)−ρ C (x)≤<br />

ρ C (x)+r 0<br />

r 0 |x|−ρ C (x)|y| ρ C(x)|y|<br />

(G.4.28)<br />

Spet ker jeρ C (x)≥r 0 , ta neenakost sledi tudi iz (G.4.23), torej (G.4.19) zagotovo velja,<br />

če je le iz<strong>po</strong>lnjen <strong>po</strong>goj (G.4.25). Naš rezultat zdaj sledi iz (G.4.19) in (G.4.28).<br />

Trditev G.4.6. Naj bosta C⊆D⊆R n konveksni množici, x∈Fr C∩Fr D ter naj bosta<br />

radialni funkcijiρ C inρ D obe odvedljivi v x. Tedaj veljaρ ′ C (x)=ρ D(x).<br />

DOKAZ. Ker je x∈Fr C∩Fr D, jeρ C (x)=ρ D (x). Ker je C⊆D, za vsak y∈R n \{0}<br />

veljaρ C (y)≤ρ D (y). Ne<strong>po</strong>sredno iz definicije smernega odvoda sledi, da <strong>po</strong>tem za vsak<br />

u∈R n veljaρ ′ C (x)u≤ρ′ D (x)u. Potem pa mora biti resρ′ C (x)=ρ′ D (x).<br />

Trditev G.4.7. Naj bo C⊆R n konveksna množica, 0∈Int C in x∈R n \{0}. Če je radialna<br />

funkcija diferenciabilna v x, v točki g C (x) obstaja natanko en o<strong>po</strong>rni <strong>po</strong>lprostor.<br />

DOKAZ. Po izreku G.3.6 obstaja v g C (x) vsaj en o<strong>po</strong>rni <strong>po</strong>lprostor. Po točki (2) trditve<br />

G.3.1 ga lahko zapišemo v oblikiΠ :={y∈R n ;〈y, u〉≤〈g C (x), u〉}, kjer je|u|=1.<br />

Dokazati moramo le še, da je lahko vektor u le en sam. Iz trditve G.4.6 ter zvez (G.4.2)<br />

in (G.4.4) dobimo:<br />

gradρ C (x)=gradρ Π (x)=a<br />

〈x, u〉x−〈x, x〉u<br />

|x|〈x, u〉 2<br />

( x<br />

=ρ C (x)<br />

u )<br />

|x| 2− 〈x, u〉<br />

(G.4.29)<br />

(ker je 0∈Int C, <strong>po</strong> trditvi G.4.1 velja〈x, u〉>0). Od tod najprej sledi, da mora biti u<br />

kolinearen z gradρ C (x)−ρ C (x) x/|x| 2 . Ker je vektor u enotski in〈x, u〉>0, je <strong>po</strong>tem res<br />

lahko le en sam.<br />

Posledica G.4.8. Če je C⊆R n konveksna množica z neprazno notranjostjo, v skoraj vsaki<br />

točki x∈Fr C glede na Hausdorffovo meroH n−1 obstaja natanko en o<strong>po</strong>rni <strong>po</strong>lprostor.<br />

DOKAZ. Brez škode za splošnost lahko privzamemo, da je 0∈Int C. Naj bo y∈Fr C<br />

točka, v kateri obstaja več kot en o<strong>po</strong>rni <strong>po</strong>lprostor. Iz trditve G.4.7 sledi, da <strong>po</strong>temρ C<br />

ni odvedljiva v nobeni točki oblike x, za katero je g C (x)= y. Po (G.4.2) v teh točkah tudi<br />

preslikava g C ni odvedljiva. Ker je{x ; g C (x)= y}={αy ;α>0}, to <strong>po</strong>meni tudi, da je:<br />

H 1({ x∈R n \{0} ; g C (x)= y in g C ni odvedljiva v x }) =∞<br />

(G.4.30)<br />

Po formuli (F.3.21) pa je (n−1)-dimenzionalna Hausdorffova mera množice točk y, za<br />

katere velja (G.4.30), enaka nič.


292 G.4 RADIALNA PROJEKCIJA


Dodatek H<br />

Gaussovi perimetri konveksnih množic<br />

H.1 Formulacija in zgodovina problema<br />

Pri večrazsežni normalni aproksimaciji, natančneje, ocenjevanju količin tipa:<br />

∣<br />

∣P[W∈ C]−N(0, I d )(C) ∣ ∣<br />

(H.1.1)<br />

kjer je C⊆R d merljiva množica (glej razdelek 4.3), je treba oceniti količine:<br />

1<br />

ε N(0, I d){C ε \ C},<br />

in sicer enakomerno <strong>po</strong>ε. Tu zaε>0 definiramo:<br />

1<br />

ε N(0, I d){C\C −ε }<br />

C ε := { x∈R d ; dist(x, C)≤ε } , C −ε := { x∈R d ; dist(x,R d \ C)≥ε }<br />

(H.1.2)<br />

(H.1.3)<br />

kjer dist <strong>po</strong>meni oddaljenost točke od množice, t. j.:<br />

dist(x, A) := inf|x− y|<br />

(H.1.4)<br />

y∈A<br />

V splošnem sta lahko količini v (H.1.2) enaki 1/ε, brž ko jeε>0 (to se npr. zgodi, če<br />

je množica C <strong>po</strong>vsod gosta, npr. množica vseh točk z racionalnimi koordinatami). A<br />

za take množice normalna <strong>aproksimacija</strong> sploh ni smiselna, zato se je treba omejiti na<br />

kakšen manjši razred bolj “krotkih” množic, ki pa mora biti zaprt za afine transformacije<br />

in preslikave C↦→ C ε .<br />

Eden takih razredov so tudi konveksne množice. Velja namreč naslednja trditev, ki<br />

jo bomo dokazali na koncu razdelka.<br />

Trditev H.1.1. Za vsako konveksno množico C⊆R d in vsakε>0 sta tudi množici C ε in<br />

C −ε konveksni.<br />

Označimo:<br />

1<br />

γ d := sup{<br />

ε N(0, I d){C ε \ C}, 1 }<br />

ε N(0, I d){C\C −ε } ; C⊆R d konveksna množica,ε>0<br />

293<br />

(H.1.5)


294 H.1 FORMULACIJA IN ZGODOVINA PROBLEMA<br />

Količinamγ d pravimo Gaussovi perimetri (glej naslednji razdelek).<br />

Prvo vprašanje, ki se <strong>po</strong>rodi, je, ali je splohγ d


Dodatek H: GAUSSOVI PERIMETRI KONVEKSNIH MNOŽIC 295<br />

vendar za to oceno ne <strong>po</strong>da natančnega dokaza.<br />

Tudi ocena (H.1.9) oz. (H.1.11) se da <strong>po</strong>splošiti tudi na druge mere. Tako Bentkus,<br />

Juozulynas in Paulauskas [24] izpeljejo oceno, pri kateri namesto Gaussove mere<br />

nastopa primerna stabilna <strong>po</strong>razdelitev.<br />

Nazarov torej za velike d izboljša konstanto v Ballovi oceni (H.1.9), ne <strong>po</strong>da pa<br />

eksplicitne ocene. Tu bomo <strong>po</strong>dali naslednjo oceno, ki da še nekoliko boljšo konstanto<br />

kot v (H.1.12) in je <strong>po</strong>vsem eksplicitna.<br />

Izrek H.1.3. Naj boγ d tako kot v (H.1.5). Tedaj za vsak d∈N velja:<br />

γ d ≤ 0,64+0,59 d 1/4<br />

(H.1.13)<br />

Izrek bomo dokazali v razdelkih H.3 in H.4; <strong>po</strong>dali bomo tudi določene izboljšave<br />

za majhne dimenzije (glej tabelo H.4.1).<br />

DOKAZTRDITVE H.1.1. Naj bo najprej x, y∈C ε . Dokazati moramo, da za vsak t∈<br />

[0, 1] velja z := (1−t)x+ty∈C ε . Obstajata taki točkiξ,η∈C, da je|x−ξ|≤ε in|y−η|≤ε.<br />

Ker je <strong>po</strong> točki (2) trditve G.2.1 množica C konveksna, je tudiζ := (1−t)ξ+tη∈C in ni<br />

težko preveriti, da je|z−ζ|≤ε. Torej je res z∈C ε .<br />

Naj bo zdaj x, y∈C −ε , t∈[0, 1] in z=(1−t)x+ty. Pa recimo, da je zC −ε . To<br />

<strong>po</strong>meni, da je dist(z,R d \ C)


296 H.2 IZRAŽAVA S HAUSDORFFOVO MERO<br />

DEFINICIJA. Naj bo C <strong>po</strong>ljubna <strong>po</strong>dmnožica metričnega prostora M. Definirajmo<br />

razdaljno funkcijoδ C <strong>po</strong> predpisu:<br />

⎧<br />

⎪⎨ − dist(x, M\C) ; x∈C<br />

δ C (x) :=<br />

(H.2.4)<br />

⎪⎩ dist(x, C) ; xC<br />

O<strong>po</strong>mba. Če je x∈R d \ Int C, jeδ C (x)=|x−p C (x)|, kjer je p C pravokotna projekcija<br />

na C (glej razdelek G.3).<br />

Lema H.2.2. Naj bo C⊆R d konveksna množica. Tedaj za vsak x∈R d in vsakε>0<br />

obstaja tak y, da je 0


Dodatek H: GAUSSOVI PERIMETRI KONVEKSNIH MNOŽIC 297<br />

DOKAZ. Zveza (H.2.7) sledi ne<strong>po</strong>sredno iz (H.1.3) in (H.2.4). Dokažimo še (H.2.8).<br />

Da je Fr C η ⊆{x ;δ C (x)=η}, takoj sledi iz (H.2.7) in zveznosti razdaljne funkcije (ki<br />

sledi iz trditve H.2.3). Naj bo zdajδ C (x)=η. Tedaj je očitno x∈C η , <strong>po</strong> lemi H.2.2 pa za<br />

vsakε>0 obstaja tak y, da je|y−x|δ C (x), se pravi, da je yC η . To pa<br />

<strong>po</strong>meni, da mora biti x∈Fr C η .<br />

Naslednji rezultat je modifikacija <strong>po</strong>sledice G.3.8.<br />

Lema H.2.6. Naj bo C⊆R d konveksna množica inε≥0. Tedaj pravokotna projekcija p C<br />

surjektivno preslika Fr C ε na Fr C.<br />

DOKAZ. Ker je C⊆C ε , je tudi Fr C ε ⊆R d \ Int C ε ⊆R d \ Int C, torej je p C<br />

(<br />

Fr C<br />

ε ) ⊆ Fr C.<br />

Preostane nam le še dokazati, da za vsak y∈Fr C obstaja tak x∈Fr C ε , da je p C (x)= y.<br />

Naj bo u enotski zunanji normalni vektor kakega o<strong>po</strong>rnega <strong>po</strong>lprostora množice C v<br />

točki y. Definirajmo x := y+εu. Po trditvi G.3.7 je p C (x)= y, velja pa šeδ C (x)=<br />

dist(x, C)=|x−p C (x)|=|x− y|=ε, torej <strong>po</strong> (H.2.8) velja tudi x∈Fr C ε .<br />

DOKAZTRDITVE H.2.1. Označimo:<br />

{∫<br />

}<br />

γ ′ d := sup φ d (x)H d−1 (dx) ; C⊆R d konveksna množica<br />

Fr C<br />

(H.2.9)<br />

Dokazati moramo torej, da jeγ d =γ ′ . Iz trditve H.2.3, različice (F.3.14) krivočrtnega<br />

d<br />

Fubinijevega izreka, točke (2) trditve F.3.1 in zveze (H.2.8) dobimo:<br />

∫<br />

N(0, I)(C ε \ C)= φ d (x) J 1 δ C (x) dx=<br />

C ε \C<br />

∫ ε ∫<br />

= φ d (x)H d−1 (dx) dt<br />

(H.2.10)<br />

0 δ −1<br />

C<br />

∫ ({t}) ε ∫<br />

= φ d (x)H d−1 (dx) dt<br />

0 Fr C t<br />

Podobno velja tudi:<br />

N(0, I)(C\C −ε )=<br />

Iz (H.2.10) in (H.2.11) najprej sledi, da je:<br />

∫ 0<br />

−ε<br />

∫<br />

Fr C t φ d (x)H d−1 (dx) dt<br />

(H.2.11)<br />

N(0, I)(C ε \ C)≤εγ ′ d<br />

in N(0, I)(C\C −ε )≤εγ ′ d<br />

(H.2.12)<br />

Če <strong>po</strong>gledamo supremum <strong>po</strong> vseh konveksnih množicah in vsehε>0, dobimo, da je<br />

γ d ≤γ ′ d .<br />

Za dokaz neenakosti v nasprotno smer najprej označimo:<br />

Υ − εφ d (x) := inf<br />

|y|≤ε φ d(x+ y)<br />

(H.2.13)


298 H.3 EKSPLICITNA RAZLIČICA OCENE NAZAROVA<br />

Naj bo x∈Fr C t , kjer je<br />

(<br />

0≤t≤ε. Ker <strong>po</strong> (H.2.8) velja|x−p C (x)|=dist(x, C)=δ C (x)=t,<br />

je očitnoφ d (x)≥Υεφ − d pC (x) ) . Iz (H.2.10), leme H.2.6, trditve G.3.5 in točke (1) <strong>po</strong>sledice<br />

F.2.6 dobimo:<br />

∫ ε ∫<br />

(<br />

N(0, I)(C ε \ C)≥ Υεφ − d pC (x) ) H d−1 (dx) dt≥<br />

0 Fr C<br />

∫ t ε ∫<br />

≥ Υεφ − d (y)H d−1 (dy) dt= (H.2.14)<br />

0 p C (Fr C t )<br />

∫<br />

=ε Υεφ − d (y)H d−1 (dy)<br />

Fr C<br />

Torej za vsakε>0 velja:<br />

∫<br />

Υεφ − d (y)H d−1 (dy)≤γ d<br />

Fr C<br />

(H.2.15)<br />

Ker jeφ d zvezna, za vsak x∈R d velja lim ε↓0 Υεφ − d (x)=φ d (x). Torej <strong>po</strong> izreku o monotoni<br />

konvergenci velja: ∫<br />

φ d (y)H d−1 (dy)≤γ d<br />

(H.2.16)<br />

Fr C<br />

Ker to velja za vse konveksne množice, je tudiγ ′ ≤γ d d.<br />

H.3 Eksplicitna različica ocene Nazarova<br />

Kot prvi korak pri dokazu ocene (H.1.13) bomo najprej izpeljali nekoliko slabšo<br />

oceno.<br />

Trditev H.3.1. Za vsak d∈Nvelja ocena:<br />

√ √<br />

π<br />

γ d ≤<br />

2 + 4 d<br />

< 1,26+0,76 d1/4<br />

(H.3.1)<br />

π<br />

Dokaz te ocene bo služil kot osnova za dokaz izboljšane ocene (H.1.13). V dokazu<br />

trditve H.3.1, ki ga bomo izpeljali s<strong>po</strong>daj, so že zajete vse glavne ideje izpeljave ocene<br />

(H.1.13). Z drugimi besedami, ločnica med izpeljavama ocen (H.3.1) in (H.1.13) so zgolj<br />

tehnične izboljšave, ki jih bomo <strong>po</strong>dali v naslednjem razdelku.<br />

Preden gremo dokazovat trditev H.3.1, formulirajmo še tri <strong>po</strong>možne rezultate. Prvega<br />

bomo dokazali na koncu razdelka.<br />

Lema H.3.2. Naj bo C⊆R d konveksna množica in x∈R d \{0}. Nadalje naj bo radialna<br />

projekcija g C (glej razdelek G.4) diferenciabilna v x. Tedaj velja:<br />

J d−1 g C (x)=<br />

(<br />

ρC (x)<br />

|x|<br />

) d−1<br />

1<br />

cosθ<br />

(H.3.2)<br />

kjer jeθkot med krajevnim vektorjem točke x in zunanjim normalnim vektorjem o<strong>po</strong>rnega<br />

<strong>po</strong>lprostora množice C v točki g C (x), J d−1 pa je jacobiana (glej razdelek F.3).


Dodatek H: GAUSSOVI PERIMETRI KONVEKSNIH MNOŽIC 299<br />

O<strong>po</strong>mba. Če je g C diferenciabilna v x, <strong>po</strong> trditvi G.4.7 v točki g C (x) obstaja en sam<br />

o<strong>po</strong>rni <strong>po</strong>lprostor.<br />

Naslednji rezultat, ki ga bomo prav tako dokazali na koncu razdelka, je neenakostna<br />

različica Stirlingovega obrazca.<br />

Trditev H.3.3. Za vsak x>0 velja ocena:<br />

( ) x x √<br />

Γ(x+1)≥ 2πx (H.3.3)<br />

e<br />

Naslednji rezultat pa je v resnici prvi korak v dokazu trditve H.3.1. Pove, da se je<br />

dovolj omejiti na množice, ki imajo v notranjosti izhodišče.<br />

Lema H.3.4. Za vsak d∈Nvelja:<br />

{∫<br />

}<br />

γ d = sup φ d (x)H d−1 (dx) ; C⊆R d konveksna množica, 0∈Int C<br />

Fr C<br />

DOKAZ.<br />

Prvi korak. Velja:<br />

{∫<br />

}<br />

γ d = sup φ d (x)H d−1 (dx) ; C⊆R d konveksna množica, Int C∅<br />

Fr C<br />

(H.3.4)<br />

(H.3.5)<br />

U<strong>po</strong>števali bomo trditev H.2.1. Dovolj je dokazati, da za vsako konveksno množico<br />

C s prazno notranjostjo obstaja taka konveksna množica D z neprazno notranjostjo,<br />

da je ∫ Fr C φ d(x)H d−1 (dx)≤ ∫ Fr D φ d(x)H d−1 (dx), kar bo zagotovo veljalo, če bo veljalo<br />

Fr C⊆Fr D. Taka množica D pa vedno obstaja: če je namreč Int C=∅, je <strong>po</strong> trditvi<br />

G.2.4 množica C vsebovana v nekem pravem afinem <strong>po</strong>dprostoru, ta pa je prav gotovo<br />

vsebovan v robu nekega <strong>po</strong>lprostora, ki ga proglasimo za D.<br />

Drugi korak. Velja:<br />

{∫<br />

}<br />

γ d = sup φ d (x)H d−1 (dx) ; C⊆R d konveksna množica, Int C∅, 0∈C<br />

Fr C<br />

(H.3.6)<br />

Naj bo C konveksna množica z neprazno notranjostjo. Označimo z := g C (0). Tedaj je<br />

očitno 0∈C−z. Pišimo:<br />

∫ ∫<br />

φ d (x)H d−1 (dx)=<br />

Fr C<br />

∫<br />

=<br />

φ d (y+z)H d−1 (dy)=<br />

Fr(C−z)<br />

φ d (y) exp ( −〈y, z〉− 1|z|2) H d−1 (dy)<br />

2<br />

Fr(C−z)<br />

(H.3.7)<br />

Ker <strong>po</strong> točki (2) leme G.3.3 za vsak x∈C velja〈x−z, z〉≥0, tudi za vsak y∈C−z velja<br />

〈y, z〉≥0. Sledi:<br />

∫ ∫<br />

φ d (x)H d−1 (dx) dx≤ φ d (y)H d−1 (dy)<br />

(H.3.8)<br />

Fr C<br />

Fr(C−z)


300 H.3 EKSPLICITNA RAZLIČICA OCENE NAZAROVA<br />

Enakost (H.3.6) je s tem dokazana.<br />

Tretji korak. Velja (H.3.4). Naj bo C konveksna množica z neprazno notranjostjo in<br />

0∈C. Po (G.2.4) obstaja za<strong>po</strong>redje točk z n ∈ Int C, ki konvergira k izhodišču. Tedaj<br />

za vsak n∈N velja 0∈Int(C−z n ), <strong>po</strong>leg tega pa <strong>po</strong> izreku o dominirani konvergenci<br />

velja:<br />

∫<br />

φ d (x)H d−1 (dx)= lim φ d (x−z n )H<br />

Fr C<br />

n→∞<br />

∫Fr d−1 (dx)=<br />

C<br />

= lim φ d (y)H<br />

n→∞<br />

∫Fr(C−z d−1 (dy)<br />

n )<br />

(H.3.9)<br />

Naš rezultat je s tem dokazan.<br />

DOKAZTRDITVE H.3.1. U<strong>po</strong>rabili bomo lemo H.3.4, torej bomo morali za vsako konveksno<br />

množico C⊆R d , za katero je 0∈Int C, omejiti integral:<br />

∫<br />

φ d (x)H d−1 (dx)<br />

Fr C<br />

(H.3.10)<br />

Glavna ideja je, da konstruiramo primerno lokalno Lipschitzevo preslikavo g: A→<br />

Fr C, kjer je A⊆R d primerna množica, nakar u<strong>po</strong>rabimo krivočrtni Fubinijev izrek<br />

(izrek F.3.2). Privzemimo še, da za skoraj vsak x∈A (glede na Lebesguovo mero) velja:<br />

H 1( g −1 ({g(x)}) ) > 0<br />

(H.3.11)<br />

in še, da je J d−1 g(x)≤ j(x), kjer je j(x)>0. Tedaj velja:<br />

∫ ∫<br />

1= φ d (x) dx≥<br />

R d<br />

A<br />

∫ ∫<br />

φ d (x)<br />

j(x) J φ d (x)<br />

d−1g(x) dx=<br />

Fr C g −1 ({y}) j(x) H 1 (dx)H d−1 (dy)<br />

(H.3.12)<br />

Če uspemo oceniti:<br />

∫<br />

g −1 ({y})<br />

φ d (x)<br />

j(x) H 1 (dx)≥cφ d (y)<br />

(H.3.13)<br />

(kar med drugim avtomatično <strong>po</strong>meni, da je <strong>po</strong>goj (H.3.11) iz<strong>po</strong>lnjen), torej velja:<br />

∫<br />

Fr Cφ d (y)H d−1 (dy)≤ 1 c<br />

(H.3.14)<br />

Z drugimi besedami, velja:<br />

∫<br />

φ d (y)H d−1 (dy)≤ sup∫<br />

Fr C<br />

y∈Fr C<br />

g −1 ({y})<br />

φ d (y)<br />

φ d (x)<br />

j(x) H 1 (dx)<br />

(H.3.15)


Dodatek H: GAUSSOVI PERIMETRI KONVEKSNIH MNOŽIC 301<br />

Ena možnost je, da za preslikavo g izberemo radialno projekcijo g C : R d \{0}→Fr C.<br />

V tem primeru velja g −1 ({y})={sy/|y| ; s≥0}. Če slednji zapis izberemo za parametrizacijo<br />

praslike g −1 ({y}) (ki ima jacobiano enako 1) in u<strong>po</strong>rabimo formulo (F.3.13),<br />

C<br />

dobimo: ∫ ∫<br />

φ d (x) ∞<br />

g −1 ({y}) j(x) H 1 (dx)=(2π) −d/2 e −s2 /2<br />

(<br />

0<br />

j s y ) ds (H.3.16)<br />

|y|<br />

Za j(x) lahko <strong>po</strong>stavimo kar desno stran v (H.3.2). Sledi:<br />

∫ ∫<br />

φ d (x)<br />

j(x) H c(y) ∞<br />

1 (dx)=<br />

s d−1 e −s2 /2 ds=<br />

(2π) d/2 |y| d−1<br />

g −1 ({y})<br />

= c(y)φ d(y)<br />

|y| d−1 e −|y|2 /2<br />

0<br />

∫ ∞<br />

0<br />

s d−1 e −s2 /2 ds<br />

(H.3.17)<br />

kjer je c(y) kosinus kota med y in zunanjim normalnim vektorjem o<strong>po</strong>rnega <strong>po</strong>lprostora<br />

v točki y. Tako iz (H.3.15) dobimo:<br />

∫<br />

|y| d−1 e −|y|2 /2<br />

φ d (y)H d−1 (dy)≤ sup ∫ ∞<br />

(H.3.18)<br />

Fr C<br />

y∈Fr C<br />

c(y) s d−1 e −s2 /2 ds<br />

Pomanjkljivost zgornje ocene je, da nimamo nobenega nadzora nad kosinusom c(y), ki<br />

je lahko <strong>po</strong>ljubno blizu nič (<strong>po</strong> trditvi G.4.1 ga sicer lahko navzdol omejimo z razmerjem<br />

med oddaljenostjo izhodišča do roba množice C in oddaljenostjo točke y od izhodišča,<br />

a kaj, ko je to razmerje lahko <strong>po</strong>ljubno majhno).<br />

Druga možnost pa je, da za preslikavo g izberemo pravokotno projekcijo p C : R d \<br />

Int C→Fr C. V tem primeru lahko zaradi nerazteznosti projekcije <strong>po</strong>stavimo j(x)=1<br />

(glej trditev G.3.5 in točko (1) trditve F.3.1). Sledi:<br />

∫<br />

φ d (y)H d−1 (dy)≤ sup<br />

Fr C<br />

y∈Fr C<br />

∫<br />

0<br />

φ d (y)<br />

p −1<br />

C ({y}) φ d (x)H 1 (dx)<br />

(H.3.19)<br />

Po trditvi G.3.7 velja p −1 ({y})⊇{y+su ; s≥0}, kjer je u zunanji enotski normalni<br />

C<br />

vektor kakega o<strong>po</strong>rnega <strong>po</strong>lprostora v točki y. Če prejšnji zapis spet u<strong>po</strong>rabimo kot<br />

parametrizacijo, dobimo:<br />

∫ ∫ ∞<br />

φ d (x)H 1 (dx)≥ φ d (y+su) ds=<br />

p −1<br />

C ({y}) 0<br />

∫ ∞<br />

= (2π) −d/2 exp ( − 1 2 |y|2 − s c(y)|y|− 1s2) ds=<br />

2<br />

0<br />

= (2π) −d/2 exp ( − 1 2 (1−c2 (y))|y| 2)∫ ∞<br />

exp ( − 1(c(y)|y|+s)2) ds=<br />

2<br />

0<br />

=φ d (y)ψ ( −c(y)|y| ) (H.3.20)


302 H.3 EKSPLICITNA RAZLIČICA OCENE NAZAROVA<br />

kjer jeψMillsovo razmerje (glej dodatek C). Iz (H.3.15) zdaj dobimo:<br />

∫<br />

φ d (y)H d−1 1<br />

(dy)≤ sup<br />

Fr C<br />

y∈Fr Cψ ( −c(y)|y| )<br />

(H.3.21)<br />

Millsovo razmerje pa je majhno pri zelo negativnih argumentih (glej trditev C.2.3).<br />

Tako je, <strong>po</strong>vršno <strong>po</strong>vedano, ocena (H.3.18) u<strong>po</strong>rabna pri velikih, ocena (H.3.21) pa pri<br />

majhnih vrednostih kosinusa c(y). Smiselno bi bilo torej obe oceni kombinirati.<br />

Če imamo <strong>po</strong>dani dve preslikavi g 1 : A 1 → Fr C in g 2 : A 2 → C, ki zadoščata (H.3.11)<br />

ter za kateri je še J d−1 g 1 (x)≤ j 1 (x) in J d−1 g 2 (x)≤ j 2 (x), lahko za <strong>po</strong>ljuben p∈[0, 1]<br />

zapišemo:<br />

∫ ∫<br />

φ d (x)<br />

1≥(1−p)<br />

A 1<br />

j 1 (x) J φ d (x)<br />

d−1g 1 (x) dx+p<br />

A 1<br />

j 1 (x) J d−1g 1 (x) dx=<br />

∫ ⎡ ∫ ∫ ⎤<br />

= ⎢⎣ (1−p) φ d (x)<br />

Fr C<br />

g −1<br />

1 ({y}) j 1 (x) H φ 1 d (x)<br />

(dx)+p<br />

g −1<br />

1 ({y}) j 1 (x) H 1 (dx) ⎥⎦ H d−1 (dy)<br />

Sledi:<br />

⎛<br />

(H.3.22)<br />

∫<br />

φ<br />

φ d (y)H d−1 d (y)<br />

(dy)≤ sup ∫ ∫<br />

Fr C<br />

y∈Fr C φ d (x)<br />

⎜⎝ (1−p)<br />

g −1<br />

1 ({y}) j 1 (x) H φ 1 d (x)<br />

(dx)+p<br />

g −1<br />

1 ({y}) j 1 (x) H 1 (dx) ⎟⎠<br />

(H.3.23)<br />

Če za g 1 <strong>po</strong>stavimo radialno, za g 2 pa pravokotno projekcijo ter v zgornjo oceno vstaviti<br />

(H.3.17) in (H.3.20), dobimo:<br />

⎛<br />

⎞<br />

∫<br />

φ d (y)H d−1 1<br />

(dy)≤ sup ∫ ∞<br />

Fr C<br />

y∈Fr C⎜⎝<br />

(1−p) c(y)|y| −(d−1) e |y|2 /2<br />

s d−1 e −s2 /2 ds+pψ(−c(y)|y|) ⎟⎠<br />

Če označimo r :=|y| in t :=|y| c(y), pa lahko to zapišemo tudi v obliki:<br />

∫<br />

φ d (y)H d−1 (dy)≤ 1<br />

Fr C<br />

p sup 1<br />

t≥0 t H(d, p)+ψ(−t)<br />

0<br />

⎞<br />

(H.3.24)<br />

(H.3.25)<br />

kjer je:<br />

H(d, p) := 1−p<br />

p<br />

∫ ∞<br />

inf<br />

r≥0 r−d e r2 /2<br />

s d−1 e −s2 /2 ds<br />

0<br />

Če <strong>po</strong>stavimoρ := r 2 /2 in integral izrazimo s funkcijo gama, dobimo:<br />

H(d, p)= 1−p<br />

2p<br />

inf<br />

ρ≥0 ρ−d/2 e ρ Γ(<br />

d<br />

2<br />

)<br />

= 1−p<br />

2p<br />

(<br />

d<br />

2e<br />

) −d/2 (<br />

d<br />

Γ<br />

2)<br />

(H.3.26)<br />

(H.3.27)


Dodatek H: GAUSSOVI PERIMETRI KONVEKSNIH MNOŽIC 303<br />

Po trditvi H.3.3 lahko ocenimo:<br />

(<br />

d<br />

Γ<br />

2)= 2 ( ) √<br />

d π<br />

d Γ 2 + 1 ≥ 2<br />

d<br />

(<br />

d<br />

2e<br />

) d/2<br />

(H.3.28)<br />

Sledi:<br />

H(d, p)≥ 1−p<br />

√<br />

π<br />

p d<br />

sup<br />

t≥0<br />

(H.3.29)<br />

Oceniti moramo še desno stran v (H.3.25). Iz trditve C.2.3 <strong>po</strong> nekaj računanja dobimo,<br />

da za vsak x>0 velja:<br />

1<br />

tx+ψ(−t) ≤ F(x)<br />

(H.3.30)<br />

kjer je:<br />

F(x) :=<br />

inf<br />

t≥0<br />

⎛<br />

1<br />

=<br />

⎜⎝ tx+ 1<br />

√<br />

2<br />

⎞⎟ + t ⎠<br />

π<br />

Ni se težko prepričati, da velja ocena:<br />

⎧<br />

1<br />

⎪⎨ 2 √ x + 1<br />

2 ( √ √) ; x≤ π<br />

2π− x 2<br />

√<br />

2 ⎪⎩<br />

; x≥ π π<br />

2<br />

(H.3.31)<br />

F(x)≤ 1 √<br />

2π<br />

+ 1<br />

2 √ x<br />

Iz (H.3.25), (H.3.29), (H.3.30) in (H.3.32) zdaj lahko <strong>po</strong>vzamemo:<br />

∫ √<br />

φ d (y)H d−1 (dy)≤ 1<br />

Fr C<br />

p √ 2π + 1<br />

2 √ 4 d<br />

p(1−p) π<br />

(H.3.32)<br />

(H.3.33)<br />

V primeru, ko gre d proti neskončno, je najugodneje vzeti p=1/2. Za ta primer z<br />

u<strong>po</strong>rabo leme H.3.4 dejansko dobimo želeni rezultat.<br />

DOKAZLEME H.3.2. Iz (G.4.2) in (G.4.29) <strong>po</strong> nekaj računanja dobimo:<br />

g ′ C (x)v=ρ C(x)<br />

|x|<br />

( )<br />

〈u, v〉<br />

v−<br />

〈u, x〉 x<br />

(H.3.34)<br />

Če je v pravokoten na u, velja g ′ (x)v=( ρ<br />

C C (x)/|x| ) v. Nadalje je〈g ′ (x)u, u〉=0. Do<strong>po</strong>lnimo<br />

vektor u do ortonormirane baze prostoraR d . V tej bazi ima g ′ (x) matrični<br />

C<br />

C<br />

zapis:<br />

⎡<br />

0 0··· 0<br />

⎤<br />

A= ⎢⎣ ξ ρ C(x)<br />

I⎥⎦<br />

(H.3.35)<br />

|x|


304 H.3 EKSPLICITNA RAZLIČICA OCENE NAZAROVA<br />

kjer jeξustrezni matrični zapis vektorja g ′ (x)u v ortogonalnem komplementu vektorja<br />

C<br />

u. Po točki (6) <strong>po</strong>tem velja [[A]] d−1 = [[B]] d−1 , kjer je:<br />

Po točki (7) trditve F.3.1 nadalje velja:<br />

Lema je tako dokazana.<br />

B=<br />

[<br />

ξ ρ C(x)<br />

|x|<br />

[[A]] 2 d−1 = det( BB T) =<br />

⎛ ( ) 2 ρC (x)<br />

= det⎜⎝ ξξT +<br />

⎞⎟<br />

|x| ⎠ =<br />

⎡ ( ) 2 ( ) 2(d−2) ρC (x) ρC (x)<br />

= ⎢⎣ |ξ|2 +<br />

⎤⎥<br />

|x| ⎦ =<br />

|x|<br />

( ) 2(d−1) ( )<br />

ρC (x) |x|<br />

2 2<br />

= =<br />

|x| 〈u, x〉<br />

( ) 2(d−1) ρC (x) 1<br />

=<br />

|x| cos 2 θ<br />

]<br />

(H.3.36)<br />

(H.3.37)<br />

Dokazati moramo še trditev H.3.3. Preden se lotimo dokazovanja, formulirajmo še<br />

naslednji tehnični rezultat.<br />

Lema H.3.5. Za vsak x>0velja:<br />

(<br />

1+ 1 x) x+ 1<br />

2≥<br />

e (H.3.38)<br />

DOKAZ. Ekvivalentno je dokazati, da velja:<br />

(<br />

x+ 1 ) (<br />

ln 1+ 1 )<br />

2 x<br />

≥ 1<br />

(H.3.39)<br />

ali tudi, da za vsak t>0 velja:<br />

( 1<br />

t + 1 2)<br />

ln(1+t)≥1<br />

(H.3.40)<br />

ali tudi, da velja:<br />

f (t) :=<br />

(<br />

1+ t )<br />

ln(1+t)−t≥0<br />

2<br />

(H.3.41)<br />

Velja f (0)=0. Po odvajanju dobimo:<br />

f ′ (t)= ln(1+t)<br />

2<br />

−<br />

t<br />

2(1+t)<br />

Spet je f ′ (0)=0in <strong>po</strong> <strong>po</strong>novnem odvajanju dobimo:<br />

f ′′ (t)=<br />

t<br />

2(1+t) 2≥ 0<br />

Torej je res f (t)≥0za vse t≥0 in neenakost je dokazana.<br />

(H.3.42)<br />

(H.3.43)


Dodatek H: GAUSSOVI PERIMETRI KONVEKSNIH MNOŽIC 305<br />

DOKAZTRDITVE H.3.3. Definirajmo:<br />

( ) x x √<br />

f (x) := 2πx (H.3.44)<br />

e<br />

Po običajnem Stirlingovem obrazcu je lim x→∞ Γ(x+1)/ f (x)=1. Ker za vsak k∈N 0<br />

velja:<br />

Γ(x+k+1)<br />

Γ(x+1)=<br />

(H.3.45)<br />

(x+1)(x+2)...(x+k)<br />

iz Stirlingovega obrazca sledi tudi:<br />

f (x+k)<br />

Γ(x+1)= lim<br />

k→∞ (x+1)(x+2)...(x+k)<br />

(H.3.46)<br />

(zgornja formula s<strong>po</strong>minja na znameniti Eulerjev zapis funkcije gama z limito). Toda<br />

<strong>po</strong> lemi H.3.5 velja:<br />

f (x+1)<br />

(<br />

= 1+ 1 ) x+ 1<br />

2<br />

n+1<br />

≥ n+1<br />

(H.3.47)<br />

f (x) x e<br />

zato je tudi:<br />

Od tod pa že sledi naš rezultat.<br />

f (x+k)<br />

(x+1)(x+2)...(x+k) ≥ f (x)<br />

(H.3.48)<br />

H.4 Izboljšava ocene<br />

Cilj tega razdelka je dokazati oceno (H.1.13), ki je izboljšava že dokazane ocene<br />

(H.3.1). Preden se lotimo dokazovanja, bomo <strong>po</strong>trebovali še nekaj <strong>po</strong>možnih rezultatov,<br />

ki jih bomo dokazali na koncu razdelka.<br />

Lema H.4.1. Za vsak x≥0in vsakα>0veljata oceni:<br />

(<br />

1− x ) −α 2<br />

e −αx ≥ e x2 /2<br />

α<br />

(<br />

1− x ) α 2 −1<br />

e αx ≥ e −x2 /2<br />

α<br />

Lema H.4.2. Brž ko jeα≥1inβ≥1/ √ e, za funkcijo:<br />

G(x,α,β) :=<br />

(<br />

1− x ) −α 2<br />

e<br />

[β+<br />

−αx<br />

α<br />

(<br />

∫ α<br />

x<br />

1− x3<br />

α<br />

)<br />

(<br />

1− y ) α<br />

]<br />

2 −1<br />

e αy dy<br />

α<br />

(H.4.1)<br />

(H.4.2)<br />

(H.4.3)<br />

velja:<br />

inf G(x,α,β)= inf G(x,α,β)<br />

x


306 H.4 IZBOLJŠAVA OCENE<br />

DOKAZIZREKA H.1.3. Da ocena (H.3.1) ni optimalna, se vidi že pri d = 1 (ocena<br />

(H.1.8)). Tudi za večje d se da ocena (H.3.1) izboljšati že, če izpustimo določene <strong>po</strong>enostavitve<br />

pri njeni izpeljavi. Natančneje, iz (H.3.25), (H.3.27) in leme H.3.4, dobimo<br />

oceno:<br />

⎧ √<br />

2<br />

; d=1<br />

π ⎪⎨ ⎛<br />

γ d ≤γ d,1 :=<br />

(H.4.5)<br />

inf<br />

⎪⎩<br />

0


Dodatek H: GAUSSOVI PERIMETRI KONVEKSNIH MNOŽIC 307<br />

Dobimo:<br />

H(d, p)≥ 1 (<br />

2α inf 1− x ) −α 2<br />

[ 1−p<br />

e −αx<br />

x1/ √ e in na desni strani ocene (H.4.12)<br />

lahko u<strong>po</strong>rabimo lemo H.4.2. Nato u<strong>po</strong>rabimo še lemo H.4.1 in dobimo:<br />

H(d, p)≥ 1<br />

2α inf<br />

0≤x≤1 ex2 /2<br />

[ ∫ 1−p √ α<br />

) ]<br />

2π+<br />

(1− y3<br />

e −y2 /2 dy<br />

p α<br />

x<br />

(H.4.13)<br />

Ker je 1− y 3 /α≥0, brž ko je y≥α, je tudi:<br />

kjer je:<br />

H(d, p)≥ 1<br />

2α inf<br />

= 1<br />

2α inf<br />

≥ 1<br />

2α<br />

0≤x≤1 ex2 /2<br />

0≤x≤1<br />

[ ∫ 1−p √ ∞<br />

) ]<br />

2π+<br />

(1− y3<br />

e −y2 /2 dy =<br />

p<br />

x α<br />

[ ]<br />

1−p √<br />

2π e<br />

x 2 /2 +ψ(−x)− x2 + 2<br />

≥<br />

p α<br />

)<br />

(<br />

J(p)− 3 α<br />

J(p) := inf<br />

x<br />

[ ]<br />

1−p √<br />

2π e<br />

x 2 /2 +ψ(−x)<br />

p<br />

Iz (H.4.7), (H.3.30), (H.4.12) in leme H.3.4 zdaj dobimo, da velja:<br />

γ d ≤ 1 ( ( 1<br />

p F J(p)− 3 ))<br />

= 1 √ ⎞ ⎛⎜<br />

2α α p F 1<br />

2<br />

⎝ √<br />

⎛⎜ ⎝ J(p)−3<br />

2d d⎞<br />

⎟⎠ ⎟⎠<br />

(H.4.14)<br />

(H.4.15)<br />

(H.4.16)<br />

kjer je F tako kot v (H.3.31).<br />

S<strong>po</strong>mnimo se, da v limiti, ko gre t↓0, velja F(t)∼1/(2 √ t). V limiti, ko gre d→∞,<br />

je torej desna stran zgornje ocene približno (t. j. z relativno napako, ki gre proti nič)<br />

enaka K(p) d 1/4 , kjer je:<br />

K(p) :=<br />

⎛<br />

1<br />

2 3/4 p √ J(p) = sup<br />

1<br />

x ⎜⎝ 2<br />

√p(1−p) √ 3/4 2π e x2 /2<br />

+ p 2 ψ(−x)<br />

⎟⎠<br />

⎞<br />

(H.4.17)<br />

Parameter p lahko še <strong>po</strong>ljubno izbiramo v okviru intervala (0, 0,8]. Numerični izračuni<br />

<strong>po</strong>kažejo, da K(p) doseže minimum pri 0,72 (če se omejimo na primer, ko je 100p celo<br />

število) in v tem primeru je K(p)


308 H.4 IZBOLJŠAVA OCENE<br />

Desna stran je smiselno definirana za d≥5, saj je v tem primeru J(0,72)−3 √ 2/d>0.<br />

Oceniti moramo še razliko medγ d,2 in 0,59 d 1/4 . Pokazali bomo, da jeγ d,2 − 0,59 d 1/4<br />

padajoča funkcija dimenzije d.<br />

Označimo x := 1/ √ 2d. Po krajšem računu dobimo:<br />

⎛<br />

F⎜⎝ √ 1<br />

√ ⎞<br />

2<br />

⎛⎜ ⎝ J(p)−3<br />

2d d⎞<br />

⎟⎠ ⎟⎠ − p K(p) d1/4 =<br />

= F ( J(p)x−6x 2) 1<br />

−<br />

2 √ J(p)x =<br />

= F ( J(p)x−6x 2) 1<br />

−<br />

2 √ J(p)x−6x 2+<br />

+<br />

6 √ x<br />

2 √ J 2 (p)−6J(p)x ( √<br />

J(p)+<br />

√<br />

J(p)−6x<br />

)<br />

(H.4.19)<br />

Člen na desni je očitno naraščajoča funkcija spremenljivke x. Če je x≤3/J(p), to velja<br />

tudi za J(p)x−6x 2 . Nadalje se ni težko prepričati, da je tudi F(t)−1/(2 √ t) naraščajoča<br />

funkcija spremenljivke t. Torej je celoten izraz v (H.4.19) naraščajoča funkcija spremenljivke<br />

x oziroma padajoča funkcija spremenljivke d, brž ko je x≤3/J(p). Ni se težko<br />

prepričati, da pri p=0,72 to velja za vse d. Torej jeγ d,2 − K(0,72) d 1/4 padajoča funkcija<br />

spremenljivke d, se pravi, da to velja tudi zaγ d,2 − 0,59 d 1/4 .<br />

Primerjajmo zdaj ocene količinγ d , ki smo jih izpeljali v (H.4.5) in (H.4.18). V<br />

naslednji tabeli so <strong>po</strong>dane navzgor zaokrožene vrednosti količinγ d,i in∆ d,i :=γ d,i −0,59 d 1/4<br />

za i=1, 2 in d≤50:


Dodatek H: GAUSSOVI PERIMETRI KONVEKSNIH MNOŽIC 309<br />

d γ d,1 γ d,2 ∆ d,1 ∆ d,2<br />

1 0,798 − 0,208 −<br />

2 1,219 − 0,517 −<br />

3 1,300 − 0,524 −<br />

4 1,364 − 0,529 −<br />

5 1,416 4,569 0,534 3,686<br />

6 1,462 2,902 0,538 1,978<br />

7 1,502 2,504 0,543 1,545<br />

8 1,539 2,325 0,546 1,333<br />

9 1,572 2,225 0,550 1,203<br />

10 1,603 2,163 0,553 1,114<br />

11 1,631 2,123 0,557 1,049<br />

12 1,658 2,097 0,560 0,998<br />

13 1,683 2,078 0,563 0,958<br />

14 1,707 2,066 0,565 0,925<br />

15 1,729 2,058 0,568 0,896<br />

16 1,751 2,052 0,571 0,872<br />

17 1,771 2,049 0,573 0,851<br />

18 1,791 2,048 0,576 0,833<br />

19 1,810 2,048 0,578 0,817<br />

20 1,829 2,050 0,581 0,802<br />

21 1,846 2,052 0,583 0,789<br />

22 1,863 2,054 0,585 0,777<br />

23 1,880 2,058 0,587 0,766<br />

24 1,896 2,061 0,590 0,756<br />

25 1,911 2,065 0,592 0,746<br />

d γ d,1 γ d,2 ∆ d,1 ∆ d,2<br />

26 1,926 2,070 0,594 0,738<br />

27 1,941 2,074 0,596 0,729<br />

28 1,955 2,079 0,598 0,722<br />

29 1,969 2,084 0,600 0,715<br />

30 1,982 2,089 0,602 0,708<br />

31 1,996 2,094 0,603 0,702<br />

32 2,009 2,099 0,605 0,696<br />

33 2,021 2,105 0,607 0,690<br />

34 2,034 2,110 0,609 0,685<br />

35 2,046 2,115 0,611 0,680<br />

36 2,057 2,121 0,612 0,675<br />

37 2,069 2,126 0,614 0,671<br />

38 2,080 2,131 0,616 0,666<br />

39 2,092 2,137 0,617 0,662<br />

40 2,103 2,142 0,619 0,658<br />

41 2,113 2,147 0,620 0,654<br />

42 2,124 2,153 0,622 0,651<br />

43 2,134 2,158 0,624 0,647<br />

44 2,145 2,163 0,625 0,644<br />

45 2,155 2,169 0,627 0,640<br />

46 2,165 2,174 0,628 0,637<br />

47 2,174 2,179 0,630 0,634<br />

48 2,184 2,184 0,631 0,631<br />

49 2,193 2,189 0,632 0,628<br />

50 2,203 2,195 0,634 0,626<br />

Tabela H.4.1<br />

Iz tabele je razvidno, da je za d≤48 ugodnejša ocena zγ d,1 , za večje d pa je bržkone<br />

ugodnejša ocena zγ d,2 . Prav tako ugotovimo, da za d≤48 velja∆ d,1 < 0,64. Ker je∆ d,2<br />

padajoča funkcija spremenljivke d, tudi za d≥48 velja∆ d,2 < 0,64. Ocena (H.1.13) je<br />

tako dokazana.<br />

DOKAZLEME H.4.1.<br />

(H.4.1): Velja:<br />

[ (<br />

ln 1−<br />

α) x −α 2<br />

] (<br />

e −αx =−αx−α 2 − x )<br />

α − x2 x3<br />

2α2− 3α 3−... =<br />

= x2<br />

2 + x3<br />

3α + x4<br />

4α 2+···≥<br />

≥ x2<br />

2<br />

(H.4.20)


310 H.4 IZBOLJŠAVA OCENE<br />

(H.4.2): Velja:<br />

A := ln<br />

Po ureditvi členov dobimo:<br />

( ) α<br />

1−<br />

x<br />

2 −1<br />

α e<br />

αx<br />

e − 2 1 x2( ) =<br />

1− x3<br />

=αx+(α 2 − 1)<br />

α<br />

(<br />

+ x2<br />

2 + x3<br />

α + x6<br />

2α<br />

A=− x3<br />

3α − x4<br />

4α<br />

− x )<br />

α − x2<br />

α 2−x3 α 3−... +<br />

2−<br />

x5<br />

2+<br />

x9<br />

3α 3+...<br />

5α 3−···+<br />

+ x α + x2 x3<br />

2α2+ 3α 3+···+<br />

+ x3<br />

α + x6<br />

2α<br />

2+<br />

x9<br />

3α 3+...<br />

(H.4.21)<br />

(H.4.22)<br />

V prvem nizu členov ocenimo−x k+2 /((k+2)α k ) ≥ −x k+2 /(kα k ).<br />

dobimo:<br />

A≥ 1 α<br />

∞∑<br />

=<br />

k=1<br />

(<br />

−x 3 + x+x 3) + 1<br />

1<br />

kα k (<br />

−x k+2 + x k + x 3k)<br />

2α 2 (<br />

−x 4 + x 2 + x 6) + 1<br />

3α 3 (<br />

−x 5 + x 3 + x 9) +···=<br />

Po ureditvi členov<br />

(H.4.23)<br />

Za 0≤x≤1 velja x k+2 ≤ x k , za x≥1 pa velja x k+2 ≤ x 3k . Sledi A≥0 in neenakost je<br />

dokazana.<br />

DOKAZLEME H.4.2. Funkcijo G odvajajmo parcialno <strong>po</strong> x. Po krajšem računu dobimo:<br />

∂G<br />

(1−<br />

∂x (x,α,β)=x x ) −α<br />

∫ 2 −1 α (<br />

e<br />

[β+<br />

−αx 1− y ) α<br />

]<br />

2 −1 (<br />

e αy dy − 1− x −1<br />

(H.4.24)<br />

α α α)<br />

x<br />

Za x≤0 torej očitno velja ∂G (x,α,β)≤0. Pri x≥1 pa ocenimo:<br />

∂x<br />

∂G<br />

(1−<br />

∂x α) (x,α,β)≥ x −1<br />

[ (<br />

1− x ) −α 2<br />

]<br />

e −αx β−1<br />

α<br />

(H.4.25)<br />

) −α 2<br />

Po (H.4.1) je ( 1− x e −αx ≥ e x2 /2 ≥ √ e. Če je torejβ≥1/ √ e, za x≥1 velja ∂G(x,α,β)≤0<br />

α<br />

∂x<br />

in rezultat je dokazan.


Sklep<br />

Videli smo, da Steinova metoda nudi oceno napake pri normalni aproksimaciji za<br />

vrsto zanimivih primerov, kjer igra vlogo odvisnost. Vendar pa njeni <strong>po</strong>tenciali še<br />

zdaleč niso izčrpani. Dosti bi se dalo še storiti pri ocenah Berry–Esséenovega tipa<br />

in njihovih večrazsežnih <strong>po</strong>splošitvah, <strong>po</strong>sebej za primer, ko slučajne spremenljivke<br />

niso omejene. Doslej najsplošnejša rezultata sta izpeljala Chen in Shao za lokalno<br />

odvisnost [41] in določene vrste statistik [42]. Vendar pa sta njuna rezultata omejena<br />

le na enorazsežni primer in tudi odvisnost konstante od maksimalne stopnje v grafu<br />

odvisnosti ni vedno optimalna. Včasih je ta odvisnost ključnega <strong>po</strong>mena, npr. pri U-<br />

statistikah. Zanimivo bi bilo izpeljati tudi splošnejši rezultat, ki ni omejen le na lokalno<br />

odvisnost.<br />

Velika hiba Steinove metode so konstante. Res je sicer, da bi se veliko konstant,<br />

ki nastopajo v tem delu, dalo s pazljivejšim računanjem zlahka izboljšati, še vedno<br />

pa so konstante za vsote neodvisnih slučajnih spremenljivk kar nekajkrat slabše od<br />

tistih, ki so bile dobljene z drugimi metodami. Pri izboljšavi konstant se je doslej za<br />

najobetavnejšega izkazal pristop s koncentracijsko neenakostjo (glej Chen in Shao [40]).<br />

Že v uvodu smo omenili, da smo izpustili neenakomerne ocene. Pomembne pa<br />

so tudi ocene velikih odklonov, t. j. take, pri katerih verjetnostiP(W≤x) ocenimo z<br />

majhno relativno napako. Določen napredek pri tem je dosegel avtor tega dela [97], še<br />

vedno pa ostaja pri tem dosti manevrskega prostora. Verjetnosti velikih odklonov bi<br />

bilo zanimivo izpeljati tudi za večrazsežni primer.<br />

Prav tako zanimivo <strong>po</strong>dročje pa je tudi Edgeworthov razvoj. Pri tem so bili sicer<br />

tudi že doseženi določeni rezultati (glej Barbour [8], Schneller [117] ter Rinott in Rotar<br />

[107]), a je še dosti odprtega. Matematike torej v bodoče tudi na tem <strong>po</strong>dročju čaka še<br />

veliko dela.<br />

311


312


Literatura<br />

[1] A. K. Aleškevičienė: Verojatnosti bol’ših uklonjenij dlja U-statistik i funkcionalov<br />

Misesa, Teor. verojatnost. i primenjen. 35 (1990), 3–14.<br />

[2] E. L. Allgower, K. Georg: Numerical Continuation Methods, Springer Series in<br />

Computational Mathematics, vol. 13, Springer-Verlag, Berlin, 1990.<br />

[3] B. von Bahr: Multi-dimensional integral limit theorems, Ark. Mat. 7 (1967), 71–88.<br />

[4] P. Baldi, Y. Rinott, C. Stein: A normal approximation for the number of local maxima<br />

of a random function on a graph, Probability, statistics, and mathematics, Academic<br />

Press, Boston, MA, 1989, str. 59–81.<br />

[5] K. Ball: The reverse isoperimetric problem for Gaussian measure, Discrete Comput.<br />

Geom. 10 (1993), 411–420.<br />

[6] S. Banach: Über homogene Polynome in L 2 , Studia Math. 7 (1938), 36–44.<br />

[7] A. D. Barbour: Poisson convergence and random graphs, Math. Proc. Cambridge<br />

Philos. Soc. 92 (1982), 349–359.<br />

[8] : Asymptotic expansions based on smooth functions in the central limit theorem,<br />

Probab. Theory Relat. Fields 72 (1986), 289–303.<br />

[9] : Stein’s method for diffusion approximations, Probab. Theory Related Fields<br />

84 (1990), 297–322.<br />

[10] : Stein’s method, Encyclopaedia of Statistical Sciences, vol. 1, Wiley, New<br />

York, 1997, str. 513–521.<br />

[11] A. D. Barbour, L. H. Y. Chen: An Introduction to Stein’s Method, Lecture Notes Series,<br />

vol. 4, Institute for Mathematical Sciences, National University of Singa<strong>po</strong>re,<br />

2005.<br />

[12] : Stein’s Method and Applications, Lecture Notes Series, vol. 5, Institute for<br />

Mathematical Sciences, National University of Singa<strong>po</strong>re, 2005.<br />

[13] A. D. Barbour, L. H. Y. Chen, W.-L. Loh: Com<strong>po</strong>und Poisson approximation for<br />

nonnegative random variables via Stein’s method, Ann. Probab. 20 (1992), 1843–1866.<br />

313


314<br />

[14] A. D. Barbour, O. Chryssaphinou: Com<strong>po</strong>und Poisson approximation: a user’s guide,<br />

Ann. Appl. Probab. 11 (2001), 964–1002.<br />

[15] A. D. Barbour, V. Čekanavičius: Total variation asymptotics for sums of independent<br />

integer random variables, Ann. Probab. 30 (2002), 509–545.<br />

[16] A. D. Barbour, L. Holst, S. Janson: Poisson Approximation, Oxford Studies in<br />

Probability, vol. 2, Oxford University Press, New York, 1992.<br />

[17] A. D. Barbour, M. Karoński, A. Ruciński: A central limit theorem for decom<strong>po</strong>sable<br />

random variables with applications to random graphs, J. Combin. Theory Ser. B 47<br />

(1989), 125–145.<br />

[18] A. D. Barbour, S. Utev: Solving the Stein equation in com<strong>po</strong>und Poisson approximation,<br />

Adv. in Appl. Probab. 30 (1998), 449–475.<br />

[19] : Com<strong>po</strong>und Poisson approximation in total variation, Stochastic Process.<br />

Appl. 82 (1999), 89–125.<br />

[20] A. D. Barbour, A. Xia: Estimating Stein’s constants for com<strong>po</strong>und Poisson approximation,<br />

Bernoulli 6 (2000), 581–590.<br />

[21] V. Bentkus: O zavisnosti ocenki Berry-Esseena ot razmernosti, Lietuvos Matematikos<br />

Rinkinys 26 (1986), 205–210.<br />

[22] : On the dependence of the Berry-Esseen bound on dimension, J. Statist. Plann.<br />

Inference 113 (2003), 385–402.<br />

[23] V. Bentkus, F. Götze, A. Tikhomirov: Berry-Esseen bounds for statistics of weakly<br />

dependent samples, Bernoulli 3 (1997), 329–349.<br />

[24] V. Bentkus, A. Juozulynas, V. Paulauskas: Bounds for stable measures of convex shells<br />

and stable approximations, Ann. Probab. 28 (2000), 1280–1300.<br />

[25] H. Bergström: On the central limit theorem, Skand. Aktuarietidskr. 27 (1944), 139–<br />

153.<br />

[26] : On the central limit theorem in the space R k , k>1, Skand. Aktuarietidskr.<br />

28 (1945), 106–127.<br />

[27] A. C. Berry: The accuracy of the Gaussian approximation to the sum of independent<br />

variates, Trans. Amer. Math. Soc. 49 (1941), 122–136.<br />

[28] R. N. Bhattacharya: On errors of normal approximation, Ann. Probab. 3 (1975),<br />

815–828.<br />

[29] R. N. Bhattacharya, R. R. Rao: Normal Approximation and Asymptotic Expansions,<br />

Robert E. Krieger Publishing Co. Inc., Melbourne, FL, 1986.<br />

[30] M. Bloznelis, F. Götze: Orthogonal decom<strong>po</strong>sition of finite <strong>po</strong>pulation statistics and its<br />

applications to distributional asymptotics, Ann. Statist. 29 (2001), 899–917.


315<br />

[31] M. Bloznelis, F. Götze: An Edgeworth expansion for symmetric finite <strong>po</strong>pulation<br />

statistics, Ann. Probab. 30 (2002), 1238–1265.<br />

[32] T. S. Blyth: Module Theory, Clarendon Press, Oxford, 1977.<br />

[33] J. Bochnak, J. Siciak: Polynomials and multilinear mappings in to<strong>po</strong>logical vector<br />

spaces, Studia Math. 39 (1971), 59–76.<br />

[34] E. Bolthausen: An estimate of the remainder in a combinatorial central limit theorem,<br />

Z. Wahrsch. verw. Gebiete 66 (1984), 379–386.<br />

[35] E. Bolthausen, F. Götze: The rate of convergence for multivariate sampling statistics,<br />

Ann. Statist. 21 (1993), 1692–1710.<br />

[36] H. Callaert, P. Janssen: The Berry-Esseen theorem for U-statistics, Ann. Statist. 6<br />

(1978), 417–421.<br />

[37] L. Le Cam: An approximation theorem for the Poisson binomial distribution, Pacific J.<br />

Math. 10 (1960), 1181–1197.<br />

[38] L. H. Y. Chen: Poisson approximation for dependent trials, Ann. Probab. 3 (1975),<br />

534–545.<br />

[39] : Stein’s method: some perspectives with applications, Probability towards<br />

2000 (New York, 1995), Lecture Notes in Statist., vol. 128, Springer, New York,<br />

1998, str. 97–122.<br />

[40] L. H. Y. Chen, Q.-M. Shao: A non-uniform Berry-Esseen bound via Stein’s method,<br />

Probab. Theory Related Fields 120 (2001), 236–254.<br />

[41] : Normal approximation under local dependence, Ann. Probab. 32 (2004),<br />

1985–2028.<br />

[42] : Normal approximation for nonlinear statistics using a concentration inequality<br />

approach, Bernoulli 13 (2007), 581–599.<br />

[43] P. L. Čebišev: Sur deux théorèmes relatifs aux probabilités, Acta Math. 14 (1890),<br />

305–315.<br />

[44] M. Černe: Ravnotežje, Obz. mat. fiz. 49 (2002), 49–52.<br />

[45] G. Dall’Aglio: Sugli estremi dei momenti delle funzioni di ripartizione doppia, Ann.<br />

Scuoloa Norm. Sup. Pisa (3) 10 (1956), 35–74.<br />

[46] A. Defant, K. Floret: Tensor Norms and Operator Ideals, North-Holland Mathematics<br />

Studies, vol. 176, North-Holland Publishing Co., Amsterdam, 1993.<br />

[47] A. Dembo, Y. Rinott: Some examples of normal approximations by Stein’s method,<br />

Random discrete structures (Minnea<strong>po</strong>lis, MN, 1993), IMA Vol. Math. Appl.,<br />

vol. 76, Springer, New York, 1996, str. 25–44.


316<br />

[48] J. W. Demmel: U<strong>po</strong>rabna numerična linearna algebra, DMFA, Ljubljana, 2000.<br />

[49] P. Diaconis: The distribution of leading digits and uniform distribution mod 1, Ann.<br />

Probab. 5 (1977), 72–81.<br />

[50] : An example for Stein’s method, Technical re<strong>po</strong>rt. Stats Dept, Stanford, 1989.<br />

[51] : Stein’s method for Markov chains: first examples, Stein’s method: ex<strong>po</strong>sitory<br />

lectures and applications, IMS Lecture Notes Monogr. Ser., vol. 46, Inst. Math.<br />

Statist., Beachwood, OH, 2004, str. 27–43.<br />

[52] J. Dugundji: To<strong>po</strong>logy, Allyn and Bacon Inc., Boston, Mass., 1966.<br />

[53] C.-G. Esséen: On the Lia<strong>po</strong>unoff limit of error in the theory of probability, Ark. Mat.<br />

Astr. Fys. 28A (1942), 19.<br />

[54] : Fourier analysis of distribution functions. A mathematical study of the Laplace-<br />

Gaussian law, Acta Math. 77 (1945), 1–125.<br />

[55] S. N. Ethier, T. G. Kurtz: Markov Processes, Wiley Series in Probability and Mathematical<br />

Statistics: Probability and Mathematical Statistics, John Wiley & Sons<br />

Inc., New York, 1986.<br />

[56] L. C. Evans, R. F. Gariepy: Measure Theory and Fine Properties of Functions, Studies<br />

in Advanced Mathematics, CRC Press, Boca Raton, FL, 1992.<br />

[57] H. Federer: Geometric Measure Theory, Die Grundlehren der mathematischen<br />

Wissenschaften, Band 153, Springer-Verlag New York Inc., New York, 1969.<br />

[58] W. Feller: Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung, Math.<br />

Z. 40 (1935), 521–559.<br />

[59] : On the Berry-Esseen theorem, Z. Wahrsch. verw. Gebiete 10 (1968), 261–268.<br />

[60] L. Goldstein: Normal approximation for hierarchical structures, Ann. Appl. Probab.<br />

14 (2004), 1950–1969.<br />

[61] : Berry-Esseen bounds for combinatorial central limit theorems and pattern<br />

occurrences, using zero and size biasing, J. Appl. Probab. 42 (2005), 661–683.<br />

[62] L. Goldstein, G. Reinert: Stein’s method and the zero bias transformation with application<br />

to simple random sampling, Ann. Appl. Probab. 7 (1997), 935–952.<br />

[63] L. Goldstein, Y. Rinott: Multivariate normal approximations by Stein’s method and<br />

size bias couplings, J. Appl. Probab. 33 (1996), 1–17.<br />

[64] F. Götze: On the rate of convergence in the multivariate CLT, Ann. Probab. 19 (1991),<br />

724–739.<br />

[65] P. R. Halmos: Measure Theory, D. Van Nostrand Company, Inc., New York, N. Y.,<br />

1950.


317<br />

[66] S.-T. Ho, L. H. Y. Chen: An L p bound for the remainder in a combinatorial central limit<br />

theorem, Ann. Probab. 6 (1978), 231–249.<br />

[67] W. Hoeffding: A class of statistics with asymptotically normal distribution, Ann. Math.<br />

Statisitcs 19 (1948), 293–325.<br />

[68] M. L. Katz: Note on the Berry-Esseen theorem, Ann. Math. Statist. 34 (1963), 1107–<br />

1108.<br />

[69] P. N. Kokic, N. C. Weber: An Edgeworth expansion for U-statistics based on samples<br />

from finite <strong>po</strong>pulations, Ann. Probab. 18 (1990), 390–404.<br />

[70] : Large deviation probabilities for U-statistics based on samples from finite <strong>po</strong>pulations,<br />

Exploring stochastic laws, VSP, Utrecht, 1995, str. 175–181.<br />

[71] U. Konieczna: Asymptotic normality of the vertex degree in random subgraphs of the<br />

n-cube, Math. Nachr. 154 (1991), 217–224.<br />

[72] M. Konvalinka: Aproksimacijska lastnost, Magistrsko delo, <strong>Univerza</strong> v <strong>Ljubljani</strong>,<br />

2004.<br />

[73] P. Lévy: Calcul des probabilités, Paris, 1925.<br />

[74] J. W. Lindeberg: Eine neue Herleitung des Ex<strong>po</strong>nentialgesetzes in der Wahrscheinlichkeitsrechnung,<br />

Math. Z. 15 (1922), 211–225.<br />

[75] A. M. Ljapunov: Sur une pro<strong>po</strong>sition de la théorie des probabilités, Bull. Acad. Imp.<br />

Sci. St. Petersb. 13 (1900), 359–386.<br />

[76] : Nouvelle forme du théorème sur la limite de probabilité, Mem. Acad. Sci. St.<br />

Petersb. 12 (1901), 1–24.<br />

[77] W.-L. Loh: Stein’s method and multinomial approximation, Ann. Appl. Probab. 2<br />

(1992), 536–554.<br />

[78] H. M. Luk: Stein’s method for the gamma distribution and related statistical applications,<br />

Doktorska disertacija, Univ. Southern California, 1994.<br />

[79] C. T. McMullen: Lipschitz maps and nets in Euclidean space, Geom. Funct. Anal. 8<br />

(1998), 304–314.<br />

[80] V. G. Mikhailov: Estimation of the accuracy of com<strong>po</strong>und Poisson approximation for<br />

the distribution of the number of coinciding chains, Theory Probab. Appl. 46 (2003),<br />

667–675.<br />

[81] R. von Mises: On the asymptotic distribution of differentiable statistical functions,<br />

Ann. Math. Statistics 18 (1947), 309–348.<br />

[82] A. de Moivre: The Doctrine of Chances: A method of calculating the probability of<br />

events in play, London, 1718.


318<br />

[83] S. V. Nagaev: An estimate of the remainder term in the multidimensional central limit<br />

theorem, Proceedings of the Third Japan-USSR Sym<strong>po</strong>sium on Probability Theory<br />

(Tashkent, 1975) (Berlin), Springer, 1976, str. 419–438. Lecture Notes in Math., Vol.<br />

550.<br />

[84] H. K. Nandi, P. K. Sen: On the properties of U-statistics when the observations are not<br />

independent. II. Unbiased estimation of the parameters of a finite <strong>po</strong>pulation, Calcutta<br />

Statist. Assoc. Bull. 12 (1963), 124–148.<br />

[85] J. F. Nash, Jr.: Equilibrium <strong>po</strong>ints in n-person games, Proc. Nat. Acad. Sci. U. S. A.<br />

36 (1950), 48–49.<br />

[86] : Non-cooperative games, Ann. of Math. (2) 54 (1951), 286–295.<br />

[87] F. Nazarov: On the maximal perimeter of a convex set inR n with respect to a Gaussian<br />

measure, Geometric aspects of functional analysis, Lecture Notes in Math., vol.<br />

1807, Springer, Berlin, 2003, str. 169–187.<br />

[88] É. Pardoux, A. Y. Veretennikov: On the Poisson equation and diffusion approximation.<br />

I, Ann. Probab. 29 (2001), 1061–1085.<br />

[89] : On Poisson equation and diffusion approximation. II, Ann. Probab. 31 (2003),<br />

1166–1192.<br />

[90] : On the Poisson equation and diffusion approximation 3, Ann. Probab. 33<br />

(2005), 1111–1133.<br />

[91] V. Paulauskas: O mnogomernoj central’noj predel’noj teoreme, Lietuvos Matematikos<br />

Rinkinys 10 (1970), 783–789.<br />

[92] V. V. Petrov: Odna ocenka otklonjenija raspredeljenija summy nezavismyh slučajnyh<br />

veličin ot normal’nogo zakona, Dokl. akad. nauk SSSR 160 (1965), 1013–1015.<br />

[93] S. T. Račev: Zadača Monža-Kantoroviča o peremeščeniji mass i jeje primenjenija v<br />

stohastike, Teor. verojatnost. i primenen. 29 (1984), 625–653.<br />

[94] M. Raič: Chen–Steinova metoda, Magistrsko delo, <strong>Univerza</strong> v <strong>Ljubljani</strong>, 1998.<br />

[95] : Normal approximation by Stein’s method, Metodološki zvezki, vol. 21, FDV,<br />

Ljubljana, 2003, str. 71–97.<br />

[96] : A multivariate CLT for decom<strong>po</strong>sable random vectors with finite second moments,<br />

J. Theoret. Probab. 17 (2004), 573–603.<br />

[97] : CLT-related large deviation bounds based on Stein’s method, To appear in<br />

Advances in Applied Probability, 2007.<br />

[98] R. R. Rao: Some problems in probability theory, Doktorska disertacija, Calcutta<br />

University, 1960.


319<br />

[99] : On the central limit theorem in R k , Bull. Amer. Math. Soc. 67 (1961), 359–361.<br />

[100] G. Reinert: The asymptotic evolution of the general stochastic epidemic, Ann. Appl.<br />

Probab. 5 (1995), 1061–1086.<br />

[101] : A weak law of large numbers for empirical measures via Stein’s method, Ann.<br />

Probab. 23 (1995), 334–354.<br />

[102] : Stein’s method for epidemic processes, Complex stochastic systems (Eindhoven,<br />

1999), Monogr. Statist. Appl. Probab., vol. 87, Chapman & Hall/CRC, Boca<br />

Raton, FL, 2001, str. 235–275.<br />

[103] Y. Rinott: On normal approximation rates for certain sums of dependent random variables,<br />

J. Comput. Appl. Math. 55 (1994), 135–143.<br />

[104] Y. Rinott, V. Rotar: A multivariate CLT for local dependence with n −1/2 log n rate and<br />

applications to multivariate graph related statistics, J. Multivariate Anal. 56 (1996),<br />

333–350.<br />

[105] : On coupling constructions and rates in the CLT for dependent summands with<br />

applications to the antivoter model and weighted U-statistics, Ann. Appl. Probab. 7<br />

(1997), 1080–1105.<br />

[106] : Normal approximations by Stein’s method, Decis. Econ. Finance 23 (2000),<br />

15–29.<br />

[107] : On Edgeworth expansions for dependency-neighborhoods chain structures and<br />

Stein’s method, Probab. Theory Related Fields 126 (2003), 528–570.<br />

[108] Y. Rinott, M. Scarsini: On the number of pure strategy Nash equilibria in random<br />

games, Games Econom. Behav. 33 (2000), 274–293.<br />

[109] L. C. G. Rogers, D. Williams: Diffusions, Markov Processes, and Martingales. Vol.<br />

1, Cambridge Mathematical Library, Cambridge University Press, Cambridge,<br />

2000.<br />

[110] W. Rudin: Real and Complex Analysis, McGraw-Hill Book Co., New York, 1987.<br />

[111] : Functional Analysis, International Series in Pure and Applied Mathematics,<br />

McGraw-Hill Inc., New York, 1991.<br />

[112] T. Salvemini: Sul calcolo degli indici di concordanza tra due caratteri quantitativi, Atti<br />

della VI Riunione Soc. Ital. di Statistica (Roma), 1943.<br />

[113] V. V. Sazonov: On the multi-dimensional central limit theorem, Sankhyā Ser. A 30<br />

(1968), 181–204.<br />

[114] : On a bound for the rate of convergence in the multidimensional central limit<br />

theorem, Proceedings of the Sixth Berkeley Sym<strong>po</strong>sium on Mathematical Statistics<br />

and Probability (Univ. California, Berkeley, Calif., 1970/1971), Vol. II: Probability<br />

theory (Berkeley, Calif.), Univ. California Press, 1972, str. 563–581.


320<br />

[115] : Normal Approximation — Some Recent Advances, Lecture Notes in Mathematics,<br />

vol. 879, Springer-Verlag, Berlin, 1981.<br />

[116] W. Schneller: A short proof of Motoo’s combinatorial central limit theorem using Stein’s<br />

method, Probab. Theory Related Fields 78 (1988), 249–252.<br />

[117] : Edgeworth expansions for linear rank statistics, Ann. Statist. 17 (1989), 1103–<br />

1123.<br />

[118] W. Schoutens: Orthogonal <strong>po</strong>lynomials in Stein’s method, J. Math. Anal. Appl. 253<br />

(2001), 515–531.<br />

[119] V. V. Senatov: Several estimates of the rate of convergence in the multidimensional<br />

central limit theorem, Dokl. Akad. Nauk SSSR 254 (1980), 809–812.<br />

[120] R. J. Serfling: Approximation Theorems of Mathematical Statistics, John Wiley & Sons<br />

Inc., New York, 1980.<br />

[121] I. G. Ševcova: Utočnjenje ocenok skorosti shodimosti v teoreme Ljapunova, <strong>po</strong>slano v<br />

objavo v Doklady Akademii Nauk, 2010.<br />

[122] A. N. Shiryaev: Probability, Graduate Texts in Mathematics, vol. 95, Springer-<br />

Verlag, New York, 1996.<br />

[123] R. L. Smith: Extreme value theory for dependent sequences via the Stein-Chen method<br />

of Poisson approximation, Stochastic Process. Appl. 30 (1988), 317–327.<br />

[124] C. Stein: A bound for the error in the normal approximation to the distribution of a<br />

sum of dependent random variables, Proceedings of the Sixth Berkeley Sym<strong>po</strong>sium<br />

on Mathematical Statistics and Probability (Univ. California, Berkeley, Calif.,<br />

1970/1971), Vol. II: Probability theory (Berkeley, Calif.), Univ. California Press,<br />

1972, str. 583–602.<br />

[125] : Approximate Computation of Expectations, Institute of Mathematical Statistics<br />

Lecture Notes—Monograph Series, 7, Institute of Mathematical Statistics,<br />

Hayward, CA, 1986.<br />

[126] C. Stein, P. Diaconis, S. Holmes, G. Reinert: Use of exchangeable pairs in the analysis<br />

of simulations, Stein’s method: ex<strong>po</strong>sitory lectures and applications, IMS Lecture<br />

Notes Monogr. Ser., vol. 46, Inst. Math. Statist., Beachwood, OH, 2004, str. 1–26.<br />

[127] S. Sternberg: Lectures on differential geometry, Prentice-Hall Inc., Englewood Cliffs,<br />

N.J., 1964.<br />

[128] J. A. Tawn: Estimating probabilities of extreme sea-levels, J. Royal Statist. Soc. Ser. C<br />

41 (1992), 77–93.<br />

[129] L. C. Zhao, X. R. Chen: Berry-Esseen bounds for finite-<strong>po</strong>pulation U-statistics, Sci.<br />

Sinica Ser. A 30 (1987), 113–127.


321<br />

[130] : Normal approximation for finite-<strong>po</strong>pulation U-statistics, Acta Math. Appl.<br />

Sinica (English Ser.) 6 (1990), 263–272.<br />

[131] L. Zhao, Z. Bai, C.-C. Chao, W.-Q. Liang: Error bound in a central limit theorem of<br />

double-indexed permutation statistics, Ann. Statist. 25 (1997), 2210–2227.<br />

[132] V. M. Zolotarjev: Absoljutnaja ocenka ostatnočnogo člena v central’noj predel’noj teoreme,<br />

Teor. verojatnost. i primenjen. 11 (1966), 108–119.<br />

[133] : A sharpening of the inequality of Berry-Esseen, Z. Wahrsch. verw. Gebiete 8<br />

(1967), 332–342.


322


Notacija<br />

1. Množice, logika<br />

A c<br />

komplement množice oz. dogodka<br />

N {1, 2, 3,...}<br />

N 0 {0, 1, 2,...}<br />

1(izjava) 1, če je izjava resnična, sicer pa 0<br />

1 A indikator množice: 1 A (x)=1, če je x∈A, in 1 A (x)=0, če xA.<br />

2. Števila<br />

x + max{x, 0}<br />

x − max{−x, 0}<br />

3. Vektorji in tenzorji<br />

|x|<br />

u 1 u 2 ...u r<br />

I<br />

I<br />

I T<br />

sl A<br />

|U| ∧<br />

|U| ∨<br />

dolžina vektorja<br />

če so u i vektorji ali tenzorji: skrčitveni produkt (glej razdelek D.5)<br />

identična matrika oz. identični mešani (1, 1)-tenzor (glej razdelek<br />

D.5)<br />

fundamentalni kovariantni tenzor (glej razdelek D.7)<br />

fundamentalni kontravariantni tenzor (glej razdelek D.7)<br />

sled tenzorja (glej razdelek D.5)<br />

projektivna norma (glej razdelek D.8)<br />

injektivna norma (glej razdelek D.8)<br />

4. Funkcije<br />

φ standardizirana Gaussova gostota, t. j.φ(x)=(2π) −1/2 e − 1 2 x2 .<br />

φ d standardizirana Gaussova gostota vR d , t. j.<br />

φ d (x)=(2π) −d/2 e − 1 2 |x|2 .<br />

Φ<br />

ψ<br />

Gaussov verjetnostni integral, t. j.Φ(x)= ∫ x<br />

−∞<br />

φ(z) dz.<br />

Millsovo razmerje, t. j.ψ(x)=Φ(x)/φ(x) (glej dodatek C).<br />

323


324<br />

5. Operacije s funkcijami<br />

f ′ (x)v<br />

f (r) (x)v 1 ...v r<br />

M 0 ( f )<br />

M r ( f )<br />

odvod funkcije f pri x v smeri vektorja v (glej razdelek E.1)<br />

odvod funkcije f reda r pri x v smereh v 1 ,...v r (glej razdelek E.1)<br />

sup x<br />

| f (x)| (glej razdelek E.5)<br />

za r∈N: sup<br />

xy<br />

∥ f (r−1) (x)− f (r−1) (y) ∥ ∥ ∥∨<br />

|x− y|<br />

(glej razdelek E.5)<br />

V( f ) totalna variacija funkcije f (glej razdelek 4.1)<br />

grad f<br />

div u<br />

∆ f<br />

gradient (glej razdelek E.1)<br />

divergenca (glej razdelek E.1)<br />

Laplaceov operator (glej razdelek E.1)<br />

6. Funkcijski prostori (za vse <strong>po</strong>drobnosti glej razdelka E.3 in E.5)<br />

C(D)<br />

C c (D)<br />

C (r) (D)<br />

C (r)<br />

c (D)<br />

♭(D),♭ (0) (D)<br />

♭ loc (D),♭ (0)<br />

loc (D)<br />

♭ (r) (D),♭ (r)<br />

loc (D)<br />

L p (D)<br />

L p loc (D)<br />

prostor zveznih funkcij iz D vR<br />

prostor zveznih funkcij iz D vRskompaktnim nosilcem<br />

prostor r-krat zvezno odvedljivih funkcij iz D vR<br />

prostor r-krat zvezno odvedljivih funkcij iz D vRskompaktnim<br />

nosilcem<br />

prostor Lebesguovo merljivih omejenih funkcij iz D vR<br />

prostor Lebesguovo merljivih lokalno omejenih funkcij<br />

r≥1: prostor zveznih r-krat šibko odvedljivih funkcij z (lokalno)<br />

omejenim r-tim šibkim odvodom<br />

prostor funkcij z integrabilno p-to absolutno <strong>po</strong>tenco (oz. končnim<br />

absolutnim bistvenim supremumom pri p=∞)<br />

prostor funkcij, ki so lokalno v Lp<br />

W r,p (D),W r,p<br />

(D) prostori Soboljeva<br />

loc<br />

C (r) (D; V),W r,p (D; V), . . . prostori ustreznih preslikav iz D v vektorski prostor V


NOTACIJA 325<br />

7. Slučajne spremenljivke, <strong>po</strong>razdelitve<br />

E X<br />

var(X)<br />

matematično upanje slučajne spremenljivke ali slučajnega vektorja<br />

X. Privzeli bomo, da ima množenje prednost pred matematičnim<br />

upanjem, tako daE XY <strong>po</strong>meniE(XY).<br />

v enorazsežnem primeru varianca, v večrazsežnem kovariantni<br />

2-tenzor, ki ustreza kovariančni matriki: var(X) :=E(X−E X) 2<br />

Var(X) kovariančna matrika oz. ustrezni mešani (1, 1)-tenzor: Var(X) :=<br />

E(X−E X)(X−E X) T<br />

cov(X, Y), Cov(X, Y) kovariančni različici var in Var<br />

Z<br />

L(X)<br />

δ x<br />

Po(λ)<br />

N(µ,σ 2 )<br />

N(µ,Σ)<br />

standardizirana normalna slučajna spremenljivka ali vektor<br />

<strong>po</strong>razdelitev slučajne spremenljivke X<br />

Diracova mera v točki x<br />

Poissonova <strong>po</strong>razdelitev<br />

enorazsežna normalna <strong>po</strong>razdelitev z matematičnim upanjemµ<br />

in variancoσ 2<br />

večrazsežna normalna <strong>po</strong>razdelitev z matematičnim upanjemµ<br />

in kovariančno matrikoΣ<br />

8. Funkcije, ki se razlikujejo skoraj <strong>po</strong>vsod. Nekatere operacije na funkcijah oz. slučajnih<br />

spremenljivkah (npr. <strong>po</strong>gojno matematično upanje ali šibki odvod) nam ne dajo enoličnega<br />

rezultata, temveč cel razred funkcij, ki imajo to lastnost, da se <strong>po</strong>ljubni dve izmed<br />

njih skoraj <strong>po</strong>vsod ujemata. Natančneje, dobljeni razredi imajo obliko f+η, kjerηteče<br />

<strong>po</strong> vsehN-merljivih funkcijah,N pa je izrojenaσ-algebra, t. j. taka, da za vsak A∈N<br />

velja, da ima bodisi A bodisi A c mero nič. Z drugimi besedami, vsak tak razred funkcij<br />

je določen z izrojenoσ-algebro in predstavnikom (verzijo).<br />

Ker se funkcije znotraj <strong>po</strong>sameznega razreda skoraj <strong>po</strong>vsod ujemajo, jih bomo, kot je<br />

to navada, v pisavi kar enačili s funkcijami samimi v skladu z naslednjimi dogovori:<br />

E(X|F )<br />

Zaσ-algebro vzamemo množico vseh dogodkov izF , ki imajo<br />

verjetnost nič ali ena (ni <strong>po</strong>membno, ali je slučajna spremenljivka<br />

X natančno določena ali je v resnici ekvivalenčni razred).<br />

f 1 = f 2 , f 1 < f 2 itd. Če je f i določen s predstavnikom f ˜ i in izrojenoσ-algebroN i ,<br />

npr. zapis f 1 = f 2 <strong>po</strong>meni, da obstaja takaσ(N 1 ∪N 2 )-merljiva<br />

funkcijaη, da je f 1 = f 2 +η. Tako, če je Y strogo določena slučajna<br />

spremenljivka, zapis Y=E(X|F ) <strong>po</strong> definiciji <strong>po</strong>meni tudi, da<br />

je Y merljiva glede naF .


326<br />

f 1 = f 2 p.p., Y 1 ≤ Y 2 s.g. Podobno kot prej, le da namestoσ(N 1 ∪N 2 ) vzamemoσalgebro<br />

vseh množic, ki so vsebovani v množicah z mero nič ali<br />

pa to velja za njihove komplemente.<br />

f 1 + f 2 itd.<br />

Če je f i določen s predstavnikom f ˜ i in izrojenoσ-algebroN i , je<br />

razred f 1 + f 2 <strong>po</strong> definiciji določen s predstavnikom f ˜ 1 + f ˜ 2 in<br />

σ-algebroσ(N 1 ∪N 2 ).<br />

f∈A<br />

Obstaja vsaj ena verzija, ki pripadaA.<br />

f ima določeno lastnost. Obstaja vsaj ena verzija, ki ima to lastnost.<br />

p( f ) če je p seminorma: infimum seminorme <strong>po</strong> vseh predstavnikih<br />

f (x)<br />

Če f ni natančno določena, tudi x ne more biti spremenljivka s<br />

točno določeno vrednostjo, lahko pa je <strong>po</strong>možna spremenljivka<br />

(npr. v integralu).<br />

9. Metrike na prostorih <strong>po</strong>razdelitev<br />

d TV<br />

d W<br />

d K<br />

Metrika totalne variacije: d TV (µ,ν)=sup A<br />

|µ(A)−ν(A)|; glej razdelek<br />

A.2.<br />

Wassersteinova metrika: d W (µ,ν)=sup{|µ( f )−ν( f )| ; M 1 ( f )≤1};<br />

glej razdelek A.8.<br />

Metrika Kolmogorova: d K (µ,ν)=sup x<br />

∣ ∣∣µ<br />

(<br />

(−∞, x]<br />

)<br />

−µ<br />

(<br />

(−∞, x]<br />

)∣ ∣∣;<br />

glej razdelek A.10.


Stvarno kazalo<br />

<strong>aproksimacija</strong><br />

enorazsežna normalna, 15<br />

rešitev Steinove enačbe, 18, 65, 136<br />

Steinov operator, 9, 16, 17<br />

Steinova enačba, 17, 65, 67<br />

Poissonova, 11<br />

rešitev Steinove enačbe, 13<br />

Steinov operator, 11, 12<br />

Steinova enačba, 12<br />

večrazsežna normalna, 23, 44<br />

enoličnost reš. St. en., 56<br />

rešitev Steinove enačbe, 49<br />

Steinov operator, 35<br />

Steinova enačba, 45, 49, 67<br />

barvanje grafa, 173<br />

baza<br />

dualna, 222<br />

Berry–Esséenov izrek, 134<br />

dokaz s Steinovo metodo, 136<br />

primer na obarvanih grafih, 174<br />

v več dimenzijah, 148<br />

za konveksne mn., 147<br />

za lok. maks. v grafih, 175<br />

za lokalno odvisnost, 143<br />

za Nasheva ravnotežja, 176<br />

za odvisne sl. spr., 142<br />

za sluč. grafe, 179<br />

za stat. konč. <strong>po</strong>p., 168<br />

za statistike, 166<br />

za stopnje oglišč, 182<br />

dimenzija<br />

Hausdorffova, 270<br />

konveksne množice, 277<br />

divergenca, 244<br />

dualna baza, 222<br />

dualni par<br />

evklidskih prostorov, 232<br />

vektorskih prostorov, 222<br />

dvig indeksa, 232<br />

dvojno indeks. permut. stat., 77<br />

Dynkinova formula, 31, 212<br />

enorazsežna normalna aproks., 15<br />

Steinov operator, 9, 16, 17<br />

Steinova enačba, 17, 65, 67<br />

rešitev, 18, 65, 136<br />

fundamentalni tenzor, 234<br />

Gaussov perimeter, 292, 293<br />

konv. množice, ocena, 293<br />

generator operatorske <strong>po</strong>lgrupe, 208<br />

glajenje, 123, 136, 151<br />

gradient, 244<br />

graf<br />

barvanje, 173<br />

lokalni maksimum, 174<br />

Berry–Esséenov izrek, 175<br />

odvisnosti, 94<br />

slučajni, 179<br />

Berry–Esséenov izrek, 179<br />

stopnja oglišča, 181<br />

Berry–Esséenov izrek, 182<br />

Hausdorffova dimenzija, 270<br />

Hausdorffova mera, 268<br />

Hille–Yosidov izrek, 214<br />

identični tenzor, 230<br />

indeks<br />

dvig, spust, 232<br />

injektivna norma, 235<br />

izmenljivost, 9, 71<br />

izrek<br />

Berry–Esséenov, 134<br />

327


328<br />

dokaz s Steinovo metodo, 136<br />

primer na obarvanih grafih, 174<br />

za lok. maks. v grafih, 175<br />

za lokalno odvisnost, 143<br />

za Nasheva ravnotežja, 176<br />

za odvisne sl. spr., 142<br />

za sluč. grafe, 179<br />

za stat. konč. <strong>po</strong>p., 168<br />

za statistike, 166<br />

za stopnje oglišč, 182<br />

Fubinijev<br />

krivočrtni, 273<br />

Hille–Yosidov, 214<br />

Le Camov, 13<br />

Lindeberg–Fellerjev, 113<br />

Lindebergov<br />

za lokalno odvisnost, 118<br />

Rademacherjev, 255<br />

jacobiana, 271<br />

konveksna množica, 147, 275<br />

ocena Gauss. perimetra, 293<br />

konvergenca<br />

šibka, 187<br />

zadostni <strong>po</strong>goji, 191<br />

konvergenca v metriki<br />

zadostni <strong>po</strong>goji, 193<br />

krivočrtni Fubinijev izrek, 273<br />

kumulativna prema utežitev, 95<br />

konstrukcija, 99<br />

Laplaceov operator, 244<br />

Le Camov izrek, 13<br />

Lindeberg–Bergströmova metoda, 24<br />

Lindeberg–Fellerjev izrek, 113<br />

Lindebergov izrek<br />

za lokalno odvisnost, 118<br />

Lindebergov <strong>po</strong>goj, 113<br />

Lipschitzeva preslikava, 255<br />

lokalna odvisnost, 93, 108, 117, 123, 141,<br />

142, 146, 166, 174, 176<br />

Berry–Esséenov izrek, 143<br />

Lindebergov izrek, 118<br />

lokalni maksimum v grafu, 174<br />

Berry–Esséenov izrek, 175<br />

markovske verige, 27<br />

mera<br />

Hausdorffova, 268<br />

zunanja, 265<br />

merljiva množica, 266<br />

mešani tenzor, 228<br />

metoda zveznega nadaljevanja, 31<br />

metrika<br />

d r , 26, 133, 197<br />

iz testnih funkcij, 185<br />

Kolmogorova, 19, 133, 193, 202<br />

Prohorova, 191<br />

totalne variacije, 12<br />

Wassersteinova, 18, 26, 133, 196<br />

večrazsežne ocene, 120<br />

Millsovo razmerje, 19, 57, 215<br />

odvodi, 217<br />

množica<br />

konveksna, 147, 275<br />

ocena Gauss. perimetra, 293<br />

merljiva, 266<br />

multilinearna preslikava, 221<br />

simetrična, 239<br />

Nashevo ravnotežje, 176<br />

Berry–Esséenov izrek, 176<br />

neodvisne slučajne spr., 10, 11, 15, 24, 28,<br />

44, 47, 74, 82, 88, 92, 98, 102, 108,<br />

114, 116, 122, 134, 135, 146, 147, 166<br />

neodvisni slučajni vektorji, 24, 44, 47, 122,<br />

146, 147<br />

norma<br />

dualna, 235<br />

injektivna, 235<br />

na tenzorskem prod. evkl. pr., 238<br />

projektivna, 236<br />

normalna <strong>aproksimacija</strong><br />

enorazsežna, 15<br />

rešitev Steinove enačbe, 18, 65, 136<br />

Steinov operator, 9, 16, 17<br />

Steinova enačba, 17, 65, 67<br />

večrazsežna, 23, 44<br />

enoličnost reš. St. en., 56<br />

rešitev Steinove enačbe, 49<br />

Steinov operator, 35


NOTACIJA 329<br />

Steinova enačba, 45, 49, 67<br />

odvod<br />

klasični, 243<br />

smerni, 243<br />

šibki, 248<br />

operatorska <strong>po</strong>lgrupa, 31, 207<br />

generator, 208<br />

kontrakcijska, 207<br />

krepko zvezna, 207<br />

Ornstein–Uhlenbeckova, 35<br />

o<strong>po</strong>rni <strong>po</strong>lprostor, 279<br />

Ornstein–Uhlenbeckov proces, 35<br />

Ornstein–Uhlenbeckova <strong>po</strong>lgrupa, 35<br />

perimeter<br />

Gaussov, 292, 293<br />

konv. množice, ocena, 293<br />

permutacije<br />

slučajne, 75, 89, 93, 102, 109<br />

Poissonova <strong>aproksimacija</strong>, 11<br />

Steinov operator, 11, 12<br />

Steinova enačba, 12<br />

rešitev, 13<br />

<strong>po</strong>vezave s kraj. iste barve, 173<br />

Berry–Esséenov izrek, 174<br />

pravokotna projekcija, 281<br />

prema utežitev, 80<br />

konstrukcija, 83<br />

projekcija<br />

pravokotna, 281<br />

radialna, 283<br />

projektivna norma, 236<br />

prostor Soboljeva, 249<br />

Rademacherjev izrek, 255<br />

radialna funkcija, 283<br />

radialna projekcija, 283<br />

razčlenitve<br />

prvega reda, 91<br />

drugega reda, 105<br />

tretjega reda, 120<br />

relativna prema utežitev, 83<br />

resolventa, 213<br />

sklicevanje nase, 126, 138, 141, 143, 151<br />

skrčitev tenzorskega produkta, 227<br />

skrčitveni produkt, 228<br />

sled, 227<br />

slučajne permutacije, 75, 89, 93, 102, 109<br />

slučajni graf, 179<br />

Berry–Esséenov izrek, 179<br />

smerni odvod, 243<br />

spust indeksa, 232<br />

statistika, 165<br />

končne <strong>po</strong>pulacije, 165, 168<br />

U-, 165, 167, 169<br />

V-, 165<br />

Steinov operator, 7<br />

konstrukcija, 9<br />

za enorazsežno normalno <strong>po</strong>razd., 9,<br />

16, 17<br />

za Poissonovo <strong>po</strong>razdelitev, 11, 12<br />

večrazsežno normalno <strong>po</strong>razd., 35<br />

Steinova enačba, 8<br />

primerjava enorazs. in večrazs., 65<br />

za enorazsežno normalno <strong>po</strong>razd., 17,<br />

65, 67<br />

rešitev, 18, 65, 136<br />

za Poissonovo <strong>po</strong>razd., 12<br />

rešitev, 13<br />

za večrazsežno normalno <strong>po</strong>razd., 45,<br />

49, 67<br />

enoličnost rešitve, 56<br />

rešitev, 49<br />

stopnja oglišča, 181<br />

Berry–Esséenov izrek, 182<br />

šibka konvergenca, 187<br />

zadostni <strong>po</strong>goji, 191<br />

šibka to<strong>po</strong>logija<br />

običajna, 190<br />

primerjava, 191<br />

v splošnem, 187<br />

šibki odvod, 248<br />

Taylorjeva formula, 246<br />

za šibke odvode, 250<br />

tenzor, 223<br />

fundamentalni, 234<br />

identični, 230<br />

injektivna norma, 235


330<br />

mešani, 228<br />

projektivna norma, 236<br />

razcepen, 223<br />

simetričen, 239<br />

skrčitveni produkt, 228<br />

tenzorski produkt, 223<br />

končnorazsežnih prostorov, 225<br />

skrčitev, 227<br />

tenzorski prod. evklidskih prostorov, 231<br />

to<strong>po</strong>logija<br />

šibka<br />

običajna, 190<br />

primerjava, 191<br />

v splošnem, 187<br />

U-statistika, 165, 167, 169<br />

utežitev<br />

kumulativna prema, 95<br />

konstrukcija, 99<br />

prema, 80<br />

konstrukcija, 83<br />

relativna prema, 83<br />

večrazsežna normalna aproks., 23, 44<br />

Steinov operator, 35<br />

Steinova enačba, 45, 49, 67<br />

enoličnost rešitve, 56<br />

rešitev, 49<br />

vektorski prostor<br />

dualni par, 222<br />

dualni par evklidskih, 232<br />

norma na tenz. prod. evklidskih, 238<br />

tenzorski produkt, 223<br />

tenzorski produkt evklidskih, 231<br />

tenzorski prod. končnorazsežnih, 225<br />

V-statistika, 165<br />

Wassersteinova metrika, 18, 26, 133, 196<br />

večrazsežne ocene, 120<br />

zunanja mera, 265


NOTACIJA 331<br />

Izjava<br />

Podpisani Martin Raič izjavljam, da je pričujoča disertacija plod lastnega raziskovalnega<br />

dela.<br />

V <strong>Ljubljani</strong>, 22. marca 2006<br />

Martin Raič

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!