Approximationstheorie

Weitere Magazine

Empfehlungen

Info

178 8 DER SATZ VON KOLMOGOROFF Abbildung 8.7: Die Sigmoidfunktion aus (8.20). Durch Umskalierung σ (λ·), λ > 0, kann man den Steigungsteil natürlich beliebig steil oder flach machen. Obwohl die Funktion nie exakt die Werte 0 und 1 annimmt, erreicht sie diese aber “praktisch” schon relativ bald. Wie der Name sagt, stehen Eingabelayer immer am Anfang, Ausgabelayer immer am Ende des Prozesses. Derartige Layer können nun beliebig baumartig ineinander verschachtelt werden und führen dann eben zu einem neuronalen Netzwerk 225 . Die “moderne” numerische Bedeutung des Satzes von Kolmogoroff liegt nun darin, daß man ihn als einen Darstellungssatz für neuronale Netzwerke interpretieren kann, wobei für j = 0, . . . , 2s zuerst je einen Eingabelayer basierend auf φj verwendet 226 , diese Ausgaben dann durch jeweils einen einfachen Layer mit Anregungsfunktion g, Gewichten λ1, . . . , λs und nur einem Ausgabkanal schickt und die Resultate durch ein triviales Ausgabenetzwerk kombinieren lässt. Trivial bedeutet in diesem Fall, daß alle Gewichte den Wert 1 und die Anregungsfunktion die Identität ist. Toll – neuronale Netze können also jede Funktion darstellen, aber (zumindest, wenn man Satz 8.2 verwenden will) in diesem Fall muss eine der Anregungsfunktionen sehr massiv von der darzustellenden Funktion f abhängen und müsste dann selbst wieder durch ein geeignetes Teilnetzwerk approximiert werden. Bleibt noch eine Frage zum Schluss: Wie erstellt man eigentlich generell so ein Netzwerk in einer Anwendung? Das ist erstaunlich einfach! Man verwendet sogenannte Trainingsdaten (x j , yj) ∈ R s+1 , belegt die freien Parameter w, also die Gewichte in den einzelnen Layern, 224Wer will kann dies als eine Einführung von projektiven Koordinaten sehen, auch wenn wir hier beim besten Willen keine projektive Geometrie betreiben. 225Enthält dieses Netzwerk als Graph keine geschlossenen Kreise, dann spricht man von einem Feedworward– Netzwerk, mit Kreisen kann es noch lustiger werden, denn dann kann sich das Netzwerk ja auch rekursiv selbst anregen. 226Die φj sind monoton steigende Funktionen von [0, 1] nach [0, 1], wenn man die noch für x < 0 zu 0 und für x > 1 zu 1 fortsetzt, dann hat man es durchaus mit einer Art Sigmoidfunktion zu tun.
8.4 Neuronale Netze 179 1 2 3 . . . m ϕ ϕ ϕ . . . ϕ 1 2 3 ... n Abbildung 8.8: Ein “Layer” eines neuronalen Netzwerkes: Die n Eingangskanäle werden, jeweils mit zu wählenden Gewichten, in alle Neuronen geführt. Diese Neuronen sind alle Kopien voneinander, haben also dieselbe Anregungsfunktion mit meist zufälligen Werten vor und minimiert dann die Abweichung des Netwerkes von den vorgegebenen Daten: N min (fw (xj) − yj) w 2 . j=1 Das ist ein nichtlineares Optimierungsproblem und für sowas gibt es Methoden, normalerweise sogenannte Abstiegsverfahren, siehe beispielsweise [58, 70]. Was ein paar ganz interessante Bemerkungen hervorruft: 1. Solche nichtlinearen Optimierungsverfahren finden normalerweise nur lokale Minima und es kann somit nicht garantiert werden, daß das Netzwerk die Parameter wirklich optimal einstellt. 2. Durch die zufällige Vorbelegung kann es passieren, daß bei verschiedenen “Trainingssitzungen” dieselben Eingaben zu verschiedenen Resultaten führen. 3. Generell haben neuronale Netzwerke relativ wenige wirklich beweisbare Eigenschaften und man kann nie wirklich garantieren, daß das Netzwerk für alle Eingabewerte gesicherte Ergebnisse liefert. Man kann noch vieles über neuronale Netze erzählen, aber das alles wäre wieder eine ganz andere Geschichte für sich.
Seite 1 und 2:
10 8 6 4 2 0 -4 -3 -2 -1 0 1 2 3 4
Seite 3 und 4:
INHALTSVERZEICHNIS 1 Inhaltsverzeic
Seite 5 und 6:
And first, so that all may understa
Seite 7 und 8:
1.2 Ein historisches Beispiel: Summ
Seite 9 und 10:
Seite 11 und 12:
Seite 13 und 14:
Seite 15 und 16:
1.3 Fazit 13 und somit Fn(t) ≤ 1
Seite 17 und 18:
Sunt qui quicquid in libris scriptu
Seite 19 und 20:
2.1 Der Satz von Weierstraß 17 Mit
Seite 21 und 22:
2.2 Der Satz von Stone 19 Satz 2.7
Seite 23 und 24:
2.2 Der Satz von Stone 21 und werde
Seite 25 und 26:
2.3 Der Satz von Bishop 23 Satz 2.1
Seite 27 und 28:
2.4 Müntz-Sätze 25 und da f −
Seite 29 und 30:
2.4 Müntz-Sätze 27 “·” das k
Seite 31 und 32:
2.4 Müntz-Sätze 29 Übung 2.7 Zei
Seite 33 und 34:
2.4 Müntz-Sätze 31 schreiben kön
Seite 35 und 36:
2.4 Müntz-Sätze 33 und somit cn c
Seite 37 und 38:
2.4 Müntz-Sätze 35 2. limj→∞
Seite 39 und 40:
3.1 Approximation durch lineare Rä
Seite 41 und 42:
3.1 Approximation durch lineare Rä
Seite 43 und 44:
3.2 Das Kolmogoroff-Kriterium und e
Seite 45 und 46:
Seite 47 und 48:
Seite 49 und 50:
Seite 51 und 52:
3.3 Haar-Räume und Alternanten 49
Seite 53 und 54:
Seite 55 und 56:
Seite 57 und 58:
Seite 59 und 60:
Seite 61 und 62:
3.4 Der Remez-Algorithmus 59 φ ∗
Seite 63 und 64:
3.4 Der Remez-Algorithmus 61 Dieses
Seite 65 und 66:
3.4 Der Remez-Algorithmus 63 Was al
Seite 67 und 68:
3.4 Der Remez-Algorithmus 65 muß y
Seite 69 und 70:
Bisweilen erweist sich das wahre Wi
Seite 71 und 72:
4.2 Simultanapproximation 69 was pe
Seite 73 und 74:
4.2 Simultanapproximation 71 also i
Seite 75 und 76:
4.3 Shape preservation 73 Satz 4.8
Seite 77 und 78:
4.4 Der Preis: Saturation 75 Übung
Seite 79 und 80:
4.4 Der Preis: Saturation 77 Satz 2
Seite 81 und 82:
4.4 Der Preis: Saturation 79 Lemma
Seite 83 und 84:
4.4 Der Preis: Saturation 81 zur Ko
Seite 85 und 86:
4.5 Multivariate Bernsteinpolynome
Seite 87 und 88:
Seite 89 und 90:
Seite 91 und 92:
Seite 93 und 94:
Seite 95 und 96:
5.1 Ein Satz von Bernstein 93 Bemer
Seite 97 und 98:
5.1 Ein Satz von Bernstein 95 Bewei
Seite 99 und 100:
5.3 Trigonometrische Polynome II: J
Seite 101 und 102:
5.3 Trigonometrische Polynome II: J
Seite 103 und 104:
5.4 Trigonometrische Polynome III:
Seite 105 und 106:
5.4 Trigonometrische Polynome III:
Seite 107 und 108:
5.5 Trigonometrische Polynome IV: D
Seite 109 und 110:
5.6 Trigonometrische Polynome V: Di
Seite 111 und 112:
5.7 Algebraische Polynome 109 1. Is
Seite 113 und 114:
5.7 Algebraische Polynome 111 Um nu
Seite 115 und 116:
5.7 Algebraische Polynome 113 Also
Seite 117 und 118:
6.1 Translationsinvariante Räume 1
Seite 119 und 120:
6.1 Translationsinvariante Räume 1
Seite 121 und 122:
6.2 Ein bißchen Fourieranalysis 11
Seite 123 und 124:
Seite 125 und 126:
Seite 127 und 128:
Seite 129 und 130: 6.3 Polynomreproduktion und die Str
Seite 135 und 136: 6.4 Approximationsordnung 133 6.4 A
Seite 137 und 138: 6.4 Approximationsordnung 135 worau
Seite 139 und 140: 6.4 Approximationsordnung 137 Bemer
Seite 141 und 142: 7.1 Multiresolution Analysis 139 2.
Seite 143 und 144: 7.1 Multiresolution Analysis 141 Pr
Seite 145 und 146: 7.2 Orthogonale Skalierungsfunktion
Seite 147 und 148: 7.2 Orthogonale Skalierungsfunktion
Seite 149 und 150: 7.3 Wavelets für orthonormale Skal
Seite 151 und 152: 7.3 Wavelets für orthonormale Skal
Seite 153 und 154: 7.4 Approximation mit Wavelets 151
Seite 161 und 162: 8.1 Nomographie, Hilberts 13. Probl
Seite 163 und 164: 8.1 Nomographie, Hilberts 13. Probl
Seite 165 und 166: 8.2 Von Würfeln und Intervallen 16
Seite 167 und 168: 8.2 Von Würfeln und Intervallen 16
Seite 169 und 170: 8.3 Der Beweis 167 ist. Der Grund h
Seite 171 und 172: 8.3 Der Beweis 169 4. Die Intervall
Seite 173 und 174: 8.3 Der Beweis 171 ε > 0, so daß
Seite 175 und 176: 8.3 Der Beweis 173 zusammen, die du
Seite 177 und 178: 8.3 Der Beweis 175 Bemerkung 8.12 D
Seite 179: 8.4 Neuronale Netze 177 w = (w0, .
Seite 183 und 184: LITERATUR 181 Uns ist in alten mær
Seite 185 und 186: LITERATUR 183 [29] H. Heuser. Lehrb
Seite 187 und 188: LITERATUR 185 [62] T. J. Ransford.
Seite 189 und 190: Abschluß, 19 Abstand, 37 Algebra,
Seite 191 und 192: INDEX 189 Identität approximative,
Seite 193: INDEX 191 Stammfunktion, 155 Standa
Alle anzeigen

Approximationstheorie

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?