Model Output Statistics
Model Output Statistics
Model Output Statistics
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Model</strong> <strong>Output</strong> <strong>Statistics</strong><br />
Vortrag im Rahmen des Seminars<br />
Medienmeteorologie<br />
Von Werner Schneider
Gliederung<br />
1) Behandlung von <strong>Model</strong>ldaten<br />
2) Funktionsweise von <strong>Model</strong> <strong>Output</strong> <strong>Statistics</strong> (MOS)<br />
3) Screening Regression<br />
4) Kreuzvalidation<br />
5) Auswahl von Prädiktoren<br />
6) Anwendung von MOS<br />
7) Zusammenfassung<br />
8) Literatur
1) Behandlung von <strong>Model</strong>ldaten<br />
Notwendigkeit der Anpassung von <strong>Model</strong>ldaten an<br />
reale Beobachtungsdaten<br />
• Keine exakte Beschreibung des Atmosphärischen Systems<br />
durch <strong>Model</strong>le möglich<br />
Zu große Datensätze<br />
Zu geringe Rechenleistung<br />
• <strong>Model</strong>ldaten nur an wenigen Gitterpunkten<br />
• Teilweise keine direkte Vorhersage der zu bestimmenden<br />
Größe
1) Behandlung von <strong>Model</strong>ldaten<br />
Die Methoden : Perfect Prog<br />
• Annahme: Perfektes <strong>Model</strong>l<br />
• Analysedaten beschreiben<br />
reale Situation nur auf<br />
falschen Skalen<br />
Statistischer Zusammenhang zwischen Stationsbeobachtungen und<br />
Analysedaten<br />
Angewendet auf Vorhersagedaten<br />
Vorteil: Großes Datenvolumen
1) Behandlung von <strong>Model</strong>ldaten<br />
Die Methoden : MOS<br />
• Annahme: Fehlerhaftes<br />
<strong>Model</strong>l<br />
• <strong>Model</strong>ldaten beschreiben<br />
andere Situation als<br />
Analysedaten<br />
Statistischer Zusammenhang zwischen Vorhersagedaten und<br />
Stationsbeobachtungen<br />
Angewendet auf Vorhersagedaten<br />
Vorteil: Keine beschränkenden Annahmen
2) Funktionsweise von MOS<br />
Lineare Regressionsgleichung<br />
Def.: Prädiktand > Vorherzusagende (abhängige) Variable Y<br />
Prädiktoren > Unabhängige Variablen X i<br />
‣ Linearer Ansatz:<br />
Ŷ = a 0 X 0 + a 1 X 1 + . . . + a k X k<br />
mit X 0 = 1 Konstante<br />
Ŷ Schätzer für Y<br />
a i Regressionskoeffizienten
2) Funktionsweise von MOS<br />
Probleme<br />
• Wie lassen sich nichtlineare Abhängigkeiten des<br />
Prädiktanden von Prädiktoren beschreiben ?<br />
• Sind die Prädiktoren unabhängig voneinander ?<br />
Bildung von Funktionen eines oder mehrerer<br />
Prädiktoren<br />
• Objektives Verfahren zur Bestimmung der<br />
optimalen Prädiktoren
3) Screening regression<br />
Ansatz<br />
‣ Stichprobe vom Umfang n<br />
Minimum der mittleren quadratischen Fehler (MSE) der Stichprobe<br />
=> Optimaler Schätzer â i<br />
MSE<br />
∑<br />
Güte der Anpassung der Regressionsgleichung gegeben durch<br />
Reduktion der Varianz (RV)<br />
RV<br />
1<br />
n<br />
n<br />
∑<br />
( y<br />
−<br />
i=<br />
1<br />
=<br />
n<br />
i<br />
1<br />
n<br />
y)²<br />
∑<br />
i=<br />
1<br />
=<br />
−<br />
( y<br />
1<br />
n<br />
i<br />
1<br />
n<br />
−<br />
n<br />
i=<br />
1<br />
n<br />
∑<br />
i=<br />
1<br />
(<br />
y)²<br />
−<br />
ˆ<br />
yi yi<br />
( y<br />
i<br />
−<br />
)<br />
2<br />
yˆ<br />
i)²
3) Screening regression<br />
Schrittweise Vorgehen<br />
0. Auswahl von möglichen Prädiktoren<br />
1. Wähle X1 mit höchster Korrelation zum Prädiktanden<br />
höchste Reduktion der Varianz RV<br />
2. Bestimme optimales â 1<br />
<br />
Ŷ 1 = â 0 X 0 + â 1 X 1<br />
3. Wähle X k mit höchster Korrelation zu<br />
( Y - Ŷ k-1 )<br />
. . .<br />
=> Optimale Anzahl der Terme ?
4) Kreuzvalidation<br />
Overfitting<br />
Unendlich viele Prädiktoren<br />
Bei Anwendung auf abhängigen Datensatz<br />
verschwindet die Varianz<br />
Anwendung auf unabhängigen Datensatz<br />
Nicht physikalische Zusammenhänge<br />
erhöhen die Varianz<br />
Lösung: > Untergrenze für Signifikanz<br />
> Feste Anzahl von Prädiktoren aus Erfahrung<br />
> Kreuzvalidation
4) Kreuzvalidation<br />
Vorgehensweise<br />
• Zerlegung des<br />
Datensatzes<br />
• Entwicklung der<br />
Regressionsgleichung aus<br />
abhängigem Teil<br />
• Überprüfung am<br />
unabhängigen Teil<br />
Häufig Minimum der<br />
Varianz bei optimaler<br />
Anzahl von Prädiktoren<br />
Mit Kontrollsatz<br />
Ohne Kontrollsatz
5) Auswahl von Prädiktoren<br />
Ein Zitat:<br />
„ The better the preparation of the predictors<br />
and predictants, the better are the results „<br />
(Knüpffer 1996)
5) Auswahl von Prädiktoren<br />
Unterschiedliche Prädiktanden<br />
• Temperaturen Zeitabhängige Prädiktanden<br />
=> Gleichungen für jede Jahreszeit<br />
• Wind Vektoren als Prädiktanden<br />
=> Gleichungen für Komponenten<br />
• Niederschlag Binäre Prädiktanden<br />
=> Wahrscheinlichkeitsangaben beschränkt auf Intervall [0,1]<br />
• Bedeckungsgrad Kategorisierte Prädiktanden<br />
=> Mehrfach binäre Aufteilung<br />
• Arbeitsplätze am Bau<br />
=> Nur indirekte Abhängigkeit von meteorologischen Größen
5) Auswahl von Prädiktoren<br />
Eine beliebige Wahl ?<br />
Bestimmung der Maximaltemperatur in Bonn<br />
• Schlüsselbegriff „kalt“<br />
im 100 jährigem<br />
Kalender<br />
• Beobachtung auf der<br />
Zugspitze<br />
• Vorhersage Pollenflug<br />
in Bonn<br />
oder<br />
• Vorhersage<br />
Maximaltemperatur für<br />
Essen und Trier<br />
• Beobachtung<br />
Maximaltemperatur<br />
• Vorhersage<br />
Bedeckungsgrad in<br />
Bonn<br />
=> Subjektive Vorauswahl
5) Auswahl von Prädiktoren<br />
Typen von Prädiktoren<br />
• Direkter <strong>Model</strong>loutput<br />
• Beobachtungsgrößen Stationsmeldungen<br />
• Funktionen von Ort und Zeit<br />
sin (Jahrestag/365)<br />
astronomisch: Winkel der Sonne über der Erdoberfläche<br />
• Funktionen von Prädiktoren<br />
• Schaltervariablen<br />
=> Welche Prädiktoren sind sinnvoll ?
5) Auswahl von Prädiktoren<br />
Direkter <strong>Model</strong>loutput<br />
• Diskret für einzelne Gitterpunkte<br />
‣ Lineare Interpolation von mindestens 4 Gitterpunkten<br />
‣ Space smoothing zur Unterdrückung von Lärm<br />
‣ Korrekturen für Höhe und Geländeform<br />
Beobachtungsgrößen<br />
• Fehlerkorrekturen für Ausreißer
5) Auswahl von Prädiktoren<br />
Funktionen von Prädiktoren<br />
Beispiel : Industrieschnee in Brühl<br />
X 1 Binär: Fließt Öl aus Rotterdam<br />
X 2 Funktion: Produkt aus Stärke der Inversion und Windrichtung<br />
normiert auf SO<br />
X 3 Funktion: Vorhergesagte Maximaltemperatur mit maximaler<br />
Gewichtung bei –3°C<br />
• Kombination von abhängigen Prädiktoren<br />
liefert unabhängigen Prädiktor<br />
• Aufnahme von nichtlinearen Zusammenhängen
6) Anwendung von MOS<br />
SAPEMOS<br />
• Entwickelt Ende der 60er Jahre auf Grundlage des<br />
Subsynoptic Advection <strong>Model</strong> und Primitive Equation <strong>Model</strong><br />
• Vorhersage von Niederschlagswahrscheinlichkeit, Wind,<br />
Bedeckungsgrad, Maximaltemperatur und<br />
Schneewahrscheinlichkeit<br />
• Gleichungen teilweise entwickelt für einzelne Stationen<br />
(10 –20), aber auch für ganzen Osten der USA<br />
• Teilweise Unterteilung in Jahreszeiten
6) Anwendung von MOS<br />
SAPEMOS Beispiel Maximaltemperatur<br />
MOS- Gleichung für Washigton D. C. (Winter)<br />
Ergebnisse: > Absoluter Fehler durchschnittlich 3-4°F<br />
> MOS um 0-0,5°F geringeren absoluten Fehler (AE) als PP<br />
> Subjektive Vorhersage um 0,5-1,0°F geringeren AE als MOS<br />
> Verbesserung durch Sinus des Jahrestages
6) Anwendung von MOS<br />
SAPEMOS Beispiel Niederschlagswahrscheinlichkeit<br />
Fehler und Brier Scores:<br />
Ergebnis: > Niederschlagswahrscheinlichkeit im Intervall 2 -100%<br />
> Teilweise zu geringe Wahrscheinlichkeiten<br />
> Brier Scores teilweise besser als lokale Vorhersage
6) Anwendung von MOS<br />
AVN- MOS<br />
• Entwickelt ab 2000 in Zusammenarbeit mit WetterOnline<br />
auf Grundlage des Aviation- <strong>Model</strong>ls<br />
• Vorhersage von Minimal- und Maximaltemperaturen<br />
sowie Bedeckungsgrad (relative Sonnenscheindauer),<br />
Niederschlag und Wind<br />
• Datengrundlage aus Stationsbeobachtungen (27) und<br />
archivierten <strong>Model</strong>lläufen<br />
• Annahme von konstanten <strong>Model</strong>lfehlern nach 24 Stunden<br />
• Separate Gleichungen für 4 Jahreszeiten<br />
• Prädiktorenzahl über Kreuzvalidation (maximal 7)
6) Anwendung von MOS<br />
AVN- MOS<br />
Ergebnisse Maximaltemperatur:<br />
‣ MOS Gleichung für Düsseldorf (Frühling)<br />
Y = 1,28°C + 0,89 Maximaltemperatur <strong>Model</strong>lausgang<br />
+ 2,56 Optimierte Feuchtefunktion 600m -3000m<br />
+ 0.0085 Latenter Wärmefluss am Boden<br />
- 0,18 Vorhersagefehler des Vortages<br />
‣ Fehler 1- 1,5°C abhängig von Stationshöhe<br />
‣ Optimale Prädiktorenzahl stark unterschiedlich<br />
‣ Reduktion der Varianz bis über 0,9
6) Anwendung von MOS<br />
AVN- MOS<br />
Ergebnisse Relative Sonnenscheidauer<br />
‣ Häufigste Prädiktoren:<br />
> Relative Feuchte<br />
>Windrichtung<br />
> Temperaturgradienten<br />
> Optimierte Feuchtefunktion<br />
> . . .<br />
> <strong>Model</strong>lbedeckungsgrad (12. Position )<br />
‣ Fehler: 15% bis 20%<br />
‣ Reduktion der Varianz zwischen 0,4 und 0,7<br />
Optimale Prädiktorenzahl zu groß
7) Zusammenfassung<br />
• Statistische Methoden notwendig zur Anpassung<br />
von <strong>Model</strong>ldaten an Beobachtungsdaten<br />
• MOS Ansatz liefert größtenteils bessere<br />
Ergebnisse als PP<br />
• Entscheidend ist Auswahl der richtigen<br />
Prädiktoren mit der richtigen Technik<br />
=> MOS Vorhersagen sind heute bei nahezu allen<br />
Anbietern von Wettervorhersagen in Gebrauch
7) Literatur<br />
• H. R. Glahn und D. A. Lowry: „ The use of <strong>Model</strong> <strong>Output</strong> <strong>Statistics</strong><br />
(MOS) in Objective Weather Forecasting“ in Journal of Applied<br />
Meteorology,11 Seite 1203-1211<br />
• W. H. Klein und H. R. Glahn: „Forecasting local weather by means of<br />
<strong>Model</strong> <strong>Output</strong> <strong>Statistics</strong>“ in Bulletin of the American Meteorologicaol<br />
Society, 55 Seite 1217-1227<br />
• C. Schölzel: „Ein AVN/MOS- System für Europa“ Diplomarbeit in<br />
Meteorologie<br />
• S. Weber: „Erweiterung eines AVN/MOS- Systems“ Diplomarbeit in<br />
Meteorologie<br />
• Craig, Goldstein, Rougier und Seheult: „Bayesian Forecasting for<br />
Complex Systems Using Computer Simulators“ in Journal of the<br />
American Statistical Association,96 Seite 717
Vielen Dank für die<br />
Aufmerksamkeit