24.11.2013 Aufrufe

Korrektur: Lineare Regression in Excel ... - BayCEER

Korrektur: Lineare Regression in Excel ... - BayCEER

Korrektur: Lineare Regression in Excel ... - BayCEER

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Korrektur</strong>: <strong>L<strong>in</strong>eare</strong> <strong>Regression</strong> <strong>in</strong> <strong>Excel</strong><br />

Doppelsummenkurve<br />

10000<br />

8000<br />

kum. Abfluss<br />

6000<br />

4000<br />

2000<br />

Juni 1987<br />

0<br />

0 5000 10000 15000 20000<br />

kum. Niederschlag<br />

1


PDFA Abfluss Lange Bramke<br />

400<br />

kum. Stabw.<br />

300<br />

200<br />

100<br />

Feb. 1981<br />

0<br />

01.80 01.82 01.84 01.86 01.88 01.90 01.92 01.94 01.96<br />

Zum Vergleich: Wiederkehrdiagramm<br />

1993<br />

1992<br />

1991<br />

1990<br />

1989<br />

1988<br />

1987<br />

1986<br />

1985<br />

1984<br />

1983<br />

1982<br />

1981<br />

1980<br />

1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993<br />

2


Zeitreihen<br />

120<br />

100<br />

100<br />

80<br />

60<br />

80<br />

60<br />

40<br />

20<br />

0<br />

Niederschlag<br />

-20<br />

Abfluss<br />

40<br />

20<br />

-40<br />

-60<br />

-80<br />

0<br />

-100<br />

01.01.80 01.01.82 01.01.84 01.01.86 01.01.88 01.01.90 01.01.92 01.01.94<br />

PDFA Niederschlag und Temperatur<br />

Niederschlag<br />

Temperatur<br />

1200<br />

600<br />

1000<br />

500<br />

kum. Stabw.<br />

800<br />

600<br />

400<br />

kum. Stabw.<br />

400<br />

300<br />

200<br />

200<br />

100<br />

0<br />

0<br />

01.80 01.82 01.84 01.86 01.88 01.90 01.92 01.94<br />

01.80 01.82 01.84 01.86 01.88 01.90 01.92 01.94<br />

3


Extremwerte<br />

Motivation: Oft s<strong>in</strong>d nicht Mittelwerte, sondern die Extrema von Interesse<br />

Fragestellung: Lässt sich aus der Verteilung der beobachteten (Jahres-)Maxima<br />

die Wahrsche<strong>in</strong>lichkeit extrem seltener Maxima (z.B. HQ 100<br />

) abschätzen?<br />

Problem: Extrema s<strong>in</strong>d sehr schwer zu schätzen<br />

- Spannweite der Werte steigt mit zunehmendem Stichprobenumfang<br />

(ke<strong>in</strong>e Sättigung der Statistik)<br />

- Kle<strong>in</strong>e Änderungen der Parametrisierungen angepasster<br />

Häufigkeitsverteilungen wirken sich sehr stark auf die Wahrsche<strong>in</strong>lichkeit<br />

der Extremwerte aus<br />

- Extrema s<strong>in</strong>d selten<br />

Zwei verschiedene Ansätze<br />

1. Block-Extrema (Fenster gleicher Länge; Bsp.: Jahresmaxima): GEV<br />

2. Schwellwertüberschreitungen (POT = Peak over Threshold): GPD<br />

4


Annahmen<br />

• Verteilung der x(t) ist nicht bekannt<br />

• unabhängige und gleichverteilte Maxima (i.i.d. = <strong>in</strong>dependent and<br />

identically distributed)<br />

• Extreme Ereignisse s<strong>in</strong>d unkorreliert: Asymptotic Independence<br />

of Maxima Theorem (AIM-Theorem)<br />

• Approximation für<br />

n → ∞<br />

Allgeme<strong>in</strong>e Extremwertverteilung<br />

(GEV = General Extreme Value Distribution)<br />

GEV<br />

ξ , x,<br />

σ<br />

- x:<br />

Mittelwert (Lageparameter)<br />

- σ: Standardabweichung (Skalenparameter)<br />

- ξ: Formparameter<br />

( x)<br />

=<br />

⎧<br />

⎪<br />

⎨e<br />

⎪<br />

⎩<br />

⎛<br />

⎜ ⎛ x−<br />

x ⎞<br />

− 1+<br />

ξ<br />

⎜ ⎟<br />

⎝ ⎝ σ ⎠<br />

−e<br />

−1/<br />

ξ<br />

⎛ x−x<br />

⎞<br />

−⎜<br />

⎟<br />

⎝ σ ⎠<br />

für ξ = 0: Exponential Tail (Gumbel-Verteilung)<br />

e<br />

⎞<br />

⎟<br />

⎠<br />

für ξ ≠ 0<br />

für ξ = 0<br />

für ξ > 0: Heavy Tail<br />

für ξ < 0: F<strong>in</strong>ite Tail<br />

(Fréchet-Verteilung)<br />

(neg. Weibull-Verteilung)<br />

5


GEV: 3 Typen<br />

0.7<br />

0.6<br />

Gumbel; ξ=0<br />

Fréchet; ξ=0,8<br />

Weibull; ξ=-0,8<br />

0.5<br />

pdf (GEV(x,0,1,ξ))<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

-6 -4 -2 0 2 4 6 8 10<br />

x<br />

(Endres 2005)<br />

Verallgeme<strong>in</strong>erte Pareto-Verteilung<br />

(GPD = Generalized Pareto Distribution)<br />

•für x‘ = Schwellwert:<br />

GPD<br />

′<br />

x−<br />

x′<br />

−1/<br />

ξ<br />

ξ , σ<br />

( x − x ) = 1−<br />

(1 + ξ ⋅ )<br />

σ<br />

•3 Spezialfälle:<br />

für ξ = 0: Exponential Tail (Exponential-Verteilung, GP0)<br />

für ξ > 0: Heavy Tail<br />

für ξ < 0: F<strong>in</strong>ite Tail<br />

(Pareto-Verteilung, GP1)<br />

(Beta-Verteilung, GP2)<br />

6


GPD: 3 Typen<br />

(Endres 2005)<br />

GEV vs. GPD<br />

• Zusammenhang:<br />

GPD( x)<br />

= 1+<br />

logGEV<br />

( x)<br />

für logGEV<br />

( x)<br />

> −1<br />

• Ausnutzung der Daten:<br />

- bestimmt durch Fensterlänge (GEV) oder Schwellwert (GPD);<br />

- jeweils so zu wählen, dass die Extrema vone<strong>in</strong>ander unabhängig s<strong>in</strong>d<br />

• Präferenzen:<br />

- Kont<strong>in</strong>uierliche Messungen: GEV, z.B. Abflussgangl<strong>in</strong>ien<br />

- Protokollierung der Extremereignisse: GPD, z.B. Schadensmeldungen der<br />

Versicherungen<br />

7


Anpassung der theoretischen Verteilung<br />

(Endres 2005)<br />

Problem: Langreichweitige Korrelationen<br />

Normierte Wiederkehr<strong>in</strong>tervalle der Schwellwertüberschreitungen<br />

(Endres 2005)<br />

8


Übersicht<br />

1. Def<strong>in</strong>ition und Eigenschaften von Zeitreihen<br />

2. Tests und Trenderkennung für Zeitreihen<br />

3. Fourriertransformation, Powerspektrum<br />

4. Wavelets<br />

5. Zeitreihenmodellierung der ARMA-Klasse (kurzes Gedächtnis)<br />

6. Modellierung von Zeitreihen mit langem Gedächtnis<br />

7. Komplexität und Information von Zeitreihen<br />

8. Wiederkehranalyse<br />

9. S<strong>in</strong>guläre System-Analyse<br />

10. Bruchpunktanalyse<br />

11. Extremwertanalyse<br />

Zeitreihen<br />

• E<strong>in</strong>e Zeitreihe ist e<strong>in</strong>e Menge von Werten, die <strong>in</strong> e<strong>in</strong>er<br />

festgelegten (und bekannten!) Reihenfolge vorliegen.<br />

• Zeitreihen rechtfertigen eigene statistische Verfahren (und<br />

e<strong>in</strong>e eigene Vorlesung), weil sie <strong>in</strong> der Regel autokorreliert<br />

s<strong>in</strong>d.<br />

Gegenbeispiel: Weißes Rauschen<br />

9


Korrelation etc.<br />

Varianz<br />

Maß für<br />

Streuung um den Mittelwert<br />

Mathematisch<br />

mittlere quadrierte Abweichung<br />

Kovarianz<br />

Korrelation<br />

<strong>Regression</strong><br />

Faltung<br />

Enge des l<strong>in</strong>earen Zusammenhangs<br />

zwischen zwei Variablen<br />

Enge des l<strong>in</strong>earen Zusammenhangs<br />

zwischen zwei Variablen<br />

Art des Zusammenhangs zwischen<br />

mehreren Größen<br />

Enge des Zusammenhangs zweier<br />

Zeitreihen bzw. Funktionen<br />

mittlere quadrierte Abweichung zweier<br />

Variablen jeweils von ihrem Mittelwert<br />

auf [-1;1]-normierte Kovarianz<br />

(Teilung durch das Produkt der<br />

Standardabweichungen)<br />

Funktion<br />

gemitteltes Produkt zweier gegene<strong>in</strong>ander<br />

verschobener Zeitreihen bzw. Funktionen<br />

Übersicht<br />

Verfahren<br />

Ziel<br />

global/lokal<br />

Instationaritäten<br />

Periodizitäten<br />

(saisonaler) Kendall-Test<br />

Analyse<br />

global<br />

des Mittelwerts<br />

-<br />

Bartlett-, Levene-Test<br />

Analyse<br />

global<br />

der Varianz<br />

-<br />

Stationaritätstest nach Witt<br />

Analyse<br />

lokal<br />

der Verteilung<br />

-<br />

Fourierspektrum, Periodogramm<br />

Analyse<br />

global<br />

-<br />

Frequenz-scharf<br />

(harmonische)<br />

Power-Spektrum<br />

Analyse<br />

global<br />

-<br />

Frequenz-scharf<br />

(allgeme<strong>in</strong>)<br />

Wavelet-Analyse<br />

Analyse<br />

lokal<br />

des Frequenzspektrums<br />

Frequenz-scharf<br />

(harmonische)<br />

ARIMA-Modelle<br />

Modellierung<br />

global<br />

-<br />

-<br />

Hurst-Koeffizient<br />

Analyse<br />

global<br />

(langreichweitige Korrelationen)<br />

-<br />

Komplexität und Information<br />

Analyse<br />

global<br />

-<br />

-<br />

Wiederkehranalyse<br />

Analyse<br />

lokal<br />

der Dynamik (Attraktoren)<br />

annähernd<br />

S<strong>in</strong>guläre System-Analyse<br />

Analyse<br />

lokal<br />

der Dynamik (Attraktoren)<br />

annähernd<br />

Doppelsummenkurve<br />

Analyse<br />

lokal<br />

des Verhältnisses zweier Variablen<br />

-<br />

Bruchpunktanalyse (i.e.S.)<br />

Analyse<br />

Lokal<br />

des Mittelwertes<br />

-<br />

Progressive Detrended Fluctuation<br />

Analysis<br />

Analyse<br />

lokal<br />

der Varianz, der Korrelationen<br />

-<br />

Extremwertanalyse<br />

Analyse<br />

global<br />

-<br />

-<br />

10

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!