IEKP-KA/2013-8 - Institut fÃ¼r Experimentelle Kernphysik - KIT

Weitere Magazine

Empfehlungen

Info

38 5. Statistische Methoden 5.1. Hypothesentests Ziel eines Hypothesentests ist es eine Aussage über die Vereinbarkeit einer Messung mit einer bestimmten Hypothese H 0 , beispielsweise ” die Messdaten entsprechen denen, die für ein Positron erwartet werden“, zu machen. Die Messung wird dabei in der Form eines Satzes von Variablen x = {x 1 , x 2 , ..., x n } geschrieben, wobei x i einem einzelnen Messwert entspricht und n die Anzahl der aufgenommenen Messwerte pro Ereignis ist, also die Dimensionalität des Parameterraumes darstellt. Die Hypothese H 0 wird in der Regel mit einer oder mehreren Gegenhypothesen H 1 , H 2 , ... verglichen und zurückgewiesen oder angenommen. Jede der Hypothesen setzt eine unterschiedliche Verteilung der einzelnen Parameter x, gegeben durch die Wahrscheinlichkeitsdichteverteilungen f(x|H 0 ), f(x|H 1 ), ... voraus. Ein Beispiel im zweidimensionalen Parameterraum der Variablen x 1 und x 2 ist in Abbildung 5.1 gezeigt. Die Populationen H 0 und H 1 lassen sich hier klar durch die in Dunkelrot gezeichnete Entscheidungsgrenze separieren, die es in optimaler Weise zu bestimmen gilt. Für Parameterräume höherer Dimensionalität ist es von Vorteil die Mess- Abbildung 5.1.: Beispiel von Populationen H 0 und H 1 im zweidimensionalen Parameterraum der Variablen x 1 und x 2 , getrennt durch eine lineare Entscheidungsgrenze (dunkelrot) [39]. werte in einer sogenannten Test-Funktion t(x) niedrigerer Dimensionalität m (mit m < n), in der alle Informationen der gemachten Messung enthalten sind, zu verarbeiten. Eine eindimensionale Test-Funktion könnte beispielsweise durch den Mittelwert gebildet werden, wie er in Abbildung 4.12 gezeigt wurde. Eine solche Test-Statistik ist wiederum mit einer eigenen Wahrscheinlichkeitsdichte g(t|H 0 ), g(t|H 1 ), ... abhängig von der zu betrachtenden Hypothese verteilt. Im einfachsten Fall ist m = 1 und das Problem damit eindimensional. In diesem Fall kann die Entscheidungsgrenze als t(x 1 , ..., x n ) = t cut geschrieben werden und ist damit ein einfacher Schnitt auf t, der die Test-Statistik in eine Annahme- und eine Verwurfsregion teilt. Fällt die Messung in die Annahmeregion wird H 0 als wahr angenommen, fällt es in die Verwurfsregion wird H 0 zurückgewiesen. Abbildung 5.2 zeigt eine solche Test-Funktion mit einer Einteilung in eine Annahme- und eine Verwurfsregion. Darin ist ebenfalls ersichtlich, dass sich die Wahrscheinlichkeitsdichtefunktionen g(t|H 0 ) und g(t|H 1 ) für gewöhnlich überlappen. Damit existiert eine endliche Wahrscheinlichkeit β = ∫ tcut t min g(t|H 1 )dt, (5.4) für eine als H 0 angenommene Messung zur Population H 1 zu gehören und damit eine falsche Hypothese zu akzeptieren. Man spricht von einem Fehler zweiter Art. t min entspricht dabei der unteren Grenze, in der die Waschreinlichkeitsdichtefunktion g(t|H 1 ) definiert ist. Einen Fehler erster Art begeht man, indem die richtige Hypothese H 0 durch eine Messung in der Verwurfsregion, was mit der Wahrscheinlichkeit α = ∫ tmax t cut g(t|H 0 )dt (5.5) 38
5.2. Das Likelihoodverhältnis 39 Abbildung 5.2.: Wahrscheinlichkeitsdichteverteilungen für die Hypothesen H 0 und H 1 einer eindimensionalen Test-Statistik t(x) mit Einteilung in eine Annahmeund eine Verwurfsregion, getrennt durch die Entscheidungsgrenze t cut [38]. passiert, zugunsten von H 1 verworfen wird. t max ist hier die obere Grenze von g(t|H 0 ). Eine wichtige Kenngröße ist außerdem die Effizienz auf die zu testende Hypothese H 0 mit ε = 1 − α, als Wahrscheinlichkeit ein H 0 Ereignis auch als solches zu erkennen. Eine hohe Effizienz geht dabei mit einer höheren Wahrscheinlichkeit einen Fehler zweiter Art zu begehen einher. Dies wird durch die Reinheit p 1 als Anteil von H 0 Ereignissen in der Annahmeregion S von t min bis t cut nach ∫ S p = g(t|H 0)dt ∫ S g(t|H 0)dt + ∫ S g(t|H (5.6) 1)dt ausgedrückt. Ein guter Test verbindet hohe Effizienz mit hoher Reinheit. Die Aufgabe besteht nun darin eine Test-Funktion t(x) mit optimalen Separationseigenschaften zu konstruieren und eine Schnittgrenze t cut zu finden. Im Folgenden wird die Hypothese H 0 als Signal bezeichnet und entspricht der Messung eines Leptons. Die Gegenhypothese H 1 entspricht dann der Messung eines Protons und wird als Untergrund bezeichnet. 5.2. Das Likelihoodverhältnis Ein Weg eine Test-Funktion zu finden basiert auf dem Neyman-Pearson Lemma [38]. Dieses legt eine optimale Annahmeregion fest, im Sinne von maximaler Effizienz auf das Signal bei minimaler Wahrscheinlichkeit einen Fehler zweiter Art zu begehen. Für einen Test auf eine Nullhypothese H 0 zu einer Gegenhypothese H 1 ist diese Annahmeregion durch das Verhältnis der Wahrscheinlichkeitsdichteverteilungen f(x|H 0 ) f(x|H 1 ) > c (5.7) festgelegt. Ist dieses Verhältnis kleiner oder gleich c wird die Nullhypothese verworfen. c ist dabei ein vorher anhand von α und β aus den Formeln 5.4-5.5 festgelegtes konstantes Signifikanzniveau. Äquivalent dazu ist die optimale Test-Statistik durch 1 engl.:Purity f(x|H 0 ) = t(x) (5.8) f(x|H 1 ) 39
Seite 1 und 2: IEKP-KA/2013-8 Positronen Identifiz
Seite 3 und 4: Inhaltsverzeichnis 1. Einleitung 1
Seite 5 und 6: 1. Einleitung Die Teilchenphysik ko
Seite 7: 3 Abbildung 1.2.: Foto des AMS-02 D
Seite 10 und 11: 6 2. Physikalischer Hintergrund Abb
Seite 12 und 13: 8 2. Physikalischer Hintergrund Abb
Seite 14 und 15: 10 2. Physikalischer Hintergrund im
Seite 16 und 17: 12 2. Physikalischer Hintergrund mi
Seite 18 und 19: 14 2. Physikalischer Hintergrund Di
Seite 20 und 21: 16 3. Der AMS-02 Detektor tektor ei
Seite 22 und 23: 18 3. Der AMS-02 Detektor Abbildung
Seite 24 und 25: 20 3. Der AMS-02 Detektor Loch Paar
Seite 26 und 27: 22 3. Der AMS-02 Detektor nem Brech
Seite 28 und 29: 24 3. Der AMS-02 Detektor gien bis
Seite 31 und 32: 4. Der Übergangsstrahlungsdetektor
Seite 33 und 34: 4.2. Aufbau des Detektors und Messu
Seite 35 und 36: 4.3. Gassystem und Betrieb auf der
Seite 37 und 38: 4.4. Kalibrierung 33 Abbildung 4.7.
Seite 39 und 40: 4.5. Unterscheidung von Protonen un
Seite 41: 5. Statistische Methoden Aus den Me
Seite 45 und 46: Entries 3137898 Mean 1.027 RMS 0.14
Seite 47 und 48: 5.3. Künstliche neuronale Netze 43
Seite 49 und 50: 5.3. Künstliche neuronale Netze 45
Seite 51 und 52: 6. Das neuronale Netzwerk für den
Seite 53 und 54: 6.1. Selektion des Trainingssamples
Seite 55 und 56: 6.2. Eingangs-Variablen 51 Abbildun
Seite 57 und 58: 6.2. Eingangs-Variablen 53 Energiea
Seite 59 und 60: 6.2. Eingangs-Variablen 55 Beta 1.4
Seite 61 und 62: 6.3. Training des neuronalen Netzwe
Seite 63 und 64: 6.3. Training des neuronalen Netzwe
Seite 65 und 66: 6.4. Ausgabe des neuronalen Netzwer
Seite 67 und 68: 7. Vergleich von Methoden zur Proto
Seite 69 und 70: 7.1. Reinheit der Separationsmethod
Seite 71 und 72: 7.2. Vergleich anhand der ermittelt
Seite 73 und 74: 7.2. Vergleich anhand der ermittelt
Seite 75: 7.2. Vergleich anhand der ermittelt
Seite 79 und 80: Literaturverzeichnis [1] NASA/WMAP
Seite 81: Literaturverzeichnis 77 [40] Bishop
Seite 84 und 85: 80 Abbildungsverzeichnis 3.7. Schem
Seite 86 und 87: 82 Abbildungsverzeichnis 6.6. Energ
Seite 89 und 90: Anhang A. Ausschnitt der Analysedat
Seite 91 und 92: A. AUSSCHNITT DER ANALYSEDATEI FÜR
Seite 93 und 94:
A. AUSSCHNITT DER ANALYSEDATEI FÜR
Seite 95 und 96:
A. AUSSCHNITT DER ANALYSEDATEI FÜR
Seite 97 und 98:
B. Ausschnitt der Analysedatei für
Seite 99 und 100:
B. AUSSCHNITT DER ANALYSEDATEI FÜR
Seite 101 und 102:
Seite 103 und 104:
Alle anzeigen

IEKP-KA/2013-8 - Institut fÃ¼r Experimentelle Kernphysik - KIT

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?