IEKP-KA/2013-8 - Institut für Experimentelle Kernphysik - KIT
IEKP-KA/2013-8 - Institut für Experimentelle Kernphysik - KIT
IEKP-KA/2013-8 - Institut für Experimentelle Kernphysik - KIT
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
38 5. Statistische Methoden<br />
5.1. Hypothesentests<br />
Ziel eines Hypothesentests ist es eine Aussage über die Vereinbarkeit einer Messung mit<br />
einer bestimmten Hypothese H 0 , beispielsweise ”<br />
die Messdaten entsprechen denen, die für<br />
ein Positron erwartet werden“, zu machen. Die Messung wird dabei in der Form eines<br />
Satzes von Variablen x = {x 1 , x 2 , ..., x n } geschrieben, wobei x i einem einzelnen Messwert<br />
entspricht und n die Anzahl der aufgenommenen Messwerte pro Ereignis ist, also<br />
die Dimensionalität des Parameterraumes darstellt. Die Hypothese H 0 wird in der Regel<br />
mit einer oder mehreren Gegenhypothesen H 1 , H 2 , ... verglichen und zurückgewiesen oder<br />
angenommen. Jede der Hypothesen setzt eine unterschiedliche Verteilung der einzelnen Parameter<br />
x, gegeben durch die Wahrscheinlichkeitsdichteverteilungen f(x|H 0 ), f(x|H 1 ), ...<br />
voraus. Ein Beispiel im zweidimensionalen Parameterraum der Variablen x 1 und x 2 ist<br />
in Abbildung 5.1 gezeigt. Die Populationen H 0 und H 1 lassen sich hier klar durch die<br />
in Dunkelrot gezeichnete Entscheidungsgrenze separieren, die es in optimaler Weise zu<br />
bestimmen gilt. Für Parameterräume höherer Dimensionalität ist es von Vorteil die Mess-<br />
Abbildung 5.1.: Beispiel von Populationen H 0 und H 1 im zweidimensionalen Parameterraum<br />
der Variablen x 1 und x 2 , getrennt durch eine lineare Entscheidungsgrenze<br />
(dunkelrot) [39].<br />
werte in einer sogenannten Test-Funktion t(x) niedrigerer Dimensionalität m (mit m < n),<br />
in der alle Informationen der gemachten Messung enthalten sind, zu verarbeiten. Eine eindimensionale<br />
Test-Funktion könnte beispielsweise durch den Mittelwert gebildet werden,<br />
wie er in Abbildung 4.12 gezeigt wurde. Eine solche Test-Statistik ist wiederum mit einer<br />
eigenen Wahrscheinlichkeitsdichte g(t|H 0 ), g(t|H 1 ), ... abhängig von der zu betrachtenden<br />
Hypothese verteilt. Im einfachsten Fall ist m = 1 und das Problem damit eindimensional.<br />
In diesem Fall kann die Entscheidungsgrenze als t(x 1 , ..., x n ) = t cut geschrieben werden<br />
und ist damit ein einfacher Schnitt auf t, der die Test-Statistik in eine Annahme- und<br />
eine Verwurfsregion teilt. Fällt die Messung in die Annahmeregion wird H 0 als wahr angenommen,<br />
fällt es in die Verwurfsregion wird H 0 zurückgewiesen. Abbildung 5.2 zeigt<br />
eine solche Test-Funktion mit einer Einteilung in eine Annahme- und eine Verwurfsregion.<br />
Darin ist ebenfalls ersichtlich, dass sich die Wahrscheinlichkeitsdichtefunktionen g(t|H 0 )<br />
und g(t|H 1 ) für gewöhnlich überlappen. Damit existiert eine endliche Wahrscheinlichkeit<br />
β =<br />
∫ tcut<br />
t min<br />
g(t|H 1 )dt, (5.4)<br />
für eine als H 0 angenommene Messung zur Population H 1 zu gehören und damit eine<br />
falsche Hypothese zu akzeptieren. Man spricht von einem Fehler zweiter Art. t min entspricht<br />
dabei der unteren Grenze, in der die Waschreinlichkeitsdichtefunktion g(t|H 1 ) definiert<br />
ist. Einen Fehler erster Art begeht man, indem die richtige Hypothese H 0 durch eine<br />
Messung in der Verwurfsregion, was mit der Wahrscheinlichkeit<br />
α =<br />
∫ tmax<br />
t cut<br />
g(t|H 0 )dt (5.5)<br />
38