IEKP-KA/2013-8 - Institut für Experimentelle Kernphysik - KIT
IEKP-KA/2013-8 - Institut für Experimentelle Kernphysik - KIT
IEKP-KA/2013-8 - Institut für Experimentelle Kernphysik - KIT
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>IEKP</strong>-<strong>KA</strong>/<strong>2013</strong>-8<br />
Positronen Identifizierung<br />
mit dem AMS-02 Detektor<br />
auf der<br />
Internationalen Raumstation<br />
Diplomarbeit<br />
von<br />
Stefan Zeißler<br />
An der Fakultät für Physik<br />
<strong>Institut</strong> für experimentelle <strong>Kernphysik</strong><br />
(<strong>IEKP</strong>)<br />
Erstgutachter:<br />
Zweitgutachter:<br />
Prof. Dr. Wim de Boer<br />
Prof. Dr. Günter Quast<br />
Bearbeitungszeit: 29. Februar 2012 – 28. Februar <strong>2013</strong><br />
<strong>KIT</strong> – Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft<br />
www.kit.edu
Ich versichere wahrheitsgemäß, die Arbeit selbstständig angefertigt, alle benutzten Hilfsmittel<br />
vollständig und genau angegeben und alles kenntlich gemacht zu haben, was aus<br />
Arbeiten anderer unverändert oder mit Abänderungen entnommen wurde.<br />
Karlsruhe, 28. Februar <strong>2013</strong><br />
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<br />
(Stefan Zeißler)
Inhaltsverzeichnis<br />
1. Einleitung 1<br />
2. Physikalischer Hintergrund 5<br />
2.1. Kosmische Strahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />
2.2. Quellen Kosmischer Strahlung . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />
2.3. Dunkle Materie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />
2.3.1. Kandidaten für Dunkle Materie . . . . . . . . . . . . . . . . . . . . . 11<br />
2.3.2. Suche nach Dunkler Materie . . . . . . . . . . . . . . . . . . . . . . . 12<br />
2.4. Der Positronanteil in der leptonischen Komponente der kosmischen Strahlung 12<br />
3. Der AMS-02 Detektor 15<br />
3.1. Der Übergangsstrahlungsdetektor (TRD) . . . . . . . . . . . . . . . . . . . 16<br />
3.2. Der Flugzeitdetektor (TOF) . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />
3.3. Der Permanentmagnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />
3.4. Der Silizium Spurdetektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />
3.5. Der Antikoinzidenz Zähler (ACC) . . . . . . . . . . . . . . . . . . . . . . . . 20<br />
3.6. Der Ring abbildende Tscherenkow Detektor (RICH) . . . . . . . . . . . . . 21<br />
3.7. Das elektromagnetische Kalorimeter (ECAL) . . . . . . . . . . . . . . . . . 22<br />
3.8. Teilchensignaturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />
4. Der Übergangsstrahlungsdetektor 27<br />
4.1. Entstehung von Übergangsstrahlung . . . . . . . . . . . . . . . . . . . . . . 27<br />
4.2. Aufbau des Detektors und Messung von Übergangsstrahlung . . . . . . . . 28<br />
4.3. Gassystem und Betrieb auf der ISS . . . . . . . . . . . . . . . . . . . . . . . 30<br />
4.4. Kalibrierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />
4.5. Unterscheidung von Protonen und Positronen . . . . . . . . . . . . . . . . . 35<br />
5. Statistische Methoden 37<br />
5.1. Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />
5.2. Das Likelihoodverhältnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
5.3. Künstliche neuronale Netze . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />
5.3.1. Künstliche Neuronen . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />
5.3.2. Multi-Layer-Perzeptron . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />
5.3.3. Training des neuronalen Netzes . . . . . . . . . . . . . . . . . . . . . 44<br />
5.3.4. Die NeuroBayes R○ Software . . . . . . . . . . . . . . . . . . . . . . . 45<br />
6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor 47<br />
6.1. Selektion des Trainingssamples . . . . . . . . . . . . . . . . . . . . . . . . . 47<br />
6.1.1. Preselection und Selection . . . . . . . . . . . . . . . . . . . . . . . . 48<br />
6.1.2. Elektronen und Protonen Selektion . . . . . . . . . . . . . . . . . . . 50<br />
6.2. Eingangs-Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51<br />
iii
iv<br />
Inhaltsverzeichnis<br />
6.3. Training des neuronalen Netzwerks . . . . . . . . . . . . . . . . . . . . . . . 56<br />
6.3.1. Test auf Over-Training . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />
6.3.2. Training mit Gewichten . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />
6.3.3. Trainingseinstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . 59<br />
6.4. Ausgabe des neuronalen Netzwerkes . . . . . . . . . . . . . . . . . . . . . . 60<br />
7. Vergleich von Methoden zur Protonen/Positronen Trennung 63<br />
7.1. Reinheit der Separationsmethoden . . . . . . . . . . . . . . . . . . . . . . . 65<br />
7.2. Vergleich anhand der ermittelten Reinheit . . . . . . . . . . . . . . . . . . . 67<br />
8. Zusammenfassung und Ausblick 73<br />
Literaturverzeichnis 75<br />
Abbildungsverzeichnis 77<br />
Anhang 85<br />
A. Ausschnitt der Analysedatei für das neuronale Netzwerk im Rigiditätsbereich<br />
2 − 5 GV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />
B. Ausschnitt der Analysedatei für das neuronale Netzwerk im Rigiditätsbereich<br />
5 − 300 GV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93<br />
iv
1. Einleitung<br />
Die Teilchenphysik kommt mit Teilchenbeschleunigern wie dem Large Hadron Collider<br />
(LHC) am europäischen Kernforschungszentrum CERN 1 in Genf der Antwort auf die Frage<br />
nach den Bestandteilen der Materie immer näher. Doch aus astronomischen Messungen<br />
weiß man, dass nach derzeitigem Kenntnisstand nur ein Bruchteil der im Universum<br />
gemessenen Materie erklärt werden kann. Etwa 80% der Masse im Universum wird aus<br />
sogenannter Dunkler Materie gebildet, für die noch kein geeigneter Teilchenphysikalischer<br />
Kandidat identifiziert werden konnte.<br />
Um Teilchen der Dunklen Materie zu identifizieren werden aktuell verschiedene Ansätze<br />
verfolgt:<br />
• Direkte Messung durch Kernwechselwirkungen.<br />
• Erzeugung und Nachweis an Beschleunigerexperimenten.<br />
• Indirekte Messung aus Annihilationsprodukten in der kosmischen Strahlung.<br />
Das Alpha Magnetic Spectrometer (AMS-02) als neuster und leistungsfähigster Detektor<br />
zur Vermessung der kosmischen Strahlung widmet sich der indirekten Messung Dunkler<br />
Materie und ist damit unter Punkt drei einzuordnen.<br />
Die Beobachtung kosmischer Strahlung begann 1912 mit deren Entdeckung durch Viktor<br />
Hess (Nobelpreis 1936) und bildet seit dem die grundlegende Methode der Astroteilchenphysik,<br />
als eine Disziplin die Methoden der Astrophysik und der Teilchenphysik gemeinsam<br />
nutzt und damit eine Verbindung zwischen dem Kleinsten und dem Größten bildet.<br />
Bahnbrechende Erfolge der Astroteilchenphysik waren die Entdeckung des Positrons, als<br />
erstes Teilchen der Antimaterie, durch Anderson 1932 (Nobelpreis 1936) und die Entdeckung<br />
der kosmischen Mikrowellenhintergrundstrahlung 1965 durch Penzias und Wilson<br />
(Nobelpreis 1978). Die Beobachtung dieser in der Urknalltheorie vorhergesagten elektromagnetischen<br />
Strahlung im infraroten Wellenlängenbereich bildete ein starkes Argument<br />
für das Urknallmodell. Dieses beschreibt die Entwicklung des Kosmos wie sie in Abbildung<br />
1.1 dargestellt ist.<br />
Heutzutage werden Teilchen der kosmischen Strahlung mit hochmodernen Detektoren und<br />
komplizierten Analysemethoden vermessen. Dazu werden unter anderem Detekorfelder, wie<br />
beim Auger Observatorium in Argentinien, errichtet, die durch kosmische Teilchen ausgelöste<br />
Teilchenschauer messen und daraus das Primärteilchen rekonstruieren. Die Erdatmosphäre<br />
fungiert dabei als Kalorimeter. Um kosmische Teilchen direkt vermessen zu<br />
1 franz.: Conseil Européen pour la Recherche Nucléaire<br />
1
2 1. Einleitung<br />
Abbildung 1.1.: Entwicklung des Universums nach der Urknalltheorie [1].<br />
können werden aber auch weiterhin Detektoren wie das High Energy Antimatter Telescope<br />
(HEAT) an Ballons auf etwa 40 km Höhe an den Rand der Erdatmosphäre gebracht.<br />
Die modernste Art kosmische Strahlung zu vermessen bilden Satelliten gestützte Experimente<br />
wie der AMS-02 Detektor. Dieser ist ein moderner Teilchendetekor mit hoher<br />
Akzeptanz im Energiebereich bis zu einigen TeV. Er befindet sich seit Mai 2011 auf der<br />
Internationalen Raumstation und kann dort in fast vollständiger Abwesenheit von atmosphärischen<br />
Einflüssen kosmische Strahlung direkt und über einen langen Zeitraum vermessen.<br />
Er ist ausgestattet mit einem Silizium Spurdetektor im Magnetfeld eines Permanentmagneten,<br />
einem Flugzeitdetektor, einem Ring abbildenden Tscherenkow Detektor,<br />
sowie einem Übergangsstrahlungsdetektor und einem elektromagnetischen Kalorimeter.<br />
Eine ähnliche Konfiguration ohne Übergangsstrahlungsdetektor und Kalorimeter wurde<br />
in einem 10-tägigen Testflug mit dem Space Shuttle Discovery im Jahr 1998 getestet und<br />
nach überzeugenden Ergebnissen für einen dauerhaften Einsatz im All bis mindestens 2020<br />
aufgerüstet. In Abbildung 1.2 ist der AMS-02 Detektor an seiner aktuellen Position auf<br />
der Internationalen Raumstation zu sehen, wo er in den letzten 22 Monaten bereits 30 Milliarden<br />
Teilchen messen konnte. Mit seinen Messungen wird der AMS-02 Detektor einen<br />
großen Beitrag zur Beantwortung der Frage nach Dunkler Materie und darüber hinaus<br />
liefern.<br />
So wird beispielsweise der Anteil des Positronenflusses in der leptonischen Komponente<br />
der kosmischen Strahlung gemessen, der ein Indiz für Annihilation von bisher unentdeckten<br />
Teilchen der Dunklen Materie sein kann. 2012 beobachtete der Payload for Antimatter<br />
Matter Exploration and Light-nuclei Astrophysics (PAMELA) Detektor einen unerwarteten<br />
Anstieg im Positronenanteil, der von AMS-02 genauer untersucht und dessen Messung<br />
zu höheren Energien hin erweitert werden wird. Da Positronen selten in primären Quellen<br />
erzeugt werden, sind sie ein sensitives Indiz für Zerfalls- und Stoßprozesse, die im<br />
Kosmos ablaufen. Auf die Bedeutung des Positronenanteils für die Suche nach Dunkler<br />
Materie wird in Kapitel 2 näher eingegangen. Um bei einem Verhältnis des dominierenden<br />
Protonen- zum Positronenfluss von etwa 10 3 weniger als 1% Protonenkontamination in<br />
der Positronenauswahl zu erreichen wird dabei eine Protonenunterdrückung von 10 6 angestrebt.<br />
Die zur Trennung dieser beiden Teilchenarten wichtigen Subdetektoren im AMS-02<br />
2
3<br />
Abbildung 1.2.: Foto des AMS-02 Detektor auf der Internationalen Raumstation [2].<br />
Experiment, das in Kapitel 3 genauer beschrieben ist, sind das elektromagnetische Kalorimeter<br />
und der Übergangsstrahlungsdetektor, mit dessen Funktionsweise und Betrieb sich<br />
Kapitel 4 befasst.<br />
In dieser Arbeit wurde eine Multivariante Analysemethode in Form eines neuronalen Netzwerks<br />
entwickelt mit der Positronen von Protonen mithilfe des Übergangsstrahlungsdetektos<br />
zuverlässig unterschieden werden können. Dieses neuronale Netzwerk wurde dabei aus<br />
einer Trainingsauswahl von Flugdaten der ersten eineinhalb Jahre Datennahme trainiert.<br />
Dabei wurde die Redundanz der AMS-02 Subdetektoren ausgenutzt. Die Schritte, um aus<br />
den AMS-02 Flugdaten ein neuronales Netzwerk zur Trennung von Protonen und Positronen<br />
zu erhalten, sind in Kapitel 6 beschrieben. In Kapitel 7 wird ein Vergleich zwischen<br />
den verschiedenen zur Verfügung stehenden Methoden zur Trennung von Protonen und<br />
Positronen mithilfe des Übergangsstrahlungsdetektors durchgeführt. Dabei wird alleine<br />
mit dem Übergangsstrahlungsdetektor eine Protonenunterdrückung von 10 3 bei einer Selektionseffizienz<br />
für Positronen von 90% im Rigiditätsbereich von 2 − 300 GV erreicht.<br />
3
2. Physikalischer Hintergrund<br />
Primäre Aufgabe des AMS-02 Detektors ist die Vermessung der kosmischen Strahlung. Die<br />
Beobachtung kosmischer Strahlung begann 1912 mit deren Entdeckung durch Viktor Hess.<br />
Dieser untersuchte in einer Reihe von Ballonflügen die Entladungsrate von Elektroskopen<br />
mit der Höhe über der Erdoberfläche. Die Entladung wird dabei durch Stöße mit ionisierenden<br />
Teilchen der Hintergrundstrahlung verursacht, deren Ursprung man im Erdinneren<br />
vermutete. Viktor Hess konnte nachweisen, dass die Entladungsrate als Funktion der Höhe<br />
zunimmt und damit nur eine Quelle ionisierender Teilchen außerhalb der Atmosphäre in<br />
Frage kommt. Konsistente Ergebnisse durch Messungen bei Nacht und Sonnenfinsternissen<br />
schlossen die Sonne als potentielle Quelle aus.<br />
2.1. Kosmische Strahlung<br />
Der Begriff kosmische Strahlung beschreibt eine Teilchenstrahlung über einen breiten Energiebereich,<br />
deren Ursprung im Weltall liegt. Die kosmische Strahlung besteht aus verschiedenartigen<br />
Teilchen, wobei Protonen mit etwa 85% den größten Anteil ausmachen. Außerdem<br />
kommen Heliumkerne mit einem Anteil von etwa 12% vor. Die restlichen 3% bilden<br />
Atomkerne höherer Ladungszahl Z ≥ 3 sowie Elektronen und Positronen [4]. Dabei kommen<br />
alle Kerne schwerer Elemente in der kosmischen Strahlung vor, wie in Abbildung 2.1<br />
gezeigt ist. Dort ist auch die relative Häufigkeit der Elemente im Sonnensystem gezeigt,<br />
welche dem Vorkommen in der kosmischen Strahlung bis auf wenige Ausnahmen auffallend<br />
ähnlich ist. Neben den geladenen Teilchen zählen auch ungeladene Teilchen wie Neutrinos<br />
und Photonen kosmischen Ursprungs zur kosmischen Strahlung. Die Intensität der<br />
kosmischen Strahlung fällt mit der Energie nahezu konstant nach einem Potenzgesetz ab.<br />
Das Spektrum der Hauptbestandteile der kosmischen Strahlung in einem Energiebereich<br />
von 10 MeV bis 10 12 GeV ist in Abbildung 2.2 dargestellt. Dort ist der Teilchenfluss pro<br />
Sekunde und Quadratmeter Fläche eines Raumwinkelelements mit der Energie doppelt logarithmisch<br />
aufgetragen. Dabei wurde der Teilchenfluss noch mit der Energie zum Quadrat<br />
multipliziert und damit abgeflacht. Dies bedeutet, dass die Wahrscheinlichkeit kosmische<br />
Teilchen einer bestimmten Energie zu messen mit der Energie rapide abfällt. Abbildung<br />
2.2 ist außerdem zu entnehmen, dass das Verhältnis von Elektronen zu Protonenfluss die<br />
Größenordung 10 −2 annimmt und damit auf 100 Protonen etwa ein Elektron vorkommt.<br />
Noch seltener sind Positronen, die noch um einen Faktor 10 weniger vorkommen als Elektronen.<br />
Für die Untersuchung der kosmischen Strahlung gibt es zwei Ansätze. Zum einen kann sie<br />
5
6 2. Physikalischer Hintergrund<br />
Abbildung 2.1.: Relative Häufigkeit der Elemente in der kosmischen Strahlung als Funktion<br />
ihrer Kernladungszahl Z bei einer Energie von 1 GeV pro Nukleon,<br />
normiert auf Si=100 [3]. Gezeigt ist außerdem die Häufigkeit der Elemente<br />
im Sonnensystem (graue Dreiecke).<br />
direkt mit Satelliten oder Ballonexperimenten im oberen Bereich der Erdatmosphäre gemessen<br />
werden. Dabei können Satellitenexperimente durch ihre relativ hohen Kosten bei<br />
starker Gewichtsbeschränkung und damit relativ kleinen Abmessungen nur für niedrige<br />
Energien bis einige TeV verwendet werden. Sie bieten durch die Abwesenheit von atmosphärischen<br />
Einflüssen allerdings eine optimale Messumgebung. In diesem Bereich misst<br />
auch der AMS-02 Detektor. Wirtschaftlicher sind Ballonexperimente, bei denen ein Teilchendetektor<br />
zum Nachweis geladener Teilchen an einem Ballon auf bis zu 40 km Höhe<br />
an den Rand der Atmosphäre gebracht wird. Allerdings sind Ballonflüge nur über relativ<br />
kurze Zeiträume machbar, was die Menge gemessener Teilchen beschränkt. Außerdem<br />
wird die Messung durch Sekundärteilchen aus Wechselwirkungen in der über dem Detektor<br />
liegenden Atmosphäre verfälscht. Ballonexperimente wie das High Energy Antimatter Telescope<br />
(HEAT), das am 3. Mai 1994 seinen ersten Flug über 29 Stunden auf 36, 5 − 33 km<br />
Höhe absolvierte, bieten eine gute Möglichkeit kosmische Teilchen bis zu Energien im PeV<br />
Bereich zu Messen. HEAT war dabei mit einem Flugzeitdetektor, einem Übergangsstrahlungsdetekor,<br />
einem Spurdetektor aus Driftkammern innerhalb eines Magneten und einem<br />
elektromagnetischen Kalorimeter ausgerüstet. In Abbildung 2.3 ist eine Skizze des HEAT<br />
Detektors, sowie ein Foto des Ballons im oberen Teil der Atmosphäre beim Erstflug zu sehen.<br />
Messungen von Teilchen höherer Energie werden indirekt über Wechselwirkungen der<br />
Teilchen mit der Materie der Erdatmosphäre durchgeführt. Dabei werden geeignete Detektoren<br />
über eine große Fläche verteilt aufgestellt. Trifft ein Kern der kosmischen Strahlung<br />
auf Atome aus der Luft in der Erdatmosphäre, bildet sich ein hadronischer Schauer aus.<br />
Dieser setzt sich kaskadenartig zur Erdoberfläche fort. Hier können die entstandenen Sekundärteilchen<br />
nahezu gleichzeitig gemessen werden und aus ihrer Energie und Verteilung,<br />
sowie deren Zusammensetzung das primäre Teilchen rekonstruiert werden. Gleiches gilt für<br />
Elektronen und Photonen, wobei sich hier ein elektromagnetischer Schauer ausbildet, der<br />
vom hadronsichen unterschieden werden kann. Ein Nachteil dieser Methode ist ihre hohe<br />
Komplexität in der Schauerrekonstruktion. Außerdem kann keine Aussage über das Ladungsvorzeichen<br />
eines Teilchens gemacht werden, so dass Teilchen von deren Antiteilchen<br />
nicht unterschieden werden können. Experimente dieser Art sind der ehemalige Karlsruhe<br />
Shower Core and Array Detector (<strong>KA</strong>SCADE) am Campus Nord des Karlsruhe <strong>Institut</strong><br />
für Technologie, sowie das Pierre-Auger-Observatorium in Argentinien, das mit 1600<br />
Tscherenkow Detektoren, wie in Abbildung 2.4 rechts gezeigt, eine Fläche von 3000 km 2<br />
abdeckt. Eine weitere Möglichkeit der indirekten Messung besteht darin den Luftschauer<br />
6
2.2. Quellen Kosmischer Strahlung 7<br />
Space<br />
experiments<br />
Balloon experiments<br />
Ground based<br />
experiments<br />
AMS-02<br />
Abbildung 2.2.: Teilchenspektrum der kosmischen Strahlung mit der Energie [5]. Die Abbildung<br />
vereint Messergebnisse verschiedener Experimente deren Ergebnisse<br />
durch unterschiedliche Farben und Marker dargestellt werden.<br />
direkt durch sein isotrop abgestrahltes Fluoreszenzlicht zu beobachten und daraus das Primärteilchen<br />
zu identifizieren. Dies ist jedoch nur bei geringem Untergrund und damit in<br />
dunklen Nächten und weit weg von Städten möglich. Solche Fluoreszenz-Teleskope werden<br />
ebenfalls am Pierre-Auger-Observatorium eingesetzt. Eine Rekonstruktion eines von den<br />
Fluoreszenz-Teleskopen und Bodenstationen gemeinsam gemessenes Ereignis am Pierre-<br />
Auger-Observatorium ist in Abbildung 2.4 links zu sehen.<br />
Die Messung kosmischer Strahlung verrät dabei viel über physikalische Vorgänge im Universum.<br />
Die Strahlung trägt dabei mit ihrer Energie und Richtung Informationen über<br />
ihre Quelle zur Erde.<br />
2.2. Quellen Kosmischer Strahlung<br />
Die Entstehung von kosmischer Strahlung ist eng mit Prozessen der Sternentwicklung<br />
verknüpft [8]. In unserer näheren Umgebung ist die Sonne eine Quelle für sehr nieder<br />
energetische kosmische Strahlung mit hoher Intensität die zeitlich mit der Sonnenaktivität<br />
variiert. Von der Sonne werden dabei überwiegend Protonen, sowie Elektronen und<br />
Neutrinos abgegeben. Kerne schwerer Elemente und kosmische Strahlung ab Energien von<br />
etwa 1 GeV können von der Sonne jedoch nicht erzeugt werden und müssen galaktischen<br />
Ursprungs sein. Als Quellen kosmischer Strahlung im für den AMS-02 Detektor relevanten<br />
Energiebereich bis 1 TeV werden Schockfronten von Supernova Überresten vermutet. Eine<br />
Supernova markiert das Ende der Fusionsaktivität eines massereichen Sterns ab 1, 4 Sonnenmassen.<br />
Dabei kollabiert der Stern und wird in einer Explosion, bei der große Mengen<br />
Materie ins All geschleudert werden, vernichtet. In diesem Endstadium ist die Temperatur<br />
im Innern des Sterns hoch genug um die Fusion von Kernen höherer Kernzahl bis zum<br />
7
8 2. Physikalischer Hintergrund<br />
Abbildung 2.3.: Skizze des HEAT Detektors (rechts), ausgerüstet mit Flugzeitmessung<br />
(TOF), Übergangsstrahlungsdetektor (TRD), Driftkammern (DTH) innerhalb<br />
eines Magneten und einem elektromagnetischen Kalorimeter (EC)<br />
und ein Foto des Detektors am Ballon in der Atmosphäre (links) [6].<br />
Abbildung 2.4.: Übersicht der Detektorverteilung mit eingezeichneten Sichtlinien der<br />
Fluoreszenz-Teleskope beim Pierre-Auger-Observatorium (links) und Rekonstruktion<br />
eines Ereignisses mit Bodenstationen und Fluoreszenz-<br />
Teleskopen (rechts) [7].<br />
8
2.3. Dunkle Materie 9<br />
Eisen zu ermöglichen. Die entweichende Materie besteht dabei aus Protonen, sowie Atomkernen<br />
und Elektronen. Sie bildet mit diesen geladenen Teilchen eine Front aus diffusen<br />
Magnetfeldern.<br />
Innerhalb der Schockfronten findet für die geladenen Teilchen immer wieder ein Energieübertrag,<br />
ähnlich eines inelastischen Stoßes an der Schockfront, statt. Dabei wird mit<br />
jedem Stoß die Energie der Teilchen um den Faktor ρ erhöht, so dass die Energie nach<br />
einem Stoß E 1 = E 0 (1 + ρ) ist. Nach n Stößen besitzen Teilchen damit die Energie<br />
E n = E 0 (1 + ρ) n . (2.1)<br />
Man spricht von Fermi Beschleunigung erster Art [9]. Um die Menge an Teilchen in der<br />
Schockfront abzuschätzen, wird ihnen eine energieunabhängige Entweichwahrscheinlichkeit<br />
p esc zugeordnet, mit der sie eine Schockfront verlassen. Die Teilchenzahl nach n Stößen ist<br />
dann<br />
N n = N 0 (1 − p esc ) n . (2.2)<br />
Betrachtet man nun die Entwicklung der Teilchenzahl ln(N n /N 0 ) = n · ln(1 − p esc ) mit<br />
dem Energiezuwachs ln(E n /E 0 ) = n · ln(ρ) erhält man aus deren Verhältnis die Anzahl<br />
der Teilchen nach n Zyklen<br />
N n = N 0<br />
( En<br />
E 0<br />
) p<br />
, (2.3)<br />
mit p = ln(1−pesc)<br />
ln(1+ρ)<br />
. Damit lässt sich aus<br />
∫ ∞<br />
der Verlauf des Energiespektrums<br />
E<br />
dN<br />
dE dE = N n (2.4)<br />
dN<br />
dE ∼ ( E<br />
E 0<br />
) −(p+1)<br />
(2.5)<br />
abschätzen. Dies ist das in 2.1 angesprochene Potenzgesetz für den Fluss der kosmischen<br />
Strahlung. Das Prinzip der Beschleunigung kosmischer Teilchen an Schockfronten ist in<br />
Abbildung 2.5 nochmals verdeutlicht.<br />
Abbildung 2.5.: Beschleunigung kosmischer Teilchen an einer Schockfront.<br />
2.3. Dunkle Materie<br />
Schon zu Begin des 20. Jahrhunderts deuteten astronomische Messungen darauf hin, dass<br />
die bisher gemessene und wahrgenommene Materie nur einen Bruchteil der Gesamtmaterie<br />
9
10 2. Physikalischer Hintergrund<br />
im Universum ausmacht. Erste Hinweise auf diese Diskrepanz wurden in den 1930er Jahren<br />
von Fritz Zwicky gegeben, der eine zusätzliche nicht sichtbare Materie postulierte, um die<br />
Stabilität von Galaxienhaufen zu erklären [10]. Anhaltspunkte lassen sich auch aus den<br />
Rotationskurven von Galaxien ziehen. Nach den Gesetzen der newtonschen Mechanik,<br />
nehmen diese für einen Körper mit der Masse M in einer Massenverteilung in einem<br />
Zentrum m, wie man sie anhand der sichtbaren Galaxiescheibe erwarten würde, aus<br />
mit dem Orbitalradius r nach<br />
mv 2<br />
r<br />
v =<br />
= G · mM<br />
r 2 (2.6)<br />
√<br />
GM/r (2.7)<br />
ab. Beobachtungen zeigen jedoch, dass sich Rotationsgeschwindigkeiten nahezu konstant<br />
mit dem Orbitalradius verhalten. Der Verlauf der Rotationsgeschwindigkeiten aus Messungen<br />
an der Dreiecksnebel genannten Galaxie M33, sowie die Erwartung nach der newtonschen<br />
Mechanik sind in Abbildung 2.6 gezeigt. Um dieses Verhalten zu erklären, benötigt<br />
Abbildung 2.6.: Rotationsgeschwindigkeit von Sternen einer Galaxie mit deren Orbitalradius<br />
(grün) sowie die Erwartung aus den Keplerschen Gesetzen (orange)<br />
[11].<br />
man eine Massenverteilung nach ϱ ∼ r −2 und damit eine Verteilung der überwiegenden<br />
Masse im sogenannten Halo der Galaxie [4]. Auch auf größeren Skalen lassen sich Hinweise<br />
finden, dass im Universum mehr Materie als die sichtbare, in Form von Gaswolken<br />
und Sternen, vorhanden ist. Beispielsweise aus dem Gravitationslinseneffekt, der die Folge<br />
der Ablenkung von Licht an großen Mengen Materie sichtbar macht. All diese Hinweise<br />
sprechen für ein Vorhandensein sogenannter Dunkler, weil nicht-sichtbarer, Materie im<br />
Universum.<br />
Um die tatsächliche Menge an Dunkler Materie abzuschätzen ist man auf kosmologische<br />
Modelle angewiesen. Die für die Entwicklung des Kosmos bevorzugte Theorie ist das Λ-<br />
CDM-Modell. Λ steht dabei für eine kosmologische Konstante, die die beschleunigte Expansion<br />
des Universums erklären soll, und CDM für kalte Dunkle Materie 1 . Dieses Modell<br />
ist gut durch Beobachtungen der kosmischen Hintergrundstrahlung und der Häufigkeit der<br />
Elemente im Kosmos belegt. Die Voraussage der Materieverteilung durch das Λ-CDM-<br />
Modell ist in Abbildung 2.7 dargestellt. Demnach entfällt 23% der Materie im Kosmos<br />
auf die Dunklen Materie. Baryonische Materie in Form von Atomen macht lediglich 4, 6%<br />
aus. Ein Großteil von 72% entfällt auf die kosmologische Konstante, die auch als Dunkle<br />
Energie bezeichnet wird und deren Ursprung noch unklar ist.<br />
1 engl.: Cold Dark Matter<br />
10
2.3. Dunkle Materie 11<br />
Abbildung 2.7.: Erwartete Verteilung von Materie und Energie im Universum nach dem<br />
Λ-CDM-Modell [12].<br />
2.3.1. Kandidaten für Dunkle Materie<br />
Ein naheliegender Kandidat für nicht selbst leuchtende und damit dunkle Materie in den<br />
Halos von Galaxien bildet klassische baryonische Materie. Diese könnte in Form von Gasoder<br />
Staubwolken, die kalt genug sind um kein Licht im infraroten Wellenlängenbereich<br />
zu emittieren, vorhanden sein. Gas- oder Staubwolken würden jedoch einfallende Strahlung<br />
absorbieren und sich dadurch erwärmen. Damit würden sie im infraroten Lichtbereich<br />
sichtbar werden. Ein weiterer Ansatz bilden massereiche baryonische Objekte (MACHOs 2 ),<br />
deren Massedruck nicht ausreicht um den Fusionsprozess in Gang zu setzen und die damit<br />
kalt bleiben. Als solche Objekte kommen braune Zwerge, oder bereits ausgebrannte<br />
Sterne in Form von Neutronensternen oder schwarzen Löchern in Frage. Solche massiven<br />
Objekte könnten durch den Mikrolinseneffekt sichtbar gemacht werden. Auch wenn in der<br />
Halo tatsächlich vereinzelt massive Objekte beobachtet werden konnten, reicht ihre Dichte<br />
nicht aus um das Massendefizit zu erklären.<br />
Für Dunkle Materie kommt auch nicht baryonische Materie in Frage. Ein Kandidat hierfür<br />
darf keine elektromagnetische Ladung zu tragen und muss Masse zu besitzen. Außerdem<br />
muss ein geeigneter Kandidat stabil sein. Schwach Wechselwirkende massereiche Teilchen<br />
(WIMPs 3 ) als Teilchen der Dunklen Materie könnten Neutrinos sein. Aus der Beobachtung<br />
der Neutrinooszillation bei solaren Neutrinos folgt, dass Neutrinos Masse besitzen müssen.<br />
Ihre Dichte im Universum ist vergleichbar mit der Dichte von Photonen der kosmischen<br />
Hintergrundstrahlung, was in etwa 300 Neutrinos/cm 3 bedeutet. Aus dieser Information<br />
und der kritischen Dichte von 10 −29 g/cm 3 aus WMAP Messungen, kann eine obere Grenze<br />
für Neutrinomassen m ν gegeben werden. Diese liegt für die drei Neutrinos und ihrer<br />
Antiteilchen bei<br />
20eV/c 2 ≥ ∑ m ν = 2(m νe + m νµ + m ντ )<br />
und damit bei maximal 10 eV/c 2 , wenn nur eines der Neutrinotypen Masse trägt [4].<br />
Teilchen dieser geringen Masse sind relativistisch und werden als heiße Dunkle Materie<br />
bezeichnet. Bestünde die benötigte Dunkle Materie ausschließlich aus heißer Dunklen<br />
Materie, wäre die beobachtete Strukturbildung im Universum jedoch nicht erklärbar. Es<br />
muss daher auch nicht relativistische kalte Dunkle Materie geben. Geeignete Kandidaten<br />
finden sich in supersymmetrischen Erweiterungen des Standardmodells der Teilchenphysik.<br />
Im Standardmodell der Teilchenphysik besteht Materie aus sechs Quarks (Up, Down,<br />
Charme, Strange, Top, Bottom), drei Generationen von Leptonen mit ihren Neutrinos<br />
(Elektron, Myon, Tau) und den vier Typen von Austauschbosonen (Photon, Gluon, Z<br />
und W), sowie dem Higgs Boson. Zusätzlich existieren noch entsprechende Antiteilchen<br />
2 engl.: MAssive Compact Halo Object<br />
3 engl.: Weakly Interacting Massive Particle<br />
11
12 2. Physikalischer Hintergrund<br />
mit entgegengesetzter Masse und Parität. In supersymmetrischen Erweiterungen des Standardmodells<br />
erhält jedes Teilchen im Standardmodell einen supersymmetrischen Partner<br />
mit einer entgegengesetzten neuen Quantenzahl, der R-Parität. Die Teilchen in der minimalen<br />
supersymmetrischen Erweiterung des Standartmodels der Teilchenphysik sind in<br />
Abbildung 2.8 dargestellt. Da bisher keine supersymmetrischen Teilchen an Beschleuni-<br />
Abbildung 2.8.: Teilchen der minimalen supersymmetrischen Erweiterung des Standardmodells<br />
der Teilchenphysik [13].<br />
gern gefunden wurden, geht man davon aus, dass die Supersymmetrie gebrochen ist und<br />
supersymmetrische Teilchen damit schwerer als ihre Partner sind. Dabei ist aufgrund der<br />
Paritätserhaltung zumindest das leichteste supersymmetrische Teilchen, das sogenannte<br />
Neutralino ˜χ 0 , stabil und damit ein geeigneter WIMP Kandidat für Dunkle Materie [4].<br />
Experimente zur Suche nach Dunkler Materie konzentrieren sich hauptsächlich auf die<br />
Suche nach solchen WIMPs.<br />
2.3.2. Suche nach Dunkler Materie<br />
Suche nach Dunkler Materie aus der kosmischen Strahlung findet auf zwei verschiedene Arten<br />
statt. Zum einen können WIMPs durch inelastische Stöße an Atomkernen aufgrund der<br />
schwachen Wechselwirkung direkt nachgewiesen werden. Energien, die bei einem solchen<br />
Stoß frei werden, sind sehr klein und man hat mit einem großen Untergrund durch natürliche<br />
Strahlung zu kämpfen. Um diesen abzuschirmen befinden sich solche Experimente<br />
meist im Innern von Bergen oder Untertage. Außerdem werden hoch reine Materialien<br />
benötigt um klare Signale zu erhalten. Ein Experiment dieser Art ist beispielsweise das<br />
EDELWEISS 4 Experiment im Modane Untergrundlabor.<br />
Des Weiteren können WIMPs durch Paarzerfall miteinander in Teilchen des Standartmodells<br />
zerfallen, da hier die R-Parität nicht verletzt ist. Solche Zerfälle sind in Abbildung 2.9<br />
dargestellt. Anhand der Zerfallsprodukte könnten sich WIMPs indirekt nachweisen lassen.<br />
Auf der Suche nach einem Ausschlag im Spektrum der möglichen Zerfallsprodukte, der auf<br />
WIMP Annihilation hindeuten könnte, ist auch das AMS-02 Experiment.<br />
2.4. Der Positronanteil in der leptonischen Komponente der<br />
kosmischen Strahlung<br />
Ein solcher Hinweis auf WIMP Annihilation könnte aus dem Anteil an Positronen in den<br />
Leptonen der kosmischen Strahlung hervorgehen. Kosmische Positronen stammen hauptsächlich<br />
aus Wechselwirkungsprozessen von kosmischen Protonen mit interstellarem Gas.<br />
4 franz.: Expérience pour Détecter Les WImps En SIte Souterrain<br />
12
2.4. Der Positronanteil in der leptonischen Komponente der kosmischen Strahlung 13<br />
Abbildung 2.9.: Zerfallskette der Annihilation supersymmetrischer Neutralinos in Teilchen<br />
des Standardmodells der Teilchenphysik [14].<br />
In primären Quellen wie Supernova-Explosionen werden sie aufgrund der Paarvernichtung<br />
mit Elektronen nur wenig erzeugt. Aus diesem Wissen, kann man eine Erwartung an den<br />
Anteil an Positronen in den Leptonen der kosmischen Strahlung formulieren. Dieser sollte<br />
logarithmisch mit der Energie fallen. Satellitenexperimente wie PAMELA oder Fermi<br />
beobachten jedoch einen Anstieg im Positronenanteil ab einer Energie von 6 GeV, wie er<br />
in Abbildung 2.10 dargestellt ist. Dieser Anstieg deutet auf eine bisher unbekannte Quelle<br />
Abbildung 2.10.: Positronenanteil in der leptonischen Komponente der kosmischen Strahlung<br />
mit der Energie bis 100 GeV aus Messungen verschiedener Experimente<br />
[15].<br />
kosmischer Positronen hin. WIMP Annihilation, wie sie in Abbildung 2.9 dargestellt ist,<br />
könnte eine solche sekundäre Quelle sein. Als primäre Quelle von Elektron-Positron Paaren<br />
kommen allerdings auch Pulsare in Frage [16]. Pulsare sind rotierende Neutronensterne<br />
als Überreste von Supernova-Explosionen. Die Rotation führt zu einem induzierten elektrischen<br />
Feld, durch dass dem Pulsar Elektronen an dessen Oberfläche entzogen werden.<br />
13
14 2. Physikalischer Hintergrund<br />
Diese folgen dem starken Magnetischen Feld des Neutronensterns und emittieren Photonen<br />
durch Synchrotronstrahlung. Hochenergetische Photonen können im hohen magnetischen<br />
Feld durch Paarbildung Elektron-Positron Paare bilden. Dieser Prozess kann beliebig oft<br />
wiederholt werden, so das eine große Zahl an Elektron-Positron Paaren frei werden. Während<br />
Positronen als Produkt von WIMP Annihilation isotrop nachweisbar wären, sollte<br />
bei Pulsaren als Quelle eine Energieabhängige Anisotropie auftreten.<br />
Der AMS-02 Detektor wird das Positronenspektrum zu höheren Energien fortsetzen und<br />
mit seiner hohen Akzeptanz eine mögliche Anisotropie untersuchen. Damit wird die Quelle<br />
des Anstiegs im Positronenverhältnis weiter eingegrenzt werden.<br />
14
3. Der AMS-02 Detektor<br />
Der AMS-02 Detektor ist ein seit Mai 2011 auf der Internationalen Raumstation (ISS 1 ) als<br />
externes Modul montierter Teilchendetektor. Die ISS stellt dem sieben Tonnen schweren<br />
und 64 Kubikmeter fassenden Detektor eine sichere Energieversorgung von etwa 2500 Watt<br />
sowie eine hohe Datenübertragung von mindestens 9 Megabits/s zur Erde zur Verfügung.<br />
Der Detektor ist so konstruiert, dass er während der gesamten Restlaufzeit der ISS Mission<br />
bis mindestens 2020 arbeiten kann [17]. Das Instrument ist aus sechs voneinander unabhängig<br />
arbeitenden Subdetektoren aufgebaut, die jeweils unterschiedliche Eigenschaften<br />
eines einfallenden Teilchens messen. Eine technische Zeichnung des Detektors und seiner<br />
Komponenten ist in Abbildung 3.1 zu sehen. Demnach durchquert ein von oben in den De-<br />
Abbildung 3.1.: Technische Zeichnung des AMS-02 Detektors mit Beschriftung der Subdetektoren<br />
[18].<br />
1 engl.: International Space Station<br />
15
16 3. Der AMS-02 Detektor<br />
tektor einfallendes Teilchen zunächst den Übergangsstrahlungsdetektor (TRD 2 ) der Energieabgaben<br />
proportional zum Gammafaktor misst. Anschließend werden die ersten beiden<br />
Szintillatorlagen zur Flugzeitmessung (TOF 3 ) durchquert, welche zusammen mit zwei weiteren<br />
Lagen unterhalb des Magneten die Geschwindigkeit des Teilchens messen können. Im<br />
Kern des Detektors befindet sich ein Silizium Spurdetektor mit sieben Lagen. Dieser wird<br />
von einem Permanentmagneten umgeben der ein Magnetfeld von 0, 15 Tesla erzeugt. So<br />
kann über die Krümmung der Teilchenbahn im Magnetfeld das Ladungsvorzeichen sowie<br />
das Verhältnis aus Teilchenimpuls und Ladung gemessen werden. Um die Auflösung des<br />
Spurdetektors zu erhöhen, befinden sich zwei weitere Lagen auf der Oberseite des Übergangsstrahlungsdetektors,<br />
sowie vor dem Kalorimeter. Um Teilchen zurückzuweisen, die<br />
von der Seite in den Detektor einfallen, ist der Silizium Spurdetektor von einem Antikoinzidenzzähler<br />
umgeben. Nun folgen noch der Ring abbildende Tschwerenkow Detektor,<br />
der Masse und Ladung des Teilchens messen kann und das elektromagnetische Kalorimeter<br />
zur Energiebestimmung. Dank dieses Aufbaus und der großen Erfahrung, die man von<br />
vorangegangenen teilchenphysikalischen Experimenten in die einzelnen Subdetektoren einfließen<br />
lassen konnte, misst der AMS-02 Detektor kosmische Teilchen mit einer sehr hohen<br />
Akzeptanz.<br />
Aufbau und Funktionsweise der einzelnen Subdetektoren werden im Folgenden näher behandelt,<br />
wobei eine detaillierte Beschreibung des Übergangsstrahlungsdetektors im nachfolgenden<br />
Kapitel erfolgt.<br />
3.1. Der Übergangsstrahlungsdetektor (TRD)<br />
Der Übergangsstrahlungsdetektor ist ein speziell für hohe Teilchenenergien im GeV Bereich<br />
ausgelegter Subdetektor auf der Oberseite des AMS-02 Detektors. Bei diesen Energien sind<br />
Teilchen durch ihre Masse, die im MeV/c 2 Bereich liegt, nur noch schwer zu unterscheiden,<br />
da die Teilchenenergien durch den kinetischen Anteil dominiert sind. Um solche Teilchen<br />
dennoch gut identifizieren zu können macht man sich den Effekt der Übergangsstrahlung<br />
zunutze. Diese kann entstehen, wenn ein hochrelativistisches geladenes Teilchen von einem<br />
Medium mit einer Permitivität ɛ 1 in ein Medium unterschiedlicher Permitivität ɛ 2 eintritt.<br />
Die Intensität der in Vorwärtsrichtung emittierten Strahlung im Energiebereich von einigen<br />
keV ist dabei proportional zum Gamma-Faktor γ = E/mc 2 des Teilchens. Das bedeutet,<br />
dass beispielsweise ein Elektron mit einer Ruhemasse von 0, 5 MeV/c 2 bei gleicher Energie<br />
wesentlich mehr Übergangsstrahlung produziert als ein Proton mit einer Ruhemasse von<br />
940 Mev/c 2 . Die Wahrscheinlichkeit Übergangsstrahlung zu emittieren ist so gering, dass<br />
man eine Anordnung aus vielen Übergängen von Materialien unterschiedlicher Permitivität<br />
wählt. Im Übergangsstrahlungsdetektor des AMS-02 Detektors sind daher 20 Lagen<br />
mit 20 mm dickem Radiatorvlies aus Polypropylen- und Polyethylen-Fasern verbaut, die<br />
eine hohe Zahl von Vakuum-Radiator Übergängen gewährleisten. Die entstandene Übergangsstrahlung<br />
wird dann von Proportionaldrahtkammerröhrchen unter jeder Lage Vlies<br />
detektiert. Eine schematische Skizze einer Lage im Übergangsstrahlungsdetektor ist in Abbildung<br />
3.2 zu sehen.<br />
Aufgrund dieser Eigenschaften ist der Übergangsstrahlungsdetektor vor allem für die Trennung<br />
von Positronen und Protonen sehr gut geeignet. Details zu Aufbau und Funktionsweise<br />
des Übergangsstrahlungsdetektors werden gesondert in Kapitel 4 behandelt.<br />
3.2. Der Flugzeitdetektor (TOF)<br />
Das System zur Flugzeitmessung besteht aus vier Lagen parallel angeordneter 1 cm dicker<br />
Kunststoff Szintillatorstreifen aus Polyvinyltoluene (PVT). Zwei Lagen sind dabei ober-<br />
2 engl.: Transition Radiation Detector<br />
3 engl.: Time Of Flight<br />
16
3.2. Der Flugzeitdetektor (TOF) 17<br />
Abbildung 3.2.: Schematische Zeichnung einer TRD Lage aus 20 mm dickem Radiatorvlies<br />
und Proportionaldrahtkammerröhrchen zum Nachweis von Übergangsstrahlung<br />
[19].<br />
halb und zwei unterhalb der Magnetstruktur angebracht, wobei die Szintillatorstreifen für<br />
zwei Lagen um 90 Grad zueinander gedreht sind um eine x-y-Ortsauflösung zu erreichen.<br />
An beiden Enden der Szintillatorstreifen sind Photomultiplier angebracht. In Abbildung<br />
3.3 ist der Flugzeitdetektor vor seinem Einbau in das AMS-02 Instrument zu sehen.<br />
Abbildung 3.3.: Foto der oberen und unteren Lagen des Flugzeitdetektors vor dem Einbau<br />
[20].<br />
Passiert ein geladenes Teilchen das szintillierende Material des Detektors werden dessen<br />
Moleküle angeregt und fallen durch schnelle Emission (τ ∼ 10 −8 s) eines charakteristischen<br />
Photons in ihren Grundzustand zurück. Das entstehende Licht wird durch Lichtleiter zu<br />
den Photomultiplieren an den Enden der Szintillatorstreifen geleitet. Ein solcher Szintillatorstreifen<br />
ist in Abbildung 3.4 zu sehen. Durch die Photomultiplier wird ein Signal zur<br />
Zeitmessung ausgelöst bzw. gestoppt. Der Flugzeitdetektor arbeitet also wie eine Stoppuhr<br />
mit einer Genauigkeit von 150 ps und kann damit die Geschwindigkeit von Teilchen mit bis<br />
zu 98% der Lichtgeschwindigkeit bestimmen [20]. Dadurch kann auch die Durchflugrichtung<br />
des Teilchens bestimmt werden, die zur Bestimmung des Ladungsvorzeichens durch<br />
den Spurdetektor benötigt wird.<br />
Außerdem kann durch die Intensität der charakteristischen Fluoreszensstrahlung die Energieabgabe<br />
pro Weglänge dE/dx des durchdringenden Teilchens und damit seine Ladung<br />
bestimmt werden.<br />
17
18 3. Der AMS-02 Detektor<br />
Abbildung 3.4.: Technische Zeichnung eines Szintillatorstreifens mit Beschriftung der<br />
Komponenten [20].<br />
3.3. Der Permanentmagnet<br />
Um kosmische Teilchen von deren Antiteilchen unterscheiden zu können benötigt man eine<br />
Messung des Ladungsvorzeichens. Dieses wird durch eine Kombination von Permanentmagneten<br />
und Silizium Spurdetektor, der die Teilchenspur im Magnetfeld aufnehmen kann,<br />
bewerkstelligt. Ein Teilchen, das sich durch ein Magnetfeld ⃗ B mit der Geschwindigkeit ⃗v<br />
bewegt wird durch die Lorentzkraft<br />
F L = q · (⃗v × ⃗ B) (3.1)<br />
abgelenkt. Die Krümmung der Teilchenbahn kann dann vom Spurdetektor gemessen werden.<br />
Der Magnet des AMS-02 Instruments besteht dabei aus 6400 Neodym-Eisen-Bor Blöcken,<br />
die aus 64 Sektoren einen Zylinder von einem Meter Höhe und etwa einem Meter im Durchmesser<br />
bilden. Der Magnet erzeugt eine nahezu homogenes Magnetfeld mit einer Stärke<br />
von 0, 15 Tessla in x-Richtung, wobei die z-Richtung in der vertikalen Detektorachse verläuft.<br />
Die Geometrie des Magneten wurde so gewählt, dass nahezu kein Restmagnetfeld<br />
außerhalb des Magnetzylinders vorhanden ist, welches die Elektronik, sowie Funktionen<br />
von Subdetektoren und der ISS beeinträchtigen könnte. Außerdem ist das Dipolmoment<br />
nahezu null, was für eine stabile Umlaufbahn im Erdmagnetfeld von entscheidender Bedeutung<br />
ist [21]. In Abbildung 3.5 ist ein Foto des Magneten vor dem Einbau zu sehen<br />
sowie eine Skizze mit Blick auf die x-y-Ebene, in der das Magnetfeld und die Ausrichtung<br />
der 64 Segmente dargestellt wird. Der Permanentmagnet wurde bereits beim Flug von<br />
AMS-01 verwendet.<br />
3.4. Der Silizium Spurdetektor<br />
Der Spurdetektor 4 ist der einzige Subdetektor, der die Krümmung eines sich bewegenden<br />
Teilchens im Magnetfeld und somit das Ladungsvorzeichen zur Unterscheidung von Teilchen<br />
und Antiteilchen bestimmen kann. Die der Krümmung zugeordnete Messgröße ist<br />
dabei die Rigidität R, welche als das Produkt aus Magnetfeld B und Krümmungsradius r<br />
definiert ist. Außerdem ist sie mit<br />
R =<br />
p<br />
(3.2)<br />
Z · e<br />
direkt proportional zum Teilchenimpuls p, wobei Z die Ladungszahl des Teilchens und e<br />
die Elementarladung ist. Ist diese bekannt, lässt sich also der Impuls des Teilchens bestimmen.<br />
Das Vorzeichen wird dabei so gewählt, dass ein negativ geladenes Teilchen eine<br />
negative Rigidität besitzt und ein positiv geladenes Teilchen eine positive Rigidität.<br />
4 engl.: Tracker<br />
18
3.4. Der Silizium Spurdetektor 19<br />
Abbildung 3.5.: Der AMS-02 Permanentmagnet in der Seitenansicht (links) und das von<br />
ihm erzeugte Magnetfeld in der Draufsicht (rechts) [22].<br />
Das System zur Spurbestimmung besteht aus neun Lagen, die jeweils aus doppelseitigen<br />
Siliziumstreifensensoren aufgebaut sind. Dabei bilden die Lagen zwei bis acht innerhalb<br />
des Magneten den inneren Spurdetektor. Lage eins, oberhalb des Übergangsstrahlungsdetektors<br />
und Lage neun vor dem Kalorimeter bilden den oberen- und unteren Spurdetektor<br />
und erweitern den Messbereich für Rigiditäten bis zu 2 TeV. Insgesamt wurden 192 Siliziumstreifen<br />
verbaut. In Abbildung 3.6 ist der Aufbau des Spurdetektorsystems zu sehen.<br />
Abbildung 3.6.: Schematische Darstellung der Spurdetektorplatten (links) und Fotos vor<br />
deren Integration in den Detektor (rechts) [23].<br />
Durchdringt ein geladenes Teilchen einen der Siliziumstreifen, produziert es im Halbleitermaterial<br />
Elektronen-Loch Paare, die innerhalb von 10 ns durch ein anliegendes elektrisches<br />
Feld von etwa 80 V in entgegengesetzte Richtung abgesaugt und damit an der Rekombination<br />
gehindert werden. Die Elektronen werden von Leiterstreifen auf der Oberfläche des<br />
Sensors in direkter Umgebung des Teilchendurchgangs aufgenommen. Diese Elektronenströme<br />
kann man messen und damit den Ladungsschwerpunkt als Durchstoßpunkt des<br />
Teilchens mit einer Genauigkeit von 10 µm in der Krümmungsebene und 30 µm in der<br />
nicht gekrümmten Bahnebene bestimmen. Außerdem ist die Menge erzeugter Elektronen-<br />
19
20 3. Der AMS-02 Detektor<br />
Loch Paare und damit die Stärke des Signals proportional zum Quadrat der Ladungszahl<br />
Z 2 , welche somit bestimmt werden kann [24]. Eine schematische Darstellung eines solchen<br />
Streifensensors ist in Abbildung 3.7 zu sehen. So erhält man im optimalen Fall neun<br />
Durchstoßpunkte, mit denen die Teilchenbahn rekonstruiert werden kann.<br />
Abbildung 3.7.: Schematische Skizze von Aufbau und Funktionsweise eines doppelseitigen<br />
Silizium Streifensensors [24].<br />
Um die gewünschte Auflösung des Spurdetektors zu erreichen und beizubehalten wurde<br />
ein System zur Kalibrierung, bestehend aus 10 Laserdioden im infraroten Wellenlängenbereich<br />
integriert. Die Wellenlänge von 1082 nm wurde so gewählt, dass der Strahl zwar<br />
im Spurdetektor Signale hinterlässt, aber dennoch genug durchdringend ist um den gesamten<br />
inneren Spurdetektor zu passieren. So wird eine durchgehend gerade Teilchenbahn<br />
simuliert. Die Position dieser Signale kann auf 10 µm genau bestimmt und die Anordnung<br />
der Detektorlagen zu jedem gewünschten Zeitpunkt angegeben werden. Eine weitere<br />
Herausforderung ist die von der Elektronik erzeugte Abwärme abzuleiten, da diese den<br />
Spurdetektor aufheizen und damit störendes thermisches Rauschen verursachen würde.<br />
Aufgrund fehlender Atmosphäre muss die Abwärme von einem CO 2 -Kreislauf aufgenommen<br />
und zu großen Radiatoren an der Außenseite des AMS-02 Detektors geleitet werden.<br />
Das Temperatur Kontrollsystem des Spurdetektors (TTCS 5 ) ist dabei in der Lage die<br />
Temperatur des Spurdetektors innerhalb eines Grads konstant zu halten.<br />
3.5. Der Antikoinzidenz Zähler (ACC)<br />
Um bei einem isotropen Teilchenfluss durch den Detektor von etwa 10000 Teilchen pro<br />
Sekunde nur für die Analyse interessante Trigger von in z-Richtung passierenden Teilchen<br />
abzuspeichern, ist der innere Spurdetektor zylindrisch von 16 Szintillatorbahnen umgeben,<br />
dem sogenannten Antikoinzidenz Zähler (ACC 6 ). Fällt ein Teilchen seitlich in den Spurdetektor<br />
ein, so wird in diesen Szintillatorbahnen mit hoher Effizienz Szintillationslicht<br />
produziert und zu Photomultipliern weitergeleitet. Events, die solche Teilchen enthalten,<br />
können damit aussortiert werden. Dies ist wichtig, da diese Teilchen Signale im Spurdetektor<br />
hinterlassen, die dann der Teilchenspur eines von oben nach unten passierenden<br />
Teilchens zugeordnet werden können und damit die Rigiditätsbestimmung und speziell die<br />
Messung des Ladungsvorzeichens verfälschen.<br />
Um nicht zusätzlich hochenergetische Teilchen oder Teilchen hoher Ladung in z-Richtung<br />
zurückzuweisen, die durch Wechselwirkung mit Spurdetektor, Flugzeitdetektor oder der<br />
Trägerkonstruktion Delta-Elektronen 7 erzeugen können, wird außerdem das Signal der<br />
5 engl.: Tracker Thermal Control System<br />
6 engl.: Anti Coincidence Counter<br />
7 Sekundärelektronen in einem breiten Energiebereich<br />
20
3.6. Der Ring abbildende Tscherenkow Detektor (RICH) 21<br />
Flugzeitdetektoren für den Vetotrigger verwendet. Abbildung 3.8 zeigt verschiedene Triggerkonfigurationen.<br />
Abbildung 3.8.: Ein seitlich einfallendes Teilchen, das vom ACC zurückgewiesen wird<br />
(links), ein Teilchen hoher Ladung, das Delta-Elektronen erzeugt (Mitte)<br />
sowie ein Backsplash Event (rechts), welche angenommen werden [25].<br />
3.6. Der Ring abbildende Tscherenkow Detektor (RICH)<br />
Durchquert ein geladenes Teilchen ein Medium mit relativistischer Geschwindigkeit β,<br />
welche größer ist als die Phasengeschwindigkeit elektromagnetischer Wellen v = c n<br />
im<br />
Medium, wobei c die Vakuumlichtgeschwindigkeit von c = 299792458 m/s und n der<br />
Brechungsindex des Mediums ist, so werden Atome längs der Flugbahn des Teilchens<br />
kurzzeitig polarisiert und senden dabei eine charakteristische Strahlung aus. Dies ist die<br />
sogenannte Tscherenkow 8 Strahlung. Diese Strahlung breitet sich Kegelförmig entlang der<br />
Flugbahn in Bewegungsrichtung aus, wobei der Öffnugnswinkel θ mit der Geschwindigkeit<br />
des Teilchens und dem Brechungsindex des Mediums verknüpft ist<br />
cos(θ) = 1<br />
n · β . (3.3)<br />
Eine Skizze zur Ausbreitung der Tscherenkow Strahlung ist in Abbildung 3.9 zu sehen.<br />
Der Ring abbildende Tscherenkow Detektor (RICH 9 ) macht sich diesen Effekt zunutze.<br />
Er enthält eine Radiatorschicht aus 2, 7 cm dickem Aerogel im äußeren Bereich mit ei-<br />
Abbildung 3.9.: Skizze zur Ausbreitung von Tscherenkow Strahlung [26].<br />
8 engl.: Cherenkov<br />
9 engl.: Ring Imaging Cherenkov Detector<br />
21
22 3. Der AMS-02 Detektor<br />
nem Brechungsindex zwischen 1, 03 und 1, 05, sowie eine 5 mm dicke und 35cm × 35cm<br />
große Natriumfluorid-Schicht im Zentrum mit Brechungsindex 1, 335. Das ausgesendete<br />
Tscherenkow-Licht wird dann von einer Lage aus 680 Multi-Anoden Photomultipliern<br />
detektiert. In dieser Lage mit einem Durchmesser von etwa 118, 5 cm befindet sich eine<br />
64cm × 64cm große Aussparung, um Messungen des darunterliegenden Kaloriemeters<br />
nicht zu beeinflussen. Die zuvor erwähnte Natriumfluorid-Schicht mit sehr hohem Brechungsindex<br />
und damit großem Winkel des Tschwerenkow-Kegels sorgt hier dafür, dass<br />
Tscherenkow-Licht von Teilchen, die innerhalb dieser Fläche passieren, trotzdem die Photomultiplier<br />
erreichen kann. Um die Akzeptanz zu erhöhen, ist der 47 cm hohe Freiraum zwischen<br />
Radiator- und Detektorschicht am Rand verspiegelt. Das Licht wird also reflektiert<br />
und der Ring, als Schnittfläche durch den Tscherenkow-Lichtkegel in der Detektorschicht<br />
kann rekonstruiert werden. Aufbau und Funktion des Ring abbildenden Tscherenkow Detektors<br />
sind in Abbildung 3.10 zu sehen. Aus dem Durchmesser des aufgenommenen Rings<br />
Abbildung 3.10.: Skizze der Funktionsweise des RICH (links) und Foto der einzelnen Bestandteile<br />
vor dem Zusammenbauen (rechts) [27].<br />
kann nun also die Geschwindigkeit des Teilchens mit einer Auflösung von 0, 1% für Teilchen<br />
mit Ladungszahl Z = 1 und 0, 01% für Kerne mit Ladungszahl Z > 1 bestimmt werden.<br />
Außerdem kann anhand der Intensität des Tscherenkow-Lichtes die Ladungszahl Z mit<br />
einer Auflösung von 10% bestimmt werden. Aus diesen Größen und der Rigidität R kann<br />
man nun die Masse des Teilchens nach<br />
berechnen.<br />
m = R · Z<br />
√<br />
1 − β 2<br />
β<br />
(3.4)<br />
3.7. Das elektromagnetische Kalorimeter (ECAL)<br />
Am unteren Ende des AMS-02 Detektors befindet sich das elektromagnetische Kalorimeter<br />
(ECAL 10 ). Dieses ist ein aus 1 mm dicker Bleifolie im Wechsel mit einer Lage aus Szintillationsfasern<br />
mit einem Durchmesser von 1 mm und mit Epoxydharz verklebter Block von<br />
10 engl.: Electromagnetic calorimeter<br />
22
3.7. Das elektromagnetische Kalorimeter (ECAL) 23<br />
16, 7 cm Höhe und einer Grundfläche von 64, 8cm × 64, 8cm. Die durchschnittliche Dichte<br />
beträgt 6, 9 g/cm 3 [28]. Elf Schichten aus Bleifolie und zehn Lagen Szintillationsfasern werden<br />
dabei zu einem sogenannten Superlayer mit einer Höhe von 18, 5 mm zusammengefasst.<br />
Insgesamt besteht das elektromagnetische Kalorimeter aus neun solcher Superlayer, wobei<br />
vier parallel zur x-Richtung und fünf Superlayer parallel zur y-Richtung abwechselnd angeordnet<br />
sind. Innerhalb eines Superlayers sind 35 Szintillationsfasern zu sogenannten Zellen<br />
zusammengefasst. Vier solcher Zellen werden von einem Photomultiplier ausgelesen. Insgesamt<br />
wurden 324 Photomultiplier für 1269 Zellen verbaut. In Abbildung 3.11 ist rechts<br />
ein Querschnitt durch einen solchen Superlayer und links die Anordnung der Superlayer<br />
gezeigt. Das Kalorimeter kann nun aufgrund der unterschiedlichen Wechselwirkungen von<br />
Abbildung 3.11.: Anordnung von drei Superlayern in wechselnder x-y Ausrichtung (links)<br />
und Querschnitt eines Superlayers mit als Zelle gruppierten Szintillationsfasern<br />
(rechts) [29].<br />
hochenergetischen Teilchen mit dem Bleiabsorber Leptonen, Hadronen und Photonen voneinander<br />
unterscheiden. Ein durchdringendes Elektron oder Positron löst dabei einen elektromagnetischen<br />
Schauer, dominiert von Bremsstrahlung und e − /e + -Paarbildung, aus. Ein<br />
Proton zerfällt durch Kern-Kern Wechselwirkungen hauptsächlich in Pionen und Kaonen<br />
und löst somit einen hadronischen Schauer aus. Diese hadronsichen Schauer sind durch ihre<br />
hohe Teilchenzahl wesentlich weiter gestreut und unterscheiden sich in ihrer Energieabgabe<br />
von eher gerichteten elektromagnetischen Schauern. Diese unterschiedlichen Schauerverhalten<br />
sind in Abbildung 3.12 dargestellt. Das elektromagnetische Kalorimeter kann eine<br />
Abbildung 3.12.: Skizze des Kaloriemeters mit Abmessungen und Ausbreitung hadronischer<br />
(blau) und elektromagnetischer Schauer (rot).<br />
vollständige 3D Rekonstruktion des Schauers erstellen und somit einen wichtigen Beitrag<br />
zur Trennung von Positronen und Protonen liefern. Die Höhe des Kalorimeters entspricht<br />
dabei 17 Strahlungslängen und nur 0, 6 nuklearen Absorbtionslängen. So werden Positronen<br />
mit sehr hoher Wahrscheinlichkeit einen Schauer auslösen und dieser wird im Idealfall<br />
vollständig absorbiert. Die meisten Protonen werden hingegen keinen Schauer auslösen und<br />
nur einen Bruchteil ihrer Energie durch Ionisation im Kalorimeter deponieren. Hochenergetische<br />
Photonen werden ebenfalls einen elektromagnetischen Schauer auslösen, jedoch in<br />
den anderen Subdetektoren kein Signal hinterlassen und können somit identifiziert werden.<br />
Für vollständig absorbierte Schauer kann das Kalorimeter auch die Gesamtenergie des einfallenden<br />
Teilchens angeben, was hauptsächlich bei Elektronen und Positronen mit Ener-<br />
23
24 3. Der AMS-02 Detektor<br />
gien bis zu 1 TeV der Fall ist.<br />
3.8. Teilchensignaturen<br />
Die Signale der beschriebenen Subdetektoren sind in Abbildung 3.13 für die wichtigsten<br />
Teilchen der kosmischen Strahlung und Antihelium bei gleicher Energie von 300 GeV zusammengefasst.<br />
Dabei stehen die angedeuteten Ausschläge nach unten bei TRD und TOF<br />
für Energieabgaben in diesen Subdetektoren. Für den Übergangsstrahlungsdetektor erhält<br />
Abbildung 3.13.: Signaturen von Teilchen bei 300 GeV in den einzelnen Subdetektoren des<br />
AMS-02 Detektors [18].<br />
man für die beiden Leptonen, Elektron und Positron, Übergangsstrahlung in der Intensität<br />
proportional zu deren Gammafaktor, während Protonen und Helium nur ein, hier nicht gezeigtes,<br />
sehr geringes Ionisationssignal hinterlassen. Photonen hinterlassen als ungeladene<br />
Teilchen keine Spuren im gesamten Detektor, können aber im Kalorimeter durch Ionisation<br />
einen elektromagnetischen Schauer auslösen. Außerdem können sie über Paarbildung in<br />
ein Elektron und ein Positron zerfallen und so nachgewiesen werden. Im Flugzeitdetektor<br />
können Teilchen durch ihre Energieabgabe pro Weglänge, die proportional zur getragenen<br />
Ladung im Quadrat ist, charakterisiert werden. Dies ist auch im Spurdetektor möglich,<br />
was anhand der dickeren Spur des Heliums dargestellt ist. Dort wird außerdem das Ladungsvorzeichen,<br />
als einzige Möglichkeit Elektronen von Positronen, oder Helium von Antihelium<br />
zu unterscheiden, bestimmt. Der Ring abbildende Tscherenkow Detektor kann die<br />
Ladung durch die Intensität des Ringes, sowie die Geschwindigkeit über den Ringdurchmesser<br />
bestimmen. Da Helium bei gleicher Gesamtenergie eine geringere Geschwindigkeit<br />
als Protonen oder Leptonen besitzt, ist der Ring hier deutlich größer. Zuletzt folgt das<br />
elektromagnetische Kalorimeter, in dem wie beschrieben elektromagnetische Schauer von<br />
hadronischen Schauern unterschieden werden. In der Abbildung lösen Protonen und Helium<br />
gar keinen Schauer aus und hinterlassen einzig ihr Ionisationssignal proportional zur<br />
Kernladungszahl.<br />
Aus Abbildung 3.13 wird deutlich, dass ein Subdetekor alleine nicht alle Teilchen voneinander<br />
trennen kann. Erst durch das Zusammenspiel aller Subdetektoren kann jeder<br />
Bestandteil der kosmischen Strahlung identifiziert werden.<br />
In Abbildung 3.14 und 3.15 sind ein Elektron und ein Proton Ereignis bei einer Energie<br />
von etwa 90 GeV im Ereignismonitor zu sehen, der in der AMS Software integriert ist.<br />
24
3.8. Teilchensignaturen 25<br />
AMS Event Display Run/Event 1349332598 / 215920 GMT Time 2012-278.06:46:51<br />
Front<br />
Side<br />
DAQ<br />
DAQ<br />
z<br />
Header<br />
z<br />
Header<br />
x<br />
y<br />
Level1<br />
y<br />
x<br />
Level1<br />
Level3<br />
Level3<br />
Particle TrTofTrdTrdHRichRichBEcal No 0 Id=146 p= -92.6±<br />
63 M= 20.4±<br />
o<br />
20 θ=2.90 φ=2.59 Q= 1 β= 0.977± 0.032/ 0.98/ βh= 0.971± 0.037 θ_M -36.8 Coo=(16.63,-27.87,53.04) LT 0.88 θ_G 1.22 φ_G 4.22<br />
TrTrack #0 NHits 6 (x:4,y:6,xy:4)Pattern: 57 _XXXXXX__, DefFit: 17, Chi2 3.704 Pirig -105.370Rigidity: -92.605 Err(1/R): 0.00729 P0: 5.361 -20.912 0.000 Dir: 0.2061 -0.1274 0.9702<br />
Abbildung 3.14.: Ereignismonitor eines Elektrons mit einer Rigidität von −92, 6 GV, aufgenommen<br />
am 04. Oktober 2012.<br />
AMS Event Display Run/Event 1349332598 / 626474 GMT Time 2012-278.06:54:11<br />
Front<br />
Side<br />
DAQ<br />
DAQ<br />
z<br />
Header<br />
z<br />
Header<br />
x<br />
y<br />
Level1<br />
y<br />
x<br />
Level1<br />
Level3<br />
Level3<br />
Particle TrTofTrdRichRichBEcal No 0 Id=46 p= 83.3±<br />
7.1 M= 32.9±<br />
o<br />
8.3 θ=3.04 φ=2.91 Q= 1 β= 0.930± 0.030/ 0.93/ βh= 0.938± 0.041 θ_M -56.7 Coo=(47.02,-5.14,53.05) LT -1.00 θ_G 0.99 φ_G 4.54<br />
TrTrack #0 NHits 8 (x:7,y:8,xy:7)Pattern: -1 XXXXX_XXX, DefFit: 3089, Chi2 1.442 Pirig 82.592Rigidity: 83.264 Err(1/R): 0.00102 P0: 41.509 -3.866 0.000 Dir: 0.1034 -0.0238 0.9944<br />
Abbildung 3.15.: Ereignismonitor eines Protons mit einer Rigidität von 83, 3 GV, aufgenommen<br />
am 04. Oktober 2012.<br />
25
4. Der Übergangsstrahlungsdetektor<br />
In diesem Kapitel soll auf den bereits in Teil 3.1 angesprochenen Übergangsstrahlungsdetektor<br />
näher eingegangen werden. Aufgrund seiner Fähigkeit relativistische Teilchen nach<br />
deren Masse zu trennen, ist er für die Trennung von Positronen und Protonen bei hohen<br />
Energien besonders geeignet. Wie bereits beschrieben sind Protonen der Hauptbestandteil<br />
kosmischer Strahlung und damit der dominierende Untergrund bei der Messung von Positronen.<br />
Bei einem Verhältnis des Protonen- zu Positronenflusses von 10 3 −10 4 wird dabei<br />
eine Protonenunterdrückung von 10 6 angestrebt um die Verunreinigung durch Protonen<br />
im Positronenspektrum unter 1% zu halten.<br />
Um eine maximale Effizienz zu erreichen, besitzt der TRD eine oktogonale Form mit einem,<br />
sich nach unten hin verkleinernden, Durchmesser des Inkreises von 2 m auf der Oberseite<br />
und 0, 8 m auf der Unterseite.<br />
Auch wenn die Technik Teilchen anhand emittierter Übergangsstrahlung zu detektieren<br />
wohl bekannt ist und in einigen teilchenphysikalischen Experimenten wie dem ATLAS<br />
Detektor am LHC oder HERA-B am DESY in Hamburg verwendet wird, ist der Betrieb<br />
des Übergangsstrahlaungsdetektors als komplexer Gasdetektor im Weltraum dennoch eine<br />
Herausforderung.<br />
4.1. Entstehung von Übergangsstrahlung<br />
Zur Beschreibung der Entstehung von Übergangsstrahlung beim Grenzübergang eines geladenen<br />
Teilchens zwischen Materialien unterschiedlicher Permitivität werden unterschiedliche<br />
Modelle herangezogen. Eine physikalisch leicht nachzuvollziehende Annahme postuliert<br />
eine Spiegelladung, die durch Polarisation des Mediums durch das herannahende geladene<br />
Teilchen induziert wird. Beide Ladungen bilden so einen elektrischen Dipol, wie er in Abbildung<br />
4.1 dargestellt ist. Durch die Bewegung des Teilchens verändert sich dieser Dipol<br />
und strahlt somit Energie in Form elektromagnetischer Wellen ab.<br />
Ein anderer Ansatz basiert auf den Lösungen der inhomogenen Maxwellgleichungen in beiden<br />
Medien, welche sich durch einen Term mit der elektrischen Polarisation im Medium<br />
unterscheiden. Beim Übergang zwischen zwei Stoffen muss dann eine Umordnung der vom<br />
Teilchen erzeugten Felder stattfinden, bei der die Differenzenergie abgestrahlt wird. Die<br />
Intensität der abgestrahlten Photonen ist dabei<br />
I = γq2 (ω 1 − ω 2 ) 2<br />
3c<br />
(4.1)<br />
27
28 4. Der Übergangsstrahlungsdetektor<br />
Abbildung 4.1.: Spiegelladung einer positiven Ladung an einer Grenzfläche [30].<br />
mit dem Lorentz-Faktor des Teilchens γ = E/mc 2 , seiner Ladung q und den Plasmafrequenzen<br />
ω 1,2 in beiden Materialien. Ein Großteil dieser Energie wird mit der Wahrscheinlichkeit<br />
von etwa α/3 in Form energiereicher Photonen im Röntgenbereich von 2 − 20<br />
keV innerhalb des Winkelbereichs θ ≤ 1/γ, des sogenannten Vorwärtskegels, abgestrahlt<br />
[31]. Dabei ist α = 1/137 die Feinstrukturkonstante. Gleichung 4.1 ist auch bei einem<br />
nichtrelativistischen Teilchen mit γ ∼ 1 ungleich null. Damit wird Übergangsstrahlung,<br />
anders als beispielsweise beim Tscherenkow Effekt, auch bei niedrigen Geschwindigkeiten<br />
abgestrahlt. Bei vielen Grenzübergängen werden dann mit einer ausreichend großen Wahrscheinlichkeit<br />
Photonen mit einer direkt zum Lorentz-Faktor des Teilchens proportionalen<br />
Intensität emittiert. Diese können bei bekannter Energie zur Unterscheidung von Teilchen<br />
nach deren Masse verwendet werden.<br />
4.2. Aufbau des Detektors und Messung von Übergangsstrahlung<br />
Als Radiator im Übergangsstrahlungsdetektor des AMS-02 Experiments sind 20 Lagen<br />
aus Vlies, bestehend aus Polypropylen- und Polyethylen-Fasern, mit einer Dicke von 20<br />
mm und einer Dichte von 0, 06 g/cm 3 verbaut. Die lose angeordneten und etwa 10 µm<br />
dicken Fasern ermöglichen eine hohe Zahl von Vakuum-Radiator Übergängen, so dass<br />
beim Durchqueren einer Lage Übergangsstrahlung mit einer Wahrscheinlichkeit von etwa<br />
60% ausgesendet und detektiert wird [32]. Die entstandene Übergangsstrahlung wird von<br />
Proportionaldrahtkammerröhrchen unterhalb jeder einzelnen Lage Vlies gemessen. Diese<br />
haben einen Durchmesser von 6 mm und eine Länge von 0, 8 − 2 m. Sie bestehen aus<br />
Kapton-Folie die mit Aluminium und Graphit als Kathode auf der einen und Polyurethan<br />
auf der anderen Seite beschichtet ist. Zwei solcher Folien werden jeweils Rücken an Rücken<br />
zusammengebracht und bilden somit eine 72 µm starke Hülle. Die einzelnen Schichten<br />
des Wandmaterials sowie der Fertigungsprozess der Röhrchen sind in Abbildung 4.2 zu<br />
sehen. Als Anodendraht wird ein 30 µm dicker Draht aus mit Gold beschichtetem Wolfram<br />
verwendet. Die Betriebsspannung im Proportionalbereich liegt im Bereich von etwa 1500<br />
V. 16 solcher Röhrchen sind zu einem Modul zusammengefasst. Zur Stabilität sind die<br />
Module mit 6 Versteifungen aus Karbon durchzogen, sowie mit Karbonband im Abstand<br />
von 10 cm gesichert. Ein Bild eines solchen Moduls in der Draufsicht und im Querschnitt<br />
mittels Computertomographie ist in Abbildung 4.3 zu sehen. Insgesamt wurden 328 Module<br />
und damit 5248 Proportionaldrahtkammerröhrchen in 20 Lagen verbaut. Die oberen und<br />
unteren vier Lagen sind dabei parallel zur x-Richtung, die restlichen Lagen um 90 ◦ gedreht<br />
in y-Richtung angeordnet, was eine drei-dimensionale Spurrekonstruktion ermöglicht. Die<br />
einzelnen Module sind in eine Oktogonale Trägerkonstruktion aus Aluminiumwaben mit<br />
Querstreifen aus Karbon zur Stabilität eingebettet. Der gesamte Subdetektor wiegt dank<br />
konsequenter Leichtbauweise nur 500 kg.<br />
Als Füllgas für die Proportionaldrahtkammern wird eine Mischung aus 90% Xenon und<br />
28
4.2. Aufbau des Detektors und Messung von Übergangsstrahlung 29<br />
Abbildung 4.2.: Schematische Darstellung der Zusammensetzung des Wandmaterials für<br />
eine Proportionalkammerröhre (links) und Veranschaulichung des Fertigungsprozesses<br />
(rechts) [33].<br />
Abbildung 4.3.: Foto eines Moduls in der Draufsicht (oben) und der Querschnitt mittels<br />
Computertomographie (unten) [32].<br />
10% Kohlenstoffdioxid verwendet. Einfallende Übergangsstrahlungsphotonen geben ihre<br />
Energie nach der Beziehung<br />
I = I 0 · e −µx (4.2)<br />
ans Detektorgas ab, wobei I 0 der Intensität des Photonenstrahls beim Eintritt in Materie<br />
entspricht, x die im Medium zurückgelegte Weglänge ist und µ ein vom jeweiligen<br />
Interaktionsprozess nach<br />
µ = N A<br />
A · (σ Ph + σ CS + σ Pb ) (4.3)<br />
abhängiger Absorptionskoeffizient. Der Absorptionskoeffizient µ hängt dabei von der Summe<br />
der einzelnen Wirkungsquerschnitte für die Wechselwirkungsprozesse Compton Streuung<br />
(CS), Photoeffekt (Ph) und Paarbildung (Pb) ab. Alle drei Prozesse finden in einem<br />
gewissen Energiebereich prinzipiell parallel statt wie in Abbildung 4.4 (a) am Beispiel von<br />
Blei als Absorber dargestellt ist. Dennoch ist abängig von der Energie des Photons und<br />
Material des Absorbers jeweils ein Prozess der dominierende. In Abbildung 4.4 (b) ist dies<br />
in Abhängigkeit der Kernladungszahl des Absorbers und der Photonenenergie dargestellt.<br />
Demnach ist für Übergangsstrahlungsphotonen mit Energien im Röntgenbereich bis zu<br />
20 keV, die sich durch das Xenongas mit einer Kernladungszahl von Z Xe = 54 bewegen<br />
der Photoeffekt dominierend. Bei diesem wird das einfallende Photon von einem Elektron<br />
in der Atomschale der Gasatome vollständig absorbiert und dieses Elektron wird mit der<br />
kinetischen Energie E kin = E Photon − E Bindung frei. Der Wirkungsquerschnitt ist mit<br />
σ ∝ Z 5 proportional zur Kernladungszahl des Absorbers. Xenon ist damit für die Detektion<br />
der Übergangsstrahlungsphotonen gut geeignet. Im äußeren elektrischen Feld wird<br />
29
30 4. Der Übergangsstrahlungsdetektor<br />
(a)<br />
(b)<br />
Abbildung 4.4.: (a) Energieabhängigkeit des Massenabsorptionskoeffizienten µ in Blei<br />
Z Pb = 82 und (b) Bereiche in denen Photoeffekt, Compton Effekt oder<br />
Paarbildung dominieren in Abhängigkeit der Kernladungszahl Z des Absorbers<br />
und der Photonenenergie [34].<br />
das freie Elektron dann zum Anodendraht hin beschleunigt. Das elektrische Feld nimmt<br />
durch die Zylindersymmetrie der Anordnung mit E(r) ∝ 1/r zur Mitte hin stark zu und<br />
beschleunigt Elektronen in der direkten Umgebung des Anodendrahtes so stark, dass diese<br />
durch weitere Ionisation eine Ladungslawine erzeugen. Diese löst bei Auftreffen auf den<br />
Draht ein messbares Signal proportional zur im Gas deponierten Energie aus. Da nur in<br />
direkter Umgebung des Anodendrahtes Lawinenbildung eintritt, ist die Verstärkung unabhängig<br />
vom Abstand des Ionisationspunktes. Die Gasverstärkung hängt jedoch von der<br />
Zusammensetzung und dem Druck des Gases, sowie der angelegten Hochspannung ab.<br />
Die Energieabgabe geladener Teilchen pro Weglänge dE/dx durch Ionisationsprozesse im<br />
Detektorgas lässt sich dabei durch die Bethe-Bloch-Formel<br />
− dE<br />
dx = 4πN Arem 2 e c 2 z 2 Z [<br />
1<br />
A β<br />
ln 2m ec 2 γ 2 β 2<br />
I<br />
− β 2 − δ 2<br />
]<br />
(4.4)<br />
mit<br />
z: Ladung des einfallenden Teilchens<br />
Z,A: Kernladungszahl und Massenzahl des Absorbers<br />
m e : Elektronenmasse<br />
r e : klassischer Elektronenradius r e = 1 e<br />
4πɛ 0<br />
· 2<br />
m ec 2<br />
N A : Avogadro-Konstante<br />
I: Für den Absorber charakteristische Ionisationskonstante<br />
beschreiben [34]. Protonen, die wenig Übergangsstrahlung aussondern werden daher in den<br />
Proportionaldrahtkammern nur ein Signal durch Ionisation hinterlassen, während Elektronen<br />
durch das Emittieren von Übergangsstrahlung wesentlich mehr Energie im Detektor<br />
deponieren. Die Verteilung der durch Ionisation deponierten Energie folgt dabei wie in<br />
Abbildung 4.5 gezeigt einer Landau Verteilung [35].<br />
4.3. Gassystem und Betrieb auf der ISS<br />
Wie beschrieben erfolgt der Nachweis geladener Teilchen und Übergangsstrahlungsphotonen<br />
durch Ionisation des dafür besonders geeigneten Xenongases. Das zugesetzte Kohlen-<br />
30
4.3. Gassystem und Betrieb auf der ISS 31<br />
3<br />
×10<br />
500<br />
400<br />
300<br />
200<br />
100<br />
Energiespektrum in Lage 6 bei 25 GeV<br />
Entries<br />
1.129837e+07<br />
Mean 104.7<br />
RMS 89.19<br />
Constant<br />
6.553e+07<br />
MPV 54.52<br />
Sigma 21.35<br />
0<br />
0 100 200 300 400 500 600<br />
Energieabgabe/ADC<br />
Abbildung 4.5.: Energieabgabe aller Teilchen im Energiebereich um 25 GeV in Lage 6 mit<br />
angepasster Landau-Verteilung im Ionisationsbereich (rot).<br />
stoffdioxid wirkt dabei als Löschgas, das ab einer bestimmten Schwelle durch inelastische<br />
Stöße mit Elektronen zu eigenen Schwingungszuständen angeregt wird und diesen damit<br />
Energie entzieht. Damit wird weitere Lawinenbildung unterbunden. Die Herausforderung<br />
im Betrieb eines Gasdetektors im Vakuum des Weltraums liegt dabei darin, Gasverlust<br />
durch Diffusion und undichte Stellen möglichst gering zu halten. Um eventuell vorhandene<br />
Gasverluste dennoch ausgleichen zu können, führt der Detektor Gasreserven von 49, 5<br />
kg Xenon und 4, 5 kg Kohlenstoffdioxid in einem eigenen Gassystem mit sich, die für die<br />
Restlaufzeit des Experimentes ausreichen. Eine schematische Darstellung dieses Gassystems<br />
ist in Abbildung 4.6 zu sehen. Dieses besteht demnach aus der sogenannten Box-S 1 ,<br />
in der die Gasreserven aufbewahrt und bei Bedarf im 1 Liter fassenden Mischbehälter<br />
im richtigen Verhältnis gemischt und an die Box-C 2 weitergegeben werden, von wo aus<br />
das Gas mit Pumpen kontrolliert in das Gassystem des Hauptdetektors transferiert wird.<br />
Jede Gaszuleitung und jedes Ventil in Box-S und Box-C ist dabei unabhängig zweifach<br />
vorhanden um mögliche Defekte kompensieren zu können. Außerdem werden Temperatur<br />
und Druck im Gassystem an verschiedenen Stellen gemessen um einen einwandfreien Betrieb<br />
zu gewährleisten. Kontrolliert wird dies, sowie alle anderen wichtigen Funktionen des<br />
AMS-02 Detektors, im Schichtbetrieb in einem eigens dafür eingerichteten Kontrollzentrum<br />
(POCC 3 ) in Genf auf dem Gelände des CERN und eines vollständig ausgerüsteten zweiten<br />
Kontrollzentrums in Taiwan. Eine Foto des Kontrollraums mit Beschreibung der einzelnen<br />
Schichtpositionen ist in Abbildung 4.7 zu sehen. Von dort werden auch TRD-Operationen<br />
wie das Nachfüllen des Gases (gas refill) und die Anpassung der Spannung in den Proportionaldrahtkammern<br />
(high voltage adjustment) durchgeführt. Um trotz Gasverlusten<br />
eine stabile Gasverstärkung zu gewährleisten wird diese Spannungsanpassung täglich vom<br />
zuständigen TRD-Experten durchgeführt. Dabei wird eine in der Detektorelektronik gespeicherte<br />
Konfigurationsdatei mit neuen Parametern für die Hochspannungswerte der<br />
einzelnen Kanäle gelöscht und neu geschrieben. Ziel ist es den wahrscheinlichsten Wert<br />
1 engl.: Storage<br />
2 engl.: Circulate<br />
3 engl.: Payload Operation Control Center<br />
31
32 4. Der Übergangsstrahlungsdetektor<br />
Abbildung 4.6.: Darstellung des Gassystems bestehend aus der Box-S, der Box-C und dem<br />
Gaskreislauf des Hauptdetektors bestehend aus 41 Segmenten [32].<br />
(MPV 4 ), wie in Abbildung 4.5 definiert als Spitze der Laundau-Verteilung der deponierten<br />
Ionisationsenergie dE/dx von Protonen auf einem stabilen Wert von 60 Analog-Digital<br />
Zählwerten (ADC 5 ) zu halten. Ein Bildschirmfoto des zur Ausgabe des benötigten Korrekturwertes<br />
entwickelten Programms ist in Abbildung 4.8 zu sehen. Für die Anpassung muss<br />
die Datennahme gestoppt und im Anschluss die automatische Kalibrierung des Detektors<br />
vor jedem Äquatorübergang durchgeführt werden, was eine Zusammenarbeit mit der<br />
Schichtleitung 6 erfordert, da Rechte zur Übertragung von Befehlen (command) benötigt<br />
werden. Die für den TRD zuständige Position (TEE) ist außerdem für die Überwachung<br />
des Antikoinzidenzzählers und Spurdetektors, sowie dessen Temperaturkontrollsystems zuständig.<br />
Dazu wurden spezielle auf die Positionen angepasste Computerprogramme entwickelt,<br />
die benötigte Daten nahezu in Echtzeit anzeigen. Im Rahmen dieser Diplomarbeit<br />
wurde diese Schichtposition besetzt und Hochspannungsanpassungen als TRD-Experte in<br />
eigener Verantwortung durchgeführt.<br />
Für die Datennahme ist der Orbit der ISS in vier Teile, in sogenannte Runs geteilt. Ein<br />
Run ist dabei ein Intervall in dem Datennahme betrieben wird und verläuft für gewöhnlich<br />
zwischen Äquator und Pol und endet, bzw. beginnt dort. Ein Run dauert dabei etwa 23<br />
Minuten.<br />
4.4. Kalibrierung<br />
Durch die täglichen Hochspannungsanpassungen und den in etwa alle 4 Wochen durchgeführten<br />
gas refill kann die Gasverstärkung nur grob auf einem konstanten Level gehalten<br />
werden, wie in Abbildung 4.8 ersichtlich ist. Um mit den Messwerten Analysen durchführen<br />
zu können muss eine genauere Kalibrierung der Gasverstärkung 7 für jeden Run<br />
4 engl.: Most Probable Value<br />
5 engl.: Analog digital counts<br />
6 engl.: LEAD<br />
7 engl.: Gain calibration<br />
32
4.4. Kalibrierung 33<br />
Abbildung 4.7.: Foto des AMS-02 POCC auf dem Gelände des CERN in Genf [36]. Die einzelnen<br />
Schichtpositionen sind in rot gekennzeichnet. Dabei ist ”Data” für<br />
die Überwachung der Datenübertragung von der ISS zum CERN, über<br />
einzelne Zwischenstationen zuständig. ”LEAD” dient als Schichtleitung<br />
und ist Schnittstelle für die Kommunikation mit der NASA. ”PM” ist<br />
für Ecal, RICH und TOF verantwortlich, ”TEE” überwacht Spurdetektor,<br />
ACC und TRD. ”Thermal” kontrolliert die Temperatursituation im gesamten<br />
Detektor, welche stark mit dem Winkel des Detektors zur Sonne<br />
korreliert und kann gegebenenfalls nach Rücksprache mit der Schichtleitung<br />
Heizungen zu- und abschalten, oder die NASA bitten die Position der<br />
Solarpanele oder Radiatoren der ISS so zu verändern, dass diese entweder<br />
Schatten spenden, oder Zufuhr von Sonnenlicht ermöglichen. Außerdem<br />
befindet sich im POCC noch eine Position für das Offline Computing,<br />
die im Bild nicht eingefangen wurde und wo die Ereignisrekonstruktion<br />
überwacht wird.<br />
33
34 4. Der Übergangsstrahlungsdetektor<br />
Abbildung 4.8.: Bildschirmfoto des Programms zur Ermittlung des Korrekturwertes zur<br />
Hochspannungsanpassung. Aufgetragen ist der wahrscheinlichste Wert der<br />
deponierten Energie über einen Zeitraum (hier zwei Wochen). Der Wert<br />
schwankt um etwa 60 ADC, wobei ein etwa linearer Anstieg mittels Hochspannungsanpassungen<br />
kompensiert wird. In rot ist eine lineare Anpassung<br />
an die Daten zu sehen, die vom Programm ausgegeben wird und den<br />
Korrekturwert bestimmt (hier −3 V).<br />
durchgeführt werden. Da die in den Proportionaldrahtkammerröhrchen deponierte Energie<br />
von der in den Röhrchen zurückgelegten Weglänge abhängt, müssen außerdem kleinste<br />
zeitabhängige Verschiebungen der Detektorkonstruktion, beispielsweise durch Temperaturschwankungen,<br />
im 100 µm-Bereich korrigiert werden (alignment), um diese Weglänge<br />
korrekt angeben zu können. Für diese Aufgaben werden in der AMS-02 Software Lösungen<br />
zur Korrektur in Form der TrdQt von der RWTH Aachen und TrdKCalib vom Massachusetts<br />
<strong>Institut</strong>e of Technology (MIT) bereitgestellt. Auf die von der Software durchgeführten<br />
Schritte wird hier nur am Beispiel der TrdKCalib eingegangen, um einen Überblick über<br />
deren Arbeitsweise zu geben.<br />
Für die Kalibrierung der Gasverstärkung wird, wie bei der in Teil 4.3 für das high voltage<br />
adjustment beschriebenen Methode, das ADC Spektrum pro Proportionaldrahtkammerröhrchen<br />
für einen Run gemessen und auf einen wahrscheinlichsten Wert von 60 ADC<br />
Zählwerten normiert. So wird das in Abbildung 4.8 dargestellte Spektrum im Nachhinein<br />
weiter geglättet.<br />
Für das alignment wird die vom Spurdetektor gemessene Teilchenspur in den Übergangsstrahlungsdetektor<br />
fortgesetzt und der Detektor virtuell so verschoben, dass dessen Signale<br />
mittels eines Minimierungsverfahrens einen möglichst kleinen Abstand zu dieser Spur haben.<br />
So werden sechs zeitabhängige Korrekturparameter zur Translation dx, dy und dz und<br />
zur Rotation α, β und γ berechnet und auf die einzelnen Signalorte angewendet. Dabei<br />
unterscheidet man zwischen Bewegungen auf einer langen und einer kurzen Zeitbasis. Auf<br />
einer langen Zeitbasis werden Events in einem 12 Stunden Zeitintervall ausgewertet und<br />
damit eine Kalibrierung für jede einzelne Lage des Übergangsstrahlungsdetektors durchgeführt.<br />
In Abbildung 4.9 ist die Verschiebung in x-Richtung exemplarisch für die Lagen 4, 10<br />
und 14 auf dieser Zeitbasis veranschaulicht. Ähnliche Trends sind in den Auftragungen für<br />
die restlichen fünf Korrekturparameter zu sehen. Außerdem folgen diese augenscheinlich<br />
34
4.5. Unterscheidung von Protonen und Positronen 35<br />
Abbildung 4.9.: Auftragung der Verschiebung dx in x-Richtung von Lage 4, 10 und 14 auf<br />
langer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 30 Tage.<br />
Abbildung 4.10.: Auftragung der Verschiebung des gesamten Detektors dx in x-Richtung<br />
auf kurzer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 2<br />
Stunden.<br />
für alle Lagen demselben Trend, was eine Bewegung des Übergangsstrahlungsdetektors als<br />
starrer Körper ergibt. Diese Annahme wird aus Mangel an Daten auch für Korrekturen<br />
auf kurzer Zeitbasis von etwa 5 Minuten gemacht. Dies ist in Abbildung 4.10 dargestellt.<br />
Hier kann man die Bewegung des Detektors mit jedem Orbit von 1, 5 Stunden sehen. Mit<br />
diesen Methoden kann eine Kalibrierung mit einer Genauigkeit von 30 − 40 µm für die<br />
TrdKCalib durchgeführt werden.<br />
4.5. Unterscheidung von Protonen und Positronen<br />
Um nun mithilfe des Übergangsstrahlungsdetektors Analysen durchführen zu können, müssen<br />
die von der Elektronik ausgegebenen ADC Signale A ADC mit dem zeitabhängigen<br />
Gasverstärkungsfaktor f G multipliziert und die dreidimensionale Pfadlänge durch das Gas<br />
x path nach dem alignment ermittelt werden. Damit kann, mit dem bekannten Durchmesser<br />
der Proportionaldrahtkammerröhrchen d, nach<br />
A PLCorr = A ADC · f G ·<br />
d<br />
x path<br />
(4.5)<br />
eine lineare Pfadlängen- und Gasverstärkungskorrektur durchgeführt werden, die zu einem<br />
zeitlich und örtlich unabhängigen Wert für die ADC Signale A PLCorr führt.<br />
35
hEle_mean_25<br />
Entries 19229<br />
Mean 365.8<br />
RMS 89.31<br />
36 4. Der Übergangsstrahlungsdetektor<br />
Ein normiertes Spektrum dieser Werte, im Folgenden als Energieabgabe im Übergangsstrahlungsdetektor<br />
bezeichnet, aus Flugdaten im Energiebereich um 25 GeV für Lage 6<br />
ist in Abbildung 4.11 dargestellt. Dabei wurde eine Unterteilung in Elektronen (blau), die<br />
für den Übergangsstrahlungsdetektor wie Positronen aussehen, und Protonen (rot) vorgenommen.<br />
Zu sehen ist ein Ausschlag im Ionisationsbereich mit einem Ausläufer in den<br />
Röntgenbereich der Übergangsstrahlung. Dieser ist bei Elektronen wesentlich stärker ausgeprägt.<br />
Die Wahrscheinlichkeit Energie im Röntgenbereich der Übergangsstrahlung zu<br />
emittieren ist demnach für Elektronen mit einer Energie von etwa 25 GeV ungefähr 10<br />
mal höher als für Protonen derselben Energie. Im Mittelwert der 20 Detektorlagen führt<br />
dies bereits zu einer beeindruckenden Separation der Populationen von Elektronen und<br />
Positronen, wie sie in Abbildung 4.12 dargestellt sind.<br />
Abbildung 4.11.: Auf eins normiertes Spektrum der Energieabgabe von Elektronen (blau)<br />
und Protonen (rot) im Energiebereich um 25 GeV in Lage 6.<br />
0.1<br />
0.08<br />
Elektronen<br />
Protonen<br />
0.06<br />
0.04<br />
0.02<br />
0<br />
0 100 200 300 400 500 600 700 800<br />
Mittlere Energieabgabe/ADC<br />
Abbildung 4.12.: Auf eins normiertes Spektrum des Mittelwertes der Energieabgabe in den<br />
20 Detektorlagen von Elektronen (blau) und Protonen (rot) im Energiebereich<br />
um 25 GeV.<br />
36
5. Statistische Methoden<br />
Aus den Messungen des Übergangsstrahlungsdetektors erhält man nach Teil 4.5 für jede<br />
der 20 Lagen die Energieabgabe innerhalb dieser Lage als reellen Zahlenwert. Gegenstand<br />
dieser Arbeit ist es, die Energieabgaben in den einzelnen Lagen zu interpretieren und entsprechend<br />
der Natur des Events eine Einteilung in Positronen und Protonen vorzunehmen.<br />
Statistisch gesehen ist eine bestimmte Energieabgabe in einer Lage innerhalb eines Intervalls<br />
dE eine zufällige Zahl, wobei der Grad der Häufigkeit durch die Wahrscheinlichkeit<br />
P p,e (∆E) beschrieben wird. Die Größe Wahrscheinlichkeit ist dabei eine reelle Zahl im<br />
Intervall [0, 1] und so definiert, dass ein sicheres Ereignis die Wahrscheinlichkeit 1 besitzt<br />
und sich einzelne Wahrscheinlichkeiten, zum Beispiel die Wahrscheinlichkeit der Energieabgabe<br />
einem der Bereiche dE i , addieren lassen solange sich die Energieintervalle dE i nicht<br />
überlappen, das heißt die Menge der Energieintervalle disjunkt ist<br />
∑<br />
P p,e (∆E i ) = P p,e ( ∑<br />
i<br />
i<br />
∆E i ). (5.1)<br />
Diese Definitionen von Wahrscheinlichkeit sind als Axiome von Kolmogorow bekannt. Die<br />
Wahrscheinlichkeit P p,e (dE) ergibt sich dabei aus der sogenannten Wahrscheinlichkeitsdichte<br />
f(E) mit dem Integral über das Energieintervall dE<br />
∫<br />
P p,e (∆E) =<br />
∆E<br />
f(E)dE. (5.2)<br />
Die Wahrscheinlichkeitsdichtefunktion f(E) ist dabei so normiert, dass ihre Gesamtfläche<br />
im gesamten Ereignisraum E gleich<br />
∫<br />
E<br />
f(E)dE = 1 (5.3)<br />
ist [38]. Die in Abbildung 4.11 gezeigten Spektren entsprechen also nach den Gleichungen<br />
5.1-5.3 durch das Zusammenfassen der gezählten Werte in Intervalle (Bins) und anschließendes<br />
Normieren auf eins einer diskreten Wahrscheinlichkeitsdichteverteilung. Man<br />
beachte den Unterschied zwischen einer Wahrscheinlichkeitsdichte und einer Wahrscheinlichkeitsverteilung<br />
als Integral der Wahrscheinlichkeitsdichte.<br />
Die Energieabgaben der 20 Lagen müssen demnach den Wahrscheinlichkeitsdichteverteilungen<br />
von Leptonen oder Protonen zugeordnet werden.<br />
37
38 5. Statistische Methoden<br />
5.1. Hypothesentests<br />
Ziel eines Hypothesentests ist es eine Aussage über die Vereinbarkeit einer Messung mit<br />
einer bestimmten Hypothese H 0 , beispielsweise ”<br />
die Messdaten entsprechen denen, die für<br />
ein Positron erwartet werden“, zu machen. Die Messung wird dabei in der Form eines<br />
Satzes von Variablen x = {x 1 , x 2 , ..., x n } geschrieben, wobei x i einem einzelnen Messwert<br />
entspricht und n die Anzahl der aufgenommenen Messwerte pro Ereignis ist, also<br />
die Dimensionalität des Parameterraumes darstellt. Die Hypothese H 0 wird in der Regel<br />
mit einer oder mehreren Gegenhypothesen H 1 , H 2 , ... verglichen und zurückgewiesen oder<br />
angenommen. Jede der Hypothesen setzt eine unterschiedliche Verteilung der einzelnen Parameter<br />
x, gegeben durch die Wahrscheinlichkeitsdichteverteilungen f(x|H 0 ), f(x|H 1 ), ...<br />
voraus. Ein Beispiel im zweidimensionalen Parameterraum der Variablen x 1 und x 2 ist<br />
in Abbildung 5.1 gezeigt. Die Populationen H 0 und H 1 lassen sich hier klar durch die<br />
in Dunkelrot gezeichnete Entscheidungsgrenze separieren, die es in optimaler Weise zu<br />
bestimmen gilt. Für Parameterräume höherer Dimensionalität ist es von Vorteil die Mess-<br />
Abbildung 5.1.: Beispiel von Populationen H 0 und H 1 im zweidimensionalen Parameterraum<br />
der Variablen x 1 und x 2 , getrennt durch eine lineare Entscheidungsgrenze<br />
(dunkelrot) [39].<br />
werte in einer sogenannten Test-Funktion t(x) niedrigerer Dimensionalität m (mit m < n),<br />
in der alle Informationen der gemachten Messung enthalten sind, zu verarbeiten. Eine eindimensionale<br />
Test-Funktion könnte beispielsweise durch den Mittelwert gebildet werden,<br />
wie er in Abbildung 4.12 gezeigt wurde. Eine solche Test-Statistik ist wiederum mit einer<br />
eigenen Wahrscheinlichkeitsdichte g(t|H 0 ), g(t|H 1 ), ... abhängig von der zu betrachtenden<br />
Hypothese verteilt. Im einfachsten Fall ist m = 1 und das Problem damit eindimensional.<br />
In diesem Fall kann die Entscheidungsgrenze als t(x 1 , ..., x n ) = t cut geschrieben werden<br />
und ist damit ein einfacher Schnitt auf t, der die Test-Statistik in eine Annahme- und<br />
eine Verwurfsregion teilt. Fällt die Messung in die Annahmeregion wird H 0 als wahr angenommen,<br />
fällt es in die Verwurfsregion wird H 0 zurückgewiesen. Abbildung 5.2 zeigt<br />
eine solche Test-Funktion mit einer Einteilung in eine Annahme- und eine Verwurfsregion.<br />
Darin ist ebenfalls ersichtlich, dass sich die Wahrscheinlichkeitsdichtefunktionen g(t|H 0 )<br />
und g(t|H 1 ) für gewöhnlich überlappen. Damit existiert eine endliche Wahrscheinlichkeit<br />
β =<br />
∫ tcut<br />
t min<br />
g(t|H 1 )dt, (5.4)<br />
für eine als H 0 angenommene Messung zur Population H 1 zu gehören und damit eine<br />
falsche Hypothese zu akzeptieren. Man spricht von einem Fehler zweiter Art. t min entspricht<br />
dabei der unteren Grenze, in der die Waschreinlichkeitsdichtefunktion g(t|H 1 ) definiert<br />
ist. Einen Fehler erster Art begeht man, indem die richtige Hypothese H 0 durch eine<br />
Messung in der Verwurfsregion, was mit der Wahrscheinlichkeit<br />
α =<br />
∫ tmax<br />
t cut<br />
g(t|H 0 )dt (5.5)<br />
38
5.2. Das Likelihoodverhältnis 39<br />
Abbildung 5.2.: Wahrscheinlichkeitsdichteverteilungen für die Hypothesen H 0 und H 1 einer<br />
eindimensionalen Test-Statistik t(x) mit Einteilung in eine Annahmeund<br />
eine Verwurfsregion, getrennt durch die Entscheidungsgrenze t cut [38].<br />
passiert, zugunsten von H 1 verworfen wird. t max ist hier die obere Grenze von g(t|H 0 ).<br />
Eine wichtige Kenngröße ist außerdem die Effizienz auf die zu testende Hypothese H 0<br />
mit ε = 1 − α, als Wahrscheinlichkeit ein H 0 Ereignis auch als solches zu erkennen. Eine<br />
hohe Effizienz geht dabei mit einer höheren Wahrscheinlichkeit einen Fehler zweiter Art<br />
zu begehen einher. Dies wird durch die Reinheit p 1 als Anteil von H 0 Ereignissen in der<br />
Annahmeregion S von t min bis t cut nach<br />
∫<br />
S<br />
p =<br />
g(t|H 0)dt<br />
∫<br />
S g(t|H 0)dt + ∫ S g(t|H (5.6)<br />
1)dt<br />
ausgedrückt. Ein guter Test verbindet hohe Effizienz mit hoher Reinheit. Die Aufgabe<br />
besteht nun darin eine Test-Funktion t(x) mit optimalen Separationseigenschaften zu konstruieren<br />
und eine Schnittgrenze t cut zu finden.<br />
Im Folgenden wird die Hypothese H 0 als Signal bezeichnet und entspricht der Messung<br />
eines Leptons. Die Gegenhypothese H 1 entspricht dann der Messung eines Protons und<br />
wird als Untergrund bezeichnet.<br />
5.2. Das Likelihoodverhältnis<br />
Ein Weg eine Test-Funktion zu finden basiert auf dem Neyman-Pearson Lemma [38]. Dieses<br />
legt eine optimale Annahmeregion fest, im Sinne von maximaler Effizienz auf das Signal<br />
bei minimaler Wahrscheinlichkeit einen Fehler zweiter Art zu begehen. Für einen Test auf<br />
eine Nullhypothese H 0 zu einer Gegenhypothese H 1 ist diese Annahmeregion durch das<br />
Verhältnis der Wahrscheinlichkeitsdichteverteilungen<br />
f(x|H 0 )<br />
f(x|H 1 ) > c (5.7)<br />
festgelegt. Ist dieses Verhältnis kleiner oder gleich c wird die Nullhypothese verworfen. c<br />
ist dabei ein vorher anhand von α und β aus den Formeln 5.4-5.5 festgelegtes konstantes<br />
Signifikanzniveau. Äquivalent dazu ist die optimale Test-Statistik durch<br />
1 engl.:Purity<br />
f(x|H 0 )<br />
= t(x) (5.8)<br />
f(x|H 1 )<br />
39
40 5. Statistische Methoden<br />
gegeben. Dabei ist jede monotone Funktion dieses Verhältnisses gleichberechtigt. Formel<br />
5.8 wird als Likelihoodverhältnis bezeichnet. Das Likelihoodverhältnis liefert im Falle einfacher,<br />
durch eine Hyperfläche trennbarer, Populationen optimale Separationseigenschaften.<br />
Allerdings müssen die Wahrscheinlichkeitsdichtefunktionen für Parameter beider Hypothesen<br />
bekannt sein, was jedoch nicht immer der Fall ist. In diesem Fall müssen die<br />
Wahrscheinlichkeitsdichtefunktionen Messdaten nachempfunden oder durch Monte-Carlo<br />
Simulationen modelliert werden.<br />
Für die Likelihoodfunktion zur Trennung von Positronen und Protonen mithilfe des Übergangsstrahlungsdetektors,<br />
werden die Verteilungen der Energieabgabe pro Lage für Leptonen<br />
und Protonen nach Selektion mit dem elektromagnetischen Kalorimeter, nach Teil<br />
6.1, den Daten entnommen. Auf eins normiert entsprechen die Histogramme diskreten<br />
Wahrscheinlichkeitsdichtefunktionen wie in Abbildung 4.11 gezeigt und bereits beschrieben.<br />
Diese könnten nun parametrisiert werden um das Likelihoodverältnis zu bilden. Einfacher<br />
ist es jedoch die Wahrscheinlichkeiten P e,p (dE) für ein Positron- oder Protonereignis<br />
direkt aus der Wahrscheinlichkeitsverteilung zu entnehmen. Die Wahrscheinlichkeiten für<br />
Positron oder Proton in jeder der n = 20 Lagen werden dann über das geometrische Mittel<br />
√ √√√<br />
∏ n<br />
P e,p (dE) = n Pe,p(dE) k (5.9)<br />
k=1<br />
vereint. Daraus wird dann das Likelihoodverhältnis<br />
(<br />
)<br />
P e (dE)<br />
L = − log<br />
P e (dE) + P p (dE)<br />
(5.10)<br />
gebildet. Die Bildung des Logarithmus als monotone Funktion ist dabei Konvention und<br />
soll einer besseren Verarbeitung der Daten im Computer dienen. Bei der Bildung des geometrischen<br />
Mittels nach Gleichung 5.9 werden keine Korrelationen zwischen den einzelnen<br />
Lagen betrachtet, so dass das Likelihoodverhältniss nur eine gute Test-Statistik darstellt,<br />
wenn solche Korrelationen nicht existieren.<br />
In der AMS-02 Software werden Likelihoodverhältnisse durch das in der RWTH Aachen<br />
entwickelte Framework TrdQt und das im MIT entwickelte TrdK bereitgestellt. Beide<br />
unterscheiden sich durch ihr verwendetes alignment, sowie durch die Kalibrierung der<br />
Gasverstärkung, wie in Kapitel 4.4 beschrieben. Außerdem werden Abhängigkeiten der<br />
verwendeten Wahrscheinlichkeitsdichteverteilungen von der Energie des Teilchens oder<br />
des Gasdrucks im Proportionaldrahtkammerröhrchen unterschiedlich parametrisiert. Die<br />
Verteilungen der Likelihoodverhältnisse sind in Abbildung 5.3 zu sehen. Ein hoher Wert<br />
entspricht dabei einer Proton ähnlichen Signatur des Teilchens. Ein niedriger Wert einer<br />
Lepton ähnlichen Signatur.<br />
5.3. Künstliche neuronale Netze<br />
Die einfachste Möglichkeit eine Trennung vorzunehmen, ist die einer Hyperebene wie sie<br />
bereits in Abbildung 5.1 im zweidimensionalen Fall verwendet wurde. Eine entsprechende<br />
Test-Funktion kann in Form einer linearen Funktion als<br />
y(x) = w T x + w 0 (5.11)<br />
mit dem n-dimensionalen Variablenvektor x und w, welcher als Vektor der Gewichte bezeichnet<br />
wird, geschrieben werden [40]. Die Entscheidungsgrenze liegt dann auf der Hyperebene<br />
mit y(x) = 0. Die Form dieser Hyperebene wird durch die Gewichte festgelegt.<br />
40
Entries<br />
3137898<br />
Mean 1.027<br />
RMS 0.1442<br />
5.3. Künstliche neuronale Netze 41<br />
7<br />
10<br />
6<br />
10<br />
5<br />
10<br />
4<br />
10<br />
3<br />
10<br />
TrdQt Protonen<br />
TrdK Protonen<br />
htemp__1<br />
TrdQt Leptonen<br />
TrdK Leptonen<br />
2<br />
10<br />
10<br />
1<br />
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2<br />
Likelihoodverhaltnis<br />
Abbildung 5.3.: Verteilung des Likelihoodverhältnis gegeben durch TrdQt und TrdK von<br />
Protonen und Leptonen aus Flugdaten, selektiert durch das elektromagnetsiche<br />
Kalorimeter.<br />
5.3.1. Künstliche Neuronen<br />
Gleichung 5.11 kann in Form eines sogenannten Netzwerkdiagramms wie in Abbildung 5.4<br />
ausgedrückt werden. Dabei werden die einzelnen Elemente des Vektors x als Eingangselemente<br />
dargestellt, die über die Gewichte mit dem Ausgabewert y verbunden sind. Die<br />
Schwelle w 0 ist dabei an ein separates Eingangselement geknüpft, welches dauerhaft den<br />
Wert +1 innehat und als Bias bezeichnet wird.<br />
Bias<br />
Input<br />
variables<br />
x 1<br />
⋮<br />
⋮<br />
w 0<br />
w i<br />
y(⃗x)<br />
x n<br />
Abbildung 5.4.: Darstellung von Gleichung 5.11 als Netzwerkdiagramm.<br />
Die Ausgabe von Funktion 5.11 wird zumeist in einer monotonen Funktion g(y) verarbeitet,<br />
die die Form der Ausgabe maßgeblich bestimmt und Aktivierungsfunktion genannt<br />
wird. Eine geeignete Funktion dafür ist die S-Förmige Sigmoid Funktion<br />
g(y) =<br />
1<br />
1 + e −y (5.12)<br />
41
42 5. Statistische Methoden<br />
1<br />
0.8<br />
g(y)=<br />
1<br />
1+e<br />
-y<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
-5 -4 -3 -2 -1 0 1 2 3 4 5<br />
y<br />
Abbildung 5.5.: Zeichnung der Sigmoid Funktion nach Formel 5.12.<br />
die das Intervall (−∞, ∞) auf (0, 1) abbildet und für kleine Werte y linear angenährt<br />
werden kann. Die Sigmoid Funktion ist in Abbildung 5.5 dargestellt. Auf die besondere<br />
Bedeutung dieser Funktion als Aktivierungsfunktion wird in Teil 5.3.4 näher eingegangen.<br />
Ein solches Netzwerk mit Aktivierungsfunktion wird als künstliches Neuron bezeichnet.<br />
Die Namensgebung trägt dem biologischen Vorbild auf dem ein solches Netzwerk basiert<br />
Rechnung. Gemeint ist eine Nervenzelle, die im zentralen Nervensystem über Synapsen<br />
mit anderen Nervenzellen verknüpft ist. Die Synapsen entsprechen in diesem Bild den<br />
Gewichten w i , wobei das Gewicht des Bias w 0 einem Schwellwert entspricht, ab dessen<br />
Überschreitung das Neuron aktiv wird ( ”<br />
feuert“).<br />
Mit einem künstlichen Neuron kann bereits eine Trennung einfacher, durch eine Hyperebene<br />
linear trennbarer Populationen, vorgenommen werden. Für nichtlineare und stark korrelierte<br />
Verteilungen ist sowohl das Likelihoodverhältnis, als auch ein einzelnes künstliches<br />
Neuron zur Ausgabe einer Test-Statistik ungeeignet. Ein Beispiel einer solchen Verteilung<br />
im zweidimensionalen Fall ist in Abbildung 5.6 dargestellt. Hier wird augenscheinlich klar,<br />
dass die beiden Populationen H 0 und H 1 nicht durch eine gerade Linie getrennt werden<br />
können.<br />
5.3.2. Multi-Layer-Perzeptron<br />
Um nichtlineare Probleme zu lösen werden Schichten mehrerer künstlicher Neuronen hintereinander<br />
geschaltet. Man spricht dann von einem Multi-Layer-Perzeptron (MLP). In der<br />
ersten Schicht werden die einzelnen n Eingabewerte x i aufgenommen. Die letzte Schicht<br />
besteht aus einem einzelnen Neuron, welches den Ausgabewert y(x) liefert. Dazwischen<br />
befindet sich mindestens eine versteckte Schicht 2 aus k Neuronen, die Eingabewerte gemäß<br />
(<br />
)<br />
n∑<br />
ϕ j (x) = g w j0 + w ji x i (5.13)<br />
für jedes Neuron der versteckten Schicht ϕ j transformiert. w j0 sind die Gewichte des Bias.<br />
Das Ausgabeneuron gibt dann, wie ein einzelnes Neuron mit k Eingangsparametern ϕ j ,<br />
den Ausgabewert entsprechend<br />
⎛<br />
⎞<br />
k∑<br />
y(⃗ϕ) = ˜g ⎝ ˜w 0 + ˜w j ϕ j ⎠ . (5.14)<br />
2 engl.: Hidden layer<br />
i=1<br />
j=1<br />
42
5.3. Künstliche neuronale Netze 43<br />
Abbildung 5.6.: Beispiel nicht einfacher, durch eine Hyperebene linear separierbarer, Populationen<br />
H 0 und H 1 im zweidimensionalen Parameterraum der Variablen<br />
x 1 und x 2 [39].<br />
Die Neuronen einer einzelnen Schicht werden dabei jeweils in Vorwärtsrichtung miteinander<br />
verknüpft, so dass ein sogenanntes Feed-Forward Netzwerk entsteht. Die Topologie<br />
eines solchen Netzwerkes ist in Abbildung 5.7 dargestellt. Die versteckte Schicht führt<br />
Bias<br />
∑<br />
i<br />
w j0<br />
x i w ji<br />
∑ ϕ j<br />
j<br />
̃w j<br />
Input<br />
variables<br />
x 1<br />
⋮<br />
⋮<br />
ϕ j (⃗x)<br />
y(⃗ϕ)<br />
x n<br />
Input<br />
Hidden<br />
Layer<br />
Output<br />
Node<br />
Abbildung 5.7.: Multi Layer Perzeptron mit einer versteckten Lage.<br />
dabei eine Transformation der Eingabewerte nach x 1 , ...x n → ϕ 1 (x), ...ϕ n (x) in einen sogenannten<br />
Merkmalsraum 3 durch, in dem die Populationen linear separierbar sind. Die<br />
lineare Separation kann dann vom Ausgabeneuron durchgeführt werden. Prinzipiell sind<br />
alle Topologien, mit beliebig vielen versteckten Schichten, sowie Neuronen und verschiedenen<br />
Verbindungen auch in Rückwärtsrichtung, denkbar. Ein Feed-Forward Netzwerk mit<br />
nur einer versteckten Schicht ist jedoch für die meisten Separationsprobleme ausreichend.<br />
Aufgabe ist es nun die Gewichte w ij zu bestimmen, die die Eigenschaften der Transformation<br />
x → ⃗ϕ(x), sowie die Hyperebene zur Trennung der Populationen festlegen. Diese<br />
Anpassung der Gewichte an die Signal- und Untergrundverteilungen des Separationspro-<br />
3 engl.: Feature space<br />
43
44 5. Statistische Methoden<br />
blems wird als Training bezeichnet.<br />
5.3.3. Training des neuronalen Netzes<br />
Um ein neuronales Netzwerk für Separationsprobleme zu verwenden greift man üblicherweise<br />
auf überwachte Trainingsmethoden zurück. Bei solchen Methoden wird eine Auswahl<br />
an Trainingsereignissen mit den Eingangsparametern x benötigt, deren Zugehörigkeit zur<br />
Population Signal oder Untergrund bekannt ist. Man ordnet diesen Ereignissen einem Zielwert<br />
entsprechend ihrer Natur zu, der den Wert widerspiegelt, den das Netzwerk idealer<br />
weise für diese Eingabewerte ausgeben soll. Beispielsweise kann dies 1 für Signalereignisse<br />
und 0 für Untergrundereignisse sein. Um eine solche Trainingsauswahl zu erhalten, wird<br />
entweder auf Monte Carlo Simulationen oder auf Daten, die man mit Sicherheit einem<br />
Ereignis zuordnen kann, zurück gegriffen. Im Folgenden wird für diese Auswahl an Trainingsereignissen<br />
der gebräuchliche Begriff Trainingssample aus dem Englischen verwendet.<br />
Die einzelnen Ereignisse k des Trainingssamples werden nun iterativ an das Netzwerk gegeben<br />
und dessen Ausgabewert y(x) mit dem Zielwert t verglichen. Aus den einzelnen<br />
Abweichungen wird dann die Fehlerfunktion nach der Summe der Residuenquadrate<br />
E(w) = 1 2<br />
N∑<br />
|y(x k , w) − t k | 2 =<br />
k=1<br />
N∑<br />
E k (w) (5.15)<br />
gebildet, wobei N die Anzahl der Trainingsereignisse ist. Die einzelnen Gewichte werden<br />
nun bei jedem Durchgang angepasst und der Vorgang wiederholt. Die Art und Weise wie<br />
die Gewichte angepasst werden, wird als Fehlerrückführung oder auch Backpropagation<br />
bezeichnet. Dabei werden die errechneten Fehler wieder rückwärts durch das Netzwerk<br />
übertragen und die Gewichte nach<br />
k=1<br />
∂E k<br />
∂w ij<br />
= δ j g(a i ) = ∆w ij (5.16)<br />
den Korrekturfaktor als Fehler eines Neurons nach der Rück-<br />
angepasst, wobei δ j = ∂E k<br />
∂a j<br />
führungs-Formel<br />
δ j = g(a j ) ∑ l<br />
w kj δ l (5.17)<br />
gibt [40]. Dabei bezeichnet l den Index des direkt vorangegangenen Neurons und a i ist die<br />
Eingabe ins entsprechende Neuron, also hier x i oder ϕ j .<br />
Das Vorgehen nach dem Backpropagation Verfahren garantiert, dass die Fehlerfunktion<br />
mit jeder Iteration kleiner wird und damit das Netzwerk die Populationen besser unterscheiden<br />
kann. Man spricht deshalb von einem Lernprozess, der vom neuronalen Netzwerk<br />
durchlaufen wird. Das Training entspricht dann einem Minimierungsprozess, bei dem die<br />
Fehlerfunktion 5.15 als Funktion der Gewichte w ij minimiert wird. Dabei soll das Netzwerk<br />
im Minimum der Fehlerfunktion noch eine gewisse Fähigkeit zur Generalisierung<br />
besitzen. Das bedeutet, dass Ereignisse, deren Parameterzusammensetzung nicht exakt<br />
der eines gelernten Ereignisses entsprechen, noch korrekt eingeordnet werden können. Diese<br />
Forderung stellt eine Grenze der idealen Anzahl an Trainingsiterationen dar. Werden zu<br />
viele Trainingsiterationen auf immer das gleiche Trainingssample durchgeführt, folgt das<br />
Netzwerk dessen charakteristischen Fluktuationen und verliert die Fähigkeit zur Generalisierung.<br />
Dieser Vorgang wird als Übertraining bezeichnet. Gebräuchlicher sind jedoch die<br />
englischen Begriffe Overtraining oder Overfitting. Der Einfluss von Overtraining auf die<br />
Separationsgrenze ist für den zweidimensionalen Fall in Abbildung 5.8 dargestellt. Man<br />
sieht wie im Falle von Overtraining die Separationsgrenze jeder Fluktuation im Trainingssample<br />
folgt.<br />
Um Overtraining zu verhindern wird in der Regel ein Teil des Trainingssamples dazu verwendet,<br />
die Generalisierungsfähigkeit des neuronalen Netzwerks an einer unabhängigen<br />
44
5.3. Künstliche neuronale Netze 45<br />
Abbildung 5.8.: Separationsgrenzen für zwei Populationen im zweidimensionalen Parameterraum<br />
von x 1 und x 2 mit guter Generalisierungsfähigkeit (links) und<br />
nach Overtraining (mitte). Rechts ist das Verhalten der Fehlerfunktion im<br />
Falle von Overtraining dargestellt [39].<br />
Auswahl von Ereignissen zu testen. Dieses wird als Testsample bezeichnet. Bei einer guten<br />
Generalisierungsfähigkeit sollte die Performance, gemessen durch die Fehlerfunktion, für<br />
das Trainingssample und das unabhängige Testsample gleich gut sein. Nimmt die Generalisierungsfähigkeit<br />
ab, wird der Fehler auf das Trainingssample weiter kleiner, da für<br />
diese spezielle Auswahl die Trennung besser wird, wie in Abbildung 5.8 im Falle des Overtrainings<br />
zu ersehen ist. Im unabhängigen Testsample, welches diesen Fluktuationen nicht<br />
unterliegt, wird der Fehler größer. Dieses Verhalten ist in Abbildung 5.8 rechts gezeigt. An<br />
der Stelle, an der die Fehlerfunktionen auseinander laufen, sollte kein weiterer Trainingsdurchlauf<br />
durchgeführt werden. Ein Nachteil dieser Methode Overtraining zu verhindern<br />
ist, dass nicht alle Ereignisse des Trainingssamples für das Training verwendet werden<br />
können, was bei kleinen Trainingssamples zu Performanceverlusten führen kann.<br />
5.3.4. Die NeuroBayes R○ Software<br />
NeuroBayes R○ ist eine Softwarelösung zur Erstellung eines Feed Forward Netzwerkes. Entwickelt<br />
wurde die Software am Karlsruhe <strong>Institut</strong> für Technologie (<strong>KIT</strong>) zur Ereignis-<br />
Selektion in der Hochenergiephysik, wobei sie über die Jahre weiterentwickelt wurde und<br />
schließlich zur Verwendung in der Wirtschaft im Unternehmen GmbH ausgegliedert<br />
wurde. Dadurch ist NeuroBayes R○ eine lizenzierte Software deren Quellcode damit<br />
weder einseh- noch veränderbar ist. Trotzdem findet die Software auch weiterhin im<br />
wissenschaftlichen Bereich Verwendung, wobei die Anpassung der Software an das Analyseziel<br />
durch das Setzen von Bitschaltern 4 bewerkstelligt wird. Die Software verknüpft<br />
dabei Methoden der Bayes Statistik und neuronaler Netzwerke und bietet dabei einen internen<br />
Schutz vor Overtraining [41]. Mithilfe der Bayes Statistik kann eine Definition des<br />
Wahrscheinlichkeitsbegriffs gegeben werden, der eine Aussage über sogenannte bedingte<br />
Wahrscheinlichkeiten P (A|B) macht. Die bedingte Wahrscheinlichkeit gibt dabei eine<br />
Wahrscheinlichkeit an, das Ereignis A zu beobachten, unter der Voraussetzung das Ereignis<br />
B bereits beobachtet wurde. Dabei ist die bedingte Wahrscheinlichkeit der Quotient aus<br />
der Schnittmenge der Wahrscheinlichkeit für A und B, normiert auf die Wahrscheinlichkeit<br />
für B, da dieses Ereignis per Definition aufgetreten ist<br />
P (A|B) =<br />
P (A ∩ B)<br />
. (5.18)<br />
P (B)<br />
4 engl.: Flag<br />
45
46 5. Statistische Methoden<br />
Daraus folgt direkt aus der Umkehrbarkeit des Terms der Schnittmenge P (A ∪ B) =<br />
P (B ∪ A)<br />
P (B|A) · P (A)<br />
P (A|B) = . (5.19)<br />
P (B)<br />
Gleichung 5.19 wird Bayes Theorem genannt und stellt eine Verknüpfung zwischen den<br />
beiden Ereignissen A und B her [38]. Der Term P (B|A) wird als Likelihood bezeichnet<br />
und stellt die Messgrundlage dar. P (A) wird Prior genannt und bietet eine Möglichkeit<br />
Vorwissen in die statistische Auswertung einfließen zu lassen. P (B) stellt eine Normierungskonstante<br />
dar. Das Ergebnis P (A|B) wird dann als Posteriori Wahrscheinlichkeit<br />
bezeichnet.<br />
Mithilfe der Bayes Statistik kann eine Interpretation der Ausgabe eines neuronalen Netzwerks<br />
mit Sigmoid Aktivierungsfunktion gegeben werden. Betrachtet man zwei gaussförmig<br />
verteilte Populationen H 0 und H 1 im Parameterraum mit d Dimensionen um ⃗µ 0,1 und<br />
deren Kovarianzmatrix ∑ nach<br />
(<br />
1<br />
P (x|H 0,1 ) =<br />
(2π) d/2 | ∑ | 1/2 · exp − 1 2 (x − ⃗µ 0,1) T ∑ )<br />
−1<br />
(x − ⃗µ0,1 ) (5.20)<br />
und betrachtet die Wahrscheinlichkeit der Zugehörigkeit zu H 0 mit Bayes Theorem<br />
P (H 0 |x) =<br />
so erhält man mit der Substitution<br />
P (x|H 0 )P (H 0 )<br />
P (x|H 0 )P (H 0 ) + P (x|H 1 )P (H 1 ) , (5.21)<br />
a = ln P (x|H 0)P (H 0 )<br />
P (x|H 1 )P (H 1 )<br />
(5.22)<br />
aus Gleichung 5.21 die Sigmoid Funktion<br />
P (H 0 |x) =<br />
1<br />
. (5.23)<br />
1 + e−a Für die Substitution in Gleichung 5.22, die dem Liklihoodverhältnis aus Gleichung 5.8<br />
entspricht, erhält man mit 5.20<br />
a = w T x + w 0 (5.24)<br />
mit<br />
w 0 = − 1 2 ⃗µT 0<br />
∑ −1⃗µ0<br />
+ 1 2 ⃗µT 1<br />
w = ∑ −1<br />
(⃗µ0 − ⃗µ 1 ) (5.25)<br />
∑ −1⃗µ1<br />
+ ln P (H 0)<br />
P (H 1 ) . (5.26)<br />
Damit kann die Ausgabe eines neuronalen Netzwerks mit Sigmoid Aktivierungsfunktion<br />
als Posterior Wahrscheinlichkeit nach Bayes Theorem interpretiert werden [40]. Man erhält<br />
damit nicht nur eine einfache Separation, sondern eine Wahrscheinlichkeit für ein Ereignis,<br />
vom Typ H 0 oder H 1 zu sein.<br />
In der NeuroBayes R○ Software werden Bayes Methoden außerdem im Preprocessing angewandt.<br />
Hier werden die Eingangsparameter zur optimalen Verwendung im neuronalen<br />
Netz vorbereitet.<br />
Die NeuroBayes R○ Software ist zur Verwendung in zwei Teile geteilt. Zum einen existiert<br />
der NeuroBayes R○ Teacher, mit dem ein Netzwerk aufgebaut und trainiert werden kann.<br />
Das trainierte Netzwerk wird dann abgespeichert und kann über den NeuroBayes R○-Expert<br />
aufgerufen und für Analyseaufgaben verwendet werden.<br />
46
6. Das neuronale Netzwerk für den<br />
Übergangsstrahlungsdetektor<br />
Für die Trennung von Positronen und Protonen mit Hilfe des Übergangsstrahlungsdetektors<br />
wurde die an der Universität Karlsruhe entwickelte und in 5.3.4 vorgestellte Software<br />
NeuroBayes R○ zur Erstellung eines neuronalen Netzwerks genutzt. Dafür wird in der Zusammenstellung<br />
des Trainingssamples auf Flugdaten zurückgegriffen, die die realen Verhältnisse<br />
im Detektor besser wiedergeben als es mit Monte-Carlo Daten möglich wäre.<br />
Dabei wird die Redundanz der AMS-02 Subdetektoren ausgenutzt und Trainingsdaten<br />
mit dem elektromagnetischen Kalorimeter selektiert. Für diese Arbeit wurden Daten vom<br />
20. Mai 2011 bis zum 1. November 2012 verwendet, was in etwa 24 Milliarden Triggern<br />
entspricht.<br />
6.1. Selektion des Trainingssamples<br />
Die Schwierigkeit in der Zusammenstellung eines Ereignissamples mit dem das neuronale<br />
Netzwerk trainiert werden kann liegt darin, dass Trainingssamples einerseits sehr rein sein<br />
müssen und andererseits in der Selektion keine Variablen verwendet werden dürfen auf die<br />
später auch das Netzwerk trainiert werden soll. Die Reinheit ist wichtig, da im Falle eines<br />
kontaminierten Samples das Netzwerk auf verfälschten Informationen trainiert wird. Die<br />
Unabhängigkeit der Selektion des Trainingssamples von den Netzwerkvariablen muss gewährleistet<br />
sein, da ansonsten die Verteilung der Trainignsvariablen verfälscht wird. Hierzu<br />
kann die Redundanz der AMS-02 Subdetektoren ausgenutzt werden. Im Falle des TRDs<br />
kann das von diesem unabhängig arbeitende elektromagnetische Kalorimeter zur Einteilung<br />
der Daten in Trainingssamples verwendet werden. Selektiert und für das Training<br />
verwendet werden dabei Protonen und Elektronen anstelle von Positronen. Elektronen<br />
und Positronen können vom Übergangsstrahlungsdetektor nicht unterschieden werden, da<br />
weder deponierte Ionisationsenergie nach Gleichung 4.4, noch die gemessene Intensität<br />
der Übergangsstrahlung nach Gleichung 4.1 vom Ladungsvorzeichen abhängen. Elektronen<br />
kommen in der kosmischen Strahlung, wie in Teil 2.1 gezeigt wurde, in etwa um einen<br />
Faktor 10 häufiger vor und sind durch das unterschiedliche Ladungsvorzeichen sicherer<br />
vom Protonenuntergrund zu unterscheiden. So kann mit Hilfe des elektromagnetischen<br />
Kalorimeters eine ausreichend große und sichere Trainingsauswahl definiert werden. Dieses<br />
Vorgehen ist in Abbildung 6.1 noch einmal schematisch dargestellt.<br />
Um aus allen von AMS aufgenommenen Triggern nur für die Analyse relevante Ereignis-<br />
47
48 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />
Abbildung 6.1.: Schematische Skizze zur Vorgehensweise zum Trainieren eines neuronalen<br />
Netzwerkes mit Flugdaten [42].<br />
se auszuwählen, muss dabei zunächst eine generelle Vorauswahl 1 getroffen werden, bevor<br />
man bestimmte, für die Proton-Positron Trennung geeignete, Ereignisse auswählt 2 und<br />
diese dann mit Hilfe des Kalorimeters zu Proton oder Elektron bestimmt 3 . Ziel ist es ein<br />
möglichst reines Datensample zu erhalten.<br />
6.1.1. Preselection und Selection<br />
In der Vorselektion werden Trigger nach ihrer generellen Tauglichkeit bewertet und für<br />
eine Analyse ungeeignete, wie zum Beispiel falsch rekonstruierte Ereignisse, entfernt. Dabei<br />
muss eine Variable gefunden werden, mit der der Schnitt auf ungeeignete Ereignisse<br />
durchgeführt werden kann ohne dabei ebenfalls gute Ereignisse zu verwerfen und damit die<br />
Menge an Daten zu sehr zu beschneiden. Die für die Selektion des Trainingssamples angewandten<br />
Schnitte sollten denen einer späteren Analyse entsprechen, um nicht unbewusst<br />
Korrelationen zwischen den Variablen einzubringen oder zu verwerfen. Eine Übersicht<br />
der angewandten Bedingungen und deren Effizienz ist in Abbildung 6.2 gegeben. Auf die<br />
einzelnen Schnitte wird im Folgenden näher eingegangen. Die angegebene Effizienz gibt<br />
dabei den Anteil der in diesem Schritt beibehaltenen Ereignisse an. Um die Stärke eines<br />
Schnittes abzuschätzen muss diese mit 1−Effizienz umgerechnet werden. Der Einfluss der<br />
einzelnen Schnitte auf die gesamte Triggermenge ist in Abbildung 6.3 dargestellt. In den<br />
beiden Abbildungen 6.2 und 6.3 kennzeichnet Global eine generelle Selektion nach der<br />
Vollständigkeit von Ereignissen. In Badrun und Science werden Runs mit speziellen Markierungen<br />
verworfen. Diese werden gesetzt um Runs zu kennzeichnen, bei denen besonders<br />
viele Hardwarefehler vorkamen, oder Detektoroperationen wie ein gas refill durchgeführt<br />
wurden. Einzelne Ereignisse mit Hardwarefehlern werden mit dem mit HW gekennzeichneten<br />
Schnitt entfernt. LiveTime kennzeichnet einen Schnitt auf den Anteil der Zeit, in<br />
der der Trigger inaktiv war, von größer 0, 65 um Regionen großen Teilchenflusses wie die<br />
Südatlantische Anomalie und teilweise die Polregionen auszuschließen. Dort können Ereignisse<br />
aufgrund des hohen Teilchenflusses und der daraus resultierenden hohen Signaldichte<br />
nur schlecht rekonstruiert werden. Ereignisse außerhalb der rekonstruierten relativistischen<br />
Geschwindigkeit 0, 6 < β < 1, 4 werden ebenfalls entfernt, wobei physikalisch unsinnige<br />
relativistische Geschwindigkeiten von größer 1 den hohen Bewegungsenergien der Teilchen<br />
geschuldet sind, aber als Trigger durchaus ihre Berechtigung haben. Bei dieser mit Beta<br />
gekennzeichneten Bedingung werden auch Teilchen, die sich von unten nach oben durch<br />
den Detektor bewegen entfernt, was Teilchen, die aus der unter dem Detektor liegenden<br />
Atmosphäre reflektiert oder dort erzeugt werden, ausschließt. Des Weiteren wird eine<br />
Spurrekonstruktion (TrTrack) vorausgesetzt und ein rekonstruierter Schauer im elektromagnetischen<br />
Kalorimeter (EcalShr), um eine Teilchenidentifizierung vornehmen zu können.<br />
1 engl.: Preselection<br />
2 engl.: Selection<br />
3 engl.: Tagging<br />
48
6.1. Selektion des Trainingssamples 49<br />
Abbildung 6.2.: Effizienz der angewandten Bedingungen bezüglich des vorangegangen<br />
Schnittes. Die Beschreibungen der einzelnen Schnitte sind im Text zu<br />
finden.<br />
Diese Forderung ist aufgrund der geringen Akzeptanz des elektromagnetischen Kalorimeters<br />
besonders stark und entfernt mit etwa 82, 6% die meisten Ereignisse. Außerdem wird<br />
verlangt, dass sich keines der Solarpanele, die die ISS mit Strom versorgen, im Sichtfeld<br />
des Detektors befindet (Shadow), um Sekundärteilchen auszuschließen. Mit SubD Acceptance<br />
wird geprüft ob die Spurrekonstruktion eine gewisse Minimalgüte erfüllt und sich<br />
der Schauer im Kalorimeter in einem gewissen Akzeptanzvolumen innerhalb des Kalorimeters<br />
befindet, um Energieverluste des Schauers am Rand auszuschließen. Für ein gutes<br />
Ereignis im Übergangsstrahlungsdetektor (GoodTrd) wird verlangt, dass die rekonstruierte<br />
Spur den Subdetektor vollständig passiert und eine gesamte Pfadlänge in den Proportionaldrahtkammerröhrchen<br />
von mehr als 7 cm gemessen wurde. Zum Schluß wird in Match<br />
überprüft, ob die Richtungsrekonstruktionen der einzelnen Subdetektoren zusammenpassen.<br />
Nach der Vorauswahl, die mit Preselection gekennzeichnet ist, sind nur noch etwa 3, 9%<br />
der Triggerereignisse übrig. Die verwendete Vorauswahl geht auf einen Analysevorschlag<br />
zum Positronenanteil zurück. Nun folgt eine analysebezogene Auswahl von Ereignissen.<br />
Dabei werden Ereignisse verworfen, die für eine spezielle Aufgabe nicht geeignet sind, da<br />
sie zum Beispiel nicht im geforderten Energieintervall liegen, das hier den Rigiditätsbereich<br />
von 2 − 300 GV umfasst und mit RigRange gekennzeichnet ist. Außerdem wird auf Ereignisse<br />
geschnitten, deren Rekonstruktionsqualität nicht für eine Analyse des Ereignisses<br />
ausreicht, was mit einem Schnitt auf die Größe Chi zum Quadrant für die rekonstruierte<br />
Teilchenspur von kleiner 10 und auf dessen Projektion in die für die Ladungsrekonstruktion<br />
entscheidende Y-Z-Ebene von kleiner 8 (TrChi2 ), sowie einem Schnitt auf mindestens<br />
12 Treffer im Übergangsstrahlungsdetektor (TrdPart) selektiert wird. Zusätzlich wird das<br />
Sample auf Ereignisse mit rekonstruierter Ladung von Z = 1 oder Z = 2 reduziert (Charge).<br />
So bleiben etwa 381 Millionen Ereignisse zur Analyse übrig.<br />
49
50 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />
Abbildung 6.3.: Verbleibender Anteil des Triggersamples nach jeder der angewandten<br />
Bedingungen.<br />
6.1.2. Elektronen und Protonen Selektion<br />
Um nun Elektronen und Protonen zu selektieren wird wie beschrieben auf das elektromagnetische<br />
Kalorimeter zurückgegriffen. Hierfür wird in der AMS Software eine multivariate<br />
Analysemethode in Form eines vervielfachten Entscheidungsbaumes (BDT 4 ) bereit<br />
gestellt, der anhand von Kalorimetervariablen eine Einteilung in elektron-, bzw. positronähnliche<br />
Ereignisse vornimmt. Ein Entscheidungsbaum führt dabei pro Entscheidungsebene<br />
eine Entscheidung anhand einer einzelnen Variable in Richtung Signal oder Untergrund<br />
aus [43]. Die einzelnen Entscheidungsebenen folgen dabei hierarchisch aufeinander.<br />
Dadurch wird der Parameterraum in einzelne Regionen geteilt, die Signal- oder Untergrundcharakter<br />
haben. Eine schematische Darstellung eines Entscheidungsbaumes ist in<br />
Abbildung 6.4 links gezeigt. Beim Boosting werden dabei mehrere Entscheidungsbäume<br />
trainiert und am Ende des Trainings zusammengefasst. Man spricht dabei von einem Wald.<br />
Diese Methode soll das Training gegenüber Fluktuationen im Trainingssample robust machen.<br />
Die Ausgabe des boosted decision trees für das elektromagnetische Kalorimeter in<br />
der AMS Software, für eine Auswahl von Leptonen und Protonen aus Flugdaten, ist in<br />
Abbildung 6.4 rechts gezeigt. Dort ist außerdem der Schnitt für Elektronen- und Protonenselektion<br />
eingezeichnet. Eine wichtige Entscheidungsvariable außerhalb des TRD ist der<br />
Anteil an im elektromagnetischen Kalorimeter deponierter Energie von der Gesamtenergie<br />
des Teilchens. Wie in Teil 3.7 beschrieben, deponieren Leptonen nahezu ihre gesamte<br />
Energie im Kalorimeter, während Protonen nur wenig Energie deponieren. Gemessen wird<br />
dieses Verhältniss aus der gemessenen deponierten Energie im Kalorimeter und der Rigidität,<br />
die für Teilchen mit Ladung Z = 1 der Bewegungsenergie entspricht. Bei Energien<br />
im GeV Bereich ist die Bewegungsenergie der dominante Anteil der Gesamtenergie von<br />
Protonen und Elektronen. Damit ist die Rigidität in erster Nährung ein Maß für die Gesamtenergie<br />
eines Teilchens mit Ladung Z = 1. Draus folgt, dass dieses sogenannte E/P<br />
Verhältnis für Leptonen etwa gleich 1 ist und für Protonen gegen 0 tendiert. Die Vertei-<br />
4 engl.: Boosted Decision Tree<br />
50
6.2. Eingangs-Variablen 51<br />
Abbildung 6.4.: Schematische Darstellung eines Entscheidungsbaumes, der Ereignisse mit<br />
Paramtern x in Signal S und Untergrund B anhand von Einzelentscheidungen,<br />
einteilt (links) [43] und Ausgabe des BDT in der AMS Software<br />
für Leptonen und Protonen, selektiert mit dem TrdQt Likelihoodverhältnis<br />
(rechts).<br />
lung dieser Variable ist in Abbildung 6.5 für eine Auswahl von Leptonen und Protonen aus<br />
Flugdaten, selektiert mit der TrdQt Likelihood gezeigt. Um Protonen zu selektieren wird<br />
verlangt, dass diese Variable kleiner 0, 4 ist und für Leptonen zwischen 0, 7 und 10, 0 liegt.<br />
Die mit dem Spurdetektor rekonstruierte Ladung soll sowohl für Leptonen, als auch für<br />
Protonen zwischen 0, 5 und 1, 5 liegen. Um eine Verunreinigung von Helium im Protonensample<br />
zu vermeiden, wird noch ein Schnitt auf die im Flugzeitdetektor deponierte Energie<br />
angewandt, die proportional zur Ladung im Quadrat ist. Dabei soll die durchschnittliche<br />
deponierte Energie in den vier Lagen kleiner als 4, 0 MeV sein und das Maximum 5, 0 MeV<br />
nicht überschreiten. Das Entfernen von Helium ist besonders wichtig, da es im elektromagnetischen<br />
Kalorimeter Protonen ähnlich sieht und als solches gekennzeichnet wird. Im<br />
Übergangsstrahlungsdetektor ist Helium jedoch durch seine hohe Ionisationsenergie nur<br />
schwer von Leptonen zu unterscheiden, so das ein Untergrund durch Helium das Training<br />
und spätere Analysen massiv verfälscht. Für die Auswahl von Positronen in den Abbildungen<br />
6.2 und 6.3 gelten die Kriterien für Elektronen mit positivem Ladungsvorzeichen.<br />
Für Helium wird verlangt, dass die mit dem Spurdetektor rekonstruierte Ladung zwischen<br />
1, 5 und 2, 5 liegt und vom elektromagnetisch Kalorimeter als Lepton zurückgewiesen wird.<br />
Mit diesen Bedingungen erhält man ein Trainingssample aus etwa 3 Millionen Elektronen<br />
und 255 Millionen Protonen im Rigiditätsbereich von 2 − 300 GV.<br />
6.2. Eingangs-Variablen<br />
Als Eingangs-Variablen für das neuronale Netzwerk des Übergangsstrahlungsdetektors stehen<br />
vor allem die Energieabgaben in den 20 Lagen zur Verfügung. Diese Energieabgaben<br />
sind nach Gleichung 4.1 abhängig vom Gammafaktor und somit von der Gesamtenergie<br />
des Teilchens. Damit ergibt sich eine Abhängigkeit der Eingangsvariablen zur gemessenen<br />
Rigidität, wie in Abbildung 6.6 am Beispiel von Flugdaten bis 300 GV gezeigt ist. Die<br />
Energieabgabe von Protonen steigt demnach mit der Energie wie erwartet an. Um diese<br />
Abhängigkeit zu berücksichtigen, wird die Rigidität als Eingangsvariable mit in das neuronale<br />
Netzwerk übergeben. Außerdem ist eine Abhängigkeit der Energieabgaben von der<br />
Gaszusammensetzung in den Proportionaldrahtkammerröhrchen zu erwarten. Der Teildruck<br />
des Xenongases wird also ebenfalls als Eingabevariable übergeben, um diesen zu<br />
51
52 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />
Abbildung 6.5.: Verteilung der EoverP Variable, die das Verhältnis von im Kalorimeter<br />
deponierter- zur Gesamtenergie eines Teilchens gibt.<br />
parametrisieren. Zusätzlich wurden noch aus den Energieabgaben zusammengesetzte, sogenannte<br />
integrierte Variablen getestet. Dazu wurde beispielsweise der RMS 5 oder der<br />
gestutzte Mittelwert der Energieabgaben betrachtet. Solche Variablen haben für sich alleine<br />
genommen gute Separationseigenschaften, allerdings tragen sie eventuell vorhandenen<br />
Korrelationen zwischen den einzelnen Lagen keine Rechnung und berauben dem neuronalen<br />
Netzwerk damit seiner potentiellen Vorteile gegenüber dem Likelihoodverhältnis.<br />
In Abbildung 6.7 ist ein Vergleich zwischen neuronalen Netzwerken mit unterschiedlichen<br />
Eingangsvariablen zu sehen. Dabei steht Int für das Set integrierter Variablen, Lay für die<br />
Energieabgaben in jeder Lage, Rig für die Rigidität des Teilchens, Beta für die relativistische<br />
Geschwindigkeit und Xe für den Teildruck des Xenongases. Außerdem wurde noch<br />
der Einfallswinkel des Teilchens zur z-Achse im Übergangsstahlungsdetektor als Eingangsvariable<br />
Theta und die geographische Breite Lat getestet. Die zum Vergleich verwendete<br />
Größe ist dabei die Protonenunterdrückung Rej 6 , die als Kehrwert der Effizienz Protonen<br />
als Signal zu selektieren nach<br />
Rej = 1 ε p<br />
(6.1)<br />
definiert ist. Die Protonenunterdrückung gibt damit an, auf wie viele Protonen im Durchschnitt<br />
eins als Signal falsch identifiziert wird. Die Protonenunterdrückung ist abhängig<br />
von der Signaleffizienz, die angibt wie viele Leptonen auch als solche erkannt werden. Als<br />
Vergleichsgröße ist die Protonenunterdrückung gut geeignet, da sie bei gegebener Entscheidungsgrenze<br />
nur mit Informationen der Protonenverteilung errechnet werden kann und<br />
nicht, wie beispielsweise die Reinheit, vom Verhältnis der Protonen- zur Leptonenanzahl<br />
abhängt, so dass diese normiert werden müssten. Die verschiedenen Netzwerke erreichen<br />
bei einer Signaleffizienz von 90% eine Protonenunterdrückung von der Größenordnung 10 3 .<br />
Die vielversprechendsten Variablenkonfigurationen sind dicker gezeichnet. Dabei scheint<br />
vor allem die Variablenkonfiguration mit den Energiedepositionen der einzelnen Lagen,<br />
sowie Rigidität, relativistische Geschwindigkeit, Teildruck des Xenongases und dem Einfallswinkel<br />
in den Übergangsstrahlungsdetektor, sowie der geographischen Breite eine gut<br />
5 engl.: Root mean squared<br />
6 engl.: Rejection<br />
52
6.2. Eingangs-Variablen 53<br />
Energieabgabe/ADC<br />
3<br />
10<br />
10<br />
2<br />
-3<br />
10<br />
-4<br />
10<br />
-5<br />
10<br />
Energieabgabe/ADC<br />
3<br />
10<br />
10<br />
2<br />
-3<br />
10<br />
10 -4<br />
-5<br />
10<br />
-6<br />
10<br />
-6<br />
10<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
10 -7<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
10 -7<br />
Abbildung 6.6.: Energieabgabe in Lage 6 über der Rigidität bis 300 GV für Protonen<br />
(links) und Elektronen (rechts). In schwarz ist die durchschnittliche Energieabgabe<br />
gezeigt (zut Interpretation sollte die logarithmisch gezeichnete<br />
y-Achse beachtet werden. Die Energieabgabe über 10 2 ADC stellt also<br />
einen signifikanten Anteil des Mittelwertes dar).<br />
geeignete zu sein. Für Vergleiche von Separationsmethoden ist außerdem der Verlauf der<br />
Protonenunterdrückung mit der Rigidität des Teilchens entscheidend. Dazu wird die Signaleffizienz<br />
auf 90% fixiert und der Schnittwert t cut für jeden Bin in der Rigidität separat<br />
mit 90% Signaleffizienz ermittelt. Zur Fehlerbetrachtung wird der statistische Fehler auf<br />
die Protoneneffizienz σ εp mit<br />
√<br />
σ Rej =<br />
√(<br />
∂Rej<br />
∂ε p<br />
) 2<br />
σε 2 p<br />
= 1 ε 2 σ εp (6.2)<br />
p<br />
auf die Protonenunterdrückung fortgepflanzt. Der statistische Fehler auf die Protoneneffizienz<br />
wird dabei von der Root Klasse TEfficiency mit Methoden der Bayes Statistik nach<br />
[44] mit uniformem Prior zwischen 0 und 1 ermittelt und ist asymmetrisch. Die Rigiditätsabhängigkeit<br />
der neuronalen Netze aus Abbildung 6.7 ist in Abbildung 6.8 gezeigt.<br />
Hier ist zu sehen, dass Variablenkonfigurationen mit hoher Protonenunterdrückung aus<br />
Abbildung 6.7 nur eine sehr hohe Unterdrückung bei geringer Rigidität aufweisen, wo der<br />
Schwerpunkt des Trainingssamples liegt. Bei höheren Rigiditäten sticht vor allem die Variablenkonfiguration<br />
mit den integrierten Variablen heraus, da deren Verteilung mit der<br />
Rigidität aufgrund geringerer Fluktuationen einfacher zu parametrisieren sind.<br />
Für niedrige Energien ist die relativistische Geschwindigkeit β, gemessen durch den Flugzeitdetektor,<br />
eine zusätzliche Variable, die bei der Unterscheidung von Protonen und Leptonen<br />
helfen kann. Protonen mit einer deutlich höheren Masse werden erst bei größeren<br />
Energien relativistisch als die leichteren Elektronen und Positronen. Dies ist in Abbildung<br />
6.9 dargestellt, wo die rekonstruierte relativistische Geschwindigkeit über der gemessenen<br />
Rigidität bis 300 GV für Protonen (links) und Elektronen (rechts) aufgetragen ist.<br />
Protonen werden erst bei etwa 5 GV vollkommen relativistisch. Elektronen sind bereits<br />
bei der unteren Grenze von 2 GV relativistisch. Um diese Information zu nutzen wurde das<br />
neuronale Netzwerk in zwei rigiditätsabhängige Teile getrennt. Ein Teil wird mit Ereignissen<br />
bis 5 GV trainiert und enthält die relativistische Geschwindigkeit als Eingangsvariable<br />
und ein Teil von 5 − 300 GV wird mit der Rigidität trainiert. Ein Vergleich der Protonenunterdrückung<br />
mit der Rigidität von geteilt trainierten neuronalen Netzen von 2 − 5<br />
GV und 5 − 300 GV, sowie des im gesamten Rigiditätsbereich von 2 − 300 GV trainierten<br />
Netzes ist in Abbildung 6.10 zu sehen. Außerdem wurde der Bereich von 5 − 300 GV<br />
bei 16 GV ein weiteres mal unterteilt. Die Entscheidung zur Unterteilung bei 16 GV ist<br />
dabei statistisch motiviert. Für das Netzwerk im gesamten Rigiditätsbereich wurde das<br />
53
54 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />
Protonenunterdruckung<br />
4<br />
10<br />
3<br />
10<br />
2<br />
10<br />
Int+Rig+Xe+Theta<br />
All<br />
Lay Only<br />
Lay+Xe<br />
Lay+Rig<br />
Lay+Rig+Xe<br />
Lay+Rig+Xe+Theta<br />
Lay+Rig+Xe+Theta+Beta<br />
Lay+Rig+Xe+Theta+Lat+Beta<br />
0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1<br />
Signal Effizienz<br />
Abbildung 6.7.: Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration<br />
der Eingangsvariablen gegen die Signaleffizienz.<br />
Protonenunterdruckung<br />
3<br />
10<br />
10<br />
2<br />
Int+Rig+Xe+Theta<br />
All<br />
Lay Only<br />
Lay+Xe<br />
Lay+Rig<br />
Lay+Rig+Xe<br />
Lay+Rig+Xe+Theta<br />
Lay+Rig+Xe+Theta+Beta<br />
Lay+Rig+Xe+Theta+Lat+Beta<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
Abbildung 6.8.: Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration<br />
der Eingangsvariablen mit der Rigidität des Teilchens.<br />
54
6.2. Eingangs-Variablen 55<br />
Beta<br />
1.4<br />
1.3<br />
5<br />
10<br />
Beta<br />
1.4<br />
1.3<br />
10 4<br />
1.2<br />
1.1<br />
10 4<br />
1.2<br />
1.1<br />
3<br />
10<br />
1<br />
0.9<br />
0.8<br />
3<br />
10<br />
2<br />
10<br />
1<br />
0.9<br />
0.8<br />
10 2<br />
10<br />
0.7<br />
10<br />
0.7<br />
0.6<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
1<br />
0.6<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
1<br />
Abbildung 6.9.: Relativistische Geschwindigkeit über der Rigidität bis 300 GV für Protonen<br />
(links) und Elektronen (rechts). In schwarz ist die der Verlauf des<br />
Durchschnitts gezeigt.<br />
Protonenunterdruckung<br />
3<br />
10<br />
2-5 GV<br />
5-300 GV<br />
2<br />
10<br />
2-300 GV<br />
5-16 GV & 16-300 GV<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
Abbildung 6.10.: Protonenunterdrückung neuronaler Netze, trainiert in unterschiedlichen<br />
Energiebereichen.<br />
Netzwerk mit der höchsten Protonenunterdrückung nach Abbildung 6.7 verwendet. Man<br />
erkennt bei niedrigen Energien eine leichte Verbesserung durch die Unterteilung, sowie eine<br />
signifikante Verbesserung bei Energien ab 10 GV. Die zusätzliche Unterteilung bei 16 GV<br />
bringt hingegen keine weitere Verbesserung. Dies mag am Mangel an Trainingsereignissen<br />
im Rigiditätsbereich von 16 − 300 GV liegen.<br />
Im Folgenden wird im Rigiditätsbereich von 2 − 5 GV das Netzwerk mit den Eingangsvariablen<br />
Energieabgabe, relativistische Geschwindigkeit, Teildruck des Xenongases, sowie<br />
dem Einfallswinkel des Teilchens zur z-Achse im Übergangsstrahlungsdetektor trainiert.<br />
Für den Rigiditätsbereich von 5 − 300 GV werden als Eingangsvariablen die Energieabgaben<br />
in jeder Lage, der Teildruck des Xenongases, die Rigidität und der Einfallswinkel<br />
zur z-Achse des Teilchens im Übergangsstrahlungsdetektor verwendet. Die Eingangsgrößen<br />
Gasdruck und Einfallswinkel im TRD sind dabei nicht rigiditäts-, oder teilchenabhängig<br />
und werden nur zur Parametrisierung der Energieabgaben ins Netzwerk gegeben. Außerdem<br />
werden für das Trainingssample im Bereich 5 − 300 GV nur Ereignisse mit einem<br />
Signal in Lage 1 des Spurdetektors, oberhalb des Übergangsstrahlungsdetektors, verwen-<br />
55
56 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />
Abbildung 6.11.: Durchschnittliche Energieabgabe von Protonen (rot) und Leptonen (dunkelblau)<br />
in den 20 Lagen des Übergangsstrahlungsdetektors mit angedeutetem<br />
Schnitt auf das Protonensample für die Trainingsauswahl.<br />
det. Damit kann die für die Berechnung der Energieabgaben benötigte Pfadlänge genauer<br />
angegeben werden. Getestet wurde das Netzwerk allerdings auch auf Ereignissen ohne<br />
einen zugeordneten Treffer in Lage 1.<br />
6.3. Training des neuronalen Netzwerks<br />
Je mehr Ereignisse des Trainingssamples für das Netzwerktraining verwendet werden können,<br />
desto besser kann die Verteilung der Eingangsparameter vom Netzwerk nachvollzogen<br />
und damit deren Separation optimiert werden. Die Anzahl an Trainingsereignissen ist vor<br />
allem durch die Anzahl an Elektronen als Signalereignisse im Trainingssample begrenzt.<br />
Diese machen nur etwa 1% der Trainingsdaten aus. Um den Trainingsprozess nicht zu<br />
sehr durch Protonen als Untergrund zu dominieren, wird nur ein Teil der Protonenauswahl<br />
verwendet. Um trotzdem ein gutes Trainingsresultat zu erzielen, werden hierfür speziell<br />
die Protonen herausgefiltert, die nur schwer von Elektronen zu unterscheiden sind<br />
und damit einen schweren Untergrund darstellen. Um diese nicht direkt anhand der Eingangsvariablen<br />
zu selektieren und weiterhin den gesamten Parameterraum abzudecken,<br />
wird die durchschnittliche Energieabgabe in allen Lagen betrachtet. Protonen mit einer<br />
überdurchschnittlich hohen Energieabgabe im Detektor bilden dann diesen schwer zu unterscheidenden<br />
Untergrund und werden für das Training verwendet. Die Verteilung der<br />
durchschnittlichen Energieabgabe bei Protonen und Leptonen aus Flugdaten, selektiert<br />
mit dem elektromagnetischen Kalorimeter, ist in Abbildung 6.11 gezeigt. Das Netzwerk<br />
sollte Protonen mit geringer durchschnittlicher Energieabgabe trotzdem einordnen können<br />
und wird daher auf alle Protonenereignisse getestet.<br />
6.3.1. Test auf Over-Training<br />
Um für das Training keine weiteren Daten zu verlieren, soll das Traingssample nicht, wie<br />
in Teil 5.3.3 beschrieben, aufgeteilt werden, um ein unabhängiges Testsample zu erhalten,<br />
sondern im Ganzen für das Training verwendet werden. Dabei soll der Trainingsalgorithmus<br />
innerhalb der Neurobayes R○ Software automatisch stoppen, wenn ein gutes globales<br />
56
6.3. Training des neuronalen Netzwerks 57<br />
Minimum der Fehlerfunktion E(w) gefunden ist und damit Over-Training verhindern. Dies<br />
passiert durch die sogenannte BFGS-Methode 7 , die eine schnelle Möglichkeit bietet ein globales<br />
Minimum zu finden [40]. Um dies zu testen, wird das Trainingssample in 10 Teile<br />
geteilt. Jedes dieser Teilsamples wird dann in einer Trainingsprozedur mit den übrigen<br />
neun Teilsamplen, bei gleichen Trainingseinstellungen, als Testsample verwendet. Es wird<br />
getestet ob in einem der 10 Trainingsprozeduren Over-Training stattfindet. Ist dies nicht<br />
der Fall, kann das Netzwerk bei gleichen Trainingseinstellungen mit der gesamten Trainingsauswahl<br />
trainiert werden ohne Over-Training zu riskieren.<br />
Um auf Over-Training zu testen, werden die Verteilungen der Ausgabewerte des neuronalen<br />
Netzwerks für das Test- und das Trainignssample verglichen. Sind die Werte gleich<br />
verteilt, hat kein Over-Training statt gefunden. Man erhält eine Ausgabe wie sie in Abbildung<br />
6.12 dargestellt ist für jede der 10 Trainingsprozeduren. Die Verteilung der Residuen<br />
wird nach<br />
r =<br />
t T raining − t T est<br />
(6.3)<br />
N T est + N T raining<br />
gebildet, wobei t T raining,T est der Ausgabewert des Trainings, bzw. des Testsamples für einen<br />
Bin und N T raining,T est der Inhalt des entsprechenden Bins ist. Die Residuen sollten über<br />
den möglichen Ausgabewerten zufällig verteilt sein und kein Muster aufweisen. Ist dies der<br />
Fall können die Verteilungen als gleich angesehen werden. Das ist, wie in Abbildung 6.12,<br />
für alle Teiltrainings der Fall, so dass man davon ausgehen kann, dass kein Over-Training<br />
stattfindet.<br />
6.3.2. Training mit Gewichten<br />
Eine weitere Möglichkeit das Training des neuronalen Netzwerkes zu optimieren, besteht<br />
in der Verwendung von Gewichten. Diese stellen eine Größe dar, mit der die Bedeutung<br />
eines Ereignisses für das Training beschrieben wird. Jedem Trainingsereignis wird dabei<br />
eine reelle Zahl zwischen 0 und 1 zugeordnet, wobei mit 1 gewichtete Ereignisse besonders<br />
stark in das Training einfließen und mit 0 gewichtete Ereignisse für das Training nicht<br />
beachtet werden. Für die Festlegung der Gewichte wird die Netzwerkausgabe nach einer<br />
Trainingsiteration betrachtet. Die Gewichte werden dann so gesetzt, dass bereits gut eingeordnete<br />
Ereignisse ein geringes Gewicht für das Training erhalten. Falsch eingeordnete<br />
Ereignisse erhalten ein hohes Gewicht. Dazu wird der Ausgabewert t des Netzwerks auf<br />
das Intervall zwischen 0 und 1 transformiert, wobei 1 einem Signal und 0 einem Untergrundereignis<br />
entspricht. Dann werden die Gewichte g linear nach diesem Ausgabewert<br />
mit g Sig = 1 − t für Signalereignisse und g Bkg = t für Untergrundereignisse festgelegt, wie<br />
es in Abbildung 6.13 dargestellt ist. Anschließend kann das Training mit einer gewöhnlichen<br />
Anzahl an Iterationen durchgeführt werden. Um den Ausgabewert des neuronalen<br />
Netzwerkes auch weiterhin als Wahrscheinlichkeit im Sinne der Bayes-Statistik nach Teil<br />
5.3.4 interpretieren zu können, muss eine an das Training anschließende Rückgewichtung<br />
nach<br />
t 1 · t 2<br />
˜t =<br />
(6.4)<br />
t 1 t 2 + (1 − t 1 )(1 − t 2 )<br />
durchgeführt werden, wobei t 1 der Ausgabewert nach einer Trainingsiteration und t 2 den<br />
Ausgabewert nach dem zweiten Training, darstellt. Die Methode Gewichte nach diesem<br />
Vorgehen festzulegen wird als Verstärkung bezeichnet. Der Einfluss der Verstärkung auf die<br />
Protonenunterdrückung der Netzwerke im Bereich 2−5 GV und 5−300 GV ist in Abbildung<br />
6.14 gezeigt. Demnach scheint das Training mit Gewichten für das Netzwerk bei niedrigen<br />
Energien ein Nachteil zu sein und wird daher nicht angewandt. Bei hohen Energien erreicht<br />
man durch das Verstärken einen kleinen Vorteil. Die Schwierigkeit bei der hier vorgestellten<br />
Methode liegt in der Stärke der Netzwerke nach bereits einer Trainingsiteration, so dass<br />
ein Großteil des Trainingssamples zu gering gewichtet wird.<br />
7 Broyden-Fletcher-Goldfarb-Shanno Methode<br />
57
58 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />
Verteilung der Ausgabewerte<br />
6<br />
10<br />
Signal Training<br />
Signal Test<br />
Untergrund Training<br />
5<br />
10<br />
Untergrund Test<br />
4<br />
10<br />
3<br />
10<br />
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />
Ausgabewerte<br />
Signal Training To Test Residuals<br />
0.15<br />
0.1<br />
0.05<br />
0<br />
-0.05<br />
-0.1<br />
-0.15<br />
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />
Expert Output<br />
Background Training To Test Residuals<br />
0.04<br />
0.02<br />
0<br />
-0.02<br />
-0.04<br />
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />
Expert Output<br />
Abbildung 6.12.: Verteilung der Ausgabewerte des neuronalen Netzwerkes für das<br />
Trainings- und das Testsample aufgeteilt nach Signal und Untergrundereignissen<br />
(oben). Darunter sind die Residuen der Verteilungen dargestellt.<br />
58
6.3. Training des neuronalen Netzwerks 59<br />
-1<br />
10<br />
1<br />
0.8<br />
Gewichte<br />
1<br />
-1<br />
10<br />
1<br />
0.8<br />
Gewichte<br />
0.6<br />
0.6<br />
-2<br />
10<br />
0.4<br />
-2<br />
10<br />
0.4<br />
-3<br />
10<br />
0.2<br />
-3<br />
10<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
Ausgabewert<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
Ausgabewert<br />
Abbildung 6.13.: Verteilung der Ausgabewerte von Protonen (links) und Elektronen<br />
(rechts) nach einer Trainingsiteration mit Gewichtsfunktion (grün).<br />
Protonenunterdruckung<br />
3<br />
10<br />
Protonenunterdruckung<br />
3<br />
10<br />
Normal<br />
Verstarkt<br />
2 2.5 3 3.5 4 4.5 5<br />
Rigiditat/GV<br />
Normal<br />
Verstarkt<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
Abbildung 6.14.: Vergleich des verstärkten neuronalen Netzwerkes mit dem unverstärkten<br />
im Bereich von 2 − 5 GV (links) und 5 − 300 GV (rechts).<br />
6.3.3. Trainingseinstellungen<br />
In der NeuroBayes R○ Software werden Trainingseinstellungen über das Setzen von Bitschaltern<br />
getätigt. Damit kann festgelegt werden, wie das Training ablaufen und Eingangsvariablen<br />
in der Vorprozessierung behandelt werden sollen. In der Vorprozessierung<br />
werden die Eingangsvariablen für die Verwendung im neuronalen Netzwerk vorbereitet.<br />
Dabei werden sie mittels einer nichtlinearen Transformation zu einer Gauß-Verteilung mit<br />
Mittelwert 0 und Varianz 1 transformiert. Dafür wird eine Anpassung an die Verteilung der<br />
Eingangsvariablen durchgeführt. Danach werden die Verteilungen der Eingangsvariablen<br />
dekorreliert [41]. In etwa 12% der Fälle kann dem Ereignis keine Energieabgabe in einer<br />
Lage zugeordnet werden. Die NeuroBayes R○ Software schließt solche fehlenden Energieabgaben<br />
von der Anpassung aus und gibt sie als Nullinformation an des Netzwerk weiter.<br />
Des Weiteren werden die Eingangsvariablen nach ihren Separationseigenschaften sortiert<br />
und für die Unterscheidung von Signal und Untergrund irrelevante Variablen entfernt.<br />
Für die Trennungseigenschaften des neuronalen Netzwerks sind außerdem die Menge an<br />
Neuronen in der versteckten Schicht wichtig. Durch diese wird die Kapazität des neuronalen<br />
Netzwerks bestimmt. Sind zu viele Neuronen in der versteckten Schicht, tendiert das<br />
Netzwerk zum Over-Training und verliert seine Eigenschaft zur Generalisierung. Wenige<br />
Neuronen führen wiederum zu einer zu starken Vereinfachung der Parameterverteilung.<br />
Für N Eingangsvariablen werden N + 2 Neuronen in der versteckten Schicht verwendet.<br />
Zusätzlich kann die Trainingsgeschwindigkeit festgelegt werden, die die Schrittweite bei<br />
der numerischen Minimierung der Fehlerfunktion E(w) festlegt. Diese wird bei 1.0 und<br />
damit der Grundeinstellung belassen. Die Zahl der Trainingsiterationen wird nicht fixiert,<br />
59
100% Signal-ähnlich<br />
60 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />
so das Trainingsiterationen durchgeführt werden, bis der BFGS-Algorithmus das Training<br />
beendet. Da bei dem großen Trainingssample und der starken Separationseigenschaften<br />
der Einganvsvariablen bereits in der ersten Trainingsiteration ein Großteil der Parameterverteilung<br />
gelernt wird, wird dieser Punkt bereits nach etwa 6 − 8 Iterationen erreicht.<br />
6.4. Ausgabe des neuronalen Netzwerkes<br />
Die Ausgabe des neuronalen Netzes kann nach Teil 5.3.4 als Wahrscheinlichkeit interpretiert<br />
werden. In der NeuroBayes R○ Software wird die Ausgabe so gewählt, dass Ausgabewerte<br />
zwischen −1 und +1 liegen. Ein Wert bei +1 kann dann als 100%ige Wahrscheinlichkeit<br />
für ein Signalereignis aufgefasst werden, Werte bei −1 als 100%ige Wahrscheinlichkeit<br />
für ein Untergrundereignis. Die Verteilung der Ausgabewerte des neuronalen Netzwerks im<br />
Rigiditätsbereich 5 − 300 GV ist in Abbildung 6.15 gegeben. Zudem wird von der Software<br />
100% Untergrund-ähnlich<br />
t cut<br />
Abbildung 6.15.: Verteilung der Ausgabewerte des neuronalen Netzwerks und deren<br />
Interpretation.<br />
eine Rangliste der Eingangsvariablen erstellt. Diese ist sortiert nach dem Beitrag einer<br />
Variable zur Separation im neuronalen Netzwerk, gegeben durch die Signifikanz. Die Liste<br />
für das Netzwerk von 2 − 5 GV ist in Tabelle 6.1 dargestellt. Dabei ist nicht nur die<br />
Signifikanz ”<br />
Sig“ der Variablen im Netzwerk, sondern auch die Signifikanz der Variablen<br />
alleine gegeben und der Signifikanzverlust für das Netzwerk ohne diese Variable. Die Signifikanz<br />
alleine gibt dabei die Korrelation zwischen der Variable und dem Zielwert, wie<br />
er in Teil 5.3.3 definiert wurde. Außerdem ist die Korrelation zu den anderen Variablen<br />
gegeben. Die Ranglist für das Netzwerk von 5 − 300 GV ist in Tabelle 6.2 angegeben. Die<br />
Zählung der Lagen im Übergangsstrahlungsdetektor erfolgt dabei aufsteigend von unten<br />
nach oben. Um eine Fehlerdiagnose zu vereinfachen und den Erfolg des Trainings zu überprüfen,<br />
wird von der Software ein Analysedokument erstellt. In diesem Dokument sind<br />
wichtige Informationen zum Verlauf des Trainings wie die Fehlerfunktion, Informationen<br />
zu den einzelnen Variablen wie Separationseigenschaften und deren Transformation, sowie<br />
Informationen über das Netzwerk selbst wie die Korrelationsmatrix der Eingabeparameter<br />
und die Struktur des Netzwerks. Ein Ausschnitt mit wichtigen Informationen der Analysedokumente<br />
für die Netzwerke von 2 − 5 GV und von 5 − 300 GV ist in Anhang A und<br />
B zu finden.<br />
60
6.4. Ausgabe des neuronalen Netzwerkes 61<br />
Variable Sig. im Netzwerk Sig. alleine Sig. Verlust Korrelation<br />
Beta 855.24 855.24 260.94 38.1%<br />
Energieabgabe in Lage 01 563.36 698.85 192.35 31.9%<br />
Energieabgabe in Lage 05 502.87 696.97 188.62 32.0%<br />
Energieabgabe in Lage 03 452.28 695.26 189.79 31.8%<br />
Energieabgabe in Lage 06 411.77 692.18 187.59 31.7%<br />
Energieabgabe in Lage 02 378.03 698.26 190.23 32.0%<br />
Energieabgabe in Lage 07 349.08 689.71 185.72 31.7%<br />
Energieabgabe in Lage 08 323.10 686.05 184.17 31.5%<br />
Energieabgabe in Lage 09 300.03 679.50 181.69 31.3%<br />
Energieabgabe in Lage 04 281.32 682.20 185.32 31.2%<br />
Energieabgabe in Lage 10 265.43 674.53 180.11 31.0%<br />
Energieabgabe in Lage 11 248.11 667.33 176.13 30.8%<br />
Energieabgabe in Lage 13 233.16 660.92 173.47 30.6%<br />
Energieabgabe in Lage 12 221.54 663.16 173.92 30.7%<br />
Energieabgabe in Lage 14 206.52 649.74 168.22 30.2%<br />
Energieabgabe in Lage 15 194.78 641.07 165.72 29.8%<br />
Energieabgabe in Lage 17 185.55 622.63 159.23 29.0%<br />
Energieabgabe in Lage 18 173.80 609.84 155.82 28.4%<br />
Energieabgabe in Lage 16 166.76 618.57 158.17 28.8%<br />
Energieabgabe in Lage 19 154.86 591.89 149.07 27.7%<br />
Energieabgabe in Lage 20 135.84 555.83 136.01 26.2%<br />
TrdTheta 53.53 74.66 53.53 1.9%<br />
Xe Teildruck 8.25 74.89 8.25 4.2%<br />
Tabelle 6.1.: Liste der Eingangsvariablen des neuronalen Netzwerks im Rigiditätsbereich<br />
2 − 5 GV, sortiert nach deren Beitrag zur Separation.<br />
61
62 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />
Variable Sig. im Netzwerk Sig. alleine Sig. Verlust Korrelation<br />
Energieabgabe in Lage 02 711.54 711.54 206.57 30.7%<br />
Energieabgabe in Lage 06 621.71 709.51 204.95 30.7%<br />
Energieabgabe in Lage 05 552.53 710.04 205.50 30.7%<br />
Energieabgabe in Lage 08 495.60 705.16 204.72 30.5%<br />
Energieabgabe in Lage 01 451.80 706.62 206.31 30.5%<br />
Energieabgabe in Lage 07 414.48 706.76 205.04 30.5%<br />
Energieabgabe in Lage 03 383.18 707.40 204.71 30.6%<br />
Energieabgabe in Lage 09 355.18 699.53 203.33 30.2%<br />
Energieabgabe in Lage 10 331.33 697.62 202.19 30.1%<br />
Energieabgabe in Lage 11 309.31 690.55 201.15 29.8%<br />
Energieabgabe in Lage 12 291.53 688.17 199.88 29.7%<br />
Energieabgabe in Lage 13 275.07 682.54 198.97 29.4%<br />
Energieabgabe in Lage 04 261.78 694.79 201.47 30.0%<br />
Energieabgabe in Lage 14 245.98 673.02 195.34 29.0%<br />
Energieabgabe in Lage 15 232.65 661.38 193.47 28.4%<br />
Energieabgabe in Lage 17 217.04 639.35 186.65 27.4%<br />
Energieabgabe in Lage 16 207.78 633.50 187.34 27.0%<br />
Energieabgabe in Lage 18 199.26 620.53 184.76 26.4%<br />
Energieabgabe in Lage 19 187.14 592.50 179.44 24.9%<br />
Energieabgabe in Lage 20 168.35 531.46 166.17 22.0%<br />
Rabs 126.74 523.23 126.77 23.8%<br />
XePressure 23.82 42.37 23.82 1.2%<br />
TrdTheta 12.77 34.79 12.77 1.6%<br />
Tabelle 6.2.: Liste der Eingangsvariablen des neuronalen Netzwerks im Rigiditätsbereich<br />
5 − 300 GV, sortiert nach deren Beitrag zur Separation.<br />
62
7. Vergleich von Methoden zur<br />
Protonen/Positronen Trennung<br />
Wie in Teil 5.2 beschrieben, stehen zur Trennung von Protonen und Leptonen zwei Implementierungen<br />
von Likelihoodverhältnissen in der AMS Software zur Verfügung: Das<br />
in der RWTH Aachen entwickelte Framework TrdQt und das im MIT entwickelte TrdK.<br />
Die Separationseigenschaften dieser Methoden sollen hier mit denen des neuronalen Netzwerks<br />
verglichen werden. Die Protonenunterdrückung von Separationsmethoden ist dabei<br />
stark von der Vorselektion und der Selektion der zu testenden Ereignisse abhängig. Dabei<br />
ist dann ein Vorteil des neuronalen Netzwerks gegenüber den Likelihood Methoden<br />
zu erwarten, wenn einzelne Korrelationen zwischen den Lagen auftreten und damit eine<br />
einfache lineare Trennung der Populationen nicht mehr optimal ist. Außerdem können Abhängigkeiten<br />
von Parametern wie Rigidität oder Gasdruck auf eine unterschiedliche Weise<br />
eingebracht werden.<br />
Als Vergleich zwischen den Methoden wird die Protonenunterdrückung betrachtet, wie<br />
sie in Teil 6.2 definiert wurde. In Abbildung 7.1 ist die Protonenunterdrückung für die<br />
drei Methoden mit der Effizienz auf die Selektion von Elektronen gezeigt. Dabei liegen<br />
die Likelihoodmethoden nahe beieinander, wobei das Likelihoodverhältnis der TrdK Calib<br />
leicht über der TrdQt Likelihood liegt. Das neuronale Netzwerk kann sich nur bei niedrigen<br />
Effizienzen von den Likelihoodmethoden absetzen und hat oberhalb einer Signaleffizienz<br />
von etwa 75% vergleichbare Performance. Abbildung 7.2 zeigt die Protonenunterdrückung<br />
bei 90% Signaleffizienz, in jedem Bin, mit der Rigidität. Hier ist zu sehen, dass das neuronale<br />
Netzwerk vor allem bei niedrigen Rigiditäten bis 5 GV im Vorteil gegenüber den<br />
Likelihoodmethoden ist.<br />
In den Abbildungen 7.3 sind die Übereinstimmungen der Auswahl von Elektronen bei einer<br />
Auswahleffizienz von 90% durch die beiden Likelihoodmethoden und das neuronale Netzwerk<br />
als sogenanntes Venn Diagramm gezeigt. Dieses zeigt an, inwieweit die durch die drei<br />
Separationsmethoden selektierten Elektronen übereinstimmen. Die Überschneidung der<br />
Mengen ist in Prozent gegeben. Darunter ist die Anzahl an Ereignissen in den Teilmengen<br />
angegeben. 100% entsprechen dabei der Gesamtzahl an selektierten Signalereignissen,<br />
also der Summe in allen Teilmengen. Demnach werden 90% der selektierten Elektronen<br />
in Übereinstimmung der drei Separationsmethoden ausgewählt. Weitere 4% werden nur<br />
von den Likelihoodmethoden, jedoch nicht vom neuronalen Netzwerk erkannt. Diese gilt es<br />
noch zu untersuchen und gegebenenfalls in das Netzwerktraining einzubinden. Insgesamt<br />
ist die Übereinstimmung der Auswahl jedoch hoch.<br />
Um die physikalisch relevanten Eigenschaften der Separationsmethoden zu untersuchen,<br />
63
64 7. Vergleich von Methoden zur Protonen/Positronen Trennung<br />
Rejection<br />
5<br />
10<br />
Rejection with signal efficiency<br />
4<br />
10<br />
3<br />
10<br />
Neuronales Netzwerk<br />
2<br />
10<br />
TrdQt Likelihood<br />
TrdK Calib Likelihood<br />
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
Sig Eff<br />
Abbildung 7.1.: Protonenunterdrückung mit der Signaleffizienz des neuronalen<br />
Netzwerks (dunkelblau), sowie des TrdQt- (rot) und des TrdK-<br />
Likelihoodverhältnisses (blau).<br />
Protonenunterdruckung<br />
3<br />
10<br />
Neuronales Netzwerk<br />
TrdQt Likelihood<br />
TrdKCalib Likelihood<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
Abbildung 7.2.: Protonenunterdrückung mit Rigidität im Bereich 5 − 300 GV für das<br />
neuronale Netzwerks (schwarz), sowie für das TrdQt- (rot) und TrdK-<br />
Likelihoodverhältnis (blau).<br />
64
7.1. Reinheit der Separationsmethoden 65<br />
Abbildung 7.3.: Übereinstimmung der Auswahl von Elektronen bei 90% Signaleffizienz<br />
durch die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem<br />
neuronalen Netzwerk.<br />
wird die Reinheit als Anteil von Signalereignissen in der Annahmeregion nach Gleichung<br />
5.6 ermittelt. Mit bekannter Reinheit kann dann eine Analyse von ausgewählten Positronen<br />
und Elektronen durchgeführt werden.<br />
7.1. Reinheit der Separationsmethoden<br />
Um die Reinheit zu ermitteln soll auch hier auf Flugdaten zurückgegriffen werden. Dazu<br />
wurde eine Methode gewählt, die eine selektierte Positronenauswahl an Schablonen aus<br />
Elektronen als Signal und Protonen als Untergrund anpasst. Als Schablone dient dabei die<br />
Verteilung der Ausgabewerte des Boosted Decision Trees durch das elektromagnetische Kalorimeter,<br />
unabhängig vom Übergangsstrahlungsdetektor. Damit kann ermittelt werden,<br />
wie das selektierte Positronensample zusammengesetzt ist. Um Schablonen zu erstellen<br />
muss eine Protonen- und Elektronenselektion unabhängig vom elektromagnetischen Kalorimeter<br />
durchgeführt werden. Dazu werden Ereignisse mit dem Übergangsstrahlungsdetektor<br />
selektiert. Man startet mit einer Ereignismenge aus Ereignissen mit Ladungsbetrag<br />
|Z| = 1 aus Spurdetektor, sowie einer maximalen Energieabgabe von weniger als 5, 0 MeV<br />
und einer durchschnittlichen Energieabgabe von weniger als 4, 0 MeV im Flugzeitdetektor,<br />
um Heliumkontamination zu vermeiden. Aus dieser Menge werden nun Protonen mit<br />
• Positive Ladung Z = +1 mit dem Spurdetektor<br />
• Proton mit TrdQt Likelihoodverhältnis<br />
und Elektronen mit<br />
• Negative Ladung Z = −1 mit dem Spurdetektor<br />
• Elektron mit TrdQt Likelihoodverhältnis<br />
in einem bestimmten Rigiditätsbereich selektiert. Man erhält aus der Verteilung der BDT<br />
Ausgabewerte Rigiditätsabhängige Schablonen, wie in Abbildung 7.4. Nun werden Positronen<br />
mit Ladung Z = +1 mittels der Methode selektiert, deren Reinheit ermittelt werden<br />
soll. An diese Verteilung werden die Schablonen durch Variieren der Gewichte angepasst,<br />
bis deren gewichtete Summe der Positronenauswahl bestmöglich entspricht. Dazu wird die<br />
Root Klasse TFractionFitter genutzt. Aus dem Gewicht der Elektronenschablone erhält<br />
65
66 7. Vergleich von Methoden zur Protonen/Positronen Trennung<br />
7<br />
10<br />
6<br />
10<br />
5<br />
10<br />
Protonen Schablone<br />
6<br />
10<br />
5<br />
10<br />
4<br />
10<br />
3<br />
10<br />
Elektronen Schablone<br />
4<br />
10<br />
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />
BDT<br />
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />
BDT<br />
Abbildung 7.4.: Verteilung des BDT Ausgabewertes der Protonenschablone<br />
(links) und der Elektronenschablone (rechts), selektiert mit dem<br />
Übergangsstrahlungsdetektor.<br />
Selektierte Positronen<br />
-1<br />
10<br />
-1<br />
10<br />
Data Points<br />
Electron Template<br />
Proton Template<br />
Fit<br />
Purity: 0.264 +- 0.003<br />
ChiSq/NDF: 2.719<br />
-2<br />
10<br />
-2<br />
10<br />
-3<br />
10<br />
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />
BDT<br />
-3<br />
10<br />
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />
BDT<br />
Abbildung 7.5.: Verteilung des BDT Ausgabewertes einer Auswahl von Positronen mit<br />
dem neuronalen Netzwerk bei einer Elektronen Effizienz von 90% im Rigiditätsbereich<br />
7, 96 − 10, 05 GV (links) und Anpassung der Schablonen<br />
an dies Positronenauswahl (rechts).<br />
man dann die Reinheit. Ein Beispiel für eine solche Anpassung, für eine Positronenauswahl<br />
im Rigiditätsbereich 7, 96 − 10, 05 GV, ist in Abbildung 7.5 dargestellt.<br />
Nicht aufgerufen wird der Entscheidungsbaum für Ereignisse, die bereits durch eine einfache<br />
Betrachtung der Schauerform sicher als Protonen identifiziert werden können. Dies<br />
betrifft Ereignisse die nur durch Ionisation Energie im Kalorimeter deponieren und damit<br />
MIP 1 -ähnlich sind. Diese Ereignisse mit einer geringen Energieabgabe in den ersten beiden<br />
Superlagen des Kalorimeters werden zu −0, 9991 und Ereignisse mit einer geringen<br />
Schauerausbreitung zu −0, 9993 gesetzt und damit sicher als Protonen gekennzeichnet.<br />
Für die Anpassung an die Verteilung des BDT stellen solche Ereignisse ein Problem dar,<br />
da sie überwiegend für positive Teilchen auftreten. Damit wird eine Diskrepanz zwischen<br />
Elektronenschablone und Positronenverteilung hergestellt. Sie werden daher von der Anpassung<br />
ausgenommen und im Nachhinein korrigiert. Dazu wird ausgenutzt, dass es sich<br />
bei diesen Ereignissen in der Positronenauswahl ausschließlich um falsch eingeordnete Protonen<br />
handelt. Die Situation für die Verteilung der BDT Ausgabewerte ist in Abbildung<br />
7.6 dargestellt. Es befinden sich A+B Protonen in den Bins bei −0, 9993 und −0, 9991 der<br />
Positronenauswahl durch den TRD. Das Ergebnis der Anpassung f für die Elektronen-<br />
1 engl.: Minimum Ionisation Particle<br />
66
7.2. Vergleich anhand der ermittelten Reinheit 67<br />
A<br />
B<br />
MIP<br />
-0.9993<br />
MIP<br />
-0.9991<br />
BDT<br />
Abbildung 7.6.: Schematische Darstellung der Verteilung des Entscheidungsbaumes in der<br />
Region der minimal ionisierenden Teilchen in der Longitudinalen und Lateralen<br />
Schauerausbreitung.<br />
schablone ohne diese Bins gibt<br />
f =<br />
N P os<br />
N − (A + B) , (7.1)<br />
wobei N P os die Anzahl richtig eingeordneter Positronen und N die vom TRD selektierten<br />
Positronen mit Protonenverunreinigung gibt. Die Nummer der richtig eingeordneten Positronen<br />
N P os wird durch das Ausschließen der Bins von der Anpassung an die Schablonen<br />
nicht verändert. Damit ist die korrigierte Reinheit<br />
p = N P os<br />
N<br />
= f −<br />
(A + B)<br />
N . (7.2)<br />
7.2. Vergleich anhand der ermittelten Reinheit<br />
Mit dem Vorgehen nach der Anpassung der Positronenauswahl mithilfe von Schablonen<br />
wird jetzt die Reinheit der Positronenauswahl mit der Effizienz auf die Positronenselektion<br />
ermittelt. Diese ist in Abbildung 7.7 für den Rigiditätsbereich 2 − 300 GV dargestellt.<br />
Die Verläufe ähneln denen aus Abbildung 7.1. Bei niedriger Signaleffizienz ist die Anzahl<br />
selektierter Positronen zu gering und die Anpassungsprozedur ist instabil gegenüber statistischen<br />
Fluktuationen und kann nicht mehr optimal durchgeführt werden.<br />
Wie in Kapitel 5.1 beschrieben verbindet eine gute Separationsmethode hohe Effizienz bei<br />
hoher Reinheit. Als Arbeitspunkt wird daher der Punkt ausgewählt, der dem Idealpunkt<br />
mit Signaleffizienz 1 und Reinheit 1 am nächsten liegt. Um Arbeitspunkte mit der Rigidität<br />
zu erhalten werden nun Anpassungen an Schablonen in bestimmten Rigiditätsabschnitten<br />
durchgeführt und der Verlauf der Reinheit mit der Signaleffizienz betrachtet. Daraus erhält<br />
man den Arbeitspunkt für den ensprechenden Rigiditätsbereich. Die damit ermittelten<br />
Entscheidungsgrenzen mit der Rigidität, sowie die Effizienz auf die Signalauswahl sind<br />
in Abbildung 7.8 dargestellt. Dabei ist für die Entscheidungsgrenzen zu beachten, dass<br />
für das neuronale Netzwerk hohe Ausgabewerte gegen +1 einem Signalereignis entsprechen.<br />
Für die Likelihoodverhältnisse hingegen stehen niedrige Werte für Signalereignisse.<br />
Der Ausschlag für die Entscheidungsgrenze im letzten Bin geht also in allen Separationsmethoden<br />
in Richtung höherer Untergrund und ist der geringen Statistik in diesem Bin<br />
geschuldet. Die Effizienz auf die Signalauswahl ist bei allen Methoden vergleichbar und<br />
67
68 7. Vergleich von Methoden zur Protonen/Positronen Trennung<br />
Reinheit<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
Neuronales Netzwerk<br />
TrdQt Likelihood<br />
TrdK Calib Likelihood<br />
0<br />
0.4 0.5 0.6 0.7 0.8 0.9 1<br />
Signal Effizienz<br />
Abbildung 7.7.: Reinheit der Positronenauswahl mit der Effizienz auf die<br />
Positronenselektion.<br />
Entscheidungsgrenze<br />
Signal Effizienz<br />
1<br />
0.95<br />
0.9<br />
0.85<br />
0.8<br />
0.75<br />
0.7<br />
Rigidität/GV<br />
0.65<br />
0.6<br />
0.55<br />
0.5<br />
Neuronales Netzwerk<br />
TrdQt Likelihood<br />
TrdK Calib Likelihood<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
Abbildung 7.8.: Entscheidungsgrenzen am Arbeitspunkt mit der Rigidität (links) und Signaleffizienz<br />
bei diesen Entscheidungsgrenzen mit der Rigidität (rechts).<br />
liegt bei etwa 80%. Die für die Arbeitspunkte ermittelte Reinheit mit der Rigidität ist in<br />
Abbildung 7.9 zu sehen. Hier hebt sich das neuronale Netzwerk bei niedrigen Rigidtäten,<br />
ähnlich der Protonenunterdrückung aus Abbildung 7.2, deutlich von den Likelihoodmethoden<br />
ab. Dies ist durch die Einbindung der relativen Geschwindigkeit zu erklären. In<br />
den Abbildungen 7.10 und 7.11 ist noch einmal die Übereinstimmung der Auswahl von<br />
Elektronen und Positronen mit den Entscheidungsgrenzen aus Abbildung 7.8, verteilt auf<br />
die drei Separationsmethoden, als Venn Diagramm gezeigt. Dabei wurden die Einträge<br />
für Positronen mit der Reinheit gewichtet, um Protonenkontamination zu korrigieren. Für<br />
die Schnittflächen wurde die höchste Reinheit der Schnittpartner verwendet, was zumeist<br />
der Reinheit des neuronalen Netzwerks entspricht und die Zahlen für die Likelihoodmethoden<br />
in Schnittmengen mit dem neuronalen Netzwerk leicht erhöht. Der prozentuale<br />
Anteil wurde so definiert, dass die gesamte Menge an Elektronen oder Positronen, selektiert<br />
durch mindestens eine der drei Methoden und damit die Summe aller Teilmengen,<br />
100% entspricht. Die Anzahl der Einträge in die jeweiligen Bereichen wurde bei Positronen<br />
außerdem auf ganze Zahlen gerundet. Die Teilmengen sind bei Elektronen ähnlich verteilt<br />
68
7.2. Vergleich anhand der ermittelten Reinheit 69<br />
Reinheit<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
10<br />
Neuronales Netzwerk<br />
TrdQt Likelihood<br />
TrdK Calib Likelihood<br />
2<br />
10<br />
Rigiditat/GV<br />
Abbildung 7.9.: Reinheit der Positronenauswahl mit der Rigidität.<br />
wie in Abbildung 7.3, jedoch ist die Selektionseffizienz für das neuronale Netzwerk etwas<br />
höher, was die Schnittflächen zu diesem etwas verschiebt. Für Positronen ist der gegenteilige<br />
Effekt zu sehen. Die Likelihoodmethoden selektieren wesentlich mehr Positronen<br />
als das neuronale Netzwerk und nur 80000 Positronen werden in Übereinstimmung der<br />
drei Methoden ausgewählt. In Abbildung 7.12 ist die Anzahl der ausgewählten Positronen<br />
durch die verschiedenen Separationsmethoden mit der Rigidität aufgetragen. Dort ist<br />
zu erkennen, dass die Anzahl ausgewählter Positronen im statistischen Fehlerbereich in<br />
großen Teilen übereinstimmen. Der statistische Fehler setzt sich hierbei aus dem binominalen<br />
Fehler als Wurzel der Positronenanzahl und dem Fehler aus der Anpassungsprozedur<br />
zusammen. Im letzten Rigiditätsabschnitt werden durch die Likelihoodmethoden jedoch<br />
wesentlich mehr Positronen selektiert. Dies ist auf die geringe Zahl an Elektronen und<br />
Positronen in diesem Rigiditätsbereich zurückzuführen, wodurch die Anpassungsprozedur<br />
fehlerhaft verläuft und erklärt die Verschiebung der Positronenauswahl in Abbildung 7.11.<br />
69
70 7. Vergleich von Methoden zur Protonen/Positronen Trennung<br />
Abbildung 7.10.: Übereinstimmung der Auswahl von Elektronen am Arbeitspunkt durch<br />
die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />
Netzwerk.<br />
Abbildung 7.11.: Übereinstimmung der Auswahl von Positronen am Arbeitspunkt durch<br />
die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />
Netzwerk gewichtet mit der Reinheit.<br />
70
7.2. Vergleich anhand der ermittelten Reinheit 71<br />
# Positronen<br />
5<br />
10<br />
4<br />
10<br />
3<br />
10<br />
2<br />
10<br />
NN Positronen<br />
TrdQt Positronen<br />
TrdK Positronen<br />
10<br />
2<br />
10<br />
Rigiditat/GV<br />
Abbildung 7.12.: Positronenauswahl der Separationsmethoden mit der Rigidität.<br />
71
8. Zusammenfassung und Ausblick<br />
Mit Abschluss dieser Diplomarbeit befindet der AMS-02 Detektor seit 22 Monaten auf der<br />
Internationalen Raumstation und konnte dort durchgehend ohne Ausfälle bereits 30 Milliarden<br />
Teilchen messen. Der Betrieb des Detektors ist bis zum Jahr 2020 sichergestellt und<br />
könnte nach einer eventuellen Verlängerung der ISS Mission entsprechend weitergeführt<br />
werden. Derzeitigen Prognosen zu Folge sind die Gasreserven des TRD, bei Fortsetzung<br />
des jetzigen Betriebes, wie er in Kapitel 4 beschrieben ist, für mindestens 30 weitere Jahre<br />
ausreichend, sodass dessen Aktivität nicht eingeschränkt werden müsste.<br />
Eine der interessantesten Messungen durch den AMS-02 Detektor wird auch in Zukunft<br />
die präzise Messung des Positronenanteils in der leptonischen Komponente der kosmischen<br />
Strahlung sein. Hierzu werden Methoden benötigt um Positronen aus der durch Protonen<br />
dominierten kosmischen Strahlung zu Separieren.<br />
Mit den vorhandenen Methoden, basierend auf Likelihoodverhältnissen, zur Trennung leptonischer<br />
und hadronischer Ereignisse mit Hilfe des Übergangsstrahlungsdetektors kann<br />
eine Protonenunterdrückung von 10 3 bei einer Signaleffizienz von 90% erreicht werden.<br />
In dieser Arbeit wurde eine neue Methode in Form eines neuronalen Netzwerkes im Rigiditätsbereich<br />
von 2 − 300 GV entwickelt und getestet. Dazu wurde die NeuroBayes R○<br />
Software genutzt. Wie in Kapitel 7 gezeigt wurde, sind die Separationseigenschaften des<br />
Neuronalen Netwerks mit denen der Likelihoodmethoden vergleichbar. Hierdurch konnten<br />
diese validiert werden. Bei kleinen Rigiditäten bis 5 GV ist eine signifikante Verbesserung<br />
der Separationseigenschaften gegenüber der Likelihoodmethoden erzielt worden, was auf<br />
die Implementierung der relativen Geschwindigkeit zurückzuführen ist. Außerdem ist eine<br />
höhere Reinheit bei Signaleffizienzen unter 75% auf die Signalauswahl für das neuronale<br />
Netzwerk erzielt worden.<br />
In einer in Kürze erscheinenden Veröffentlichung zum Positronenanteil bis 350 GV wird<br />
das Likelihoodverhältnis der TrdK verwendet. Mit weiteren Messdaten wird der Positronenanteil<br />
in Zukunft noch bis in den TeV Bereich fortgesetzt werden können. Zusätzlich<br />
wird der AMS-02 Detektor Untersuchungen zur Anisotropie durchführen. Die Messungen<br />
des Positronenanteils durch den AMS-02 Detektor werden damit einen wichtigen Beitrag<br />
zur Identifikation eines teilchenphysikalischen Kandidaten der Dunklen Materie liefern.<br />
73
Literaturverzeichnis<br />
[1] NASA/WMAP Science Team, Expansion des Universums und Entwicklungsstadien<br />
als Modell. http://commons.wikimedia.org/wiki/File:Expansion_des_<br />
Universums.png% relax.<br />
[2] NASA,. http://www.flickr.com/photos/ams02/5858030178/.<br />
[3] Bluemer, J.; Engel, R.; Hoerandel, J. R. Progress in Particle and Nuclear Physics<br />
2009, 63, 293 – 338.<br />
[4] Grupen, C. Astroparticle Physics, 1st ed.; Springer: Berlin [u.a.], 2005.<br />
[5] Hu, H. Status of the EAS studies of cosmic rays with energy below 10 16 eV, 2009,<br />
arXiv:0911.3034 [astro-ph.HE].<br />
[6] stratocat.com, Data of the stratospheric balloon launched on 5/3/1994. http://<br />
stratocat.com.ar/fichas-e/1994/FSU-19940503.htm.<br />
[7] The Pierre Auger Cosmic Ray Observatory. http://www.auger.org.<br />
[8] Stanev, T. High energy cosmic rays : with 19 tab., 2nd ed.; Springer-Praxis books in<br />
astrophysics and astronomy; Springer: Berlin, 2004.<br />
[9] Engel, R. Vorlesungsfolien: Astroteilchenphysik II - Kosmsiche Strahlung (WS 12/13).<br />
[10] Zwicky, F. Astrophysical Journal 1937, 86, 217.<br />
[11] Galactic Case for Dark Matter. http://www.learner.org/courses/physics/<br />
visual/visual.html?shortname=andromeda.<br />
[12] NASA/WMAP Science Team, The contents of the Universe as measured with WMAP<br />
and computed by NASA/WMAP Science team. http://en.wikipedia.org/wiki/<br />
File:080998_Universe_Content_240.jpg.<br />
[13] DESY, Supersymmetrische Partnerteilchen. http://www.weltderphysik.de/<br />
gebiete/theorie/jenseits-des-standardmodells/supersymmetrie/.<br />
[14] The Astronomist, Dark Matter Confronts Observations. http://theastronomist.<br />
fieldofscience.com/2010/05/dark-matter-confronts-observations.html.<br />
[15] Fermi LAT Collaboration, Phys. Rev. Lett. 2012, 108, 011103.<br />
[16] Blasi, P.; Amato, E. arXiv:1007.4745 2010.<br />
[17] The AMS Collaboration, AMS In A Nutshel. http://www.ams02.org/what-is-ams/<br />
ams-facts-figures/.<br />
[18] The AMS Collaboration, Private Kommunikation.<br />
[19] The AMS Collaboration, The TRD. http://www.ams02.org/what-is-ams/<br />
tecnology/trd/.<br />
75
76 Literaturverzeichnis<br />
[20] The AMS Collaboration, The Time-of-Flight. http://www.ams02.org/<br />
what-is-ams/tecnology/tof/.<br />
[21] CAPELL, M. In AMS on ISS - Construction of a particle physics detector on the<br />
International Space Station; The AMS Collaboration, 2004; Chapter 1.1 Construction<br />
of the AMS-01 magnet.<br />
[22] The AMS Collaboration, The Permanent Magnet. http://www.ams02.org/<br />
what-is-ams/tecnology/magnet/pmmagnet/.<br />
[23] The AMS Collaboration, Tracker Shifter Guide (I), Aug. 2011.<br />
[24] The AMS Collaboration, The Silicon Tracker. http://www.ams02.org/<br />
what-is-ams/tecnology/tracker/.<br />
[25] The AMS Collaboration, The Anti-Coincidence Counter. http://www.ams02.org/<br />
what-is-ams/tecnology/acc/.<br />
[26] Horvath, A. Cherenkov.svg (Creative Commons BY-SA). http://<br />
upload.wikimedia.org/wikipedia/commons/thumb/6/6b/Cherenkov.svg/<br />
378px-Cherenkov.svg.png.<br />
[27] The AMS Collaboration, The RICH. http://www.ams02.org/what-is-ams/<br />
tecnology/rich/.<br />
[28] The AMS Collaboration, The ECAL. http://www.ams02.org/what-is-ams/<br />
tecnology/ecal/.<br />
[29] CAPELL, M. In AMS on ISS - Construction of a particle physics detector on the<br />
International Space Station; The AMS Collaboration, 2004; Chapter 2.7 Electromagnetic<br />
Calorimeter (ECAL).<br />
[30] Paeng, Spiegelladung.svg (Creative Commons BY-SA). http://de.wikipedia.<br />
org/w/index.php?title=Datei:Spiegelladung.svg&page=1&filetimestamp=<br />
20081130200154.<br />
[31] Jackson, J. D. Klassische Elektrodynamik, 4th ed.; de Gruyter: Berlin [u.a.], 2006.<br />
[32] CAPEL, M. In AMS on ISS - Construction of a particle physics detector on the<br />
International Space Station; The AMS Collaboration, 2004; Chapter 2.2 Transition<br />
Radiation Detector (TRD).<br />
[33] Hattenbach, J. Gasverstaerkungsmessungen mit Proportionalkammern des AMS02-<br />
Uebergangsstrahlungsdetektors, 2004.<br />
[34] Grupen, C. Particle detectors, 1st ed.; Cambridge monographs on particle physics,<br />
nuclear physics, and cosmology ; 5; Univ. Press: Cambridge, 1996.<br />
[35] Leo, W. R. Techniques for nuclear and particle physics experiments : a how-to approach;<br />
Springer: Berlin, 1987.<br />
[36] The AMS Collaboration, THE NEW CERN POCC. http://www.ams02.org/2011/<br />
07/the-new-cern-pocc/.<br />
[37] Weng, Z. TRDKLikelihood (AMS TWiki - intern). https://twiki.cern.ch/twiki/<br />
bin/view/AMS/TRDKLikelihood.<br />
[38] Cowan, G. Statistical data analysis; Oxford science publications; Clarendon Press:<br />
Oxford, 1998.<br />
[39] Cowan, G. CERN Summer Student Lectures. Introduction to Statistical Methods for<br />
High Energy Physics, 2011.<br />
76
Literaturverzeichnis 77<br />
[40] Bishop, C. M. Neural networks for pattern recognition, Repr. ed.; Clarendon Pr.:<br />
Oxford, 1998.<br />
[41] The NeuroBayes Users Guide, April 06th, 2012. http://neurobayes.phi-t.de/<br />
index.php/public-information/documentation% relax.<br />
[42] Valerio Vagelli, Private Kommunikation.<br />
[43] TMVA - Toolkit for Multivariate Data Analysis, arXiv:physics/0703039, November<br />
03rd, 2009. http://tmva.sourceforge.net.<br />
[44] TEfficiency - a class to handle efficiency histograms, June 12th, 2012. http://root.<br />
cern.ch/root/html/TEfficiency.html.<br />
77
Abbildungsverzeichnis<br />
1.1. Entwicklung des Universums nach der Urknalltheorie [1]. . . . . . . . . . . . 2<br />
1.2. Foto des AMS-02 Detektor auf der Internationalen Raumstation [2]. . . . . 3<br />
2.1. Relative Häufigkeit der Elemente in der kosmischen Strahlung als Funktion<br />
ihrer Kernladungszahl Z bei einer Energie von 1 GeV pro Nukleon, normiert<br />
auf Si=100 [3]. Gezeigt ist außerdem die Häufigkeit der Elemente im<br />
Sonnensystem (graue Dreiecke). . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
2.2. Teilchenspektrum der kosmischen Strahlung mit der Energie [5]. Die Abbildung<br />
vereint Messergebnisse verschiedener Experimente deren Ergebnisse<br />
durch unterschiedliche Farben und Marker dargestellt werden. . . . . . . . . 7<br />
2.3. Skizze des HEAT Detektors (rechts), ausgerüstet mit Flugzeitmessung (TOF),<br />
Übergangsstrahlungsdetektor (TRD), Driftkammern (DTH) innerhalb eines<br />
Magneten und einem elektromagnetischen Kalorimeter (EC) und ein Foto<br />
des Detektors am Ballon in der Atmosphäre (links) [6]. . . . . . . . . . . . . 8<br />
2.4. Übersicht der Detektorverteilung mit eingezeichneten Sichtlinien der Fluoreszenz-<br />
Teleskope beim Pierre-Auger-Observatorium (links) und Rekonstruktion eines<br />
Ereignisses mit Bodenstationen und Fluoreszenz-Teleskopen (rechts) [7]. 8<br />
2.5. Beschleunigung kosmischer Teilchen an einer Schockfront. . . . . . . . . . . 9<br />
2.6. Rotationsgeschwindigkeit von Sternen einer Galaxie mit deren Orbitalradius<br />
(grün) sowie die Erwartung aus den Keplerschen Gesetzen (orange) [11]. . . 10<br />
2.7. Erwartete Verteilung von Materie und Energie im Universum nach dem<br />
Λ-CDM-Modell [12]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
2.8. Teilchen der minimalen supersymmetrischen Erweiterung des Standardmodells<br />
der Teilchenphysik [13]. . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />
2.9. Zerfallskette der Annihilation supersymmetrischer Neutralinos in Teilchen<br />
des Standardmodells der Teilchenphysik [14]. . . . . . . . . . . . . . . . . . 13<br />
2.10. Positronenanteil in der leptonischen Komponente der kosmischen Strahlung<br />
mit der Energie bis 100 GeV aus Messungen verschiedener Experimente [15]. 13<br />
3.1. Technische Zeichnung des AMS-02 Detektors mit Beschriftung der Subdetektoren<br />
[18]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />
3.2. Schematische Zeichnung einer TRD Lage aus 20 mm dickem Radiatorvlies<br />
und Proportionaldrahtkammerröhrchen zum Nachweis von Übergangsstrahlung<br />
[19]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />
3.3. Foto der oberen und unteren Lagen des Flugzeitdetektors vor dem Einbau<br />
[20]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />
3.4. Technische Zeichnung eines Szintillatorstreifens mit Beschriftung der Komponenten<br />
[20]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />
3.5. Der AMS-02 Permanentmagnet in der Seitenansicht (links) und das von ihm<br />
erzeugte Magnetfeld in der Draufsicht (rechts) [22]. . . . . . . . . . . . . . . 19<br />
3.6. Schematische Darstellung der Spurdetektorplatten (links) und Fotos vor<br />
deren Integration in den Detektor (rechts) [23]. . . . . . . . . . . . . . . . . 19<br />
79
80 Abbildungsverzeichnis<br />
3.7. Schematische Skizze von Aufbau und Funktionsweise eines doppelseitigen<br />
Silizium Streifensensors [24]. . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />
3.8. Ein seitlich einfallendes Teilchen, das vom ACC zurückgewiesen wird (links),<br />
ein Teilchen hoher Ladung, das Delta-Elektronen erzeugt (Mitte) sowie ein<br />
Backsplash Event (rechts), welche angenommen werden [25]. . . . . . . . . . 21<br />
3.9. Skizze zur Ausbreitung von Tscherenkow Strahlung [26]. . . . . . . . . . . . 21<br />
3.10. Skizze der Funktionsweise des RICH (links) und Foto der einzelnen Bestandteile<br />
vor dem Zusammenbauen (rechts) [27]. . . . . . . . . . . . . . . . . . . 22<br />
3.11. Anordnung von drei Superlayern in wechselnder x-y Ausrichtung (links) und<br />
Querschnitt eines Superlayers mit als Zelle gruppierten Szintillationsfasern<br />
(rechts) [29]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23<br />
3.12. Skizze des Kaloriemeters mit Abmessungen und Ausbreitung hadronischer<br />
(blau) und elektromagnetischer Schauer (rot). . . . . . . . . . . . . . . . . . 23<br />
3.13. Signaturen von Teilchen bei 300 GeV in den einzelnen Subdetektoren des<br />
AMS-02 Detektors [18]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />
3.14. Ereignismonitor eines Elektrons mit einer Rigidität von −92, 6 GV, aufgenommen<br />
am 04. Oktober 2012. . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />
3.15. Ereignismonitor eines Protons mit einer Rigidität von 83, 3 GV, aufgenommen<br />
am 04. Oktober 2012. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />
4.1. Spiegelladung einer positiven Ladung an einer Grenzfläche [30]. . . . . . . . 28<br />
4.2. Schematische Darstellung der Zusammensetzung des Wandmaterials für eine<br />
Proportionalkammerröhre (links) und Veranschaulichung des Fertigungsprozesses<br />
(rechts) [33]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />
4.3. Foto eines Moduls in der Draufsicht (oben) und der Querschnitt mittels<br />
Computertomographie (unten) [32]. . . . . . . . . . . . . . . . . . . . . . . . 29<br />
4.4. (a) Energieabhängigkeit des Massenabsorptionskoeffizienten µ in Blei Z Pb =<br />
82 und (b) Bereiche in denen Photoeffekt, Compton Effekt oder Paarbildung<br />
dominieren in Abhängigkeit der Kernladungszahl Z des Absorbers und der<br />
Photonenenergie [34]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />
4.5. Energieabgabe aller Teilchen im Energiebereich um 25 GeV in Lage 6 mit<br />
angepasster Landau-Verteilung im Ionisationsbereich (rot). . . . . . . . . . 31<br />
4.6. Darstellung des Gassystems bestehend aus der Box-S, der Box-C und dem<br />
Gaskreislauf des Hauptdetektors bestehend aus 41 Segmenten [32]. . . . . . 32<br />
4.7. Foto des AMS-02 POCC auf dem Gelände des CERN in Genf [36]. Die<br />
einzelnen Schichtpositionen sind in rot gekennzeichnet. Dabei ist ”Data”<br />
für die Überwachung der Datenübertragung von der ISS zum CERN, über<br />
einzelne Zwischenstationen zuständig. ”LEAD” dient als Schichtleitung und<br />
ist Schnittstelle für die Kommunikation mit der NASA. ”PM” ist für Ecal,<br />
RICH und TOF verantwortlich, ”TEE” überwacht Spurdetektor, ACC und<br />
TRD. ”Thermal” kontrolliert die Temperatursituation im gesamten Detektor,<br />
welche stark mit dem Winkel des Detektors zur Sonne korreliert und<br />
kann gegebenenfalls nach Rücksprache mit der Schichtleitung Heizungen<br />
zu- und abschalten, oder die NASA bitten die Position der Solarpanele oder<br />
Radiatoren der ISS so zu verändern, dass diese entweder Schatten spenden,<br />
oder Zufuhr von Sonnenlicht ermöglichen. Außerdem befindet sich im POCC<br />
noch eine Position für das Offline Computing, die im Bild nicht eingefangen<br />
wurde und wo die Ereignisrekonstruktion überwacht wird. . . . . . . . . . . 33<br />
80
Abbildungsverzeichnis 81<br />
4.8. Bildschirmfoto des Programms zur Ermittlung des Korrekturwertes zur<br />
Hochspannungsanpassung. Aufgetragen ist der wahrscheinlichste Wert der<br />
deponierten Energie über einen Zeitraum (hier zwei Wochen). Der Wert<br />
schwankt um etwa 60 ADC, wobei ein etwa linearer Anstieg mittels Hochspannungsanpassungen<br />
kompensiert wird. In rot ist eine lineare Anpassung<br />
an die Daten zu sehen, die vom Programm ausgegeben wird und den Korrekturwert<br />
bestimmt (hier −3 V). . . . . . . . . . . . . . . . . . . . . . . . . 34<br />
4.9. Auftragung der Verschiebung dx in x-Richtung von Lage 4, 10 und 14 auf<br />
langer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 30 Tage. . . . 35<br />
4.10. Auftragung der Verschiebung des gesamten Detektors dx in x-Richtung auf<br />
kurzer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 2 Stunden. . . 35<br />
4.11. Auf eins normiertes Spektrum der Energieabgabe von Elektronen (blau)<br />
und Protonen (rot) im Energiebereich um 25 GeV in Lage 6. . . . . . . . . 36<br />
4.12. Auf eins normiertes Spektrum des Mittelwertes der Energieabgabe in den 20<br />
Detektorlagen von Elektronen (blau) und Protonen (rot) im Energiebereich<br />
um 25 GeV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />
5.1. Beispiel von Populationen H 0 und H 1 im zweidimensionalen Parameterraum<br />
der Variablen x 1 und x 2 , getrennt durch eine lineare Entscheidungsgrenze<br />
(dunkelrot) [39]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />
5.2. Wahrscheinlichkeitsdichteverteilungen für die Hypothesen H 0 und H 1 einer<br />
eindimensionalen Test-Statistik t(x) mit Einteilung in eine Annahme- und<br />
eine Verwurfsregion, getrennt durch die Entscheidungsgrenze t cut [38]. . . . 39<br />
5.3. Verteilung des Likelihoodverhältnis gegeben durch TrdQt und TrdK von<br />
Protonen und Leptonen aus Flugdaten, selektiert durch das elektromagnetsiche<br />
Kalorimeter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />
5.4. Darstellung von Gleichung 5.11 als Netzwerkdiagramm. . . . . . . . . . . . 41<br />
5.5. Zeichnung der Sigmoid Funktion nach Formel 5.12. . . . . . . . . . . . . . . 42<br />
5.6. Beispiel nicht einfacher, durch eine Hyperebene linear separierbarer, Populationen<br />
H 0 und H 1 im zweidimensionalen Parameterraum der Variablen x 1<br />
und x 2 [39]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />
5.7. Multi Layer Perzeptron mit einer versteckten Lage. . . . . . . . . . . . . . . 43<br />
5.8. Separationsgrenzen für zwei Populationen im zweidimensionalen Parameterraum<br />
von x 1 und x 2 mit guter Generalisierungsfähigkeit (links) und nach<br />
Overtraining (mitte). Rechts ist das Verhalten der Fehlerfunktion im Falle<br />
von Overtraining dargestellt [39]. . . . . . . . . . . . . . . . . . . . . . . . . 45<br />
6.1. Schematische Skizze zur Vorgehensweise zum Trainieren eines neuronalen<br />
Netzwerkes mit Flugdaten [42]. . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />
6.2. Effizienz der angewandten Bedingungen bezüglich des vorangegangen Schnittes.<br />
Die Beschreibungen der einzelnen Schnitte sind im Text zu finden. . . . 49<br />
6.3. Verbleibender Anteil des Triggersamples nach jeder der angewandten Bedingungen.<br />
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />
6.4. Schematische Darstellung eines Entscheidungsbaumes, der Ereignisse mit<br />
Paramtern x in Signal S und Untergrund B anhand von Einzelentscheidungen,<br />
einteilt (links) [43] und Ausgabe des BDT in der AMS Software<br />
für Leptonen und Protonen, selektiert mit dem TrdQt Likelihoodverhältnis<br />
(rechts). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51<br />
6.5. Verteilung der EoverP Variable, die das Verhältnis von im Kalorimeter<br />
deponierter- zur Gesamtenergie eines Teilchens gibt. . . . . . . . . . . . . . 52<br />
81
82 Abbildungsverzeichnis<br />
6.6. Energieabgabe in Lage 6 über der Rigidität bis 300 GV für Protonen (links)<br />
und Elektronen (rechts). In schwarz ist die durchschnittliche Energieabgabe<br />
gezeigt (zut Interpretation sollte die logarithmisch gezeichnete y-Achse<br />
beachtet werden. Die Energieabgabe über 10 2 ADC stellt also einen signifikanten<br />
Anteil des Mittelwertes dar). . . . . . . . . . . . . . . . . . . . . . . 53<br />
6.7. Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration<br />
der Eingangsvariablen gegen die Signaleffizienz. . . . . . . . . . . . . . 54<br />
6.8. Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration<br />
der Eingangsvariablen mit der Rigidität des Teilchens. . . . . . . . . . 54<br />
6.9. Relativistische Geschwindigkeit über der Rigidität bis 300 GV für Protonen<br />
(links) und Elektronen (rechts). In schwarz ist die der Verlauf des Durchschnitts<br />
gezeigt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />
6.10. Protonenunterdrückung neuronaler Netze, trainiert in unterschiedlichen Energiebereichen.<br />
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />
6.11. Durchschnittliche Energieabgabe von Protonen (rot) und Leptonen (dunkelblau)<br />
in den 20 Lagen des Übergangsstrahlungsdetektors mit angedeutetem<br />
Schnitt auf das Protonensample für die Trainingsauswahl. . . . . . . . . . . 56<br />
6.12. Verteilung der Ausgabewerte des neuronalen Netzwerkes für das Trainingsund<br />
das Testsample aufgeteilt nach Signal und Untergrundereignissen (oben).<br />
Darunter sind die Residuen der Verteilungen dargestellt. . . . . . . . . . . . 58<br />
6.13. Verteilung der Ausgabewerte von Protonen (links) und Elektronen (rechts)<br />
nach einer Trainingsiteration mit Gewichtsfunktion (grün). . . . . . . . . . 59<br />
6.14. Vergleich des verstärkten neuronalen Netzwerkes mit dem unverstärkten im<br />
Bereich von 2 − 5 GV (links) und 5 − 300 GV (rechts). . . . . . . . . . . . . 59<br />
6.15. Verteilung der Ausgabewerte des neuronalen Netzwerks und deren Interpretation.<br />
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60<br />
7.1. Protonenunterdrückung mit der Signaleffizienz des neuronalen Netzwerks<br />
(dunkelblau), sowie des TrdQt- (rot) und des TrdK-Likelihoodverhältnisses<br />
(blau). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />
7.2. Protonenunterdrückung mit Rigidität im Bereich 5−300 GV für das neuronale<br />
Netzwerks (schwarz), sowie für das TrdQt- (rot) und TrdK-Likelihoodverhältnis<br />
(blau). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />
7.3. Übereinstimmung der Auswahl von Elektronen bei 90% Signaleffizienz durch<br />
die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />
Netzwerk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65<br />
7.4. Verteilung des BDT Ausgabewertes der Protonenschablone (links) und der<br />
Elektronenschablone (rechts), selektiert mit dem Übergangsstrahlungsdetektor.<br />
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />
7.5. Verteilung des BDT Ausgabewertes einer Auswahl von Positronen mit dem<br />
neuronalen Netzwerk bei einer Elektronen Effizienz von 90% im Rigiditätsbereich<br />
7, 96 − 10, 05 GV (links) und Anpassung der Schablonen an dies<br />
Positronenauswahl (rechts). . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />
7.6. Schematische Darstellung der Verteilung des Entscheidungsbaumes in der<br />
Region der minimal ionisierenden Teilchen in der Longitudinalen und Lateralen<br />
Schauerausbreitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />
7.7. Reinheit der Positronenauswahl mit der Effizienz auf die Positronenselektion. 68<br />
7.8. Entscheidungsgrenzen am Arbeitspunkt mit der Rigidität (links) und Signaleffizienz<br />
bei diesen Entscheidungsgrenzen mit der Rigidität (rechts). . . 68<br />
7.9. Reinheit der Positronenauswahl mit der Rigidität. . . . . . . . . . . . . . . 69<br />
82
Abbildungsverzeichnis 83<br />
7.10. Übereinstimmung der Auswahl von Elektronen am Arbeitspunkt durch die<br />
Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />
Netzwerk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />
7.11. Übereinstimmung der Auswahl von Positronen am Arbeitspunkt durch die<br />
Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />
Netzwerk gewichtet mit der Reinheit. . . . . . . . . . . . . . . . . . . . . . . 70<br />
7.12. Positronenauswahl der Separationsmethoden mit der Rigidität. . . . . . . . 71<br />
83
Anhang<br />
A. Ausschnitt der Analysedatei für das neuronale Netzwerk<br />
im Rigiditätsbereich 2 − 5 GV<br />
Es sind jeweils die drei Variablen dargestellt, die zur Separation im neuronalen Netzwerk<br />
den größten und den geringsten Beitrag liefern. Außerdem ist die Korrelationsmatrix<br />
zwischen den Eingangsvariablen und dem Zielwert dargestellt. Die Nummerierung der Variablen<br />
bedeutet:<br />
1: Zielwert<br />
2-21: Energieabgabe in Lage 1-20 in aufsteigender Reihenfolge, beginnend mit der Untersten<br />
Lage.<br />
22: Teildruck des Xenongases<br />
23: Relativistische Geschwindigkeit<br />
24: Einfallswinkel zur z-Achse im Übergangsstrahlungsdetektor<br />
85
A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 23 : BetaH<br />
1st most important<br />
added signi. 855.24<br />
signi. loss 260.94<br />
PrePro: 14<br />
only this 855.24<br />
corr. to others 38.10%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
35000<br />
30000<br />
25000<br />
20000<br />
15000<br />
10000<br />
5000<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
1.399437<br />
1.100351<br />
1.078029<br />
1.065192<br />
1.056015<br />
1.048733<br />
1.04268<br />
1.037391<br />
1.032703<br />
1.02845<br />
1.024516<br />
1.020873<br />
1.017451<br />
1.014212<br />
1.011099<br />
1.008133<br />
1.005258<br />
1.002483<br />
0.9997801<br />
0.9971423<br />
0.9945523<br />
0.9919873<br />
0.9894633<br />
0.9869387<br />
0.9844563<br />
0.9819705<br />
0.9794869<br />
0.9769875<br />
0.9744718<br />
0.9719208<br />
0.9693583<br />
0.9667521<br />
0.9640802<br />
0.9613398<br />
0.9585309<br />
0.9556495<br />
0.9526754<br />
0.9495729<br />
0.9463084<br />
0.9428559<br />
0.9392083<br />
0.935312<br />
0.9310813<br />
0.9264022<br />
0.921209<br />
0.9152441<br />
0.9081725<br />
0.8993907<br />
0.8872931<br />
0.8662445<br />
0.6000374<br />
1<br />
spline fit<br />
purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
10 20 30 40 50 60 70 80 90 100<br />
bin #<br />
events<br />
120<br />
100<br />
80<br />
60<br />
40<br />
3<br />
× 10<br />
background<br />
Underflow 0<br />
Overflow 0<br />
signal<br />
Underflow 0<br />
Overflow 0<br />
final<br />
20<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
86
A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 2 : trdCorrPLCalibAmp_01<br />
2nd most important<br />
added signi. 563.36<br />
signi. loss 192.35<br />
PrePro: 34<br />
only this 698.85<br />
corr. to others 31.90%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
25000<br />
20000<br />
15000<br />
10000<br />
5000<br />
433859<br />
+ δ<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
5187.892<br />
1369.59<br />
1107.222<br />
951.8484<br />
840.4878<br />
753.5143<br />
681.5417<br />
620.3561<br />
567.4154<br />
520.2942<br />
478.3508<br />
440.5281<br />
405.674<br />
372.9406<br />
341.6276<br />
311.5186<br />
281.8334<br />
254.0245<br />
228.958<br />
207.7957<br />
190.2112<br />
175.4075<br />
162.7582<br />
151.6648<br />
141.8791<br />
133.1637<br />
125.1968<br />
117.9706<br />
111.3237<br />
105.1213<br />
99.31538<br />
93.79573<br />
88.63403<br />
83.70804<br />
78.97566<br />
74.42928<br />
70.05956<br />
65.87531<br />
61.7957<br />
57.86063<br />
54.03711<br />
50.28083<br />
46.58661<br />
42.90292<br />
39.21753<br />
35.436<br />
31.50442<br />
27.23672<br />
22.45378<br />
16.64294<br />
5.467211<br />
purity<br />
1.1<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0 20 40 60 80 100<br />
bin #<br />
spline fit<br />
events<br />
250<br />
200<br />
150<br />
100<br />
3<br />
× 10<br />
background<br />
Underflow 0<br />
Overflow 0<br />
signal<br />
Underflow 0<br />
Overflow 0<br />
final<br />
50<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
87
A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 6 : trdCorrPLCalibAmp_05<br />
3rd most important<br />
added signi. 502.87<br />
signi. loss 188.62<br />
PrePro: 34<br />
only this 696.97<br />
corr. to others 32.00%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
25000<br />
20000<br />
15000<br />
10000<br />
5000<br />
481483<br />
+ δ<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
5056.227<br />
1357.681<br />
1100.936<br />
949.5911<br />
840.5353<br />
754.5347<br />
683.9365<br />
623.5177<br />
570.6536<br />
523.9442<br />
482.403<br />
444.761<br />
410.1113<br />
377.554<br />
346.3172<br />
315.8091<br />
286.0721<br />
257.5736<br />
232.4112<br />
210.7303<br />
192.6581<br />
177.4841<br />
164.5917<br />
153.379<br />
143.4881<br />
134.6227<br />
126.5669<br />
119.2384<br />
112.4591<br />
106.2098<br />
100.3631<br />
94.83015<br />
89.54459<br />
84.51933<br />
79.76627<br />
75.23732<br />
70.81435<br />
66.58655<br />
62.49566<br />
58.517<br />
54.67928<br />
50.93496<br />
47.24749<br />
43.57888<br />
39.82298<br />
35.9854<br />
31.96201<br />
27.63112<br />
22.73946<br />
16.73352<br />
4.349168<br />
purity<br />
1.1<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0 20 40 60 80 100<br />
bin #<br />
spline fit<br />
events<br />
300<br />
250<br />
200<br />
150<br />
100<br />
3<br />
× 10<br />
background<br />
Underflow 0<br />
Overflow 0<br />
signal<br />
Underflow 0<br />
Overflow 0<br />
final<br />
50<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
88
A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 21 : trdCorrPLCalibAmp_20<br />
21st most important<br />
added signi. 135.84<br />
signi. loss 136.01<br />
PrePro: 34<br />
only this 555.83<br />
corr. to others 26.20%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
24000<br />
22000<br />
20000<br />
18000<br />
16000<br />
14000<br />
12000<br />
10000<br />
8000<br />
6000<br />
4000<br />
2000<br />
0<br />
868342<br />
+ δ<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
6041.599<br />
1110.968<br />
865.7998<br />
732.9839<br />
643.5043<br />
575.6859<br />
521.3511<br />
476.4004<br />
438.2697<br />
404.3527<br />
373.5493<br />
344.5736<br />
317.0714<br />
290.3966<br />
264.9343<br />
241.6966<br />
221.2569<br />
203.5454<br />
188.453<br />
175.5161<br />
164.1541<br />
154.1823<br />
145.2344<br />
137.1628<br />
129.7391<br />
122.9339<br />
116.6403<br />
110.6698<br />
105.0707<br />
99.77618<br />
94.72484<br />
89.92406<br />
85.32338<br />
80.89519<br />
76.62537<br />
72.5141<br />
68.51025<br />
64.6149<br />
60.80059<br />
57.07046<br />
53.44294<br />
49.83293<br />
46.24947<br />
42.66248<br />
39.02958<br />
35.25742<br />
31.31008<br />
26.96108<br />
22.02558<br />
15.94596<br />
4.718814<br />
purity<br />
1.1<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0 20 40 60 80 100<br />
bin #<br />
spline fit<br />
500<br />
400<br />
3<br />
× 10<br />
background<br />
Underflow 0<br />
Overflow 0<br />
signal<br />
Underflow 0<br />
Overflow 0<br />
final<br />
events<br />
300<br />
200<br />
100<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
89
A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 24 : TrdTheta<br />
22nd most important<br />
added signi. 53.53<br />
signi. loss 53.53<br />
PrePro: 14<br />
only this 74.66<br />
corr. to others 1.90%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
22000<br />
20000<br />
18000<br />
16000<br />
14000<br />
12000<br />
10000<br />
8000<br />
6000<br />
4000<br />
2000<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
0.4617698<br />
0.3705839<br />
0.3518855<br />
0.3382589<br />
0.3270903<br />
0.3172321<br />
0.3083608<br />
0.3001441<br />
0.2923863<br />
0.2850505<br />
0.2780822<br />
0.2713964<br />
0.2649222<br />
0.258674<br />
0.2525556<br />
0.2465838<br />
0.2407531<br />
0.2350209<br />
0.2293701<br />
0.2237482<br />
0.2182046<br />
0.2127205<br />
0.2073456<br />
0.202138<br />
0.196957<br />
0.1918237<br />
0.186721<br />
0.181664<br />
0.1765808<br />
0.1715089<br />
0.1664513<br />
0.1613503<br />
0.1562231<br />
0.1510617<br />
0.1458857<br />
0.1406432<br />
0.1352804<br />
0.1298138<br />
0.1242574<br />
0.1185254<br />
0.1126188<br />
0.1064881<br />
0.1001931<br />
0.0936<br />
0.0865<br />
0.079<br />
0.0707<br />
0.0614<br />
0.0505<br />
0.0363<br />
0.000133<br />
purity<br />
0.75<br />
0.7<br />
0.65<br />
0.6<br />
0.55<br />
0.5<br />
0.45<br />
0.4<br />
10 20 30 40 50 60 70 80 90 100<br />
bin #<br />
spline fit<br />
events<br />
10<br />
180<br />
160<br />
140<br />
120<br />
100<br />
80<br />
60<br />
40<br />
× 3<br />
background<br />
Underflow<br />
1.623e+04<br />
Overflow 0<br />
signal<br />
Underflow 1.817e+04<br />
Overflow 0<br />
20<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
final<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
90
A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 22 : XePressure<br />
23rd most important<br />
added signi. 8.25<br />
signi. loss 8.25<br />
PrePro: 14<br />
only this 74.89<br />
corr. to others 4.20%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
25000<br />
20000<br />
events<br />
15000<br />
10000<br />
5000<br />
flat<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
957.5226<br />
927.3995<br />
908.1777<br />
881.1694<br />
870.1697<br />
860.6412<br />
853.0984<br />
848.3617<br />
843.8889<br />
840.176<br />
836.9884<br />
833.843<br />
829.9792<br />
826.9833<br />
823.6919<br />
820.6704<br />
817.0032<br />
814.1653<br />
811.0883<br />
808.6268<br />
805.8223<br />
802.9522<br />
800.0515<br />
797.2932<br />
794.8823<br />
792.7988<br />
790.7637<br />
788.5785<br />
786.1142<br />
783.6104<br />
780.2161<br />
776.8483<br />
772.6436<br />
769.4099<br />
766.3697<br />
763.0281<br />
759.647<br />
756.3378<br />
752.5549<br />
748.6431<br />
744.7544<br />
738.3484<br />
733.9265<br />
728.7922<br />
725.6871<br />
721.8424<br />
716.218<br />
711.0453<br />
705.0251<br />
693.4141<br />
673.8303<br />
purity<br />
0.8<br />
0.75<br />
0.7<br />
0.65<br />
0.6<br />
0.55<br />
0.5<br />
0.45<br />
0.4<br />
10 20 30 40 50 60 70 80 90 100<br />
bin #<br />
spline fit<br />
events<br />
250<br />
200<br />
150<br />
100<br />
3<br />
× 10<br />
background<br />
Underflow 0<br />
Overflow 0<br />
signal<br />
Underflow 0<br />
Overflow 0<br />
final<br />
50<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
91
A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
correlation matrix of input variables<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
10<br />
11<br />
12<br />
13<br />
14<br />
15<br />
16<br />
17<br />
18<br />
19<br />
20<br />
21<br />
22<br />
23<br />
24<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
10<br />
11<br />
12<br />
13<br />
14<br />
15<br />
16<br />
17<br />
18<br />
19<br />
20<br />
21<br />
22<br />
23<br />
24<br />
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />
92
B. Ausschnitt der Analysedatei für das neuronale Netzwerk im Rigiditätsbereich 5 − 300<br />
GV 93<br />
B. Ausschnitt der Analysedatei für das neuronale Netzwerk<br />
im Rigiditätsbereich 5 − 300 GV<br />
Es sind jeweils die drei Variablen dargestellt, die zur Separation im neuronalen Netzwerk<br />
den größten und den geringsten Beitrag liefern. Außerdem ist die Korrelationsmatrix<br />
zwischen den Eingangsvariablen und dem Zielwert dargestellt. Die Nummerierung der Variablen<br />
bedeutet:<br />
1: Zielwert<br />
2-21: Energieabgabe in Lage 1-20 in aufsteigender Reihenfolge, beginnend mit der Untersten<br />
Lage.<br />
22: Rigidität<br />
23: Teildruck des Xenongases<br />
24: Einfallswinkel zur z-Achse im Übergangsstrahlungsdetektor<br />
93
B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 3 : trdCorrPLCalibAmp_02<br />
1st most important<br />
added signi. 711.54<br />
signi. loss 206.57<br />
PrePro: 34<br />
only this 711.54<br />
corr. to others 30.70%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
30000<br />
25000<br />
20000<br />
15000<br />
10000<br />
5000<br />
0<br />
348809<br />
+ δ<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
4914.171<br />
1039.354<br />
768.8289<br />
615.7069<br />
510.048<br />
432.72<br />
372.9626<br />
323.4832<br />
281.9772<br />
247.8554<br />
221.2952<br />
200.6322<br />
184.2086<br />
170.7083<br />
159.3502<br />
149.6192<br />
141.0025<br />
133.4103<br />
126.5006<br />
120.2507<br />
114.5081<br />
109.1841<br />
104.2368<br />
99.5844<br />
95.19666<br />
91.05158<br />
87.08572<br />
83.30116<br />
79.68558<br />
76.23055<br />
72.90968<br />
69.6701<br />
66.57407<br />
63.55056<br />
60.63733<br />
57.79167<br />
55.03362<br />
52.34347<br />
49.67154<br />
47.04086<br />
44.4186<br />
41.78348<br />
39.10942<br />
36.37815<br />
33.57457<br />
30.62705<br />
27.48236<br />
24.04369<br />
20.0779<br />
15.26057<br />
5.517467<br />
purity<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
0 20 40 60 80 100<br />
bin #<br />
spline fit<br />
events<br />
450<br />
400<br />
350<br />
300<br />
250<br />
200<br />
150<br />
100<br />
3<br />
× 10<br />
background<br />
Underflow 0<br />
Overflow<br />
3.32e+04<br />
signal<br />
Underflow 0<br />
Overflow<br />
5.328e+04<br />
50<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
final<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
94
B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 7 : trdCorrPLCalibAmp_06<br />
2nd most important<br />
added signi. 621.71<br />
signi. loss 204.95<br />
PrePro: 34<br />
only this 709.51<br />
corr. to others 30.70%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
30000<br />
25000<br />
20000<br />
15000<br />
10000<br />
5000<br />
353046<br />
+ δ<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
5184.061<br />
1034.124<br />
767.7705<br />
616.8388<br />
512.5553<br />
435.3591<br />
375.2073<br />
325.7245<br />
283.7613<br />
249.8716<br />
223.1833<br />
202.3612<br />
185.8178<br />
172.3129<br />
160.84<br />
151.0179<br />
142.3509<br />
134.6774<br />
127.7773<br />
121.449<br />
115.6295<br />
110.2467<br />
105.2585<br />
100.5728<br />
96.14638<br />
91.94565<br />
87.96183<br />
84.14177<br />
80.50351<br />
77.00533<br />
73.6557<br />
70.40901<br />
67.27305<br />
64.23938<br />
61.27406<br />
58.42184<br />
55.61806<br />
52.90528<br />
50.20462<br />
47.53442<br />
44.90078<br />
42.25595<br />
39.5536<br />
36.81123<br />
33.97744<br />
30.97629<br />
27.76586<br />
24.23906<br />
20.2081<br />
15.2593<br />
5.188988<br />
purity<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
0 20 40 60 80 100<br />
bin #<br />
spline fit<br />
events<br />
350<br />
300<br />
250<br />
200<br />
150<br />
100<br />
50<br />
3<br />
× 10<br />
background<br />
Underflow 0<br />
Overflow<br />
3.332e+04<br />
signal<br />
Underflow 0<br />
Overflow<br />
5.299e+04<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
final<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
95
B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 6 : trdCorrPLCalibAmp_05<br />
3rd most important<br />
added signi. 552.53<br />
signi. loss 205.50<br />
PrePro: 34<br />
only this 710.04<br />
corr. to others 30.70%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
30000<br />
25000<br />
20000<br />
15000<br />
10000<br />
5000<br />
337762<br />
+ δ<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
4819.777<br />
1035.006<br />
769.8124<br />
618.1377<br />
513.5813<br />
436.2079<br />
375.774<br />
325.9545<br />
284.0431<br />
249.7908<br />
223.0231<br />
202.3457<br />
185.729<br />
172.097<br />
160.6341<br />
150.7854<br />
142.0866<br />
134.4162<br />
127.4888<br />
121.2172<br />
115.458<br />
110.0854<br />
105.1045<br />
100.4109<br />
96.00632<br />
91.82274<br />
87.84129<br />
84.02768<br />
80.39516<br />
76.89474<br />
73.52493<br />
70.28131<br />
67.13827<br />
64.08839<br />
61.14251<br />
58.2922<br />
55.49753<br />
52.76738<br />
50.09917<br />
47.44595<br />
44.82158<br />
42.19268<br />
39.50712<br />
36.7534<br />
33.9009<br />
30.90087<br />
27.72095<br />
24.1898<br />
20.19525<br />
15.2736<br />
5.899064<br />
purity<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
0 20 40 60 80 100<br />
bin #<br />
spline fit<br />
events<br />
350<br />
300<br />
250<br />
200<br />
150<br />
100<br />
50<br />
3<br />
× 10<br />
background<br />
Underflow 0<br />
Overflow<br />
3.156e+04<br />
signal<br />
Underflow 0<br />
Overflow<br />
5.016e+04<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
final<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
96
B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 22 : Rabs<br />
21st most important<br />
added signi. 126.74<br />
signi. loss 126.77<br />
PrePro: 14<br />
only this 523.23<br />
corr. to others 23.80%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
35000<br />
30000<br />
25000<br />
20000<br />
15000<br />
10000<br />
5000<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
299.9975<br />
91.78024<br />
62.51433<br />
49.27654<br />
41.41805<br />
36.13225<br />
32.28812<br />
29.29262<br />
26.88197<br />
24.87893<br />
23.15389<br />
21.63084<br />
20.28647<br />
19.0916<br />
18.0127<br />
17.0347<br />
16.13735<br />
15.32545<br />
14.58312<br />
13.90427<br />
13.28219<br />
12.70855<br />
12.18237<br />
11.6901<br />
11.23266<br />
10.80431<br />
10.40385<br />
10.0287<br />
9.673396<br />
9.338589<br />
9.026165<br />
8.728868<br />
8.446316<br />
8.179838<br />
7.926431<br />
7.684944<br />
7.455448<br />
7.232958<br />
7.021305<br />
6.818047<br />
6.622366<br />
6.434406<br />
6.253811<br />
6.078671<br />
5.909512<br />
5.745498<br />
5.58785<br />
5.434582<br />
5.284349<br />
5.140067<br />
5.000001<br />
0.4<br />
spline fit<br />
purity<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
10 20 30 40 50 60 70 80 90 100<br />
bin #<br />
events<br />
3<br />
× 10<br />
background<br />
200<br />
Underflow 0<br />
Overflow 0<br />
180<br />
signal<br />
160<br />
Underflow 0<br />
Overflow 0<br />
140<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
final<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
97
B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 23 : XePressure<br />
22nd most important<br />
added signi. 23.82<br />
signi. loss 23.82<br />
PrePro: 14<br />
only this 42.37<br />
corr. to others 1.20%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
30000<br />
25000<br />
20000<br />
15000<br />
10000<br />
5000<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
957.5234<br />
925.3198<br />
904.099<br />
876.9962<br />
864.222<br />
857.3082<br />
850.7179<br />
846.3821<br />
842.7605<br />
839.2656<br />
836.2207<br />
833.2805<br />
829.7496<br />
826.4435<br />
823.3109<br />
820.3891<br />
816.8484<br />
814.0654<br />
811.2056<br />
808.8173<br />
805.9642<br />
803.1381<br />
800.3605<br />
797.9133<br />
795.5087<br />
793.2348<br />
791.2104<br />
789.2292<br />
787.0731<br />
784.6501<br />
781.5228<br />
778.5696<br />
774.0419<br />
771.1307<br />
768.0739<br />
765.0428<br />
761.407<br />
757.829<br />
754.4852<br />
750.592<br />
746.7178<br />
741.9993<br />
736.1835<br />
730.6431<br />
726.8955<br />
723.1272<br />
717.9636<br />
712.0719<br />
705.8931<br />
695.4951<br />
673.8303<br />
purity<br />
0.26<br />
0.24<br />
0.22<br />
0.2<br />
0.18<br />
0.16<br />
0.14<br />
0.12<br />
0.1<br />
10 20 30 40 50 60 70 80 90 100<br />
bin #<br />
spline fit<br />
events<br />
3<br />
× 10<br />
background<br />
200<br />
Underflow 0<br />
180<br />
Overflow<br />
signal<br />
2.693e+04<br />
160<br />
Underflow 0<br />
Overflow 6738<br />
140<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
final<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
98
B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
Input node 24 : TrdTheta<br />
23rd most important<br />
added signi. 12.77<br />
signi. loss 12.77<br />
PrePro: 14<br />
only this 34.79<br />
corr. to others 1.60%<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
events<br />
30000<br />
25000<br />
20000<br />
15000<br />
10000<br />
5000<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
flat<br />
0.3354059<br />
0.2687234<br />
0.2543075<br />
0.2440088<br />
0.2357388<br />
0.2286777<br />
0.2223225<br />
0.2165484<br />
0.211204<br />
0.206202<br />
0.2014383<br />
0.1968907<br />
0.192484<br />
0.1882222<br />
0.1841263<br />
0.1801225<br />
0.1761906<br />
0.1723429<br />
0.1685615<br />
0.1648228<br />
0.161126<br />
0.1575091<br />
0.15388<br />
0.1503039<br />
0.1467278<br />
0.1431729<br />
0.1396151<br />
0.136053<br />
0.1325064<br />
0.1289332<br />
0.1253528<br />
0.1217531<br />
0.1180875<br />
0.1144042<br />
0.1106882<br />
0.1069056<br />
0.1030646<br />
0.0991368<br />
0.0951<br />
0.091<br />
0.0867<br />
0.0822<br />
0.0775<br />
0.0725<br />
0.0672<br />
0.0615<br />
0.0552<br />
0.0481<br />
0.0396<br />
0.0284<br />
0.000119<br />
0.22<br />
0.2<br />
spline fit<br />
purity<br />
0.18<br />
0.16<br />
0.14<br />
0.12<br />
10 20 30 40 50 60 70 80 90 100<br />
bin #<br />
events<br />
140<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
3<br />
× 10<br />
background<br />
Underflow 0<br />
Overflow 0<br />
signal<br />
Underflow 0<br />
Overflow 0<br />
0<br />
-3 -2 -1 0 1 2 3<br />
final netinput<br />
final<br />
1<br />
separation<br />
signal purity<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />
signal efficiency<br />
99
B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />
correlation matrix of input variables<br />
Phi-T<br />
®<br />
NeuroBayes<br />
Teacher<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
10<br />
11<br />
12<br />
13<br />
14<br />
15<br />
16<br />
17<br />
18<br />
19<br />
20<br />
21<br />
22<br />
23<br />
24<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
10<br />
11<br />
12<br />
13<br />
14<br />
15<br />
16<br />
17<br />
18<br />
19<br />
20<br />
21<br />
22<br />
23<br />
24<br />
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />
100