18.01.2014 Aufrufe

IEKP-KA/2013-8 - Institut für Experimentelle Kernphysik - KIT

IEKP-KA/2013-8 - Institut für Experimentelle Kernphysik - KIT

IEKP-KA/2013-8 - Institut für Experimentelle Kernphysik - KIT

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>IEKP</strong>-<strong>KA</strong>/<strong>2013</strong>-8<br />

Positronen Identifizierung<br />

mit dem AMS-02 Detektor<br />

auf der<br />

Internationalen Raumstation<br />

Diplomarbeit<br />

von<br />

Stefan Zeißler<br />

An der Fakultät für Physik<br />

<strong>Institut</strong> für experimentelle <strong>Kernphysik</strong><br />

(<strong>IEKP</strong>)<br />

Erstgutachter:<br />

Zweitgutachter:<br />

Prof. Dr. Wim de Boer<br />

Prof. Dr. Günter Quast<br />

Bearbeitungszeit: 29. Februar 2012 – 28. Februar <strong>2013</strong><br />

<strong>KIT</strong> – Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft<br />

www.kit.edu


Ich versichere wahrheitsgemäß, die Arbeit selbstständig angefertigt, alle benutzten Hilfsmittel<br />

vollständig und genau angegeben und alles kenntlich gemacht zu haben, was aus<br />

Arbeiten anderer unverändert oder mit Abänderungen entnommen wurde.<br />

Karlsruhe, 28. Februar <strong>2013</strong><br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<br />

(Stefan Zeißler)


Inhaltsverzeichnis<br />

1. Einleitung 1<br />

2. Physikalischer Hintergrund 5<br />

2.1. Kosmische Strahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />

2.2. Quellen Kosmischer Strahlung . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

2.3. Dunkle Materie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />

2.3.1. Kandidaten für Dunkle Materie . . . . . . . . . . . . . . . . . . . . . 11<br />

2.3.2. Suche nach Dunkler Materie . . . . . . . . . . . . . . . . . . . . . . . 12<br />

2.4. Der Positronanteil in der leptonischen Komponente der kosmischen Strahlung 12<br />

3. Der AMS-02 Detektor 15<br />

3.1. Der Übergangsstrahlungsdetektor (TRD) . . . . . . . . . . . . . . . . . . . 16<br />

3.2. Der Flugzeitdetektor (TOF) . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />

3.3. Der Permanentmagnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

3.4. Der Silizium Spurdetektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

3.5. Der Antikoinzidenz Zähler (ACC) . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

3.6. Der Ring abbildende Tscherenkow Detektor (RICH) . . . . . . . . . . . . . 21<br />

3.7. Das elektromagnetische Kalorimeter (ECAL) . . . . . . . . . . . . . . . . . 22<br />

3.8. Teilchensignaturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

4. Der Übergangsstrahlungsdetektor 27<br />

4.1. Entstehung von Übergangsstrahlung . . . . . . . . . . . . . . . . . . . . . . 27<br />

4.2. Aufbau des Detektors und Messung von Übergangsstrahlung . . . . . . . . 28<br />

4.3. Gassystem und Betrieb auf der ISS . . . . . . . . . . . . . . . . . . . . . . . 30<br />

4.4. Kalibrierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

4.5. Unterscheidung von Protonen und Positronen . . . . . . . . . . . . . . . . . 35<br />

5. Statistische Methoden 37<br />

5.1. Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />

5.2. Das Likelihoodverhältnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

5.3. Künstliche neuronale Netze . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

5.3.1. Künstliche Neuronen . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />

5.3.2. Multi-Layer-Perzeptron . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

5.3.3. Training des neuronalen Netzes . . . . . . . . . . . . . . . . . . . . . 44<br />

5.3.4. Die NeuroBayes R○ Software . . . . . . . . . . . . . . . . . . . . . . . 45<br />

6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor 47<br />

6.1. Selektion des Trainingssamples . . . . . . . . . . . . . . . . . . . . . . . . . 47<br />

6.1.1. Preselection und Selection . . . . . . . . . . . . . . . . . . . . . . . . 48<br />

6.1.2. Elektronen und Protonen Selektion . . . . . . . . . . . . . . . . . . . 50<br />

6.2. Eingangs-Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51<br />

iii


iv<br />

Inhaltsverzeichnis<br />

6.3. Training des neuronalen Netzwerks . . . . . . . . . . . . . . . . . . . . . . . 56<br />

6.3.1. Test auf Over-Training . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />

6.3.2. Training mit Gewichten . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

6.3.3. Trainingseinstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . 59<br />

6.4. Ausgabe des neuronalen Netzwerkes . . . . . . . . . . . . . . . . . . . . . . 60<br />

7. Vergleich von Methoden zur Protonen/Positronen Trennung 63<br />

7.1. Reinheit der Separationsmethoden . . . . . . . . . . . . . . . . . . . . . . . 65<br />

7.2. Vergleich anhand der ermittelten Reinheit . . . . . . . . . . . . . . . . . . . 67<br />

8. Zusammenfassung und Ausblick 73<br />

Literaturverzeichnis 75<br />

Abbildungsverzeichnis 77<br />

Anhang 85<br />

A. Ausschnitt der Analysedatei für das neuronale Netzwerk im Rigiditätsbereich<br />

2 − 5 GV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />

B. Ausschnitt der Analysedatei für das neuronale Netzwerk im Rigiditätsbereich<br />

5 − 300 GV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93<br />

iv


1. Einleitung<br />

Die Teilchenphysik kommt mit Teilchenbeschleunigern wie dem Large Hadron Collider<br />

(LHC) am europäischen Kernforschungszentrum CERN 1 in Genf der Antwort auf die Frage<br />

nach den Bestandteilen der Materie immer näher. Doch aus astronomischen Messungen<br />

weiß man, dass nach derzeitigem Kenntnisstand nur ein Bruchteil der im Universum<br />

gemessenen Materie erklärt werden kann. Etwa 80% der Masse im Universum wird aus<br />

sogenannter Dunkler Materie gebildet, für die noch kein geeigneter Teilchenphysikalischer<br />

Kandidat identifiziert werden konnte.<br />

Um Teilchen der Dunklen Materie zu identifizieren werden aktuell verschiedene Ansätze<br />

verfolgt:<br />

• Direkte Messung durch Kernwechselwirkungen.<br />

• Erzeugung und Nachweis an Beschleunigerexperimenten.<br />

• Indirekte Messung aus Annihilationsprodukten in der kosmischen Strahlung.<br />

Das Alpha Magnetic Spectrometer (AMS-02) als neuster und leistungsfähigster Detektor<br />

zur Vermessung der kosmischen Strahlung widmet sich der indirekten Messung Dunkler<br />

Materie und ist damit unter Punkt drei einzuordnen.<br />

Die Beobachtung kosmischer Strahlung begann 1912 mit deren Entdeckung durch Viktor<br />

Hess (Nobelpreis 1936) und bildet seit dem die grundlegende Methode der Astroteilchenphysik,<br />

als eine Disziplin die Methoden der Astrophysik und der Teilchenphysik gemeinsam<br />

nutzt und damit eine Verbindung zwischen dem Kleinsten und dem Größten bildet.<br />

Bahnbrechende Erfolge der Astroteilchenphysik waren die Entdeckung des Positrons, als<br />

erstes Teilchen der Antimaterie, durch Anderson 1932 (Nobelpreis 1936) und die Entdeckung<br />

der kosmischen Mikrowellenhintergrundstrahlung 1965 durch Penzias und Wilson<br />

(Nobelpreis 1978). Die Beobachtung dieser in der Urknalltheorie vorhergesagten elektromagnetischen<br />

Strahlung im infraroten Wellenlängenbereich bildete ein starkes Argument<br />

für das Urknallmodell. Dieses beschreibt die Entwicklung des Kosmos wie sie in Abbildung<br />

1.1 dargestellt ist.<br />

Heutzutage werden Teilchen der kosmischen Strahlung mit hochmodernen Detektoren und<br />

komplizierten Analysemethoden vermessen. Dazu werden unter anderem Detekorfelder, wie<br />

beim Auger Observatorium in Argentinien, errichtet, die durch kosmische Teilchen ausgelöste<br />

Teilchenschauer messen und daraus das Primärteilchen rekonstruieren. Die Erdatmosphäre<br />

fungiert dabei als Kalorimeter. Um kosmische Teilchen direkt vermessen zu<br />

1 franz.: Conseil Européen pour la Recherche Nucléaire<br />

1


2 1. Einleitung<br />

Abbildung 1.1.: Entwicklung des Universums nach der Urknalltheorie [1].<br />

können werden aber auch weiterhin Detektoren wie das High Energy Antimatter Telescope<br />

(HEAT) an Ballons auf etwa 40 km Höhe an den Rand der Erdatmosphäre gebracht.<br />

Die modernste Art kosmische Strahlung zu vermessen bilden Satelliten gestützte Experimente<br />

wie der AMS-02 Detektor. Dieser ist ein moderner Teilchendetekor mit hoher<br />

Akzeptanz im Energiebereich bis zu einigen TeV. Er befindet sich seit Mai 2011 auf der<br />

Internationalen Raumstation und kann dort in fast vollständiger Abwesenheit von atmosphärischen<br />

Einflüssen kosmische Strahlung direkt und über einen langen Zeitraum vermessen.<br />

Er ist ausgestattet mit einem Silizium Spurdetektor im Magnetfeld eines Permanentmagneten,<br />

einem Flugzeitdetektor, einem Ring abbildenden Tscherenkow Detektor,<br />

sowie einem Übergangsstrahlungsdetektor und einem elektromagnetischen Kalorimeter.<br />

Eine ähnliche Konfiguration ohne Übergangsstrahlungsdetektor und Kalorimeter wurde<br />

in einem 10-tägigen Testflug mit dem Space Shuttle Discovery im Jahr 1998 getestet und<br />

nach überzeugenden Ergebnissen für einen dauerhaften Einsatz im All bis mindestens 2020<br />

aufgerüstet. In Abbildung 1.2 ist der AMS-02 Detektor an seiner aktuellen Position auf<br />

der Internationalen Raumstation zu sehen, wo er in den letzten 22 Monaten bereits 30 Milliarden<br />

Teilchen messen konnte. Mit seinen Messungen wird der AMS-02 Detektor einen<br />

großen Beitrag zur Beantwortung der Frage nach Dunkler Materie und darüber hinaus<br />

liefern.<br />

So wird beispielsweise der Anteil des Positronenflusses in der leptonischen Komponente<br />

der kosmischen Strahlung gemessen, der ein Indiz für Annihilation von bisher unentdeckten<br />

Teilchen der Dunklen Materie sein kann. 2012 beobachtete der Payload for Antimatter<br />

Matter Exploration and Light-nuclei Astrophysics (PAMELA) Detektor einen unerwarteten<br />

Anstieg im Positronenanteil, der von AMS-02 genauer untersucht und dessen Messung<br />

zu höheren Energien hin erweitert werden wird. Da Positronen selten in primären Quellen<br />

erzeugt werden, sind sie ein sensitives Indiz für Zerfalls- und Stoßprozesse, die im<br />

Kosmos ablaufen. Auf die Bedeutung des Positronenanteils für die Suche nach Dunkler<br />

Materie wird in Kapitel 2 näher eingegangen. Um bei einem Verhältnis des dominierenden<br />

Protonen- zum Positronenfluss von etwa 10 3 weniger als 1% Protonenkontamination in<br />

der Positronenauswahl zu erreichen wird dabei eine Protonenunterdrückung von 10 6 angestrebt.<br />

Die zur Trennung dieser beiden Teilchenarten wichtigen Subdetektoren im AMS-02<br />

2


3<br />

Abbildung 1.2.: Foto des AMS-02 Detektor auf der Internationalen Raumstation [2].<br />

Experiment, das in Kapitel 3 genauer beschrieben ist, sind das elektromagnetische Kalorimeter<br />

und der Übergangsstrahlungsdetektor, mit dessen Funktionsweise und Betrieb sich<br />

Kapitel 4 befasst.<br />

In dieser Arbeit wurde eine Multivariante Analysemethode in Form eines neuronalen Netzwerks<br />

entwickelt mit der Positronen von Protonen mithilfe des Übergangsstrahlungsdetektos<br />

zuverlässig unterschieden werden können. Dieses neuronale Netzwerk wurde dabei aus<br />

einer Trainingsauswahl von Flugdaten der ersten eineinhalb Jahre Datennahme trainiert.<br />

Dabei wurde die Redundanz der AMS-02 Subdetektoren ausgenutzt. Die Schritte, um aus<br />

den AMS-02 Flugdaten ein neuronales Netzwerk zur Trennung von Protonen und Positronen<br />

zu erhalten, sind in Kapitel 6 beschrieben. In Kapitel 7 wird ein Vergleich zwischen<br />

den verschiedenen zur Verfügung stehenden Methoden zur Trennung von Protonen und<br />

Positronen mithilfe des Übergangsstrahlungsdetektors durchgeführt. Dabei wird alleine<br />

mit dem Übergangsstrahlungsdetektor eine Protonenunterdrückung von 10 3 bei einer Selektionseffizienz<br />

für Positronen von 90% im Rigiditätsbereich von 2 − 300 GV erreicht.<br />

3


2. Physikalischer Hintergrund<br />

Primäre Aufgabe des AMS-02 Detektors ist die Vermessung der kosmischen Strahlung. Die<br />

Beobachtung kosmischer Strahlung begann 1912 mit deren Entdeckung durch Viktor Hess.<br />

Dieser untersuchte in einer Reihe von Ballonflügen die Entladungsrate von Elektroskopen<br />

mit der Höhe über der Erdoberfläche. Die Entladung wird dabei durch Stöße mit ionisierenden<br />

Teilchen der Hintergrundstrahlung verursacht, deren Ursprung man im Erdinneren<br />

vermutete. Viktor Hess konnte nachweisen, dass die Entladungsrate als Funktion der Höhe<br />

zunimmt und damit nur eine Quelle ionisierender Teilchen außerhalb der Atmosphäre in<br />

Frage kommt. Konsistente Ergebnisse durch Messungen bei Nacht und Sonnenfinsternissen<br />

schlossen die Sonne als potentielle Quelle aus.<br />

2.1. Kosmische Strahlung<br />

Der Begriff kosmische Strahlung beschreibt eine Teilchenstrahlung über einen breiten Energiebereich,<br />

deren Ursprung im Weltall liegt. Die kosmische Strahlung besteht aus verschiedenartigen<br />

Teilchen, wobei Protonen mit etwa 85% den größten Anteil ausmachen. Außerdem<br />

kommen Heliumkerne mit einem Anteil von etwa 12% vor. Die restlichen 3% bilden<br />

Atomkerne höherer Ladungszahl Z ≥ 3 sowie Elektronen und Positronen [4]. Dabei kommen<br />

alle Kerne schwerer Elemente in der kosmischen Strahlung vor, wie in Abbildung 2.1<br />

gezeigt ist. Dort ist auch die relative Häufigkeit der Elemente im Sonnensystem gezeigt,<br />

welche dem Vorkommen in der kosmischen Strahlung bis auf wenige Ausnahmen auffallend<br />

ähnlich ist. Neben den geladenen Teilchen zählen auch ungeladene Teilchen wie Neutrinos<br />

und Photonen kosmischen Ursprungs zur kosmischen Strahlung. Die Intensität der<br />

kosmischen Strahlung fällt mit der Energie nahezu konstant nach einem Potenzgesetz ab.<br />

Das Spektrum der Hauptbestandteile der kosmischen Strahlung in einem Energiebereich<br />

von 10 MeV bis 10 12 GeV ist in Abbildung 2.2 dargestellt. Dort ist der Teilchenfluss pro<br />

Sekunde und Quadratmeter Fläche eines Raumwinkelelements mit der Energie doppelt logarithmisch<br />

aufgetragen. Dabei wurde der Teilchenfluss noch mit der Energie zum Quadrat<br />

multipliziert und damit abgeflacht. Dies bedeutet, dass die Wahrscheinlichkeit kosmische<br />

Teilchen einer bestimmten Energie zu messen mit der Energie rapide abfällt. Abbildung<br />

2.2 ist außerdem zu entnehmen, dass das Verhältnis von Elektronen zu Protonenfluss die<br />

Größenordung 10 −2 annimmt und damit auf 100 Protonen etwa ein Elektron vorkommt.<br />

Noch seltener sind Positronen, die noch um einen Faktor 10 weniger vorkommen als Elektronen.<br />

Für die Untersuchung der kosmischen Strahlung gibt es zwei Ansätze. Zum einen kann sie<br />

5


6 2. Physikalischer Hintergrund<br />

Abbildung 2.1.: Relative Häufigkeit der Elemente in der kosmischen Strahlung als Funktion<br />

ihrer Kernladungszahl Z bei einer Energie von 1 GeV pro Nukleon,<br />

normiert auf Si=100 [3]. Gezeigt ist außerdem die Häufigkeit der Elemente<br />

im Sonnensystem (graue Dreiecke).<br />

direkt mit Satelliten oder Ballonexperimenten im oberen Bereich der Erdatmosphäre gemessen<br />

werden. Dabei können Satellitenexperimente durch ihre relativ hohen Kosten bei<br />

starker Gewichtsbeschränkung und damit relativ kleinen Abmessungen nur für niedrige<br />

Energien bis einige TeV verwendet werden. Sie bieten durch die Abwesenheit von atmosphärischen<br />

Einflüssen allerdings eine optimale Messumgebung. In diesem Bereich misst<br />

auch der AMS-02 Detektor. Wirtschaftlicher sind Ballonexperimente, bei denen ein Teilchendetektor<br />

zum Nachweis geladener Teilchen an einem Ballon auf bis zu 40 km Höhe<br />

an den Rand der Atmosphäre gebracht wird. Allerdings sind Ballonflüge nur über relativ<br />

kurze Zeiträume machbar, was die Menge gemessener Teilchen beschränkt. Außerdem<br />

wird die Messung durch Sekundärteilchen aus Wechselwirkungen in der über dem Detektor<br />

liegenden Atmosphäre verfälscht. Ballonexperimente wie das High Energy Antimatter Telescope<br />

(HEAT), das am 3. Mai 1994 seinen ersten Flug über 29 Stunden auf 36, 5 − 33 km<br />

Höhe absolvierte, bieten eine gute Möglichkeit kosmische Teilchen bis zu Energien im PeV<br />

Bereich zu Messen. HEAT war dabei mit einem Flugzeitdetektor, einem Übergangsstrahlungsdetekor,<br />

einem Spurdetektor aus Driftkammern innerhalb eines Magneten und einem<br />

elektromagnetischen Kalorimeter ausgerüstet. In Abbildung 2.3 ist eine Skizze des HEAT<br />

Detektors, sowie ein Foto des Ballons im oberen Teil der Atmosphäre beim Erstflug zu sehen.<br />

Messungen von Teilchen höherer Energie werden indirekt über Wechselwirkungen der<br />

Teilchen mit der Materie der Erdatmosphäre durchgeführt. Dabei werden geeignete Detektoren<br />

über eine große Fläche verteilt aufgestellt. Trifft ein Kern der kosmischen Strahlung<br />

auf Atome aus der Luft in der Erdatmosphäre, bildet sich ein hadronischer Schauer aus.<br />

Dieser setzt sich kaskadenartig zur Erdoberfläche fort. Hier können die entstandenen Sekundärteilchen<br />

nahezu gleichzeitig gemessen werden und aus ihrer Energie und Verteilung,<br />

sowie deren Zusammensetzung das primäre Teilchen rekonstruiert werden. Gleiches gilt für<br />

Elektronen und Photonen, wobei sich hier ein elektromagnetischer Schauer ausbildet, der<br />

vom hadronsichen unterschieden werden kann. Ein Nachteil dieser Methode ist ihre hohe<br />

Komplexität in der Schauerrekonstruktion. Außerdem kann keine Aussage über das Ladungsvorzeichen<br />

eines Teilchens gemacht werden, so dass Teilchen von deren Antiteilchen<br />

nicht unterschieden werden können. Experimente dieser Art sind der ehemalige Karlsruhe<br />

Shower Core and Array Detector (<strong>KA</strong>SCADE) am Campus Nord des Karlsruhe <strong>Institut</strong><br />

für Technologie, sowie das Pierre-Auger-Observatorium in Argentinien, das mit 1600<br />

Tscherenkow Detektoren, wie in Abbildung 2.4 rechts gezeigt, eine Fläche von 3000 km 2<br />

abdeckt. Eine weitere Möglichkeit der indirekten Messung besteht darin den Luftschauer<br />

6


2.2. Quellen Kosmischer Strahlung 7<br />

Space<br />

experiments<br />

Balloon experiments<br />

Ground based<br />

experiments<br />

AMS-02<br />

Abbildung 2.2.: Teilchenspektrum der kosmischen Strahlung mit der Energie [5]. Die Abbildung<br />

vereint Messergebnisse verschiedener Experimente deren Ergebnisse<br />

durch unterschiedliche Farben und Marker dargestellt werden.<br />

direkt durch sein isotrop abgestrahltes Fluoreszenzlicht zu beobachten und daraus das Primärteilchen<br />

zu identifizieren. Dies ist jedoch nur bei geringem Untergrund und damit in<br />

dunklen Nächten und weit weg von Städten möglich. Solche Fluoreszenz-Teleskope werden<br />

ebenfalls am Pierre-Auger-Observatorium eingesetzt. Eine Rekonstruktion eines von den<br />

Fluoreszenz-Teleskopen und Bodenstationen gemeinsam gemessenes Ereignis am Pierre-<br />

Auger-Observatorium ist in Abbildung 2.4 links zu sehen.<br />

Die Messung kosmischer Strahlung verrät dabei viel über physikalische Vorgänge im Universum.<br />

Die Strahlung trägt dabei mit ihrer Energie und Richtung Informationen über<br />

ihre Quelle zur Erde.<br />

2.2. Quellen Kosmischer Strahlung<br />

Die Entstehung von kosmischer Strahlung ist eng mit Prozessen der Sternentwicklung<br />

verknüpft [8]. In unserer näheren Umgebung ist die Sonne eine Quelle für sehr nieder<br />

energetische kosmische Strahlung mit hoher Intensität die zeitlich mit der Sonnenaktivität<br />

variiert. Von der Sonne werden dabei überwiegend Protonen, sowie Elektronen und<br />

Neutrinos abgegeben. Kerne schwerer Elemente und kosmische Strahlung ab Energien von<br />

etwa 1 GeV können von der Sonne jedoch nicht erzeugt werden und müssen galaktischen<br />

Ursprungs sein. Als Quellen kosmischer Strahlung im für den AMS-02 Detektor relevanten<br />

Energiebereich bis 1 TeV werden Schockfronten von Supernova Überresten vermutet. Eine<br />

Supernova markiert das Ende der Fusionsaktivität eines massereichen Sterns ab 1, 4 Sonnenmassen.<br />

Dabei kollabiert der Stern und wird in einer Explosion, bei der große Mengen<br />

Materie ins All geschleudert werden, vernichtet. In diesem Endstadium ist die Temperatur<br />

im Innern des Sterns hoch genug um die Fusion von Kernen höherer Kernzahl bis zum<br />

7


8 2. Physikalischer Hintergrund<br />

Abbildung 2.3.: Skizze des HEAT Detektors (rechts), ausgerüstet mit Flugzeitmessung<br />

(TOF), Übergangsstrahlungsdetektor (TRD), Driftkammern (DTH) innerhalb<br />

eines Magneten und einem elektromagnetischen Kalorimeter (EC)<br />

und ein Foto des Detektors am Ballon in der Atmosphäre (links) [6].<br />

Abbildung 2.4.: Übersicht der Detektorverteilung mit eingezeichneten Sichtlinien der<br />

Fluoreszenz-Teleskope beim Pierre-Auger-Observatorium (links) und Rekonstruktion<br />

eines Ereignisses mit Bodenstationen und Fluoreszenz-<br />

Teleskopen (rechts) [7].<br />

8


2.3. Dunkle Materie 9<br />

Eisen zu ermöglichen. Die entweichende Materie besteht dabei aus Protonen, sowie Atomkernen<br />

und Elektronen. Sie bildet mit diesen geladenen Teilchen eine Front aus diffusen<br />

Magnetfeldern.<br />

Innerhalb der Schockfronten findet für die geladenen Teilchen immer wieder ein Energieübertrag,<br />

ähnlich eines inelastischen Stoßes an der Schockfront, statt. Dabei wird mit<br />

jedem Stoß die Energie der Teilchen um den Faktor ρ erhöht, so dass die Energie nach<br />

einem Stoß E 1 = E 0 (1 + ρ) ist. Nach n Stößen besitzen Teilchen damit die Energie<br />

E n = E 0 (1 + ρ) n . (2.1)<br />

Man spricht von Fermi Beschleunigung erster Art [9]. Um die Menge an Teilchen in der<br />

Schockfront abzuschätzen, wird ihnen eine energieunabhängige Entweichwahrscheinlichkeit<br />

p esc zugeordnet, mit der sie eine Schockfront verlassen. Die Teilchenzahl nach n Stößen ist<br />

dann<br />

N n = N 0 (1 − p esc ) n . (2.2)<br />

Betrachtet man nun die Entwicklung der Teilchenzahl ln(N n /N 0 ) = n · ln(1 − p esc ) mit<br />

dem Energiezuwachs ln(E n /E 0 ) = n · ln(ρ) erhält man aus deren Verhältnis die Anzahl<br />

der Teilchen nach n Zyklen<br />

N n = N 0<br />

( En<br />

E 0<br />

) p<br />

, (2.3)<br />

mit p = ln(1−pesc)<br />

ln(1+ρ)<br />

. Damit lässt sich aus<br />

∫ ∞<br />

der Verlauf des Energiespektrums<br />

E<br />

dN<br />

dE dE = N n (2.4)<br />

dN<br />

dE ∼ ( E<br />

E 0<br />

) −(p+1)<br />

(2.5)<br />

abschätzen. Dies ist das in 2.1 angesprochene Potenzgesetz für den Fluss der kosmischen<br />

Strahlung. Das Prinzip der Beschleunigung kosmischer Teilchen an Schockfronten ist in<br />

Abbildung 2.5 nochmals verdeutlicht.<br />

Abbildung 2.5.: Beschleunigung kosmischer Teilchen an einer Schockfront.<br />

2.3. Dunkle Materie<br />

Schon zu Begin des 20. Jahrhunderts deuteten astronomische Messungen darauf hin, dass<br />

die bisher gemessene und wahrgenommene Materie nur einen Bruchteil der Gesamtmaterie<br />

9


10 2. Physikalischer Hintergrund<br />

im Universum ausmacht. Erste Hinweise auf diese Diskrepanz wurden in den 1930er Jahren<br />

von Fritz Zwicky gegeben, der eine zusätzliche nicht sichtbare Materie postulierte, um die<br />

Stabilität von Galaxienhaufen zu erklären [10]. Anhaltspunkte lassen sich auch aus den<br />

Rotationskurven von Galaxien ziehen. Nach den Gesetzen der newtonschen Mechanik,<br />

nehmen diese für einen Körper mit der Masse M in einer Massenverteilung in einem<br />

Zentrum m, wie man sie anhand der sichtbaren Galaxiescheibe erwarten würde, aus<br />

mit dem Orbitalradius r nach<br />

mv 2<br />

r<br />

v =<br />

= G · mM<br />

r 2 (2.6)<br />

√<br />

GM/r (2.7)<br />

ab. Beobachtungen zeigen jedoch, dass sich Rotationsgeschwindigkeiten nahezu konstant<br />

mit dem Orbitalradius verhalten. Der Verlauf der Rotationsgeschwindigkeiten aus Messungen<br />

an der Dreiecksnebel genannten Galaxie M33, sowie die Erwartung nach der newtonschen<br />

Mechanik sind in Abbildung 2.6 gezeigt. Um dieses Verhalten zu erklären, benötigt<br />

Abbildung 2.6.: Rotationsgeschwindigkeit von Sternen einer Galaxie mit deren Orbitalradius<br />

(grün) sowie die Erwartung aus den Keplerschen Gesetzen (orange)<br />

[11].<br />

man eine Massenverteilung nach ϱ ∼ r −2 und damit eine Verteilung der überwiegenden<br />

Masse im sogenannten Halo der Galaxie [4]. Auch auf größeren Skalen lassen sich Hinweise<br />

finden, dass im Universum mehr Materie als die sichtbare, in Form von Gaswolken<br />

und Sternen, vorhanden ist. Beispielsweise aus dem Gravitationslinseneffekt, der die Folge<br />

der Ablenkung von Licht an großen Mengen Materie sichtbar macht. All diese Hinweise<br />

sprechen für ein Vorhandensein sogenannter Dunkler, weil nicht-sichtbarer, Materie im<br />

Universum.<br />

Um die tatsächliche Menge an Dunkler Materie abzuschätzen ist man auf kosmologische<br />

Modelle angewiesen. Die für die Entwicklung des Kosmos bevorzugte Theorie ist das Λ-<br />

CDM-Modell. Λ steht dabei für eine kosmologische Konstante, die die beschleunigte Expansion<br />

des Universums erklären soll, und CDM für kalte Dunkle Materie 1 . Dieses Modell<br />

ist gut durch Beobachtungen der kosmischen Hintergrundstrahlung und der Häufigkeit der<br />

Elemente im Kosmos belegt. Die Voraussage der Materieverteilung durch das Λ-CDM-<br />

Modell ist in Abbildung 2.7 dargestellt. Demnach entfällt 23% der Materie im Kosmos<br />

auf die Dunklen Materie. Baryonische Materie in Form von Atomen macht lediglich 4, 6%<br />

aus. Ein Großteil von 72% entfällt auf die kosmologische Konstante, die auch als Dunkle<br />

Energie bezeichnet wird und deren Ursprung noch unklar ist.<br />

1 engl.: Cold Dark Matter<br />

10


2.3. Dunkle Materie 11<br />

Abbildung 2.7.: Erwartete Verteilung von Materie und Energie im Universum nach dem<br />

Λ-CDM-Modell [12].<br />

2.3.1. Kandidaten für Dunkle Materie<br />

Ein naheliegender Kandidat für nicht selbst leuchtende und damit dunkle Materie in den<br />

Halos von Galaxien bildet klassische baryonische Materie. Diese könnte in Form von Gasoder<br />

Staubwolken, die kalt genug sind um kein Licht im infraroten Wellenlängenbereich<br />

zu emittieren, vorhanden sein. Gas- oder Staubwolken würden jedoch einfallende Strahlung<br />

absorbieren und sich dadurch erwärmen. Damit würden sie im infraroten Lichtbereich<br />

sichtbar werden. Ein weiterer Ansatz bilden massereiche baryonische Objekte (MACHOs 2 ),<br />

deren Massedruck nicht ausreicht um den Fusionsprozess in Gang zu setzen und die damit<br />

kalt bleiben. Als solche Objekte kommen braune Zwerge, oder bereits ausgebrannte<br />

Sterne in Form von Neutronensternen oder schwarzen Löchern in Frage. Solche massiven<br />

Objekte könnten durch den Mikrolinseneffekt sichtbar gemacht werden. Auch wenn in der<br />

Halo tatsächlich vereinzelt massive Objekte beobachtet werden konnten, reicht ihre Dichte<br />

nicht aus um das Massendefizit zu erklären.<br />

Für Dunkle Materie kommt auch nicht baryonische Materie in Frage. Ein Kandidat hierfür<br />

darf keine elektromagnetische Ladung zu tragen und muss Masse zu besitzen. Außerdem<br />

muss ein geeigneter Kandidat stabil sein. Schwach Wechselwirkende massereiche Teilchen<br />

(WIMPs 3 ) als Teilchen der Dunklen Materie könnten Neutrinos sein. Aus der Beobachtung<br />

der Neutrinooszillation bei solaren Neutrinos folgt, dass Neutrinos Masse besitzen müssen.<br />

Ihre Dichte im Universum ist vergleichbar mit der Dichte von Photonen der kosmischen<br />

Hintergrundstrahlung, was in etwa 300 Neutrinos/cm 3 bedeutet. Aus dieser Information<br />

und der kritischen Dichte von 10 −29 g/cm 3 aus WMAP Messungen, kann eine obere Grenze<br />

für Neutrinomassen m ν gegeben werden. Diese liegt für die drei Neutrinos und ihrer<br />

Antiteilchen bei<br />

20eV/c 2 ≥ ∑ m ν = 2(m νe + m νµ + m ντ )<br />

und damit bei maximal 10 eV/c 2 , wenn nur eines der Neutrinotypen Masse trägt [4].<br />

Teilchen dieser geringen Masse sind relativistisch und werden als heiße Dunkle Materie<br />

bezeichnet. Bestünde die benötigte Dunkle Materie ausschließlich aus heißer Dunklen<br />

Materie, wäre die beobachtete Strukturbildung im Universum jedoch nicht erklärbar. Es<br />

muss daher auch nicht relativistische kalte Dunkle Materie geben. Geeignete Kandidaten<br />

finden sich in supersymmetrischen Erweiterungen des Standardmodells der Teilchenphysik.<br />

Im Standardmodell der Teilchenphysik besteht Materie aus sechs Quarks (Up, Down,<br />

Charme, Strange, Top, Bottom), drei Generationen von Leptonen mit ihren Neutrinos<br />

(Elektron, Myon, Tau) und den vier Typen von Austauschbosonen (Photon, Gluon, Z<br />

und W), sowie dem Higgs Boson. Zusätzlich existieren noch entsprechende Antiteilchen<br />

2 engl.: MAssive Compact Halo Object<br />

3 engl.: Weakly Interacting Massive Particle<br />

11


12 2. Physikalischer Hintergrund<br />

mit entgegengesetzter Masse und Parität. In supersymmetrischen Erweiterungen des Standardmodells<br />

erhält jedes Teilchen im Standardmodell einen supersymmetrischen Partner<br />

mit einer entgegengesetzten neuen Quantenzahl, der R-Parität. Die Teilchen in der minimalen<br />

supersymmetrischen Erweiterung des Standartmodels der Teilchenphysik sind in<br />

Abbildung 2.8 dargestellt. Da bisher keine supersymmetrischen Teilchen an Beschleuni-<br />

Abbildung 2.8.: Teilchen der minimalen supersymmetrischen Erweiterung des Standardmodells<br />

der Teilchenphysik [13].<br />

gern gefunden wurden, geht man davon aus, dass die Supersymmetrie gebrochen ist und<br />

supersymmetrische Teilchen damit schwerer als ihre Partner sind. Dabei ist aufgrund der<br />

Paritätserhaltung zumindest das leichteste supersymmetrische Teilchen, das sogenannte<br />

Neutralino ˜χ 0 , stabil und damit ein geeigneter WIMP Kandidat für Dunkle Materie [4].<br />

Experimente zur Suche nach Dunkler Materie konzentrieren sich hauptsächlich auf die<br />

Suche nach solchen WIMPs.<br />

2.3.2. Suche nach Dunkler Materie<br />

Suche nach Dunkler Materie aus der kosmischen Strahlung findet auf zwei verschiedene Arten<br />

statt. Zum einen können WIMPs durch inelastische Stöße an Atomkernen aufgrund der<br />

schwachen Wechselwirkung direkt nachgewiesen werden. Energien, die bei einem solchen<br />

Stoß frei werden, sind sehr klein und man hat mit einem großen Untergrund durch natürliche<br />

Strahlung zu kämpfen. Um diesen abzuschirmen befinden sich solche Experimente<br />

meist im Innern von Bergen oder Untertage. Außerdem werden hoch reine Materialien<br />

benötigt um klare Signale zu erhalten. Ein Experiment dieser Art ist beispielsweise das<br />

EDELWEISS 4 Experiment im Modane Untergrundlabor.<br />

Des Weiteren können WIMPs durch Paarzerfall miteinander in Teilchen des Standartmodells<br />

zerfallen, da hier die R-Parität nicht verletzt ist. Solche Zerfälle sind in Abbildung 2.9<br />

dargestellt. Anhand der Zerfallsprodukte könnten sich WIMPs indirekt nachweisen lassen.<br />

Auf der Suche nach einem Ausschlag im Spektrum der möglichen Zerfallsprodukte, der auf<br />

WIMP Annihilation hindeuten könnte, ist auch das AMS-02 Experiment.<br />

2.4. Der Positronanteil in der leptonischen Komponente der<br />

kosmischen Strahlung<br />

Ein solcher Hinweis auf WIMP Annihilation könnte aus dem Anteil an Positronen in den<br />

Leptonen der kosmischen Strahlung hervorgehen. Kosmische Positronen stammen hauptsächlich<br />

aus Wechselwirkungsprozessen von kosmischen Protonen mit interstellarem Gas.<br />

4 franz.: Expérience pour Détecter Les WImps En SIte Souterrain<br />

12


2.4. Der Positronanteil in der leptonischen Komponente der kosmischen Strahlung 13<br />

Abbildung 2.9.: Zerfallskette der Annihilation supersymmetrischer Neutralinos in Teilchen<br />

des Standardmodells der Teilchenphysik [14].<br />

In primären Quellen wie Supernova-Explosionen werden sie aufgrund der Paarvernichtung<br />

mit Elektronen nur wenig erzeugt. Aus diesem Wissen, kann man eine Erwartung an den<br />

Anteil an Positronen in den Leptonen der kosmischen Strahlung formulieren. Dieser sollte<br />

logarithmisch mit der Energie fallen. Satellitenexperimente wie PAMELA oder Fermi<br />

beobachten jedoch einen Anstieg im Positronenanteil ab einer Energie von 6 GeV, wie er<br />

in Abbildung 2.10 dargestellt ist. Dieser Anstieg deutet auf eine bisher unbekannte Quelle<br />

Abbildung 2.10.: Positronenanteil in der leptonischen Komponente der kosmischen Strahlung<br />

mit der Energie bis 100 GeV aus Messungen verschiedener Experimente<br />

[15].<br />

kosmischer Positronen hin. WIMP Annihilation, wie sie in Abbildung 2.9 dargestellt ist,<br />

könnte eine solche sekundäre Quelle sein. Als primäre Quelle von Elektron-Positron Paaren<br />

kommen allerdings auch Pulsare in Frage [16]. Pulsare sind rotierende Neutronensterne<br />

als Überreste von Supernova-Explosionen. Die Rotation führt zu einem induzierten elektrischen<br />

Feld, durch dass dem Pulsar Elektronen an dessen Oberfläche entzogen werden.<br />

13


14 2. Physikalischer Hintergrund<br />

Diese folgen dem starken Magnetischen Feld des Neutronensterns und emittieren Photonen<br />

durch Synchrotronstrahlung. Hochenergetische Photonen können im hohen magnetischen<br />

Feld durch Paarbildung Elektron-Positron Paare bilden. Dieser Prozess kann beliebig oft<br />

wiederholt werden, so das eine große Zahl an Elektron-Positron Paaren frei werden. Während<br />

Positronen als Produkt von WIMP Annihilation isotrop nachweisbar wären, sollte<br />

bei Pulsaren als Quelle eine Energieabhängige Anisotropie auftreten.<br />

Der AMS-02 Detektor wird das Positronenspektrum zu höheren Energien fortsetzen und<br />

mit seiner hohen Akzeptanz eine mögliche Anisotropie untersuchen. Damit wird die Quelle<br />

des Anstiegs im Positronenverhältnis weiter eingegrenzt werden.<br />

14


3. Der AMS-02 Detektor<br />

Der AMS-02 Detektor ist ein seit Mai 2011 auf der Internationalen Raumstation (ISS 1 ) als<br />

externes Modul montierter Teilchendetektor. Die ISS stellt dem sieben Tonnen schweren<br />

und 64 Kubikmeter fassenden Detektor eine sichere Energieversorgung von etwa 2500 Watt<br />

sowie eine hohe Datenübertragung von mindestens 9 Megabits/s zur Erde zur Verfügung.<br />

Der Detektor ist so konstruiert, dass er während der gesamten Restlaufzeit der ISS Mission<br />

bis mindestens 2020 arbeiten kann [17]. Das Instrument ist aus sechs voneinander unabhängig<br />

arbeitenden Subdetektoren aufgebaut, die jeweils unterschiedliche Eigenschaften<br />

eines einfallenden Teilchens messen. Eine technische Zeichnung des Detektors und seiner<br />

Komponenten ist in Abbildung 3.1 zu sehen. Demnach durchquert ein von oben in den De-<br />

Abbildung 3.1.: Technische Zeichnung des AMS-02 Detektors mit Beschriftung der Subdetektoren<br />

[18].<br />

1 engl.: International Space Station<br />

15


16 3. Der AMS-02 Detektor<br />

tektor einfallendes Teilchen zunächst den Übergangsstrahlungsdetektor (TRD 2 ) der Energieabgaben<br />

proportional zum Gammafaktor misst. Anschließend werden die ersten beiden<br />

Szintillatorlagen zur Flugzeitmessung (TOF 3 ) durchquert, welche zusammen mit zwei weiteren<br />

Lagen unterhalb des Magneten die Geschwindigkeit des Teilchens messen können. Im<br />

Kern des Detektors befindet sich ein Silizium Spurdetektor mit sieben Lagen. Dieser wird<br />

von einem Permanentmagneten umgeben der ein Magnetfeld von 0, 15 Tesla erzeugt. So<br />

kann über die Krümmung der Teilchenbahn im Magnetfeld das Ladungsvorzeichen sowie<br />

das Verhältnis aus Teilchenimpuls und Ladung gemessen werden. Um die Auflösung des<br />

Spurdetektors zu erhöhen, befinden sich zwei weitere Lagen auf der Oberseite des Übergangsstrahlungsdetektors,<br />

sowie vor dem Kalorimeter. Um Teilchen zurückzuweisen, die<br />

von der Seite in den Detektor einfallen, ist der Silizium Spurdetektor von einem Antikoinzidenzzähler<br />

umgeben. Nun folgen noch der Ring abbildende Tschwerenkow Detektor,<br />

der Masse und Ladung des Teilchens messen kann und das elektromagnetische Kalorimeter<br />

zur Energiebestimmung. Dank dieses Aufbaus und der großen Erfahrung, die man von<br />

vorangegangenen teilchenphysikalischen Experimenten in die einzelnen Subdetektoren einfließen<br />

lassen konnte, misst der AMS-02 Detektor kosmische Teilchen mit einer sehr hohen<br />

Akzeptanz.<br />

Aufbau und Funktionsweise der einzelnen Subdetektoren werden im Folgenden näher behandelt,<br />

wobei eine detaillierte Beschreibung des Übergangsstrahlungsdetektors im nachfolgenden<br />

Kapitel erfolgt.<br />

3.1. Der Übergangsstrahlungsdetektor (TRD)<br />

Der Übergangsstrahlungsdetektor ist ein speziell für hohe Teilchenenergien im GeV Bereich<br />

ausgelegter Subdetektor auf der Oberseite des AMS-02 Detektors. Bei diesen Energien sind<br />

Teilchen durch ihre Masse, die im MeV/c 2 Bereich liegt, nur noch schwer zu unterscheiden,<br />

da die Teilchenenergien durch den kinetischen Anteil dominiert sind. Um solche Teilchen<br />

dennoch gut identifizieren zu können macht man sich den Effekt der Übergangsstrahlung<br />

zunutze. Diese kann entstehen, wenn ein hochrelativistisches geladenes Teilchen von einem<br />

Medium mit einer Permitivität ɛ 1 in ein Medium unterschiedlicher Permitivität ɛ 2 eintritt.<br />

Die Intensität der in Vorwärtsrichtung emittierten Strahlung im Energiebereich von einigen<br />

keV ist dabei proportional zum Gamma-Faktor γ = E/mc 2 des Teilchens. Das bedeutet,<br />

dass beispielsweise ein Elektron mit einer Ruhemasse von 0, 5 MeV/c 2 bei gleicher Energie<br />

wesentlich mehr Übergangsstrahlung produziert als ein Proton mit einer Ruhemasse von<br />

940 Mev/c 2 . Die Wahrscheinlichkeit Übergangsstrahlung zu emittieren ist so gering, dass<br />

man eine Anordnung aus vielen Übergängen von Materialien unterschiedlicher Permitivität<br />

wählt. Im Übergangsstrahlungsdetektor des AMS-02 Detektors sind daher 20 Lagen<br />

mit 20 mm dickem Radiatorvlies aus Polypropylen- und Polyethylen-Fasern verbaut, die<br />

eine hohe Zahl von Vakuum-Radiator Übergängen gewährleisten. Die entstandene Übergangsstrahlung<br />

wird dann von Proportionaldrahtkammerröhrchen unter jeder Lage Vlies<br />

detektiert. Eine schematische Skizze einer Lage im Übergangsstrahlungsdetektor ist in Abbildung<br />

3.2 zu sehen.<br />

Aufgrund dieser Eigenschaften ist der Übergangsstrahlungsdetektor vor allem für die Trennung<br />

von Positronen und Protonen sehr gut geeignet. Details zu Aufbau und Funktionsweise<br />

des Übergangsstrahlungsdetektors werden gesondert in Kapitel 4 behandelt.<br />

3.2. Der Flugzeitdetektor (TOF)<br />

Das System zur Flugzeitmessung besteht aus vier Lagen parallel angeordneter 1 cm dicker<br />

Kunststoff Szintillatorstreifen aus Polyvinyltoluene (PVT). Zwei Lagen sind dabei ober-<br />

2 engl.: Transition Radiation Detector<br />

3 engl.: Time Of Flight<br />

16


3.2. Der Flugzeitdetektor (TOF) 17<br />

Abbildung 3.2.: Schematische Zeichnung einer TRD Lage aus 20 mm dickem Radiatorvlies<br />

und Proportionaldrahtkammerröhrchen zum Nachweis von Übergangsstrahlung<br />

[19].<br />

halb und zwei unterhalb der Magnetstruktur angebracht, wobei die Szintillatorstreifen für<br />

zwei Lagen um 90 Grad zueinander gedreht sind um eine x-y-Ortsauflösung zu erreichen.<br />

An beiden Enden der Szintillatorstreifen sind Photomultiplier angebracht. In Abbildung<br />

3.3 ist der Flugzeitdetektor vor seinem Einbau in das AMS-02 Instrument zu sehen.<br />

Abbildung 3.3.: Foto der oberen und unteren Lagen des Flugzeitdetektors vor dem Einbau<br />

[20].<br />

Passiert ein geladenes Teilchen das szintillierende Material des Detektors werden dessen<br />

Moleküle angeregt und fallen durch schnelle Emission (τ ∼ 10 −8 s) eines charakteristischen<br />

Photons in ihren Grundzustand zurück. Das entstehende Licht wird durch Lichtleiter zu<br />

den Photomultiplieren an den Enden der Szintillatorstreifen geleitet. Ein solcher Szintillatorstreifen<br />

ist in Abbildung 3.4 zu sehen. Durch die Photomultiplier wird ein Signal zur<br />

Zeitmessung ausgelöst bzw. gestoppt. Der Flugzeitdetektor arbeitet also wie eine Stoppuhr<br />

mit einer Genauigkeit von 150 ps und kann damit die Geschwindigkeit von Teilchen mit bis<br />

zu 98% der Lichtgeschwindigkeit bestimmen [20]. Dadurch kann auch die Durchflugrichtung<br />

des Teilchens bestimmt werden, die zur Bestimmung des Ladungsvorzeichens durch<br />

den Spurdetektor benötigt wird.<br />

Außerdem kann durch die Intensität der charakteristischen Fluoreszensstrahlung die Energieabgabe<br />

pro Weglänge dE/dx des durchdringenden Teilchens und damit seine Ladung<br />

bestimmt werden.<br />

17


18 3. Der AMS-02 Detektor<br />

Abbildung 3.4.: Technische Zeichnung eines Szintillatorstreifens mit Beschriftung der<br />

Komponenten [20].<br />

3.3. Der Permanentmagnet<br />

Um kosmische Teilchen von deren Antiteilchen unterscheiden zu können benötigt man eine<br />

Messung des Ladungsvorzeichens. Dieses wird durch eine Kombination von Permanentmagneten<br />

und Silizium Spurdetektor, der die Teilchenspur im Magnetfeld aufnehmen kann,<br />

bewerkstelligt. Ein Teilchen, das sich durch ein Magnetfeld ⃗ B mit der Geschwindigkeit ⃗v<br />

bewegt wird durch die Lorentzkraft<br />

F L = q · (⃗v × ⃗ B) (3.1)<br />

abgelenkt. Die Krümmung der Teilchenbahn kann dann vom Spurdetektor gemessen werden.<br />

Der Magnet des AMS-02 Instruments besteht dabei aus 6400 Neodym-Eisen-Bor Blöcken,<br />

die aus 64 Sektoren einen Zylinder von einem Meter Höhe und etwa einem Meter im Durchmesser<br />

bilden. Der Magnet erzeugt eine nahezu homogenes Magnetfeld mit einer Stärke<br />

von 0, 15 Tessla in x-Richtung, wobei die z-Richtung in der vertikalen Detektorachse verläuft.<br />

Die Geometrie des Magneten wurde so gewählt, dass nahezu kein Restmagnetfeld<br />

außerhalb des Magnetzylinders vorhanden ist, welches die Elektronik, sowie Funktionen<br />

von Subdetektoren und der ISS beeinträchtigen könnte. Außerdem ist das Dipolmoment<br />

nahezu null, was für eine stabile Umlaufbahn im Erdmagnetfeld von entscheidender Bedeutung<br />

ist [21]. In Abbildung 3.5 ist ein Foto des Magneten vor dem Einbau zu sehen<br />

sowie eine Skizze mit Blick auf die x-y-Ebene, in der das Magnetfeld und die Ausrichtung<br />

der 64 Segmente dargestellt wird. Der Permanentmagnet wurde bereits beim Flug von<br />

AMS-01 verwendet.<br />

3.4. Der Silizium Spurdetektor<br />

Der Spurdetektor 4 ist der einzige Subdetektor, der die Krümmung eines sich bewegenden<br />

Teilchens im Magnetfeld und somit das Ladungsvorzeichen zur Unterscheidung von Teilchen<br />

und Antiteilchen bestimmen kann. Die der Krümmung zugeordnete Messgröße ist<br />

dabei die Rigidität R, welche als das Produkt aus Magnetfeld B und Krümmungsradius r<br />

definiert ist. Außerdem ist sie mit<br />

R =<br />

p<br />

(3.2)<br />

Z · e<br />

direkt proportional zum Teilchenimpuls p, wobei Z die Ladungszahl des Teilchens und e<br />

die Elementarladung ist. Ist diese bekannt, lässt sich also der Impuls des Teilchens bestimmen.<br />

Das Vorzeichen wird dabei so gewählt, dass ein negativ geladenes Teilchen eine<br />

negative Rigidität besitzt und ein positiv geladenes Teilchen eine positive Rigidität.<br />

4 engl.: Tracker<br />

18


3.4. Der Silizium Spurdetektor 19<br />

Abbildung 3.5.: Der AMS-02 Permanentmagnet in der Seitenansicht (links) und das von<br />

ihm erzeugte Magnetfeld in der Draufsicht (rechts) [22].<br />

Das System zur Spurbestimmung besteht aus neun Lagen, die jeweils aus doppelseitigen<br />

Siliziumstreifensensoren aufgebaut sind. Dabei bilden die Lagen zwei bis acht innerhalb<br />

des Magneten den inneren Spurdetektor. Lage eins, oberhalb des Übergangsstrahlungsdetektors<br />

und Lage neun vor dem Kalorimeter bilden den oberen- und unteren Spurdetektor<br />

und erweitern den Messbereich für Rigiditäten bis zu 2 TeV. Insgesamt wurden 192 Siliziumstreifen<br />

verbaut. In Abbildung 3.6 ist der Aufbau des Spurdetektorsystems zu sehen.<br />

Abbildung 3.6.: Schematische Darstellung der Spurdetektorplatten (links) und Fotos vor<br />

deren Integration in den Detektor (rechts) [23].<br />

Durchdringt ein geladenes Teilchen einen der Siliziumstreifen, produziert es im Halbleitermaterial<br />

Elektronen-Loch Paare, die innerhalb von 10 ns durch ein anliegendes elektrisches<br />

Feld von etwa 80 V in entgegengesetzte Richtung abgesaugt und damit an der Rekombination<br />

gehindert werden. Die Elektronen werden von Leiterstreifen auf der Oberfläche des<br />

Sensors in direkter Umgebung des Teilchendurchgangs aufgenommen. Diese Elektronenströme<br />

kann man messen und damit den Ladungsschwerpunkt als Durchstoßpunkt des<br />

Teilchens mit einer Genauigkeit von 10 µm in der Krümmungsebene und 30 µm in der<br />

nicht gekrümmten Bahnebene bestimmen. Außerdem ist die Menge erzeugter Elektronen-<br />

19


20 3. Der AMS-02 Detektor<br />

Loch Paare und damit die Stärke des Signals proportional zum Quadrat der Ladungszahl<br />

Z 2 , welche somit bestimmt werden kann [24]. Eine schematische Darstellung eines solchen<br />

Streifensensors ist in Abbildung 3.7 zu sehen. So erhält man im optimalen Fall neun<br />

Durchstoßpunkte, mit denen die Teilchenbahn rekonstruiert werden kann.<br />

Abbildung 3.7.: Schematische Skizze von Aufbau und Funktionsweise eines doppelseitigen<br />

Silizium Streifensensors [24].<br />

Um die gewünschte Auflösung des Spurdetektors zu erreichen und beizubehalten wurde<br />

ein System zur Kalibrierung, bestehend aus 10 Laserdioden im infraroten Wellenlängenbereich<br />

integriert. Die Wellenlänge von 1082 nm wurde so gewählt, dass der Strahl zwar<br />

im Spurdetektor Signale hinterlässt, aber dennoch genug durchdringend ist um den gesamten<br />

inneren Spurdetektor zu passieren. So wird eine durchgehend gerade Teilchenbahn<br />

simuliert. Die Position dieser Signale kann auf 10 µm genau bestimmt und die Anordnung<br />

der Detektorlagen zu jedem gewünschten Zeitpunkt angegeben werden. Eine weitere<br />

Herausforderung ist die von der Elektronik erzeugte Abwärme abzuleiten, da diese den<br />

Spurdetektor aufheizen und damit störendes thermisches Rauschen verursachen würde.<br />

Aufgrund fehlender Atmosphäre muss die Abwärme von einem CO 2 -Kreislauf aufgenommen<br />

und zu großen Radiatoren an der Außenseite des AMS-02 Detektors geleitet werden.<br />

Das Temperatur Kontrollsystem des Spurdetektors (TTCS 5 ) ist dabei in der Lage die<br />

Temperatur des Spurdetektors innerhalb eines Grads konstant zu halten.<br />

3.5. Der Antikoinzidenz Zähler (ACC)<br />

Um bei einem isotropen Teilchenfluss durch den Detektor von etwa 10000 Teilchen pro<br />

Sekunde nur für die Analyse interessante Trigger von in z-Richtung passierenden Teilchen<br />

abzuspeichern, ist der innere Spurdetektor zylindrisch von 16 Szintillatorbahnen umgeben,<br />

dem sogenannten Antikoinzidenz Zähler (ACC 6 ). Fällt ein Teilchen seitlich in den Spurdetektor<br />

ein, so wird in diesen Szintillatorbahnen mit hoher Effizienz Szintillationslicht<br />

produziert und zu Photomultipliern weitergeleitet. Events, die solche Teilchen enthalten,<br />

können damit aussortiert werden. Dies ist wichtig, da diese Teilchen Signale im Spurdetektor<br />

hinterlassen, die dann der Teilchenspur eines von oben nach unten passierenden<br />

Teilchens zugeordnet werden können und damit die Rigiditätsbestimmung und speziell die<br />

Messung des Ladungsvorzeichens verfälschen.<br />

Um nicht zusätzlich hochenergetische Teilchen oder Teilchen hoher Ladung in z-Richtung<br />

zurückzuweisen, die durch Wechselwirkung mit Spurdetektor, Flugzeitdetektor oder der<br />

Trägerkonstruktion Delta-Elektronen 7 erzeugen können, wird außerdem das Signal der<br />

5 engl.: Tracker Thermal Control System<br />

6 engl.: Anti Coincidence Counter<br />

7 Sekundärelektronen in einem breiten Energiebereich<br />

20


3.6. Der Ring abbildende Tscherenkow Detektor (RICH) 21<br />

Flugzeitdetektoren für den Vetotrigger verwendet. Abbildung 3.8 zeigt verschiedene Triggerkonfigurationen.<br />

Abbildung 3.8.: Ein seitlich einfallendes Teilchen, das vom ACC zurückgewiesen wird<br />

(links), ein Teilchen hoher Ladung, das Delta-Elektronen erzeugt (Mitte)<br />

sowie ein Backsplash Event (rechts), welche angenommen werden [25].<br />

3.6. Der Ring abbildende Tscherenkow Detektor (RICH)<br />

Durchquert ein geladenes Teilchen ein Medium mit relativistischer Geschwindigkeit β,<br />

welche größer ist als die Phasengeschwindigkeit elektromagnetischer Wellen v = c n<br />

im<br />

Medium, wobei c die Vakuumlichtgeschwindigkeit von c = 299792458 m/s und n der<br />

Brechungsindex des Mediums ist, so werden Atome längs der Flugbahn des Teilchens<br />

kurzzeitig polarisiert und senden dabei eine charakteristische Strahlung aus. Dies ist die<br />

sogenannte Tscherenkow 8 Strahlung. Diese Strahlung breitet sich Kegelförmig entlang der<br />

Flugbahn in Bewegungsrichtung aus, wobei der Öffnugnswinkel θ mit der Geschwindigkeit<br />

des Teilchens und dem Brechungsindex des Mediums verknüpft ist<br />

cos(θ) = 1<br />

n · β . (3.3)<br />

Eine Skizze zur Ausbreitung der Tscherenkow Strahlung ist in Abbildung 3.9 zu sehen.<br />

Der Ring abbildende Tscherenkow Detektor (RICH 9 ) macht sich diesen Effekt zunutze.<br />

Er enthält eine Radiatorschicht aus 2, 7 cm dickem Aerogel im äußeren Bereich mit ei-<br />

Abbildung 3.9.: Skizze zur Ausbreitung von Tscherenkow Strahlung [26].<br />

8 engl.: Cherenkov<br />

9 engl.: Ring Imaging Cherenkov Detector<br />

21


22 3. Der AMS-02 Detektor<br />

nem Brechungsindex zwischen 1, 03 und 1, 05, sowie eine 5 mm dicke und 35cm × 35cm<br />

große Natriumfluorid-Schicht im Zentrum mit Brechungsindex 1, 335. Das ausgesendete<br />

Tscherenkow-Licht wird dann von einer Lage aus 680 Multi-Anoden Photomultipliern<br />

detektiert. In dieser Lage mit einem Durchmesser von etwa 118, 5 cm befindet sich eine<br />

64cm × 64cm große Aussparung, um Messungen des darunterliegenden Kaloriemeters<br />

nicht zu beeinflussen. Die zuvor erwähnte Natriumfluorid-Schicht mit sehr hohem Brechungsindex<br />

und damit großem Winkel des Tschwerenkow-Kegels sorgt hier dafür, dass<br />

Tscherenkow-Licht von Teilchen, die innerhalb dieser Fläche passieren, trotzdem die Photomultiplier<br />

erreichen kann. Um die Akzeptanz zu erhöhen, ist der 47 cm hohe Freiraum zwischen<br />

Radiator- und Detektorschicht am Rand verspiegelt. Das Licht wird also reflektiert<br />

und der Ring, als Schnittfläche durch den Tscherenkow-Lichtkegel in der Detektorschicht<br />

kann rekonstruiert werden. Aufbau und Funktion des Ring abbildenden Tscherenkow Detektors<br />

sind in Abbildung 3.10 zu sehen. Aus dem Durchmesser des aufgenommenen Rings<br />

Abbildung 3.10.: Skizze der Funktionsweise des RICH (links) und Foto der einzelnen Bestandteile<br />

vor dem Zusammenbauen (rechts) [27].<br />

kann nun also die Geschwindigkeit des Teilchens mit einer Auflösung von 0, 1% für Teilchen<br />

mit Ladungszahl Z = 1 und 0, 01% für Kerne mit Ladungszahl Z > 1 bestimmt werden.<br />

Außerdem kann anhand der Intensität des Tscherenkow-Lichtes die Ladungszahl Z mit<br />

einer Auflösung von 10% bestimmt werden. Aus diesen Größen und der Rigidität R kann<br />

man nun die Masse des Teilchens nach<br />

berechnen.<br />

m = R · Z<br />

√<br />

1 − β 2<br />

β<br />

(3.4)<br />

3.7. Das elektromagnetische Kalorimeter (ECAL)<br />

Am unteren Ende des AMS-02 Detektors befindet sich das elektromagnetische Kalorimeter<br />

(ECAL 10 ). Dieses ist ein aus 1 mm dicker Bleifolie im Wechsel mit einer Lage aus Szintillationsfasern<br />

mit einem Durchmesser von 1 mm und mit Epoxydharz verklebter Block von<br />

10 engl.: Electromagnetic calorimeter<br />

22


3.7. Das elektromagnetische Kalorimeter (ECAL) 23<br />

16, 7 cm Höhe und einer Grundfläche von 64, 8cm × 64, 8cm. Die durchschnittliche Dichte<br />

beträgt 6, 9 g/cm 3 [28]. Elf Schichten aus Bleifolie und zehn Lagen Szintillationsfasern werden<br />

dabei zu einem sogenannten Superlayer mit einer Höhe von 18, 5 mm zusammengefasst.<br />

Insgesamt besteht das elektromagnetische Kalorimeter aus neun solcher Superlayer, wobei<br />

vier parallel zur x-Richtung und fünf Superlayer parallel zur y-Richtung abwechselnd angeordnet<br />

sind. Innerhalb eines Superlayers sind 35 Szintillationsfasern zu sogenannten Zellen<br />

zusammengefasst. Vier solcher Zellen werden von einem Photomultiplier ausgelesen. Insgesamt<br />

wurden 324 Photomultiplier für 1269 Zellen verbaut. In Abbildung 3.11 ist rechts<br />

ein Querschnitt durch einen solchen Superlayer und links die Anordnung der Superlayer<br />

gezeigt. Das Kalorimeter kann nun aufgrund der unterschiedlichen Wechselwirkungen von<br />

Abbildung 3.11.: Anordnung von drei Superlayern in wechselnder x-y Ausrichtung (links)<br />

und Querschnitt eines Superlayers mit als Zelle gruppierten Szintillationsfasern<br />

(rechts) [29].<br />

hochenergetischen Teilchen mit dem Bleiabsorber Leptonen, Hadronen und Photonen voneinander<br />

unterscheiden. Ein durchdringendes Elektron oder Positron löst dabei einen elektromagnetischen<br />

Schauer, dominiert von Bremsstrahlung und e − /e + -Paarbildung, aus. Ein<br />

Proton zerfällt durch Kern-Kern Wechselwirkungen hauptsächlich in Pionen und Kaonen<br />

und löst somit einen hadronischen Schauer aus. Diese hadronsichen Schauer sind durch ihre<br />

hohe Teilchenzahl wesentlich weiter gestreut und unterscheiden sich in ihrer Energieabgabe<br />

von eher gerichteten elektromagnetischen Schauern. Diese unterschiedlichen Schauerverhalten<br />

sind in Abbildung 3.12 dargestellt. Das elektromagnetische Kalorimeter kann eine<br />

Abbildung 3.12.: Skizze des Kaloriemeters mit Abmessungen und Ausbreitung hadronischer<br />

(blau) und elektromagnetischer Schauer (rot).<br />

vollständige 3D Rekonstruktion des Schauers erstellen und somit einen wichtigen Beitrag<br />

zur Trennung von Positronen und Protonen liefern. Die Höhe des Kalorimeters entspricht<br />

dabei 17 Strahlungslängen und nur 0, 6 nuklearen Absorbtionslängen. So werden Positronen<br />

mit sehr hoher Wahrscheinlichkeit einen Schauer auslösen und dieser wird im Idealfall<br />

vollständig absorbiert. Die meisten Protonen werden hingegen keinen Schauer auslösen und<br />

nur einen Bruchteil ihrer Energie durch Ionisation im Kalorimeter deponieren. Hochenergetische<br />

Photonen werden ebenfalls einen elektromagnetischen Schauer auslösen, jedoch in<br />

den anderen Subdetektoren kein Signal hinterlassen und können somit identifiziert werden.<br />

Für vollständig absorbierte Schauer kann das Kalorimeter auch die Gesamtenergie des einfallenden<br />

Teilchens angeben, was hauptsächlich bei Elektronen und Positronen mit Ener-<br />

23


24 3. Der AMS-02 Detektor<br />

gien bis zu 1 TeV der Fall ist.<br />

3.8. Teilchensignaturen<br />

Die Signale der beschriebenen Subdetektoren sind in Abbildung 3.13 für die wichtigsten<br />

Teilchen der kosmischen Strahlung und Antihelium bei gleicher Energie von 300 GeV zusammengefasst.<br />

Dabei stehen die angedeuteten Ausschläge nach unten bei TRD und TOF<br />

für Energieabgaben in diesen Subdetektoren. Für den Übergangsstrahlungsdetektor erhält<br />

Abbildung 3.13.: Signaturen von Teilchen bei 300 GeV in den einzelnen Subdetektoren des<br />

AMS-02 Detektors [18].<br />

man für die beiden Leptonen, Elektron und Positron, Übergangsstrahlung in der Intensität<br />

proportional zu deren Gammafaktor, während Protonen und Helium nur ein, hier nicht gezeigtes,<br />

sehr geringes Ionisationssignal hinterlassen. Photonen hinterlassen als ungeladene<br />

Teilchen keine Spuren im gesamten Detektor, können aber im Kalorimeter durch Ionisation<br />

einen elektromagnetischen Schauer auslösen. Außerdem können sie über Paarbildung in<br />

ein Elektron und ein Positron zerfallen und so nachgewiesen werden. Im Flugzeitdetektor<br />

können Teilchen durch ihre Energieabgabe pro Weglänge, die proportional zur getragenen<br />

Ladung im Quadrat ist, charakterisiert werden. Dies ist auch im Spurdetektor möglich,<br />

was anhand der dickeren Spur des Heliums dargestellt ist. Dort wird außerdem das Ladungsvorzeichen,<br />

als einzige Möglichkeit Elektronen von Positronen, oder Helium von Antihelium<br />

zu unterscheiden, bestimmt. Der Ring abbildende Tscherenkow Detektor kann die<br />

Ladung durch die Intensität des Ringes, sowie die Geschwindigkeit über den Ringdurchmesser<br />

bestimmen. Da Helium bei gleicher Gesamtenergie eine geringere Geschwindigkeit<br />

als Protonen oder Leptonen besitzt, ist der Ring hier deutlich größer. Zuletzt folgt das<br />

elektromagnetische Kalorimeter, in dem wie beschrieben elektromagnetische Schauer von<br />

hadronischen Schauern unterschieden werden. In der Abbildung lösen Protonen und Helium<br />

gar keinen Schauer aus und hinterlassen einzig ihr Ionisationssignal proportional zur<br />

Kernladungszahl.<br />

Aus Abbildung 3.13 wird deutlich, dass ein Subdetekor alleine nicht alle Teilchen voneinander<br />

trennen kann. Erst durch das Zusammenspiel aller Subdetektoren kann jeder<br />

Bestandteil der kosmischen Strahlung identifiziert werden.<br />

In Abbildung 3.14 und 3.15 sind ein Elektron und ein Proton Ereignis bei einer Energie<br />

von etwa 90 GeV im Ereignismonitor zu sehen, der in der AMS Software integriert ist.<br />

24


3.8. Teilchensignaturen 25<br />

AMS Event Display Run/Event 1349332598 / 215920 GMT Time 2012-278.06:46:51<br />

Front<br />

Side<br />

DAQ<br />

DAQ<br />

z<br />

Header<br />

z<br />

Header<br />

x<br />

y<br />

Level1<br />

y<br />

x<br />

Level1<br />

Level3<br />

Level3<br />

Particle TrTofTrdTrdHRichRichBEcal No 0 Id=146 p= -92.6±<br />

63 M= 20.4±<br />

o<br />

20 θ=2.90 φ=2.59 Q= 1 β= 0.977± 0.032/ 0.98/ βh= 0.971± 0.037 θ_M -36.8 Coo=(16.63,-27.87,53.04) LT 0.88 θ_G 1.22 φ_G 4.22<br />

TrTrack #0 NHits 6 (x:4,y:6,xy:4)Pattern: 57 _XXXXXX__, DefFit: 17, Chi2 3.704 Pirig -105.370Rigidity: -92.605 Err(1/R): 0.00729 P0: 5.361 -20.912 0.000 Dir: 0.2061 -0.1274 0.9702<br />

Abbildung 3.14.: Ereignismonitor eines Elektrons mit einer Rigidität von −92, 6 GV, aufgenommen<br />

am 04. Oktober 2012.<br />

AMS Event Display Run/Event 1349332598 / 626474 GMT Time 2012-278.06:54:11<br />

Front<br />

Side<br />

DAQ<br />

DAQ<br />

z<br />

Header<br />

z<br />

Header<br />

x<br />

y<br />

Level1<br />

y<br />

x<br />

Level1<br />

Level3<br />

Level3<br />

Particle TrTofTrdRichRichBEcal No 0 Id=46 p= 83.3±<br />

7.1 M= 32.9±<br />

o<br />

8.3 θ=3.04 φ=2.91 Q= 1 β= 0.930± 0.030/ 0.93/ βh= 0.938± 0.041 θ_M -56.7 Coo=(47.02,-5.14,53.05) LT -1.00 θ_G 0.99 φ_G 4.54<br />

TrTrack #0 NHits 8 (x:7,y:8,xy:7)Pattern: -1 XXXXX_XXX, DefFit: 3089, Chi2 1.442 Pirig 82.592Rigidity: 83.264 Err(1/R): 0.00102 P0: 41.509 -3.866 0.000 Dir: 0.1034 -0.0238 0.9944<br />

Abbildung 3.15.: Ereignismonitor eines Protons mit einer Rigidität von 83, 3 GV, aufgenommen<br />

am 04. Oktober 2012.<br />

25


4. Der Übergangsstrahlungsdetektor<br />

In diesem Kapitel soll auf den bereits in Teil 3.1 angesprochenen Übergangsstrahlungsdetektor<br />

näher eingegangen werden. Aufgrund seiner Fähigkeit relativistische Teilchen nach<br />

deren Masse zu trennen, ist er für die Trennung von Positronen und Protonen bei hohen<br />

Energien besonders geeignet. Wie bereits beschrieben sind Protonen der Hauptbestandteil<br />

kosmischer Strahlung und damit der dominierende Untergrund bei der Messung von Positronen.<br />

Bei einem Verhältnis des Protonen- zu Positronenflusses von 10 3 −10 4 wird dabei<br />

eine Protonenunterdrückung von 10 6 angestrebt um die Verunreinigung durch Protonen<br />

im Positronenspektrum unter 1% zu halten.<br />

Um eine maximale Effizienz zu erreichen, besitzt der TRD eine oktogonale Form mit einem,<br />

sich nach unten hin verkleinernden, Durchmesser des Inkreises von 2 m auf der Oberseite<br />

und 0, 8 m auf der Unterseite.<br />

Auch wenn die Technik Teilchen anhand emittierter Übergangsstrahlung zu detektieren<br />

wohl bekannt ist und in einigen teilchenphysikalischen Experimenten wie dem ATLAS<br />

Detektor am LHC oder HERA-B am DESY in Hamburg verwendet wird, ist der Betrieb<br />

des Übergangsstrahlaungsdetektors als komplexer Gasdetektor im Weltraum dennoch eine<br />

Herausforderung.<br />

4.1. Entstehung von Übergangsstrahlung<br />

Zur Beschreibung der Entstehung von Übergangsstrahlung beim Grenzübergang eines geladenen<br />

Teilchens zwischen Materialien unterschiedlicher Permitivität werden unterschiedliche<br />

Modelle herangezogen. Eine physikalisch leicht nachzuvollziehende Annahme postuliert<br />

eine Spiegelladung, die durch Polarisation des Mediums durch das herannahende geladene<br />

Teilchen induziert wird. Beide Ladungen bilden so einen elektrischen Dipol, wie er in Abbildung<br />

4.1 dargestellt ist. Durch die Bewegung des Teilchens verändert sich dieser Dipol<br />

und strahlt somit Energie in Form elektromagnetischer Wellen ab.<br />

Ein anderer Ansatz basiert auf den Lösungen der inhomogenen Maxwellgleichungen in beiden<br />

Medien, welche sich durch einen Term mit der elektrischen Polarisation im Medium<br />

unterscheiden. Beim Übergang zwischen zwei Stoffen muss dann eine Umordnung der vom<br />

Teilchen erzeugten Felder stattfinden, bei der die Differenzenergie abgestrahlt wird. Die<br />

Intensität der abgestrahlten Photonen ist dabei<br />

I = γq2 (ω 1 − ω 2 ) 2<br />

3c<br />

(4.1)<br />

27


28 4. Der Übergangsstrahlungsdetektor<br />

Abbildung 4.1.: Spiegelladung einer positiven Ladung an einer Grenzfläche [30].<br />

mit dem Lorentz-Faktor des Teilchens γ = E/mc 2 , seiner Ladung q und den Plasmafrequenzen<br />

ω 1,2 in beiden Materialien. Ein Großteil dieser Energie wird mit der Wahrscheinlichkeit<br />

von etwa α/3 in Form energiereicher Photonen im Röntgenbereich von 2 − 20<br />

keV innerhalb des Winkelbereichs θ ≤ 1/γ, des sogenannten Vorwärtskegels, abgestrahlt<br />

[31]. Dabei ist α = 1/137 die Feinstrukturkonstante. Gleichung 4.1 ist auch bei einem<br />

nichtrelativistischen Teilchen mit γ ∼ 1 ungleich null. Damit wird Übergangsstrahlung,<br />

anders als beispielsweise beim Tscherenkow Effekt, auch bei niedrigen Geschwindigkeiten<br />

abgestrahlt. Bei vielen Grenzübergängen werden dann mit einer ausreichend großen Wahrscheinlichkeit<br />

Photonen mit einer direkt zum Lorentz-Faktor des Teilchens proportionalen<br />

Intensität emittiert. Diese können bei bekannter Energie zur Unterscheidung von Teilchen<br />

nach deren Masse verwendet werden.<br />

4.2. Aufbau des Detektors und Messung von Übergangsstrahlung<br />

Als Radiator im Übergangsstrahlungsdetektor des AMS-02 Experiments sind 20 Lagen<br />

aus Vlies, bestehend aus Polypropylen- und Polyethylen-Fasern, mit einer Dicke von 20<br />

mm und einer Dichte von 0, 06 g/cm 3 verbaut. Die lose angeordneten und etwa 10 µm<br />

dicken Fasern ermöglichen eine hohe Zahl von Vakuum-Radiator Übergängen, so dass<br />

beim Durchqueren einer Lage Übergangsstrahlung mit einer Wahrscheinlichkeit von etwa<br />

60% ausgesendet und detektiert wird [32]. Die entstandene Übergangsstrahlung wird von<br />

Proportionaldrahtkammerröhrchen unterhalb jeder einzelnen Lage Vlies gemessen. Diese<br />

haben einen Durchmesser von 6 mm und eine Länge von 0, 8 − 2 m. Sie bestehen aus<br />

Kapton-Folie die mit Aluminium und Graphit als Kathode auf der einen und Polyurethan<br />

auf der anderen Seite beschichtet ist. Zwei solcher Folien werden jeweils Rücken an Rücken<br />

zusammengebracht und bilden somit eine 72 µm starke Hülle. Die einzelnen Schichten<br />

des Wandmaterials sowie der Fertigungsprozess der Röhrchen sind in Abbildung 4.2 zu<br />

sehen. Als Anodendraht wird ein 30 µm dicker Draht aus mit Gold beschichtetem Wolfram<br />

verwendet. Die Betriebsspannung im Proportionalbereich liegt im Bereich von etwa 1500<br />

V. 16 solcher Röhrchen sind zu einem Modul zusammengefasst. Zur Stabilität sind die<br />

Module mit 6 Versteifungen aus Karbon durchzogen, sowie mit Karbonband im Abstand<br />

von 10 cm gesichert. Ein Bild eines solchen Moduls in der Draufsicht und im Querschnitt<br />

mittels Computertomographie ist in Abbildung 4.3 zu sehen. Insgesamt wurden 328 Module<br />

und damit 5248 Proportionaldrahtkammerröhrchen in 20 Lagen verbaut. Die oberen und<br />

unteren vier Lagen sind dabei parallel zur x-Richtung, die restlichen Lagen um 90 ◦ gedreht<br />

in y-Richtung angeordnet, was eine drei-dimensionale Spurrekonstruktion ermöglicht. Die<br />

einzelnen Module sind in eine Oktogonale Trägerkonstruktion aus Aluminiumwaben mit<br />

Querstreifen aus Karbon zur Stabilität eingebettet. Der gesamte Subdetektor wiegt dank<br />

konsequenter Leichtbauweise nur 500 kg.<br />

Als Füllgas für die Proportionaldrahtkammern wird eine Mischung aus 90% Xenon und<br />

28


4.2. Aufbau des Detektors und Messung von Übergangsstrahlung 29<br />

Abbildung 4.2.: Schematische Darstellung der Zusammensetzung des Wandmaterials für<br />

eine Proportionalkammerröhre (links) und Veranschaulichung des Fertigungsprozesses<br />

(rechts) [33].<br />

Abbildung 4.3.: Foto eines Moduls in der Draufsicht (oben) und der Querschnitt mittels<br />

Computertomographie (unten) [32].<br />

10% Kohlenstoffdioxid verwendet. Einfallende Übergangsstrahlungsphotonen geben ihre<br />

Energie nach der Beziehung<br />

I = I 0 · e −µx (4.2)<br />

ans Detektorgas ab, wobei I 0 der Intensität des Photonenstrahls beim Eintritt in Materie<br />

entspricht, x die im Medium zurückgelegte Weglänge ist und µ ein vom jeweiligen<br />

Interaktionsprozess nach<br />

µ = N A<br />

A · (σ Ph + σ CS + σ Pb ) (4.3)<br />

abhängiger Absorptionskoeffizient. Der Absorptionskoeffizient µ hängt dabei von der Summe<br />

der einzelnen Wirkungsquerschnitte für die Wechselwirkungsprozesse Compton Streuung<br />

(CS), Photoeffekt (Ph) und Paarbildung (Pb) ab. Alle drei Prozesse finden in einem<br />

gewissen Energiebereich prinzipiell parallel statt wie in Abbildung 4.4 (a) am Beispiel von<br />

Blei als Absorber dargestellt ist. Dennoch ist abängig von der Energie des Photons und<br />

Material des Absorbers jeweils ein Prozess der dominierende. In Abbildung 4.4 (b) ist dies<br />

in Abhängigkeit der Kernladungszahl des Absorbers und der Photonenenergie dargestellt.<br />

Demnach ist für Übergangsstrahlungsphotonen mit Energien im Röntgenbereich bis zu<br />

20 keV, die sich durch das Xenongas mit einer Kernladungszahl von Z Xe = 54 bewegen<br />

der Photoeffekt dominierend. Bei diesem wird das einfallende Photon von einem Elektron<br />

in der Atomschale der Gasatome vollständig absorbiert und dieses Elektron wird mit der<br />

kinetischen Energie E kin = E Photon − E Bindung frei. Der Wirkungsquerschnitt ist mit<br />

σ ∝ Z 5 proportional zur Kernladungszahl des Absorbers. Xenon ist damit für die Detektion<br />

der Übergangsstrahlungsphotonen gut geeignet. Im äußeren elektrischen Feld wird<br />

29


30 4. Der Übergangsstrahlungsdetektor<br />

(a)<br />

(b)<br />

Abbildung 4.4.: (a) Energieabhängigkeit des Massenabsorptionskoeffizienten µ in Blei<br />

Z Pb = 82 und (b) Bereiche in denen Photoeffekt, Compton Effekt oder<br />

Paarbildung dominieren in Abhängigkeit der Kernladungszahl Z des Absorbers<br />

und der Photonenenergie [34].<br />

das freie Elektron dann zum Anodendraht hin beschleunigt. Das elektrische Feld nimmt<br />

durch die Zylindersymmetrie der Anordnung mit E(r) ∝ 1/r zur Mitte hin stark zu und<br />

beschleunigt Elektronen in der direkten Umgebung des Anodendrahtes so stark, dass diese<br />

durch weitere Ionisation eine Ladungslawine erzeugen. Diese löst bei Auftreffen auf den<br />

Draht ein messbares Signal proportional zur im Gas deponierten Energie aus. Da nur in<br />

direkter Umgebung des Anodendrahtes Lawinenbildung eintritt, ist die Verstärkung unabhängig<br />

vom Abstand des Ionisationspunktes. Die Gasverstärkung hängt jedoch von der<br />

Zusammensetzung und dem Druck des Gases, sowie der angelegten Hochspannung ab.<br />

Die Energieabgabe geladener Teilchen pro Weglänge dE/dx durch Ionisationsprozesse im<br />

Detektorgas lässt sich dabei durch die Bethe-Bloch-Formel<br />

− dE<br />

dx = 4πN Arem 2 e c 2 z 2 Z [<br />

1<br />

A β<br />

ln 2m ec 2 γ 2 β 2<br />

I<br />

− β 2 − δ 2<br />

]<br />

(4.4)<br />

mit<br />

z: Ladung des einfallenden Teilchens<br />

Z,A: Kernladungszahl und Massenzahl des Absorbers<br />

m e : Elektronenmasse<br />

r e : klassischer Elektronenradius r e = 1 e<br />

4πɛ 0<br />

· 2<br />

m ec 2<br />

N A : Avogadro-Konstante<br />

I: Für den Absorber charakteristische Ionisationskonstante<br />

beschreiben [34]. Protonen, die wenig Übergangsstrahlung aussondern werden daher in den<br />

Proportionaldrahtkammern nur ein Signal durch Ionisation hinterlassen, während Elektronen<br />

durch das Emittieren von Übergangsstrahlung wesentlich mehr Energie im Detektor<br />

deponieren. Die Verteilung der durch Ionisation deponierten Energie folgt dabei wie in<br />

Abbildung 4.5 gezeigt einer Landau Verteilung [35].<br />

4.3. Gassystem und Betrieb auf der ISS<br />

Wie beschrieben erfolgt der Nachweis geladener Teilchen und Übergangsstrahlungsphotonen<br />

durch Ionisation des dafür besonders geeigneten Xenongases. Das zugesetzte Kohlen-<br />

30


4.3. Gassystem und Betrieb auf der ISS 31<br />

3<br />

×10<br />

500<br />

400<br />

300<br />

200<br />

100<br />

Energiespektrum in Lage 6 bei 25 GeV<br />

Entries<br />

1.129837e+07<br />

Mean 104.7<br />

RMS 89.19<br />

Constant<br />

6.553e+07<br />

MPV 54.52<br />

Sigma 21.35<br />

0<br />

0 100 200 300 400 500 600<br />

Energieabgabe/ADC<br />

Abbildung 4.5.: Energieabgabe aller Teilchen im Energiebereich um 25 GeV in Lage 6 mit<br />

angepasster Landau-Verteilung im Ionisationsbereich (rot).<br />

stoffdioxid wirkt dabei als Löschgas, das ab einer bestimmten Schwelle durch inelastische<br />

Stöße mit Elektronen zu eigenen Schwingungszuständen angeregt wird und diesen damit<br />

Energie entzieht. Damit wird weitere Lawinenbildung unterbunden. Die Herausforderung<br />

im Betrieb eines Gasdetektors im Vakuum des Weltraums liegt dabei darin, Gasverlust<br />

durch Diffusion und undichte Stellen möglichst gering zu halten. Um eventuell vorhandene<br />

Gasverluste dennoch ausgleichen zu können, führt der Detektor Gasreserven von 49, 5<br />

kg Xenon und 4, 5 kg Kohlenstoffdioxid in einem eigenen Gassystem mit sich, die für die<br />

Restlaufzeit des Experimentes ausreichen. Eine schematische Darstellung dieses Gassystems<br />

ist in Abbildung 4.6 zu sehen. Dieses besteht demnach aus der sogenannten Box-S 1 ,<br />

in der die Gasreserven aufbewahrt und bei Bedarf im 1 Liter fassenden Mischbehälter<br />

im richtigen Verhältnis gemischt und an die Box-C 2 weitergegeben werden, von wo aus<br />

das Gas mit Pumpen kontrolliert in das Gassystem des Hauptdetektors transferiert wird.<br />

Jede Gaszuleitung und jedes Ventil in Box-S und Box-C ist dabei unabhängig zweifach<br />

vorhanden um mögliche Defekte kompensieren zu können. Außerdem werden Temperatur<br />

und Druck im Gassystem an verschiedenen Stellen gemessen um einen einwandfreien Betrieb<br />

zu gewährleisten. Kontrolliert wird dies, sowie alle anderen wichtigen Funktionen des<br />

AMS-02 Detektors, im Schichtbetrieb in einem eigens dafür eingerichteten Kontrollzentrum<br />

(POCC 3 ) in Genf auf dem Gelände des CERN und eines vollständig ausgerüsteten zweiten<br />

Kontrollzentrums in Taiwan. Eine Foto des Kontrollraums mit Beschreibung der einzelnen<br />

Schichtpositionen ist in Abbildung 4.7 zu sehen. Von dort werden auch TRD-Operationen<br />

wie das Nachfüllen des Gases (gas refill) und die Anpassung der Spannung in den Proportionaldrahtkammern<br />

(high voltage adjustment) durchgeführt. Um trotz Gasverlusten<br />

eine stabile Gasverstärkung zu gewährleisten wird diese Spannungsanpassung täglich vom<br />

zuständigen TRD-Experten durchgeführt. Dabei wird eine in der Detektorelektronik gespeicherte<br />

Konfigurationsdatei mit neuen Parametern für die Hochspannungswerte der<br />

einzelnen Kanäle gelöscht und neu geschrieben. Ziel ist es den wahrscheinlichsten Wert<br />

1 engl.: Storage<br />

2 engl.: Circulate<br />

3 engl.: Payload Operation Control Center<br />

31


32 4. Der Übergangsstrahlungsdetektor<br />

Abbildung 4.6.: Darstellung des Gassystems bestehend aus der Box-S, der Box-C und dem<br />

Gaskreislauf des Hauptdetektors bestehend aus 41 Segmenten [32].<br />

(MPV 4 ), wie in Abbildung 4.5 definiert als Spitze der Laundau-Verteilung der deponierten<br />

Ionisationsenergie dE/dx von Protonen auf einem stabilen Wert von 60 Analog-Digital<br />

Zählwerten (ADC 5 ) zu halten. Ein Bildschirmfoto des zur Ausgabe des benötigten Korrekturwertes<br />

entwickelten Programms ist in Abbildung 4.8 zu sehen. Für die Anpassung muss<br />

die Datennahme gestoppt und im Anschluss die automatische Kalibrierung des Detektors<br />

vor jedem Äquatorübergang durchgeführt werden, was eine Zusammenarbeit mit der<br />

Schichtleitung 6 erfordert, da Rechte zur Übertragung von Befehlen (command) benötigt<br />

werden. Die für den TRD zuständige Position (TEE) ist außerdem für die Überwachung<br />

des Antikoinzidenzzählers und Spurdetektors, sowie dessen Temperaturkontrollsystems zuständig.<br />

Dazu wurden spezielle auf die Positionen angepasste Computerprogramme entwickelt,<br />

die benötigte Daten nahezu in Echtzeit anzeigen. Im Rahmen dieser Diplomarbeit<br />

wurde diese Schichtposition besetzt und Hochspannungsanpassungen als TRD-Experte in<br />

eigener Verantwortung durchgeführt.<br />

Für die Datennahme ist der Orbit der ISS in vier Teile, in sogenannte Runs geteilt. Ein<br />

Run ist dabei ein Intervall in dem Datennahme betrieben wird und verläuft für gewöhnlich<br />

zwischen Äquator und Pol und endet, bzw. beginnt dort. Ein Run dauert dabei etwa 23<br />

Minuten.<br />

4.4. Kalibrierung<br />

Durch die täglichen Hochspannungsanpassungen und den in etwa alle 4 Wochen durchgeführten<br />

gas refill kann die Gasverstärkung nur grob auf einem konstanten Level gehalten<br />

werden, wie in Abbildung 4.8 ersichtlich ist. Um mit den Messwerten Analysen durchführen<br />

zu können muss eine genauere Kalibrierung der Gasverstärkung 7 für jeden Run<br />

4 engl.: Most Probable Value<br />

5 engl.: Analog digital counts<br />

6 engl.: LEAD<br />

7 engl.: Gain calibration<br />

32


4.4. Kalibrierung 33<br />

Abbildung 4.7.: Foto des AMS-02 POCC auf dem Gelände des CERN in Genf [36]. Die einzelnen<br />

Schichtpositionen sind in rot gekennzeichnet. Dabei ist ”Data” für<br />

die Überwachung der Datenübertragung von der ISS zum CERN, über<br />

einzelne Zwischenstationen zuständig. ”LEAD” dient als Schichtleitung<br />

und ist Schnittstelle für die Kommunikation mit der NASA. ”PM” ist<br />

für Ecal, RICH und TOF verantwortlich, ”TEE” überwacht Spurdetektor,<br />

ACC und TRD. ”Thermal” kontrolliert die Temperatursituation im gesamten<br />

Detektor, welche stark mit dem Winkel des Detektors zur Sonne<br />

korreliert und kann gegebenenfalls nach Rücksprache mit der Schichtleitung<br />

Heizungen zu- und abschalten, oder die NASA bitten die Position der<br />

Solarpanele oder Radiatoren der ISS so zu verändern, dass diese entweder<br />

Schatten spenden, oder Zufuhr von Sonnenlicht ermöglichen. Außerdem<br />

befindet sich im POCC noch eine Position für das Offline Computing,<br />

die im Bild nicht eingefangen wurde und wo die Ereignisrekonstruktion<br />

überwacht wird.<br />

33


34 4. Der Übergangsstrahlungsdetektor<br />

Abbildung 4.8.: Bildschirmfoto des Programms zur Ermittlung des Korrekturwertes zur<br />

Hochspannungsanpassung. Aufgetragen ist der wahrscheinlichste Wert der<br />

deponierten Energie über einen Zeitraum (hier zwei Wochen). Der Wert<br />

schwankt um etwa 60 ADC, wobei ein etwa linearer Anstieg mittels Hochspannungsanpassungen<br />

kompensiert wird. In rot ist eine lineare Anpassung<br />

an die Daten zu sehen, die vom Programm ausgegeben wird und den<br />

Korrekturwert bestimmt (hier −3 V).<br />

durchgeführt werden. Da die in den Proportionaldrahtkammerröhrchen deponierte Energie<br />

von der in den Röhrchen zurückgelegten Weglänge abhängt, müssen außerdem kleinste<br />

zeitabhängige Verschiebungen der Detektorkonstruktion, beispielsweise durch Temperaturschwankungen,<br />

im 100 µm-Bereich korrigiert werden (alignment), um diese Weglänge<br />

korrekt angeben zu können. Für diese Aufgaben werden in der AMS-02 Software Lösungen<br />

zur Korrektur in Form der TrdQt von der RWTH Aachen und TrdKCalib vom Massachusetts<br />

<strong>Institut</strong>e of Technology (MIT) bereitgestellt. Auf die von der Software durchgeführten<br />

Schritte wird hier nur am Beispiel der TrdKCalib eingegangen, um einen Überblick über<br />

deren Arbeitsweise zu geben.<br />

Für die Kalibrierung der Gasverstärkung wird, wie bei der in Teil 4.3 für das high voltage<br />

adjustment beschriebenen Methode, das ADC Spektrum pro Proportionaldrahtkammerröhrchen<br />

für einen Run gemessen und auf einen wahrscheinlichsten Wert von 60 ADC<br />

Zählwerten normiert. So wird das in Abbildung 4.8 dargestellte Spektrum im Nachhinein<br />

weiter geglättet.<br />

Für das alignment wird die vom Spurdetektor gemessene Teilchenspur in den Übergangsstrahlungsdetektor<br />

fortgesetzt und der Detektor virtuell so verschoben, dass dessen Signale<br />

mittels eines Minimierungsverfahrens einen möglichst kleinen Abstand zu dieser Spur haben.<br />

So werden sechs zeitabhängige Korrekturparameter zur Translation dx, dy und dz und<br />

zur Rotation α, β und γ berechnet und auf die einzelnen Signalorte angewendet. Dabei<br />

unterscheidet man zwischen Bewegungen auf einer langen und einer kurzen Zeitbasis. Auf<br />

einer langen Zeitbasis werden Events in einem 12 Stunden Zeitintervall ausgewertet und<br />

damit eine Kalibrierung für jede einzelne Lage des Übergangsstrahlungsdetektors durchgeführt.<br />

In Abbildung 4.9 ist die Verschiebung in x-Richtung exemplarisch für die Lagen 4, 10<br />

und 14 auf dieser Zeitbasis veranschaulicht. Ähnliche Trends sind in den Auftragungen für<br />

die restlichen fünf Korrekturparameter zu sehen. Außerdem folgen diese augenscheinlich<br />

34


4.5. Unterscheidung von Protonen und Positronen 35<br />

Abbildung 4.9.: Auftragung der Verschiebung dx in x-Richtung von Lage 4, 10 und 14 auf<br />

langer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 30 Tage.<br />

Abbildung 4.10.: Auftragung der Verschiebung des gesamten Detektors dx in x-Richtung<br />

auf kurzer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 2<br />

Stunden.<br />

für alle Lagen demselben Trend, was eine Bewegung des Übergangsstrahlungsdetektors als<br />

starrer Körper ergibt. Diese Annahme wird aus Mangel an Daten auch für Korrekturen<br />

auf kurzer Zeitbasis von etwa 5 Minuten gemacht. Dies ist in Abbildung 4.10 dargestellt.<br />

Hier kann man die Bewegung des Detektors mit jedem Orbit von 1, 5 Stunden sehen. Mit<br />

diesen Methoden kann eine Kalibrierung mit einer Genauigkeit von 30 − 40 µm für die<br />

TrdKCalib durchgeführt werden.<br />

4.5. Unterscheidung von Protonen und Positronen<br />

Um nun mithilfe des Übergangsstrahlungsdetektors Analysen durchführen zu können, müssen<br />

die von der Elektronik ausgegebenen ADC Signale A ADC mit dem zeitabhängigen<br />

Gasverstärkungsfaktor f G multipliziert und die dreidimensionale Pfadlänge durch das Gas<br />

x path nach dem alignment ermittelt werden. Damit kann, mit dem bekannten Durchmesser<br />

der Proportionaldrahtkammerröhrchen d, nach<br />

A PLCorr = A ADC · f G ·<br />

d<br />

x path<br />

(4.5)<br />

eine lineare Pfadlängen- und Gasverstärkungskorrektur durchgeführt werden, die zu einem<br />

zeitlich und örtlich unabhängigen Wert für die ADC Signale A PLCorr führt.<br />

35


hEle_mean_25<br />

Entries 19229<br />

Mean 365.8<br />

RMS 89.31<br />

36 4. Der Übergangsstrahlungsdetektor<br />

Ein normiertes Spektrum dieser Werte, im Folgenden als Energieabgabe im Übergangsstrahlungsdetektor<br />

bezeichnet, aus Flugdaten im Energiebereich um 25 GeV für Lage 6<br />

ist in Abbildung 4.11 dargestellt. Dabei wurde eine Unterteilung in Elektronen (blau), die<br />

für den Übergangsstrahlungsdetektor wie Positronen aussehen, und Protonen (rot) vorgenommen.<br />

Zu sehen ist ein Ausschlag im Ionisationsbereich mit einem Ausläufer in den<br />

Röntgenbereich der Übergangsstrahlung. Dieser ist bei Elektronen wesentlich stärker ausgeprägt.<br />

Die Wahrscheinlichkeit Energie im Röntgenbereich der Übergangsstrahlung zu<br />

emittieren ist demnach für Elektronen mit einer Energie von etwa 25 GeV ungefähr 10<br />

mal höher als für Protonen derselben Energie. Im Mittelwert der 20 Detektorlagen führt<br />

dies bereits zu einer beeindruckenden Separation der Populationen von Elektronen und<br />

Positronen, wie sie in Abbildung 4.12 dargestellt sind.<br />

Abbildung 4.11.: Auf eins normiertes Spektrum der Energieabgabe von Elektronen (blau)<br />

und Protonen (rot) im Energiebereich um 25 GeV in Lage 6.<br />

0.1<br />

0.08<br />

Elektronen<br />

Protonen<br />

0.06<br />

0.04<br />

0.02<br />

0<br />

0 100 200 300 400 500 600 700 800<br />

Mittlere Energieabgabe/ADC<br />

Abbildung 4.12.: Auf eins normiertes Spektrum des Mittelwertes der Energieabgabe in den<br />

20 Detektorlagen von Elektronen (blau) und Protonen (rot) im Energiebereich<br />

um 25 GeV.<br />

36


5. Statistische Methoden<br />

Aus den Messungen des Übergangsstrahlungsdetektors erhält man nach Teil 4.5 für jede<br />

der 20 Lagen die Energieabgabe innerhalb dieser Lage als reellen Zahlenwert. Gegenstand<br />

dieser Arbeit ist es, die Energieabgaben in den einzelnen Lagen zu interpretieren und entsprechend<br />

der Natur des Events eine Einteilung in Positronen und Protonen vorzunehmen.<br />

Statistisch gesehen ist eine bestimmte Energieabgabe in einer Lage innerhalb eines Intervalls<br />

dE eine zufällige Zahl, wobei der Grad der Häufigkeit durch die Wahrscheinlichkeit<br />

P p,e (∆E) beschrieben wird. Die Größe Wahrscheinlichkeit ist dabei eine reelle Zahl im<br />

Intervall [0, 1] und so definiert, dass ein sicheres Ereignis die Wahrscheinlichkeit 1 besitzt<br />

und sich einzelne Wahrscheinlichkeiten, zum Beispiel die Wahrscheinlichkeit der Energieabgabe<br />

einem der Bereiche dE i , addieren lassen solange sich die Energieintervalle dE i nicht<br />

überlappen, das heißt die Menge der Energieintervalle disjunkt ist<br />

∑<br />

P p,e (∆E i ) = P p,e ( ∑<br />

i<br />

i<br />

∆E i ). (5.1)<br />

Diese Definitionen von Wahrscheinlichkeit sind als Axiome von Kolmogorow bekannt. Die<br />

Wahrscheinlichkeit P p,e (dE) ergibt sich dabei aus der sogenannten Wahrscheinlichkeitsdichte<br />

f(E) mit dem Integral über das Energieintervall dE<br />

∫<br />

P p,e (∆E) =<br />

∆E<br />

f(E)dE. (5.2)<br />

Die Wahrscheinlichkeitsdichtefunktion f(E) ist dabei so normiert, dass ihre Gesamtfläche<br />

im gesamten Ereignisraum E gleich<br />

∫<br />

E<br />

f(E)dE = 1 (5.3)<br />

ist [38]. Die in Abbildung 4.11 gezeigten Spektren entsprechen also nach den Gleichungen<br />

5.1-5.3 durch das Zusammenfassen der gezählten Werte in Intervalle (Bins) und anschließendes<br />

Normieren auf eins einer diskreten Wahrscheinlichkeitsdichteverteilung. Man<br />

beachte den Unterschied zwischen einer Wahrscheinlichkeitsdichte und einer Wahrscheinlichkeitsverteilung<br />

als Integral der Wahrscheinlichkeitsdichte.<br />

Die Energieabgaben der 20 Lagen müssen demnach den Wahrscheinlichkeitsdichteverteilungen<br />

von Leptonen oder Protonen zugeordnet werden.<br />

37


38 5. Statistische Methoden<br />

5.1. Hypothesentests<br />

Ziel eines Hypothesentests ist es eine Aussage über die Vereinbarkeit einer Messung mit<br />

einer bestimmten Hypothese H 0 , beispielsweise ”<br />

die Messdaten entsprechen denen, die für<br />

ein Positron erwartet werden“, zu machen. Die Messung wird dabei in der Form eines<br />

Satzes von Variablen x = {x 1 , x 2 , ..., x n } geschrieben, wobei x i einem einzelnen Messwert<br />

entspricht und n die Anzahl der aufgenommenen Messwerte pro Ereignis ist, also<br />

die Dimensionalität des Parameterraumes darstellt. Die Hypothese H 0 wird in der Regel<br />

mit einer oder mehreren Gegenhypothesen H 1 , H 2 , ... verglichen und zurückgewiesen oder<br />

angenommen. Jede der Hypothesen setzt eine unterschiedliche Verteilung der einzelnen Parameter<br />

x, gegeben durch die Wahrscheinlichkeitsdichteverteilungen f(x|H 0 ), f(x|H 1 ), ...<br />

voraus. Ein Beispiel im zweidimensionalen Parameterraum der Variablen x 1 und x 2 ist<br />

in Abbildung 5.1 gezeigt. Die Populationen H 0 und H 1 lassen sich hier klar durch die<br />

in Dunkelrot gezeichnete Entscheidungsgrenze separieren, die es in optimaler Weise zu<br />

bestimmen gilt. Für Parameterräume höherer Dimensionalität ist es von Vorteil die Mess-<br />

Abbildung 5.1.: Beispiel von Populationen H 0 und H 1 im zweidimensionalen Parameterraum<br />

der Variablen x 1 und x 2 , getrennt durch eine lineare Entscheidungsgrenze<br />

(dunkelrot) [39].<br />

werte in einer sogenannten Test-Funktion t(x) niedrigerer Dimensionalität m (mit m < n),<br />

in der alle Informationen der gemachten Messung enthalten sind, zu verarbeiten. Eine eindimensionale<br />

Test-Funktion könnte beispielsweise durch den Mittelwert gebildet werden,<br />

wie er in Abbildung 4.12 gezeigt wurde. Eine solche Test-Statistik ist wiederum mit einer<br />

eigenen Wahrscheinlichkeitsdichte g(t|H 0 ), g(t|H 1 ), ... abhängig von der zu betrachtenden<br />

Hypothese verteilt. Im einfachsten Fall ist m = 1 und das Problem damit eindimensional.<br />

In diesem Fall kann die Entscheidungsgrenze als t(x 1 , ..., x n ) = t cut geschrieben werden<br />

und ist damit ein einfacher Schnitt auf t, der die Test-Statistik in eine Annahme- und<br />

eine Verwurfsregion teilt. Fällt die Messung in die Annahmeregion wird H 0 als wahr angenommen,<br />

fällt es in die Verwurfsregion wird H 0 zurückgewiesen. Abbildung 5.2 zeigt<br />

eine solche Test-Funktion mit einer Einteilung in eine Annahme- und eine Verwurfsregion.<br />

Darin ist ebenfalls ersichtlich, dass sich die Wahrscheinlichkeitsdichtefunktionen g(t|H 0 )<br />

und g(t|H 1 ) für gewöhnlich überlappen. Damit existiert eine endliche Wahrscheinlichkeit<br />

β =<br />

∫ tcut<br />

t min<br />

g(t|H 1 )dt, (5.4)<br />

für eine als H 0 angenommene Messung zur Population H 1 zu gehören und damit eine<br />

falsche Hypothese zu akzeptieren. Man spricht von einem Fehler zweiter Art. t min entspricht<br />

dabei der unteren Grenze, in der die Waschreinlichkeitsdichtefunktion g(t|H 1 ) definiert<br />

ist. Einen Fehler erster Art begeht man, indem die richtige Hypothese H 0 durch eine<br />

Messung in der Verwurfsregion, was mit der Wahrscheinlichkeit<br />

α =<br />

∫ tmax<br />

t cut<br />

g(t|H 0 )dt (5.5)<br />

38


5.2. Das Likelihoodverhältnis 39<br />

Abbildung 5.2.: Wahrscheinlichkeitsdichteverteilungen für die Hypothesen H 0 und H 1 einer<br />

eindimensionalen Test-Statistik t(x) mit Einteilung in eine Annahmeund<br />

eine Verwurfsregion, getrennt durch die Entscheidungsgrenze t cut [38].<br />

passiert, zugunsten von H 1 verworfen wird. t max ist hier die obere Grenze von g(t|H 0 ).<br />

Eine wichtige Kenngröße ist außerdem die Effizienz auf die zu testende Hypothese H 0<br />

mit ε = 1 − α, als Wahrscheinlichkeit ein H 0 Ereignis auch als solches zu erkennen. Eine<br />

hohe Effizienz geht dabei mit einer höheren Wahrscheinlichkeit einen Fehler zweiter Art<br />

zu begehen einher. Dies wird durch die Reinheit p 1 als Anteil von H 0 Ereignissen in der<br />

Annahmeregion S von t min bis t cut nach<br />

∫<br />

S<br />

p =<br />

g(t|H 0)dt<br />

∫<br />

S g(t|H 0)dt + ∫ S g(t|H (5.6)<br />

1)dt<br />

ausgedrückt. Ein guter Test verbindet hohe Effizienz mit hoher Reinheit. Die Aufgabe<br />

besteht nun darin eine Test-Funktion t(x) mit optimalen Separationseigenschaften zu konstruieren<br />

und eine Schnittgrenze t cut zu finden.<br />

Im Folgenden wird die Hypothese H 0 als Signal bezeichnet und entspricht der Messung<br />

eines Leptons. Die Gegenhypothese H 1 entspricht dann der Messung eines Protons und<br />

wird als Untergrund bezeichnet.<br />

5.2. Das Likelihoodverhältnis<br />

Ein Weg eine Test-Funktion zu finden basiert auf dem Neyman-Pearson Lemma [38]. Dieses<br />

legt eine optimale Annahmeregion fest, im Sinne von maximaler Effizienz auf das Signal<br />

bei minimaler Wahrscheinlichkeit einen Fehler zweiter Art zu begehen. Für einen Test auf<br />

eine Nullhypothese H 0 zu einer Gegenhypothese H 1 ist diese Annahmeregion durch das<br />

Verhältnis der Wahrscheinlichkeitsdichteverteilungen<br />

f(x|H 0 )<br />

f(x|H 1 ) > c (5.7)<br />

festgelegt. Ist dieses Verhältnis kleiner oder gleich c wird die Nullhypothese verworfen. c<br />

ist dabei ein vorher anhand von α und β aus den Formeln 5.4-5.5 festgelegtes konstantes<br />

Signifikanzniveau. Äquivalent dazu ist die optimale Test-Statistik durch<br />

1 engl.:Purity<br />

f(x|H 0 )<br />

= t(x) (5.8)<br />

f(x|H 1 )<br />

39


40 5. Statistische Methoden<br />

gegeben. Dabei ist jede monotone Funktion dieses Verhältnisses gleichberechtigt. Formel<br />

5.8 wird als Likelihoodverhältnis bezeichnet. Das Likelihoodverhältnis liefert im Falle einfacher,<br />

durch eine Hyperfläche trennbarer, Populationen optimale Separationseigenschaften.<br />

Allerdings müssen die Wahrscheinlichkeitsdichtefunktionen für Parameter beider Hypothesen<br />

bekannt sein, was jedoch nicht immer der Fall ist. In diesem Fall müssen die<br />

Wahrscheinlichkeitsdichtefunktionen Messdaten nachempfunden oder durch Monte-Carlo<br />

Simulationen modelliert werden.<br />

Für die Likelihoodfunktion zur Trennung von Positronen und Protonen mithilfe des Übergangsstrahlungsdetektors,<br />

werden die Verteilungen der Energieabgabe pro Lage für Leptonen<br />

und Protonen nach Selektion mit dem elektromagnetischen Kalorimeter, nach Teil<br />

6.1, den Daten entnommen. Auf eins normiert entsprechen die Histogramme diskreten<br />

Wahrscheinlichkeitsdichtefunktionen wie in Abbildung 4.11 gezeigt und bereits beschrieben.<br />

Diese könnten nun parametrisiert werden um das Likelihoodverältnis zu bilden. Einfacher<br />

ist es jedoch die Wahrscheinlichkeiten P e,p (dE) für ein Positron- oder Protonereignis<br />

direkt aus der Wahrscheinlichkeitsverteilung zu entnehmen. Die Wahrscheinlichkeiten für<br />

Positron oder Proton in jeder der n = 20 Lagen werden dann über das geometrische Mittel<br />

√ √√√<br />

∏ n<br />

P e,p (dE) = n Pe,p(dE) k (5.9)<br />

k=1<br />

vereint. Daraus wird dann das Likelihoodverhältnis<br />

(<br />

)<br />

P e (dE)<br />

L = − log<br />

P e (dE) + P p (dE)<br />

(5.10)<br />

gebildet. Die Bildung des Logarithmus als monotone Funktion ist dabei Konvention und<br />

soll einer besseren Verarbeitung der Daten im Computer dienen. Bei der Bildung des geometrischen<br />

Mittels nach Gleichung 5.9 werden keine Korrelationen zwischen den einzelnen<br />

Lagen betrachtet, so dass das Likelihoodverhältniss nur eine gute Test-Statistik darstellt,<br />

wenn solche Korrelationen nicht existieren.<br />

In der AMS-02 Software werden Likelihoodverhältnisse durch das in der RWTH Aachen<br />

entwickelte Framework TrdQt und das im MIT entwickelte TrdK bereitgestellt. Beide<br />

unterscheiden sich durch ihr verwendetes alignment, sowie durch die Kalibrierung der<br />

Gasverstärkung, wie in Kapitel 4.4 beschrieben. Außerdem werden Abhängigkeiten der<br />

verwendeten Wahrscheinlichkeitsdichteverteilungen von der Energie des Teilchens oder<br />

des Gasdrucks im Proportionaldrahtkammerröhrchen unterschiedlich parametrisiert. Die<br />

Verteilungen der Likelihoodverhältnisse sind in Abbildung 5.3 zu sehen. Ein hoher Wert<br />

entspricht dabei einer Proton ähnlichen Signatur des Teilchens. Ein niedriger Wert einer<br />

Lepton ähnlichen Signatur.<br />

5.3. Künstliche neuronale Netze<br />

Die einfachste Möglichkeit eine Trennung vorzunehmen, ist die einer Hyperebene wie sie<br />

bereits in Abbildung 5.1 im zweidimensionalen Fall verwendet wurde. Eine entsprechende<br />

Test-Funktion kann in Form einer linearen Funktion als<br />

y(x) = w T x + w 0 (5.11)<br />

mit dem n-dimensionalen Variablenvektor x und w, welcher als Vektor der Gewichte bezeichnet<br />

wird, geschrieben werden [40]. Die Entscheidungsgrenze liegt dann auf der Hyperebene<br />

mit y(x) = 0. Die Form dieser Hyperebene wird durch die Gewichte festgelegt.<br />

40


Entries<br />

3137898<br />

Mean 1.027<br />

RMS 0.1442<br />

5.3. Künstliche neuronale Netze 41<br />

7<br />

10<br />

6<br />

10<br />

5<br />

10<br />

4<br />

10<br />

3<br />

10<br />

TrdQt Protonen<br />

TrdK Protonen<br />

htemp__1<br />

TrdQt Leptonen<br />

TrdK Leptonen<br />

2<br />

10<br />

10<br />

1<br />

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2<br />

Likelihoodverhaltnis<br />

Abbildung 5.3.: Verteilung des Likelihoodverhältnis gegeben durch TrdQt und TrdK von<br />

Protonen und Leptonen aus Flugdaten, selektiert durch das elektromagnetsiche<br />

Kalorimeter.<br />

5.3.1. Künstliche Neuronen<br />

Gleichung 5.11 kann in Form eines sogenannten Netzwerkdiagramms wie in Abbildung 5.4<br />

ausgedrückt werden. Dabei werden die einzelnen Elemente des Vektors x als Eingangselemente<br />

dargestellt, die über die Gewichte mit dem Ausgabewert y verbunden sind. Die<br />

Schwelle w 0 ist dabei an ein separates Eingangselement geknüpft, welches dauerhaft den<br />

Wert +1 innehat und als Bias bezeichnet wird.<br />

Bias<br />

Input<br />

variables<br />

x 1<br />

⋮<br />

⋮<br />

w 0<br />

w i<br />

y(⃗x)<br />

x n<br />

Abbildung 5.4.: Darstellung von Gleichung 5.11 als Netzwerkdiagramm.<br />

Die Ausgabe von Funktion 5.11 wird zumeist in einer monotonen Funktion g(y) verarbeitet,<br />

die die Form der Ausgabe maßgeblich bestimmt und Aktivierungsfunktion genannt<br />

wird. Eine geeignete Funktion dafür ist die S-Förmige Sigmoid Funktion<br />

g(y) =<br />

1<br />

1 + e −y (5.12)<br />

41


42 5. Statistische Methoden<br />

1<br />

0.8<br />

g(y)=<br />

1<br />

1+e<br />

-y<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

-5 -4 -3 -2 -1 0 1 2 3 4 5<br />

y<br />

Abbildung 5.5.: Zeichnung der Sigmoid Funktion nach Formel 5.12.<br />

die das Intervall (−∞, ∞) auf (0, 1) abbildet und für kleine Werte y linear angenährt<br />

werden kann. Die Sigmoid Funktion ist in Abbildung 5.5 dargestellt. Auf die besondere<br />

Bedeutung dieser Funktion als Aktivierungsfunktion wird in Teil 5.3.4 näher eingegangen.<br />

Ein solches Netzwerk mit Aktivierungsfunktion wird als künstliches Neuron bezeichnet.<br />

Die Namensgebung trägt dem biologischen Vorbild auf dem ein solches Netzwerk basiert<br />

Rechnung. Gemeint ist eine Nervenzelle, die im zentralen Nervensystem über Synapsen<br />

mit anderen Nervenzellen verknüpft ist. Die Synapsen entsprechen in diesem Bild den<br />

Gewichten w i , wobei das Gewicht des Bias w 0 einem Schwellwert entspricht, ab dessen<br />

Überschreitung das Neuron aktiv wird ( ”<br />

feuert“).<br />

Mit einem künstlichen Neuron kann bereits eine Trennung einfacher, durch eine Hyperebene<br />

linear trennbarer Populationen, vorgenommen werden. Für nichtlineare und stark korrelierte<br />

Verteilungen ist sowohl das Likelihoodverhältnis, als auch ein einzelnes künstliches<br />

Neuron zur Ausgabe einer Test-Statistik ungeeignet. Ein Beispiel einer solchen Verteilung<br />

im zweidimensionalen Fall ist in Abbildung 5.6 dargestellt. Hier wird augenscheinlich klar,<br />

dass die beiden Populationen H 0 und H 1 nicht durch eine gerade Linie getrennt werden<br />

können.<br />

5.3.2. Multi-Layer-Perzeptron<br />

Um nichtlineare Probleme zu lösen werden Schichten mehrerer künstlicher Neuronen hintereinander<br />

geschaltet. Man spricht dann von einem Multi-Layer-Perzeptron (MLP). In der<br />

ersten Schicht werden die einzelnen n Eingabewerte x i aufgenommen. Die letzte Schicht<br />

besteht aus einem einzelnen Neuron, welches den Ausgabewert y(x) liefert. Dazwischen<br />

befindet sich mindestens eine versteckte Schicht 2 aus k Neuronen, die Eingabewerte gemäß<br />

(<br />

)<br />

n∑<br />

ϕ j (x) = g w j0 + w ji x i (5.13)<br />

für jedes Neuron der versteckten Schicht ϕ j transformiert. w j0 sind die Gewichte des Bias.<br />

Das Ausgabeneuron gibt dann, wie ein einzelnes Neuron mit k Eingangsparametern ϕ j ,<br />

den Ausgabewert entsprechend<br />

⎛<br />

⎞<br />

k∑<br />

y(⃗ϕ) = ˜g ⎝ ˜w 0 + ˜w j ϕ j ⎠ . (5.14)<br />

2 engl.: Hidden layer<br />

i=1<br />

j=1<br />

42


5.3. Künstliche neuronale Netze 43<br />

Abbildung 5.6.: Beispiel nicht einfacher, durch eine Hyperebene linear separierbarer, Populationen<br />

H 0 und H 1 im zweidimensionalen Parameterraum der Variablen<br />

x 1 und x 2 [39].<br />

Die Neuronen einer einzelnen Schicht werden dabei jeweils in Vorwärtsrichtung miteinander<br />

verknüpft, so dass ein sogenanntes Feed-Forward Netzwerk entsteht. Die Topologie<br />

eines solchen Netzwerkes ist in Abbildung 5.7 dargestellt. Die versteckte Schicht führt<br />

Bias<br />

∑<br />

i<br />

w j0<br />

x i w ji<br />

∑ ϕ j<br />

j<br />

̃w j<br />

Input<br />

variables<br />

x 1<br />

⋮<br />

⋮<br />

ϕ j (⃗x)<br />

y(⃗ϕ)<br />

x n<br />

Input<br />

Hidden<br />

Layer<br />

Output<br />

Node<br />

Abbildung 5.7.: Multi Layer Perzeptron mit einer versteckten Lage.<br />

dabei eine Transformation der Eingabewerte nach x 1 , ...x n → ϕ 1 (x), ...ϕ n (x) in einen sogenannten<br />

Merkmalsraum 3 durch, in dem die Populationen linear separierbar sind. Die<br />

lineare Separation kann dann vom Ausgabeneuron durchgeführt werden. Prinzipiell sind<br />

alle Topologien, mit beliebig vielen versteckten Schichten, sowie Neuronen und verschiedenen<br />

Verbindungen auch in Rückwärtsrichtung, denkbar. Ein Feed-Forward Netzwerk mit<br />

nur einer versteckten Schicht ist jedoch für die meisten Separationsprobleme ausreichend.<br />

Aufgabe ist es nun die Gewichte w ij zu bestimmen, die die Eigenschaften der Transformation<br />

x → ⃗ϕ(x), sowie die Hyperebene zur Trennung der Populationen festlegen. Diese<br />

Anpassung der Gewichte an die Signal- und Untergrundverteilungen des Separationspro-<br />

3 engl.: Feature space<br />

43


44 5. Statistische Methoden<br />

blems wird als Training bezeichnet.<br />

5.3.3. Training des neuronalen Netzes<br />

Um ein neuronales Netzwerk für Separationsprobleme zu verwenden greift man üblicherweise<br />

auf überwachte Trainingsmethoden zurück. Bei solchen Methoden wird eine Auswahl<br />

an Trainingsereignissen mit den Eingangsparametern x benötigt, deren Zugehörigkeit zur<br />

Population Signal oder Untergrund bekannt ist. Man ordnet diesen Ereignissen einem Zielwert<br />

entsprechend ihrer Natur zu, der den Wert widerspiegelt, den das Netzwerk idealer<br />

weise für diese Eingabewerte ausgeben soll. Beispielsweise kann dies 1 für Signalereignisse<br />

und 0 für Untergrundereignisse sein. Um eine solche Trainingsauswahl zu erhalten, wird<br />

entweder auf Monte Carlo Simulationen oder auf Daten, die man mit Sicherheit einem<br />

Ereignis zuordnen kann, zurück gegriffen. Im Folgenden wird für diese Auswahl an Trainingsereignissen<br />

der gebräuchliche Begriff Trainingssample aus dem Englischen verwendet.<br />

Die einzelnen Ereignisse k des Trainingssamples werden nun iterativ an das Netzwerk gegeben<br />

und dessen Ausgabewert y(x) mit dem Zielwert t verglichen. Aus den einzelnen<br />

Abweichungen wird dann die Fehlerfunktion nach der Summe der Residuenquadrate<br />

E(w) = 1 2<br />

N∑<br />

|y(x k , w) − t k | 2 =<br />

k=1<br />

N∑<br />

E k (w) (5.15)<br />

gebildet, wobei N die Anzahl der Trainingsereignisse ist. Die einzelnen Gewichte werden<br />

nun bei jedem Durchgang angepasst und der Vorgang wiederholt. Die Art und Weise wie<br />

die Gewichte angepasst werden, wird als Fehlerrückführung oder auch Backpropagation<br />

bezeichnet. Dabei werden die errechneten Fehler wieder rückwärts durch das Netzwerk<br />

übertragen und die Gewichte nach<br />

k=1<br />

∂E k<br />

∂w ij<br />

= δ j g(a i ) = ∆w ij (5.16)<br />

den Korrekturfaktor als Fehler eines Neurons nach der Rück-<br />

angepasst, wobei δ j = ∂E k<br />

∂a j<br />

führungs-Formel<br />

δ j = g(a j ) ∑ l<br />

w kj δ l (5.17)<br />

gibt [40]. Dabei bezeichnet l den Index des direkt vorangegangenen Neurons und a i ist die<br />

Eingabe ins entsprechende Neuron, also hier x i oder ϕ j .<br />

Das Vorgehen nach dem Backpropagation Verfahren garantiert, dass die Fehlerfunktion<br />

mit jeder Iteration kleiner wird und damit das Netzwerk die Populationen besser unterscheiden<br />

kann. Man spricht deshalb von einem Lernprozess, der vom neuronalen Netzwerk<br />

durchlaufen wird. Das Training entspricht dann einem Minimierungsprozess, bei dem die<br />

Fehlerfunktion 5.15 als Funktion der Gewichte w ij minimiert wird. Dabei soll das Netzwerk<br />

im Minimum der Fehlerfunktion noch eine gewisse Fähigkeit zur Generalisierung<br />

besitzen. Das bedeutet, dass Ereignisse, deren Parameterzusammensetzung nicht exakt<br />

der eines gelernten Ereignisses entsprechen, noch korrekt eingeordnet werden können. Diese<br />

Forderung stellt eine Grenze der idealen Anzahl an Trainingsiterationen dar. Werden zu<br />

viele Trainingsiterationen auf immer das gleiche Trainingssample durchgeführt, folgt das<br />

Netzwerk dessen charakteristischen Fluktuationen und verliert die Fähigkeit zur Generalisierung.<br />

Dieser Vorgang wird als Übertraining bezeichnet. Gebräuchlicher sind jedoch die<br />

englischen Begriffe Overtraining oder Overfitting. Der Einfluss von Overtraining auf die<br />

Separationsgrenze ist für den zweidimensionalen Fall in Abbildung 5.8 dargestellt. Man<br />

sieht wie im Falle von Overtraining die Separationsgrenze jeder Fluktuation im Trainingssample<br />

folgt.<br />

Um Overtraining zu verhindern wird in der Regel ein Teil des Trainingssamples dazu verwendet,<br />

die Generalisierungsfähigkeit des neuronalen Netzwerks an einer unabhängigen<br />

44


5.3. Künstliche neuronale Netze 45<br />

Abbildung 5.8.: Separationsgrenzen für zwei Populationen im zweidimensionalen Parameterraum<br />

von x 1 und x 2 mit guter Generalisierungsfähigkeit (links) und<br />

nach Overtraining (mitte). Rechts ist das Verhalten der Fehlerfunktion im<br />

Falle von Overtraining dargestellt [39].<br />

Auswahl von Ereignissen zu testen. Dieses wird als Testsample bezeichnet. Bei einer guten<br />

Generalisierungsfähigkeit sollte die Performance, gemessen durch die Fehlerfunktion, für<br />

das Trainingssample und das unabhängige Testsample gleich gut sein. Nimmt die Generalisierungsfähigkeit<br />

ab, wird der Fehler auf das Trainingssample weiter kleiner, da für<br />

diese spezielle Auswahl die Trennung besser wird, wie in Abbildung 5.8 im Falle des Overtrainings<br />

zu ersehen ist. Im unabhängigen Testsample, welches diesen Fluktuationen nicht<br />

unterliegt, wird der Fehler größer. Dieses Verhalten ist in Abbildung 5.8 rechts gezeigt. An<br />

der Stelle, an der die Fehlerfunktionen auseinander laufen, sollte kein weiterer Trainingsdurchlauf<br />

durchgeführt werden. Ein Nachteil dieser Methode Overtraining zu verhindern<br />

ist, dass nicht alle Ereignisse des Trainingssamples für das Training verwendet werden<br />

können, was bei kleinen Trainingssamples zu Performanceverlusten führen kann.<br />

5.3.4. Die NeuroBayes R○ Software<br />

NeuroBayes R○ ist eine Softwarelösung zur Erstellung eines Feed Forward Netzwerkes. Entwickelt<br />

wurde die Software am Karlsruhe <strong>Institut</strong> für Technologie (<strong>KIT</strong>) zur Ereignis-<br />

Selektion in der Hochenergiephysik, wobei sie über die Jahre weiterentwickelt wurde und<br />

schließlich zur Verwendung in der Wirtschaft im Unternehmen GmbH ausgegliedert<br />

wurde. Dadurch ist NeuroBayes R○ eine lizenzierte Software deren Quellcode damit<br />

weder einseh- noch veränderbar ist. Trotzdem findet die Software auch weiterhin im<br />

wissenschaftlichen Bereich Verwendung, wobei die Anpassung der Software an das Analyseziel<br />

durch das Setzen von Bitschaltern 4 bewerkstelligt wird. Die Software verknüpft<br />

dabei Methoden der Bayes Statistik und neuronaler Netzwerke und bietet dabei einen internen<br />

Schutz vor Overtraining [41]. Mithilfe der Bayes Statistik kann eine Definition des<br />

Wahrscheinlichkeitsbegriffs gegeben werden, der eine Aussage über sogenannte bedingte<br />

Wahrscheinlichkeiten P (A|B) macht. Die bedingte Wahrscheinlichkeit gibt dabei eine<br />

Wahrscheinlichkeit an, das Ereignis A zu beobachten, unter der Voraussetzung das Ereignis<br />

B bereits beobachtet wurde. Dabei ist die bedingte Wahrscheinlichkeit der Quotient aus<br />

der Schnittmenge der Wahrscheinlichkeit für A und B, normiert auf die Wahrscheinlichkeit<br />

für B, da dieses Ereignis per Definition aufgetreten ist<br />

P (A|B) =<br />

P (A ∩ B)<br />

. (5.18)<br />

P (B)<br />

4 engl.: Flag<br />

45


46 5. Statistische Methoden<br />

Daraus folgt direkt aus der Umkehrbarkeit des Terms der Schnittmenge P (A ∪ B) =<br />

P (B ∪ A)<br />

P (B|A) · P (A)<br />

P (A|B) = . (5.19)<br />

P (B)<br />

Gleichung 5.19 wird Bayes Theorem genannt und stellt eine Verknüpfung zwischen den<br />

beiden Ereignissen A und B her [38]. Der Term P (B|A) wird als Likelihood bezeichnet<br />

und stellt die Messgrundlage dar. P (A) wird Prior genannt und bietet eine Möglichkeit<br />

Vorwissen in die statistische Auswertung einfließen zu lassen. P (B) stellt eine Normierungskonstante<br />

dar. Das Ergebnis P (A|B) wird dann als Posteriori Wahrscheinlichkeit<br />

bezeichnet.<br />

Mithilfe der Bayes Statistik kann eine Interpretation der Ausgabe eines neuronalen Netzwerks<br />

mit Sigmoid Aktivierungsfunktion gegeben werden. Betrachtet man zwei gaussförmig<br />

verteilte Populationen H 0 und H 1 im Parameterraum mit d Dimensionen um ⃗µ 0,1 und<br />

deren Kovarianzmatrix ∑ nach<br />

(<br />

1<br />

P (x|H 0,1 ) =<br />

(2π) d/2 | ∑ | 1/2 · exp − 1 2 (x − ⃗µ 0,1) T ∑ )<br />

−1<br />

(x − ⃗µ0,1 ) (5.20)<br />

und betrachtet die Wahrscheinlichkeit der Zugehörigkeit zu H 0 mit Bayes Theorem<br />

P (H 0 |x) =<br />

so erhält man mit der Substitution<br />

P (x|H 0 )P (H 0 )<br />

P (x|H 0 )P (H 0 ) + P (x|H 1 )P (H 1 ) , (5.21)<br />

a = ln P (x|H 0)P (H 0 )<br />

P (x|H 1 )P (H 1 )<br />

(5.22)<br />

aus Gleichung 5.21 die Sigmoid Funktion<br />

P (H 0 |x) =<br />

1<br />

. (5.23)<br />

1 + e−a Für die Substitution in Gleichung 5.22, die dem Liklihoodverhältnis aus Gleichung 5.8<br />

entspricht, erhält man mit 5.20<br />

a = w T x + w 0 (5.24)<br />

mit<br />

w 0 = − 1 2 ⃗µT 0<br />

∑ −1⃗µ0<br />

+ 1 2 ⃗µT 1<br />

w = ∑ −1<br />

(⃗µ0 − ⃗µ 1 ) (5.25)<br />

∑ −1⃗µ1<br />

+ ln P (H 0)<br />

P (H 1 ) . (5.26)<br />

Damit kann die Ausgabe eines neuronalen Netzwerks mit Sigmoid Aktivierungsfunktion<br />

als Posterior Wahrscheinlichkeit nach Bayes Theorem interpretiert werden [40]. Man erhält<br />

damit nicht nur eine einfache Separation, sondern eine Wahrscheinlichkeit für ein Ereignis,<br />

vom Typ H 0 oder H 1 zu sein.<br />

In der NeuroBayes R○ Software werden Bayes Methoden außerdem im Preprocessing angewandt.<br />

Hier werden die Eingangsparameter zur optimalen Verwendung im neuronalen<br />

Netz vorbereitet.<br />

Die NeuroBayes R○ Software ist zur Verwendung in zwei Teile geteilt. Zum einen existiert<br />

der NeuroBayes R○ Teacher, mit dem ein Netzwerk aufgebaut und trainiert werden kann.<br />

Das trainierte Netzwerk wird dann abgespeichert und kann über den NeuroBayes R○-Expert<br />

aufgerufen und für Analyseaufgaben verwendet werden.<br />

46


6. Das neuronale Netzwerk für den<br />

Übergangsstrahlungsdetektor<br />

Für die Trennung von Positronen und Protonen mit Hilfe des Übergangsstrahlungsdetektors<br />

wurde die an der Universität Karlsruhe entwickelte und in 5.3.4 vorgestellte Software<br />

NeuroBayes R○ zur Erstellung eines neuronalen Netzwerks genutzt. Dafür wird in der Zusammenstellung<br />

des Trainingssamples auf Flugdaten zurückgegriffen, die die realen Verhältnisse<br />

im Detektor besser wiedergeben als es mit Monte-Carlo Daten möglich wäre.<br />

Dabei wird die Redundanz der AMS-02 Subdetektoren ausgenutzt und Trainingsdaten<br />

mit dem elektromagnetischen Kalorimeter selektiert. Für diese Arbeit wurden Daten vom<br />

20. Mai 2011 bis zum 1. November 2012 verwendet, was in etwa 24 Milliarden Triggern<br />

entspricht.<br />

6.1. Selektion des Trainingssamples<br />

Die Schwierigkeit in der Zusammenstellung eines Ereignissamples mit dem das neuronale<br />

Netzwerk trainiert werden kann liegt darin, dass Trainingssamples einerseits sehr rein sein<br />

müssen und andererseits in der Selektion keine Variablen verwendet werden dürfen auf die<br />

später auch das Netzwerk trainiert werden soll. Die Reinheit ist wichtig, da im Falle eines<br />

kontaminierten Samples das Netzwerk auf verfälschten Informationen trainiert wird. Die<br />

Unabhängigkeit der Selektion des Trainingssamples von den Netzwerkvariablen muss gewährleistet<br />

sein, da ansonsten die Verteilung der Trainignsvariablen verfälscht wird. Hierzu<br />

kann die Redundanz der AMS-02 Subdetektoren ausgenutzt werden. Im Falle des TRDs<br />

kann das von diesem unabhängig arbeitende elektromagnetische Kalorimeter zur Einteilung<br />

der Daten in Trainingssamples verwendet werden. Selektiert und für das Training<br />

verwendet werden dabei Protonen und Elektronen anstelle von Positronen. Elektronen<br />

und Positronen können vom Übergangsstrahlungsdetektor nicht unterschieden werden, da<br />

weder deponierte Ionisationsenergie nach Gleichung 4.4, noch die gemessene Intensität<br />

der Übergangsstrahlung nach Gleichung 4.1 vom Ladungsvorzeichen abhängen. Elektronen<br />

kommen in der kosmischen Strahlung, wie in Teil 2.1 gezeigt wurde, in etwa um einen<br />

Faktor 10 häufiger vor und sind durch das unterschiedliche Ladungsvorzeichen sicherer<br />

vom Protonenuntergrund zu unterscheiden. So kann mit Hilfe des elektromagnetischen<br />

Kalorimeters eine ausreichend große und sichere Trainingsauswahl definiert werden. Dieses<br />

Vorgehen ist in Abbildung 6.1 noch einmal schematisch dargestellt.<br />

Um aus allen von AMS aufgenommenen Triggern nur für die Analyse relevante Ereignis-<br />

47


48 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />

Abbildung 6.1.: Schematische Skizze zur Vorgehensweise zum Trainieren eines neuronalen<br />

Netzwerkes mit Flugdaten [42].<br />

se auszuwählen, muss dabei zunächst eine generelle Vorauswahl 1 getroffen werden, bevor<br />

man bestimmte, für die Proton-Positron Trennung geeignete, Ereignisse auswählt 2 und<br />

diese dann mit Hilfe des Kalorimeters zu Proton oder Elektron bestimmt 3 . Ziel ist es ein<br />

möglichst reines Datensample zu erhalten.<br />

6.1.1. Preselection und Selection<br />

In der Vorselektion werden Trigger nach ihrer generellen Tauglichkeit bewertet und für<br />

eine Analyse ungeeignete, wie zum Beispiel falsch rekonstruierte Ereignisse, entfernt. Dabei<br />

muss eine Variable gefunden werden, mit der der Schnitt auf ungeeignete Ereignisse<br />

durchgeführt werden kann ohne dabei ebenfalls gute Ereignisse zu verwerfen und damit die<br />

Menge an Daten zu sehr zu beschneiden. Die für die Selektion des Trainingssamples angewandten<br />

Schnitte sollten denen einer späteren Analyse entsprechen, um nicht unbewusst<br />

Korrelationen zwischen den Variablen einzubringen oder zu verwerfen. Eine Übersicht<br />

der angewandten Bedingungen und deren Effizienz ist in Abbildung 6.2 gegeben. Auf die<br />

einzelnen Schnitte wird im Folgenden näher eingegangen. Die angegebene Effizienz gibt<br />

dabei den Anteil der in diesem Schritt beibehaltenen Ereignisse an. Um die Stärke eines<br />

Schnittes abzuschätzen muss diese mit 1−Effizienz umgerechnet werden. Der Einfluss der<br />

einzelnen Schnitte auf die gesamte Triggermenge ist in Abbildung 6.3 dargestellt. In den<br />

beiden Abbildungen 6.2 und 6.3 kennzeichnet Global eine generelle Selektion nach der<br />

Vollständigkeit von Ereignissen. In Badrun und Science werden Runs mit speziellen Markierungen<br />

verworfen. Diese werden gesetzt um Runs zu kennzeichnen, bei denen besonders<br />

viele Hardwarefehler vorkamen, oder Detektoroperationen wie ein gas refill durchgeführt<br />

wurden. Einzelne Ereignisse mit Hardwarefehlern werden mit dem mit HW gekennzeichneten<br />

Schnitt entfernt. LiveTime kennzeichnet einen Schnitt auf den Anteil der Zeit, in<br />

der der Trigger inaktiv war, von größer 0, 65 um Regionen großen Teilchenflusses wie die<br />

Südatlantische Anomalie und teilweise die Polregionen auszuschließen. Dort können Ereignisse<br />

aufgrund des hohen Teilchenflusses und der daraus resultierenden hohen Signaldichte<br />

nur schlecht rekonstruiert werden. Ereignisse außerhalb der rekonstruierten relativistischen<br />

Geschwindigkeit 0, 6 < β < 1, 4 werden ebenfalls entfernt, wobei physikalisch unsinnige<br />

relativistische Geschwindigkeiten von größer 1 den hohen Bewegungsenergien der Teilchen<br />

geschuldet sind, aber als Trigger durchaus ihre Berechtigung haben. Bei dieser mit Beta<br />

gekennzeichneten Bedingung werden auch Teilchen, die sich von unten nach oben durch<br />

den Detektor bewegen entfernt, was Teilchen, die aus der unter dem Detektor liegenden<br />

Atmosphäre reflektiert oder dort erzeugt werden, ausschließt. Des Weiteren wird eine<br />

Spurrekonstruktion (TrTrack) vorausgesetzt und ein rekonstruierter Schauer im elektromagnetischen<br />

Kalorimeter (EcalShr), um eine Teilchenidentifizierung vornehmen zu können.<br />

1 engl.: Preselection<br />

2 engl.: Selection<br />

3 engl.: Tagging<br />

48


6.1. Selektion des Trainingssamples 49<br />

Abbildung 6.2.: Effizienz der angewandten Bedingungen bezüglich des vorangegangen<br />

Schnittes. Die Beschreibungen der einzelnen Schnitte sind im Text zu<br />

finden.<br />

Diese Forderung ist aufgrund der geringen Akzeptanz des elektromagnetischen Kalorimeters<br />

besonders stark und entfernt mit etwa 82, 6% die meisten Ereignisse. Außerdem wird<br />

verlangt, dass sich keines der Solarpanele, die die ISS mit Strom versorgen, im Sichtfeld<br />

des Detektors befindet (Shadow), um Sekundärteilchen auszuschließen. Mit SubD Acceptance<br />

wird geprüft ob die Spurrekonstruktion eine gewisse Minimalgüte erfüllt und sich<br />

der Schauer im Kalorimeter in einem gewissen Akzeptanzvolumen innerhalb des Kalorimeters<br />

befindet, um Energieverluste des Schauers am Rand auszuschließen. Für ein gutes<br />

Ereignis im Übergangsstrahlungsdetektor (GoodTrd) wird verlangt, dass die rekonstruierte<br />

Spur den Subdetektor vollständig passiert und eine gesamte Pfadlänge in den Proportionaldrahtkammerröhrchen<br />

von mehr als 7 cm gemessen wurde. Zum Schluß wird in Match<br />

überprüft, ob die Richtungsrekonstruktionen der einzelnen Subdetektoren zusammenpassen.<br />

Nach der Vorauswahl, die mit Preselection gekennzeichnet ist, sind nur noch etwa 3, 9%<br />

der Triggerereignisse übrig. Die verwendete Vorauswahl geht auf einen Analysevorschlag<br />

zum Positronenanteil zurück. Nun folgt eine analysebezogene Auswahl von Ereignissen.<br />

Dabei werden Ereignisse verworfen, die für eine spezielle Aufgabe nicht geeignet sind, da<br />

sie zum Beispiel nicht im geforderten Energieintervall liegen, das hier den Rigiditätsbereich<br />

von 2 − 300 GV umfasst und mit RigRange gekennzeichnet ist. Außerdem wird auf Ereignisse<br />

geschnitten, deren Rekonstruktionsqualität nicht für eine Analyse des Ereignisses<br />

ausreicht, was mit einem Schnitt auf die Größe Chi zum Quadrant für die rekonstruierte<br />

Teilchenspur von kleiner 10 und auf dessen Projektion in die für die Ladungsrekonstruktion<br />

entscheidende Y-Z-Ebene von kleiner 8 (TrChi2 ), sowie einem Schnitt auf mindestens<br />

12 Treffer im Übergangsstrahlungsdetektor (TrdPart) selektiert wird. Zusätzlich wird das<br />

Sample auf Ereignisse mit rekonstruierter Ladung von Z = 1 oder Z = 2 reduziert (Charge).<br />

So bleiben etwa 381 Millionen Ereignisse zur Analyse übrig.<br />

49


50 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />

Abbildung 6.3.: Verbleibender Anteil des Triggersamples nach jeder der angewandten<br />

Bedingungen.<br />

6.1.2. Elektronen und Protonen Selektion<br />

Um nun Elektronen und Protonen zu selektieren wird wie beschrieben auf das elektromagnetische<br />

Kalorimeter zurückgegriffen. Hierfür wird in der AMS Software eine multivariate<br />

Analysemethode in Form eines vervielfachten Entscheidungsbaumes (BDT 4 ) bereit<br />

gestellt, der anhand von Kalorimetervariablen eine Einteilung in elektron-, bzw. positronähnliche<br />

Ereignisse vornimmt. Ein Entscheidungsbaum führt dabei pro Entscheidungsebene<br />

eine Entscheidung anhand einer einzelnen Variable in Richtung Signal oder Untergrund<br />

aus [43]. Die einzelnen Entscheidungsebenen folgen dabei hierarchisch aufeinander.<br />

Dadurch wird der Parameterraum in einzelne Regionen geteilt, die Signal- oder Untergrundcharakter<br />

haben. Eine schematische Darstellung eines Entscheidungsbaumes ist in<br />

Abbildung 6.4 links gezeigt. Beim Boosting werden dabei mehrere Entscheidungsbäume<br />

trainiert und am Ende des Trainings zusammengefasst. Man spricht dabei von einem Wald.<br />

Diese Methode soll das Training gegenüber Fluktuationen im Trainingssample robust machen.<br />

Die Ausgabe des boosted decision trees für das elektromagnetische Kalorimeter in<br />

der AMS Software, für eine Auswahl von Leptonen und Protonen aus Flugdaten, ist in<br />

Abbildung 6.4 rechts gezeigt. Dort ist außerdem der Schnitt für Elektronen- und Protonenselektion<br />

eingezeichnet. Eine wichtige Entscheidungsvariable außerhalb des TRD ist der<br />

Anteil an im elektromagnetischen Kalorimeter deponierter Energie von der Gesamtenergie<br />

des Teilchens. Wie in Teil 3.7 beschrieben, deponieren Leptonen nahezu ihre gesamte<br />

Energie im Kalorimeter, während Protonen nur wenig Energie deponieren. Gemessen wird<br />

dieses Verhältniss aus der gemessenen deponierten Energie im Kalorimeter und der Rigidität,<br />

die für Teilchen mit Ladung Z = 1 der Bewegungsenergie entspricht. Bei Energien<br />

im GeV Bereich ist die Bewegungsenergie der dominante Anteil der Gesamtenergie von<br />

Protonen und Elektronen. Damit ist die Rigidität in erster Nährung ein Maß für die Gesamtenergie<br />

eines Teilchens mit Ladung Z = 1. Draus folgt, dass dieses sogenannte E/P<br />

Verhältnis für Leptonen etwa gleich 1 ist und für Protonen gegen 0 tendiert. Die Vertei-<br />

4 engl.: Boosted Decision Tree<br />

50


6.2. Eingangs-Variablen 51<br />

Abbildung 6.4.: Schematische Darstellung eines Entscheidungsbaumes, der Ereignisse mit<br />

Paramtern x in Signal S und Untergrund B anhand von Einzelentscheidungen,<br />

einteilt (links) [43] und Ausgabe des BDT in der AMS Software<br />

für Leptonen und Protonen, selektiert mit dem TrdQt Likelihoodverhältnis<br />

(rechts).<br />

lung dieser Variable ist in Abbildung 6.5 für eine Auswahl von Leptonen und Protonen aus<br />

Flugdaten, selektiert mit der TrdQt Likelihood gezeigt. Um Protonen zu selektieren wird<br />

verlangt, dass diese Variable kleiner 0, 4 ist und für Leptonen zwischen 0, 7 und 10, 0 liegt.<br />

Die mit dem Spurdetektor rekonstruierte Ladung soll sowohl für Leptonen, als auch für<br />

Protonen zwischen 0, 5 und 1, 5 liegen. Um eine Verunreinigung von Helium im Protonensample<br />

zu vermeiden, wird noch ein Schnitt auf die im Flugzeitdetektor deponierte Energie<br />

angewandt, die proportional zur Ladung im Quadrat ist. Dabei soll die durchschnittliche<br />

deponierte Energie in den vier Lagen kleiner als 4, 0 MeV sein und das Maximum 5, 0 MeV<br />

nicht überschreiten. Das Entfernen von Helium ist besonders wichtig, da es im elektromagnetischen<br />

Kalorimeter Protonen ähnlich sieht und als solches gekennzeichnet wird. Im<br />

Übergangsstrahlungsdetektor ist Helium jedoch durch seine hohe Ionisationsenergie nur<br />

schwer von Leptonen zu unterscheiden, so das ein Untergrund durch Helium das Training<br />

und spätere Analysen massiv verfälscht. Für die Auswahl von Positronen in den Abbildungen<br />

6.2 und 6.3 gelten die Kriterien für Elektronen mit positivem Ladungsvorzeichen.<br />

Für Helium wird verlangt, dass die mit dem Spurdetektor rekonstruierte Ladung zwischen<br />

1, 5 und 2, 5 liegt und vom elektromagnetisch Kalorimeter als Lepton zurückgewiesen wird.<br />

Mit diesen Bedingungen erhält man ein Trainingssample aus etwa 3 Millionen Elektronen<br />

und 255 Millionen Protonen im Rigiditätsbereich von 2 − 300 GV.<br />

6.2. Eingangs-Variablen<br />

Als Eingangs-Variablen für das neuronale Netzwerk des Übergangsstrahlungsdetektors stehen<br />

vor allem die Energieabgaben in den 20 Lagen zur Verfügung. Diese Energieabgaben<br />

sind nach Gleichung 4.1 abhängig vom Gammafaktor und somit von der Gesamtenergie<br />

des Teilchens. Damit ergibt sich eine Abhängigkeit der Eingangsvariablen zur gemessenen<br />

Rigidität, wie in Abbildung 6.6 am Beispiel von Flugdaten bis 300 GV gezeigt ist. Die<br />

Energieabgabe von Protonen steigt demnach mit der Energie wie erwartet an. Um diese<br />

Abhängigkeit zu berücksichtigen, wird die Rigidität als Eingangsvariable mit in das neuronale<br />

Netzwerk übergeben. Außerdem ist eine Abhängigkeit der Energieabgaben von der<br />

Gaszusammensetzung in den Proportionaldrahtkammerröhrchen zu erwarten. Der Teildruck<br />

des Xenongases wird also ebenfalls als Eingabevariable übergeben, um diesen zu<br />

51


52 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />

Abbildung 6.5.: Verteilung der EoverP Variable, die das Verhältnis von im Kalorimeter<br />

deponierter- zur Gesamtenergie eines Teilchens gibt.<br />

parametrisieren. Zusätzlich wurden noch aus den Energieabgaben zusammengesetzte, sogenannte<br />

integrierte Variablen getestet. Dazu wurde beispielsweise der RMS 5 oder der<br />

gestutzte Mittelwert der Energieabgaben betrachtet. Solche Variablen haben für sich alleine<br />

genommen gute Separationseigenschaften, allerdings tragen sie eventuell vorhandenen<br />

Korrelationen zwischen den einzelnen Lagen keine Rechnung und berauben dem neuronalen<br />

Netzwerk damit seiner potentiellen Vorteile gegenüber dem Likelihoodverhältnis.<br />

In Abbildung 6.7 ist ein Vergleich zwischen neuronalen Netzwerken mit unterschiedlichen<br />

Eingangsvariablen zu sehen. Dabei steht Int für das Set integrierter Variablen, Lay für die<br />

Energieabgaben in jeder Lage, Rig für die Rigidität des Teilchens, Beta für die relativistische<br />

Geschwindigkeit und Xe für den Teildruck des Xenongases. Außerdem wurde noch<br />

der Einfallswinkel des Teilchens zur z-Achse im Übergangsstahlungsdetektor als Eingangsvariable<br />

Theta und die geographische Breite Lat getestet. Die zum Vergleich verwendete<br />

Größe ist dabei die Protonenunterdrückung Rej 6 , die als Kehrwert der Effizienz Protonen<br />

als Signal zu selektieren nach<br />

Rej = 1 ε p<br />

(6.1)<br />

definiert ist. Die Protonenunterdrückung gibt damit an, auf wie viele Protonen im Durchschnitt<br />

eins als Signal falsch identifiziert wird. Die Protonenunterdrückung ist abhängig<br />

von der Signaleffizienz, die angibt wie viele Leptonen auch als solche erkannt werden. Als<br />

Vergleichsgröße ist die Protonenunterdrückung gut geeignet, da sie bei gegebener Entscheidungsgrenze<br />

nur mit Informationen der Protonenverteilung errechnet werden kann und<br />

nicht, wie beispielsweise die Reinheit, vom Verhältnis der Protonen- zur Leptonenanzahl<br />

abhängt, so dass diese normiert werden müssten. Die verschiedenen Netzwerke erreichen<br />

bei einer Signaleffizienz von 90% eine Protonenunterdrückung von der Größenordnung 10 3 .<br />

Die vielversprechendsten Variablenkonfigurationen sind dicker gezeichnet. Dabei scheint<br />

vor allem die Variablenkonfiguration mit den Energiedepositionen der einzelnen Lagen,<br />

sowie Rigidität, relativistische Geschwindigkeit, Teildruck des Xenongases und dem Einfallswinkel<br />

in den Übergangsstrahlungsdetektor, sowie der geographischen Breite eine gut<br />

5 engl.: Root mean squared<br />

6 engl.: Rejection<br />

52


6.2. Eingangs-Variablen 53<br />

Energieabgabe/ADC<br />

3<br />

10<br />

10<br />

2<br />

-3<br />

10<br />

-4<br />

10<br />

-5<br />

10<br />

Energieabgabe/ADC<br />

3<br />

10<br />

10<br />

2<br />

-3<br />

10<br />

10 -4<br />

-5<br />

10<br />

-6<br />

10<br />

-6<br />

10<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

10 -7<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

10 -7<br />

Abbildung 6.6.: Energieabgabe in Lage 6 über der Rigidität bis 300 GV für Protonen<br />

(links) und Elektronen (rechts). In schwarz ist die durchschnittliche Energieabgabe<br />

gezeigt (zut Interpretation sollte die logarithmisch gezeichnete<br />

y-Achse beachtet werden. Die Energieabgabe über 10 2 ADC stellt also<br />

einen signifikanten Anteil des Mittelwertes dar).<br />

geeignete zu sein. Für Vergleiche von Separationsmethoden ist außerdem der Verlauf der<br />

Protonenunterdrückung mit der Rigidität des Teilchens entscheidend. Dazu wird die Signaleffizienz<br />

auf 90% fixiert und der Schnittwert t cut für jeden Bin in der Rigidität separat<br />

mit 90% Signaleffizienz ermittelt. Zur Fehlerbetrachtung wird der statistische Fehler auf<br />

die Protoneneffizienz σ εp mit<br />

√<br />

σ Rej =<br />

√(<br />

∂Rej<br />

∂ε p<br />

) 2<br />

σε 2 p<br />

= 1 ε 2 σ εp (6.2)<br />

p<br />

auf die Protonenunterdrückung fortgepflanzt. Der statistische Fehler auf die Protoneneffizienz<br />

wird dabei von der Root Klasse TEfficiency mit Methoden der Bayes Statistik nach<br />

[44] mit uniformem Prior zwischen 0 und 1 ermittelt und ist asymmetrisch. Die Rigiditätsabhängigkeit<br />

der neuronalen Netze aus Abbildung 6.7 ist in Abbildung 6.8 gezeigt.<br />

Hier ist zu sehen, dass Variablenkonfigurationen mit hoher Protonenunterdrückung aus<br />

Abbildung 6.7 nur eine sehr hohe Unterdrückung bei geringer Rigidität aufweisen, wo der<br />

Schwerpunkt des Trainingssamples liegt. Bei höheren Rigiditäten sticht vor allem die Variablenkonfiguration<br />

mit den integrierten Variablen heraus, da deren Verteilung mit der<br />

Rigidität aufgrund geringerer Fluktuationen einfacher zu parametrisieren sind.<br />

Für niedrige Energien ist die relativistische Geschwindigkeit β, gemessen durch den Flugzeitdetektor,<br />

eine zusätzliche Variable, die bei der Unterscheidung von Protonen und Leptonen<br />

helfen kann. Protonen mit einer deutlich höheren Masse werden erst bei größeren<br />

Energien relativistisch als die leichteren Elektronen und Positronen. Dies ist in Abbildung<br />

6.9 dargestellt, wo die rekonstruierte relativistische Geschwindigkeit über der gemessenen<br />

Rigidität bis 300 GV für Protonen (links) und Elektronen (rechts) aufgetragen ist.<br />

Protonen werden erst bei etwa 5 GV vollkommen relativistisch. Elektronen sind bereits<br />

bei der unteren Grenze von 2 GV relativistisch. Um diese Information zu nutzen wurde das<br />

neuronale Netzwerk in zwei rigiditätsabhängige Teile getrennt. Ein Teil wird mit Ereignissen<br />

bis 5 GV trainiert und enthält die relativistische Geschwindigkeit als Eingangsvariable<br />

und ein Teil von 5 − 300 GV wird mit der Rigidität trainiert. Ein Vergleich der Protonenunterdrückung<br />

mit der Rigidität von geteilt trainierten neuronalen Netzen von 2 − 5<br />

GV und 5 − 300 GV, sowie des im gesamten Rigiditätsbereich von 2 − 300 GV trainierten<br />

Netzes ist in Abbildung 6.10 zu sehen. Außerdem wurde der Bereich von 5 − 300 GV<br />

bei 16 GV ein weiteres mal unterteilt. Die Entscheidung zur Unterteilung bei 16 GV ist<br />

dabei statistisch motiviert. Für das Netzwerk im gesamten Rigiditätsbereich wurde das<br />

53


54 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />

Protonenunterdruckung<br />

4<br />

10<br />

3<br />

10<br />

2<br />

10<br />

Int+Rig+Xe+Theta<br />

All<br />

Lay Only<br />

Lay+Xe<br />

Lay+Rig<br />

Lay+Rig+Xe<br />

Lay+Rig+Xe+Theta<br />

Lay+Rig+Xe+Theta+Beta<br />

Lay+Rig+Xe+Theta+Lat+Beta<br />

0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1<br />

Signal Effizienz<br />

Abbildung 6.7.: Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration<br />

der Eingangsvariablen gegen die Signaleffizienz.<br />

Protonenunterdruckung<br />

3<br />

10<br />

10<br />

2<br />

Int+Rig+Xe+Theta<br />

All<br />

Lay Only<br />

Lay+Xe<br />

Lay+Rig<br />

Lay+Rig+Xe<br />

Lay+Rig+Xe+Theta<br />

Lay+Rig+Xe+Theta+Beta<br />

Lay+Rig+Xe+Theta+Lat+Beta<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

Abbildung 6.8.: Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration<br />

der Eingangsvariablen mit der Rigidität des Teilchens.<br />

54


6.2. Eingangs-Variablen 55<br />

Beta<br />

1.4<br />

1.3<br />

5<br />

10<br />

Beta<br />

1.4<br />

1.3<br />

10 4<br />

1.2<br />

1.1<br />

10 4<br />

1.2<br />

1.1<br />

3<br />

10<br />

1<br />

0.9<br />

0.8<br />

3<br />

10<br />

2<br />

10<br />

1<br />

0.9<br />

0.8<br />

10 2<br />

10<br />

0.7<br />

10<br />

0.7<br />

0.6<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

1<br />

0.6<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

1<br />

Abbildung 6.9.: Relativistische Geschwindigkeit über der Rigidität bis 300 GV für Protonen<br />

(links) und Elektronen (rechts). In schwarz ist die der Verlauf des<br />

Durchschnitts gezeigt.<br />

Protonenunterdruckung<br />

3<br />

10<br />

2-5 GV<br />

5-300 GV<br />

2<br />

10<br />

2-300 GV<br />

5-16 GV & 16-300 GV<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

Abbildung 6.10.: Protonenunterdrückung neuronaler Netze, trainiert in unterschiedlichen<br />

Energiebereichen.<br />

Netzwerk mit der höchsten Protonenunterdrückung nach Abbildung 6.7 verwendet. Man<br />

erkennt bei niedrigen Energien eine leichte Verbesserung durch die Unterteilung, sowie eine<br />

signifikante Verbesserung bei Energien ab 10 GV. Die zusätzliche Unterteilung bei 16 GV<br />

bringt hingegen keine weitere Verbesserung. Dies mag am Mangel an Trainingsereignissen<br />

im Rigiditätsbereich von 16 − 300 GV liegen.<br />

Im Folgenden wird im Rigiditätsbereich von 2 − 5 GV das Netzwerk mit den Eingangsvariablen<br />

Energieabgabe, relativistische Geschwindigkeit, Teildruck des Xenongases, sowie<br />

dem Einfallswinkel des Teilchens zur z-Achse im Übergangsstrahlungsdetektor trainiert.<br />

Für den Rigiditätsbereich von 5 − 300 GV werden als Eingangsvariablen die Energieabgaben<br />

in jeder Lage, der Teildruck des Xenongases, die Rigidität und der Einfallswinkel<br />

zur z-Achse des Teilchens im Übergangsstrahlungsdetektor verwendet. Die Eingangsgrößen<br />

Gasdruck und Einfallswinkel im TRD sind dabei nicht rigiditäts-, oder teilchenabhängig<br />

und werden nur zur Parametrisierung der Energieabgaben ins Netzwerk gegeben. Außerdem<br />

werden für das Trainingssample im Bereich 5 − 300 GV nur Ereignisse mit einem<br />

Signal in Lage 1 des Spurdetektors, oberhalb des Übergangsstrahlungsdetektors, verwen-<br />

55


56 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />

Abbildung 6.11.: Durchschnittliche Energieabgabe von Protonen (rot) und Leptonen (dunkelblau)<br />

in den 20 Lagen des Übergangsstrahlungsdetektors mit angedeutetem<br />

Schnitt auf das Protonensample für die Trainingsauswahl.<br />

det. Damit kann die für die Berechnung der Energieabgaben benötigte Pfadlänge genauer<br />

angegeben werden. Getestet wurde das Netzwerk allerdings auch auf Ereignissen ohne<br />

einen zugeordneten Treffer in Lage 1.<br />

6.3. Training des neuronalen Netzwerks<br />

Je mehr Ereignisse des Trainingssamples für das Netzwerktraining verwendet werden können,<br />

desto besser kann die Verteilung der Eingangsparameter vom Netzwerk nachvollzogen<br />

und damit deren Separation optimiert werden. Die Anzahl an Trainingsereignissen ist vor<br />

allem durch die Anzahl an Elektronen als Signalereignisse im Trainingssample begrenzt.<br />

Diese machen nur etwa 1% der Trainingsdaten aus. Um den Trainingsprozess nicht zu<br />

sehr durch Protonen als Untergrund zu dominieren, wird nur ein Teil der Protonenauswahl<br />

verwendet. Um trotzdem ein gutes Trainingsresultat zu erzielen, werden hierfür speziell<br />

die Protonen herausgefiltert, die nur schwer von Elektronen zu unterscheiden sind<br />

und damit einen schweren Untergrund darstellen. Um diese nicht direkt anhand der Eingangsvariablen<br />

zu selektieren und weiterhin den gesamten Parameterraum abzudecken,<br />

wird die durchschnittliche Energieabgabe in allen Lagen betrachtet. Protonen mit einer<br />

überdurchschnittlich hohen Energieabgabe im Detektor bilden dann diesen schwer zu unterscheidenden<br />

Untergrund und werden für das Training verwendet. Die Verteilung der<br />

durchschnittlichen Energieabgabe bei Protonen und Leptonen aus Flugdaten, selektiert<br />

mit dem elektromagnetischen Kalorimeter, ist in Abbildung 6.11 gezeigt. Das Netzwerk<br />

sollte Protonen mit geringer durchschnittlicher Energieabgabe trotzdem einordnen können<br />

und wird daher auf alle Protonenereignisse getestet.<br />

6.3.1. Test auf Over-Training<br />

Um für das Training keine weiteren Daten zu verlieren, soll das Traingssample nicht, wie<br />

in Teil 5.3.3 beschrieben, aufgeteilt werden, um ein unabhängiges Testsample zu erhalten,<br />

sondern im Ganzen für das Training verwendet werden. Dabei soll der Trainingsalgorithmus<br />

innerhalb der Neurobayes R○ Software automatisch stoppen, wenn ein gutes globales<br />

56


6.3. Training des neuronalen Netzwerks 57<br />

Minimum der Fehlerfunktion E(w) gefunden ist und damit Over-Training verhindern. Dies<br />

passiert durch die sogenannte BFGS-Methode 7 , die eine schnelle Möglichkeit bietet ein globales<br />

Minimum zu finden [40]. Um dies zu testen, wird das Trainingssample in 10 Teile<br />

geteilt. Jedes dieser Teilsamples wird dann in einer Trainingsprozedur mit den übrigen<br />

neun Teilsamplen, bei gleichen Trainingseinstellungen, als Testsample verwendet. Es wird<br />

getestet ob in einem der 10 Trainingsprozeduren Over-Training stattfindet. Ist dies nicht<br />

der Fall, kann das Netzwerk bei gleichen Trainingseinstellungen mit der gesamten Trainingsauswahl<br />

trainiert werden ohne Over-Training zu riskieren.<br />

Um auf Over-Training zu testen, werden die Verteilungen der Ausgabewerte des neuronalen<br />

Netzwerks für das Test- und das Trainignssample verglichen. Sind die Werte gleich<br />

verteilt, hat kein Over-Training statt gefunden. Man erhält eine Ausgabe wie sie in Abbildung<br />

6.12 dargestellt ist für jede der 10 Trainingsprozeduren. Die Verteilung der Residuen<br />

wird nach<br />

r =<br />

t T raining − t T est<br />

(6.3)<br />

N T est + N T raining<br />

gebildet, wobei t T raining,T est der Ausgabewert des Trainings, bzw. des Testsamples für einen<br />

Bin und N T raining,T est der Inhalt des entsprechenden Bins ist. Die Residuen sollten über<br />

den möglichen Ausgabewerten zufällig verteilt sein und kein Muster aufweisen. Ist dies der<br />

Fall können die Verteilungen als gleich angesehen werden. Das ist, wie in Abbildung 6.12,<br />

für alle Teiltrainings der Fall, so dass man davon ausgehen kann, dass kein Over-Training<br />

stattfindet.<br />

6.3.2. Training mit Gewichten<br />

Eine weitere Möglichkeit das Training des neuronalen Netzwerkes zu optimieren, besteht<br />

in der Verwendung von Gewichten. Diese stellen eine Größe dar, mit der die Bedeutung<br />

eines Ereignisses für das Training beschrieben wird. Jedem Trainingsereignis wird dabei<br />

eine reelle Zahl zwischen 0 und 1 zugeordnet, wobei mit 1 gewichtete Ereignisse besonders<br />

stark in das Training einfließen und mit 0 gewichtete Ereignisse für das Training nicht<br />

beachtet werden. Für die Festlegung der Gewichte wird die Netzwerkausgabe nach einer<br />

Trainingsiteration betrachtet. Die Gewichte werden dann so gesetzt, dass bereits gut eingeordnete<br />

Ereignisse ein geringes Gewicht für das Training erhalten. Falsch eingeordnete<br />

Ereignisse erhalten ein hohes Gewicht. Dazu wird der Ausgabewert t des Netzwerks auf<br />

das Intervall zwischen 0 und 1 transformiert, wobei 1 einem Signal und 0 einem Untergrundereignis<br />

entspricht. Dann werden die Gewichte g linear nach diesem Ausgabewert<br />

mit g Sig = 1 − t für Signalereignisse und g Bkg = t für Untergrundereignisse festgelegt, wie<br />

es in Abbildung 6.13 dargestellt ist. Anschließend kann das Training mit einer gewöhnlichen<br />

Anzahl an Iterationen durchgeführt werden. Um den Ausgabewert des neuronalen<br />

Netzwerkes auch weiterhin als Wahrscheinlichkeit im Sinne der Bayes-Statistik nach Teil<br />

5.3.4 interpretieren zu können, muss eine an das Training anschließende Rückgewichtung<br />

nach<br />

t 1 · t 2<br />

˜t =<br />

(6.4)<br />

t 1 t 2 + (1 − t 1 )(1 − t 2 )<br />

durchgeführt werden, wobei t 1 der Ausgabewert nach einer Trainingsiteration und t 2 den<br />

Ausgabewert nach dem zweiten Training, darstellt. Die Methode Gewichte nach diesem<br />

Vorgehen festzulegen wird als Verstärkung bezeichnet. Der Einfluss der Verstärkung auf die<br />

Protonenunterdrückung der Netzwerke im Bereich 2−5 GV und 5−300 GV ist in Abbildung<br />

6.14 gezeigt. Demnach scheint das Training mit Gewichten für das Netzwerk bei niedrigen<br />

Energien ein Nachteil zu sein und wird daher nicht angewandt. Bei hohen Energien erreicht<br />

man durch das Verstärken einen kleinen Vorteil. Die Schwierigkeit bei der hier vorgestellten<br />

Methode liegt in der Stärke der Netzwerke nach bereits einer Trainingsiteration, so dass<br />

ein Großteil des Trainingssamples zu gering gewichtet wird.<br />

7 Broyden-Fletcher-Goldfarb-Shanno Methode<br />

57


58 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />

Verteilung der Ausgabewerte<br />

6<br />

10<br />

Signal Training<br />

Signal Test<br />

Untergrund Training<br />

5<br />

10<br />

Untergrund Test<br />

4<br />

10<br />

3<br />

10<br />

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />

Ausgabewerte<br />

Signal Training To Test Residuals<br />

0.15<br />

0.1<br />

0.05<br />

0<br />

-0.05<br />

-0.1<br />

-0.15<br />

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />

Expert Output<br />

Background Training To Test Residuals<br />

0.04<br />

0.02<br />

0<br />

-0.02<br />

-0.04<br />

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />

Expert Output<br />

Abbildung 6.12.: Verteilung der Ausgabewerte des neuronalen Netzwerkes für das<br />

Trainings- und das Testsample aufgeteilt nach Signal und Untergrundereignissen<br />

(oben). Darunter sind die Residuen der Verteilungen dargestellt.<br />

58


6.3. Training des neuronalen Netzwerks 59<br />

-1<br />

10<br />

1<br />

0.8<br />

Gewichte<br />

1<br />

-1<br />

10<br />

1<br />

0.8<br />

Gewichte<br />

0.6<br />

0.6<br />

-2<br />

10<br />

0.4<br />

-2<br />

10<br />

0.4<br />

-3<br />

10<br />

0.2<br />

-3<br />

10<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

Ausgabewert<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

Ausgabewert<br />

Abbildung 6.13.: Verteilung der Ausgabewerte von Protonen (links) und Elektronen<br />

(rechts) nach einer Trainingsiteration mit Gewichtsfunktion (grün).<br />

Protonenunterdruckung<br />

3<br />

10<br />

Protonenunterdruckung<br />

3<br />

10<br />

Normal<br />

Verstarkt<br />

2 2.5 3 3.5 4 4.5 5<br />

Rigiditat/GV<br />

Normal<br />

Verstarkt<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

Abbildung 6.14.: Vergleich des verstärkten neuronalen Netzwerkes mit dem unverstärkten<br />

im Bereich von 2 − 5 GV (links) und 5 − 300 GV (rechts).<br />

6.3.3. Trainingseinstellungen<br />

In der NeuroBayes R○ Software werden Trainingseinstellungen über das Setzen von Bitschaltern<br />

getätigt. Damit kann festgelegt werden, wie das Training ablaufen und Eingangsvariablen<br />

in der Vorprozessierung behandelt werden sollen. In der Vorprozessierung<br />

werden die Eingangsvariablen für die Verwendung im neuronalen Netzwerk vorbereitet.<br />

Dabei werden sie mittels einer nichtlinearen Transformation zu einer Gauß-Verteilung mit<br />

Mittelwert 0 und Varianz 1 transformiert. Dafür wird eine Anpassung an die Verteilung der<br />

Eingangsvariablen durchgeführt. Danach werden die Verteilungen der Eingangsvariablen<br />

dekorreliert [41]. In etwa 12% der Fälle kann dem Ereignis keine Energieabgabe in einer<br />

Lage zugeordnet werden. Die NeuroBayes R○ Software schließt solche fehlenden Energieabgaben<br />

von der Anpassung aus und gibt sie als Nullinformation an des Netzwerk weiter.<br />

Des Weiteren werden die Eingangsvariablen nach ihren Separationseigenschaften sortiert<br />

und für die Unterscheidung von Signal und Untergrund irrelevante Variablen entfernt.<br />

Für die Trennungseigenschaften des neuronalen Netzwerks sind außerdem die Menge an<br />

Neuronen in der versteckten Schicht wichtig. Durch diese wird die Kapazität des neuronalen<br />

Netzwerks bestimmt. Sind zu viele Neuronen in der versteckten Schicht, tendiert das<br />

Netzwerk zum Over-Training und verliert seine Eigenschaft zur Generalisierung. Wenige<br />

Neuronen führen wiederum zu einer zu starken Vereinfachung der Parameterverteilung.<br />

Für N Eingangsvariablen werden N + 2 Neuronen in der versteckten Schicht verwendet.<br />

Zusätzlich kann die Trainingsgeschwindigkeit festgelegt werden, die die Schrittweite bei<br />

der numerischen Minimierung der Fehlerfunktion E(w) festlegt. Diese wird bei 1.0 und<br />

damit der Grundeinstellung belassen. Die Zahl der Trainingsiterationen wird nicht fixiert,<br />

59


100% Signal-ähnlich<br />

60 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />

so das Trainingsiterationen durchgeführt werden, bis der BFGS-Algorithmus das Training<br />

beendet. Da bei dem großen Trainingssample und der starken Separationseigenschaften<br />

der Einganvsvariablen bereits in der ersten Trainingsiteration ein Großteil der Parameterverteilung<br />

gelernt wird, wird dieser Punkt bereits nach etwa 6 − 8 Iterationen erreicht.<br />

6.4. Ausgabe des neuronalen Netzwerkes<br />

Die Ausgabe des neuronalen Netzes kann nach Teil 5.3.4 als Wahrscheinlichkeit interpretiert<br />

werden. In der NeuroBayes R○ Software wird die Ausgabe so gewählt, dass Ausgabewerte<br />

zwischen −1 und +1 liegen. Ein Wert bei +1 kann dann als 100%ige Wahrscheinlichkeit<br />

für ein Signalereignis aufgefasst werden, Werte bei −1 als 100%ige Wahrscheinlichkeit<br />

für ein Untergrundereignis. Die Verteilung der Ausgabewerte des neuronalen Netzwerks im<br />

Rigiditätsbereich 5 − 300 GV ist in Abbildung 6.15 gegeben. Zudem wird von der Software<br />

100% Untergrund-ähnlich<br />

t cut<br />

Abbildung 6.15.: Verteilung der Ausgabewerte des neuronalen Netzwerks und deren<br />

Interpretation.<br />

eine Rangliste der Eingangsvariablen erstellt. Diese ist sortiert nach dem Beitrag einer<br />

Variable zur Separation im neuronalen Netzwerk, gegeben durch die Signifikanz. Die Liste<br />

für das Netzwerk von 2 − 5 GV ist in Tabelle 6.1 dargestellt. Dabei ist nicht nur die<br />

Signifikanz ”<br />

Sig“ der Variablen im Netzwerk, sondern auch die Signifikanz der Variablen<br />

alleine gegeben und der Signifikanzverlust für das Netzwerk ohne diese Variable. Die Signifikanz<br />

alleine gibt dabei die Korrelation zwischen der Variable und dem Zielwert, wie<br />

er in Teil 5.3.3 definiert wurde. Außerdem ist die Korrelation zu den anderen Variablen<br />

gegeben. Die Ranglist für das Netzwerk von 5 − 300 GV ist in Tabelle 6.2 angegeben. Die<br />

Zählung der Lagen im Übergangsstrahlungsdetektor erfolgt dabei aufsteigend von unten<br />

nach oben. Um eine Fehlerdiagnose zu vereinfachen und den Erfolg des Trainings zu überprüfen,<br />

wird von der Software ein Analysedokument erstellt. In diesem Dokument sind<br />

wichtige Informationen zum Verlauf des Trainings wie die Fehlerfunktion, Informationen<br />

zu den einzelnen Variablen wie Separationseigenschaften und deren Transformation, sowie<br />

Informationen über das Netzwerk selbst wie die Korrelationsmatrix der Eingabeparameter<br />

und die Struktur des Netzwerks. Ein Ausschnitt mit wichtigen Informationen der Analysedokumente<br />

für die Netzwerke von 2 − 5 GV und von 5 − 300 GV ist in Anhang A und<br />

B zu finden.<br />

60


6.4. Ausgabe des neuronalen Netzwerkes 61<br />

Variable Sig. im Netzwerk Sig. alleine Sig. Verlust Korrelation<br />

Beta 855.24 855.24 260.94 38.1%<br />

Energieabgabe in Lage 01 563.36 698.85 192.35 31.9%<br />

Energieabgabe in Lage 05 502.87 696.97 188.62 32.0%<br />

Energieabgabe in Lage 03 452.28 695.26 189.79 31.8%<br />

Energieabgabe in Lage 06 411.77 692.18 187.59 31.7%<br />

Energieabgabe in Lage 02 378.03 698.26 190.23 32.0%<br />

Energieabgabe in Lage 07 349.08 689.71 185.72 31.7%<br />

Energieabgabe in Lage 08 323.10 686.05 184.17 31.5%<br />

Energieabgabe in Lage 09 300.03 679.50 181.69 31.3%<br />

Energieabgabe in Lage 04 281.32 682.20 185.32 31.2%<br />

Energieabgabe in Lage 10 265.43 674.53 180.11 31.0%<br />

Energieabgabe in Lage 11 248.11 667.33 176.13 30.8%<br />

Energieabgabe in Lage 13 233.16 660.92 173.47 30.6%<br />

Energieabgabe in Lage 12 221.54 663.16 173.92 30.7%<br />

Energieabgabe in Lage 14 206.52 649.74 168.22 30.2%<br />

Energieabgabe in Lage 15 194.78 641.07 165.72 29.8%<br />

Energieabgabe in Lage 17 185.55 622.63 159.23 29.0%<br />

Energieabgabe in Lage 18 173.80 609.84 155.82 28.4%<br />

Energieabgabe in Lage 16 166.76 618.57 158.17 28.8%<br />

Energieabgabe in Lage 19 154.86 591.89 149.07 27.7%<br />

Energieabgabe in Lage 20 135.84 555.83 136.01 26.2%<br />

TrdTheta 53.53 74.66 53.53 1.9%<br />

Xe Teildruck 8.25 74.89 8.25 4.2%<br />

Tabelle 6.1.: Liste der Eingangsvariablen des neuronalen Netzwerks im Rigiditätsbereich<br />

2 − 5 GV, sortiert nach deren Beitrag zur Separation.<br />

61


62 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor<br />

Variable Sig. im Netzwerk Sig. alleine Sig. Verlust Korrelation<br />

Energieabgabe in Lage 02 711.54 711.54 206.57 30.7%<br />

Energieabgabe in Lage 06 621.71 709.51 204.95 30.7%<br />

Energieabgabe in Lage 05 552.53 710.04 205.50 30.7%<br />

Energieabgabe in Lage 08 495.60 705.16 204.72 30.5%<br />

Energieabgabe in Lage 01 451.80 706.62 206.31 30.5%<br />

Energieabgabe in Lage 07 414.48 706.76 205.04 30.5%<br />

Energieabgabe in Lage 03 383.18 707.40 204.71 30.6%<br />

Energieabgabe in Lage 09 355.18 699.53 203.33 30.2%<br />

Energieabgabe in Lage 10 331.33 697.62 202.19 30.1%<br />

Energieabgabe in Lage 11 309.31 690.55 201.15 29.8%<br />

Energieabgabe in Lage 12 291.53 688.17 199.88 29.7%<br />

Energieabgabe in Lage 13 275.07 682.54 198.97 29.4%<br />

Energieabgabe in Lage 04 261.78 694.79 201.47 30.0%<br />

Energieabgabe in Lage 14 245.98 673.02 195.34 29.0%<br />

Energieabgabe in Lage 15 232.65 661.38 193.47 28.4%<br />

Energieabgabe in Lage 17 217.04 639.35 186.65 27.4%<br />

Energieabgabe in Lage 16 207.78 633.50 187.34 27.0%<br />

Energieabgabe in Lage 18 199.26 620.53 184.76 26.4%<br />

Energieabgabe in Lage 19 187.14 592.50 179.44 24.9%<br />

Energieabgabe in Lage 20 168.35 531.46 166.17 22.0%<br />

Rabs 126.74 523.23 126.77 23.8%<br />

XePressure 23.82 42.37 23.82 1.2%<br />

TrdTheta 12.77 34.79 12.77 1.6%<br />

Tabelle 6.2.: Liste der Eingangsvariablen des neuronalen Netzwerks im Rigiditätsbereich<br />

5 − 300 GV, sortiert nach deren Beitrag zur Separation.<br />

62


7. Vergleich von Methoden zur<br />

Protonen/Positronen Trennung<br />

Wie in Teil 5.2 beschrieben, stehen zur Trennung von Protonen und Leptonen zwei Implementierungen<br />

von Likelihoodverhältnissen in der AMS Software zur Verfügung: Das<br />

in der RWTH Aachen entwickelte Framework TrdQt und das im MIT entwickelte TrdK.<br />

Die Separationseigenschaften dieser Methoden sollen hier mit denen des neuronalen Netzwerks<br />

verglichen werden. Die Protonenunterdrückung von Separationsmethoden ist dabei<br />

stark von der Vorselektion und der Selektion der zu testenden Ereignisse abhängig. Dabei<br />

ist dann ein Vorteil des neuronalen Netzwerks gegenüber den Likelihood Methoden<br />

zu erwarten, wenn einzelne Korrelationen zwischen den Lagen auftreten und damit eine<br />

einfache lineare Trennung der Populationen nicht mehr optimal ist. Außerdem können Abhängigkeiten<br />

von Parametern wie Rigidität oder Gasdruck auf eine unterschiedliche Weise<br />

eingebracht werden.<br />

Als Vergleich zwischen den Methoden wird die Protonenunterdrückung betrachtet, wie<br />

sie in Teil 6.2 definiert wurde. In Abbildung 7.1 ist die Protonenunterdrückung für die<br />

drei Methoden mit der Effizienz auf die Selektion von Elektronen gezeigt. Dabei liegen<br />

die Likelihoodmethoden nahe beieinander, wobei das Likelihoodverhältnis der TrdK Calib<br />

leicht über der TrdQt Likelihood liegt. Das neuronale Netzwerk kann sich nur bei niedrigen<br />

Effizienzen von den Likelihoodmethoden absetzen und hat oberhalb einer Signaleffizienz<br />

von etwa 75% vergleichbare Performance. Abbildung 7.2 zeigt die Protonenunterdrückung<br />

bei 90% Signaleffizienz, in jedem Bin, mit der Rigidität. Hier ist zu sehen, dass das neuronale<br />

Netzwerk vor allem bei niedrigen Rigiditäten bis 5 GV im Vorteil gegenüber den<br />

Likelihoodmethoden ist.<br />

In den Abbildungen 7.3 sind die Übereinstimmungen der Auswahl von Elektronen bei einer<br />

Auswahleffizienz von 90% durch die beiden Likelihoodmethoden und das neuronale Netzwerk<br />

als sogenanntes Venn Diagramm gezeigt. Dieses zeigt an, inwieweit die durch die drei<br />

Separationsmethoden selektierten Elektronen übereinstimmen. Die Überschneidung der<br />

Mengen ist in Prozent gegeben. Darunter ist die Anzahl an Ereignissen in den Teilmengen<br />

angegeben. 100% entsprechen dabei der Gesamtzahl an selektierten Signalereignissen,<br />

also der Summe in allen Teilmengen. Demnach werden 90% der selektierten Elektronen<br />

in Übereinstimmung der drei Separationsmethoden ausgewählt. Weitere 4% werden nur<br />

von den Likelihoodmethoden, jedoch nicht vom neuronalen Netzwerk erkannt. Diese gilt es<br />

noch zu untersuchen und gegebenenfalls in das Netzwerktraining einzubinden. Insgesamt<br />

ist die Übereinstimmung der Auswahl jedoch hoch.<br />

Um die physikalisch relevanten Eigenschaften der Separationsmethoden zu untersuchen,<br />

63


64 7. Vergleich von Methoden zur Protonen/Positronen Trennung<br />

Rejection<br />

5<br />

10<br />

Rejection with signal efficiency<br />

4<br />

10<br />

3<br />

10<br />

Neuronales Netzwerk<br />

2<br />

10<br />

TrdQt Likelihood<br />

TrdK Calib Likelihood<br />

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

Sig Eff<br />

Abbildung 7.1.: Protonenunterdrückung mit der Signaleffizienz des neuronalen<br />

Netzwerks (dunkelblau), sowie des TrdQt- (rot) und des TrdK-<br />

Likelihoodverhältnisses (blau).<br />

Protonenunterdruckung<br />

3<br />

10<br />

Neuronales Netzwerk<br />

TrdQt Likelihood<br />

TrdKCalib Likelihood<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

Abbildung 7.2.: Protonenunterdrückung mit Rigidität im Bereich 5 − 300 GV für das<br />

neuronale Netzwerks (schwarz), sowie für das TrdQt- (rot) und TrdK-<br />

Likelihoodverhältnis (blau).<br />

64


7.1. Reinheit der Separationsmethoden 65<br />

Abbildung 7.3.: Übereinstimmung der Auswahl von Elektronen bei 90% Signaleffizienz<br />

durch die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem<br />

neuronalen Netzwerk.<br />

wird die Reinheit als Anteil von Signalereignissen in der Annahmeregion nach Gleichung<br />

5.6 ermittelt. Mit bekannter Reinheit kann dann eine Analyse von ausgewählten Positronen<br />

und Elektronen durchgeführt werden.<br />

7.1. Reinheit der Separationsmethoden<br />

Um die Reinheit zu ermitteln soll auch hier auf Flugdaten zurückgegriffen werden. Dazu<br />

wurde eine Methode gewählt, die eine selektierte Positronenauswahl an Schablonen aus<br />

Elektronen als Signal und Protonen als Untergrund anpasst. Als Schablone dient dabei die<br />

Verteilung der Ausgabewerte des Boosted Decision Trees durch das elektromagnetische Kalorimeter,<br />

unabhängig vom Übergangsstrahlungsdetektor. Damit kann ermittelt werden,<br />

wie das selektierte Positronensample zusammengesetzt ist. Um Schablonen zu erstellen<br />

muss eine Protonen- und Elektronenselektion unabhängig vom elektromagnetischen Kalorimeter<br />

durchgeführt werden. Dazu werden Ereignisse mit dem Übergangsstrahlungsdetektor<br />

selektiert. Man startet mit einer Ereignismenge aus Ereignissen mit Ladungsbetrag<br />

|Z| = 1 aus Spurdetektor, sowie einer maximalen Energieabgabe von weniger als 5, 0 MeV<br />

und einer durchschnittlichen Energieabgabe von weniger als 4, 0 MeV im Flugzeitdetektor,<br />

um Heliumkontamination zu vermeiden. Aus dieser Menge werden nun Protonen mit<br />

• Positive Ladung Z = +1 mit dem Spurdetektor<br />

• Proton mit TrdQt Likelihoodverhältnis<br />

und Elektronen mit<br />

• Negative Ladung Z = −1 mit dem Spurdetektor<br />

• Elektron mit TrdQt Likelihoodverhältnis<br />

in einem bestimmten Rigiditätsbereich selektiert. Man erhält aus der Verteilung der BDT<br />

Ausgabewerte Rigiditätsabhängige Schablonen, wie in Abbildung 7.4. Nun werden Positronen<br />

mit Ladung Z = +1 mittels der Methode selektiert, deren Reinheit ermittelt werden<br />

soll. An diese Verteilung werden die Schablonen durch Variieren der Gewichte angepasst,<br />

bis deren gewichtete Summe der Positronenauswahl bestmöglich entspricht. Dazu wird die<br />

Root Klasse TFractionFitter genutzt. Aus dem Gewicht der Elektronenschablone erhält<br />

65


66 7. Vergleich von Methoden zur Protonen/Positronen Trennung<br />

7<br />

10<br />

6<br />

10<br />

5<br />

10<br />

Protonen Schablone<br />

6<br />

10<br />

5<br />

10<br />

4<br />

10<br />

3<br />

10<br />

Elektronen Schablone<br />

4<br />

10<br />

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />

BDT<br />

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />

BDT<br />

Abbildung 7.4.: Verteilung des BDT Ausgabewertes der Protonenschablone<br />

(links) und der Elektronenschablone (rechts), selektiert mit dem<br />

Übergangsstrahlungsdetektor.<br />

Selektierte Positronen<br />

-1<br />

10<br />

-1<br />

10<br />

Data Points<br />

Electron Template<br />

Proton Template<br />

Fit<br />

Purity: 0.264 +- 0.003<br />

ChiSq/NDF: 2.719<br />

-2<br />

10<br />

-2<br />

10<br />

-3<br />

10<br />

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />

BDT<br />

-3<br />

10<br />

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />

BDT<br />

Abbildung 7.5.: Verteilung des BDT Ausgabewertes einer Auswahl von Positronen mit<br />

dem neuronalen Netzwerk bei einer Elektronen Effizienz von 90% im Rigiditätsbereich<br />

7, 96 − 10, 05 GV (links) und Anpassung der Schablonen<br />

an dies Positronenauswahl (rechts).<br />

man dann die Reinheit. Ein Beispiel für eine solche Anpassung, für eine Positronenauswahl<br />

im Rigiditätsbereich 7, 96 − 10, 05 GV, ist in Abbildung 7.5 dargestellt.<br />

Nicht aufgerufen wird der Entscheidungsbaum für Ereignisse, die bereits durch eine einfache<br />

Betrachtung der Schauerform sicher als Protonen identifiziert werden können. Dies<br />

betrifft Ereignisse die nur durch Ionisation Energie im Kalorimeter deponieren und damit<br />

MIP 1 -ähnlich sind. Diese Ereignisse mit einer geringen Energieabgabe in den ersten beiden<br />

Superlagen des Kalorimeters werden zu −0, 9991 und Ereignisse mit einer geringen<br />

Schauerausbreitung zu −0, 9993 gesetzt und damit sicher als Protonen gekennzeichnet.<br />

Für die Anpassung an die Verteilung des BDT stellen solche Ereignisse ein Problem dar,<br />

da sie überwiegend für positive Teilchen auftreten. Damit wird eine Diskrepanz zwischen<br />

Elektronenschablone und Positronenverteilung hergestellt. Sie werden daher von der Anpassung<br />

ausgenommen und im Nachhinein korrigiert. Dazu wird ausgenutzt, dass es sich<br />

bei diesen Ereignissen in der Positronenauswahl ausschließlich um falsch eingeordnete Protonen<br />

handelt. Die Situation für die Verteilung der BDT Ausgabewerte ist in Abbildung<br />

7.6 dargestellt. Es befinden sich A+B Protonen in den Bins bei −0, 9993 und −0, 9991 der<br />

Positronenauswahl durch den TRD. Das Ergebnis der Anpassung f für die Elektronen-<br />

1 engl.: Minimum Ionisation Particle<br />

66


7.2. Vergleich anhand der ermittelten Reinheit 67<br />

A<br />

B<br />

MIP<br />

-0.9993<br />

MIP<br />

-0.9991<br />

BDT<br />

Abbildung 7.6.: Schematische Darstellung der Verteilung des Entscheidungsbaumes in der<br />

Region der minimal ionisierenden Teilchen in der Longitudinalen und Lateralen<br />

Schauerausbreitung.<br />

schablone ohne diese Bins gibt<br />

f =<br />

N P os<br />

N − (A + B) , (7.1)<br />

wobei N P os die Anzahl richtig eingeordneter Positronen und N die vom TRD selektierten<br />

Positronen mit Protonenverunreinigung gibt. Die Nummer der richtig eingeordneten Positronen<br />

N P os wird durch das Ausschließen der Bins von der Anpassung an die Schablonen<br />

nicht verändert. Damit ist die korrigierte Reinheit<br />

p = N P os<br />

N<br />

= f −<br />

(A + B)<br />

N . (7.2)<br />

7.2. Vergleich anhand der ermittelten Reinheit<br />

Mit dem Vorgehen nach der Anpassung der Positronenauswahl mithilfe von Schablonen<br />

wird jetzt die Reinheit der Positronenauswahl mit der Effizienz auf die Positronenselektion<br />

ermittelt. Diese ist in Abbildung 7.7 für den Rigiditätsbereich 2 − 300 GV dargestellt.<br />

Die Verläufe ähneln denen aus Abbildung 7.1. Bei niedriger Signaleffizienz ist die Anzahl<br />

selektierter Positronen zu gering und die Anpassungsprozedur ist instabil gegenüber statistischen<br />

Fluktuationen und kann nicht mehr optimal durchgeführt werden.<br />

Wie in Kapitel 5.1 beschrieben verbindet eine gute Separationsmethode hohe Effizienz bei<br />

hoher Reinheit. Als Arbeitspunkt wird daher der Punkt ausgewählt, der dem Idealpunkt<br />

mit Signaleffizienz 1 und Reinheit 1 am nächsten liegt. Um Arbeitspunkte mit der Rigidität<br />

zu erhalten werden nun Anpassungen an Schablonen in bestimmten Rigiditätsabschnitten<br />

durchgeführt und der Verlauf der Reinheit mit der Signaleffizienz betrachtet. Daraus erhält<br />

man den Arbeitspunkt für den ensprechenden Rigiditätsbereich. Die damit ermittelten<br />

Entscheidungsgrenzen mit der Rigidität, sowie die Effizienz auf die Signalauswahl sind<br />

in Abbildung 7.8 dargestellt. Dabei ist für die Entscheidungsgrenzen zu beachten, dass<br />

für das neuronale Netzwerk hohe Ausgabewerte gegen +1 einem Signalereignis entsprechen.<br />

Für die Likelihoodverhältnisse hingegen stehen niedrige Werte für Signalereignisse.<br />

Der Ausschlag für die Entscheidungsgrenze im letzten Bin geht also in allen Separationsmethoden<br />

in Richtung höherer Untergrund und ist der geringen Statistik in diesem Bin<br />

geschuldet. Die Effizienz auf die Signalauswahl ist bei allen Methoden vergleichbar und<br />

67


68 7. Vergleich von Methoden zur Protonen/Positronen Trennung<br />

Reinheit<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

Neuronales Netzwerk<br />

TrdQt Likelihood<br />

TrdK Calib Likelihood<br />

0<br />

0.4 0.5 0.6 0.7 0.8 0.9 1<br />

Signal Effizienz<br />

Abbildung 7.7.: Reinheit der Positronenauswahl mit der Effizienz auf die<br />

Positronenselektion.<br />

Entscheidungsgrenze<br />

Signal Effizienz<br />

1<br />

0.95<br />

0.9<br />

0.85<br />

0.8<br />

0.75<br />

0.7<br />

Rigidität/GV<br />

0.65<br />

0.6<br />

0.55<br />

0.5<br />

Neuronales Netzwerk<br />

TrdQt Likelihood<br />

TrdK Calib Likelihood<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

Abbildung 7.8.: Entscheidungsgrenzen am Arbeitspunkt mit der Rigidität (links) und Signaleffizienz<br />

bei diesen Entscheidungsgrenzen mit der Rigidität (rechts).<br />

liegt bei etwa 80%. Die für die Arbeitspunkte ermittelte Reinheit mit der Rigidität ist in<br />

Abbildung 7.9 zu sehen. Hier hebt sich das neuronale Netzwerk bei niedrigen Rigidtäten,<br />

ähnlich der Protonenunterdrückung aus Abbildung 7.2, deutlich von den Likelihoodmethoden<br />

ab. Dies ist durch die Einbindung der relativen Geschwindigkeit zu erklären. In<br />

den Abbildungen 7.10 und 7.11 ist noch einmal die Übereinstimmung der Auswahl von<br />

Elektronen und Positronen mit den Entscheidungsgrenzen aus Abbildung 7.8, verteilt auf<br />

die drei Separationsmethoden, als Venn Diagramm gezeigt. Dabei wurden die Einträge<br />

für Positronen mit der Reinheit gewichtet, um Protonenkontamination zu korrigieren. Für<br />

die Schnittflächen wurde die höchste Reinheit der Schnittpartner verwendet, was zumeist<br />

der Reinheit des neuronalen Netzwerks entspricht und die Zahlen für die Likelihoodmethoden<br />

in Schnittmengen mit dem neuronalen Netzwerk leicht erhöht. Der prozentuale<br />

Anteil wurde so definiert, dass die gesamte Menge an Elektronen oder Positronen, selektiert<br />

durch mindestens eine der drei Methoden und damit die Summe aller Teilmengen,<br />

100% entspricht. Die Anzahl der Einträge in die jeweiligen Bereichen wurde bei Positronen<br />

außerdem auf ganze Zahlen gerundet. Die Teilmengen sind bei Elektronen ähnlich verteilt<br />

68


7.2. Vergleich anhand der ermittelten Reinheit 69<br />

Reinheit<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

10<br />

Neuronales Netzwerk<br />

TrdQt Likelihood<br />

TrdK Calib Likelihood<br />

2<br />

10<br />

Rigiditat/GV<br />

Abbildung 7.9.: Reinheit der Positronenauswahl mit der Rigidität.<br />

wie in Abbildung 7.3, jedoch ist die Selektionseffizienz für das neuronale Netzwerk etwas<br />

höher, was die Schnittflächen zu diesem etwas verschiebt. Für Positronen ist der gegenteilige<br />

Effekt zu sehen. Die Likelihoodmethoden selektieren wesentlich mehr Positronen<br />

als das neuronale Netzwerk und nur 80000 Positronen werden in Übereinstimmung der<br />

drei Methoden ausgewählt. In Abbildung 7.12 ist die Anzahl der ausgewählten Positronen<br />

durch die verschiedenen Separationsmethoden mit der Rigidität aufgetragen. Dort ist<br />

zu erkennen, dass die Anzahl ausgewählter Positronen im statistischen Fehlerbereich in<br />

großen Teilen übereinstimmen. Der statistische Fehler setzt sich hierbei aus dem binominalen<br />

Fehler als Wurzel der Positronenanzahl und dem Fehler aus der Anpassungsprozedur<br />

zusammen. Im letzten Rigiditätsabschnitt werden durch die Likelihoodmethoden jedoch<br />

wesentlich mehr Positronen selektiert. Dies ist auf die geringe Zahl an Elektronen und<br />

Positronen in diesem Rigiditätsbereich zurückzuführen, wodurch die Anpassungsprozedur<br />

fehlerhaft verläuft und erklärt die Verschiebung der Positronenauswahl in Abbildung 7.11.<br />

69


70 7. Vergleich von Methoden zur Protonen/Positronen Trennung<br />

Abbildung 7.10.: Übereinstimmung der Auswahl von Elektronen am Arbeitspunkt durch<br />

die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />

Netzwerk.<br />

Abbildung 7.11.: Übereinstimmung der Auswahl von Positronen am Arbeitspunkt durch<br />

die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />

Netzwerk gewichtet mit der Reinheit.<br />

70


7.2. Vergleich anhand der ermittelten Reinheit 71<br />

# Positronen<br />

5<br />

10<br />

4<br />

10<br />

3<br />

10<br />

2<br />

10<br />

NN Positronen<br />

TrdQt Positronen<br />

TrdK Positronen<br />

10<br />

2<br />

10<br />

Rigiditat/GV<br />

Abbildung 7.12.: Positronenauswahl der Separationsmethoden mit der Rigidität.<br />

71


8. Zusammenfassung und Ausblick<br />

Mit Abschluss dieser Diplomarbeit befindet der AMS-02 Detektor seit 22 Monaten auf der<br />

Internationalen Raumstation und konnte dort durchgehend ohne Ausfälle bereits 30 Milliarden<br />

Teilchen messen. Der Betrieb des Detektors ist bis zum Jahr 2020 sichergestellt und<br />

könnte nach einer eventuellen Verlängerung der ISS Mission entsprechend weitergeführt<br />

werden. Derzeitigen Prognosen zu Folge sind die Gasreserven des TRD, bei Fortsetzung<br />

des jetzigen Betriebes, wie er in Kapitel 4 beschrieben ist, für mindestens 30 weitere Jahre<br />

ausreichend, sodass dessen Aktivität nicht eingeschränkt werden müsste.<br />

Eine der interessantesten Messungen durch den AMS-02 Detektor wird auch in Zukunft<br />

die präzise Messung des Positronenanteils in der leptonischen Komponente der kosmischen<br />

Strahlung sein. Hierzu werden Methoden benötigt um Positronen aus der durch Protonen<br />

dominierten kosmischen Strahlung zu Separieren.<br />

Mit den vorhandenen Methoden, basierend auf Likelihoodverhältnissen, zur Trennung leptonischer<br />

und hadronischer Ereignisse mit Hilfe des Übergangsstrahlungsdetektors kann<br />

eine Protonenunterdrückung von 10 3 bei einer Signaleffizienz von 90% erreicht werden.<br />

In dieser Arbeit wurde eine neue Methode in Form eines neuronalen Netzwerkes im Rigiditätsbereich<br />

von 2 − 300 GV entwickelt und getestet. Dazu wurde die NeuroBayes R○<br />

Software genutzt. Wie in Kapitel 7 gezeigt wurde, sind die Separationseigenschaften des<br />

Neuronalen Netwerks mit denen der Likelihoodmethoden vergleichbar. Hierdurch konnten<br />

diese validiert werden. Bei kleinen Rigiditäten bis 5 GV ist eine signifikante Verbesserung<br />

der Separationseigenschaften gegenüber der Likelihoodmethoden erzielt worden, was auf<br />

die Implementierung der relativen Geschwindigkeit zurückzuführen ist. Außerdem ist eine<br />

höhere Reinheit bei Signaleffizienzen unter 75% auf die Signalauswahl für das neuronale<br />

Netzwerk erzielt worden.<br />

In einer in Kürze erscheinenden Veröffentlichung zum Positronenanteil bis 350 GV wird<br />

das Likelihoodverhältnis der TrdK verwendet. Mit weiteren Messdaten wird der Positronenanteil<br />

in Zukunft noch bis in den TeV Bereich fortgesetzt werden können. Zusätzlich<br />

wird der AMS-02 Detektor Untersuchungen zur Anisotropie durchführen. Die Messungen<br />

des Positronenanteils durch den AMS-02 Detektor werden damit einen wichtigen Beitrag<br />

zur Identifikation eines teilchenphysikalischen Kandidaten der Dunklen Materie liefern.<br />

73


Literaturverzeichnis<br />

[1] NASA/WMAP Science Team, Expansion des Universums und Entwicklungsstadien<br />

als Modell. http://commons.wikimedia.org/wiki/File:Expansion_des_<br />

Universums.png% relax.<br />

[2] NASA,. http://www.flickr.com/photos/ams02/5858030178/.<br />

[3] Bluemer, J.; Engel, R.; Hoerandel, J. R. Progress in Particle and Nuclear Physics<br />

2009, 63, 293 – 338.<br />

[4] Grupen, C. Astroparticle Physics, 1st ed.; Springer: Berlin [u.a.], 2005.<br />

[5] Hu, H. Status of the EAS studies of cosmic rays with energy below 10 16 eV, 2009,<br />

arXiv:0911.3034 [astro-ph.HE].<br />

[6] stratocat.com, Data of the stratospheric balloon launched on 5/3/1994. http://<br />

stratocat.com.ar/fichas-e/1994/FSU-19940503.htm.<br />

[7] The Pierre Auger Cosmic Ray Observatory. http://www.auger.org.<br />

[8] Stanev, T. High energy cosmic rays : with 19 tab., 2nd ed.; Springer-Praxis books in<br />

astrophysics and astronomy; Springer: Berlin, 2004.<br />

[9] Engel, R. Vorlesungsfolien: Astroteilchenphysik II - Kosmsiche Strahlung (WS 12/13).<br />

[10] Zwicky, F. Astrophysical Journal 1937, 86, 217.<br />

[11] Galactic Case for Dark Matter. http://www.learner.org/courses/physics/<br />

visual/visual.html?shortname=andromeda.<br />

[12] NASA/WMAP Science Team, The contents of the Universe as measured with WMAP<br />

and computed by NASA/WMAP Science team. http://en.wikipedia.org/wiki/<br />

File:080998_Universe_Content_240.jpg.<br />

[13] DESY, Supersymmetrische Partnerteilchen. http://www.weltderphysik.de/<br />

gebiete/theorie/jenseits-des-standardmodells/supersymmetrie/.<br />

[14] The Astronomist, Dark Matter Confronts Observations. http://theastronomist.<br />

fieldofscience.com/2010/05/dark-matter-confronts-observations.html.<br />

[15] Fermi LAT Collaboration, Phys. Rev. Lett. 2012, 108, 011103.<br />

[16] Blasi, P.; Amato, E. arXiv:1007.4745 2010.<br />

[17] The AMS Collaboration, AMS In A Nutshel. http://www.ams02.org/what-is-ams/<br />

ams-facts-figures/.<br />

[18] The AMS Collaboration, Private Kommunikation.<br />

[19] The AMS Collaboration, The TRD. http://www.ams02.org/what-is-ams/<br />

tecnology/trd/.<br />

75


76 Literaturverzeichnis<br />

[20] The AMS Collaboration, The Time-of-Flight. http://www.ams02.org/<br />

what-is-ams/tecnology/tof/.<br />

[21] CAPELL, M. In AMS on ISS - Construction of a particle physics detector on the<br />

International Space Station; The AMS Collaboration, 2004; Chapter 1.1 Construction<br />

of the AMS-01 magnet.<br />

[22] The AMS Collaboration, The Permanent Magnet. http://www.ams02.org/<br />

what-is-ams/tecnology/magnet/pmmagnet/.<br />

[23] The AMS Collaboration, Tracker Shifter Guide (I), Aug. 2011.<br />

[24] The AMS Collaboration, The Silicon Tracker. http://www.ams02.org/<br />

what-is-ams/tecnology/tracker/.<br />

[25] The AMS Collaboration, The Anti-Coincidence Counter. http://www.ams02.org/<br />

what-is-ams/tecnology/acc/.<br />

[26] Horvath, A. Cherenkov.svg (Creative Commons BY-SA). http://<br />

upload.wikimedia.org/wikipedia/commons/thumb/6/6b/Cherenkov.svg/<br />

378px-Cherenkov.svg.png.<br />

[27] The AMS Collaboration, The RICH. http://www.ams02.org/what-is-ams/<br />

tecnology/rich/.<br />

[28] The AMS Collaboration, The ECAL. http://www.ams02.org/what-is-ams/<br />

tecnology/ecal/.<br />

[29] CAPELL, M. In AMS on ISS - Construction of a particle physics detector on the<br />

International Space Station; The AMS Collaboration, 2004; Chapter 2.7 Electromagnetic<br />

Calorimeter (ECAL).<br />

[30] Paeng, Spiegelladung.svg (Creative Commons BY-SA). http://de.wikipedia.<br />

org/w/index.php?title=Datei:Spiegelladung.svg&page=1&filetimestamp=<br />

20081130200154.<br />

[31] Jackson, J. D. Klassische Elektrodynamik, 4th ed.; de Gruyter: Berlin [u.a.], 2006.<br />

[32] CAPEL, M. In AMS on ISS - Construction of a particle physics detector on the<br />

International Space Station; The AMS Collaboration, 2004; Chapter 2.2 Transition<br />

Radiation Detector (TRD).<br />

[33] Hattenbach, J. Gasverstaerkungsmessungen mit Proportionalkammern des AMS02-<br />

Uebergangsstrahlungsdetektors, 2004.<br />

[34] Grupen, C. Particle detectors, 1st ed.; Cambridge monographs on particle physics,<br />

nuclear physics, and cosmology ; 5; Univ. Press: Cambridge, 1996.<br />

[35] Leo, W. R. Techniques for nuclear and particle physics experiments : a how-to approach;<br />

Springer: Berlin, 1987.<br />

[36] The AMS Collaboration, THE NEW CERN POCC. http://www.ams02.org/2011/<br />

07/the-new-cern-pocc/.<br />

[37] Weng, Z. TRDKLikelihood (AMS TWiki - intern). https://twiki.cern.ch/twiki/<br />

bin/view/AMS/TRDKLikelihood.<br />

[38] Cowan, G. Statistical data analysis; Oxford science publications; Clarendon Press:<br />

Oxford, 1998.<br />

[39] Cowan, G. CERN Summer Student Lectures. Introduction to Statistical Methods for<br />

High Energy Physics, 2011.<br />

76


Literaturverzeichnis 77<br />

[40] Bishop, C. M. Neural networks for pattern recognition, Repr. ed.; Clarendon Pr.:<br />

Oxford, 1998.<br />

[41] The NeuroBayes Users Guide, April 06th, 2012. http://neurobayes.phi-t.de/<br />

index.php/public-information/documentation% relax.<br />

[42] Valerio Vagelli, Private Kommunikation.<br />

[43] TMVA - Toolkit for Multivariate Data Analysis, arXiv:physics/0703039, November<br />

03rd, 2009. http://tmva.sourceforge.net.<br />

[44] TEfficiency - a class to handle efficiency histograms, June 12th, 2012. http://root.<br />

cern.ch/root/html/TEfficiency.html.<br />

77


Abbildungsverzeichnis<br />

1.1. Entwicklung des Universums nach der Urknalltheorie [1]. . . . . . . . . . . . 2<br />

1.2. Foto des AMS-02 Detektor auf der Internationalen Raumstation [2]. . . . . 3<br />

2.1. Relative Häufigkeit der Elemente in der kosmischen Strahlung als Funktion<br />

ihrer Kernladungszahl Z bei einer Energie von 1 GeV pro Nukleon, normiert<br />

auf Si=100 [3]. Gezeigt ist außerdem die Häufigkeit der Elemente im<br />

Sonnensystem (graue Dreiecke). . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

2.2. Teilchenspektrum der kosmischen Strahlung mit der Energie [5]. Die Abbildung<br />

vereint Messergebnisse verschiedener Experimente deren Ergebnisse<br />

durch unterschiedliche Farben und Marker dargestellt werden. . . . . . . . . 7<br />

2.3. Skizze des HEAT Detektors (rechts), ausgerüstet mit Flugzeitmessung (TOF),<br />

Übergangsstrahlungsdetektor (TRD), Driftkammern (DTH) innerhalb eines<br />

Magneten und einem elektromagnetischen Kalorimeter (EC) und ein Foto<br />

des Detektors am Ballon in der Atmosphäre (links) [6]. . . . . . . . . . . . . 8<br />

2.4. Übersicht der Detektorverteilung mit eingezeichneten Sichtlinien der Fluoreszenz-<br />

Teleskope beim Pierre-Auger-Observatorium (links) und Rekonstruktion eines<br />

Ereignisses mit Bodenstationen und Fluoreszenz-Teleskopen (rechts) [7]. 8<br />

2.5. Beschleunigung kosmischer Teilchen an einer Schockfront. . . . . . . . . . . 9<br />

2.6. Rotationsgeschwindigkeit von Sternen einer Galaxie mit deren Orbitalradius<br />

(grün) sowie die Erwartung aus den Keplerschen Gesetzen (orange) [11]. . . 10<br />

2.7. Erwartete Verteilung von Materie und Energie im Universum nach dem<br />

Λ-CDM-Modell [12]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.8. Teilchen der minimalen supersymmetrischen Erweiterung des Standardmodells<br />

der Teilchenphysik [13]. . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />

2.9. Zerfallskette der Annihilation supersymmetrischer Neutralinos in Teilchen<br />

des Standardmodells der Teilchenphysik [14]. . . . . . . . . . . . . . . . . . 13<br />

2.10. Positronenanteil in der leptonischen Komponente der kosmischen Strahlung<br />

mit der Energie bis 100 GeV aus Messungen verschiedener Experimente [15]. 13<br />

3.1. Technische Zeichnung des AMS-02 Detektors mit Beschriftung der Subdetektoren<br />

[18]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />

3.2. Schematische Zeichnung einer TRD Lage aus 20 mm dickem Radiatorvlies<br />

und Proportionaldrahtkammerröhrchen zum Nachweis von Übergangsstrahlung<br />

[19]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.3. Foto der oberen und unteren Lagen des Flugzeitdetektors vor dem Einbau<br />

[20]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.4. Technische Zeichnung eines Szintillatorstreifens mit Beschriftung der Komponenten<br />

[20]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

3.5. Der AMS-02 Permanentmagnet in der Seitenansicht (links) und das von ihm<br />

erzeugte Magnetfeld in der Draufsicht (rechts) [22]. . . . . . . . . . . . . . . 19<br />

3.6. Schematische Darstellung der Spurdetektorplatten (links) und Fotos vor<br />

deren Integration in den Detektor (rechts) [23]. . . . . . . . . . . . . . . . . 19<br />

79


80 Abbildungsverzeichnis<br />

3.7. Schematische Skizze von Aufbau und Funktionsweise eines doppelseitigen<br />

Silizium Streifensensors [24]. . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

3.8. Ein seitlich einfallendes Teilchen, das vom ACC zurückgewiesen wird (links),<br />

ein Teilchen hoher Ladung, das Delta-Elektronen erzeugt (Mitte) sowie ein<br />

Backsplash Event (rechts), welche angenommen werden [25]. . . . . . . . . . 21<br />

3.9. Skizze zur Ausbreitung von Tscherenkow Strahlung [26]. . . . . . . . . . . . 21<br />

3.10. Skizze der Funktionsweise des RICH (links) und Foto der einzelnen Bestandteile<br />

vor dem Zusammenbauen (rechts) [27]. . . . . . . . . . . . . . . . . . . 22<br />

3.11. Anordnung von drei Superlayern in wechselnder x-y Ausrichtung (links) und<br />

Querschnitt eines Superlayers mit als Zelle gruppierten Szintillationsfasern<br />

(rechts) [29]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23<br />

3.12. Skizze des Kaloriemeters mit Abmessungen und Ausbreitung hadronischer<br />

(blau) und elektromagnetischer Schauer (rot). . . . . . . . . . . . . . . . . . 23<br />

3.13. Signaturen von Teilchen bei 300 GeV in den einzelnen Subdetektoren des<br />

AMS-02 Detektors [18]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.14. Ereignismonitor eines Elektrons mit einer Rigidität von −92, 6 GV, aufgenommen<br />

am 04. Oktober 2012. . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

3.15. Ereignismonitor eines Protons mit einer Rigidität von 83, 3 GV, aufgenommen<br />

am 04. Oktober 2012. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

4.1. Spiegelladung einer positiven Ladung an einer Grenzfläche [30]. . . . . . . . 28<br />

4.2. Schematische Darstellung der Zusammensetzung des Wandmaterials für eine<br />

Proportionalkammerröhre (links) und Veranschaulichung des Fertigungsprozesses<br />

(rechts) [33]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

4.3. Foto eines Moduls in der Draufsicht (oben) und der Querschnitt mittels<br />

Computertomographie (unten) [32]. . . . . . . . . . . . . . . . . . . . . . . . 29<br />

4.4. (a) Energieabhängigkeit des Massenabsorptionskoeffizienten µ in Blei Z Pb =<br />

82 und (b) Bereiche in denen Photoeffekt, Compton Effekt oder Paarbildung<br />

dominieren in Abhängigkeit der Kernladungszahl Z des Absorbers und der<br />

Photonenenergie [34]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

4.5. Energieabgabe aller Teilchen im Energiebereich um 25 GeV in Lage 6 mit<br />

angepasster Landau-Verteilung im Ionisationsbereich (rot). . . . . . . . . . 31<br />

4.6. Darstellung des Gassystems bestehend aus der Box-S, der Box-C und dem<br />

Gaskreislauf des Hauptdetektors bestehend aus 41 Segmenten [32]. . . . . . 32<br />

4.7. Foto des AMS-02 POCC auf dem Gelände des CERN in Genf [36]. Die<br />

einzelnen Schichtpositionen sind in rot gekennzeichnet. Dabei ist ”Data”<br />

für die Überwachung der Datenübertragung von der ISS zum CERN, über<br />

einzelne Zwischenstationen zuständig. ”LEAD” dient als Schichtleitung und<br />

ist Schnittstelle für die Kommunikation mit der NASA. ”PM” ist für Ecal,<br />

RICH und TOF verantwortlich, ”TEE” überwacht Spurdetektor, ACC und<br />

TRD. ”Thermal” kontrolliert die Temperatursituation im gesamten Detektor,<br />

welche stark mit dem Winkel des Detektors zur Sonne korreliert und<br />

kann gegebenenfalls nach Rücksprache mit der Schichtleitung Heizungen<br />

zu- und abschalten, oder die NASA bitten die Position der Solarpanele oder<br />

Radiatoren der ISS so zu verändern, dass diese entweder Schatten spenden,<br />

oder Zufuhr von Sonnenlicht ermöglichen. Außerdem befindet sich im POCC<br />

noch eine Position für das Offline Computing, die im Bild nicht eingefangen<br />

wurde und wo die Ereignisrekonstruktion überwacht wird. . . . . . . . . . . 33<br />

80


Abbildungsverzeichnis 81<br />

4.8. Bildschirmfoto des Programms zur Ermittlung des Korrekturwertes zur<br />

Hochspannungsanpassung. Aufgetragen ist der wahrscheinlichste Wert der<br />

deponierten Energie über einen Zeitraum (hier zwei Wochen). Der Wert<br />

schwankt um etwa 60 ADC, wobei ein etwa linearer Anstieg mittels Hochspannungsanpassungen<br />

kompensiert wird. In rot ist eine lineare Anpassung<br />

an die Daten zu sehen, die vom Programm ausgegeben wird und den Korrekturwert<br />

bestimmt (hier −3 V). . . . . . . . . . . . . . . . . . . . . . . . . 34<br />

4.9. Auftragung der Verschiebung dx in x-Richtung von Lage 4, 10 und 14 auf<br />

langer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 30 Tage. . . . 35<br />

4.10. Auftragung der Verschiebung des gesamten Detektors dx in x-Richtung auf<br />

kurzer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 2 Stunden. . . 35<br />

4.11. Auf eins normiertes Spektrum der Energieabgabe von Elektronen (blau)<br />

und Protonen (rot) im Energiebereich um 25 GeV in Lage 6. . . . . . . . . 36<br />

4.12. Auf eins normiertes Spektrum des Mittelwertes der Energieabgabe in den 20<br />

Detektorlagen von Elektronen (blau) und Protonen (rot) im Energiebereich<br />

um 25 GeV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />

5.1. Beispiel von Populationen H 0 und H 1 im zweidimensionalen Parameterraum<br />

der Variablen x 1 und x 2 , getrennt durch eine lineare Entscheidungsgrenze<br />

(dunkelrot) [39]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />

5.2. Wahrscheinlichkeitsdichteverteilungen für die Hypothesen H 0 und H 1 einer<br />

eindimensionalen Test-Statistik t(x) mit Einteilung in eine Annahme- und<br />

eine Verwurfsregion, getrennt durch die Entscheidungsgrenze t cut [38]. . . . 39<br />

5.3. Verteilung des Likelihoodverhältnis gegeben durch TrdQt und TrdK von<br />

Protonen und Leptonen aus Flugdaten, selektiert durch das elektromagnetsiche<br />

Kalorimeter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />

5.4. Darstellung von Gleichung 5.11 als Netzwerkdiagramm. . . . . . . . . . . . 41<br />

5.5. Zeichnung der Sigmoid Funktion nach Formel 5.12. . . . . . . . . . . . . . . 42<br />

5.6. Beispiel nicht einfacher, durch eine Hyperebene linear separierbarer, Populationen<br />

H 0 und H 1 im zweidimensionalen Parameterraum der Variablen x 1<br />

und x 2 [39]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

5.7. Multi Layer Perzeptron mit einer versteckten Lage. . . . . . . . . . . . . . . 43<br />

5.8. Separationsgrenzen für zwei Populationen im zweidimensionalen Parameterraum<br />

von x 1 und x 2 mit guter Generalisierungsfähigkeit (links) und nach<br />

Overtraining (mitte). Rechts ist das Verhalten der Fehlerfunktion im Falle<br />

von Overtraining dargestellt [39]. . . . . . . . . . . . . . . . . . . . . . . . . 45<br />

6.1. Schematische Skizze zur Vorgehensweise zum Trainieren eines neuronalen<br />

Netzwerkes mit Flugdaten [42]. . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />

6.2. Effizienz der angewandten Bedingungen bezüglich des vorangegangen Schnittes.<br />

Die Beschreibungen der einzelnen Schnitte sind im Text zu finden. . . . 49<br />

6.3. Verbleibender Anteil des Triggersamples nach jeder der angewandten Bedingungen.<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

6.4. Schematische Darstellung eines Entscheidungsbaumes, der Ereignisse mit<br />

Paramtern x in Signal S und Untergrund B anhand von Einzelentscheidungen,<br />

einteilt (links) [43] und Ausgabe des BDT in der AMS Software<br />

für Leptonen und Protonen, selektiert mit dem TrdQt Likelihoodverhältnis<br />

(rechts). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51<br />

6.5. Verteilung der EoverP Variable, die das Verhältnis von im Kalorimeter<br />

deponierter- zur Gesamtenergie eines Teilchens gibt. . . . . . . . . . . . . . 52<br />

81


82 Abbildungsverzeichnis<br />

6.6. Energieabgabe in Lage 6 über der Rigidität bis 300 GV für Protonen (links)<br />

und Elektronen (rechts). In schwarz ist die durchschnittliche Energieabgabe<br />

gezeigt (zut Interpretation sollte die logarithmisch gezeichnete y-Achse<br />

beachtet werden. Die Energieabgabe über 10 2 ADC stellt also einen signifikanten<br />

Anteil des Mittelwertes dar). . . . . . . . . . . . . . . . . . . . . . . 53<br />

6.7. Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration<br />

der Eingangsvariablen gegen die Signaleffizienz. . . . . . . . . . . . . . 54<br />

6.8. Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration<br />

der Eingangsvariablen mit der Rigidität des Teilchens. . . . . . . . . . 54<br />

6.9. Relativistische Geschwindigkeit über der Rigidität bis 300 GV für Protonen<br />

(links) und Elektronen (rechts). In schwarz ist die der Verlauf des Durchschnitts<br />

gezeigt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

6.10. Protonenunterdrückung neuronaler Netze, trainiert in unterschiedlichen Energiebereichen.<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

6.11. Durchschnittliche Energieabgabe von Protonen (rot) und Leptonen (dunkelblau)<br />

in den 20 Lagen des Übergangsstrahlungsdetektors mit angedeutetem<br />

Schnitt auf das Protonensample für die Trainingsauswahl. . . . . . . . . . . 56<br />

6.12. Verteilung der Ausgabewerte des neuronalen Netzwerkes für das Trainingsund<br />

das Testsample aufgeteilt nach Signal und Untergrundereignissen (oben).<br />

Darunter sind die Residuen der Verteilungen dargestellt. . . . . . . . . . . . 58<br />

6.13. Verteilung der Ausgabewerte von Protonen (links) und Elektronen (rechts)<br />

nach einer Trainingsiteration mit Gewichtsfunktion (grün). . . . . . . . . . 59<br />

6.14. Vergleich des verstärkten neuronalen Netzwerkes mit dem unverstärkten im<br />

Bereich von 2 − 5 GV (links) und 5 − 300 GV (rechts). . . . . . . . . . . . . 59<br />

6.15. Verteilung der Ausgabewerte des neuronalen Netzwerks und deren Interpretation.<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60<br />

7.1. Protonenunterdrückung mit der Signaleffizienz des neuronalen Netzwerks<br />

(dunkelblau), sowie des TrdQt- (rot) und des TrdK-Likelihoodverhältnisses<br />

(blau). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />

7.2. Protonenunterdrückung mit Rigidität im Bereich 5−300 GV für das neuronale<br />

Netzwerks (schwarz), sowie für das TrdQt- (rot) und TrdK-Likelihoodverhältnis<br />

(blau). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />

7.3. Übereinstimmung der Auswahl von Elektronen bei 90% Signaleffizienz durch<br />

die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />

Netzwerk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65<br />

7.4. Verteilung des BDT Ausgabewertes der Protonenschablone (links) und der<br />

Elektronenschablone (rechts), selektiert mit dem Übergangsstrahlungsdetektor.<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />

7.5. Verteilung des BDT Ausgabewertes einer Auswahl von Positronen mit dem<br />

neuronalen Netzwerk bei einer Elektronen Effizienz von 90% im Rigiditätsbereich<br />

7, 96 − 10, 05 GV (links) und Anpassung der Schablonen an dies<br />

Positronenauswahl (rechts). . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />

7.6. Schematische Darstellung der Verteilung des Entscheidungsbaumes in der<br />

Region der minimal ionisierenden Teilchen in der Longitudinalen und Lateralen<br />

Schauerausbreitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />

7.7. Reinheit der Positronenauswahl mit der Effizienz auf die Positronenselektion. 68<br />

7.8. Entscheidungsgrenzen am Arbeitspunkt mit der Rigidität (links) und Signaleffizienz<br />

bei diesen Entscheidungsgrenzen mit der Rigidität (rechts). . . 68<br />

7.9. Reinheit der Positronenauswahl mit der Rigidität. . . . . . . . . . . . . . . 69<br />

82


Abbildungsverzeichnis 83<br />

7.10. Übereinstimmung der Auswahl von Elektronen am Arbeitspunkt durch die<br />

Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />

Netzwerk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

7.11. Übereinstimmung der Auswahl von Positronen am Arbeitspunkt durch die<br />

Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen<br />

Netzwerk gewichtet mit der Reinheit. . . . . . . . . . . . . . . . . . . . . . . 70<br />

7.12. Positronenauswahl der Separationsmethoden mit der Rigidität. . . . . . . . 71<br />

83


Anhang<br />

A. Ausschnitt der Analysedatei für das neuronale Netzwerk<br />

im Rigiditätsbereich 2 − 5 GV<br />

Es sind jeweils die drei Variablen dargestellt, die zur Separation im neuronalen Netzwerk<br />

den größten und den geringsten Beitrag liefern. Außerdem ist die Korrelationsmatrix<br />

zwischen den Eingangsvariablen und dem Zielwert dargestellt. Die Nummerierung der Variablen<br />

bedeutet:<br />

1: Zielwert<br />

2-21: Energieabgabe in Lage 1-20 in aufsteigender Reihenfolge, beginnend mit der Untersten<br />

Lage.<br />

22: Teildruck des Xenongases<br />

23: Relativistische Geschwindigkeit<br />

24: Einfallswinkel zur z-Achse im Übergangsstrahlungsdetektor<br />

85


A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 23 : BetaH<br />

1st most important<br />

added signi. 855.24<br />

signi. loss 260.94<br />

PrePro: 14<br />

only this 855.24<br />

corr. to others 38.10%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

35000<br />

30000<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

1.399437<br />

1.100351<br />

1.078029<br />

1.065192<br />

1.056015<br />

1.048733<br />

1.04268<br />

1.037391<br />

1.032703<br />

1.02845<br />

1.024516<br />

1.020873<br />

1.017451<br />

1.014212<br />

1.011099<br />

1.008133<br />

1.005258<br />

1.002483<br />

0.9997801<br />

0.9971423<br />

0.9945523<br />

0.9919873<br />

0.9894633<br />

0.9869387<br />

0.9844563<br />

0.9819705<br />

0.9794869<br />

0.9769875<br />

0.9744718<br />

0.9719208<br />

0.9693583<br />

0.9667521<br />

0.9640802<br />

0.9613398<br />

0.9585309<br />

0.9556495<br />

0.9526754<br />

0.9495729<br />

0.9463084<br />

0.9428559<br />

0.9392083<br />

0.935312<br />

0.9310813<br />

0.9264022<br />

0.921209<br />

0.9152441<br />

0.9081725<br />

0.8993907<br />

0.8872931<br />

0.8662445<br />

0.6000374<br />

1<br />

spline fit<br />

purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

10 20 30 40 50 60 70 80 90 100<br />

bin #<br />

events<br />

120<br />

100<br />

80<br />

60<br />

40<br />

3<br />

× 10<br />

background<br />

Underflow 0<br />

Overflow 0<br />

signal<br />

Underflow 0<br />

Overflow 0<br />

final<br />

20<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

86


A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 2 : trdCorrPLCalibAmp_01<br />

2nd most important<br />

added signi. 563.36<br />

signi. loss 192.35<br />

PrePro: 34<br />

only this 698.85<br />

corr. to others 31.90%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

433859<br />

+ δ<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

5187.892<br />

1369.59<br />

1107.222<br />

951.8484<br />

840.4878<br />

753.5143<br />

681.5417<br />

620.3561<br />

567.4154<br />

520.2942<br />

478.3508<br />

440.5281<br />

405.674<br />

372.9406<br />

341.6276<br />

311.5186<br />

281.8334<br />

254.0245<br />

228.958<br />

207.7957<br />

190.2112<br />

175.4075<br />

162.7582<br />

151.6648<br />

141.8791<br />

133.1637<br />

125.1968<br />

117.9706<br />

111.3237<br />

105.1213<br />

99.31538<br />

93.79573<br />

88.63403<br />

83.70804<br />

78.97566<br />

74.42928<br />

70.05956<br />

65.87531<br />

61.7957<br />

57.86063<br />

54.03711<br />

50.28083<br />

46.58661<br />

42.90292<br />

39.21753<br />

35.436<br />

31.50442<br />

27.23672<br />

22.45378<br />

16.64294<br />

5.467211<br />

purity<br />

1.1<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0 20 40 60 80 100<br />

bin #<br />

spline fit<br />

events<br />

250<br />

200<br />

150<br />

100<br />

3<br />

× 10<br />

background<br />

Underflow 0<br />

Overflow 0<br />

signal<br />

Underflow 0<br />

Overflow 0<br />

final<br />

50<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

87


A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 6 : trdCorrPLCalibAmp_05<br />

3rd most important<br />

added signi. 502.87<br />

signi. loss 188.62<br />

PrePro: 34<br />

only this 696.97<br />

corr. to others 32.00%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

481483<br />

+ δ<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

5056.227<br />

1357.681<br />

1100.936<br />

949.5911<br />

840.5353<br />

754.5347<br />

683.9365<br />

623.5177<br />

570.6536<br />

523.9442<br />

482.403<br />

444.761<br />

410.1113<br />

377.554<br />

346.3172<br />

315.8091<br />

286.0721<br />

257.5736<br />

232.4112<br />

210.7303<br />

192.6581<br />

177.4841<br />

164.5917<br />

153.379<br />

143.4881<br />

134.6227<br />

126.5669<br />

119.2384<br />

112.4591<br />

106.2098<br />

100.3631<br />

94.83015<br />

89.54459<br />

84.51933<br />

79.76627<br />

75.23732<br />

70.81435<br />

66.58655<br />

62.49566<br />

58.517<br />

54.67928<br />

50.93496<br />

47.24749<br />

43.57888<br />

39.82298<br />

35.9854<br />

31.96201<br />

27.63112<br />

22.73946<br />

16.73352<br />

4.349168<br />

purity<br />

1.1<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0 20 40 60 80 100<br />

bin #<br />

spline fit<br />

events<br />

300<br />

250<br />

200<br />

150<br />

100<br />

3<br />

× 10<br />

background<br />

Underflow 0<br />

Overflow 0<br />

signal<br />

Underflow 0<br />

Overflow 0<br />

final<br />

50<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

88


A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 21 : trdCorrPLCalibAmp_20<br />

21st most important<br />

added signi. 135.84<br />

signi. loss 136.01<br />

PrePro: 34<br />

only this 555.83<br />

corr. to others 26.20%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

24000<br />

22000<br />

20000<br />

18000<br />

16000<br />

14000<br />

12000<br />

10000<br />

8000<br />

6000<br />

4000<br />

2000<br />

0<br />

868342<br />

+ δ<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

6041.599<br />

1110.968<br />

865.7998<br />

732.9839<br />

643.5043<br />

575.6859<br />

521.3511<br />

476.4004<br />

438.2697<br />

404.3527<br />

373.5493<br />

344.5736<br />

317.0714<br />

290.3966<br />

264.9343<br />

241.6966<br />

221.2569<br />

203.5454<br />

188.453<br />

175.5161<br />

164.1541<br />

154.1823<br />

145.2344<br />

137.1628<br />

129.7391<br />

122.9339<br />

116.6403<br />

110.6698<br />

105.0707<br />

99.77618<br />

94.72484<br />

89.92406<br />

85.32338<br />

80.89519<br />

76.62537<br />

72.5141<br />

68.51025<br />

64.6149<br />

60.80059<br />

57.07046<br />

53.44294<br />

49.83293<br />

46.24947<br />

42.66248<br />

39.02958<br />

35.25742<br />

31.31008<br />

26.96108<br />

22.02558<br />

15.94596<br />

4.718814<br />

purity<br />

1.1<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0 20 40 60 80 100<br />

bin #<br />

spline fit<br />

500<br />

400<br />

3<br />

× 10<br />

background<br />

Underflow 0<br />

Overflow 0<br />

signal<br />

Underflow 0<br />

Overflow 0<br />

final<br />

events<br />

300<br />

200<br />

100<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

89


A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 24 : TrdTheta<br />

22nd most important<br />

added signi. 53.53<br />

signi. loss 53.53<br />

PrePro: 14<br />

only this 74.66<br />

corr. to others 1.90%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

22000<br />

20000<br />

18000<br />

16000<br />

14000<br />

12000<br />

10000<br />

8000<br />

6000<br />

4000<br />

2000<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

0.4617698<br />

0.3705839<br />

0.3518855<br />

0.3382589<br />

0.3270903<br />

0.3172321<br />

0.3083608<br />

0.3001441<br />

0.2923863<br />

0.2850505<br />

0.2780822<br />

0.2713964<br />

0.2649222<br />

0.258674<br />

0.2525556<br />

0.2465838<br />

0.2407531<br />

0.2350209<br />

0.2293701<br />

0.2237482<br />

0.2182046<br />

0.2127205<br />

0.2073456<br />

0.202138<br />

0.196957<br />

0.1918237<br />

0.186721<br />

0.181664<br />

0.1765808<br />

0.1715089<br />

0.1664513<br />

0.1613503<br />

0.1562231<br />

0.1510617<br />

0.1458857<br />

0.1406432<br />

0.1352804<br />

0.1298138<br />

0.1242574<br />

0.1185254<br />

0.1126188<br />

0.1064881<br />

0.1001931<br />

0.0936<br />

0.0865<br />

0.079<br />

0.0707<br />

0.0614<br />

0.0505<br />

0.0363<br />

0.000133<br />

purity<br />

0.75<br />

0.7<br />

0.65<br />

0.6<br />

0.55<br />

0.5<br />

0.45<br />

0.4<br />

10 20 30 40 50 60 70 80 90 100<br />

bin #<br />

spline fit<br />

events<br />

10<br />

180<br />

160<br />

140<br />

120<br />

100<br />

80<br />

60<br />

40<br />

× 3<br />

background<br />

Underflow<br />

1.623e+04<br />

Overflow 0<br />

signal<br />

Underflow 1.817e+04<br />

Overflow 0<br />

20<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

final<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

90


A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 22 : XePressure<br />

23rd most important<br />

added signi. 8.25<br />

signi. loss 8.25<br />

PrePro: 14<br />

only this 74.89<br />

corr. to others 4.20%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

25000<br />

20000<br />

events<br />

15000<br />

10000<br />

5000<br />

flat<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

957.5226<br />

927.3995<br />

908.1777<br />

881.1694<br />

870.1697<br />

860.6412<br />

853.0984<br />

848.3617<br />

843.8889<br />

840.176<br />

836.9884<br />

833.843<br />

829.9792<br />

826.9833<br />

823.6919<br />

820.6704<br />

817.0032<br />

814.1653<br />

811.0883<br />

808.6268<br />

805.8223<br />

802.9522<br />

800.0515<br />

797.2932<br />

794.8823<br />

792.7988<br />

790.7637<br />

788.5785<br />

786.1142<br />

783.6104<br />

780.2161<br />

776.8483<br />

772.6436<br />

769.4099<br />

766.3697<br />

763.0281<br />

759.647<br />

756.3378<br />

752.5549<br />

748.6431<br />

744.7544<br />

738.3484<br />

733.9265<br />

728.7922<br />

725.6871<br />

721.8424<br />

716.218<br />

711.0453<br />

705.0251<br />

693.4141<br />

673.8303<br />

purity<br />

0.8<br />

0.75<br />

0.7<br />

0.65<br />

0.6<br />

0.55<br />

0.5<br />

0.45<br />

0.4<br />

10 20 30 40 50 60 70 80 90 100<br />

bin #<br />

spline fit<br />

events<br />

250<br />

200<br />

150<br />

100<br />

3<br />

× 10<br />

background<br />

Underflow 0<br />

Overflow 0<br />

signal<br />

Underflow 0<br />

Overflow 0<br />

final<br />

50<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

91


A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

correlation matrix of input variables<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

13<br />

14<br />

15<br />

16<br />

17<br />

18<br />

19<br />

20<br />

21<br />

22<br />

23<br />

24<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

13<br />

14<br />

15<br />

16<br />

17<br />

18<br />

19<br />

20<br />

21<br />

22<br />

23<br />

24<br />

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />

92


B. Ausschnitt der Analysedatei für das neuronale Netzwerk im Rigiditätsbereich 5 − 300<br />

GV 93<br />

B. Ausschnitt der Analysedatei für das neuronale Netzwerk<br />

im Rigiditätsbereich 5 − 300 GV<br />

Es sind jeweils die drei Variablen dargestellt, die zur Separation im neuronalen Netzwerk<br />

den größten und den geringsten Beitrag liefern. Außerdem ist die Korrelationsmatrix<br />

zwischen den Eingangsvariablen und dem Zielwert dargestellt. Die Nummerierung der Variablen<br />

bedeutet:<br />

1: Zielwert<br />

2-21: Energieabgabe in Lage 1-20 in aufsteigender Reihenfolge, beginnend mit der Untersten<br />

Lage.<br />

22: Rigidität<br />

23: Teildruck des Xenongases<br />

24: Einfallswinkel zur z-Achse im Übergangsstrahlungsdetektor<br />

93


B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 3 : trdCorrPLCalibAmp_02<br />

1st most important<br />

added signi. 711.54<br />

signi. loss 206.57<br />

PrePro: 34<br />

only this 711.54<br />

corr. to others 30.70%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

30000<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

0<br />

348809<br />

+ δ<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

4914.171<br />

1039.354<br />

768.8289<br />

615.7069<br />

510.048<br />

432.72<br />

372.9626<br />

323.4832<br />

281.9772<br />

247.8554<br />

221.2952<br />

200.6322<br />

184.2086<br />

170.7083<br />

159.3502<br />

149.6192<br />

141.0025<br />

133.4103<br />

126.5006<br />

120.2507<br />

114.5081<br />

109.1841<br />

104.2368<br />

99.5844<br />

95.19666<br />

91.05158<br />

87.08572<br />

83.30116<br />

79.68558<br />

76.23055<br />

72.90968<br />

69.6701<br />

66.57407<br />

63.55056<br />

60.63733<br />

57.79167<br />

55.03362<br />

52.34347<br />

49.67154<br />

47.04086<br />

44.4186<br />

41.78348<br />

39.10942<br />

36.37815<br />

33.57457<br />

30.62705<br />

27.48236<br />

24.04369<br />

20.0779<br />

15.26057<br />

5.517467<br />

purity<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

0 20 40 60 80 100<br />

bin #<br />

spline fit<br />

events<br />

450<br />

400<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

3<br />

× 10<br />

background<br />

Underflow 0<br />

Overflow<br />

3.32e+04<br />

signal<br />

Underflow 0<br />

Overflow<br />

5.328e+04<br />

50<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

final<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

94


B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 7 : trdCorrPLCalibAmp_06<br />

2nd most important<br />

added signi. 621.71<br />

signi. loss 204.95<br />

PrePro: 34<br />

only this 709.51<br />

corr. to others 30.70%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

30000<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

353046<br />

+ δ<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

5184.061<br />

1034.124<br />

767.7705<br />

616.8388<br />

512.5553<br />

435.3591<br />

375.2073<br />

325.7245<br />

283.7613<br />

249.8716<br />

223.1833<br />

202.3612<br />

185.8178<br />

172.3129<br />

160.84<br />

151.0179<br />

142.3509<br />

134.6774<br />

127.7773<br />

121.449<br />

115.6295<br />

110.2467<br />

105.2585<br />

100.5728<br />

96.14638<br />

91.94565<br />

87.96183<br />

84.14177<br />

80.50351<br />

77.00533<br />

73.6557<br />

70.40901<br />

67.27305<br />

64.23938<br />

61.27406<br />

58.42184<br />

55.61806<br />

52.90528<br />

50.20462<br />

47.53442<br />

44.90078<br />

42.25595<br />

39.5536<br />

36.81123<br />

33.97744<br />

30.97629<br />

27.76586<br />

24.23906<br />

20.2081<br />

15.2593<br />

5.188988<br />

purity<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

0 20 40 60 80 100<br />

bin #<br />

spline fit<br />

events<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

3<br />

× 10<br />

background<br />

Underflow 0<br />

Overflow<br />

3.332e+04<br />

signal<br />

Underflow 0<br />

Overflow<br />

5.299e+04<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

final<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

95


B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 6 : trdCorrPLCalibAmp_05<br />

3rd most important<br />

added signi. 552.53<br />

signi. loss 205.50<br />

PrePro: 34<br />

only this 710.04<br />

corr. to others 30.70%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

30000<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

337762<br />

+ δ<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

4819.777<br />

1035.006<br />

769.8124<br />

618.1377<br />

513.5813<br />

436.2079<br />

375.774<br />

325.9545<br />

284.0431<br />

249.7908<br />

223.0231<br />

202.3457<br />

185.729<br />

172.097<br />

160.6341<br />

150.7854<br />

142.0866<br />

134.4162<br />

127.4888<br />

121.2172<br />

115.458<br />

110.0854<br />

105.1045<br />

100.4109<br />

96.00632<br />

91.82274<br />

87.84129<br />

84.02768<br />

80.39516<br />

76.89474<br />

73.52493<br />

70.28131<br />

67.13827<br />

64.08839<br />

61.14251<br />

58.2922<br />

55.49753<br />

52.76738<br />

50.09917<br />

47.44595<br />

44.82158<br />

42.19268<br />

39.50712<br />

36.7534<br />

33.9009<br />

30.90087<br />

27.72095<br />

24.1898<br />

20.19525<br />

15.2736<br />

5.899064<br />

purity<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

0 20 40 60 80 100<br />

bin #<br />

spline fit<br />

events<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

3<br />

× 10<br />

background<br />

Underflow 0<br />

Overflow<br />

3.156e+04<br />

signal<br />

Underflow 0<br />

Overflow<br />

5.016e+04<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

final<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

96


B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 22 : Rabs<br />

21st most important<br />

added signi. 126.74<br />

signi. loss 126.77<br />

PrePro: 14<br />

only this 523.23<br />

corr. to others 23.80%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

35000<br />

30000<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

299.9975<br />

91.78024<br />

62.51433<br />

49.27654<br />

41.41805<br />

36.13225<br />

32.28812<br />

29.29262<br />

26.88197<br />

24.87893<br />

23.15389<br />

21.63084<br />

20.28647<br />

19.0916<br />

18.0127<br />

17.0347<br />

16.13735<br />

15.32545<br />

14.58312<br />

13.90427<br />

13.28219<br />

12.70855<br />

12.18237<br />

11.6901<br />

11.23266<br />

10.80431<br />

10.40385<br />

10.0287<br />

9.673396<br />

9.338589<br />

9.026165<br />

8.728868<br />

8.446316<br />

8.179838<br />

7.926431<br />

7.684944<br />

7.455448<br />

7.232958<br />

7.021305<br />

6.818047<br />

6.622366<br />

6.434406<br />

6.253811<br />

6.078671<br />

5.909512<br />

5.745498<br />

5.58785<br />

5.434582<br />

5.284349<br />

5.140067<br />

5.000001<br />

0.4<br />

spline fit<br />

purity<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

10 20 30 40 50 60 70 80 90 100<br />

bin #<br />

events<br />

3<br />

× 10<br />

background<br />

200<br />

Underflow 0<br />

Overflow 0<br />

180<br />

signal<br />

160<br />

Underflow 0<br />

Overflow 0<br />

140<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

final<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

97


B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 23 : XePressure<br />

22nd most important<br />

added signi. 23.82<br />

signi. loss 23.82<br />

PrePro: 14<br />

only this 42.37<br />

corr. to others 1.20%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

30000<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

957.5234<br />

925.3198<br />

904.099<br />

876.9962<br />

864.222<br />

857.3082<br />

850.7179<br />

846.3821<br />

842.7605<br />

839.2656<br />

836.2207<br />

833.2805<br />

829.7496<br />

826.4435<br />

823.3109<br />

820.3891<br />

816.8484<br />

814.0654<br />

811.2056<br />

808.8173<br />

805.9642<br />

803.1381<br />

800.3605<br />

797.9133<br />

795.5087<br />

793.2348<br />

791.2104<br />

789.2292<br />

787.0731<br />

784.6501<br />

781.5228<br />

778.5696<br />

774.0419<br />

771.1307<br />

768.0739<br />

765.0428<br />

761.407<br />

757.829<br />

754.4852<br />

750.592<br />

746.7178<br />

741.9993<br />

736.1835<br />

730.6431<br />

726.8955<br />

723.1272<br />

717.9636<br />

712.0719<br />

705.8931<br />

695.4951<br />

673.8303<br />

purity<br />

0.26<br />

0.24<br />

0.22<br />

0.2<br />

0.18<br />

0.16<br />

0.14<br />

0.12<br />

0.1<br />

10 20 30 40 50 60 70 80 90 100<br />

bin #<br />

spline fit<br />

events<br />

3<br />

× 10<br />

background<br />

200<br />

Underflow 0<br />

180<br />

Overflow<br />

signal<br />

2.693e+04<br />

160<br />

Underflow 0<br />

Overflow 6738<br />

140<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

final<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

98


B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

Input node 24 : TrdTheta<br />

23rd most important<br />

added signi. 12.77<br />

signi. loss 12.77<br />

PrePro: 14<br />

only this 34.79<br />

corr. to others 1.60%<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

events<br />

30000<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

flat<br />

0.3354059<br />

0.2687234<br />

0.2543075<br />

0.2440088<br />

0.2357388<br />

0.2286777<br />

0.2223225<br />

0.2165484<br />

0.211204<br />

0.206202<br />

0.2014383<br />

0.1968907<br />

0.192484<br />

0.1882222<br />

0.1841263<br />

0.1801225<br />

0.1761906<br />

0.1723429<br />

0.1685615<br />

0.1648228<br />

0.161126<br />

0.1575091<br />

0.15388<br />

0.1503039<br />

0.1467278<br />

0.1431729<br />

0.1396151<br />

0.136053<br />

0.1325064<br />

0.1289332<br />

0.1253528<br />

0.1217531<br />

0.1180875<br />

0.1144042<br />

0.1106882<br />

0.1069056<br />

0.1030646<br />

0.0991368<br />

0.0951<br />

0.091<br />

0.0867<br />

0.0822<br />

0.0775<br />

0.0725<br />

0.0672<br />

0.0615<br />

0.0552<br />

0.0481<br />

0.0396<br />

0.0284<br />

0.000119<br />

0.22<br />

0.2<br />

spline fit<br />

purity<br />

0.18<br />

0.16<br />

0.14<br />

0.12<br />

10 20 30 40 50 60 70 80 90 100<br />

bin #<br />

events<br />

140<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

3<br />

× 10<br />

background<br />

Underflow 0<br />

Overflow 0<br />

signal<br />

Underflow 0<br />

Overflow 0<br />

0<br />

-3 -2 -1 0 1 2 3<br />

final netinput<br />

final<br />

1<br />

separation<br />

signal purity<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

signal efficiency<br />

99


B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI<br />

correlation matrix of input variables<br />

Phi-T<br />

®<br />

NeuroBayes<br />

Teacher<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

13<br />

14<br />

15<br />

16<br />

17<br />

18<br />

19<br />

20<br />

21<br />

22<br />

23<br />

24<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

13<br />

14<br />

15<br />

16<br />

17<br />

18<br />

19<br />

20<br />

21<br />

22<br />

23<br />

24<br />

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1<br />

100

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!