IEKP-KA/2013-8 - Institut fÃ¼r Experimentelle Kernphysik - KIT

IEKP-KA/2013-8 

Positronen Identifizierung 

mit dem AMS-02 Detektor 

auf der 

Internationalen Raumstation 

Diplomarbeit 

von 

Stefan Zeißler 

An der Fakultät für Physik 

Institut für experimentelle Kernphysik 

(IEKP) 

Erstgutachter: 

Zweitgutachter: 

Prof. Dr. Wim de Boer 

Prof. Dr. Günter Quast 

Bearbeitungszeit: 29. Februar 2012 – 28. Februar 2013 

KIT – Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft 

www.kit.edu

Ich versichere wahrheitsgemäß, die Arbeit selbstständig angefertigt, alle benutzten Hilfsmittel 

vollständig und genau angegeben und alles kenntlich gemacht zu haben, was aus 

Arbeiten anderer unverändert oder mit Abänderungen entnommen wurde. 

Karlsruhe, 28. Februar 2013 

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

(Stefan Zeißler)

Inhaltsverzeichnis 

1. Einleitung 1 

2. Physikalischer Hintergrund 5 

2.1. Kosmische Strahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 

2.2. Quellen Kosmischer Strahlung . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

2.3. Dunkle Materie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 

2.3.1. Kandidaten für Dunkle Materie . . . . . . . . . . . . . . . . . . . . . 11 

2.3.2. Suche nach Dunkler Materie . . . . . . . . . . . . . . . . . . . . . . . 12 

2.4. Der Positronanteil in der leptonischen Komponente der kosmischen Strahlung 12 

3. Der AMS-02 Detektor 15 

3.1. Der Übergangsstrahlungsdetektor (TRD) . . . . . . . . . . . . . . . . . . . 16 

3.2. Der Flugzeitdetektor (TOF) . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 

3.3. Der Permanentmagnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 

3.4. Der Silizium Spurdetektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 

3.5. Der Antikoinzidenz Zähler (ACC) . . . . . . . . . . . . . . . . . . . . . . . . 20 

3.6. Der Ring abbildende Tscherenkow Detektor (RICH) . . . . . . . . . . . . . 21 

3.7. Das elektromagnetische Kalorimeter (ECAL) . . . . . . . . . . . . . . . . . 22 

3.8. Teilchensignaturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 

4. Der Übergangsstrahlungsdetektor 27 

4.1. Entstehung von Übergangsstrahlung . . . . . . . . . . . . . . . . . . . . . . 27 

4.2. Aufbau des Detektors und Messung von Übergangsstrahlung . . . . . . . . 28 

4.3. Gassystem und Betrieb auf der ISS . . . . . . . . . . . . . . . . . . . . . . . 30 

4.4. Kalibrierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 

4.5. Unterscheidung von Protonen und Positronen . . . . . . . . . . . . . . . . . 35 

5. Statistische Methoden 37 

5.1. Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

5.2. Das Likelihoodverhältnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

5.3. Künstliche neuronale Netze . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 

5.3.1. Künstliche Neuronen . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 

5.3.2. Multi-Layer-Perzeptron . . . . . . . . . . . . . . . . . . . . . . . . . 42 

5.3.3. Training des neuronalen Netzes . . . . . . . . . . . . . . . . . . . . . 44 

5.3.4. Die NeuroBayes R○ Software . . . . . . . . . . . . . . . . . . . . . . . 45 

6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor 47 

6.1. Selektion des Trainingssamples . . . . . . . . . . . . . . . . . . . . . . . . . 47 

6.1.1. Preselection und Selection . . . . . . . . . . . . . . . . . . . . . . . . 48 

6.1.2. Elektronen und Protonen Selektion . . . . . . . . . . . . . . . . . . . 50 

6.2. Eingangs-Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 

iii

iv 

Inhaltsverzeichnis 

6.3. Training des neuronalen Netzwerks . . . . . . . . . . . . . . . . . . . . . . . 56 

6.3.1. Test auf Over-Training . . . . . . . . . . . . . . . . . . . . . . . . . . 56 

6.3.2. Training mit Gewichten . . . . . . . . . . . . . . . . . . . . . . . . . 57 

6.3.3. Trainingseinstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . 59 

6.4. Ausgabe des neuronalen Netzwerkes . . . . . . . . . . . . . . . . . . . . . . 60 

7. Vergleich von Methoden zur Protonen/Positronen Trennung 63 

7.1. Reinheit der Separationsmethoden . . . . . . . . . . . . . . . . . . . . . . . 65 

7.2. Vergleich anhand der ermittelten Reinheit . . . . . . . . . . . . . . . . . . . 67 

8. Zusammenfassung und Ausblick 73 

Literaturverzeichnis 75 

Abbildungsverzeichnis 77 

Anhang 85 

A. Ausschnitt der Analysedatei für das neuronale Netzwerk im Rigiditätsbereich 

2 − 5 GV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 

B. Ausschnitt der Analysedatei für das neuronale Netzwerk im Rigiditätsbereich 

5 − 300 GV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 

iv

1. Einleitung 

Die Teilchenphysik kommt mit Teilchenbeschleunigern wie dem Large Hadron Collider 

(LHC) am europäischen Kernforschungszentrum CERN 1 in Genf der Antwort auf die Frage 

nach den Bestandteilen der Materie immer näher. Doch aus astronomischen Messungen 

weiß man, dass nach derzeitigem Kenntnisstand nur ein Bruchteil der im Universum 

gemessenen Materie erklärt werden kann. Etwa 80% der Masse im Universum wird aus 

sogenannter Dunkler Materie gebildet, für die noch kein geeigneter Teilchenphysikalischer 

Kandidat identifiziert werden konnte. 

Um Teilchen der Dunklen Materie zu identifizieren werden aktuell verschiedene Ansätze 

verfolgt: 

• Direkte Messung durch Kernwechselwirkungen. 

• Erzeugung und Nachweis an Beschleunigerexperimenten. 

• Indirekte Messung aus Annihilationsprodukten in der kosmischen Strahlung. 

Das Alpha Magnetic Spectrometer (AMS-02) als neuster und leistungsfähigster Detektor 

zur Vermessung der kosmischen Strahlung widmet sich der indirekten Messung Dunkler 

Materie und ist damit unter Punkt drei einzuordnen. 

Die Beobachtung kosmischer Strahlung begann 1912 mit deren Entdeckung durch Viktor 

Hess (Nobelpreis 1936) und bildet seit dem die grundlegende Methode der Astroteilchenphysik, 

als eine Disziplin die Methoden der Astrophysik und der Teilchenphysik gemeinsam 

nutzt und damit eine Verbindung zwischen dem Kleinsten und dem Größten bildet. 

Bahnbrechende Erfolge der Astroteilchenphysik waren die Entdeckung des Positrons, als 

erstes Teilchen der Antimaterie, durch Anderson 1932 (Nobelpreis 1936) und die Entdeckung 

der kosmischen Mikrowellenhintergrundstrahlung 1965 durch Penzias und Wilson 

(Nobelpreis 1978). Die Beobachtung dieser in der Urknalltheorie vorhergesagten elektromagnetischen 

Strahlung im infraroten Wellenlängenbereich bildete ein starkes Argument 

für das Urknallmodell. Dieses beschreibt die Entwicklung des Kosmos wie sie in Abbildung 

1.1 dargestellt ist. 

Heutzutage werden Teilchen der kosmischen Strahlung mit hochmodernen Detektoren und 

komplizierten Analysemethoden vermessen. Dazu werden unter anderem Detekorfelder, wie 

beim Auger Observatorium in Argentinien, errichtet, die durch kosmische Teilchen ausgelöste 

Teilchenschauer messen und daraus das Primärteilchen rekonstruieren. Die Erdatmosphäre 

fungiert dabei als Kalorimeter. Um kosmische Teilchen direkt vermessen zu 

1 franz.: Conseil Européen pour la Recherche Nucléaire 

1

2 1. Einleitung 

Abbildung 1.1.: Entwicklung des Universums nach der Urknalltheorie [1]. 

können werden aber auch weiterhin Detektoren wie das High Energy Antimatter Telescope 

(HEAT) an Ballons auf etwa 40 km Höhe an den Rand der Erdatmosphäre gebracht. 

Die modernste Art kosmische Strahlung zu vermessen bilden Satelliten gestützte Experimente 

wie der AMS-02 Detektor. Dieser ist ein moderner Teilchendetekor mit hoher 

Akzeptanz im Energiebereich bis zu einigen TeV. Er befindet sich seit Mai 2011 auf der 

Internationalen Raumstation und kann dort in fast vollständiger Abwesenheit von atmosphärischen 

Einflüssen kosmische Strahlung direkt und über einen langen Zeitraum vermessen. 

Er ist ausgestattet mit einem Silizium Spurdetektor im Magnetfeld eines Permanentmagneten, 

einem Flugzeitdetektor, einem Ring abbildenden Tscherenkow Detektor, 

sowie einem Übergangsstrahlungsdetektor und einem elektromagnetischen Kalorimeter. 

Eine ähnliche Konfiguration ohne Übergangsstrahlungsdetektor und Kalorimeter wurde 

in einem 10-tägigen Testflug mit dem Space Shuttle Discovery im Jahr 1998 getestet und 

nach überzeugenden Ergebnissen für einen dauerhaften Einsatz im All bis mindestens 2020 

aufgerüstet. In Abbildung 1.2 ist der AMS-02 Detektor an seiner aktuellen Position auf 

der Internationalen Raumstation zu sehen, wo er in den letzten 22 Monaten bereits 30 Milliarden 

Teilchen messen konnte. Mit seinen Messungen wird der AMS-02 Detektor einen 

großen Beitrag zur Beantwortung der Frage nach Dunkler Materie und darüber hinaus 

liefern. 

So wird beispielsweise der Anteil des Positronenflusses in der leptonischen Komponente 

der kosmischen Strahlung gemessen, der ein Indiz für Annihilation von bisher unentdeckten 

Teilchen der Dunklen Materie sein kann. 2012 beobachtete der Payload for Antimatter 

Matter Exploration and Light-nuclei Astrophysics (PAMELA) Detektor einen unerwarteten 

Anstieg im Positronenanteil, der von AMS-02 genauer untersucht und dessen Messung 

zu höheren Energien hin erweitert werden wird. Da Positronen selten in primären Quellen 

erzeugt werden, sind sie ein sensitives Indiz für Zerfalls- und Stoßprozesse, die im 

Kosmos ablaufen. Auf die Bedeutung des Positronenanteils für die Suche nach Dunkler 

Materie wird in Kapitel 2 näher eingegangen. Um bei einem Verhältnis des dominierenden 

Protonen- zum Positronenfluss von etwa 10 3 weniger als 1% Protonenkontamination in 

der Positronenauswahl zu erreichen wird dabei eine Protonenunterdrückung von 10 6 angestrebt. 

Die zur Trennung dieser beiden Teilchenarten wichtigen Subdetektoren im AMS-02 

2

3 

Abbildung 1.2.: Foto des AMS-02 Detektor auf der Internationalen Raumstation [2]. 

Experiment, das in Kapitel 3 genauer beschrieben ist, sind das elektromagnetische Kalorimeter 

und der Übergangsstrahlungsdetektor, mit dessen Funktionsweise und Betrieb sich 

Kapitel 4 befasst. 

In dieser Arbeit wurde eine Multivariante Analysemethode in Form eines neuronalen Netzwerks 

entwickelt mit der Positronen von Protonen mithilfe des Übergangsstrahlungsdetektos 

zuverlässig unterschieden werden können. Dieses neuronale Netzwerk wurde dabei aus 

einer Trainingsauswahl von Flugdaten der ersten eineinhalb Jahre Datennahme trainiert. 

Dabei wurde die Redundanz der AMS-02 Subdetektoren ausgenutzt. Die Schritte, um aus 

den AMS-02 Flugdaten ein neuronales Netzwerk zur Trennung von Protonen und Positronen 

zu erhalten, sind in Kapitel 6 beschrieben. In Kapitel 7 wird ein Vergleich zwischen 

den verschiedenen zur Verfügung stehenden Methoden zur Trennung von Protonen und 

Positronen mithilfe des Übergangsstrahlungsdetektors durchgeführt. Dabei wird alleine 

mit dem Übergangsstrahlungsdetektor eine Protonenunterdrückung von 10 3 bei einer Selektionseffizienz 

für Positronen von 90% im Rigiditätsbereich von 2 − 300 GV erreicht. 

3

2. Physikalischer Hintergrund 

Primäre Aufgabe des AMS-02 Detektors ist die Vermessung der kosmischen Strahlung. Die 

Beobachtung kosmischer Strahlung begann 1912 mit deren Entdeckung durch Viktor Hess. 

Dieser untersuchte in einer Reihe von Ballonflügen die Entladungsrate von Elektroskopen 

mit der Höhe über der Erdoberfläche. Die Entladung wird dabei durch Stöße mit ionisierenden 

Teilchen der Hintergrundstrahlung verursacht, deren Ursprung man im Erdinneren 

vermutete. Viktor Hess konnte nachweisen, dass die Entladungsrate als Funktion der Höhe 

zunimmt und damit nur eine Quelle ionisierender Teilchen außerhalb der Atmosphäre in 

Frage kommt. Konsistente Ergebnisse durch Messungen bei Nacht und Sonnenfinsternissen 

schlossen die Sonne als potentielle Quelle aus. 

2.1. Kosmische Strahlung 

Der Begriff kosmische Strahlung beschreibt eine Teilchenstrahlung über einen breiten Energiebereich, 

deren Ursprung im Weltall liegt. Die kosmische Strahlung besteht aus verschiedenartigen 

Teilchen, wobei Protonen mit etwa 85% den größten Anteil ausmachen. Außerdem 

kommen Heliumkerne mit einem Anteil von etwa 12% vor. Die restlichen 3% bilden 

Atomkerne höherer Ladungszahl Z ≥ 3 sowie Elektronen und Positronen [4]. Dabei kommen 

alle Kerne schwerer Elemente in der kosmischen Strahlung vor, wie in Abbildung 2.1 

gezeigt ist. Dort ist auch die relative Häufigkeit der Elemente im Sonnensystem gezeigt, 

welche dem Vorkommen in der kosmischen Strahlung bis auf wenige Ausnahmen auffallend 

ähnlich ist. Neben den geladenen Teilchen zählen auch ungeladene Teilchen wie Neutrinos 

und Photonen kosmischen Ursprungs zur kosmischen Strahlung. Die Intensität der 

kosmischen Strahlung fällt mit der Energie nahezu konstant nach einem Potenzgesetz ab. 

Das Spektrum der Hauptbestandteile der kosmischen Strahlung in einem Energiebereich 

von 10 MeV bis 10 12 GeV ist in Abbildung 2.2 dargestellt. Dort ist der Teilchenfluss pro 

Sekunde und Quadratmeter Fläche eines Raumwinkelelements mit der Energie doppelt logarithmisch 

aufgetragen. Dabei wurde der Teilchenfluss noch mit der Energie zum Quadrat 

multipliziert und damit abgeflacht. Dies bedeutet, dass die Wahrscheinlichkeit kosmische 

Teilchen einer bestimmten Energie zu messen mit der Energie rapide abfällt. Abbildung 

2.2 ist außerdem zu entnehmen, dass das Verhältnis von Elektronen zu Protonenfluss die 

Größenordung 10 −2 annimmt und damit auf 100 Protonen etwa ein Elektron vorkommt. 

Noch seltener sind Positronen, die noch um einen Faktor 10 weniger vorkommen als Elektronen. 

Für die Untersuchung der kosmischen Strahlung gibt es zwei Ansätze. Zum einen kann sie 

5

6 2. Physikalischer Hintergrund 

Abbildung 2.1.: Relative Häufigkeit der Elemente in der kosmischen Strahlung als Funktion 

ihrer Kernladungszahl Z bei einer Energie von 1 GeV pro Nukleon, 

normiert auf Si=100 [3]. Gezeigt ist außerdem die Häufigkeit der Elemente 

im Sonnensystem (graue Dreiecke). 

direkt mit Satelliten oder Ballonexperimenten im oberen Bereich der Erdatmosphäre gemessen 

werden. Dabei können Satellitenexperimente durch ihre relativ hohen Kosten bei 

starker Gewichtsbeschränkung und damit relativ kleinen Abmessungen nur für niedrige 

Energien bis einige TeV verwendet werden. Sie bieten durch die Abwesenheit von atmosphärischen 

Einflüssen allerdings eine optimale Messumgebung. In diesem Bereich misst 

auch der AMS-02 Detektor. Wirtschaftlicher sind Ballonexperimente, bei denen ein Teilchendetektor 

zum Nachweis geladener Teilchen an einem Ballon auf bis zu 40 km Höhe 

an den Rand der Atmosphäre gebracht wird. Allerdings sind Ballonflüge nur über relativ 

kurze Zeiträume machbar, was die Menge gemessener Teilchen beschränkt. Außerdem 

wird die Messung durch Sekundärteilchen aus Wechselwirkungen in der über dem Detektor 

liegenden Atmosphäre verfälscht. Ballonexperimente wie das High Energy Antimatter Telescope 

(HEAT), das am 3. Mai 1994 seinen ersten Flug über 29 Stunden auf 36, 5 − 33 km 

Höhe absolvierte, bieten eine gute Möglichkeit kosmische Teilchen bis zu Energien im PeV 

Bereich zu Messen. HEAT war dabei mit einem Flugzeitdetektor, einem Übergangsstrahlungsdetekor, 

einem Spurdetektor aus Driftkammern innerhalb eines Magneten und einem 

elektromagnetischen Kalorimeter ausgerüstet. In Abbildung 2.3 ist eine Skizze des HEAT 

Detektors, sowie ein Foto des Ballons im oberen Teil der Atmosphäre beim Erstflug zu sehen. 

Messungen von Teilchen höherer Energie werden indirekt über Wechselwirkungen der 

Teilchen mit der Materie der Erdatmosphäre durchgeführt. Dabei werden geeignete Detektoren 

über eine große Fläche verteilt aufgestellt. Trifft ein Kern der kosmischen Strahlung 

auf Atome aus der Luft in der Erdatmosphäre, bildet sich ein hadronischer Schauer aus. 

Dieser setzt sich kaskadenartig zur Erdoberfläche fort. Hier können die entstandenen Sekundärteilchen 

nahezu gleichzeitig gemessen werden und aus ihrer Energie und Verteilung, 

sowie deren Zusammensetzung das primäre Teilchen rekonstruiert werden. Gleiches gilt für 

Elektronen und Photonen, wobei sich hier ein elektromagnetischer Schauer ausbildet, der 

vom hadronsichen unterschieden werden kann. Ein Nachteil dieser Methode ist ihre hohe 

Komplexität in der Schauerrekonstruktion. Außerdem kann keine Aussage über das Ladungsvorzeichen 

eines Teilchens gemacht werden, so dass Teilchen von deren Antiteilchen 

nicht unterschieden werden können. Experimente dieser Art sind der ehemalige Karlsruhe 

Shower Core and Array Detector (KASCADE) am Campus Nord des Karlsruhe Institut 

für Technologie, sowie das Pierre-Auger-Observatorium in Argentinien, das mit 1600 

Tscherenkow Detektoren, wie in Abbildung 2.4 rechts gezeigt, eine Fläche von 3000 km 2 

abdeckt. Eine weitere Möglichkeit der indirekten Messung besteht darin den Luftschauer 

6

2.2. Quellen Kosmischer Strahlung 7 

Space 

experiments 

Balloon experiments 

Ground based 

experiments 

AMS-02 

Abbildung 2.2.: Teilchenspektrum der kosmischen Strahlung mit der Energie [5]. Die Abbildung 

vereint Messergebnisse verschiedener Experimente deren Ergebnisse 

durch unterschiedliche Farben und Marker dargestellt werden. 

direkt durch sein isotrop abgestrahltes Fluoreszenzlicht zu beobachten und daraus das Primärteilchen 

zu identifizieren. Dies ist jedoch nur bei geringem Untergrund und damit in 

dunklen Nächten und weit weg von Städten möglich. Solche Fluoreszenz-Teleskope werden 

ebenfalls am Pierre-Auger-Observatorium eingesetzt. Eine Rekonstruktion eines von den 

Fluoreszenz-Teleskopen und Bodenstationen gemeinsam gemessenes Ereignis am Pierre- 

Auger-Observatorium ist in Abbildung 2.4 links zu sehen. 

Die Messung kosmischer Strahlung verrät dabei viel über physikalische Vorgänge im Universum. 

Die Strahlung trägt dabei mit ihrer Energie und Richtung Informationen über 

ihre Quelle zur Erde. 

2.2. Quellen Kosmischer Strahlung 

Die Entstehung von kosmischer Strahlung ist eng mit Prozessen der Sternentwicklung 

verknüpft [8]. In unserer näheren Umgebung ist die Sonne eine Quelle für sehr nieder 

energetische kosmische Strahlung mit hoher Intensität die zeitlich mit der Sonnenaktivität 

variiert. Von der Sonne werden dabei überwiegend Protonen, sowie Elektronen und 

Neutrinos abgegeben. Kerne schwerer Elemente und kosmische Strahlung ab Energien von 

etwa 1 GeV können von der Sonne jedoch nicht erzeugt werden und müssen galaktischen 

Ursprungs sein. Als Quellen kosmischer Strahlung im für den AMS-02 Detektor relevanten 

Energiebereich bis 1 TeV werden Schockfronten von Supernova Überresten vermutet. Eine 

Supernova markiert das Ende der Fusionsaktivität eines massereichen Sterns ab 1, 4 Sonnenmassen. 

Dabei kollabiert der Stern und wird in einer Explosion, bei der große Mengen 

Materie ins All geschleudert werden, vernichtet. In diesem Endstadium ist die Temperatur 

im Innern des Sterns hoch genug um die Fusion von Kernen höherer Kernzahl bis zum 

7


Abbildung 2.3.: Skizze des HEAT Detektors (rechts), ausgerüstet mit Flugzeitmessung 

(TOF), Übergangsstrahlungsdetektor (TRD), Driftkammern (DTH) innerhalb 

eines Magneten und einem elektromagnetischen Kalorimeter (EC) 

und ein Foto des Detektors am Ballon in der Atmosphäre (links) [6]. 

Abbildung 2.4.: Übersicht der Detektorverteilung mit eingezeichneten Sichtlinien der 

Fluoreszenz-Teleskope beim Pierre-Auger-Observatorium (links) und Rekonstruktion 

eines Ereignisses mit Bodenstationen und Fluoreszenz- 

Teleskopen (rechts) [7]. 

8

2.3. Dunkle Materie 9 

Eisen zu ermöglichen. Die entweichende Materie besteht dabei aus Protonen, sowie Atomkernen 

und Elektronen. Sie bildet mit diesen geladenen Teilchen eine Front aus diffusen 

Magnetfeldern. 

Innerhalb der Schockfronten findet für die geladenen Teilchen immer wieder ein Energieübertrag, 

ähnlich eines inelastischen Stoßes an der Schockfront, statt. Dabei wird mit 

jedem Stoß die Energie der Teilchen um den Faktor ρ erhöht, so dass die Energie nach 

einem Stoß E 1 = E 0 (1 + ρ) ist. Nach n Stößen besitzen Teilchen damit die Energie 

E n = E 0 (1 + ρ) n . (2.1) 

Man spricht von Fermi Beschleunigung erster Art [9]. Um die Menge an Teilchen in der 

Schockfront abzuschätzen, wird ihnen eine energieunabhängige Entweichwahrscheinlichkeit 

p esc zugeordnet, mit der sie eine Schockfront verlassen. Die Teilchenzahl nach n Stößen ist 

dann 

N n = N 0 (1 − p esc ) n . (2.2) 

Betrachtet man nun die Entwicklung der Teilchenzahl ln(N n /N 0 ) = n · ln(1 − p esc ) mit 

dem Energiezuwachs ln(E n /E 0 ) = n · ln(ρ) erhält man aus deren Verhältnis die Anzahl 

der Teilchen nach n Zyklen 

N n = N 0 

( En 

E 0 

) p 

, (2.3) 

mit p = ln(1−pesc) 

ln(1+ρ) 

. Damit lässt sich aus 

∫ ∞ 

der Verlauf des Energiespektrums 

E 

dN 

dE dE = N n (2.4) 

dN 

dE ∼ ( E 

E 0 

) −(p+1) 

(2.5) 

abschätzen. Dies ist das in 2.1 angesprochene Potenzgesetz für den Fluss der kosmischen 

Strahlung. Das Prinzip der Beschleunigung kosmischer Teilchen an Schockfronten ist in 

Abbildung 2.5 nochmals verdeutlicht. 

Abbildung 2.5.: Beschleunigung kosmischer Teilchen an einer Schockfront. 

2.3. Dunkle Materie 

Schon zu Begin des 20. Jahrhunderts deuteten astronomische Messungen darauf hin, dass 

die bisher gemessene und wahrgenommene Materie nur einen Bruchteil der Gesamtmaterie 

9


im Universum ausmacht. Erste Hinweise auf diese Diskrepanz wurden in den 1930er Jahren 

von Fritz Zwicky gegeben, der eine zusätzliche nicht sichtbare Materie postulierte, um die 

Stabilität von Galaxienhaufen zu erklären [10]. Anhaltspunkte lassen sich auch aus den 

Rotationskurven von Galaxien ziehen. Nach den Gesetzen der newtonschen Mechanik, 

nehmen diese für einen Körper mit der Masse M in einer Massenverteilung in einem 

Zentrum m, wie man sie anhand der sichtbaren Galaxiescheibe erwarten würde, aus 

mit dem Orbitalradius r nach 

mv 2 

r 

v = 

= G · mM 

r 2 (2.6) 

√ 

GM/r (2.7) 

ab. Beobachtungen zeigen jedoch, dass sich Rotationsgeschwindigkeiten nahezu konstant 

mit dem Orbitalradius verhalten. Der Verlauf der Rotationsgeschwindigkeiten aus Messungen 

an der Dreiecksnebel genannten Galaxie M33, sowie die Erwartung nach der newtonschen 

Mechanik sind in Abbildung 2.6 gezeigt. Um dieses Verhalten zu erklären, benötigt 

Abbildung 2.6.: Rotationsgeschwindigkeit von Sternen einer Galaxie mit deren Orbitalradius 

(grün) sowie die Erwartung aus den Keplerschen Gesetzen (orange) 

[11]. 

man eine Massenverteilung nach ϱ ∼ r −2 und damit eine Verteilung der überwiegenden 

Masse im sogenannten Halo der Galaxie [4]. Auch auf größeren Skalen lassen sich Hinweise 

finden, dass im Universum mehr Materie als die sichtbare, in Form von Gaswolken 

und Sternen, vorhanden ist. Beispielsweise aus dem Gravitationslinseneffekt, der die Folge 

der Ablenkung von Licht an großen Mengen Materie sichtbar macht. All diese Hinweise 

sprechen für ein Vorhandensein sogenannter Dunkler, weil nicht-sichtbarer, Materie im 

Universum. 

Um die tatsächliche Menge an Dunkler Materie abzuschätzen ist man auf kosmologische 

Modelle angewiesen. Die für die Entwicklung des Kosmos bevorzugte Theorie ist das Λ- 

CDM-Modell. Λ steht dabei für eine kosmologische Konstante, die die beschleunigte Expansion 

des Universums erklären soll, und CDM für kalte Dunkle Materie 1 . Dieses Modell 

ist gut durch Beobachtungen der kosmischen Hintergrundstrahlung und der Häufigkeit der 

Elemente im Kosmos belegt. Die Voraussage der Materieverteilung durch das Λ-CDM- 

Modell ist in Abbildung 2.7 dargestellt. Demnach entfällt 23% der Materie im Kosmos 

auf die Dunklen Materie. Baryonische Materie in Form von Atomen macht lediglich 4, 6% 

aus. Ein Großteil von 72% entfällt auf die kosmologische Konstante, die auch als Dunkle 

Energie bezeichnet wird und deren Ursprung noch unklar ist. 

1 engl.: Cold Dark Matter 

10

2.3. Dunkle Materie 11 

Abbildung 2.7.: Erwartete Verteilung von Materie und Energie im Universum nach dem 

Λ-CDM-Modell [12]. 

2.3.1. Kandidaten für Dunkle Materie 

Ein naheliegender Kandidat für nicht selbst leuchtende und damit dunkle Materie in den 

Halos von Galaxien bildet klassische baryonische Materie. Diese könnte in Form von Gasoder 

Staubwolken, die kalt genug sind um kein Licht im infraroten Wellenlängenbereich 

zu emittieren, vorhanden sein. Gas- oder Staubwolken würden jedoch einfallende Strahlung 

absorbieren und sich dadurch erwärmen. Damit würden sie im infraroten Lichtbereich 

sichtbar werden. Ein weiterer Ansatz bilden massereiche baryonische Objekte (MACHOs 2 ), 

deren Massedruck nicht ausreicht um den Fusionsprozess in Gang zu setzen und die damit 

kalt bleiben. Als solche Objekte kommen braune Zwerge, oder bereits ausgebrannte 

Sterne in Form von Neutronensternen oder schwarzen Löchern in Frage. Solche massiven 

Objekte könnten durch den Mikrolinseneffekt sichtbar gemacht werden. Auch wenn in der 

Halo tatsächlich vereinzelt massive Objekte beobachtet werden konnten, reicht ihre Dichte 

nicht aus um das Massendefizit zu erklären. 

Für Dunkle Materie kommt auch nicht baryonische Materie in Frage. Ein Kandidat hierfür 

darf keine elektromagnetische Ladung zu tragen und muss Masse zu besitzen. Außerdem 

muss ein geeigneter Kandidat stabil sein. Schwach Wechselwirkende massereiche Teilchen 

(WIMPs 3 ) als Teilchen der Dunklen Materie könnten Neutrinos sein. Aus der Beobachtung 

der Neutrinooszillation bei solaren Neutrinos folgt, dass Neutrinos Masse besitzen müssen. 

Ihre Dichte im Universum ist vergleichbar mit der Dichte von Photonen der kosmischen 

Hintergrundstrahlung, was in etwa 300 Neutrinos/cm 3 bedeutet. Aus dieser Information 

und der kritischen Dichte von 10 −29 g/cm 3 aus WMAP Messungen, kann eine obere Grenze 

für Neutrinomassen m ν gegeben werden. Diese liegt für die drei Neutrinos und ihrer 

Antiteilchen bei 

20eV/c 2 ≥ ∑ m ν = 2(m νe + m νµ + m ντ ) 

und damit bei maximal 10 eV/c 2 , wenn nur eines der Neutrinotypen Masse trägt [4]. 

Teilchen dieser geringen Masse sind relativistisch und werden als heiße Dunkle Materie 

bezeichnet. Bestünde die benötigte Dunkle Materie ausschließlich aus heißer Dunklen 

Materie, wäre die beobachtete Strukturbildung im Universum jedoch nicht erklärbar. Es 

muss daher auch nicht relativistische kalte Dunkle Materie geben. Geeignete Kandidaten 

finden sich in supersymmetrischen Erweiterungen des Standardmodells der Teilchenphysik. 

Im Standardmodell der Teilchenphysik besteht Materie aus sechs Quarks (Up, Down, 

Charme, Strange, Top, Bottom), drei Generationen von Leptonen mit ihren Neutrinos 

(Elektron, Myon, Tau) und den vier Typen von Austauschbosonen (Photon, Gluon, Z 

und W), sowie dem Higgs Boson. Zusätzlich existieren noch entsprechende Antiteilchen 

2 engl.: MAssive Compact Halo Object 

3 engl.: Weakly Interacting Massive Particle 

11


mit entgegengesetzter Masse und Parität. In supersymmetrischen Erweiterungen des Standardmodells 

erhält jedes Teilchen im Standardmodell einen supersymmetrischen Partner 

mit einer entgegengesetzten neuen Quantenzahl, der R-Parität. Die Teilchen in der minimalen 

supersymmetrischen Erweiterung des Standartmodels der Teilchenphysik sind in 

Abbildung 2.8 dargestellt. Da bisher keine supersymmetrischen Teilchen an Beschleuni- 

Abbildung 2.8.: Teilchen der minimalen supersymmetrischen Erweiterung des Standardmodells 

der Teilchenphysik [13]. 

gern gefunden wurden, geht man davon aus, dass die Supersymmetrie gebrochen ist und 

supersymmetrische Teilchen damit schwerer als ihre Partner sind. Dabei ist aufgrund der 

Paritätserhaltung zumindest das leichteste supersymmetrische Teilchen, das sogenannte 

Neutralino ˜χ 0 , stabil und damit ein geeigneter WIMP Kandidat für Dunkle Materie [4]. 

Experimente zur Suche nach Dunkler Materie konzentrieren sich hauptsächlich auf die 

Suche nach solchen WIMPs. 

2.3.2. Suche nach Dunkler Materie 

Suche nach Dunkler Materie aus der kosmischen Strahlung findet auf zwei verschiedene Arten 

statt. Zum einen können WIMPs durch inelastische Stöße an Atomkernen aufgrund der 

schwachen Wechselwirkung direkt nachgewiesen werden. Energien, die bei einem solchen 

Stoß frei werden, sind sehr klein und man hat mit einem großen Untergrund durch natürliche 

Strahlung zu kämpfen. Um diesen abzuschirmen befinden sich solche Experimente 

meist im Innern von Bergen oder Untertage. Außerdem werden hoch reine Materialien 

benötigt um klare Signale zu erhalten. Ein Experiment dieser Art ist beispielsweise das 

EDELWEISS 4 Experiment im Modane Untergrundlabor. 

Des Weiteren können WIMPs durch Paarzerfall miteinander in Teilchen des Standartmodells 

zerfallen, da hier die R-Parität nicht verletzt ist. Solche Zerfälle sind in Abbildung 2.9 

dargestellt. Anhand der Zerfallsprodukte könnten sich WIMPs indirekt nachweisen lassen. 

Auf der Suche nach einem Ausschlag im Spektrum der möglichen Zerfallsprodukte, der auf 

WIMP Annihilation hindeuten könnte, ist auch das AMS-02 Experiment. 

2.4. Der Positronanteil in der leptonischen Komponente der 

kosmischen Strahlung 

Ein solcher Hinweis auf WIMP Annihilation könnte aus dem Anteil an Positronen in den 

Leptonen der kosmischen Strahlung hervorgehen. Kosmische Positronen stammen hauptsächlich 

aus Wechselwirkungsprozessen von kosmischen Protonen mit interstellarem Gas. 

4 franz.: Expérience pour Détecter Les WImps En SIte Souterrain 

12

2.4. Der Positronanteil in der leptonischen Komponente der kosmischen Strahlung 13 

Abbildung 2.9.: Zerfallskette der Annihilation supersymmetrischer Neutralinos in Teilchen 

des Standardmodells der Teilchenphysik [14]. 

In primären Quellen wie Supernova-Explosionen werden sie aufgrund der Paarvernichtung 

mit Elektronen nur wenig erzeugt. Aus diesem Wissen, kann man eine Erwartung an den 

Anteil an Positronen in den Leptonen der kosmischen Strahlung formulieren. Dieser sollte 

logarithmisch mit der Energie fallen. Satellitenexperimente wie PAMELA oder Fermi 

beobachten jedoch einen Anstieg im Positronenanteil ab einer Energie von 6 GeV, wie er 

in Abbildung 2.10 dargestellt ist. Dieser Anstieg deutet auf eine bisher unbekannte Quelle 

Abbildung 2.10.: Positronenanteil in der leptonischen Komponente der kosmischen Strahlung 

mit der Energie bis 100 GeV aus Messungen verschiedener Experimente 

[15]. 

kosmischer Positronen hin. WIMP Annihilation, wie sie in Abbildung 2.9 dargestellt ist, 

könnte eine solche sekundäre Quelle sein. Als primäre Quelle von Elektron-Positron Paaren 

kommen allerdings auch Pulsare in Frage [16]. Pulsare sind rotierende Neutronensterne 

als Überreste von Supernova-Explosionen. Die Rotation führt zu einem induzierten elektrischen 

Feld, durch dass dem Pulsar Elektronen an dessen Oberfläche entzogen werden. 

13


Diese folgen dem starken Magnetischen Feld des Neutronensterns und emittieren Photonen 

durch Synchrotronstrahlung. Hochenergetische Photonen können im hohen magnetischen 

Feld durch Paarbildung Elektron-Positron Paare bilden. Dieser Prozess kann beliebig oft 

wiederholt werden, so das eine große Zahl an Elektron-Positron Paaren frei werden. Während 

Positronen als Produkt von WIMP Annihilation isotrop nachweisbar wären, sollte 

bei Pulsaren als Quelle eine Energieabhängige Anisotropie auftreten. 

Der AMS-02 Detektor wird das Positronenspektrum zu höheren Energien fortsetzen und 

mit seiner hohen Akzeptanz eine mögliche Anisotropie untersuchen. Damit wird die Quelle 

des Anstiegs im Positronenverhältnis weiter eingegrenzt werden. 

14

3. Der AMS-02 Detektor 

Der AMS-02 Detektor ist ein seit Mai 2011 auf der Internationalen Raumstation (ISS 1 ) als 

externes Modul montierter Teilchendetektor. Die ISS stellt dem sieben Tonnen schweren 

und 64 Kubikmeter fassenden Detektor eine sichere Energieversorgung von etwa 2500 Watt 

sowie eine hohe Datenübertragung von mindestens 9 Megabits/s zur Erde zur Verfügung. 

Der Detektor ist so konstruiert, dass er während der gesamten Restlaufzeit der ISS Mission 

bis mindestens 2020 arbeiten kann [17]. Das Instrument ist aus sechs voneinander unabhängig 

arbeitenden Subdetektoren aufgebaut, die jeweils unterschiedliche Eigenschaften 

eines einfallenden Teilchens messen. Eine technische Zeichnung des Detektors und seiner 

Komponenten ist in Abbildung 3.1 zu sehen. Demnach durchquert ein von oben in den De- 

Abbildung 3.1.: Technische Zeichnung des AMS-02 Detektors mit Beschriftung der Subdetektoren 

[18]. 

1 engl.: International Space Station 

15

16 3. Der AMS-02 Detektor 

tektor einfallendes Teilchen zunächst den Übergangsstrahlungsdetektor (TRD 2 ) der Energieabgaben 

proportional zum Gammafaktor misst. Anschließend werden die ersten beiden 

Szintillatorlagen zur Flugzeitmessung (TOF 3 ) durchquert, welche zusammen mit zwei weiteren 

Lagen unterhalb des Magneten die Geschwindigkeit des Teilchens messen können. Im 

Kern des Detektors befindet sich ein Silizium Spurdetektor mit sieben Lagen. Dieser wird 

von einem Permanentmagneten umgeben der ein Magnetfeld von 0, 15 Tesla erzeugt. So 

kann über die Krümmung der Teilchenbahn im Magnetfeld das Ladungsvorzeichen sowie 

das Verhältnis aus Teilchenimpuls und Ladung gemessen werden. Um die Auflösung des 

Spurdetektors zu erhöhen, befinden sich zwei weitere Lagen auf der Oberseite des Übergangsstrahlungsdetektors, 

sowie vor dem Kalorimeter. Um Teilchen zurückzuweisen, die 

von der Seite in den Detektor einfallen, ist der Silizium Spurdetektor von einem Antikoinzidenzzähler 

umgeben. Nun folgen noch der Ring abbildende Tschwerenkow Detektor, 

der Masse und Ladung des Teilchens messen kann und das elektromagnetische Kalorimeter 

zur Energiebestimmung. Dank dieses Aufbaus und der großen Erfahrung, die man von 

vorangegangenen teilchenphysikalischen Experimenten in die einzelnen Subdetektoren einfließen 

lassen konnte, misst der AMS-02 Detektor kosmische Teilchen mit einer sehr hohen 

Akzeptanz. 

Aufbau und Funktionsweise der einzelnen Subdetektoren werden im Folgenden näher behandelt, 

wobei eine detaillierte Beschreibung des Übergangsstrahlungsdetektors im nachfolgenden 

Kapitel erfolgt. 

3.1. Der Übergangsstrahlungsdetektor (TRD) 

Der Übergangsstrahlungsdetektor ist ein speziell für hohe Teilchenenergien im GeV Bereich 

ausgelegter Subdetektor auf der Oberseite des AMS-02 Detektors. Bei diesen Energien sind 

Teilchen durch ihre Masse, die im MeV/c 2 Bereich liegt, nur noch schwer zu unterscheiden, 

da die Teilchenenergien durch den kinetischen Anteil dominiert sind. Um solche Teilchen 

dennoch gut identifizieren zu können macht man sich den Effekt der Übergangsstrahlung 

zunutze. Diese kann entstehen, wenn ein hochrelativistisches geladenes Teilchen von einem 

Medium mit einer Permitivität ɛ 1 in ein Medium unterschiedlicher Permitivität ɛ 2 eintritt. 

Die Intensität der in Vorwärtsrichtung emittierten Strahlung im Energiebereich von einigen 

keV ist dabei proportional zum Gamma-Faktor γ = E/mc 2 des Teilchens. Das bedeutet, 

dass beispielsweise ein Elektron mit einer Ruhemasse von 0, 5 MeV/c 2 bei gleicher Energie 

wesentlich mehr Übergangsstrahlung produziert als ein Proton mit einer Ruhemasse von 

940 Mev/c 2 . Die Wahrscheinlichkeit Übergangsstrahlung zu emittieren ist so gering, dass 

man eine Anordnung aus vielen Übergängen von Materialien unterschiedlicher Permitivität 

wählt. Im Übergangsstrahlungsdetektor des AMS-02 Detektors sind daher 20 Lagen 

mit 20 mm dickem Radiatorvlies aus Polypropylen- und Polyethylen-Fasern verbaut, die 

eine hohe Zahl von Vakuum-Radiator Übergängen gewährleisten. Die entstandene Übergangsstrahlung 

wird dann von Proportionaldrahtkammerröhrchen unter jeder Lage Vlies 

detektiert. Eine schematische Skizze einer Lage im Übergangsstrahlungsdetektor ist in Abbildung 

3.2 zu sehen. 

Aufgrund dieser Eigenschaften ist der Übergangsstrahlungsdetektor vor allem für die Trennung 

von Positronen und Protonen sehr gut geeignet. Details zu Aufbau und Funktionsweise 

des Übergangsstrahlungsdetektors werden gesondert in Kapitel 4 behandelt. 

3.2. Der Flugzeitdetektor (TOF) 

Das System zur Flugzeitmessung besteht aus vier Lagen parallel angeordneter 1 cm dicker 

Kunststoff Szintillatorstreifen aus Polyvinyltoluene (PVT). Zwei Lagen sind dabei ober- 

2 engl.: Transition Radiation Detector 

3 engl.: Time Of Flight 

16

3.2. Der Flugzeitdetektor (TOF) 17 

Abbildung 3.2.: Schematische Zeichnung einer TRD Lage aus 20 mm dickem Radiatorvlies 

und Proportionaldrahtkammerröhrchen zum Nachweis von Übergangsstrahlung 

[19]. 

halb und zwei unterhalb der Magnetstruktur angebracht, wobei die Szintillatorstreifen für 

zwei Lagen um 90 Grad zueinander gedreht sind um eine x-y-Ortsauflösung zu erreichen. 

An beiden Enden der Szintillatorstreifen sind Photomultiplier angebracht. In Abbildung 

3.3 ist der Flugzeitdetektor vor seinem Einbau in das AMS-02 Instrument zu sehen. 

Abbildung 3.3.: Foto der oberen und unteren Lagen des Flugzeitdetektors vor dem Einbau 

[20]. 

Passiert ein geladenes Teilchen das szintillierende Material des Detektors werden dessen 

Moleküle angeregt und fallen durch schnelle Emission (τ ∼ 10 −8 s) eines charakteristischen 

Photons in ihren Grundzustand zurück. Das entstehende Licht wird durch Lichtleiter zu 

den Photomultiplieren an den Enden der Szintillatorstreifen geleitet. Ein solcher Szintillatorstreifen 

ist in Abbildung 3.4 zu sehen. Durch die Photomultiplier wird ein Signal zur 

Zeitmessung ausgelöst bzw. gestoppt. Der Flugzeitdetektor arbeitet also wie eine Stoppuhr 

mit einer Genauigkeit von 150 ps und kann damit die Geschwindigkeit von Teilchen mit bis 

zu 98% der Lichtgeschwindigkeit bestimmen [20]. Dadurch kann auch die Durchflugrichtung 

des Teilchens bestimmt werden, die zur Bestimmung des Ladungsvorzeichens durch 

den Spurdetektor benötigt wird. 

Außerdem kann durch die Intensität der charakteristischen Fluoreszensstrahlung die Energieabgabe 

pro Weglänge dE/dx des durchdringenden Teilchens und damit seine Ladung 

bestimmt werden. 

17


Abbildung 3.4.: Technische Zeichnung eines Szintillatorstreifens mit Beschriftung der 

Komponenten [20]. 

3.3. Der Permanentmagnet 

Um kosmische Teilchen von deren Antiteilchen unterscheiden zu können benötigt man eine 

Messung des Ladungsvorzeichens. Dieses wird durch eine Kombination von Permanentmagneten 

und Silizium Spurdetektor, der die Teilchenspur im Magnetfeld aufnehmen kann, 

bewerkstelligt. Ein Teilchen, das sich durch ein Magnetfeld ⃗ B mit der Geschwindigkeit ⃗v 

bewegt wird durch die Lorentzkraft 

F L = q · (⃗v × ⃗ B) (3.1) 

abgelenkt. Die Krümmung der Teilchenbahn kann dann vom Spurdetektor gemessen werden. 

Der Magnet des AMS-02 Instruments besteht dabei aus 6400 Neodym-Eisen-Bor Blöcken, 

die aus 64 Sektoren einen Zylinder von einem Meter Höhe und etwa einem Meter im Durchmesser 

bilden. Der Magnet erzeugt eine nahezu homogenes Magnetfeld mit einer Stärke 

von 0, 15 Tessla in x-Richtung, wobei die z-Richtung in der vertikalen Detektorachse verläuft. 

Die Geometrie des Magneten wurde so gewählt, dass nahezu kein Restmagnetfeld 

außerhalb des Magnetzylinders vorhanden ist, welches die Elektronik, sowie Funktionen 

von Subdetektoren und der ISS beeinträchtigen könnte. Außerdem ist das Dipolmoment 

nahezu null, was für eine stabile Umlaufbahn im Erdmagnetfeld von entscheidender Bedeutung 

ist [21]. In Abbildung 3.5 ist ein Foto des Magneten vor dem Einbau zu sehen 

sowie eine Skizze mit Blick auf die x-y-Ebene, in der das Magnetfeld und die Ausrichtung 

der 64 Segmente dargestellt wird. Der Permanentmagnet wurde bereits beim Flug von 

AMS-01 verwendet. 

3.4. Der Silizium Spurdetektor 

Der Spurdetektor 4 ist der einzige Subdetektor, der die Krümmung eines sich bewegenden 

Teilchens im Magnetfeld und somit das Ladungsvorzeichen zur Unterscheidung von Teilchen 

und Antiteilchen bestimmen kann. Die der Krümmung zugeordnete Messgröße ist 

dabei die Rigidität R, welche als das Produkt aus Magnetfeld B und Krümmungsradius r 

definiert ist. Außerdem ist sie mit 

R = 

p 

(3.2) 

Z · e 

direkt proportional zum Teilchenimpuls p, wobei Z die Ladungszahl des Teilchens und e 

die Elementarladung ist. Ist diese bekannt, lässt sich also der Impuls des Teilchens bestimmen. 

Das Vorzeichen wird dabei so gewählt, dass ein negativ geladenes Teilchen eine 

negative Rigidität besitzt und ein positiv geladenes Teilchen eine positive Rigidität. 

4 engl.: Tracker 

18

3.4. Der Silizium Spurdetektor 19 

Abbildung 3.5.: Der AMS-02 Permanentmagnet in der Seitenansicht (links) und das von 

ihm erzeugte Magnetfeld in der Draufsicht (rechts) [22]. 

Das System zur Spurbestimmung besteht aus neun Lagen, die jeweils aus doppelseitigen 

Siliziumstreifensensoren aufgebaut sind. Dabei bilden die Lagen zwei bis acht innerhalb 

des Magneten den inneren Spurdetektor. Lage eins, oberhalb des Übergangsstrahlungsdetektors 

und Lage neun vor dem Kalorimeter bilden den oberen- und unteren Spurdetektor 

und erweitern den Messbereich für Rigiditäten bis zu 2 TeV. Insgesamt wurden 192 Siliziumstreifen 

verbaut. In Abbildung 3.6 ist der Aufbau des Spurdetektorsystems zu sehen. 

Abbildung 3.6.: Schematische Darstellung der Spurdetektorplatten (links) und Fotos vor 

deren Integration in den Detektor (rechts) [23]. 

Durchdringt ein geladenes Teilchen einen der Siliziumstreifen, produziert es im Halbleitermaterial 

Elektronen-Loch Paare, die innerhalb von 10 ns durch ein anliegendes elektrisches 

Feld von etwa 80 V in entgegengesetzte Richtung abgesaugt und damit an der Rekombination 

gehindert werden. Die Elektronen werden von Leiterstreifen auf der Oberfläche des 

Sensors in direkter Umgebung des Teilchendurchgangs aufgenommen. Diese Elektronenströme 

kann man messen und damit den Ladungsschwerpunkt als Durchstoßpunkt des 

Teilchens mit einer Genauigkeit von 10 µm in der Krümmungsebene und 30 µm in der 

nicht gekrümmten Bahnebene bestimmen. Außerdem ist die Menge erzeugter Elektronen- 

19


Loch Paare und damit die Stärke des Signals proportional zum Quadrat der Ladungszahl 

Z 2 , welche somit bestimmt werden kann [24]. Eine schematische Darstellung eines solchen 

Streifensensors ist in Abbildung 3.7 zu sehen. So erhält man im optimalen Fall neun 

Durchstoßpunkte, mit denen die Teilchenbahn rekonstruiert werden kann. 

Abbildung 3.7.: Schematische Skizze von Aufbau und Funktionsweise eines doppelseitigen 

Silizium Streifensensors [24]. 

Um die gewünschte Auflösung des Spurdetektors zu erreichen und beizubehalten wurde 

ein System zur Kalibrierung, bestehend aus 10 Laserdioden im infraroten Wellenlängenbereich 

integriert. Die Wellenlänge von 1082 nm wurde so gewählt, dass der Strahl zwar 

im Spurdetektor Signale hinterlässt, aber dennoch genug durchdringend ist um den gesamten 

inneren Spurdetektor zu passieren. So wird eine durchgehend gerade Teilchenbahn 

simuliert. Die Position dieser Signale kann auf 10 µm genau bestimmt und die Anordnung 

der Detektorlagen zu jedem gewünschten Zeitpunkt angegeben werden. Eine weitere 

Herausforderung ist die von der Elektronik erzeugte Abwärme abzuleiten, da diese den 

Spurdetektor aufheizen und damit störendes thermisches Rauschen verursachen würde. 

Aufgrund fehlender Atmosphäre muss die Abwärme von einem CO 2 -Kreislauf aufgenommen 

und zu großen Radiatoren an der Außenseite des AMS-02 Detektors geleitet werden. 

Das Temperatur Kontrollsystem des Spurdetektors (TTCS 5 ) ist dabei in der Lage die 

Temperatur des Spurdetektors innerhalb eines Grads konstant zu halten. 

3.5. Der Antikoinzidenz Zähler (ACC) 

Um bei einem isotropen Teilchenfluss durch den Detektor von etwa 10000 Teilchen pro 

Sekunde nur für die Analyse interessante Trigger von in z-Richtung passierenden Teilchen 

abzuspeichern, ist der innere Spurdetektor zylindrisch von 16 Szintillatorbahnen umgeben, 

dem sogenannten Antikoinzidenz Zähler (ACC 6 ). Fällt ein Teilchen seitlich in den Spurdetektor 

ein, so wird in diesen Szintillatorbahnen mit hoher Effizienz Szintillationslicht 

produziert und zu Photomultipliern weitergeleitet. Events, die solche Teilchen enthalten, 

können damit aussortiert werden. Dies ist wichtig, da diese Teilchen Signale im Spurdetektor 

hinterlassen, die dann der Teilchenspur eines von oben nach unten passierenden 

Teilchens zugeordnet werden können und damit die Rigiditätsbestimmung und speziell die 

Messung des Ladungsvorzeichens verfälschen. 

Um nicht zusätzlich hochenergetische Teilchen oder Teilchen hoher Ladung in z-Richtung 

zurückzuweisen, die durch Wechselwirkung mit Spurdetektor, Flugzeitdetektor oder der 

Trägerkonstruktion Delta-Elektronen 7 erzeugen können, wird außerdem das Signal der 

5 engl.: Tracker Thermal Control System 

6 engl.: Anti Coincidence Counter 

7 Sekundärelektronen in einem breiten Energiebereich 

20

3.6. Der Ring abbildende Tscherenkow Detektor (RICH) 21 

Flugzeitdetektoren für den Vetotrigger verwendet. Abbildung 3.8 zeigt verschiedene Triggerkonfigurationen. 

Abbildung 3.8.: Ein seitlich einfallendes Teilchen, das vom ACC zurückgewiesen wird 

(links), ein Teilchen hoher Ladung, das Delta-Elektronen erzeugt (Mitte) 

sowie ein Backsplash Event (rechts), welche angenommen werden [25]. 

3.6. Der Ring abbildende Tscherenkow Detektor (RICH) 

Durchquert ein geladenes Teilchen ein Medium mit relativistischer Geschwindigkeit β, 

welche größer ist als die Phasengeschwindigkeit elektromagnetischer Wellen v = c n 

im 

Medium, wobei c die Vakuumlichtgeschwindigkeit von c = 299792458 m/s und n der 

Brechungsindex des Mediums ist, so werden Atome längs der Flugbahn des Teilchens 

kurzzeitig polarisiert und senden dabei eine charakteristische Strahlung aus. Dies ist die 

sogenannte Tscherenkow 8 Strahlung. Diese Strahlung breitet sich Kegelförmig entlang der 

Flugbahn in Bewegungsrichtung aus, wobei der Öffnugnswinkel θ mit der Geschwindigkeit 

des Teilchens und dem Brechungsindex des Mediums verknüpft ist 

cos(θ) = 1 

n · β . (3.3) 

Eine Skizze zur Ausbreitung der Tscherenkow Strahlung ist in Abbildung 3.9 zu sehen. 

Der Ring abbildende Tscherenkow Detektor (RICH 9 ) macht sich diesen Effekt zunutze. 

Er enthält eine Radiatorschicht aus 2, 7 cm dickem Aerogel im äußeren Bereich mit ei- 

Abbildung 3.9.: Skizze zur Ausbreitung von Tscherenkow Strahlung [26]. 

8 engl.: Cherenkov 

9 engl.: Ring Imaging Cherenkov Detector 

21


nem Brechungsindex zwischen 1, 03 und 1, 05, sowie eine 5 mm dicke und 35cm × 35cm 

große Natriumfluorid-Schicht im Zentrum mit Brechungsindex 1, 335. Das ausgesendete 

Tscherenkow-Licht wird dann von einer Lage aus 680 Multi-Anoden Photomultipliern 

detektiert. In dieser Lage mit einem Durchmesser von etwa 118, 5 cm befindet sich eine 

64cm × 64cm große Aussparung, um Messungen des darunterliegenden Kaloriemeters 

nicht zu beeinflussen. Die zuvor erwähnte Natriumfluorid-Schicht mit sehr hohem Brechungsindex 

und damit großem Winkel des Tschwerenkow-Kegels sorgt hier dafür, dass 

Tscherenkow-Licht von Teilchen, die innerhalb dieser Fläche passieren, trotzdem die Photomultiplier 

erreichen kann. Um die Akzeptanz zu erhöhen, ist der 47 cm hohe Freiraum zwischen 

Radiator- und Detektorschicht am Rand verspiegelt. Das Licht wird also reflektiert 

und der Ring, als Schnittfläche durch den Tscherenkow-Lichtkegel in der Detektorschicht 

kann rekonstruiert werden. Aufbau und Funktion des Ring abbildenden Tscherenkow Detektors 

sind in Abbildung 3.10 zu sehen. Aus dem Durchmesser des aufgenommenen Rings 

Abbildung 3.10.: Skizze der Funktionsweise des RICH (links) und Foto der einzelnen Bestandteile 

vor dem Zusammenbauen (rechts) [27]. 

kann nun also die Geschwindigkeit des Teilchens mit einer Auflösung von 0, 1% für Teilchen 

mit Ladungszahl Z = 1 und 0, 01% für Kerne mit Ladungszahl Z > 1 bestimmt werden. 

Außerdem kann anhand der Intensität des Tscherenkow-Lichtes die Ladungszahl Z mit 

einer Auflösung von 10% bestimmt werden. Aus diesen Größen und der Rigidität R kann 

man nun die Masse des Teilchens nach 

berechnen. 

m = R · Z 

√ 

1 − β 2 

β 

(3.4) 

3.7. Das elektromagnetische Kalorimeter (ECAL) 

Am unteren Ende des AMS-02 Detektors befindet sich das elektromagnetische Kalorimeter 

(ECAL 10 ). Dieses ist ein aus 1 mm dicker Bleifolie im Wechsel mit einer Lage aus Szintillationsfasern 

mit einem Durchmesser von 1 mm und mit Epoxydharz verklebter Block von 

10 engl.: Electromagnetic calorimeter 

22

3.7. Das elektromagnetische Kalorimeter (ECAL) 23 

16, 7 cm Höhe und einer Grundfläche von 64, 8cm × 64, 8cm. Die durchschnittliche Dichte 

beträgt 6, 9 g/cm 3 [28]. Elf Schichten aus Bleifolie und zehn Lagen Szintillationsfasern werden 

dabei zu einem sogenannten Superlayer mit einer Höhe von 18, 5 mm zusammengefasst. 

Insgesamt besteht das elektromagnetische Kalorimeter aus neun solcher Superlayer, wobei 

vier parallel zur x-Richtung und fünf Superlayer parallel zur y-Richtung abwechselnd angeordnet 

sind. Innerhalb eines Superlayers sind 35 Szintillationsfasern zu sogenannten Zellen 

zusammengefasst. Vier solcher Zellen werden von einem Photomultiplier ausgelesen. Insgesamt 

wurden 324 Photomultiplier für 1269 Zellen verbaut. In Abbildung 3.11 ist rechts 

ein Querschnitt durch einen solchen Superlayer und links die Anordnung der Superlayer 

gezeigt. Das Kalorimeter kann nun aufgrund der unterschiedlichen Wechselwirkungen von 

Abbildung 3.11.: Anordnung von drei Superlayern in wechselnder x-y Ausrichtung (links) 

und Querschnitt eines Superlayers mit als Zelle gruppierten Szintillationsfasern 

(rechts) [29]. 

hochenergetischen Teilchen mit dem Bleiabsorber Leptonen, Hadronen und Photonen voneinander 

unterscheiden. Ein durchdringendes Elektron oder Positron löst dabei einen elektromagnetischen 

Schauer, dominiert von Bremsstrahlung und e − /e + -Paarbildung, aus. Ein 

Proton zerfällt durch Kern-Kern Wechselwirkungen hauptsächlich in Pionen und Kaonen 

und löst somit einen hadronischen Schauer aus. Diese hadronsichen Schauer sind durch ihre 

hohe Teilchenzahl wesentlich weiter gestreut und unterscheiden sich in ihrer Energieabgabe 

von eher gerichteten elektromagnetischen Schauern. Diese unterschiedlichen Schauerverhalten 

sind in Abbildung 3.12 dargestellt. Das elektromagnetische Kalorimeter kann eine 

Abbildung 3.12.: Skizze des Kaloriemeters mit Abmessungen und Ausbreitung hadronischer 

(blau) und elektromagnetischer Schauer (rot). 

vollständige 3D Rekonstruktion des Schauers erstellen und somit einen wichtigen Beitrag 

zur Trennung von Positronen und Protonen liefern. Die Höhe des Kalorimeters entspricht 

dabei 17 Strahlungslängen und nur 0, 6 nuklearen Absorbtionslängen. So werden Positronen 

mit sehr hoher Wahrscheinlichkeit einen Schauer auslösen und dieser wird im Idealfall 

vollständig absorbiert. Die meisten Protonen werden hingegen keinen Schauer auslösen und 

nur einen Bruchteil ihrer Energie durch Ionisation im Kalorimeter deponieren. Hochenergetische 

Photonen werden ebenfalls einen elektromagnetischen Schauer auslösen, jedoch in 

den anderen Subdetektoren kein Signal hinterlassen und können somit identifiziert werden. 

Für vollständig absorbierte Schauer kann das Kalorimeter auch die Gesamtenergie des einfallenden 

Teilchens angeben, was hauptsächlich bei Elektronen und Positronen mit Ener- 

23


gien bis zu 1 TeV der Fall ist. 

3.8. Teilchensignaturen 

Die Signale der beschriebenen Subdetektoren sind in Abbildung 3.13 für die wichtigsten 

Teilchen der kosmischen Strahlung und Antihelium bei gleicher Energie von 300 GeV zusammengefasst. 

Dabei stehen die angedeuteten Ausschläge nach unten bei TRD und TOF 

für Energieabgaben in diesen Subdetektoren. Für den Übergangsstrahlungsdetektor erhält 

Abbildung 3.13.: Signaturen von Teilchen bei 300 GeV in den einzelnen Subdetektoren des 

AMS-02 Detektors [18]. 

man für die beiden Leptonen, Elektron und Positron, Übergangsstrahlung in der Intensität 

proportional zu deren Gammafaktor, während Protonen und Helium nur ein, hier nicht gezeigtes, 

sehr geringes Ionisationssignal hinterlassen. Photonen hinterlassen als ungeladene 

Teilchen keine Spuren im gesamten Detektor, können aber im Kalorimeter durch Ionisation 

einen elektromagnetischen Schauer auslösen. Außerdem können sie über Paarbildung in 

ein Elektron und ein Positron zerfallen und so nachgewiesen werden. Im Flugzeitdetektor 

können Teilchen durch ihre Energieabgabe pro Weglänge, die proportional zur getragenen 

Ladung im Quadrat ist, charakterisiert werden. Dies ist auch im Spurdetektor möglich, 

was anhand der dickeren Spur des Heliums dargestellt ist. Dort wird außerdem das Ladungsvorzeichen, 

als einzige Möglichkeit Elektronen von Positronen, oder Helium von Antihelium 

zu unterscheiden, bestimmt. Der Ring abbildende Tscherenkow Detektor kann die 

Ladung durch die Intensität des Ringes, sowie die Geschwindigkeit über den Ringdurchmesser 

bestimmen. Da Helium bei gleicher Gesamtenergie eine geringere Geschwindigkeit 

als Protonen oder Leptonen besitzt, ist der Ring hier deutlich größer. Zuletzt folgt das 

elektromagnetische Kalorimeter, in dem wie beschrieben elektromagnetische Schauer von 

hadronischen Schauern unterschieden werden. In der Abbildung lösen Protonen und Helium 

gar keinen Schauer aus und hinterlassen einzig ihr Ionisationssignal proportional zur 

Kernladungszahl. 

Aus Abbildung 3.13 wird deutlich, dass ein Subdetekor alleine nicht alle Teilchen voneinander 

trennen kann. Erst durch das Zusammenspiel aller Subdetektoren kann jeder 

Bestandteil der kosmischen Strahlung identifiziert werden. 

In Abbildung 3.14 und 3.15 sind ein Elektron und ein Proton Ereignis bei einer Energie 

von etwa 90 GeV im Ereignismonitor zu sehen, der in der AMS Software integriert ist. 

24

3.8. Teilchensignaturen 25 

AMS Event Display Run/Event 1349332598 / 215920 GMT Time 2012-278.06:46:51 

Front 

Side 

DAQ 

DAQ 

z 

Header 

z 

Header 

x 

y 

Level1 

y 

x 

Level1 

Level3 

Level3 

Particle TrTofTrdTrdHRichRichBEcal No 0 Id=146 p= -92.6± 

63 M= 20.4± 

o 

20 θ=2.90 φ=2.59 Q= 1 β= 0.977± 0.032/ 0.98/ βh= 0.971± 0.037 θ_M -36.8 Coo=(16.63,-27.87,53.04) LT 0.88 θ_G 1.22 φ_G 4.22 

TrTrack #0 NHits 6 (x:4,y:6,xy:4)Pattern: 57 _XXXXXX__, DefFit: 17, Chi2 3.704 Pirig -105.370Rigidity: -92.605 Err(1/R): 0.00729 P0: 5.361 -20.912 0.000 Dir: 0.2061 -0.1274 0.9702 

Abbildung 3.14.: Ereignismonitor eines Elektrons mit einer Rigidität von −92, 6 GV, aufgenommen 

am 04. Oktober 2012. 

AMS Event Display Run/Event 1349332598 / 626474 GMT Time 2012-278.06:54:11 

Front 

Side 

DAQ 

DAQ 

z 

Header 

z 

Header 

x 

y 

Level1 

y 

x 

Level1 

Level3 

Level3 

Particle TrTofTrdRichRichBEcal No 0 Id=46 p= 83.3± 

7.1 M= 32.9± 

o 

8.3 θ=3.04 φ=2.91 Q= 1 β= 0.930± 0.030/ 0.93/ βh= 0.938± 0.041 θ_M -56.7 Coo=(47.02,-5.14,53.05) LT -1.00 θ_G 0.99 φ_G 4.54 

TrTrack #0 NHits 8 (x:7,y:8,xy:7)Pattern: -1 XXXXX_XXX, DefFit: 3089, Chi2 1.442 Pirig 82.592Rigidity: 83.264 Err(1/R): 0.00102 P0: 41.509 -3.866 0.000 Dir: 0.1034 -0.0238 0.9944 

Abbildung 3.15.: Ereignismonitor eines Protons mit einer Rigidität von 83, 3 GV, aufgenommen 

am 04. Oktober 2012. 

25

4. Der Übergangsstrahlungsdetektor 

In diesem Kapitel soll auf den bereits in Teil 3.1 angesprochenen Übergangsstrahlungsdetektor 

näher eingegangen werden. Aufgrund seiner Fähigkeit relativistische Teilchen nach 

deren Masse zu trennen, ist er für die Trennung von Positronen und Protonen bei hohen 

Energien besonders geeignet. Wie bereits beschrieben sind Protonen der Hauptbestandteil 

kosmischer Strahlung und damit der dominierende Untergrund bei der Messung von Positronen. 

Bei einem Verhältnis des Protonen- zu Positronenflusses von 10 3 −10 4 wird dabei 

eine Protonenunterdrückung von 10 6 angestrebt um die Verunreinigung durch Protonen 

im Positronenspektrum unter 1% zu halten. 

Um eine maximale Effizienz zu erreichen, besitzt der TRD eine oktogonale Form mit einem, 

sich nach unten hin verkleinernden, Durchmesser des Inkreises von 2 m auf der Oberseite 

und 0, 8 m auf der Unterseite. 

Auch wenn die Technik Teilchen anhand emittierter Übergangsstrahlung zu detektieren 

wohl bekannt ist und in einigen teilchenphysikalischen Experimenten wie dem ATLAS 

Detektor am LHC oder HERA-B am DESY in Hamburg verwendet wird, ist der Betrieb 

des Übergangsstrahlaungsdetektors als komplexer Gasdetektor im Weltraum dennoch eine 

Herausforderung. 

4.1. Entstehung von Übergangsstrahlung 

Zur Beschreibung der Entstehung von Übergangsstrahlung beim Grenzübergang eines geladenen 

Teilchens zwischen Materialien unterschiedlicher Permitivität werden unterschiedliche 

Modelle herangezogen. Eine physikalisch leicht nachzuvollziehende Annahme postuliert 

eine Spiegelladung, die durch Polarisation des Mediums durch das herannahende geladene 

Teilchen induziert wird. Beide Ladungen bilden so einen elektrischen Dipol, wie er in Abbildung 

4.1 dargestellt ist. Durch die Bewegung des Teilchens verändert sich dieser Dipol 

und strahlt somit Energie in Form elektromagnetischer Wellen ab. 

Ein anderer Ansatz basiert auf den Lösungen der inhomogenen Maxwellgleichungen in beiden 

Medien, welche sich durch einen Term mit der elektrischen Polarisation im Medium 

unterscheiden. Beim Übergang zwischen zwei Stoffen muss dann eine Umordnung der vom 

Teilchen erzeugten Felder stattfinden, bei der die Differenzenergie abgestrahlt wird. Die 

Intensität der abgestrahlten Photonen ist dabei 

I = γq2 (ω 1 − ω 2 ) 2 

3c 

(4.1) 

27

28 4. Der Übergangsstrahlungsdetektor 

Abbildung 4.1.: Spiegelladung einer positiven Ladung an einer Grenzfläche [30]. 

mit dem Lorentz-Faktor des Teilchens γ = E/mc 2 , seiner Ladung q und den Plasmafrequenzen 

ω 1,2 in beiden Materialien. Ein Großteil dieser Energie wird mit der Wahrscheinlichkeit 

von etwa α/3 in Form energiereicher Photonen im Röntgenbereich von 2 − 20 

keV innerhalb des Winkelbereichs θ ≤ 1/γ, des sogenannten Vorwärtskegels, abgestrahlt 

[31]. Dabei ist α = 1/137 die Feinstrukturkonstante. Gleichung 4.1 ist auch bei einem 

nichtrelativistischen Teilchen mit γ ∼ 1 ungleich null. Damit wird Übergangsstrahlung, 

anders als beispielsweise beim Tscherenkow Effekt, auch bei niedrigen Geschwindigkeiten 

abgestrahlt. Bei vielen Grenzübergängen werden dann mit einer ausreichend großen Wahrscheinlichkeit 

Photonen mit einer direkt zum Lorentz-Faktor des Teilchens proportionalen 

Intensität emittiert. Diese können bei bekannter Energie zur Unterscheidung von Teilchen 

nach deren Masse verwendet werden. 

4.2. Aufbau des Detektors und Messung von Übergangsstrahlung 

Als Radiator im Übergangsstrahlungsdetektor des AMS-02 Experiments sind 20 Lagen 

aus Vlies, bestehend aus Polypropylen- und Polyethylen-Fasern, mit einer Dicke von 20 

mm und einer Dichte von 0, 06 g/cm 3 verbaut. Die lose angeordneten und etwa 10 µm 

dicken Fasern ermöglichen eine hohe Zahl von Vakuum-Radiator Übergängen, so dass 

beim Durchqueren einer Lage Übergangsstrahlung mit einer Wahrscheinlichkeit von etwa 

60% ausgesendet und detektiert wird [32]. Die entstandene Übergangsstrahlung wird von 

Proportionaldrahtkammerröhrchen unterhalb jeder einzelnen Lage Vlies gemessen. Diese 

haben einen Durchmesser von 6 mm und eine Länge von 0, 8 − 2 m. Sie bestehen aus 

Kapton-Folie die mit Aluminium und Graphit als Kathode auf der einen und Polyurethan 

auf der anderen Seite beschichtet ist. Zwei solcher Folien werden jeweils Rücken an Rücken 

zusammengebracht und bilden somit eine 72 µm starke Hülle. Die einzelnen Schichten 

des Wandmaterials sowie der Fertigungsprozess der Röhrchen sind in Abbildung 4.2 zu 

sehen. Als Anodendraht wird ein 30 µm dicker Draht aus mit Gold beschichtetem Wolfram 

verwendet. Die Betriebsspannung im Proportionalbereich liegt im Bereich von etwa 1500 

V. 16 solcher Röhrchen sind zu einem Modul zusammengefasst. Zur Stabilität sind die 

Module mit 6 Versteifungen aus Karbon durchzogen, sowie mit Karbonband im Abstand 

von 10 cm gesichert. Ein Bild eines solchen Moduls in der Draufsicht und im Querschnitt 

mittels Computertomographie ist in Abbildung 4.3 zu sehen. Insgesamt wurden 328 Module 

und damit 5248 Proportionaldrahtkammerröhrchen in 20 Lagen verbaut. Die oberen und 

unteren vier Lagen sind dabei parallel zur x-Richtung, die restlichen Lagen um 90 ◦ gedreht 

in y-Richtung angeordnet, was eine drei-dimensionale Spurrekonstruktion ermöglicht. Die 

einzelnen Module sind in eine Oktogonale Trägerkonstruktion aus Aluminiumwaben mit 

Querstreifen aus Karbon zur Stabilität eingebettet. Der gesamte Subdetektor wiegt dank 

konsequenter Leichtbauweise nur 500 kg. 

Als Füllgas für die Proportionaldrahtkammern wird eine Mischung aus 90% Xenon und 

28

4.2. Aufbau des Detektors und Messung von Übergangsstrahlung 29 

Abbildung 4.2.: Schematische Darstellung der Zusammensetzung des Wandmaterials für 

eine Proportionalkammerröhre (links) und Veranschaulichung des Fertigungsprozesses 

(rechts) [33]. 

Abbildung 4.3.: Foto eines Moduls in der Draufsicht (oben) und der Querschnitt mittels 

Computertomographie (unten) [32]. 

10% Kohlenstoffdioxid verwendet. Einfallende Übergangsstrahlungsphotonen geben ihre 

Energie nach der Beziehung 

I = I 0 · e −µx (4.2) 

ans Detektorgas ab, wobei I 0 der Intensität des Photonenstrahls beim Eintritt in Materie 

entspricht, x die im Medium zurückgelegte Weglänge ist und µ ein vom jeweiligen 

Interaktionsprozess nach 

µ = N A 

A · (σ Ph + σ CS + σ Pb ) (4.3) 

abhängiger Absorptionskoeffizient. Der Absorptionskoeffizient µ hängt dabei von der Summe 

der einzelnen Wirkungsquerschnitte für die Wechselwirkungsprozesse Compton Streuung 

(CS), Photoeffekt (Ph) und Paarbildung (Pb) ab. Alle drei Prozesse finden in einem 

gewissen Energiebereich prinzipiell parallel statt wie in Abbildung 4.4 (a) am Beispiel von 

Blei als Absorber dargestellt ist. Dennoch ist abängig von der Energie des Photons und 

Material des Absorbers jeweils ein Prozess der dominierende. In Abbildung 4.4 (b) ist dies 

in Abhängigkeit der Kernladungszahl des Absorbers und der Photonenenergie dargestellt. 

Demnach ist für Übergangsstrahlungsphotonen mit Energien im Röntgenbereich bis zu 

20 keV, die sich durch das Xenongas mit einer Kernladungszahl von Z Xe = 54 bewegen 

der Photoeffekt dominierend. Bei diesem wird das einfallende Photon von einem Elektron 

in der Atomschale der Gasatome vollständig absorbiert und dieses Elektron wird mit der 

kinetischen Energie E kin = E Photon − E Bindung frei. Der Wirkungsquerschnitt ist mit 

σ ∝ Z 5 proportional zur Kernladungszahl des Absorbers. Xenon ist damit für die Detektion 

der Übergangsstrahlungsphotonen gut geeignet. Im äußeren elektrischen Feld wird 

29


(a) 

(b) 

Abbildung 4.4.: (a) Energieabhängigkeit des Massenabsorptionskoeffizienten µ in Blei 

Z Pb = 82 und (b) Bereiche in denen Photoeffekt, Compton Effekt oder 

Paarbildung dominieren in Abhängigkeit der Kernladungszahl Z des Absorbers 

und der Photonenenergie [34]. 

das freie Elektron dann zum Anodendraht hin beschleunigt. Das elektrische Feld nimmt 

durch die Zylindersymmetrie der Anordnung mit E(r) ∝ 1/r zur Mitte hin stark zu und 

beschleunigt Elektronen in der direkten Umgebung des Anodendrahtes so stark, dass diese 

durch weitere Ionisation eine Ladungslawine erzeugen. Diese löst bei Auftreffen auf den 

Draht ein messbares Signal proportional zur im Gas deponierten Energie aus. Da nur in 

direkter Umgebung des Anodendrahtes Lawinenbildung eintritt, ist die Verstärkung unabhängig 

vom Abstand des Ionisationspunktes. Die Gasverstärkung hängt jedoch von der 

Zusammensetzung und dem Druck des Gases, sowie der angelegten Hochspannung ab. 

Die Energieabgabe geladener Teilchen pro Weglänge dE/dx durch Ionisationsprozesse im 

Detektorgas lässt sich dabei durch die Bethe-Bloch-Formel 

− dE 

dx = 4πN Arem 2 e c 2 z 2 Z [ 

1 

A β 

ln 2m ec 2 γ 2 β 2 

I 

− β 2 − δ 2 

] 

(4.4) 

mit 

z: Ladung des einfallenden Teilchens 

Z,A: Kernladungszahl und Massenzahl des Absorbers 

m e : Elektronenmasse 

r e : klassischer Elektronenradius r e = 1 e 

4πɛ 0 

· 2 

m ec 2 

N A : Avogadro-Konstante 

I: Für den Absorber charakteristische Ionisationskonstante 

beschreiben [34]. Protonen, die wenig Übergangsstrahlung aussondern werden daher in den 

Proportionaldrahtkammern nur ein Signal durch Ionisation hinterlassen, während Elektronen 

durch das Emittieren von Übergangsstrahlung wesentlich mehr Energie im Detektor 

deponieren. Die Verteilung der durch Ionisation deponierten Energie folgt dabei wie in 

Abbildung 4.5 gezeigt einer Landau Verteilung [35]. 

4.3. Gassystem und Betrieb auf der ISS 

Wie beschrieben erfolgt der Nachweis geladener Teilchen und Übergangsstrahlungsphotonen 

durch Ionisation des dafür besonders geeigneten Xenongases. Das zugesetzte Kohlen- 

30

4.3. Gassystem und Betrieb auf der ISS 31 

3 

×10 

500 

400 

300 

200 

100 

Energiespektrum in Lage 6 bei 25 GeV 

Entries 

1.129837e+07 

Mean 104.7 

RMS 89.19 

Constant 

6.553e+07 

MPV 54.52 

Sigma 21.35 

0 

0 100 200 300 400 500 600 

Energieabgabe/ADC 

Abbildung 4.5.: Energieabgabe aller Teilchen im Energiebereich um 25 GeV in Lage 6 mit 

angepasster Landau-Verteilung im Ionisationsbereich (rot). 

stoffdioxid wirkt dabei als Löschgas, das ab einer bestimmten Schwelle durch inelastische 

Stöße mit Elektronen zu eigenen Schwingungszuständen angeregt wird und diesen damit 

Energie entzieht. Damit wird weitere Lawinenbildung unterbunden. Die Herausforderung 

im Betrieb eines Gasdetektors im Vakuum des Weltraums liegt dabei darin, Gasverlust 

durch Diffusion und undichte Stellen möglichst gering zu halten. Um eventuell vorhandene 

Gasverluste dennoch ausgleichen zu können, führt der Detektor Gasreserven von 49, 5 

kg Xenon und 4, 5 kg Kohlenstoffdioxid in einem eigenen Gassystem mit sich, die für die 

Restlaufzeit des Experimentes ausreichen. Eine schematische Darstellung dieses Gassystems 

ist in Abbildung 4.6 zu sehen. Dieses besteht demnach aus der sogenannten Box-S 1 , 

in der die Gasreserven aufbewahrt und bei Bedarf im 1 Liter fassenden Mischbehälter 

im richtigen Verhältnis gemischt und an die Box-C 2 weitergegeben werden, von wo aus 

das Gas mit Pumpen kontrolliert in das Gassystem des Hauptdetektors transferiert wird. 

Jede Gaszuleitung und jedes Ventil in Box-S und Box-C ist dabei unabhängig zweifach 

vorhanden um mögliche Defekte kompensieren zu können. Außerdem werden Temperatur 

und Druck im Gassystem an verschiedenen Stellen gemessen um einen einwandfreien Betrieb 

zu gewährleisten. Kontrolliert wird dies, sowie alle anderen wichtigen Funktionen des 

AMS-02 Detektors, im Schichtbetrieb in einem eigens dafür eingerichteten Kontrollzentrum 

(POCC 3 ) in Genf auf dem Gelände des CERN und eines vollständig ausgerüsteten zweiten 

Kontrollzentrums in Taiwan. Eine Foto des Kontrollraums mit Beschreibung der einzelnen 

Schichtpositionen ist in Abbildung 4.7 zu sehen. Von dort werden auch TRD-Operationen 

wie das Nachfüllen des Gases (gas refill) und die Anpassung der Spannung in den Proportionaldrahtkammern 

(high voltage adjustment) durchgeführt. Um trotz Gasverlusten 

eine stabile Gasverstärkung zu gewährleisten wird diese Spannungsanpassung täglich vom 

zuständigen TRD-Experten durchgeführt. Dabei wird eine in der Detektorelektronik gespeicherte 

Konfigurationsdatei mit neuen Parametern für die Hochspannungswerte der 

einzelnen Kanäle gelöscht und neu geschrieben. Ziel ist es den wahrscheinlichsten Wert 

1 engl.: Storage 

2 engl.: Circulate 

3 engl.: Payload Operation Control Center 

31


Abbildung 4.6.: Darstellung des Gassystems bestehend aus der Box-S, der Box-C und dem 

Gaskreislauf des Hauptdetektors bestehend aus 41 Segmenten [32]. 

(MPV 4 ), wie in Abbildung 4.5 definiert als Spitze der Laundau-Verteilung der deponierten 

Ionisationsenergie dE/dx von Protonen auf einem stabilen Wert von 60 Analog-Digital 

Zählwerten (ADC 5 ) zu halten. Ein Bildschirmfoto des zur Ausgabe des benötigten Korrekturwertes 

entwickelten Programms ist in Abbildung 4.8 zu sehen. Für die Anpassung muss 

die Datennahme gestoppt und im Anschluss die automatische Kalibrierung des Detektors 

vor jedem Äquatorübergang durchgeführt werden, was eine Zusammenarbeit mit der 

Schichtleitung 6 erfordert, da Rechte zur Übertragung von Befehlen (command) benötigt 

werden. Die für den TRD zuständige Position (TEE) ist außerdem für die Überwachung 

des Antikoinzidenzzählers und Spurdetektors, sowie dessen Temperaturkontrollsystems zuständig. 

Dazu wurden spezielle auf die Positionen angepasste Computerprogramme entwickelt, 

die benötigte Daten nahezu in Echtzeit anzeigen. Im Rahmen dieser Diplomarbeit 

wurde diese Schichtposition besetzt und Hochspannungsanpassungen als TRD-Experte in 

eigener Verantwortung durchgeführt. 

Für die Datennahme ist der Orbit der ISS in vier Teile, in sogenannte Runs geteilt. Ein 

Run ist dabei ein Intervall in dem Datennahme betrieben wird und verläuft für gewöhnlich 

zwischen Äquator und Pol und endet, bzw. beginnt dort. Ein Run dauert dabei etwa 23 

Minuten. 

4.4. Kalibrierung 

Durch die täglichen Hochspannungsanpassungen und den in etwa alle 4 Wochen durchgeführten 

gas refill kann die Gasverstärkung nur grob auf einem konstanten Level gehalten 

werden, wie in Abbildung 4.8 ersichtlich ist. Um mit den Messwerten Analysen durchführen 

zu können muss eine genauere Kalibrierung der Gasverstärkung 7 für jeden Run 

4 engl.: Most Probable Value 

5 engl.: Analog digital counts 

6 engl.: LEAD 

7 engl.: Gain calibration 

32

4.4. Kalibrierung 33 

Abbildung 4.7.: Foto des AMS-02 POCC auf dem Gelände des CERN in Genf [36]. Die einzelnen 

Schichtpositionen sind in rot gekennzeichnet. Dabei ist ”Data” für 

die Überwachung der Datenübertragung von der ISS zum CERN, über 

einzelne Zwischenstationen zuständig. ”LEAD” dient als Schichtleitung 

und ist Schnittstelle für die Kommunikation mit der NASA. ”PM” ist 

für Ecal, RICH und TOF verantwortlich, ”TEE” überwacht Spurdetektor, 

ACC und TRD. ”Thermal” kontrolliert die Temperatursituation im gesamten 

Detektor, welche stark mit dem Winkel des Detektors zur Sonne 

korreliert und kann gegebenenfalls nach Rücksprache mit der Schichtleitung 

Heizungen zu- und abschalten, oder die NASA bitten die Position der 

Solarpanele oder Radiatoren der ISS so zu verändern, dass diese entweder 

Schatten spenden, oder Zufuhr von Sonnenlicht ermöglichen. Außerdem 

befindet sich im POCC noch eine Position für das Offline Computing, 

die im Bild nicht eingefangen wurde und wo die Ereignisrekonstruktion 

überwacht wird. 

33


Abbildung 4.8.: Bildschirmfoto des Programms zur Ermittlung des Korrekturwertes zur 

Hochspannungsanpassung. Aufgetragen ist der wahrscheinlichste Wert der 

deponierten Energie über einen Zeitraum (hier zwei Wochen). Der Wert 

schwankt um etwa 60 ADC, wobei ein etwa linearer Anstieg mittels Hochspannungsanpassungen 

kompensiert wird. In rot ist eine lineare Anpassung 

an die Daten zu sehen, die vom Programm ausgegeben wird und den 

Korrekturwert bestimmt (hier −3 V). 

durchgeführt werden. Da die in den Proportionaldrahtkammerröhrchen deponierte Energie 

von der in den Röhrchen zurückgelegten Weglänge abhängt, müssen außerdem kleinste 

zeitabhängige Verschiebungen der Detektorkonstruktion, beispielsweise durch Temperaturschwankungen, 

im 100 µm-Bereich korrigiert werden (alignment), um diese Weglänge 

korrekt angeben zu können. Für diese Aufgaben werden in der AMS-02 Software Lösungen 

zur Korrektur in Form der TrdQt von der RWTH Aachen und TrdKCalib vom Massachusetts 

Institute of Technology (MIT) bereitgestellt. Auf die von der Software durchgeführten 

Schritte wird hier nur am Beispiel der TrdKCalib eingegangen, um einen Überblick über 

deren Arbeitsweise zu geben. 

Für die Kalibrierung der Gasverstärkung wird, wie bei der in Teil 4.3 für das high voltage 

adjustment beschriebenen Methode, das ADC Spektrum pro Proportionaldrahtkammerröhrchen 

für einen Run gemessen und auf einen wahrscheinlichsten Wert von 60 ADC 

Zählwerten normiert. So wird das in Abbildung 4.8 dargestellte Spektrum im Nachhinein 

weiter geglättet. 

Für das alignment wird die vom Spurdetektor gemessene Teilchenspur in den Übergangsstrahlungsdetektor 

fortgesetzt und der Detektor virtuell so verschoben, dass dessen Signale 

mittels eines Minimierungsverfahrens einen möglichst kleinen Abstand zu dieser Spur haben. 

So werden sechs zeitabhängige Korrekturparameter zur Translation dx, dy und dz und 

zur Rotation α, β und γ berechnet und auf die einzelnen Signalorte angewendet. Dabei 

unterscheidet man zwischen Bewegungen auf einer langen und einer kurzen Zeitbasis. Auf 

einer langen Zeitbasis werden Events in einem 12 Stunden Zeitintervall ausgewertet und 

damit eine Kalibrierung für jede einzelne Lage des Übergangsstrahlungsdetektors durchgeführt. 

In Abbildung 4.9 ist die Verschiebung in x-Richtung exemplarisch für die Lagen 4, 10 

und 14 auf dieser Zeitbasis veranschaulicht. Ähnliche Trends sind in den Auftragungen für 

die restlichen fünf Korrekturparameter zu sehen. Außerdem folgen diese augenscheinlich 

34

4.5. Unterscheidung von Protonen und Positronen 35 

Abbildung 4.9.: Auftragung der Verschiebung dx in x-Richtung von Lage 4, 10 und 14 auf 

langer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 30 Tage. 

Abbildung 4.10.: Auftragung der Verschiebung des gesamten Detektors dx in x-Richtung 

auf kurzer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 2 

Stunden. 

für alle Lagen demselben Trend, was eine Bewegung des Übergangsstrahlungsdetektors als 

starrer Körper ergibt. Diese Annahme wird aus Mangel an Daten auch für Korrekturen 

auf kurzer Zeitbasis von etwa 5 Minuten gemacht. Dies ist in Abbildung 4.10 dargestellt. 

Hier kann man die Bewegung des Detektors mit jedem Orbit von 1, 5 Stunden sehen. Mit 

diesen Methoden kann eine Kalibrierung mit einer Genauigkeit von 30 − 40 µm für die 

TrdKCalib durchgeführt werden. 

4.5. Unterscheidung von Protonen und Positronen 

Um nun mithilfe des Übergangsstrahlungsdetektors Analysen durchführen zu können, müssen 

die von der Elektronik ausgegebenen ADC Signale A ADC mit dem zeitabhängigen 

Gasverstärkungsfaktor f G multipliziert und die dreidimensionale Pfadlänge durch das Gas 

x path nach dem alignment ermittelt werden. Damit kann, mit dem bekannten Durchmesser 

der Proportionaldrahtkammerröhrchen d, nach 

A PLCorr = A ADC · f G · 

d 

x path 

(4.5) 

eine lineare Pfadlängen- und Gasverstärkungskorrektur durchgeführt werden, die zu einem 

zeitlich und örtlich unabhängigen Wert für die ADC Signale A PLCorr führt. 

35

hEle_mean_25 

Entries 19229 

Mean 365.8 

RMS 89.31 


Ein normiertes Spektrum dieser Werte, im Folgenden als Energieabgabe im Übergangsstrahlungsdetektor 

bezeichnet, aus Flugdaten im Energiebereich um 25 GeV für Lage 6 

ist in Abbildung 4.11 dargestellt. Dabei wurde eine Unterteilung in Elektronen (blau), die 

für den Übergangsstrahlungsdetektor wie Positronen aussehen, und Protonen (rot) vorgenommen. 

Zu sehen ist ein Ausschlag im Ionisationsbereich mit einem Ausläufer in den 

Röntgenbereich der Übergangsstrahlung. Dieser ist bei Elektronen wesentlich stärker ausgeprägt. 

Die Wahrscheinlichkeit Energie im Röntgenbereich der Übergangsstrahlung zu 

emittieren ist demnach für Elektronen mit einer Energie von etwa 25 GeV ungefähr 10 

mal höher als für Protonen derselben Energie. Im Mittelwert der 20 Detektorlagen führt 

dies bereits zu einer beeindruckenden Separation der Populationen von Elektronen und 

Positronen, wie sie in Abbildung 4.12 dargestellt sind. 

Abbildung 4.11.: Auf eins normiertes Spektrum der Energieabgabe von Elektronen (blau) 

und Protonen (rot) im Energiebereich um 25 GeV in Lage 6. 

0.1 

0.08 

Elektronen 

Protonen 

0.06 

0.04 

0.02 

0 

0 100 200 300 400 500 600 700 800 

Mittlere Energieabgabe/ADC 

Abbildung 4.12.: Auf eins normiertes Spektrum des Mittelwertes der Energieabgabe in den 

20 Detektorlagen von Elektronen (blau) und Protonen (rot) im Energiebereich 

um 25 GeV. 

36

5. Statistische Methoden 

Aus den Messungen des Übergangsstrahlungsdetektors erhält man nach Teil 4.5 für jede 

der 20 Lagen die Energieabgabe innerhalb dieser Lage als reellen Zahlenwert. Gegenstand 

dieser Arbeit ist es, die Energieabgaben in den einzelnen Lagen zu interpretieren und entsprechend 

der Natur des Events eine Einteilung in Positronen und Protonen vorzunehmen. 

Statistisch gesehen ist eine bestimmte Energieabgabe in einer Lage innerhalb eines Intervalls 

dE eine zufällige Zahl, wobei der Grad der Häufigkeit durch die Wahrscheinlichkeit 

P p,e (∆E) beschrieben wird. Die Größe Wahrscheinlichkeit ist dabei eine reelle Zahl im 

Intervall [0, 1] und so definiert, dass ein sicheres Ereignis die Wahrscheinlichkeit 1 besitzt 

und sich einzelne Wahrscheinlichkeiten, zum Beispiel die Wahrscheinlichkeit der Energieabgabe 

einem der Bereiche dE i , addieren lassen solange sich die Energieintervalle dE i nicht 

überlappen, das heißt die Menge der Energieintervalle disjunkt ist 

∑ 

P p,e (∆E i ) = P p,e ( ∑ 

i 

i 

∆E i ). (5.1) 

Diese Definitionen von Wahrscheinlichkeit sind als Axiome von Kolmogorow bekannt. Die 

Wahrscheinlichkeit P p,e (dE) ergibt sich dabei aus der sogenannten Wahrscheinlichkeitsdichte 

f(E) mit dem Integral über das Energieintervall dE 

∫ 

P p,e (∆E) = 

∆E 

f(E)dE. (5.2) 

Die Wahrscheinlichkeitsdichtefunktion f(E) ist dabei so normiert, dass ihre Gesamtfläche 

im gesamten Ereignisraum E gleich 

∫ 

E 

f(E)dE = 1 (5.3) 

ist [38]. Die in Abbildung 4.11 gezeigten Spektren entsprechen also nach den Gleichungen 

5.1-5.3 durch das Zusammenfassen der gezählten Werte in Intervalle (Bins) und anschließendes 

Normieren auf eins einer diskreten Wahrscheinlichkeitsdichteverteilung. Man 

beachte den Unterschied zwischen einer Wahrscheinlichkeitsdichte und einer Wahrscheinlichkeitsverteilung 

als Integral der Wahrscheinlichkeitsdichte. 

Die Energieabgaben der 20 Lagen müssen demnach den Wahrscheinlichkeitsdichteverteilungen 

von Leptonen oder Protonen zugeordnet werden. 

37

38 5. Statistische Methoden 

5.1. Hypothesentests 

Ziel eines Hypothesentests ist es eine Aussage über die Vereinbarkeit einer Messung mit 

einer bestimmten Hypothese H 0 , beispielsweise ” 

die Messdaten entsprechen denen, die für 

ein Positron erwartet werden“, zu machen. Die Messung wird dabei in der Form eines 

Satzes von Variablen x = {x 1 , x 2 , ..., x n } geschrieben, wobei x i einem einzelnen Messwert 

entspricht und n die Anzahl der aufgenommenen Messwerte pro Ereignis ist, also 

die Dimensionalität des Parameterraumes darstellt. Die Hypothese H 0 wird in der Regel 

mit einer oder mehreren Gegenhypothesen H 1 , H 2 , ... verglichen und zurückgewiesen oder 

angenommen. Jede der Hypothesen setzt eine unterschiedliche Verteilung der einzelnen Parameter 

x, gegeben durch die Wahrscheinlichkeitsdichteverteilungen f(x|H 0 ), f(x|H 1 ), ... 

voraus. Ein Beispiel im zweidimensionalen Parameterraum der Variablen x 1 und x 2 ist 

in Abbildung 5.1 gezeigt. Die Populationen H 0 und H 1 lassen sich hier klar durch die 

in Dunkelrot gezeichnete Entscheidungsgrenze separieren, die es in optimaler Weise zu 

bestimmen gilt. Für Parameterräume höherer Dimensionalität ist es von Vorteil die Mess- 

Abbildung 5.1.: Beispiel von Populationen H 0 und H 1 im zweidimensionalen Parameterraum 

der Variablen x 1 und x 2 , getrennt durch eine lineare Entscheidungsgrenze 

(dunkelrot) [39]. 

werte in einer sogenannten Test-Funktion t(x) niedrigerer Dimensionalität m (mit m < n), 

in der alle Informationen der gemachten Messung enthalten sind, zu verarbeiten. Eine eindimensionale 

Test-Funktion könnte beispielsweise durch den Mittelwert gebildet werden, 

wie er in Abbildung 4.12 gezeigt wurde. Eine solche Test-Statistik ist wiederum mit einer 

eigenen Wahrscheinlichkeitsdichte g(t|H 0 ), g(t|H 1 ), ... abhängig von der zu betrachtenden 

Hypothese verteilt. Im einfachsten Fall ist m = 1 und das Problem damit eindimensional. 

In diesem Fall kann die Entscheidungsgrenze als t(x 1 , ..., x n ) = t cut geschrieben werden 

und ist damit ein einfacher Schnitt auf t, der die Test-Statistik in eine Annahme- und 

eine Verwurfsregion teilt. Fällt die Messung in die Annahmeregion wird H 0 als wahr angenommen, 

fällt es in die Verwurfsregion wird H 0 zurückgewiesen. Abbildung 5.2 zeigt 

eine solche Test-Funktion mit einer Einteilung in eine Annahme- und eine Verwurfsregion. 

Darin ist ebenfalls ersichtlich, dass sich die Wahrscheinlichkeitsdichtefunktionen g(t|H 0 ) 

und g(t|H 1 ) für gewöhnlich überlappen. Damit existiert eine endliche Wahrscheinlichkeit 

β = 

∫ tcut 

t min 

g(t|H 1 )dt, (5.4) 

für eine als H 0 angenommene Messung zur Population H 1 zu gehören und damit eine 

falsche Hypothese zu akzeptieren. Man spricht von einem Fehler zweiter Art. t min entspricht 

dabei der unteren Grenze, in der die Waschreinlichkeitsdichtefunktion g(t|H 1 ) definiert 

ist. Einen Fehler erster Art begeht man, indem die richtige Hypothese H 0 durch eine 

Messung in der Verwurfsregion, was mit der Wahrscheinlichkeit 

α = 

∫ tmax 

t cut 

g(t|H 0 )dt (5.5) 

38

5.2. Das Likelihoodverhältnis 39 

Abbildung 5.2.: Wahrscheinlichkeitsdichteverteilungen für die Hypothesen H 0 und H 1 einer 

eindimensionalen Test-Statistik t(x) mit Einteilung in eine Annahmeund 

eine Verwurfsregion, getrennt durch die Entscheidungsgrenze t cut [38]. 

passiert, zugunsten von H 1 verworfen wird. t max ist hier die obere Grenze von g(t|H 0 ). 

Eine wichtige Kenngröße ist außerdem die Effizienz auf die zu testende Hypothese H 0 

mit ε = 1 − α, als Wahrscheinlichkeit ein H 0 Ereignis auch als solches zu erkennen. Eine 

hohe Effizienz geht dabei mit einer höheren Wahrscheinlichkeit einen Fehler zweiter Art 

zu begehen einher. Dies wird durch die Reinheit p 1 als Anteil von H 0 Ereignissen in der 

Annahmeregion S von t min bis t cut nach 

∫ 

S 

p = 

g(t|H 0)dt 

∫ 

S g(t|H 0)dt + ∫ S g(t|H (5.6) 

1)dt 

ausgedrückt. Ein guter Test verbindet hohe Effizienz mit hoher Reinheit. Die Aufgabe 

besteht nun darin eine Test-Funktion t(x) mit optimalen Separationseigenschaften zu konstruieren 

und eine Schnittgrenze t cut zu finden. 

Im Folgenden wird die Hypothese H 0 als Signal bezeichnet und entspricht der Messung 

eines Leptons. Die Gegenhypothese H 1 entspricht dann der Messung eines Protons und 

wird als Untergrund bezeichnet. 

5.2. Das Likelihoodverhältnis 

Ein Weg eine Test-Funktion zu finden basiert auf dem Neyman-Pearson Lemma [38]. Dieses 

legt eine optimale Annahmeregion fest, im Sinne von maximaler Effizienz auf das Signal 

bei minimaler Wahrscheinlichkeit einen Fehler zweiter Art zu begehen. Für einen Test auf 

eine Nullhypothese H 0 zu einer Gegenhypothese H 1 ist diese Annahmeregion durch das 

Verhältnis der Wahrscheinlichkeitsdichteverteilungen 

f(x|H 0 ) 

f(x|H 1 ) > c (5.7) 

festgelegt. Ist dieses Verhältnis kleiner oder gleich c wird die Nullhypothese verworfen. c 

ist dabei ein vorher anhand von α und β aus den Formeln 5.4-5.5 festgelegtes konstantes 

Signifikanzniveau. Äquivalent dazu ist die optimale Test-Statistik durch 

1 engl.:Purity 

f(x|H 0 ) 

= t(x) (5.8) 

f(x|H 1 ) 

39


gegeben. Dabei ist jede monotone Funktion dieses Verhältnisses gleichberechtigt. Formel 

5.8 wird als Likelihoodverhältnis bezeichnet. Das Likelihoodverhältnis liefert im Falle einfacher, 

durch eine Hyperfläche trennbarer, Populationen optimale Separationseigenschaften. 

Allerdings müssen die Wahrscheinlichkeitsdichtefunktionen für Parameter beider Hypothesen 

bekannt sein, was jedoch nicht immer der Fall ist. In diesem Fall müssen die 

Wahrscheinlichkeitsdichtefunktionen Messdaten nachempfunden oder durch Monte-Carlo 

Simulationen modelliert werden. 

Für die Likelihoodfunktion zur Trennung von Positronen und Protonen mithilfe des Übergangsstrahlungsdetektors, 

werden die Verteilungen der Energieabgabe pro Lage für Leptonen 

und Protonen nach Selektion mit dem elektromagnetischen Kalorimeter, nach Teil 

6.1, den Daten entnommen. Auf eins normiert entsprechen die Histogramme diskreten 

Wahrscheinlichkeitsdichtefunktionen wie in Abbildung 4.11 gezeigt und bereits beschrieben. 

Diese könnten nun parametrisiert werden um das Likelihoodverältnis zu bilden. Einfacher 

ist es jedoch die Wahrscheinlichkeiten P e,p (dE) für ein Positron- oder Protonereignis 

direkt aus der Wahrscheinlichkeitsverteilung zu entnehmen. Die Wahrscheinlichkeiten für 

Positron oder Proton in jeder der n = 20 Lagen werden dann über das geometrische Mittel 

√ √√√ 

∏ n 

P e,p (dE) = n Pe,p(dE) k (5.9) 

k=1 

vereint. Daraus wird dann das Likelihoodverhältnis 

( 

) 

P e (dE) 

L = − log 

P e (dE) + P p (dE) 

(5.10) 

gebildet. Die Bildung des Logarithmus als monotone Funktion ist dabei Konvention und 

soll einer besseren Verarbeitung der Daten im Computer dienen. Bei der Bildung des geometrischen 

Mittels nach Gleichung 5.9 werden keine Korrelationen zwischen den einzelnen 

Lagen betrachtet, so dass das Likelihoodverhältniss nur eine gute Test-Statistik darstellt, 

wenn solche Korrelationen nicht existieren. 

In der AMS-02 Software werden Likelihoodverhältnisse durch das in der RWTH Aachen 

entwickelte Framework TrdQt und das im MIT entwickelte TrdK bereitgestellt. Beide 

unterscheiden sich durch ihr verwendetes alignment, sowie durch die Kalibrierung der 

Gasverstärkung, wie in Kapitel 4.4 beschrieben. Außerdem werden Abhängigkeiten der 

verwendeten Wahrscheinlichkeitsdichteverteilungen von der Energie des Teilchens oder 

des Gasdrucks im Proportionaldrahtkammerröhrchen unterschiedlich parametrisiert. Die 

Verteilungen der Likelihoodverhältnisse sind in Abbildung 5.3 zu sehen. Ein hoher Wert 

entspricht dabei einer Proton ähnlichen Signatur des Teilchens. Ein niedriger Wert einer 

Lepton ähnlichen Signatur. 

5.3. Künstliche neuronale Netze 

Die einfachste Möglichkeit eine Trennung vorzunehmen, ist die einer Hyperebene wie sie 

bereits in Abbildung 5.1 im zweidimensionalen Fall verwendet wurde. Eine entsprechende 

Test-Funktion kann in Form einer linearen Funktion als 

y(x) = w T x + w 0 (5.11) 

mit dem n-dimensionalen Variablenvektor x und w, welcher als Vektor der Gewichte bezeichnet 

wird, geschrieben werden [40]. Die Entscheidungsgrenze liegt dann auf der Hyperebene 

mit y(x) = 0. Die Form dieser Hyperebene wird durch die Gewichte festgelegt. 

40

Entries 

3137898 

Mean 1.027 

RMS 0.1442 

5.3. Künstliche neuronale Netze 41 

7 

10 

6 

10 

5 

10 

4 

10 

3 

10 

TrdQt Protonen 

TrdK Protonen 

htemp__1 

TrdQt Leptonen 

TrdK Leptonen 

2 

10 

10 

1 

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 

Likelihoodverhaltnis 

Abbildung 5.3.: Verteilung des Likelihoodverhältnis gegeben durch TrdQt und TrdK von 

Protonen und Leptonen aus Flugdaten, selektiert durch das elektromagnetsiche 

Kalorimeter. 

5.3.1. Künstliche Neuronen 

Gleichung 5.11 kann in Form eines sogenannten Netzwerkdiagramms wie in Abbildung 5.4 

ausgedrückt werden. Dabei werden die einzelnen Elemente des Vektors x als Eingangselemente 

dargestellt, die über die Gewichte mit dem Ausgabewert y verbunden sind. Die 

Schwelle w 0 ist dabei an ein separates Eingangselement geknüpft, welches dauerhaft den 

Wert +1 innehat und als Bias bezeichnet wird. 

Bias 

Input 

variables 

x 1 

⋮ 

⋮ 

w 0 

w i 

y(⃗x) 

x n 

Abbildung 5.4.: Darstellung von Gleichung 5.11 als Netzwerkdiagramm. 

Die Ausgabe von Funktion 5.11 wird zumeist in einer monotonen Funktion g(y) verarbeitet, 

die die Form der Ausgabe maßgeblich bestimmt und Aktivierungsfunktion genannt 

wird. Eine geeignete Funktion dafür ist die S-Förmige Sigmoid Funktion 

g(y) = 

1 

1 + e −y (5.12) 

41


1 

0.8 

g(y)= 

1 

1+e 

-y 

0.6 

0.4 

0.2 

0 

-5 -4 -3 -2 -1 0 1 2 3 4 5 

y 

Abbildung 5.5.: Zeichnung der Sigmoid Funktion nach Formel 5.12. 

die das Intervall (−∞, ∞) auf (0, 1) abbildet und für kleine Werte y linear angenährt 

werden kann. Die Sigmoid Funktion ist in Abbildung 5.5 dargestellt. Auf die besondere 

Bedeutung dieser Funktion als Aktivierungsfunktion wird in Teil 5.3.4 näher eingegangen. 

Ein solches Netzwerk mit Aktivierungsfunktion wird als künstliches Neuron bezeichnet. 

Die Namensgebung trägt dem biologischen Vorbild auf dem ein solches Netzwerk basiert 

Rechnung. Gemeint ist eine Nervenzelle, die im zentralen Nervensystem über Synapsen 

mit anderen Nervenzellen verknüpft ist. Die Synapsen entsprechen in diesem Bild den 

Gewichten w i , wobei das Gewicht des Bias w 0 einem Schwellwert entspricht, ab dessen 

Überschreitung das Neuron aktiv wird ( ” 

feuert“). 

Mit einem künstlichen Neuron kann bereits eine Trennung einfacher, durch eine Hyperebene 

linear trennbarer Populationen, vorgenommen werden. Für nichtlineare und stark korrelierte 

Verteilungen ist sowohl das Likelihoodverhältnis, als auch ein einzelnes künstliches 

Neuron zur Ausgabe einer Test-Statistik ungeeignet. Ein Beispiel einer solchen Verteilung 

im zweidimensionalen Fall ist in Abbildung 5.6 dargestellt. Hier wird augenscheinlich klar, 

dass die beiden Populationen H 0 und H 1 nicht durch eine gerade Linie getrennt werden 

können. 

5.3.2. Multi-Layer-Perzeptron 

Um nichtlineare Probleme zu lösen werden Schichten mehrerer künstlicher Neuronen hintereinander 

geschaltet. Man spricht dann von einem Multi-Layer-Perzeptron (MLP). In der 

ersten Schicht werden die einzelnen n Eingabewerte x i aufgenommen. Die letzte Schicht 

besteht aus einem einzelnen Neuron, welches den Ausgabewert y(x) liefert. Dazwischen 

befindet sich mindestens eine versteckte Schicht 2 aus k Neuronen, die Eingabewerte gemäß 

( 

) 

n∑ 

ϕ j (x) = g w j0 + w ji x i (5.13) 

für jedes Neuron der versteckten Schicht ϕ j transformiert. w j0 sind die Gewichte des Bias. 

Das Ausgabeneuron gibt dann, wie ein einzelnes Neuron mit k Eingangsparametern ϕ j , 

den Ausgabewert entsprechend 

⎛ 

⎞ 

k∑ 

y(⃗ϕ) = ˜g ⎝ ˜w 0 + ˜w j ϕ j ⎠ . (5.14) 

2 engl.: Hidden layer 

i=1 

j=1 

42


Abbildung 5.6.: Beispiel nicht einfacher, durch eine Hyperebene linear separierbarer, Populationen 

H 0 und H 1 im zweidimensionalen Parameterraum der Variablen 

x 1 und x 2 [39]. 

Die Neuronen einer einzelnen Schicht werden dabei jeweils in Vorwärtsrichtung miteinander 

verknüpft, so dass ein sogenanntes Feed-Forward Netzwerk entsteht. Die Topologie 

eines solchen Netzwerkes ist in Abbildung 5.7 dargestellt. Die versteckte Schicht führt 

Bias 

∑ 

i 

w j0 

x i w ji 

∑ ϕ j 

j 

̃w j 

Input 

variables 

x 1 

⋮ 

⋮ 

ϕ j (⃗x) 

y(⃗ϕ) 

x n 

Input 

Hidden 

Layer 

Output 

Node 

Abbildung 5.7.: Multi Layer Perzeptron mit einer versteckten Lage. 

dabei eine Transformation der Eingabewerte nach x 1 , ...x n → ϕ 1 (x), ...ϕ n (x) in einen sogenannten 

Merkmalsraum 3 durch, in dem die Populationen linear separierbar sind. Die 

lineare Separation kann dann vom Ausgabeneuron durchgeführt werden. Prinzipiell sind 

alle Topologien, mit beliebig vielen versteckten Schichten, sowie Neuronen und verschiedenen 

Verbindungen auch in Rückwärtsrichtung, denkbar. Ein Feed-Forward Netzwerk mit 

nur einer versteckten Schicht ist jedoch für die meisten Separationsprobleme ausreichend. 

Aufgabe ist es nun die Gewichte w ij zu bestimmen, die die Eigenschaften der Transformation 

x → ⃗ϕ(x), sowie die Hyperebene zur Trennung der Populationen festlegen. Diese 

Anpassung der Gewichte an die Signal- und Untergrundverteilungen des Separationspro- 

3 engl.: Feature space 

43


blems wird als Training bezeichnet. 

5.3.3. Training des neuronalen Netzes 

Um ein neuronales Netzwerk für Separationsprobleme zu verwenden greift man üblicherweise 

auf überwachte Trainingsmethoden zurück. Bei solchen Methoden wird eine Auswahl 

an Trainingsereignissen mit den Eingangsparametern x benötigt, deren Zugehörigkeit zur 

Population Signal oder Untergrund bekannt ist. Man ordnet diesen Ereignissen einem Zielwert 

entsprechend ihrer Natur zu, der den Wert widerspiegelt, den das Netzwerk idealer 

weise für diese Eingabewerte ausgeben soll. Beispielsweise kann dies 1 für Signalereignisse 

und 0 für Untergrundereignisse sein. Um eine solche Trainingsauswahl zu erhalten, wird 

entweder auf Monte Carlo Simulationen oder auf Daten, die man mit Sicherheit einem 

Ereignis zuordnen kann, zurück gegriffen. Im Folgenden wird für diese Auswahl an Trainingsereignissen 

der gebräuchliche Begriff Trainingssample aus dem Englischen verwendet. 

Die einzelnen Ereignisse k des Trainingssamples werden nun iterativ an das Netzwerk gegeben 

und dessen Ausgabewert y(x) mit dem Zielwert t verglichen. Aus den einzelnen 

Abweichungen wird dann die Fehlerfunktion nach der Summe der Residuenquadrate 

E(w) = 1 2 

N∑ 

|y(x k , w) − t k | 2 = 

k=1 

N∑ 

E k (w) (5.15) 

gebildet, wobei N die Anzahl der Trainingsereignisse ist. Die einzelnen Gewichte werden 

nun bei jedem Durchgang angepasst und der Vorgang wiederholt. Die Art und Weise wie 

die Gewichte angepasst werden, wird als Fehlerrückführung oder auch Backpropagation 

bezeichnet. Dabei werden die errechneten Fehler wieder rückwärts durch das Netzwerk 

übertragen und die Gewichte nach 

k=1 

∂E k 

∂w ij 

= δ j g(a i ) = ∆w ij (5.16) 

den Korrekturfaktor als Fehler eines Neurons nach der Rück- 

angepasst, wobei δ j = ∂E k 

∂a j 

führungs-Formel 

δ j = g(a j ) ∑ l 

w kj δ l (5.17) 

gibt [40]. Dabei bezeichnet l den Index des direkt vorangegangenen Neurons und a i ist die 

Eingabe ins entsprechende Neuron, also hier x i oder ϕ j . 

Das Vorgehen nach dem Backpropagation Verfahren garantiert, dass die Fehlerfunktion 

mit jeder Iteration kleiner wird und damit das Netzwerk die Populationen besser unterscheiden 

kann. Man spricht deshalb von einem Lernprozess, der vom neuronalen Netzwerk 

durchlaufen wird. Das Training entspricht dann einem Minimierungsprozess, bei dem die 

Fehlerfunktion 5.15 als Funktion der Gewichte w ij minimiert wird. Dabei soll das Netzwerk 

im Minimum der Fehlerfunktion noch eine gewisse Fähigkeit zur Generalisierung 

besitzen. Das bedeutet, dass Ereignisse, deren Parameterzusammensetzung nicht exakt 

der eines gelernten Ereignisses entsprechen, noch korrekt eingeordnet werden können. Diese 

Forderung stellt eine Grenze der idealen Anzahl an Trainingsiterationen dar. Werden zu 

viele Trainingsiterationen auf immer das gleiche Trainingssample durchgeführt, folgt das 

Netzwerk dessen charakteristischen Fluktuationen und verliert die Fähigkeit zur Generalisierung. 

Dieser Vorgang wird als Übertraining bezeichnet. Gebräuchlicher sind jedoch die 

englischen Begriffe Overtraining oder Overfitting. Der Einfluss von Overtraining auf die 

Separationsgrenze ist für den zweidimensionalen Fall in Abbildung 5.8 dargestellt. Man 

sieht wie im Falle von Overtraining die Separationsgrenze jeder Fluktuation im Trainingssample 

folgt. 

Um Overtraining zu verhindern wird in der Regel ein Teil des Trainingssamples dazu verwendet, 

die Generalisierungsfähigkeit des neuronalen Netzwerks an einer unabhängigen 

44


Abbildung 5.8.: Separationsgrenzen für zwei Populationen im zweidimensionalen Parameterraum 

von x 1 und x 2 mit guter Generalisierungsfähigkeit (links) und 

nach Overtraining (mitte). Rechts ist das Verhalten der Fehlerfunktion im 

Falle von Overtraining dargestellt [39]. 

Auswahl von Ereignissen zu testen. Dieses wird als Testsample bezeichnet. Bei einer guten 

Generalisierungsfähigkeit sollte die Performance, gemessen durch die Fehlerfunktion, für 

das Trainingssample und das unabhängige Testsample gleich gut sein. Nimmt die Generalisierungsfähigkeit 

ab, wird der Fehler auf das Trainingssample weiter kleiner, da für 

diese spezielle Auswahl die Trennung besser wird, wie in Abbildung 5.8 im Falle des Overtrainings 

zu ersehen ist. Im unabhängigen Testsample, welches diesen Fluktuationen nicht 

unterliegt, wird der Fehler größer. Dieses Verhalten ist in Abbildung 5.8 rechts gezeigt. An 

der Stelle, an der die Fehlerfunktionen auseinander laufen, sollte kein weiterer Trainingsdurchlauf 

durchgeführt werden. Ein Nachteil dieser Methode Overtraining zu verhindern 

ist, dass nicht alle Ereignisse des Trainingssamples für das Training verwendet werden 

können, was bei kleinen Trainingssamples zu Performanceverlusten führen kann. 

5.3.4. Die NeuroBayes R○ Software 

NeuroBayes R○ ist eine Softwarelösung zur Erstellung eines Feed Forward Netzwerkes. Entwickelt 

wurde die Software am Karlsruhe Institut für Technologie (KIT) zur Ereignis- 

Selektion in der Hochenergiephysik, wobei sie über die Jahre weiterentwickelt wurde und 

schließlich zur Verwendung in der Wirtschaft im Unternehmen GmbH ausgegliedert 

wurde. Dadurch ist NeuroBayes R○ eine lizenzierte Software deren Quellcode damit 

weder einseh- noch veränderbar ist. Trotzdem findet die Software auch weiterhin im 

wissenschaftlichen Bereich Verwendung, wobei die Anpassung der Software an das Analyseziel 

durch das Setzen von Bitschaltern 4 bewerkstelligt wird. Die Software verknüpft 

dabei Methoden der Bayes Statistik und neuronaler Netzwerke und bietet dabei einen internen 

Schutz vor Overtraining [41]. Mithilfe der Bayes Statistik kann eine Definition des 

Wahrscheinlichkeitsbegriffs gegeben werden, der eine Aussage über sogenannte bedingte 

Wahrscheinlichkeiten P (A|B) macht. Die bedingte Wahrscheinlichkeit gibt dabei eine 

Wahrscheinlichkeit an, das Ereignis A zu beobachten, unter der Voraussetzung das Ereignis 

B bereits beobachtet wurde. Dabei ist die bedingte Wahrscheinlichkeit der Quotient aus 

der Schnittmenge der Wahrscheinlichkeit für A und B, normiert auf die Wahrscheinlichkeit 

für B, da dieses Ereignis per Definition aufgetreten ist 

P (A|B) = 

P (A ∩ B) 

. (5.18) 

P (B) 

4 engl.: Flag 

45


Daraus folgt direkt aus der Umkehrbarkeit des Terms der Schnittmenge P (A ∪ B) = 

P (B ∪ A) 

P (B|A) · P (A) 

P (A|B) = . (5.19) 

P (B) 

Gleichung 5.19 wird Bayes Theorem genannt und stellt eine Verknüpfung zwischen den 

beiden Ereignissen A und B her [38]. Der Term P (B|A) wird als Likelihood bezeichnet 

und stellt die Messgrundlage dar. P (A) wird Prior genannt und bietet eine Möglichkeit 

Vorwissen in die statistische Auswertung einfließen zu lassen. P (B) stellt eine Normierungskonstante 

dar. Das Ergebnis P (A|B) wird dann als Posteriori Wahrscheinlichkeit 

bezeichnet. 

Mithilfe der Bayes Statistik kann eine Interpretation der Ausgabe eines neuronalen Netzwerks 

mit Sigmoid Aktivierungsfunktion gegeben werden. Betrachtet man zwei gaussförmig 

verteilte Populationen H 0 und H 1 im Parameterraum mit d Dimensionen um ⃗µ 0,1 und 

deren Kovarianzmatrix ∑ nach 

( 

1 

P (x|H 0,1 ) = 

(2π) d/2 | ∑ | 1/2 · exp − 1 2 (x − ⃗µ 0,1) T ∑ ) 

−1 

(x − ⃗µ0,1 ) (5.20) 

und betrachtet die Wahrscheinlichkeit der Zugehörigkeit zu H 0 mit Bayes Theorem 

P (H 0 |x) = 

so erhält man mit der Substitution 

P (x|H 0 )P (H 0 ) 

P (x|H 0 )P (H 0 ) + P (x|H 1 )P (H 1 ) , (5.21) 

a = ln P (x|H 0)P (H 0 ) 

P (x|H 1 )P (H 1 ) 

(5.22) 

aus Gleichung 5.21 die Sigmoid Funktion 

P (H 0 |x) = 

1 

. (5.23) 

1 + e−a Für die Substitution in Gleichung 5.22, die dem Liklihoodverhältnis aus Gleichung 5.8 

entspricht, erhält man mit 5.20 

a = w T x + w 0 (5.24) 

mit 

w 0 = − 1 2 ⃗µT 0 

∑ −1⃗µ0 

+ 1 2 ⃗µT 1 

w = ∑ −1 

(⃗µ0 − ⃗µ 1 ) (5.25) 

∑ −1⃗µ1 

+ ln P (H 0) 

P (H 1 ) . (5.26) 

Damit kann die Ausgabe eines neuronalen Netzwerks mit Sigmoid Aktivierungsfunktion 

als Posterior Wahrscheinlichkeit nach Bayes Theorem interpretiert werden [40]. Man erhält 

damit nicht nur eine einfache Separation, sondern eine Wahrscheinlichkeit für ein Ereignis, 

vom Typ H 0 oder H 1 zu sein. 

In der NeuroBayes R○ Software werden Bayes Methoden außerdem im Preprocessing angewandt. 

Hier werden die Eingangsparameter zur optimalen Verwendung im neuronalen 

Netz vorbereitet. 

Die NeuroBayes R○ Software ist zur Verwendung in zwei Teile geteilt. Zum einen existiert 

der NeuroBayes R○ Teacher, mit dem ein Netzwerk aufgebaut und trainiert werden kann. 

Das trainierte Netzwerk wird dann abgespeichert und kann über den NeuroBayes R○-Expert 

aufgerufen und für Analyseaufgaben verwendet werden. 

46

6. Das neuronale Netzwerk für den 

Übergangsstrahlungsdetektor 

Für die Trennung von Positronen und Protonen mit Hilfe des Übergangsstrahlungsdetektors 

wurde die an der Universität Karlsruhe entwickelte und in 5.3.4 vorgestellte Software 

NeuroBayes R○ zur Erstellung eines neuronalen Netzwerks genutzt. Dafür wird in der Zusammenstellung 

des Trainingssamples auf Flugdaten zurückgegriffen, die die realen Verhältnisse 

im Detektor besser wiedergeben als es mit Monte-Carlo Daten möglich wäre. 

Dabei wird die Redundanz der AMS-02 Subdetektoren ausgenutzt und Trainingsdaten 

mit dem elektromagnetischen Kalorimeter selektiert. Für diese Arbeit wurden Daten vom 

20. Mai 2011 bis zum 1. November 2012 verwendet, was in etwa 24 Milliarden Triggern 

entspricht. 

6.1. Selektion des Trainingssamples 

Die Schwierigkeit in der Zusammenstellung eines Ereignissamples mit dem das neuronale 

Netzwerk trainiert werden kann liegt darin, dass Trainingssamples einerseits sehr rein sein 

müssen und andererseits in der Selektion keine Variablen verwendet werden dürfen auf die 

später auch das Netzwerk trainiert werden soll. Die Reinheit ist wichtig, da im Falle eines 

kontaminierten Samples das Netzwerk auf verfälschten Informationen trainiert wird. Die 

Unabhängigkeit der Selektion des Trainingssamples von den Netzwerkvariablen muss gewährleistet 

sein, da ansonsten die Verteilung der Trainignsvariablen verfälscht wird. Hierzu 

kann die Redundanz der AMS-02 Subdetektoren ausgenutzt werden. Im Falle des TRDs 

kann das von diesem unabhängig arbeitende elektromagnetische Kalorimeter zur Einteilung 

der Daten in Trainingssamples verwendet werden. Selektiert und für das Training 

verwendet werden dabei Protonen und Elektronen anstelle von Positronen. Elektronen 

und Positronen können vom Übergangsstrahlungsdetektor nicht unterschieden werden, da 

weder deponierte Ionisationsenergie nach Gleichung 4.4, noch die gemessene Intensität 

der Übergangsstrahlung nach Gleichung 4.1 vom Ladungsvorzeichen abhängen. Elektronen 

kommen in der kosmischen Strahlung, wie in Teil 2.1 gezeigt wurde, in etwa um einen 

Faktor 10 häufiger vor und sind durch das unterschiedliche Ladungsvorzeichen sicherer 

vom Protonenuntergrund zu unterscheiden. So kann mit Hilfe des elektromagnetischen 

Kalorimeters eine ausreichend große und sichere Trainingsauswahl definiert werden. Dieses 

Vorgehen ist in Abbildung 6.1 noch einmal schematisch dargestellt. 

Um aus allen von AMS aufgenommenen Triggern nur für die Analyse relevante Ereignis- 

47

48 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor 

Abbildung 6.1.: Schematische Skizze zur Vorgehensweise zum Trainieren eines neuronalen 

Netzwerkes mit Flugdaten [42]. 

se auszuwählen, muss dabei zunächst eine generelle Vorauswahl 1 getroffen werden, bevor 

man bestimmte, für die Proton-Positron Trennung geeignete, Ereignisse auswählt 2 und 

diese dann mit Hilfe des Kalorimeters zu Proton oder Elektron bestimmt 3 . Ziel ist es ein 

möglichst reines Datensample zu erhalten. 

6.1.1. Preselection und Selection 

In der Vorselektion werden Trigger nach ihrer generellen Tauglichkeit bewertet und für 

eine Analyse ungeeignete, wie zum Beispiel falsch rekonstruierte Ereignisse, entfernt. Dabei 

muss eine Variable gefunden werden, mit der der Schnitt auf ungeeignete Ereignisse 

durchgeführt werden kann ohne dabei ebenfalls gute Ereignisse zu verwerfen und damit die 

Menge an Daten zu sehr zu beschneiden. Die für die Selektion des Trainingssamples angewandten 

Schnitte sollten denen einer späteren Analyse entsprechen, um nicht unbewusst 

Korrelationen zwischen den Variablen einzubringen oder zu verwerfen. Eine Übersicht 

der angewandten Bedingungen und deren Effizienz ist in Abbildung 6.2 gegeben. Auf die 

einzelnen Schnitte wird im Folgenden näher eingegangen. Die angegebene Effizienz gibt 

dabei den Anteil der in diesem Schritt beibehaltenen Ereignisse an. Um die Stärke eines 

Schnittes abzuschätzen muss diese mit 1−Effizienz umgerechnet werden. Der Einfluss der 

einzelnen Schnitte auf die gesamte Triggermenge ist in Abbildung 6.3 dargestellt. In den 

beiden Abbildungen 6.2 und 6.3 kennzeichnet Global eine generelle Selektion nach der 

Vollständigkeit von Ereignissen. In Badrun und Science werden Runs mit speziellen Markierungen 

verworfen. Diese werden gesetzt um Runs zu kennzeichnen, bei denen besonders 

viele Hardwarefehler vorkamen, oder Detektoroperationen wie ein gas refill durchgeführt 

wurden. Einzelne Ereignisse mit Hardwarefehlern werden mit dem mit HW gekennzeichneten 

Schnitt entfernt. LiveTime kennzeichnet einen Schnitt auf den Anteil der Zeit, in 

der der Trigger inaktiv war, von größer 0, 65 um Regionen großen Teilchenflusses wie die 

Südatlantische Anomalie und teilweise die Polregionen auszuschließen. Dort können Ereignisse 

aufgrund des hohen Teilchenflusses und der daraus resultierenden hohen Signaldichte 

nur schlecht rekonstruiert werden. Ereignisse außerhalb der rekonstruierten relativistischen 

Geschwindigkeit 0, 6 < β < 1, 4 werden ebenfalls entfernt, wobei physikalisch unsinnige 

relativistische Geschwindigkeiten von größer 1 den hohen Bewegungsenergien der Teilchen 

geschuldet sind, aber als Trigger durchaus ihre Berechtigung haben. Bei dieser mit Beta 

gekennzeichneten Bedingung werden auch Teilchen, die sich von unten nach oben durch 

den Detektor bewegen entfernt, was Teilchen, die aus der unter dem Detektor liegenden 

Atmosphäre reflektiert oder dort erzeugt werden, ausschließt. Des Weiteren wird eine 

Spurrekonstruktion (TrTrack) vorausgesetzt und ein rekonstruierter Schauer im elektromagnetischen 

Kalorimeter (EcalShr), um eine Teilchenidentifizierung vornehmen zu können. 

1 engl.: Preselection 

2 engl.: Selection 

3 engl.: Tagging 

48

6.1. Selektion des Trainingssamples 49 

Abbildung 6.2.: Effizienz der angewandten Bedingungen bezüglich des vorangegangen 

Schnittes. Die Beschreibungen der einzelnen Schnitte sind im Text zu 

finden. 

Diese Forderung ist aufgrund der geringen Akzeptanz des elektromagnetischen Kalorimeters 

besonders stark und entfernt mit etwa 82, 6% die meisten Ereignisse. Außerdem wird 

verlangt, dass sich keines der Solarpanele, die die ISS mit Strom versorgen, im Sichtfeld 

des Detektors befindet (Shadow), um Sekundärteilchen auszuschließen. Mit SubD Acceptance 

wird geprüft ob die Spurrekonstruktion eine gewisse Minimalgüte erfüllt und sich 

der Schauer im Kalorimeter in einem gewissen Akzeptanzvolumen innerhalb des Kalorimeters 

befindet, um Energieverluste des Schauers am Rand auszuschließen. Für ein gutes 

Ereignis im Übergangsstrahlungsdetektor (GoodTrd) wird verlangt, dass die rekonstruierte 

Spur den Subdetektor vollständig passiert und eine gesamte Pfadlänge in den Proportionaldrahtkammerröhrchen 

von mehr als 7 cm gemessen wurde. Zum Schluß wird in Match 

überprüft, ob die Richtungsrekonstruktionen der einzelnen Subdetektoren zusammenpassen. 

Nach der Vorauswahl, die mit Preselection gekennzeichnet ist, sind nur noch etwa 3, 9% 

der Triggerereignisse übrig. Die verwendete Vorauswahl geht auf einen Analysevorschlag 

zum Positronenanteil zurück. Nun folgt eine analysebezogene Auswahl von Ereignissen. 

Dabei werden Ereignisse verworfen, die für eine spezielle Aufgabe nicht geeignet sind, da 

sie zum Beispiel nicht im geforderten Energieintervall liegen, das hier den Rigiditätsbereich 

von 2 − 300 GV umfasst und mit RigRange gekennzeichnet ist. Außerdem wird auf Ereignisse 

geschnitten, deren Rekonstruktionsqualität nicht für eine Analyse des Ereignisses 

ausreicht, was mit einem Schnitt auf die Größe Chi zum Quadrant für die rekonstruierte 

Teilchenspur von kleiner 10 und auf dessen Projektion in die für die Ladungsrekonstruktion 

entscheidende Y-Z-Ebene von kleiner 8 (TrChi2 ), sowie einem Schnitt auf mindestens 

12 Treffer im Übergangsstrahlungsdetektor (TrdPart) selektiert wird. Zusätzlich wird das 

Sample auf Ereignisse mit rekonstruierter Ladung von Z = 1 oder Z = 2 reduziert (Charge). 

So bleiben etwa 381 Millionen Ereignisse zur Analyse übrig. 

49


Abbildung 6.3.: Verbleibender Anteil des Triggersamples nach jeder der angewandten 

Bedingungen. 

6.1.2. Elektronen und Protonen Selektion 

Um nun Elektronen und Protonen zu selektieren wird wie beschrieben auf das elektromagnetische 

Kalorimeter zurückgegriffen. Hierfür wird in der AMS Software eine multivariate 

Analysemethode in Form eines vervielfachten Entscheidungsbaumes (BDT 4 ) bereit 

gestellt, der anhand von Kalorimetervariablen eine Einteilung in elektron-, bzw. positronähnliche 

Ereignisse vornimmt. Ein Entscheidungsbaum führt dabei pro Entscheidungsebene 

eine Entscheidung anhand einer einzelnen Variable in Richtung Signal oder Untergrund 

aus [43]. Die einzelnen Entscheidungsebenen folgen dabei hierarchisch aufeinander. 

Dadurch wird der Parameterraum in einzelne Regionen geteilt, die Signal- oder Untergrundcharakter 

haben. Eine schematische Darstellung eines Entscheidungsbaumes ist in 

Abbildung 6.4 links gezeigt. Beim Boosting werden dabei mehrere Entscheidungsbäume 

trainiert und am Ende des Trainings zusammengefasst. Man spricht dabei von einem Wald. 

Diese Methode soll das Training gegenüber Fluktuationen im Trainingssample robust machen. 

Die Ausgabe des boosted decision trees für das elektromagnetische Kalorimeter in 

der AMS Software, für eine Auswahl von Leptonen und Protonen aus Flugdaten, ist in 

Abbildung 6.4 rechts gezeigt. Dort ist außerdem der Schnitt für Elektronen- und Protonenselektion 

eingezeichnet. Eine wichtige Entscheidungsvariable außerhalb des TRD ist der 

Anteil an im elektromagnetischen Kalorimeter deponierter Energie von der Gesamtenergie 

des Teilchens. Wie in Teil 3.7 beschrieben, deponieren Leptonen nahezu ihre gesamte 

Energie im Kalorimeter, während Protonen nur wenig Energie deponieren. Gemessen wird 

dieses Verhältniss aus der gemessenen deponierten Energie im Kalorimeter und der Rigidität, 

die für Teilchen mit Ladung Z = 1 der Bewegungsenergie entspricht. Bei Energien 

im GeV Bereich ist die Bewegungsenergie der dominante Anteil der Gesamtenergie von 

Protonen und Elektronen. Damit ist die Rigidität in erster Nährung ein Maß für die Gesamtenergie 

eines Teilchens mit Ladung Z = 1. Draus folgt, dass dieses sogenannte E/P 

Verhältnis für Leptonen etwa gleich 1 ist und für Protonen gegen 0 tendiert. Die Vertei- 

4 engl.: Boosted Decision Tree 

50

6.2. Eingangs-Variablen 51 

Abbildung 6.4.: Schematische Darstellung eines Entscheidungsbaumes, der Ereignisse mit 

Paramtern x in Signal S und Untergrund B anhand von Einzelentscheidungen, 

einteilt (links) [43] und Ausgabe des BDT in der AMS Software 

für Leptonen und Protonen, selektiert mit dem TrdQt Likelihoodverhältnis 

(rechts). 

lung dieser Variable ist in Abbildung 6.5 für eine Auswahl von Leptonen und Protonen aus 

Flugdaten, selektiert mit der TrdQt Likelihood gezeigt. Um Protonen zu selektieren wird 

verlangt, dass diese Variable kleiner 0, 4 ist und für Leptonen zwischen 0, 7 und 10, 0 liegt. 

Die mit dem Spurdetektor rekonstruierte Ladung soll sowohl für Leptonen, als auch für 

Protonen zwischen 0, 5 und 1, 5 liegen. Um eine Verunreinigung von Helium im Protonensample 

zu vermeiden, wird noch ein Schnitt auf die im Flugzeitdetektor deponierte Energie 

angewandt, die proportional zur Ladung im Quadrat ist. Dabei soll die durchschnittliche 

deponierte Energie in den vier Lagen kleiner als 4, 0 MeV sein und das Maximum 5, 0 MeV 

nicht überschreiten. Das Entfernen von Helium ist besonders wichtig, da es im elektromagnetischen 

Kalorimeter Protonen ähnlich sieht und als solches gekennzeichnet wird. Im 

Übergangsstrahlungsdetektor ist Helium jedoch durch seine hohe Ionisationsenergie nur 

schwer von Leptonen zu unterscheiden, so das ein Untergrund durch Helium das Training 

und spätere Analysen massiv verfälscht. Für die Auswahl von Positronen in den Abbildungen 

6.2 und 6.3 gelten die Kriterien für Elektronen mit positivem Ladungsvorzeichen. 

Für Helium wird verlangt, dass die mit dem Spurdetektor rekonstruierte Ladung zwischen 

1, 5 und 2, 5 liegt und vom elektromagnetisch Kalorimeter als Lepton zurückgewiesen wird. 

Mit diesen Bedingungen erhält man ein Trainingssample aus etwa 3 Millionen Elektronen 

und 255 Millionen Protonen im Rigiditätsbereich von 2 − 300 GV. 

6.2. Eingangs-Variablen 

Als Eingangs-Variablen für das neuronale Netzwerk des Übergangsstrahlungsdetektors stehen 

vor allem die Energieabgaben in den 20 Lagen zur Verfügung. Diese Energieabgaben 

sind nach Gleichung 4.1 abhängig vom Gammafaktor und somit von der Gesamtenergie 

des Teilchens. Damit ergibt sich eine Abhängigkeit der Eingangsvariablen zur gemessenen 

Rigidität, wie in Abbildung 6.6 am Beispiel von Flugdaten bis 300 GV gezeigt ist. Die 

Energieabgabe von Protonen steigt demnach mit der Energie wie erwartet an. Um diese 

Abhängigkeit zu berücksichtigen, wird die Rigidität als Eingangsvariable mit in das neuronale 

Netzwerk übergeben. Außerdem ist eine Abhängigkeit der Energieabgaben von der 

Gaszusammensetzung in den Proportionaldrahtkammerröhrchen zu erwarten. Der Teildruck 

des Xenongases wird also ebenfalls als Eingabevariable übergeben, um diesen zu 

51


Abbildung 6.5.: Verteilung der EoverP Variable, die das Verhältnis von im Kalorimeter 

deponierter- zur Gesamtenergie eines Teilchens gibt. 

parametrisieren. Zusätzlich wurden noch aus den Energieabgaben zusammengesetzte, sogenannte 

integrierte Variablen getestet. Dazu wurde beispielsweise der RMS 5 oder der 

gestutzte Mittelwert der Energieabgaben betrachtet. Solche Variablen haben für sich alleine 

genommen gute Separationseigenschaften, allerdings tragen sie eventuell vorhandenen 

Korrelationen zwischen den einzelnen Lagen keine Rechnung und berauben dem neuronalen 

Netzwerk damit seiner potentiellen Vorteile gegenüber dem Likelihoodverhältnis. 

In Abbildung 6.7 ist ein Vergleich zwischen neuronalen Netzwerken mit unterschiedlichen 

Eingangsvariablen zu sehen. Dabei steht Int für das Set integrierter Variablen, Lay für die 

Energieabgaben in jeder Lage, Rig für die Rigidität des Teilchens, Beta für die relativistische 

Geschwindigkeit und Xe für den Teildruck des Xenongases. Außerdem wurde noch 

der Einfallswinkel des Teilchens zur z-Achse im Übergangsstahlungsdetektor als Eingangsvariable 

Theta und die geographische Breite Lat getestet. Die zum Vergleich verwendete 

Größe ist dabei die Protonenunterdrückung Rej 6 , die als Kehrwert der Effizienz Protonen 

als Signal zu selektieren nach 

Rej = 1 ε p 

(6.1) 

definiert ist. Die Protonenunterdrückung gibt damit an, auf wie viele Protonen im Durchschnitt 

eins als Signal falsch identifiziert wird. Die Protonenunterdrückung ist abhängig 

von der Signaleffizienz, die angibt wie viele Leptonen auch als solche erkannt werden. Als 

Vergleichsgröße ist die Protonenunterdrückung gut geeignet, da sie bei gegebener Entscheidungsgrenze 

nur mit Informationen der Protonenverteilung errechnet werden kann und 

nicht, wie beispielsweise die Reinheit, vom Verhältnis der Protonen- zur Leptonenanzahl 

abhängt, so dass diese normiert werden müssten. Die verschiedenen Netzwerke erreichen 

bei einer Signaleffizienz von 90% eine Protonenunterdrückung von der Größenordnung 10 3 . 

Die vielversprechendsten Variablenkonfigurationen sind dicker gezeichnet. Dabei scheint 

vor allem die Variablenkonfiguration mit den Energiedepositionen der einzelnen Lagen, 

sowie Rigidität, relativistische Geschwindigkeit, Teildruck des Xenongases und dem Einfallswinkel 

in den Übergangsstrahlungsdetektor, sowie der geographischen Breite eine gut 

5 engl.: Root mean squared 

6 engl.: Rejection 

52



3 

10 

10 

2 

-3 

10 

-4 

10 

-5 

10 


3 

10 

10 

2 

-3 

10 

10 -4 

-5 

10 

-6 

10 

-6 

10 

10 

2 

10 

Rigiditat/GV 

10 -7 

10 

2 

10 

Rigiditat/GV 

10 -7 

Abbildung 6.6.: Energieabgabe in Lage 6 über der Rigidität bis 300 GV für Protonen 

(links) und Elektronen (rechts). In schwarz ist die durchschnittliche Energieabgabe 

gezeigt (zut Interpretation sollte die logarithmisch gezeichnete 

y-Achse beachtet werden. Die Energieabgabe über 10 2 ADC stellt also 

einen signifikanten Anteil des Mittelwertes dar). 

geeignete zu sein. Für Vergleiche von Separationsmethoden ist außerdem der Verlauf der 

Protonenunterdrückung mit der Rigidität des Teilchens entscheidend. Dazu wird die Signaleffizienz 

auf 90% fixiert und der Schnittwert t cut für jeden Bin in der Rigidität separat 

mit 90% Signaleffizienz ermittelt. Zur Fehlerbetrachtung wird der statistische Fehler auf 

die Protoneneffizienz σ εp mit 

√ 

σ Rej = 

√( 

∂Rej 

∂ε p 

) 2 

σε 2 p 

= 1 ε 2 σ εp (6.2) 

p 

auf die Protonenunterdrückung fortgepflanzt. Der statistische Fehler auf die Protoneneffizienz 

wird dabei von der Root Klasse TEfficiency mit Methoden der Bayes Statistik nach 

[44] mit uniformem Prior zwischen 0 und 1 ermittelt und ist asymmetrisch. Die Rigiditätsabhängigkeit 

der neuronalen Netze aus Abbildung 6.7 ist in Abbildung 6.8 gezeigt. 

Hier ist zu sehen, dass Variablenkonfigurationen mit hoher Protonenunterdrückung aus 

Abbildung 6.7 nur eine sehr hohe Unterdrückung bei geringer Rigidität aufweisen, wo der 

Schwerpunkt des Trainingssamples liegt. Bei höheren Rigiditäten sticht vor allem die Variablenkonfiguration 

mit den integrierten Variablen heraus, da deren Verteilung mit der 

Rigidität aufgrund geringerer Fluktuationen einfacher zu parametrisieren sind. 

Für niedrige Energien ist die relativistische Geschwindigkeit β, gemessen durch den Flugzeitdetektor, 

eine zusätzliche Variable, die bei der Unterscheidung von Protonen und Leptonen 

helfen kann. Protonen mit einer deutlich höheren Masse werden erst bei größeren 

Energien relativistisch als die leichteren Elektronen und Positronen. Dies ist in Abbildung 

6.9 dargestellt, wo die rekonstruierte relativistische Geschwindigkeit über der gemessenen 

Rigidität bis 300 GV für Protonen (links) und Elektronen (rechts) aufgetragen ist. 

Protonen werden erst bei etwa 5 GV vollkommen relativistisch. Elektronen sind bereits 

bei der unteren Grenze von 2 GV relativistisch. Um diese Information zu nutzen wurde das 

neuronale Netzwerk in zwei rigiditätsabhängige Teile getrennt. Ein Teil wird mit Ereignissen 

bis 5 GV trainiert und enthält die relativistische Geschwindigkeit als Eingangsvariable 

und ein Teil von 5 − 300 GV wird mit der Rigidität trainiert. Ein Vergleich der Protonenunterdrückung 

mit der Rigidität von geteilt trainierten neuronalen Netzen von 2 − 5 

GV und 5 − 300 GV, sowie des im gesamten Rigiditätsbereich von 2 − 300 GV trainierten 

Netzes ist in Abbildung 6.10 zu sehen. Außerdem wurde der Bereich von 5 − 300 GV 

bei 16 GV ein weiteres mal unterteilt. Die Entscheidung zur Unterteilung bei 16 GV ist 

dabei statistisch motiviert. Für das Netzwerk im gesamten Rigiditätsbereich wurde das 

53


Protonenunterdruckung 

4 

10 

3 

10 

2 

10 

Int+Rig+Xe+Theta 

All 

Lay Only 

Lay+Xe 

Lay+Rig 

Lay+Rig+Xe 

Lay+Rig+Xe+Theta 

Lay+Rig+Xe+Theta+Beta 

Lay+Rig+Xe+Theta+Lat+Beta 

0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1 

Signal Effizienz 

Abbildung 6.7.: Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration 

der Eingangsvariablen gegen die Signaleffizienz. 


3 

10 

10 

2 

Int+Rig+Xe+Theta 

All 

Lay Only 

Lay+Xe 

Lay+Rig 

Lay+Rig+Xe 

Lay+Rig+Xe+Theta 

Lay+Rig+Xe+Theta+Beta 

Lay+Rig+Xe+Theta+Lat+Beta 

10 

2 

10 

Rigiditat/GV 

Abbildung 6.8.: Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration 

der Eingangsvariablen mit der Rigidität des Teilchens. 

54


Beta 

1.4 

1.3 

5 

10 

Beta 

1.4 

1.3 

10 4 

1.2 

1.1 

10 4 

1.2 

1.1 

3 

10 

1 

0.9 

0.8 

3 

10 

2 

10 

1 

0.9 

0.8 

10 2 

10 

0.7 

10 

0.7 

0.6 

10 

2 

10 

Rigiditat/GV 

1 

0.6 

10 

2 

10 

Rigiditat/GV 

1 

Abbildung 6.9.: Relativistische Geschwindigkeit über der Rigidität bis 300 GV für Protonen 

(links) und Elektronen (rechts). In schwarz ist die der Verlauf des 

Durchschnitts gezeigt. 


3 

10 

2-5 GV 

5-300 GV 

2 

10 

2-300 GV 

5-16 GV & 16-300 GV 

10 

2 

10 

Rigiditat/GV 

Abbildung 6.10.: Protonenunterdrückung neuronaler Netze, trainiert in unterschiedlichen 

Energiebereichen. 

Netzwerk mit der höchsten Protonenunterdrückung nach Abbildung 6.7 verwendet. Man 

erkennt bei niedrigen Energien eine leichte Verbesserung durch die Unterteilung, sowie eine 

signifikante Verbesserung bei Energien ab 10 GV. Die zusätzliche Unterteilung bei 16 GV 

bringt hingegen keine weitere Verbesserung. Dies mag am Mangel an Trainingsereignissen 

im Rigiditätsbereich von 16 − 300 GV liegen. 

Im Folgenden wird im Rigiditätsbereich von 2 − 5 GV das Netzwerk mit den Eingangsvariablen 

Energieabgabe, relativistische Geschwindigkeit, Teildruck des Xenongases, sowie 

dem Einfallswinkel des Teilchens zur z-Achse im Übergangsstrahlungsdetektor trainiert. 

Für den Rigiditätsbereich von 5 − 300 GV werden als Eingangsvariablen die Energieabgaben 

in jeder Lage, der Teildruck des Xenongases, die Rigidität und der Einfallswinkel 

zur z-Achse des Teilchens im Übergangsstrahlungsdetektor verwendet. Die Eingangsgrößen 

Gasdruck und Einfallswinkel im TRD sind dabei nicht rigiditäts-, oder teilchenabhängig 

und werden nur zur Parametrisierung der Energieabgaben ins Netzwerk gegeben. Außerdem 

werden für das Trainingssample im Bereich 5 − 300 GV nur Ereignisse mit einem 

Signal in Lage 1 des Spurdetektors, oberhalb des Übergangsstrahlungsdetektors, verwen- 

55


Abbildung 6.11.: Durchschnittliche Energieabgabe von Protonen (rot) und Leptonen (dunkelblau) 

in den 20 Lagen des Übergangsstrahlungsdetektors mit angedeutetem 

Schnitt auf das Protonensample für die Trainingsauswahl. 

det. Damit kann die für die Berechnung der Energieabgaben benötigte Pfadlänge genauer 

angegeben werden. Getestet wurde das Netzwerk allerdings auch auf Ereignissen ohne 

einen zugeordneten Treffer in Lage 1. 

6.3. Training des neuronalen Netzwerks 

Je mehr Ereignisse des Trainingssamples für das Netzwerktraining verwendet werden können, 

desto besser kann die Verteilung der Eingangsparameter vom Netzwerk nachvollzogen 

und damit deren Separation optimiert werden. Die Anzahl an Trainingsereignissen ist vor 

allem durch die Anzahl an Elektronen als Signalereignisse im Trainingssample begrenzt. 

Diese machen nur etwa 1% der Trainingsdaten aus. Um den Trainingsprozess nicht zu 

sehr durch Protonen als Untergrund zu dominieren, wird nur ein Teil der Protonenauswahl 

verwendet. Um trotzdem ein gutes Trainingsresultat zu erzielen, werden hierfür speziell 

die Protonen herausgefiltert, die nur schwer von Elektronen zu unterscheiden sind 

und damit einen schweren Untergrund darstellen. Um diese nicht direkt anhand der Eingangsvariablen 

zu selektieren und weiterhin den gesamten Parameterraum abzudecken, 

wird die durchschnittliche Energieabgabe in allen Lagen betrachtet. Protonen mit einer 

überdurchschnittlich hohen Energieabgabe im Detektor bilden dann diesen schwer zu unterscheidenden 

Untergrund und werden für das Training verwendet. Die Verteilung der 

durchschnittlichen Energieabgabe bei Protonen und Leptonen aus Flugdaten, selektiert 

mit dem elektromagnetischen Kalorimeter, ist in Abbildung 6.11 gezeigt. Das Netzwerk 

sollte Protonen mit geringer durchschnittlicher Energieabgabe trotzdem einordnen können 

und wird daher auf alle Protonenereignisse getestet. 

6.3.1. Test auf Over-Training 

Um für das Training keine weiteren Daten zu verlieren, soll das Traingssample nicht, wie 

in Teil 5.3.3 beschrieben, aufgeteilt werden, um ein unabhängiges Testsample zu erhalten, 

sondern im Ganzen für das Training verwendet werden. Dabei soll der Trainingsalgorithmus 

innerhalb der Neurobayes R○ Software automatisch stoppen, wenn ein gutes globales 

56

6.3. Training des neuronalen Netzwerks 57 

Minimum der Fehlerfunktion E(w) gefunden ist und damit Over-Training verhindern. Dies 

passiert durch die sogenannte BFGS-Methode 7 , die eine schnelle Möglichkeit bietet ein globales 

Minimum zu finden [40]. Um dies zu testen, wird das Trainingssample in 10 Teile 

geteilt. Jedes dieser Teilsamples wird dann in einer Trainingsprozedur mit den übrigen 

neun Teilsamplen, bei gleichen Trainingseinstellungen, als Testsample verwendet. Es wird 

getestet ob in einem der 10 Trainingsprozeduren Over-Training stattfindet. Ist dies nicht 

der Fall, kann das Netzwerk bei gleichen Trainingseinstellungen mit der gesamten Trainingsauswahl 

trainiert werden ohne Over-Training zu riskieren. 

Um auf Over-Training zu testen, werden die Verteilungen der Ausgabewerte des neuronalen 

Netzwerks für das Test- und das Trainignssample verglichen. Sind die Werte gleich 

verteilt, hat kein Over-Training statt gefunden. Man erhält eine Ausgabe wie sie in Abbildung 

6.12 dargestellt ist für jede der 10 Trainingsprozeduren. Die Verteilung der Residuen 

wird nach 

r = 

t T raining − t T est 

(6.3) 

N T est + N T raining 

gebildet, wobei t T raining,T est der Ausgabewert des Trainings, bzw. des Testsamples für einen 

Bin und N T raining,T est der Inhalt des entsprechenden Bins ist. Die Residuen sollten über 

den möglichen Ausgabewerten zufällig verteilt sein und kein Muster aufweisen. Ist dies der 

Fall können die Verteilungen als gleich angesehen werden. Das ist, wie in Abbildung 6.12, 

für alle Teiltrainings der Fall, so dass man davon ausgehen kann, dass kein Over-Training 

stattfindet. 

6.3.2. Training mit Gewichten 

Eine weitere Möglichkeit das Training des neuronalen Netzwerkes zu optimieren, besteht 

in der Verwendung von Gewichten. Diese stellen eine Größe dar, mit der die Bedeutung 

eines Ereignisses für das Training beschrieben wird. Jedem Trainingsereignis wird dabei 

eine reelle Zahl zwischen 0 und 1 zugeordnet, wobei mit 1 gewichtete Ereignisse besonders 

stark in das Training einfließen und mit 0 gewichtete Ereignisse für das Training nicht 

beachtet werden. Für die Festlegung der Gewichte wird die Netzwerkausgabe nach einer 

Trainingsiteration betrachtet. Die Gewichte werden dann so gesetzt, dass bereits gut eingeordnete 

Ereignisse ein geringes Gewicht für das Training erhalten. Falsch eingeordnete 

Ereignisse erhalten ein hohes Gewicht. Dazu wird der Ausgabewert t des Netzwerks auf 

das Intervall zwischen 0 und 1 transformiert, wobei 1 einem Signal und 0 einem Untergrundereignis 

entspricht. Dann werden die Gewichte g linear nach diesem Ausgabewert 

mit g Sig = 1 − t für Signalereignisse und g Bkg = t für Untergrundereignisse festgelegt, wie 

es in Abbildung 6.13 dargestellt ist. Anschließend kann das Training mit einer gewöhnlichen 

Anzahl an Iterationen durchgeführt werden. Um den Ausgabewert des neuronalen 

Netzwerkes auch weiterhin als Wahrscheinlichkeit im Sinne der Bayes-Statistik nach Teil 

5.3.4 interpretieren zu können, muss eine an das Training anschließende Rückgewichtung 

nach 

t 1 · t 2 

˜t = 

(6.4) 

t 1 t 2 + (1 − t 1 )(1 − t 2 ) 

durchgeführt werden, wobei t 1 der Ausgabewert nach einer Trainingsiteration und t 2 den 

Ausgabewert nach dem zweiten Training, darstellt. Die Methode Gewichte nach diesem 

Vorgehen festzulegen wird als Verstärkung bezeichnet. Der Einfluss der Verstärkung auf die 

Protonenunterdrückung der Netzwerke im Bereich 2−5 GV und 5−300 GV ist in Abbildung 

6.14 gezeigt. Demnach scheint das Training mit Gewichten für das Netzwerk bei niedrigen 

Energien ein Nachteil zu sein und wird daher nicht angewandt. Bei hohen Energien erreicht 

man durch das Verstärken einen kleinen Vorteil. Die Schwierigkeit bei der hier vorgestellten 

Methode liegt in der Stärke der Netzwerke nach bereits einer Trainingsiteration, so dass 

ein Großteil des Trainingssamples zu gering gewichtet wird. 

7 Broyden-Fletcher-Goldfarb-Shanno Methode 

57


Verteilung der Ausgabewerte 

6 

10 

Signal Training 

Signal Test 

Untergrund Training 

5 

10 

Untergrund Test 

4 

10 

3 

10 

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 

Ausgabewerte 

Signal Training To Test Residuals 

0.15 

0.1 

0.05 

0 

-0.05 

-0.1 

-0.15 

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 

Expert Output 

Background Training To Test Residuals 

0.04 

0.02 

0 

-0.02 

-0.04 

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 

Expert Output 

Abbildung 6.12.: Verteilung der Ausgabewerte des neuronalen Netzwerkes für das 

Trainings- und das Testsample aufgeteilt nach Signal und Untergrundereignissen 

(oben). Darunter sind die Residuen der Verteilungen dargestellt. 

58

6.3. Training des neuronalen Netzwerks 59 

-1 

10 

1 

0.8 

Gewichte 

1 

-1 

10 

1 

0.8 

Gewichte 

0.6 

0.6 

-2 

10 

0.4 

-2 

10 

0.4 

-3 

10 

0.2 

-3 

10 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 

Ausgabewert 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 

Ausgabewert 

Abbildung 6.13.: Verteilung der Ausgabewerte von Protonen (links) und Elektronen 

(rechts) nach einer Trainingsiteration mit Gewichtsfunktion (grün). 


3 

10 


3 

10 

Normal 

Verstarkt 

2 2.5 3 3.5 4 4.5 5 

Rigiditat/GV 

Normal 

Verstarkt 

10 

2 

10 

Rigiditat/GV 

Abbildung 6.14.: Vergleich des verstärkten neuronalen Netzwerkes mit dem unverstärkten 

im Bereich von 2 − 5 GV (links) und 5 − 300 GV (rechts). 

6.3.3. Trainingseinstellungen 

In der NeuroBayes R○ Software werden Trainingseinstellungen über das Setzen von Bitschaltern 

getätigt. Damit kann festgelegt werden, wie das Training ablaufen und Eingangsvariablen 

in der Vorprozessierung behandelt werden sollen. In der Vorprozessierung 

werden die Eingangsvariablen für die Verwendung im neuronalen Netzwerk vorbereitet. 

Dabei werden sie mittels einer nichtlinearen Transformation zu einer Gauß-Verteilung mit 

Mittelwert 0 und Varianz 1 transformiert. Dafür wird eine Anpassung an die Verteilung der 

Eingangsvariablen durchgeführt. Danach werden die Verteilungen der Eingangsvariablen 

dekorreliert [41]. In etwa 12% der Fälle kann dem Ereignis keine Energieabgabe in einer 

Lage zugeordnet werden. Die NeuroBayes R○ Software schließt solche fehlenden Energieabgaben 

von der Anpassung aus und gibt sie als Nullinformation an des Netzwerk weiter. 

Des Weiteren werden die Eingangsvariablen nach ihren Separationseigenschaften sortiert 

und für die Unterscheidung von Signal und Untergrund irrelevante Variablen entfernt. 

Für die Trennungseigenschaften des neuronalen Netzwerks sind außerdem die Menge an 

Neuronen in der versteckten Schicht wichtig. Durch diese wird die Kapazität des neuronalen 

Netzwerks bestimmt. Sind zu viele Neuronen in der versteckten Schicht, tendiert das 

Netzwerk zum Over-Training und verliert seine Eigenschaft zur Generalisierung. Wenige 

Neuronen führen wiederum zu einer zu starken Vereinfachung der Parameterverteilung. 

Für N Eingangsvariablen werden N + 2 Neuronen in der versteckten Schicht verwendet. 

Zusätzlich kann die Trainingsgeschwindigkeit festgelegt werden, die die Schrittweite bei 

der numerischen Minimierung der Fehlerfunktion E(w) festlegt. Diese wird bei 1.0 und 

damit der Grundeinstellung belassen. Die Zahl der Trainingsiterationen wird nicht fixiert, 

59

100% Signal-ähnlich 


so das Trainingsiterationen durchgeführt werden, bis der BFGS-Algorithmus das Training 

beendet. Da bei dem großen Trainingssample und der starken Separationseigenschaften 

der Einganvsvariablen bereits in der ersten Trainingsiteration ein Großteil der Parameterverteilung 

gelernt wird, wird dieser Punkt bereits nach etwa 6 − 8 Iterationen erreicht. 

6.4. Ausgabe des neuronalen Netzwerkes 

Die Ausgabe des neuronalen Netzes kann nach Teil 5.3.4 als Wahrscheinlichkeit interpretiert 

werden. In der NeuroBayes R○ Software wird die Ausgabe so gewählt, dass Ausgabewerte 

zwischen −1 und +1 liegen. Ein Wert bei +1 kann dann als 100%ige Wahrscheinlichkeit 

für ein Signalereignis aufgefasst werden, Werte bei −1 als 100%ige Wahrscheinlichkeit 

für ein Untergrundereignis. Die Verteilung der Ausgabewerte des neuronalen Netzwerks im 

Rigiditätsbereich 5 − 300 GV ist in Abbildung 6.15 gegeben. Zudem wird von der Software 

100% Untergrund-ähnlich 

t cut 

Abbildung 6.15.: Verteilung der Ausgabewerte des neuronalen Netzwerks und deren 

Interpretation. 

eine Rangliste der Eingangsvariablen erstellt. Diese ist sortiert nach dem Beitrag einer 

Variable zur Separation im neuronalen Netzwerk, gegeben durch die Signifikanz. Die Liste 

für das Netzwerk von 2 − 5 GV ist in Tabelle 6.1 dargestellt. Dabei ist nicht nur die 

Signifikanz ” 

Sig“ der Variablen im Netzwerk, sondern auch die Signifikanz der Variablen 

alleine gegeben und der Signifikanzverlust für das Netzwerk ohne diese Variable. Die Signifikanz 

alleine gibt dabei die Korrelation zwischen der Variable und dem Zielwert, wie 

er in Teil 5.3.3 definiert wurde. Außerdem ist die Korrelation zu den anderen Variablen 

gegeben. Die Ranglist für das Netzwerk von 5 − 300 GV ist in Tabelle 6.2 angegeben. Die 

Zählung der Lagen im Übergangsstrahlungsdetektor erfolgt dabei aufsteigend von unten 

nach oben. Um eine Fehlerdiagnose zu vereinfachen und den Erfolg des Trainings zu überprüfen, 

wird von der Software ein Analysedokument erstellt. In diesem Dokument sind 

wichtige Informationen zum Verlauf des Trainings wie die Fehlerfunktion, Informationen 

zu den einzelnen Variablen wie Separationseigenschaften und deren Transformation, sowie 

Informationen über das Netzwerk selbst wie die Korrelationsmatrix der Eingabeparameter 

und die Struktur des Netzwerks. Ein Ausschnitt mit wichtigen Informationen der Analysedokumente 

für die Netzwerke von 2 − 5 GV und von 5 − 300 GV ist in Anhang A und 

B zu finden. 

60

6.4. Ausgabe des neuronalen Netzwerkes 61 

Variable Sig. im Netzwerk Sig. alleine Sig. Verlust Korrelation 

Beta 855.24 855.24 260.94 38.1% 

Energieabgabe in Lage 01 563.36 698.85 192.35 31.9% 




















TrdTheta 53.53 74.66 53.53 1.9% 

Xe Teildruck 8.25 74.89 8.25 4.2% 

Tabelle 6.1.: Liste der Eingangsvariablen des neuronalen Netzwerks im Rigiditätsbereich 

2 − 5 GV, sortiert nach deren Beitrag zur Separation. 

61


Variable Sig. im Netzwerk Sig. alleine Sig. Verlust Korrelation 





















Rabs 126.74 523.23 126.77 23.8% 

XePressure 23.82 42.37 23.82 1.2% 

TrdTheta 12.77 34.79 12.77 1.6% 

Tabelle 6.2.: Liste der Eingangsvariablen des neuronalen Netzwerks im Rigiditätsbereich 

5 − 300 GV, sortiert nach deren Beitrag zur Separation. 

62

7. Vergleich von Methoden zur 

Protonen/Positronen Trennung 

Wie in Teil 5.2 beschrieben, stehen zur Trennung von Protonen und Leptonen zwei Implementierungen 

von Likelihoodverhältnissen in der AMS Software zur Verfügung: Das 

in der RWTH Aachen entwickelte Framework TrdQt und das im MIT entwickelte TrdK. 

Die Separationseigenschaften dieser Methoden sollen hier mit denen des neuronalen Netzwerks 

verglichen werden. Die Protonenunterdrückung von Separationsmethoden ist dabei 

stark von der Vorselektion und der Selektion der zu testenden Ereignisse abhängig. Dabei 

ist dann ein Vorteil des neuronalen Netzwerks gegenüber den Likelihood Methoden 

zu erwarten, wenn einzelne Korrelationen zwischen den Lagen auftreten und damit eine 

einfache lineare Trennung der Populationen nicht mehr optimal ist. Außerdem können Abhängigkeiten 

von Parametern wie Rigidität oder Gasdruck auf eine unterschiedliche Weise 

eingebracht werden. 

Als Vergleich zwischen den Methoden wird die Protonenunterdrückung betrachtet, wie 

sie in Teil 6.2 definiert wurde. In Abbildung 7.1 ist die Protonenunterdrückung für die 

drei Methoden mit der Effizienz auf die Selektion von Elektronen gezeigt. Dabei liegen 

die Likelihoodmethoden nahe beieinander, wobei das Likelihoodverhältnis der TrdK Calib 

leicht über der TrdQt Likelihood liegt. Das neuronale Netzwerk kann sich nur bei niedrigen 

Effizienzen von den Likelihoodmethoden absetzen und hat oberhalb einer Signaleffizienz 

von etwa 75% vergleichbare Performance. Abbildung 7.2 zeigt die Protonenunterdrückung 

bei 90% Signaleffizienz, in jedem Bin, mit der Rigidität. Hier ist zu sehen, dass das neuronale 

Netzwerk vor allem bei niedrigen Rigiditäten bis 5 GV im Vorteil gegenüber den 

Likelihoodmethoden ist. 

In den Abbildungen 7.3 sind die Übereinstimmungen der Auswahl von Elektronen bei einer 

Auswahleffizienz von 90% durch die beiden Likelihoodmethoden und das neuronale Netzwerk 

als sogenanntes Venn Diagramm gezeigt. Dieses zeigt an, inwieweit die durch die drei 

Separationsmethoden selektierten Elektronen übereinstimmen. Die Überschneidung der 

Mengen ist in Prozent gegeben. Darunter ist die Anzahl an Ereignissen in den Teilmengen 

angegeben. 100% entsprechen dabei der Gesamtzahl an selektierten Signalereignissen, 

also der Summe in allen Teilmengen. Demnach werden 90% der selektierten Elektronen 

in Übereinstimmung der drei Separationsmethoden ausgewählt. Weitere 4% werden nur 

von den Likelihoodmethoden, jedoch nicht vom neuronalen Netzwerk erkannt. Diese gilt es 

noch zu untersuchen und gegebenenfalls in das Netzwerktraining einzubinden. Insgesamt 

ist die Übereinstimmung der Auswahl jedoch hoch. 

Um die physikalisch relevanten Eigenschaften der Separationsmethoden zu untersuchen, 

63

64 7. Vergleich von Methoden zur Protonen/Positronen Trennung 

Rejection 

5 

10 

Rejection with signal efficiency 

4 

10 

3 

10 

Neuronales Netzwerk 

2 

10 

TrdQt Likelihood 

TrdK Calib Likelihood 

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 

Sig Eff 

Abbildung 7.1.: Protonenunterdrückung mit der Signaleffizienz des neuronalen 

Netzwerks (dunkelblau), sowie des TrdQt- (rot) und des TrdK- 

Likelihoodverhältnisses (blau). 


3 

10 



TrdKCalib Likelihood 

10 

2 

10 

Rigiditat/GV 

Abbildung 7.2.: Protonenunterdrückung mit Rigidität im Bereich 5 − 300 GV für das 

neuronale Netzwerks (schwarz), sowie für das TrdQt- (rot) und TrdK- 

Likelihoodverhältnis (blau). 

64

7.1. Reinheit der Separationsmethoden 65 

Abbildung 7.3.: Übereinstimmung der Auswahl von Elektronen bei 90% Signaleffizienz 

durch die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem 

neuronalen Netzwerk. 

wird die Reinheit als Anteil von Signalereignissen in der Annahmeregion nach Gleichung 

5.6 ermittelt. Mit bekannter Reinheit kann dann eine Analyse von ausgewählten Positronen 

und Elektronen durchgeführt werden. 

7.1. Reinheit der Separationsmethoden 

Um die Reinheit zu ermitteln soll auch hier auf Flugdaten zurückgegriffen werden. Dazu 

wurde eine Methode gewählt, die eine selektierte Positronenauswahl an Schablonen aus 

Elektronen als Signal und Protonen als Untergrund anpasst. Als Schablone dient dabei die 

Verteilung der Ausgabewerte des Boosted Decision Trees durch das elektromagnetische Kalorimeter, 

unabhängig vom Übergangsstrahlungsdetektor. Damit kann ermittelt werden, 

wie das selektierte Positronensample zusammengesetzt ist. Um Schablonen zu erstellen 

muss eine Protonen- und Elektronenselektion unabhängig vom elektromagnetischen Kalorimeter 

durchgeführt werden. Dazu werden Ereignisse mit dem Übergangsstrahlungsdetektor 

selektiert. Man startet mit einer Ereignismenge aus Ereignissen mit Ladungsbetrag 

|Z| = 1 aus Spurdetektor, sowie einer maximalen Energieabgabe von weniger als 5, 0 MeV 

und einer durchschnittlichen Energieabgabe von weniger als 4, 0 MeV im Flugzeitdetektor, 

um Heliumkontamination zu vermeiden. Aus dieser Menge werden nun Protonen mit 

• Positive Ladung Z = +1 mit dem Spurdetektor 

• Proton mit TrdQt Likelihoodverhältnis 

und Elektronen mit 

• Negative Ladung Z = −1 mit dem Spurdetektor 

• Elektron mit TrdQt Likelihoodverhältnis 

in einem bestimmten Rigiditätsbereich selektiert. Man erhält aus der Verteilung der BDT 

Ausgabewerte Rigiditätsabhängige Schablonen, wie in Abbildung 7.4. Nun werden Positronen 

mit Ladung Z = +1 mittels der Methode selektiert, deren Reinheit ermittelt werden 

soll. An diese Verteilung werden die Schablonen durch Variieren der Gewichte angepasst, 

bis deren gewichtete Summe der Positronenauswahl bestmöglich entspricht. Dazu wird die 

Root Klasse TFractionFitter genutzt. Aus dem Gewicht der Elektronenschablone erhält 

65


7 

10 

6 

10 

5 

10 

Protonen Schablone 

6 

10 

5 

10 

4 

10 

3 

10 

Elektronen Schablone 

4 

10 

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 

BDT 

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 

BDT 

Abbildung 7.4.: Verteilung des BDT Ausgabewertes der Protonenschablone 

(links) und der Elektronenschablone (rechts), selektiert mit dem 

Übergangsstrahlungsdetektor. 

Selektierte Positronen 

-1 

10 

-1 

10 

Data Points 

Electron Template 

Proton Template 

Fit 

Purity: 0.264 +- 0.003 

ChiSq/NDF: 2.719 

-2 

10 

-2 

10 

-3 

10 

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 

BDT 

-3 

10 

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 

BDT 

Abbildung 7.5.: Verteilung des BDT Ausgabewertes einer Auswahl von Positronen mit 

dem neuronalen Netzwerk bei einer Elektronen Effizienz von 90% im Rigiditätsbereich 

7, 96 − 10, 05 GV (links) und Anpassung der Schablonen 

an dies Positronenauswahl (rechts). 

man dann die Reinheit. Ein Beispiel für eine solche Anpassung, für eine Positronenauswahl 

im Rigiditätsbereich 7, 96 − 10, 05 GV, ist in Abbildung 7.5 dargestellt. 

Nicht aufgerufen wird der Entscheidungsbaum für Ereignisse, die bereits durch eine einfache 

Betrachtung der Schauerform sicher als Protonen identifiziert werden können. Dies 

betrifft Ereignisse die nur durch Ionisation Energie im Kalorimeter deponieren und damit 

MIP 1 -ähnlich sind. Diese Ereignisse mit einer geringen Energieabgabe in den ersten beiden 

Superlagen des Kalorimeters werden zu −0, 9991 und Ereignisse mit einer geringen 

Schauerausbreitung zu −0, 9993 gesetzt und damit sicher als Protonen gekennzeichnet. 

Für die Anpassung an die Verteilung des BDT stellen solche Ereignisse ein Problem dar, 

da sie überwiegend für positive Teilchen auftreten. Damit wird eine Diskrepanz zwischen 

Elektronenschablone und Positronenverteilung hergestellt. Sie werden daher von der Anpassung 

ausgenommen und im Nachhinein korrigiert. Dazu wird ausgenutzt, dass es sich 

bei diesen Ereignissen in der Positronenauswahl ausschließlich um falsch eingeordnete Protonen 

handelt. Die Situation für die Verteilung der BDT Ausgabewerte ist in Abbildung 

7.6 dargestellt. Es befinden sich A+B Protonen in den Bins bei −0, 9993 und −0, 9991 der 

Positronenauswahl durch den TRD. Das Ergebnis der Anpassung f für die Elektronen- 

1 engl.: Minimum Ionisation Particle 

66

7.2. Vergleich anhand der ermittelten Reinheit 67 

A 

B 

MIP 

-0.9993 

MIP 

-0.9991 

BDT 

Abbildung 7.6.: Schematische Darstellung der Verteilung des Entscheidungsbaumes in der 

Region der minimal ionisierenden Teilchen in der Longitudinalen und Lateralen 

Schauerausbreitung. 

schablone ohne diese Bins gibt 

f = 

N P os 

N − (A + B) , (7.1) 

wobei N P os die Anzahl richtig eingeordneter Positronen und N die vom TRD selektierten 

Positronen mit Protonenverunreinigung gibt. Die Nummer der richtig eingeordneten Positronen 

N P os wird durch das Ausschließen der Bins von der Anpassung an die Schablonen 

nicht verändert. Damit ist die korrigierte Reinheit 

p = N P os 

N 

= f − 

(A + B) 

N . (7.2) 

7.2. Vergleich anhand der ermittelten Reinheit 

Mit dem Vorgehen nach der Anpassung der Positronenauswahl mithilfe von Schablonen 

wird jetzt die Reinheit der Positronenauswahl mit der Effizienz auf die Positronenselektion 

ermittelt. Diese ist in Abbildung 7.7 für den Rigiditätsbereich 2 − 300 GV dargestellt. 

Die Verläufe ähneln denen aus Abbildung 7.1. Bei niedriger Signaleffizienz ist die Anzahl 

selektierter Positronen zu gering und die Anpassungsprozedur ist instabil gegenüber statistischen 

Fluktuationen und kann nicht mehr optimal durchgeführt werden. 

Wie in Kapitel 5.1 beschrieben verbindet eine gute Separationsmethode hohe Effizienz bei 

hoher Reinheit. Als Arbeitspunkt wird daher der Punkt ausgewählt, der dem Idealpunkt 

mit Signaleffizienz 1 und Reinheit 1 am nächsten liegt. Um Arbeitspunkte mit der Rigidität 

zu erhalten werden nun Anpassungen an Schablonen in bestimmten Rigiditätsabschnitten 

durchgeführt und der Verlauf der Reinheit mit der Signaleffizienz betrachtet. Daraus erhält 

man den Arbeitspunkt für den ensprechenden Rigiditätsbereich. Die damit ermittelten 

Entscheidungsgrenzen mit der Rigidität, sowie die Effizienz auf die Signalauswahl sind 

in Abbildung 7.8 dargestellt. Dabei ist für die Entscheidungsgrenzen zu beachten, dass 

für das neuronale Netzwerk hohe Ausgabewerte gegen +1 einem Signalereignis entsprechen. 

Für die Likelihoodverhältnisse hingegen stehen niedrige Werte für Signalereignisse. 

Der Ausschlag für die Entscheidungsgrenze im letzten Bin geht also in allen Separationsmethoden 

in Richtung höherer Untergrund und ist der geringen Statistik in diesem Bin 

geschuldet. Die Effizienz auf die Signalauswahl ist bei allen Methoden vergleichbar und 

67


Reinheit 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 




0 

0.4 0.5 0.6 0.7 0.8 0.9 1 


Abbildung 7.7.: Reinheit der Positronenauswahl mit der Effizienz auf die 

Positronenselektion. 

Entscheidungsgrenze 


1 

0.95 

0.9 

0.85 

0.8 

0.75 

0.7 

Rigidität/GV 

0.65 

0.6 

0.55 

0.5 




10 

2 

10 

Rigiditat/GV 

Abbildung 7.8.: Entscheidungsgrenzen am Arbeitspunkt mit der Rigidität (links) und Signaleffizienz 

bei diesen Entscheidungsgrenzen mit der Rigidität (rechts). 

liegt bei etwa 80%. Die für die Arbeitspunkte ermittelte Reinheit mit der Rigidität ist in 

Abbildung 7.9 zu sehen. Hier hebt sich das neuronale Netzwerk bei niedrigen Rigidtäten, 

ähnlich der Protonenunterdrückung aus Abbildung 7.2, deutlich von den Likelihoodmethoden 

ab. Dies ist durch die Einbindung der relativen Geschwindigkeit zu erklären. In 

den Abbildungen 7.10 und 7.11 ist noch einmal die Übereinstimmung der Auswahl von 

Elektronen und Positronen mit den Entscheidungsgrenzen aus Abbildung 7.8, verteilt auf 

die drei Separationsmethoden, als Venn Diagramm gezeigt. Dabei wurden die Einträge 

für Positronen mit der Reinheit gewichtet, um Protonenkontamination zu korrigieren. Für 

die Schnittflächen wurde die höchste Reinheit der Schnittpartner verwendet, was zumeist 

der Reinheit des neuronalen Netzwerks entspricht und die Zahlen für die Likelihoodmethoden 

in Schnittmengen mit dem neuronalen Netzwerk leicht erhöht. Der prozentuale 

Anteil wurde so definiert, dass die gesamte Menge an Elektronen oder Positronen, selektiert 

durch mindestens eine der drei Methoden und damit die Summe aller Teilmengen, 

100% entspricht. Die Anzahl der Einträge in die jeweiligen Bereichen wurde bei Positronen 

außerdem auf ganze Zahlen gerundet. Die Teilmengen sind bei Elektronen ähnlich verteilt 

68


Reinheit 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 

10 




2 

10 

Rigiditat/GV 

Abbildung 7.9.: Reinheit der Positronenauswahl mit der Rigidität. 

wie in Abbildung 7.3, jedoch ist die Selektionseffizienz für das neuronale Netzwerk etwas 

höher, was die Schnittflächen zu diesem etwas verschiebt. Für Positronen ist der gegenteilige 

Effekt zu sehen. Die Likelihoodmethoden selektieren wesentlich mehr Positronen 

als das neuronale Netzwerk und nur 80000 Positronen werden in Übereinstimmung der 

drei Methoden ausgewählt. In Abbildung 7.12 ist die Anzahl der ausgewählten Positronen 

durch die verschiedenen Separationsmethoden mit der Rigidität aufgetragen. Dort ist 

zu erkennen, dass die Anzahl ausgewählter Positronen im statistischen Fehlerbereich in 

großen Teilen übereinstimmen. Der statistische Fehler setzt sich hierbei aus dem binominalen 

Fehler als Wurzel der Positronenanzahl und dem Fehler aus der Anpassungsprozedur 

zusammen. Im letzten Rigiditätsabschnitt werden durch die Likelihoodmethoden jedoch 

wesentlich mehr Positronen selektiert. Dies ist auf die geringe Zahl an Elektronen und 

Positronen in diesem Rigiditätsbereich zurückzuführen, wodurch die Anpassungsprozedur 

fehlerhaft verläuft und erklärt die Verschiebung der Positronenauswahl in Abbildung 7.11. 

69


Abbildung 7.10.: Übereinstimmung der Auswahl von Elektronen am Arbeitspunkt durch 

die Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen 

Netzwerk. 

Abbildung 7.11.: Übereinstimmung der Auswahl von Positronen am Arbeitspunkt durch 


Netzwerk gewichtet mit der Reinheit. 

70


# Positronen 

5 

10 

4 

10 

3 

10 

2 

10 

NN Positronen 

TrdQt Positronen 

TrdK Positronen 

10 

2 

10 

Rigiditat/GV 

Abbildung 7.12.: Positronenauswahl der Separationsmethoden mit der Rigidität. 

71

8. Zusammenfassung und Ausblick 

Mit Abschluss dieser Diplomarbeit befindet der AMS-02 Detektor seit 22 Monaten auf der 

Internationalen Raumstation und konnte dort durchgehend ohne Ausfälle bereits 30 Milliarden 

Teilchen messen. Der Betrieb des Detektors ist bis zum Jahr 2020 sichergestellt und 

könnte nach einer eventuellen Verlängerung der ISS Mission entsprechend weitergeführt 

werden. Derzeitigen Prognosen zu Folge sind die Gasreserven des TRD, bei Fortsetzung 

des jetzigen Betriebes, wie er in Kapitel 4 beschrieben ist, für mindestens 30 weitere Jahre 

ausreichend, sodass dessen Aktivität nicht eingeschränkt werden müsste. 

Eine der interessantesten Messungen durch den AMS-02 Detektor wird auch in Zukunft 

die präzise Messung des Positronenanteils in der leptonischen Komponente der kosmischen 

Strahlung sein. Hierzu werden Methoden benötigt um Positronen aus der durch Protonen 

dominierten kosmischen Strahlung zu Separieren. 

Mit den vorhandenen Methoden, basierend auf Likelihoodverhältnissen, zur Trennung leptonischer 

und hadronischer Ereignisse mit Hilfe des Übergangsstrahlungsdetektors kann 

eine Protonenunterdrückung von 10 3 bei einer Signaleffizienz von 90% erreicht werden. 

In dieser Arbeit wurde eine neue Methode in Form eines neuronalen Netzwerkes im Rigiditätsbereich 

von 2 − 300 GV entwickelt und getestet. Dazu wurde die NeuroBayes R○ 

Software genutzt. Wie in Kapitel 7 gezeigt wurde, sind die Separationseigenschaften des 

Neuronalen Netwerks mit denen der Likelihoodmethoden vergleichbar. Hierdurch konnten 

diese validiert werden. Bei kleinen Rigiditäten bis 5 GV ist eine signifikante Verbesserung 

der Separationseigenschaften gegenüber der Likelihoodmethoden erzielt worden, was auf 

die Implementierung der relativen Geschwindigkeit zurückzuführen ist. Außerdem ist eine 

höhere Reinheit bei Signaleffizienzen unter 75% auf die Signalauswahl für das neuronale 

Netzwerk erzielt worden. 

In einer in Kürze erscheinenden Veröffentlichung zum Positronenanteil bis 350 GV wird 

das Likelihoodverhältnis der TrdK verwendet. Mit weiteren Messdaten wird der Positronenanteil 

in Zukunft noch bis in den TeV Bereich fortgesetzt werden können. Zusätzlich 

wird der AMS-02 Detektor Untersuchungen zur Anisotropie durchführen. Die Messungen 

des Positronenanteils durch den AMS-02 Detektor werden damit einen wichtigen Beitrag 

zur Identifikation eines teilchenphysikalischen Kandidaten der Dunklen Materie liefern. 

73

Literaturverzeichnis 

[1] NASA/WMAP Science Team, Expansion des Universums und Entwicklungsstadien 

als Modell. http://commons.wikimedia.org/wiki/File:Expansion_des_ 

Universums.png% relax. 

[2] NASA,. http://www.flickr.com/photos/ams02/5858030178/. 

[3] Bluemer, J.; Engel, R.; Hoerandel, J. R. Progress in Particle and Nuclear Physics 

2009, 63, 293 – 338. 

[4] Grupen, C. Astroparticle Physics, 1st ed.; Springer: Berlin [u.a.], 2005. 

[5] Hu, H. Status of the EAS studies of cosmic rays with energy below 10 16 eV, 2009, 

arXiv:0911.3034 [astro-ph.HE]. 

[6] stratocat.com, Data of the stratospheric balloon launched on 5/3/1994. http:// 

stratocat.com.ar/fichas-e/1994/FSU-19940503.htm. 

[7] The Pierre Auger Cosmic Ray Observatory. http://www.auger.org. 

[8] Stanev, T. High energy cosmic rays : with 19 tab., 2nd ed.; Springer-Praxis books in 

astrophysics and astronomy; Springer: Berlin, 2004. 

[9] Engel, R. Vorlesungsfolien: Astroteilchenphysik II - Kosmsiche Strahlung (WS 12/13). 

[10] Zwicky, F. Astrophysical Journal 1937, 86, 217. 

[11] Galactic Case for Dark Matter. http://www.learner.org/courses/physics/ 

visual/visual.html?shortname=andromeda. 

[12] NASA/WMAP Science Team, The contents of the Universe as measured with WMAP 

and computed by NASA/WMAP Science team. http://en.wikipedia.org/wiki/ 

File:080998_Universe_Content_240.jpg. 

[13] DESY, Supersymmetrische Partnerteilchen. http://www.weltderphysik.de/ 

gebiete/theorie/jenseits-des-standardmodells/supersymmetrie/. 

[14] The Astronomist, Dark Matter Confronts Observations. http://theastronomist. 

fieldofscience.com/2010/05/dark-matter-confronts-observations.html. 

[15] Fermi LAT Collaboration, Phys. Rev. Lett. 2012, 108, 011103. 

[16] Blasi, P.; Amato, E. arXiv:1007.4745 2010. 

[17] The AMS Collaboration, AMS In A Nutshel. http://www.ams02.org/what-is-ams/ 

ams-facts-figures/. 

[18] The AMS Collaboration, Private Kommunikation. 

[19] The AMS Collaboration, The TRD. http://www.ams02.org/what-is-ams/ 

tecnology/trd/. 

75

76 Literaturverzeichnis 

[20] The AMS Collaboration, The Time-of-Flight. http://www.ams02.org/ 

what-is-ams/tecnology/tof/. 

[21] CAPELL, M. In AMS on ISS - Construction of a particle physics detector on the 

International Space Station; The AMS Collaboration, 2004; Chapter 1.1 Construction 

of the AMS-01 magnet. 

[22] The AMS Collaboration, The Permanent Magnet. http://www.ams02.org/ 

what-is-ams/tecnology/magnet/pmmagnet/. 

[23] The AMS Collaboration, Tracker Shifter Guide (I), Aug. 2011. 

[24] The AMS Collaboration, The Silicon Tracker. http://www.ams02.org/ 

what-is-ams/tecnology/tracker/. 

[25] The AMS Collaboration, The Anti-Coincidence Counter. http://www.ams02.org/ 

what-is-ams/tecnology/acc/. 

[26] Horvath, A. Cherenkov.svg (Creative Commons BY-SA). http:// 

upload.wikimedia.org/wikipedia/commons/thumb/6/6b/Cherenkov.svg/ 

378px-Cherenkov.svg.png. 

[27] The AMS Collaboration, The RICH. http://www.ams02.org/what-is-ams/ 

tecnology/rich/. 

[28] The AMS Collaboration, The ECAL. http://www.ams02.org/what-is-ams/ 

tecnology/ecal/. 

[29] CAPELL, M. In AMS on ISS - Construction of a particle physics detector on the 

International Space Station; The AMS Collaboration, 2004; Chapter 2.7 Electromagnetic 

Calorimeter (ECAL). 

[30] Paeng, Spiegelladung.svg (Creative Commons BY-SA). http://de.wikipedia. 

org/w/index.php?title=Datei:Spiegelladung.svg&page=1&filetimestamp= 

20081130200154. 

[31] Jackson, J. D. Klassische Elektrodynamik, 4th ed.; de Gruyter: Berlin [u.a.], 2006. 

[32] CAPEL, M. In AMS on ISS - Construction of a particle physics detector on the 

International Space Station; The AMS Collaboration, 2004; Chapter 2.2 Transition 

Radiation Detector (TRD). 

[33] Hattenbach, J. Gasverstaerkungsmessungen mit Proportionalkammern des AMS02- 

Uebergangsstrahlungsdetektors, 2004. 

[34] Grupen, C. Particle detectors, 1st ed.; Cambridge monographs on particle physics, 

nuclear physics, and cosmology ; 5; Univ. Press: Cambridge, 1996. 

[35] Leo, W. R. Techniques for nuclear and particle physics experiments : a how-to approach; 

Springer: Berlin, 1987. 

[36] The AMS Collaboration, THE NEW CERN POCC. http://www.ams02.org/2011/ 

07/the-new-cern-pocc/. 

[37] Weng, Z. TRDKLikelihood (AMS TWiki - intern). https://twiki.cern.ch/twiki/ 

bin/view/AMS/TRDKLikelihood. 

[38] Cowan, G. Statistical data analysis; Oxford science publications; Clarendon Press: 

Oxford, 1998. 

[39] Cowan, G. CERN Summer Student Lectures. Introduction to Statistical Methods for 

High Energy Physics, 2011. 

76

Literaturverzeichnis 77 

[40] Bishop, C. M. Neural networks for pattern recognition, Repr. ed.; Clarendon Pr.: 

Oxford, 1998. 

[41] The NeuroBayes Users Guide, April 06th, 2012. http://neurobayes.phi-t.de/ 

index.php/public-information/documentation% relax. 

[42] Valerio Vagelli, Private Kommunikation. 

[43] TMVA - Toolkit for Multivariate Data Analysis, arXiv:physics/0703039, November 

03rd, 2009. http://tmva.sourceforge.net. 

[44] TEfficiency - a class to handle efficiency histograms, June 12th, 2012. http://root. 

cern.ch/root/html/TEfficiency.html. 

77

Abbildungsverzeichnis 

1.1. Entwicklung des Universums nach der Urknalltheorie [1]. . . . . . . . . . . . 2 

1.2. Foto des AMS-02 Detektor auf der Internationalen Raumstation [2]. . . . . 3 

2.1. Relative Häufigkeit der Elemente in der kosmischen Strahlung als Funktion 

ihrer Kernladungszahl Z bei einer Energie von 1 GeV pro Nukleon, normiert 

auf Si=100 [3]. Gezeigt ist außerdem die Häufigkeit der Elemente im 

Sonnensystem (graue Dreiecke). . . . . . . . . . . . . . . . . . . . . . . . . . 6 

2.2. Teilchenspektrum der kosmischen Strahlung mit der Energie [5]. Die Abbildung 

vereint Messergebnisse verschiedener Experimente deren Ergebnisse 

durch unterschiedliche Farben und Marker dargestellt werden. . . . . . . . . 7 

2.3. Skizze des HEAT Detektors (rechts), ausgerüstet mit Flugzeitmessung (TOF), 

Übergangsstrahlungsdetektor (TRD), Driftkammern (DTH) innerhalb eines 

Magneten und einem elektromagnetischen Kalorimeter (EC) und ein Foto 

des Detektors am Ballon in der Atmosphäre (links) [6]. . . . . . . . . . . . . 8 

2.4. Übersicht der Detektorverteilung mit eingezeichneten Sichtlinien der Fluoreszenz- 

Teleskope beim Pierre-Auger-Observatorium (links) und Rekonstruktion eines 

Ereignisses mit Bodenstationen und Fluoreszenz-Teleskopen (rechts) [7]. 8 

2.5. Beschleunigung kosmischer Teilchen an einer Schockfront. . . . . . . . . . . 9 

2.6. Rotationsgeschwindigkeit von Sternen einer Galaxie mit deren Orbitalradius 

(grün) sowie die Erwartung aus den Keplerschen Gesetzen (orange) [11]. . . 10 

2.7. Erwartete Verteilung von Materie und Energie im Universum nach dem 

Λ-CDM-Modell [12]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 

2.8. Teilchen der minimalen supersymmetrischen Erweiterung des Standardmodells 

der Teilchenphysik [13]. . . . . . . . . . . . . . . . . . . . . . . . . . . 12 

2.9. Zerfallskette der Annihilation supersymmetrischer Neutralinos in Teilchen 

des Standardmodells der Teilchenphysik [14]. . . . . . . . . . . . . . . . . . 13 

2.10. Positronenanteil in der leptonischen Komponente der kosmischen Strahlung 

mit der Energie bis 100 GeV aus Messungen verschiedener Experimente [15]. 13 

3.1. Technische Zeichnung des AMS-02 Detektors mit Beschriftung der Subdetektoren 

[18]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

3.2. Schematische Zeichnung einer TRD Lage aus 20 mm dickem Radiatorvlies 

und Proportionaldrahtkammerröhrchen zum Nachweis von Übergangsstrahlung 

[19]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 

3.3. Foto der oberen und unteren Lagen des Flugzeitdetektors vor dem Einbau 

[20]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 

3.4. Technische Zeichnung eines Szintillatorstreifens mit Beschriftung der Komponenten 

[20]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 

3.5. Der AMS-02 Permanentmagnet in der Seitenansicht (links) und das von ihm 

erzeugte Magnetfeld in der Draufsicht (rechts) [22]. . . . . . . . . . . . . . . 19 

3.6. Schematische Darstellung der Spurdetektorplatten (links) und Fotos vor 

deren Integration in den Detektor (rechts) [23]. . . . . . . . . . . . . . . . . 19 

79

80 Abbildungsverzeichnis 

3.7. Schematische Skizze von Aufbau und Funktionsweise eines doppelseitigen 

Silizium Streifensensors [24]. . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 

3.8. Ein seitlich einfallendes Teilchen, das vom ACC zurückgewiesen wird (links), 

ein Teilchen hoher Ladung, das Delta-Elektronen erzeugt (Mitte) sowie ein 

Backsplash Event (rechts), welche angenommen werden [25]. . . . . . . . . . 21 

3.9. Skizze zur Ausbreitung von Tscherenkow Strahlung [26]. . . . . . . . . . . . 21 

3.10. Skizze der Funktionsweise des RICH (links) und Foto der einzelnen Bestandteile 

vor dem Zusammenbauen (rechts) [27]. . . . . . . . . . . . . . . . . . . 22 

3.11. Anordnung von drei Superlayern in wechselnder x-y Ausrichtung (links) und 

Querschnitt eines Superlayers mit als Zelle gruppierten Szintillationsfasern 

(rechts) [29]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 

3.12. Skizze des Kaloriemeters mit Abmessungen und Ausbreitung hadronischer 

(blau) und elektromagnetischer Schauer (rot). . . . . . . . . . . . . . . . . . 23 

3.13. Signaturen von Teilchen bei 300 GeV in den einzelnen Subdetektoren des 

AMS-02 Detektors [18]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 

3.14. Ereignismonitor eines Elektrons mit einer Rigidität von −92, 6 GV, aufgenommen 

am 04. Oktober 2012. . . . . . . . . . . . . . . . . . . . . . . . . . 25 

3.15. Ereignismonitor eines Protons mit einer Rigidität von 83, 3 GV, aufgenommen 

am 04. Oktober 2012. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 

4.1. Spiegelladung einer positiven Ladung an einer Grenzfläche [30]. . . . . . . . 28 

4.2. Schematische Darstellung der Zusammensetzung des Wandmaterials für eine 

Proportionalkammerröhre (links) und Veranschaulichung des Fertigungsprozesses 

(rechts) [33]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 

4.3. Foto eines Moduls in der Draufsicht (oben) und der Querschnitt mittels 

Computertomographie (unten) [32]. . . . . . . . . . . . . . . . . . . . . . . . 29 

4.4. (a) Energieabhängigkeit des Massenabsorptionskoeffizienten µ in Blei Z Pb = 

82 und (b) Bereiche in denen Photoeffekt, Compton Effekt oder Paarbildung 

dominieren in Abhängigkeit der Kernladungszahl Z des Absorbers und der 

Photonenenergie [34]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 

4.5. Energieabgabe aller Teilchen im Energiebereich um 25 GeV in Lage 6 mit 

angepasster Landau-Verteilung im Ionisationsbereich (rot). . . . . . . . . . 31 

4.6. Darstellung des Gassystems bestehend aus der Box-S, der Box-C und dem 

Gaskreislauf des Hauptdetektors bestehend aus 41 Segmenten [32]. . . . . . 32 

4.7. Foto des AMS-02 POCC auf dem Gelände des CERN in Genf [36]. Die 

einzelnen Schichtpositionen sind in rot gekennzeichnet. Dabei ist ”Data” 

für die Überwachung der Datenübertragung von der ISS zum CERN, über 

einzelne Zwischenstationen zuständig. ”LEAD” dient als Schichtleitung und 

ist Schnittstelle für die Kommunikation mit der NASA. ”PM” ist für Ecal, 

RICH und TOF verantwortlich, ”TEE” überwacht Spurdetektor, ACC und 

TRD. ”Thermal” kontrolliert die Temperatursituation im gesamten Detektor, 

welche stark mit dem Winkel des Detektors zur Sonne korreliert und 

kann gegebenenfalls nach Rücksprache mit der Schichtleitung Heizungen 

zu- und abschalten, oder die NASA bitten die Position der Solarpanele oder 

Radiatoren der ISS so zu verändern, dass diese entweder Schatten spenden, 

oder Zufuhr von Sonnenlicht ermöglichen. Außerdem befindet sich im POCC 

noch eine Position für das Offline Computing, die im Bild nicht eingefangen 

wurde und wo die Ereignisrekonstruktion überwacht wird. . . . . . . . . . . 33 

80


4.8. Bildschirmfoto des Programms zur Ermittlung des Korrekturwertes zur 

Hochspannungsanpassung. Aufgetragen ist der wahrscheinlichste Wert der 

deponierten Energie über einen Zeitraum (hier zwei Wochen). Der Wert 

schwankt um etwa 60 ADC, wobei ein etwa linearer Anstieg mittels Hochspannungsanpassungen 

kompensiert wird. In rot ist eine lineare Anpassung 

an die Daten zu sehen, die vom Programm ausgegeben wird und den Korrekturwert 

bestimmt (hier −3 V). . . . . . . . . . . . . . . . . . . . . . . . . 34 

4.9. Auftragung der Verschiebung dx in x-Richtung von Lage 4, 10 und 14 auf 

langer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 30 Tage. . . . 35 

4.10. Auftragung der Verschiebung des gesamten Detektors dx in x-Richtung auf 

kurzer Zeitbasis [37]. Eine Gitterlinie in x-Richtung markiert 2 Stunden. . . 35 

4.11. Auf eins normiertes Spektrum der Energieabgabe von Elektronen (blau) 

und Protonen (rot) im Energiebereich um 25 GeV in Lage 6. . . . . . . . . 36 

4.12. Auf eins normiertes Spektrum des Mittelwertes der Energieabgabe in den 20 

Detektorlagen von Elektronen (blau) und Protonen (rot) im Energiebereich 

um 25 GeV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 

5.1. Beispiel von Populationen H 0 und H 1 im zweidimensionalen Parameterraum 

der Variablen x 1 und x 2 , getrennt durch eine lineare Entscheidungsgrenze 

(dunkelrot) [39]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

5.2. Wahrscheinlichkeitsdichteverteilungen für die Hypothesen H 0 und H 1 einer 

eindimensionalen Test-Statistik t(x) mit Einteilung in eine Annahme- und 

eine Verwurfsregion, getrennt durch die Entscheidungsgrenze t cut [38]. . . . 39 

5.3. Verteilung des Likelihoodverhältnis gegeben durch TrdQt und TrdK von 

Protonen und Leptonen aus Flugdaten, selektiert durch das elektromagnetsiche 

Kalorimeter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 

5.4. Darstellung von Gleichung 5.11 als Netzwerkdiagramm. . . . . . . . . . . . 41 

5.5. Zeichnung der Sigmoid Funktion nach Formel 5.12. . . . . . . . . . . . . . . 42 

5.6. Beispiel nicht einfacher, durch eine Hyperebene linear separierbarer, Populationen 

H 0 und H 1 im zweidimensionalen Parameterraum der Variablen x 1 

und x 2 [39]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 

5.7. Multi Layer Perzeptron mit einer versteckten Lage. . . . . . . . . . . . . . . 43 

5.8. Separationsgrenzen für zwei Populationen im zweidimensionalen Parameterraum 

von x 1 und x 2 mit guter Generalisierungsfähigkeit (links) und nach 

Overtraining (mitte). Rechts ist das Verhalten der Fehlerfunktion im Falle 

von Overtraining dargestellt [39]. . . . . . . . . . . . . . . . . . . . . . . . . 45 

6.1. Schematische Skizze zur Vorgehensweise zum Trainieren eines neuronalen 

Netzwerkes mit Flugdaten [42]. . . . . . . . . . . . . . . . . . . . . . . . . . 48 

6.2. Effizienz der angewandten Bedingungen bezüglich des vorangegangen Schnittes. 

Die Beschreibungen der einzelnen Schnitte sind im Text zu finden. . . . 49 

6.3. Verbleibender Anteil des Triggersamples nach jeder der angewandten Bedingungen. 

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 

6.4. Schematische Darstellung eines Entscheidungsbaumes, der Ereignisse mit 

Paramtern x in Signal S und Untergrund B anhand von Einzelentscheidungen, 

einteilt (links) [43] und Ausgabe des BDT in der AMS Software 

für Leptonen und Protonen, selektiert mit dem TrdQt Likelihoodverhältnis 

(rechts). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 

6.5. Verteilung der EoverP Variable, die das Verhältnis von im Kalorimeter 

deponierter- zur Gesamtenergie eines Teilchens gibt. . . . . . . . . . . . . . 52 

81

82 Abbildungsverzeichnis 

6.6. Energieabgabe in Lage 6 über der Rigidität bis 300 GV für Protonen (links) 

und Elektronen (rechts). In schwarz ist die durchschnittliche Energieabgabe 

gezeigt (zut Interpretation sollte die logarithmisch gezeichnete y-Achse 

beachtet werden. Die Energieabgabe über 10 2 ADC stellt also einen signifikanten 

Anteil des Mittelwertes dar). . . . . . . . . . . . . . . . . . . . . . . 53 

6.7. Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration 

der Eingangsvariablen gegen die Signaleffizienz. . . . . . . . . . . . . . 54 

6.8. Protonenunterdrückung neuronaler Netze mit unterschiedlicher Konfiguration 

der Eingangsvariablen mit der Rigidität des Teilchens. . . . . . . . . . 54 

6.9. Relativistische Geschwindigkeit über der Rigidität bis 300 GV für Protonen 

(links) und Elektronen (rechts). In schwarz ist die der Verlauf des Durchschnitts 

gezeigt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

6.10. Protonenunterdrückung neuronaler Netze, trainiert in unterschiedlichen Energiebereichen. 

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

6.11. Durchschnittliche Energieabgabe von Protonen (rot) und Leptonen (dunkelblau) 

in den 20 Lagen des Übergangsstrahlungsdetektors mit angedeutetem 

Schnitt auf das Protonensample für die Trainingsauswahl. . . . . . . . . . . 56 

6.12. Verteilung der Ausgabewerte des neuronalen Netzwerkes für das Trainingsund 

das Testsample aufgeteilt nach Signal und Untergrundereignissen (oben). 

Darunter sind die Residuen der Verteilungen dargestellt. . . . . . . . . . . . 58 

6.13. Verteilung der Ausgabewerte von Protonen (links) und Elektronen (rechts) 

nach einer Trainingsiteration mit Gewichtsfunktion (grün). . . . . . . . . . 59 

6.14. Vergleich des verstärkten neuronalen Netzwerkes mit dem unverstärkten im 

Bereich von 2 − 5 GV (links) und 5 − 300 GV (rechts). . . . . . . . . . . . . 59 

6.15. Verteilung der Ausgabewerte des neuronalen Netzwerks und deren Interpretation. 

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 

7.1. Protonenunterdrückung mit der Signaleffizienz des neuronalen Netzwerks 

(dunkelblau), sowie des TrdQt- (rot) und des TrdK-Likelihoodverhältnisses 

(blau). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 

7.2. Protonenunterdrückung mit Rigidität im Bereich 5−300 GV für das neuronale 

Netzwerks (schwarz), sowie für das TrdQt- (rot) und TrdK-Likelihoodverhältnis 

(blau). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 

7.3. Übereinstimmung der Auswahl von Elektronen bei 90% Signaleffizienz durch 


Netzwerk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 

7.4. Verteilung des BDT Ausgabewertes der Protonenschablone (links) und der 

Elektronenschablone (rechts), selektiert mit dem Übergangsstrahlungsdetektor. 

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 

7.5. Verteilung des BDT Ausgabewertes einer Auswahl von Positronen mit dem 

neuronalen Netzwerk bei einer Elektronen Effizienz von 90% im Rigiditätsbereich 

7, 96 − 10, 05 GV (links) und Anpassung der Schablonen an dies 

Positronenauswahl (rechts). . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 

7.6. Schematische Darstellung der Verteilung des Entscheidungsbaumes in der 

Region der minimal ionisierenden Teilchen in der Longitudinalen und Lateralen 

Schauerausbreitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 

7.7. Reinheit der Positronenauswahl mit der Effizienz auf die Positronenselektion. 68 

7.8. Entscheidungsgrenzen am Arbeitspunkt mit der Rigidität (links) und Signaleffizienz 

bei diesen Entscheidungsgrenzen mit der Rigidität (rechts). . . 68 

7.9. Reinheit der Positronenauswahl mit der Rigidität. . . . . . . . . . . . . . . 69 

82


7.10. Übereinstimmung der Auswahl von Elektronen am Arbeitspunkt durch die 

Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen 

Netzwerk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 

7.11. Übereinstimmung der Auswahl von Positronen am Arbeitspunkt durch die 

Likelihoodverhältnisse aus der TrdQt und der TrdK, sowie dem neuronalen 

Netzwerk gewichtet mit der Reinheit. . . . . . . . . . . . . . . . . . . . . . . 70 

7.12. Positronenauswahl der Separationsmethoden mit der Rigidität. . . . . . . . 71 

83

Anhang 

A. Ausschnitt der Analysedatei für das neuronale Netzwerk 

im Rigiditätsbereich 2 − 5 GV 

Es sind jeweils die drei Variablen dargestellt, die zur Separation im neuronalen Netzwerk 

den größten und den geringsten Beitrag liefern. Außerdem ist die Korrelationsmatrix 

zwischen den Eingangsvariablen und dem Zielwert dargestellt. Die Nummerierung der Variablen 

bedeutet: 

1: Zielwert 

2-21: Energieabgabe in Lage 1-20 in aufsteigender Reihenfolge, beginnend mit der Untersten 

Lage. 

22: Teildruck des Xenongases 

23: Relativistische Geschwindigkeit 

24: Einfallswinkel zur z-Achse im Übergangsstrahlungsdetektor 

85

A. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI 

Input node 23 : BetaH 

1st most important 

added signi. 855.24 

signi. loss 260.94 

PrePro: 14 

only this 855.24 

corr. to others 38.10% 

Phi-T 

® 

NeuroBayes 

Teacher 

events 

35000 

30000 

25000 

20000 

15000 

10000 

5000 

0 

0 0.2 0.4 0.6 0.8 1 

flat 

1.399437 

1.100351 

1.078029 

1.065192 

1.056015 

1.048733 

1.04268 

1.037391 

1.032703 

1.02845 

1.024516 

1.020873 

1.017451 

1.014212 

1.011099 

1.008133 

1.005258 

1.002483 

0.9997801 

0.9971423 

0.9945523 

0.9919873 

0.9894633 

0.9869387 

0.9844563 

0.9819705 

0.9794869 

0.9769875 

0.9744718 

0.9719208 

0.9693583 

0.9667521 

0.9640802 

0.9613398 

0.9585309 

0.9556495 

0.9526754 

0.9495729 

0.9463084 

0.9428559 

0.9392083 

0.935312 

0.9310813 

0.9264022 

0.921209 

0.9152441 

0.9081725 

0.8993907 

0.8872931 

0.8662445 

0.6000374 

1 

spline fit 

purity 

0.8 

0.6 

0.4 

0.2 

0 

10 20 30 40 50 60 70 80 90 100 

bin # 

events 

120 

100 

80 

60 

40 

3 

× 10 

background 

Underflow 0 

Overflow 0 

signal 

Underflow 0 

Overflow 0 

final 

20 

0 

-3 -2 -1 0 1 2 3 

final netinput 

1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 

signal efficiency 

86


Input node 2 : trdCorrPLCalibAmp_01 

2nd most important 



PrePro: 34 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

25000 

20000 

15000 

10000 

5000 

433859 

+ δ 

0 

0 0.2 0.4 0.6 0.8 1 

flat 

5187.892 

1369.59 

1107.222 

951.8484 

840.4878 

753.5143 

681.5417 

620.3561 

567.4154 

520.2942 

478.3508 

440.5281 

405.674 

372.9406 

341.6276 

311.5186 

281.8334 

254.0245 

228.958 

207.7957 

190.2112 

175.4075 

162.7582 

151.6648 

141.8791 

133.1637 

125.1968 

117.9706 

111.3237 

105.1213 

99.31538 

93.79573 

88.63403 

83.70804 

78.97566 

74.42928 

70.05956 

65.87531 

61.7957 

57.86063 

54.03711 

50.28083 

46.58661 

42.90292 

39.21753 

35.436 

31.50442 

27.23672 

22.45378 

16.64294 

5.467211 

purity 

1.1 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0 20 40 60 80 100 

bin # 

spline fit 

events 

250 

200 

150 

100 

3 

× 10 

background 

Underflow 0 

Overflow 0 

signal 

Underflow 0 

Overflow 0 

final 

50 

0 

-3 -2 -1 0 1 2 3 


1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


87



3rd most important 



PrePro: 34 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

25000 

20000 

15000 

10000 

5000 

481483 

+ δ 

0 

0 0.2 0.4 0.6 0.8 1 

flat 

5056.227 

1357.681 

1100.936 

949.5911 

840.5353 

754.5347 

683.9365 

623.5177 

570.6536 

523.9442 

482.403 

444.761 

410.1113 

377.554 

346.3172 

315.8091 

286.0721 

257.5736 

232.4112 

210.7303 

192.6581 

177.4841 

164.5917 

153.379 

143.4881 

134.6227 

126.5669 

119.2384 

112.4591 

106.2098 

100.3631 

94.83015 

89.54459 

84.51933 

79.76627 

75.23732 

70.81435 

66.58655 

62.49566 

58.517 

54.67928 

50.93496 

47.24749 

43.57888 

39.82298 

35.9854 

31.96201 

27.63112 

22.73946 

16.73352 

4.349168 

purity 

1.1 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0 20 40 60 80 100 

bin # 

spline fit 

events 

300 

250 

200 

150 

100 

3 

× 10 

background 

Underflow 0 

Overflow 0 

signal 

Underflow 0 

Overflow 0 

final 

50 

0 

-3 -2 -1 0 1 2 3 


1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


88






PrePro: 34 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

24000 

22000 

20000 

18000 

16000 

14000 

12000 

10000 

8000 

6000 

4000 

2000 

0 

868342 

+ δ 

0 0.2 0.4 0.6 0.8 1 

flat 

6041.599 

1110.968 

865.7998 

732.9839 

643.5043 

575.6859 

521.3511 

476.4004 

438.2697 

404.3527 

373.5493 

344.5736 

317.0714 

290.3966 

264.9343 

241.6966 

221.2569 

203.5454 

188.453 

175.5161 

164.1541 

154.1823 

145.2344 

137.1628 

129.7391 

122.9339 

116.6403 

110.6698 

105.0707 

99.77618 

94.72484 

89.92406 

85.32338 

80.89519 

76.62537 

72.5141 

68.51025 

64.6149 

60.80059 

57.07046 

53.44294 

49.83293 

46.24947 

42.66248 

39.02958 

35.25742 

31.31008 

26.96108 

22.02558 

15.94596 

4.718814 

purity 

1.1 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0 20 40 60 80 100 

bin # 

spline fit 

500 

400 

3 

× 10 

background 

Underflow 0 

Overflow 0 

signal 

Underflow 0 

Overflow 0 

final 

events 

300 

200 

100 

0 

-3 -2 -1 0 1 2 3 


1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


89


Input node 24 : TrdTheta 




PrePro: 14 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

22000 

20000 

18000 

16000 

14000 

12000 

10000 

8000 

6000 

4000 

2000 

0 

0 0.2 0.4 0.6 0.8 1 

flat 

0.4617698 

0.3705839 

0.3518855 

0.3382589 

0.3270903 

0.3172321 

0.3083608 

0.3001441 

0.2923863 

0.2850505 

0.2780822 

0.2713964 

0.2649222 

0.258674 

0.2525556 

0.2465838 

0.2407531 

0.2350209 

0.2293701 

0.2237482 

0.2182046 

0.2127205 

0.2073456 

0.202138 

0.196957 

0.1918237 

0.186721 

0.181664 

0.1765808 

0.1715089 

0.1664513 

0.1613503 

0.1562231 

0.1510617 

0.1458857 

0.1406432 

0.1352804 

0.1298138 

0.1242574 

0.1185254 

0.1126188 

0.1064881 

0.1001931 

0.0936 

0.0865 

0.079 

0.0707 

0.0614 

0.0505 

0.0363 

0.000133 

purity 

0.75 

0.7 

0.65 

0.6 

0.55 

0.5 

0.45 

0.4 

10 20 30 40 50 60 70 80 90 100 

bin # 

spline fit 

events 

10 

180 

160 

140 

120 

100 

80 

60 

40 

× 3 

background 

Underflow 

1.623e+04 

Overflow 0 

signal 

Underflow 1.817e+04 

Overflow 0 

20 

0 

-3 -2 -1 0 1 2 3 


final 

1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


90


Input node 22 : XePressure 




PrePro: 14 



Phi-T 

® 

NeuroBayes 

Teacher 

25000 

20000 

events 

15000 

10000 

5000 

flat 

0 

0 0.2 0.4 0.6 0.8 1 

957.5226 

927.3995 

908.1777 

881.1694 

870.1697 

860.6412 

853.0984 

848.3617 

843.8889 

840.176 

836.9884 

833.843 

829.9792 

826.9833 

823.6919 

820.6704 

817.0032 

814.1653 

811.0883 

808.6268 

805.8223 

802.9522 

800.0515 

797.2932 

794.8823 

792.7988 

790.7637 

788.5785 

786.1142 

783.6104 

780.2161 

776.8483 

772.6436 

769.4099 

766.3697 

763.0281 

759.647 

756.3378 

752.5549 

748.6431 

744.7544 

738.3484 

733.9265 

728.7922 

725.6871 

721.8424 

716.218 

711.0453 

705.0251 

693.4141 

673.8303 

purity 

0.8 

0.75 

0.7 

0.65 

0.6 

0.55 

0.5 

0.45 

0.4 

10 20 30 40 50 60 70 80 90 100 

bin # 

spline fit 

events 

250 

200 

150 

100 

3 

× 10 

background 

Underflow 0 

Overflow 0 

signal 

Underflow 0 

Overflow 0 

final 

50 

0 

-3 -2 -1 0 1 2 3 


1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


91


correlation matrix of input variables 

Phi-T 

® 

NeuroBayes 

Teacher 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

21 

22 

23 

24 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

21 

22 

23 

24 

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 

92

B. Ausschnitt der Analysedatei für das neuronale Netzwerk im Rigiditätsbereich 5 − 300 

GV 93 

B. Ausschnitt der Analysedatei für das neuronale Netzwerk 

im Rigiditätsbereich 5 − 300 GV 

Es sind jeweils die drei Variablen dargestellt, die zur Separation im neuronalen Netzwerk 

den größten und den geringsten Beitrag liefern. Außerdem ist die Korrelationsmatrix 

zwischen den Eingangsvariablen und dem Zielwert dargestellt. Die Nummerierung der Variablen 

bedeutet: 

1: Zielwert 

2-21: Energieabgabe in Lage 1-20 in aufsteigender Reihenfolge, beginnend mit der Untersten 

Lage. 

22: Rigidität 

23: Teildruck des Xenongases 

24: Einfallswinkel zur z-Achse im Übergangsstrahlungsdetektor 

93

B. AUSSCHNITT DER ANALYSEDATEI FÜR DAS NEURONALE NETZWERK IM RIGIDITÄTSBEREI 





PrePro: 34 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

30000 

25000 

20000 

15000 

10000 

5000 

0 

348809 

+ δ 

0 0.2 0.4 0.6 0.8 1 

flat 

4914.171 

1039.354 

768.8289 

615.7069 

510.048 

432.72 

372.9626 

323.4832 

281.9772 

247.8554 

221.2952 

200.6322 

184.2086 

170.7083 

159.3502 

149.6192 

141.0025 

133.4103 

126.5006 

120.2507 

114.5081 

109.1841 

104.2368 

99.5844 

95.19666 

91.05158 

87.08572 

83.30116 

79.68558 

76.23055 

72.90968 

69.6701 

66.57407 

63.55056 

60.63733 

57.79167 

55.03362 

52.34347 

49.67154 

47.04086 

44.4186 

41.78348 

39.10942 

36.37815 

33.57457 

30.62705 

27.48236 

24.04369 

20.0779 

15.26057 

5.517467 

purity 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 

0 20 40 60 80 100 

bin # 

spline fit 

events 

450 

400 

350 

300 

250 

200 

150 

100 

3 

× 10 

background 

Underflow 0 

Overflow 

3.32e+04 

signal 

Underflow 0 

Overflow 

5.328e+04 

50 

0 

-3 -2 -1 0 1 2 3 


final 

1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


94






PrePro: 34 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

30000 

25000 

20000 

15000 

10000 

5000 

353046 

+ δ 

0 

0 0.2 0.4 0.6 0.8 1 

flat 

5184.061 

1034.124 

767.7705 

616.8388 

512.5553 

435.3591 

375.2073 

325.7245 

283.7613 

249.8716 

223.1833 

202.3612 

185.8178 

172.3129 

160.84 

151.0179 

142.3509 

134.6774 

127.7773 

121.449 

115.6295 

110.2467 

105.2585 

100.5728 

96.14638 

91.94565 

87.96183 

84.14177 

80.50351 

77.00533 

73.6557 

70.40901 

67.27305 

64.23938 

61.27406 

58.42184 

55.61806 

52.90528 

50.20462 

47.53442 

44.90078 

42.25595 

39.5536 

36.81123 

33.97744 

30.97629 

27.76586 

24.23906 

20.2081 

15.2593 

5.188988 

purity 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 

0 20 40 60 80 100 

bin # 

spline fit 

events 

350 

300 

250 

200 

150 

100 

50 

3 

× 10 

background 

Underflow 0 

Overflow 

3.332e+04 

signal 

Underflow 0 

Overflow 

5.299e+04 

0 

-3 -2 -1 0 1 2 3 


final 

1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


95






PrePro: 34 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

30000 

25000 

20000 

15000 

10000 

5000 

337762 

+ δ 

0 

0 0.2 0.4 0.6 0.8 1 

flat 

4819.777 

1035.006 

769.8124 

618.1377 

513.5813 

436.2079 

375.774 

325.9545 

284.0431 

249.7908 

223.0231 

202.3457 

185.729 

172.097 

160.6341 

150.7854 

142.0866 

134.4162 

127.4888 

121.2172 

115.458 

110.0854 

105.1045 

100.4109 

96.00632 

91.82274 

87.84129 

84.02768 

80.39516 

76.89474 

73.52493 

70.28131 

67.13827 

64.08839 

61.14251 

58.2922 

55.49753 

52.76738 

50.09917 

47.44595 

44.82158 

42.19268 

39.50712 

36.7534 

33.9009 

30.90087 

27.72095 

24.1898 

20.19525 

15.2736 

5.899064 

purity 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 

0 20 40 60 80 100 

bin # 

spline fit 

events 

350 

300 

250 

200 

150 

100 

50 

3 

× 10 

background 

Underflow 0 

Overflow 

3.156e+04 

signal 

Underflow 0 

Overflow 

5.016e+04 

0 

-3 -2 -1 0 1 2 3 


final 

1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


96


Input node 22 : Rabs 




PrePro: 14 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

35000 

30000 

25000 

20000 

15000 

10000 

5000 

0 

0 0.2 0.4 0.6 0.8 1 

flat 

299.9975 

91.78024 

62.51433 

49.27654 

41.41805 

36.13225 

32.28812 

29.29262 

26.88197 

24.87893 

23.15389 

21.63084 

20.28647 

19.0916 

18.0127 

17.0347 

16.13735 

15.32545 

14.58312 

13.90427 

13.28219 

12.70855 

12.18237 

11.6901 

11.23266 

10.80431 

10.40385 

10.0287 

9.673396 

9.338589 

9.026165 

8.728868 

8.446316 

8.179838 

7.926431 

7.684944 

7.455448 

7.232958 

7.021305 

6.818047 

6.622366 

6.434406 

6.253811 

6.078671 

5.909512 

5.745498 

5.58785 

5.434582 

5.284349 

5.140067 

5.000001 

0.4 

spline fit 

purity 

0.3 

0.2 

0.1 

0 

10 20 30 40 50 60 70 80 90 100 

bin # 

events 

3 

× 10 

background 

200 

Underflow 0 

Overflow 0 

180 

signal 

160 

Underflow 0 

Overflow 0 

140 

120 

100 

80 

60 

40 

20 

0 

-3 -2 -1 0 1 2 3 


final 

1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


97


Input node 23 : XePressure 




PrePro: 14 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

30000 

25000 

20000 

15000 

10000 

5000 

0 

0 0.2 0.4 0.6 0.8 1 

flat 

957.5234 

925.3198 

904.099 

876.9962 

864.222 

857.3082 

850.7179 

846.3821 

842.7605 

839.2656 

836.2207 

833.2805 

829.7496 

826.4435 

823.3109 

820.3891 

816.8484 

814.0654 

811.2056 

808.8173 

805.9642 

803.1381 

800.3605 

797.9133 

795.5087 

793.2348 

791.2104 

789.2292 

787.0731 

784.6501 

781.5228 

778.5696 

774.0419 

771.1307 

768.0739 

765.0428 

761.407 

757.829 

754.4852 

750.592 

746.7178 

741.9993 

736.1835 

730.6431 

726.8955 

723.1272 

717.9636 

712.0719 

705.8931 

695.4951 

673.8303 

purity 

0.26 

0.24 

0.22 

0.2 

0.18 

0.16 

0.14 

0.12 

0.1 

10 20 30 40 50 60 70 80 90 100 

bin # 

spline fit 

events 

3 

× 10 

background 

200 

Underflow 0 

180 

Overflow 

signal 

2.693e+04 

160 

Underflow 0 

Overflow 6738 

140 

120 

100 

80 

60 

40 

20 

0 

-3 -2 -1 0 1 2 3 


final 

1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


98


Input node 24 : TrdTheta 




PrePro: 14 



Phi-T 

® 

NeuroBayes 

Teacher 

events 

30000 

25000 

20000 

15000 

10000 

5000 

0 

0 0.2 0.4 0.6 0.8 1 

flat 

0.3354059 

0.2687234 

0.2543075 

0.2440088 

0.2357388 

0.2286777 

0.2223225 

0.2165484 

0.211204 

0.206202 

0.2014383 

0.1968907 

0.192484 

0.1882222 

0.1841263 

0.1801225 

0.1761906 

0.1723429 

0.1685615 

0.1648228 

0.161126 

0.1575091 

0.15388 

0.1503039 

0.1467278 

0.1431729 

0.1396151 

0.136053 

0.1325064 

0.1289332 

0.1253528 

0.1217531 

0.1180875 

0.1144042 

0.1106882 

0.1069056 

0.1030646 

0.0991368 

0.0951 

0.091 

0.0867 

0.0822 

0.0775 

0.0725 

0.0672 

0.0615 

0.0552 

0.0481 

0.0396 

0.0284 

0.000119 

0.22 

0.2 

spline fit 

purity 

0.18 

0.16 

0.14 

0.12 

10 20 30 40 50 60 70 80 90 100 

bin # 

events 

140 

120 

100 

80 

60 

40 

20 

3 

× 10 

background 

Underflow 0 

Overflow 0 

signal 

Underflow 0 

Overflow 0 

0 

-3 -2 -1 0 1 2 3 


final 

1 

separation 

signal purity 

0.8 

0.6 

0.4 

0.2 

0 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


99


correlation matrix of input variables 

Phi-T 

® 

NeuroBayes 

Teacher 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

21 

22 

23 

24 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

21 

22 

23 

24 

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 

100

IEKP-KA/2013-8 - Institut fÃ¼r Experimentelle Kernphysik - KIT

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?