IEKP-KA/2013-8 - Institut fÃ¼r Experimentelle Kernphysik - KIT

Weitere Magazine

Empfehlungen

Info

56 6. Das neuronale Netzwerk für den Übergangsstrahlungsdetektor Abbildung 6.11.: Durchschnittliche Energieabgabe von Protonen (rot) und Leptonen (dunkelblau) in den 20 Lagen des Übergangsstrahlungsdetektors mit angedeutetem Schnitt auf das Protonensample für die Trainingsauswahl. det. Damit kann die für die Berechnung der Energieabgaben benötigte Pfadlänge genauer angegeben werden. Getestet wurde das Netzwerk allerdings auch auf Ereignissen ohne einen zugeordneten Treffer in Lage 1. 6.3. Training des neuronalen Netzwerks Je mehr Ereignisse des Trainingssamples für das Netzwerktraining verwendet werden können, desto besser kann die Verteilung der Eingangsparameter vom Netzwerk nachvollzogen und damit deren Separation optimiert werden. Die Anzahl an Trainingsereignissen ist vor allem durch die Anzahl an Elektronen als Signalereignisse im Trainingssample begrenzt. Diese machen nur etwa 1% der Trainingsdaten aus. Um den Trainingsprozess nicht zu sehr durch Protonen als Untergrund zu dominieren, wird nur ein Teil der Protonenauswahl verwendet. Um trotzdem ein gutes Trainingsresultat zu erzielen, werden hierfür speziell die Protonen herausgefiltert, die nur schwer von Elektronen zu unterscheiden sind und damit einen schweren Untergrund darstellen. Um diese nicht direkt anhand der Eingangsvariablen zu selektieren und weiterhin den gesamten Parameterraum abzudecken, wird die durchschnittliche Energieabgabe in allen Lagen betrachtet. Protonen mit einer überdurchschnittlich hohen Energieabgabe im Detektor bilden dann diesen schwer zu unterscheidenden Untergrund und werden für das Training verwendet. Die Verteilung der durchschnittlichen Energieabgabe bei Protonen und Leptonen aus Flugdaten, selektiert mit dem elektromagnetischen Kalorimeter, ist in Abbildung 6.11 gezeigt. Das Netzwerk sollte Protonen mit geringer durchschnittlicher Energieabgabe trotzdem einordnen können und wird daher auf alle Protonenereignisse getestet. 6.3.1. Test auf Over-Training Um für das Training keine weiteren Daten zu verlieren, soll das Traingssample nicht, wie in Teil 5.3.3 beschrieben, aufgeteilt werden, um ein unabhängiges Testsample zu erhalten, sondern im Ganzen für das Training verwendet werden. Dabei soll der Trainingsalgorithmus innerhalb der Neurobayes R○ Software automatisch stoppen, wenn ein gutes globales 56
6.3. Training des neuronalen Netzwerks 57 Minimum der Fehlerfunktion E(w) gefunden ist und damit Over-Training verhindern. Dies passiert durch die sogenannte BFGS-Methode 7 , die eine schnelle Möglichkeit bietet ein globales Minimum zu finden [40]. Um dies zu testen, wird das Trainingssample in 10 Teile geteilt. Jedes dieser Teilsamples wird dann in einer Trainingsprozedur mit den übrigen neun Teilsamplen, bei gleichen Trainingseinstellungen, als Testsample verwendet. Es wird getestet ob in einem der 10 Trainingsprozeduren Over-Training stattfindet. Ist dies nicht der Fall, kann das Netzwerk bei gleichen Trainingseinstellungen mit der gesamten Trainingsauswahl trainiert werden ohne Over-Training zu riskieren. Um auf Over-Training zu testen, werden die Verteilungen der Ausgabewerte des neuronalen Netzwerks für das Test- und das Trainignssample verglichen. Sind die Werte gleich verteilt, hat kein Over-Training statt gefunden. Man erhält eine Ausgabe wie sie in Abbildung 6.12 dargestellt ist für jede der 10 Trainingsprozeduren. Die Verteilung der Residuen wird nach r = t T raining − t T est (6.3) N T est + N T raining gebildet, wobei t T raining,T est der Ausgabewert des Trainings, bzw. des Testsamples für einen Bin und N T raining,T est der Inhalt des entsprechenden Bins ist. Die Residuen sollten über den möglichen Ausgabewerten zufällig verteilt sein und kein Muster aufweisen. Ist dies der Fall können die Verteilungen als gleich angesehen werden. Das ist, wie in Abbildung 6.12, für alle Teiltrainings der Fall, so dass man davon ausgehen kann, dass kein Over-Training stattfindet. 6.3.2. Training mit Gewichten Eine weitere Möglichkeit das Training des neuronalen Netzwerkes zu optimieren, besteht in der Verwendung von Gewichten. Diese stellen eine Größe dar, mit der die Bedeutung eines Ereignisses für das Training beschrieben wird. Jedem Trainingsereignis wird dabei eine reelle Zahl zwischen 0 und 1 zugeordnet, wobei mit 1 gewichtete Ereignisse besonders stark in das Training einfließen und mit 0 gewichtete Ereignisse für das Training nicht beachtet werden. Für die Festlegung der Gewichte wird die Netzwerkausgabe nach einer Trainingsiteration betrachtet. Die Gewichte werden dann so gesetzt, dass bereits gut eingeordnete Ereignisse ein geringes Gewicht für das Training erhalten. Falsch eingeordnete Ereignisse erhalten ein hohes Gewicht. Dazu wird der Ausgabewert t des Netzwerks auf das Intervall zwischen 0 und 1 transformiert, wobei 1 einem Signal und 0 einem Untergrundereignis entspricht. Dann werden die Gewichte g linear nach diesem Ausgabewert mit g Sig = 1 − t für Signalereignisse und g Bkg = t für Untergrundereignisse festgelegt, wie es in Abbildung 6.13 dargestellt ist. Anschließend kann das Training mit einer gewöhnlichen Anzahl an Iterationen durchgeführt werden. Um den Ausgabewert des neuronalen Netzwerkes auch weiterhin als Wahrscheinlichkeit im Sinne der Bayes-Statistik nach Teil 5.3.4 interpretieren zu können, muss eine an das Training anschließende Rückgewichtung nach t 1 · t 2 ˜t = (6.4) t 1 t 2 + (1 − t 1 )(1 − t 2 ) durchgeführt werden, wobei t 1 der Ausgabewert nach einer Trainingsiteration und t 2 den Ausgabewert nach dem zweiten Training, darstellt. Die Methode Gewichte nach diesem Vorgehen festzulegen wird als Verstärkung bezeichnet. Der Einfluss der Verstärkung auf die Protonenunterdrückung der Netzwerke im Bereich 2−5 GV und 5−300 GV ist in Abbildung 6.14 gezeigt. Demnach scheint das Training mit Gewichten für das Netzwerk bei niedrigen Energien ein Nachteil zu sein und wird daher nicht angewandt. Bei hohen Energien erreicht man durch das Verstärken einen kleinen Vorteil. Die Schwierigkeit bei der hier vorgestellten Methode liegt in der Stärke der Netzwerke nach bereits einer Trainingsiteration, so dass ein Großteil des Trainingssamples zu gering gewichtet wird. 7 Broyden-Fletcher-Goldfarb-Shanno Methode 57
Seite 1 und 2:
IEKP-KA/2013-8 Positronen Identifiz
Seite 3 und 4:
Inhaltsverzeichnis 1. Einleitung 1
Seite 5 und 6:
1. Einleitung Die Teilchenphysik ko
Seite 7:
3 Abbildung 1.2.: Foto des AMS-02 D
Seite 10 und 11: 6 2. Physikalischer Hintergrund Abb
Seite 12 und 13: 8 2. Physikalischer Hintergrund Abb
Seite 14 und 15: 10 2. Physikalischer Hintergrund im
Seite 16 und 17: 12 2. Physikalischer Hintergrund mi
Seite 18 und 19: 14 2. Physikalischer Hintergrund Di
Seite 20 und 21: 16 3. Der AMS-02 Detektor tektor ei
Seite 22 und 23: 18 3. Der AMS-02 Detektor Abbildung
Seite 24 und 25: 20 3. Der AMS-02 Detektor Loch Paar
Seite 26 und 27: 22 3. Der AMS-02 Detektor nem Brech
Seite 28 und 29: 24 3. Der AMS-02 Detektor gien bis
Seite 31 und 32: 4. Der Übergangsstrahlungsdetektor
Seite 33 und 34: 4.2. Aufbau des Detektors und Messu
Seite 35 und 36: 4.3. Gassystem und Betrieb auf der
Seite 37 und 38: 4.4. Kalibrierung 33 Abbildung 4.7.
Seite 39 und 40: 4.5. Unterscheidung von Protonen un
Seite 41 und 42: 5. Statistische Methoden Aus den Me
Seite 43 und 44: 5.2. Das Likelihoodverhältnis 39 A
Seite 45 und 46: Entries 3137898 Mean 1.027 RMS 0.14
Seite 47 und 48: 5.3. Künstliche neuronale Netze 43
Seite 49 und 50: 5.3. Künstliche neuronale Netze 45
Seite 51 und 52: 6. Das neuronale Netzwerk für den
Seite 53 und 54: 6.1. Selektion des Trainingssamples
Seite 55 und 56: 6.2. Eingangs-Variablen 51 Abbildun
Seite 57 und 58: 6.2. Eingangs-Variablen 53 Energiea
Seite 59: 6.2. Eingangs-Variablen 55 Beta 1.4
Seite 63 und 64: 6.3. Training des neuronalen Netzwe
Seite 65 und 66: 6.4. Ausgabe des neuronalen Netzwer
Seite 67 und 68: 7. Vergleich von Methoden zur Proto
Seite 69 und 70: 7.1. Reinheit der Separationsmethod
Seite 71 und 72: 7.2. Vergleich anhand der ermittelt
Seite 73 und 74: 7.2. Vergleich anhand der ermittelt
Seite 75: 7.2. Vergleich anhand der ermittelt
Seite 79 und 80: Literaturverzeichnis [1] NASA/WMAP
Seite 81: Literaturverzeichnis 77 [40] Bishop
Seite 84 und 85: 80 Abbildungsverzeichnis 3.7. Schem
Seite 86 und 87: 82 Abbildungsverzeichnis 6.6. Energ
Seite 89 und 90: Anhang A. Ausschnitt der Analysedat
Seite 91 und 92: A. AUSSCHNITT DER ANALYSEDATEI FÜR
Seite 97 und 98: B. Ausschnitt der Analysedatei für
Seite 99 und 100: B. AUSSCHNITT DER ANALYSEDATEI FÜR
Alle anzeigen

IEKP-KA/2013-8 - Institut fÃ¼r Experimentelle Kernphysik - KIT

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?