Quantitative Analyse von Protein-Massenspektren
Quantitative Analyse von Protein-Massenspektren Quantitative Analyse von Protein-Massenspektren
Um diese Probleme zu umgehen, werden die Daten auf der y-Skala linear transformiert: Sie werden auf einen Bereich von 0% bis 100% normalisiert. Diese Art der Normalisierung beeinflusst nicht das Fitting-Ergebnis. Eine nichtlineare Transformation hingegen verändert die relativen Positionen der Datenpunkte. Beim Fitten äußert sich das dadurch, dass eine andere Funktion gefunden wird, welche χ² minimiert (vgl. Abb. 3.6.3.1). Es werden also andere Parameter gefunden. [Motulsky] Als weitere Verbesserungsmaßnahme, werden für jeden Parameter Schranken gesetzt, d.h. es werden nur sinnvolle Parameterbereiche zugelassen. Dies hat zur Folge, dass der Suchraum und somit die notwendige Rechenzeit weiter verkleinert wird. Für die Glykoproteine haben sich folgende Schranken als sinnvoll erwiesen: 62 Abb. 3.6.3.1: Effekt einer nicht-linearen Transformation. In beiden Bildern ist die Hüllkurve eines Antikörpers mit einer Masse von ca. 50kD dargestellt (schwarze Linie). Links auf der z-Skala und rechts auf der m/z-Skala (m/z=(m+1.008z)/z). Rechts ist die Variante, wie man sie im Spektrum sehen würde. In beiden Fällen wurde ein LM- Fitting (rote Kurve) mit zwei Gauß-Funktionen (grau gestrichelte Kurven) durchgeführt. Auf der z-Skala hat der Fit perfekt geklappt und man erhält für die Hüllkurve I(z)=GAUSS(z,696,39,12.5)+GAUSS(z,1840,55,16.5). Auf der m/z- Skala hingegen gelingt das Fitting überhaupt nicht. • die Amplitude muss in einem Bereich zwischen 1 und 130 liegen, • der Mittelpunkt muss zwischen 5 und 95 liegen, • und die Halbwertsbreite muss in dem Bereich zwischen 2 und 17 liegen. Ein weiterer Faktor, der optimiert werden kann, betrifft die Initialisierung der Startparameter. Es ist empfehlenswert, diese nicht einfach auf den Wert 1 zu setzen. Ebenso sollten sie nicht auf einen anderen konstanten Wert gesetzt werden. Vielmehr sollte der Wert abhängig vom aktuellen Umfeld, dynamisch gewählt werden. Speziell für Glykoproteine werden die Startparameter wie folgt festgelegt: Die Amplitude wird auf einen 15% der maximalen Intensität gesetzt. Die Zentren der Basisfunktionen werden in gleichmäßigen Abständen auf der z-Skala verteilt. Für die Halbwertsbreite wird ein Wert von 4 vergeben. Wenn die zu fittende Funktion mehrere Minima hat, kann man nicht mit Sicherheit sagen, dass man das globale Minimum findet. Das gefundene Minimum hängt von den gewählten Startparametern ab. Als Lösung für dieses Problem werden fünf verschiedene Fittings mit jeweils maximal 5000 Iterationen durchgeführt. Nach jedem Fit-Lauf werden die Startparameter zufällig verändert. Am Ende werden diejenigen Parameter gewählt, welche den besten R²
Wert ergeben haben. Die Ausführung mehrerer Fit-Läufe mit unterschiedlichen Startparametern soll gewährleisten, dass man nicht fälschlicherweise in einem lokalen Minimum hängen bleibt. Beim Betrachten komplexer Spektren kann häufig das Problem auftreten, dass weniger Datenpunkte als Parameter vorhanden sind. In diesem Fall ist ein Fitting nicht durchführbar. Mit komplexen Spektren, sind solche Spektren gemeint, in denen viele Varianten einer Masse vorkommen, welche sich nur durch geringe Massendifferenzen unterscheiden. Ebenso sind Kombinationen, bei denen Massen von ungefähr halber Größe vorkommen, ungünstig, wie es z.B. bei reduzierten Antikörpern der Fall sein kann (leichte Kette ca. 25kD und schwere Kette ca. 50kD). Die Peaks dieser beschriebenen Fälle liegen im Spektrum entsprechend dicht beieinander und überlagern häufig gegenseitig. Dies führt dazu, dass wenige freie Peaks und somit wenige Punkte für das Fitting zu Verfügung stehen. Um diesem Problem gerecht zu werden, kann man folgende Annahme machen: Die Varianten einer Masse bzw. eines Glykoproteins haben eine sehr ähnliche Hüllkurve. Folglich kann man einen einmal bestimmten Satz an Parametern der Modellfunktion für die anderen Molekülvarianten wieder verwenden. Hierzu definiert man sich eine Masse als Hauptkomponente, welche für die anderen Varianten als Grundlage dienen soll. Das stellt kein Problem dar, da häufig eine Masse im Spektrum derart gut repräsentiert ist, dass deren Hüllkurve ohne weiteres gefittet werden kann. Eine alternative Lösung dazu ist es, zuerst die Hüllkurven derjenigen Massen zu bestimmen, welche über ausreichend freie Punkte verfügen. Anschließend kann die so gewonnen Informationen dazu genutzt werden, um sukzessive die Intensität überlappender Peaks zu bestimmen. Der Nachteil bei letzterem Verfahren ist, dass mit jedem Schritt ein gewisser Prozentsatz an Fehlern mit einfließt. Am Ende kann es dann passieren, dass die Peaks der letzten Massen nur sehr ungenau sind, so dass ein Fitting nicht das wahre Ergebnis liefert. 3.6.4. Ausreißer Nach Optimierung des Fitting-Verfahrens sind beim Betrachten biologischer Daten Unregelmäßigkeiten in der Hüllkurve mancher Antikörpervarianten bzw. Massen aufgefallen. In Abb. 3.6.4.1 sind die nicht überlappenden Peaks der Masse M1=48454,71D eines Antikörpers abgebildet. Ein Fitting der Hüllkurve ist hier nicht möglich, weil die Intensität in jedem zweiten Ladungszustand einen Ausschlag nach oben macht. Zunächst war nicht klar, woher dieses Verhalten herrührt. Folgende zwei Vermutungen lagen nahe: a) Es besteht ein Fehler im Programmcode b) eine nicht qualitativ erfasste Masse befindet sich im Spektrum. 63
- Seite 11: Liste der Abkürzungen Ara L-Arabin
- Seite 14 und 15: somit viele Kombinationen, die auf
- Seite 17 und 18: 2. Ausgangssituation Antikörper si
- Seite 19 und 20: Die Frequenz, mit der sich bestimmt
- Seite 21 und 22: Die Immunglobuline lassen sich in f
- Seite 23 und 24: welche meistens über keine Glykosy
- Seite 25 und 26: Analog lässt sich auf diese Weise
- Seite 27 und 28: m R = (2.3.2) ∆m Dabei ist m die
- Seite 29 und 30: Die Hüllkurve repräsentiert die L
- Seite 31 und 32: werden, welche Massen im Spektrum v
- Seite 33: Peak-Überlappungen und für die Be
- Seite 36 und 37: Ein starkes Rauschen hat man z.B. d
- Seite 38 und 39: Nach optionaler Bestimmung der Hül
- Seite 40 und 41: 40 ∂ 0 = ∂a = 2 ⇒ ⇒ R ∑
- Seite 42 und 43: 3.3. Basislinie Die Basislinie enth
- Seite 44 und 45: Liste werden durch eine kubische Sp
- Seite 46 und 47: Dieser Mechanismus funktioniert nur
- Seite 48 und 49: tionen zu berechnen, multipliziert
- Seite 50 und 51: Der Algorithmus für die Berechnung
- Seite 52 und 53: 3.5. Simulation der Peakverbreiteru
- Seite 54 und 55: die Peakbreite nicht konstant ist.
- Seite 56 und 57: Um die Parameter der Basisfunktione
- Seite 58 und 59: 58 ⎛ df1 ⎜ ⎜ dx1 J ( x) = ⎜
- Seite 60 und 61: 60 2 R =1 − SSE SSM (3.6.2.1) SSE
- Seite 64 und 65: Möglichkeit a) konnte nach einem B
- Seite 66 und 67: Ionisierungen beschränkt. Dies kan
- Seite 68 und 69: DLL ist die Methode DLLEXPORT int M
- Seite 70 und 71: statten gehen und zweitens nicht in
- Seite 72 und 73: ten Hüllkurve gezogen. Basierend a
- Seite 74 und 75: um vertreten sind, muss man Abstric
- Seite 76 und 77: Die Auswertung der Spektren findet
- Seite 78 und 79: Bei der manuellen Quantifizierung g
- Seite 80 und 81: Ein ähnliches Bild bietet sich, we
- Seite 82 und 83: Die Daten aus Anhang A sind in Tabe
- Seite 84 und 85: Ebenso wie bei der Simulation präs
- Seite 86 und 87: Im Hinblick auf die technische Umse
- Seite 88 und 89: 88 Molekül Massen Referenz Manuell
- Seite 90 und 91: 90 Basislinie: Tal zu Tal Basislini
- Seite 92 und 93: B. Quantifizierungsergebnisse empir
- Seite 94 und 95: Molekül Massen Basislinie: nicht a
- Seite 96 und 97: Molekül Massen Basislinie: nicht a
- Seite 98 und 99: Auf die Abbildung der dritten Seite
- Seite 100 und 101: 100
- Seite 102 und 103: Haver05 Prof. Tom O’Haver, Introd
Wert ergeben haben. Die Ausführung mehrerer Fit-Läufe mit unterschiedlichen Startparametern<br />
soll gewährleisten, dass man nicht fälschlicherweise in einem lokalen Minimum hängen<br />
bleibt.<br />
Beim Betrachten komplexer Spektren kann häufig das Problem auftreten, dass weniger Datenpunkte<br />
als Parameter vorhanden sind. In diesem Fall ist ein Fitting nicht durchführbar. Mit<br />
komplexen Spektren, sind solche Spektren gemeint, in denen viele Varianten einer Masse<br />
vorkommen, welche sich nur durch geringe Massendifferenzen unterscheiden. Ebenso sind<br />
Kombinationen, bei denen Massen <strong>von</strong> ungefähr halber Größe vorkommen, ungünstig, wie es<br />
z.B. bei reduzierten Antikörpern der Fall sein kann (leichte Kette ca. 25kD und schwere Kette<br />
ca. 50kD). Die Peaks dieser beschriebenen Fälle liegen im Spektrum entsprechend dicht beieinander<br />
und überlagern häufig gegenseitig. Dies führt dazu, dass wenige freie Peaks und somit<br />
wenige Punkte für das Fitting zu Verfügung stehen.<br />
Um diesem Problem gerecht zu werden, kann man folgende Annahme machen: Die Varianten<br />
einer Masse bzw. eines Glykoproteins haben eine sehr ähnliche Hüllkurve. Folglich kann man<br />
einen einmal bestimmten Satz an Parametern der Modellfunktion für die anderen Molekülvarianten<br />
wieder verwenden. Hierzu definiert man sich eine Masse als Hauptkomponente, welche<br />
für die anderen Varianten als Grundlage dienen soll. Das stellt kein Problem dar, da häufig<br />
eine Masse im Spektrum derart gut repräsentiert ist, dass deren Hüllkurve ohne weiteres<br />
gefittet werden kann.<br />
Eine alternative Lösung dazu ist es, zuerst die Hüllkurven derjenigen Massen zu bestimmen,<br />
welche über ausreichend freie Punkte verfügen. Anschließend kann die so gewonnen Informationen<br />
dazu genutzt werden, um sukzessive die Intensität überlappender Peaks zu bestimmen.<br />
Der Nachteil bei letzterem Verfahren ist, dass mit jedem Schritt ein gewisser Prozentsatz an<br />
Fehlern mit einfließt. Am Ende kann es dann passieren, dass die Peaks der letzten Massen nur<br />
sehr ungenau sind, so dass ein Fitting nicht das wahre Ergebnis liefert.<br />
3.6.4. Ausreißer<br />
Nach Optimierung des Fitting-Verfahrens sind beim Betrachten biologischer Daten Unregelmäßigkeiten<br />
in der Hüllkurve mancher Antikörpervarianten bzw. Massen aufgefallen. In Abb.<br />
3.6.4.1 sind die nicht überlappenden Peaks der Masse M1=48454,71D eines Antikörpers abgebildet.<br />
Ein Fitting der Hüllkurve ist hier nicht möglich, weil die Intensität in jedem zweiten<br />
Ladungszustand einen Ausschlag nach oben macht. Zunächst war nicht klar, woher dieses<br />
Verhalten herrührt. Folgende zwei Vermutungen lagen nahe: a) Es besteht ein Fehler im Programmcode<br />
b) eine nicht qualitativ erfasste Masse befindet sich im Spektrum.<br />
63