Quantitative Analyse von Protein-Massenspektren

Quantitative Analyse von Protein-Massenspektren Quantitative Analyse von Protein-Massenspektren

22.12.2012 Aufrufe

Um diese Probleme zu umgehen, werden die Daten auf der y-Skala linear transformiert: Sie werden auf einen Bereich von 0% bis 100% normalisiert. Diese Art der Normalisierung beeinflusst nicht das Fitting-Ergebnis. Eine nichtlineare Transformation hingegen verändert die relativen Positionen der Datenpunkte. Beim Fitten äußert sich das dadurch, dass eine andere Funktion gefunden wird, welche χ² minimiert (vgl. Abb. 3.6.3.1). Es werden also andere Parameter gefunden. [Motulsky] Als weitere Verbesserungsmaßnahme, werden für jeden Parameter Schranken gesetzt, d.h. es werden nur sinnvolle Parameterbereiche zugelassen. Dies hat zur Folge, dass der Suchraum und somit die notwendige Rechenzeit weiter verkleinert wird. Für die Glykoproteine haben sich folgende Schranken als sinnvoll erwiesen: 62 Abb. 3.6.3.1: Effekt einer nicht-linearen Transformation. In beiden Bildern ist die Hüllkurve eines Antikörpers mit einer Masse von ca. 50kD dargestellt (schwarze Linie). Links auf der z-Skala und rechts auf der m/z-Skala (m/z=(m+1.008z)/z). Rechts ist die Variante, wie man sie im Spektrum sehen würde. In beiden Fällen wurde ein LM- Fitting (rote Kurve) mit zwei Gauß-Funktionen (grau gestrichelte Kurven) durchgeführt. Auf der z-Skala hat der Fit perfekt geklappt und man erhält für die Hüllkurve I(z)=GAUSS(z,696,39,12.5)+GAUSS(z,1840,55,16.5). Auf der m/z- Skala hingegen gelingt das Fitting überhaupt nicht. • die Amplitude muss in einem Bereich zwischen 1 und 130 liegen, • der Mittelpunkt muss zwischen 5 und 95 liegen, • und die Halbwertsbreite muss in dem Bereich zwischen 2 und 17 liegen. Ein weiterer Faktor, der optimiert werden kann, betrifft die Initialisierung der Startparameter. Es ist empfehlenswert, diese nicht einfach auf den Wert 1 zu setzen. Ebenso sollten sie nicht auf einen anderen konstanten Wert gesetzt werden. Vielmehr sollte der Wert abhängig vom aktuellen Umfeld, dynamisch gewählt werden. Speziell für Glykoproteine werden die Startparameter wie folgt festgelegt: Die Amplitude wird auf einen 15% der maximalen Intensität gesetzt. Die Zentren der Basisfunktionen werden in gleichmäßigen Abständen auf der z-Skala verteilt. Für die Halbwertsbreite wird ein Wert von 4 vergeben. Wenn die zu fittende Funktion mehrere Minima hat, kann man nicht mit Sicherheit sagen, dass man das globale Minimum findet. Das gefundene Minimum hängt von den gewählten Startparametern ab. Als Lösung für dieses Problem werden fünf verschiedene Fittings mit jeweils maximal 5000 Iterationen durchgeführt. Nach jedem Fit-Lauf werden die Startparameter zufällig verändert. Am Ende werden diejenigen Parameter gewählt, welche den besten R²

Wert ergeben haben. Die Ausführung mehrerer Fit-Läufe mit unterschiedlichen Startparametern soll gewährleisten, dass man nicht fälschlicherweise in einem lokalen Minimum hängen bleibt. Beim Betrachten komplexer Spektren kann häufig das Problem auftreten, dass weniger Datenpunkte als Parameter vorhanden sind. In diesem Fall ist ein Fitting nicht durchführbar. Mit komplexen Spektren, sind solche Spektren gemeint, in denen viele Varianten einer Masse vorkommen, welche sich nur durch geringe Massendifferenzen unterscheiden. Ebenso sind Kombinationen, bei denen Massen von ungefähr halber Größe vorkommen, ungünstig, wie es z.B. bei reduzierten Antikörpern der Fall sein kann (leichte Kette ca. 25kD und schwere Kette ca. 50kD). Die Peaks dieser beschriebenen Fälle liegen im Spektrum entsprechend dicht beieinander und überlagern häufig gegenseitig. Dies führt dazu, dass wenige freie Peaks und somit wenige Punkte für das Fitting zu Verfügung stehen. Um diesem Problem gerecht zu werden, kann man folgende Annahme machen: Die Varianten einer Masse bzw. eines Glykoproteins haben eine sehr ähnliche Hüllkurve. Folglich kann man einen einmal bestimmten Satz an Parametern der Modellfunktion für die anderen Molekülvarianten wieder verwenden. Hierzu definiert man sich eine Masse als Hauptkomponente, welche für die anderen Varianten als Grundlage dienen soll. Das stellt kein Problem dar, da häufig eine Masse im Spektrum derart gut repräsentiert ist, dass deren Hüllkurve ohne weiteres gefittet werden kann. Eine alternative Lösung dazu ist es, zuerst die Hüllkurven derjenigen Massen zu bestimmen, welche über ausreichend freie Punkte verfügen. Anschließend kann die so gewonnen Informationen dazu genutzt werden, um sukzessive die Intensität überlappender Peaks zu bestimmen. Der Nachteil bei letzterem Verfahren ist, dass mit jedem Schritt ein gewisser Prozentsatz an Fehlern mit einfließt. Am Ende kann es dann passieren, dass die Peaks der letzten Massen nur sehr ungenau sind, so dass ein Fitting nicht das wahre Ergebnis liefert. 3.6.4. Ausreißer Nach Optimierung des Fitting-Verfahrens sind beim Betrachten biologischer Daten Unregelmäßigkeiten in der Hüllkurve mancher Antikörpervarianten bzw. Massen aufgefallen. In Abb. 3.6.4.1 sind die nicht überlappenden Peaks der Masse M1=48454,71D eines Antikörpers abgebildet. Ein Fitting der Hüllkurve ist hier nicht möglich, weil die Intensität in jedem zweiten Ladungszustand einen Ausschlag nach oben macht. Zunächst war nicht klar, woher dieses Verhalten herrührt. Folgende zwei Vermutungen lagen nahe: a) Es besteht ein Fehler im Programmcode b) eine nicht qualitativ erfasste Masse befindet sich im Spektrum. 63

Wert ergeben haben. Die Ausführung mehrerer Fit-Läufe mit unterschiedlichen Startparametern<br />

soll gewährleisten, dass man nicht fälschlicherweise in einem lokalen Minimum hängen<br />

bleibt.<br />

Beim Betrachten komplexer Spektren kann häufig das Problem auftreten, dass weniger Datenpunkte<br />

als Parameter vorhanden sind. In diesem Fall ist ein Fitting nicht durchführbar. Mit<br />

komplexen Spektren, sind solche Spektren gemeint, in denen viele Varianten einer Masse<br />

vorkommen, welche sich nur durch geringe Massendifferenzen unterscheiden. Ebenso sind<br />

Kombinationen, bei denen Massen <strong>von</strong> ungefähr halber Größe vorkommen, ungünstig, wie es<br />

z.B. bei reduzierten Antikörpern der Fall sein kann (leichte Kette ca. 25kD und schwere Kette<br />

ca. 50kD). Die Peaks dieser beschriebenen Fälle liegen im Spektrum entsprechend dicht beieinander<br />

und überlagern häufig gegenseitig. Dies führt dazu, dass wenige freie Peaks und somit<br />

wenige Punkte für das Fitting zu Verfügung stehen.<br />

Um diesem Problem gerecht zu werden, kann man folgende Annahme machen: Die Varianten<br />

einer Masse bzw. eines Glykoproteins haben eine sehr ähnliche Hüllkurve. Folglich kann man<br />

einen einmal bestimmten Satz an Parametern der Modellfunktion für die anderen Molekülvarianten<br />

wieder verwenden. Hierzu definiert man sich eine Masse als Hauptkomponente, welche<br />

für die anderen Varianten als Grundlage dienen soll. Das stellt kein Problem dar, da häufig<br />

eine Masse im Spektrum derart gut repräsentiert ist, dass deren Hüllkurve ohne weiteres<br />

gefittet werden kann.<br />

Eine alternative Lösung dazu ist es, zuerst die Hüllkurven derjenigen Massen zu bestimmen,<br />

welche über ausreichend freie Punkte verfügen. Anschließend kann die so gewonnen Informationen<br />

dazu genutzt werden, um sukzessive die Intensität überlappender Peaks zu bestimmen.<br />

Der Nachteil bei letzterem Verfahren ist, dass mit jedem Schritt ein gewisser Prozentsatz an<br />

Fehlern mit einfließt. Am Ende kann es dann passieren, dass die Peaks der letzten Massen nur<br />

sehr ungenau sind, so dass ein Fitting nicht das wahre Ergebnis liefert.<br />

3.6.4. Ausreißer<br />

Nach Optimierung des Fitting-Verfahrens sind beim Betrachten biologischer Daten Unregelmäßigkeiten<br />

in der Hüllkurve mancher Antikörpervarianten bzw. Massen aufgefallen. In Abb.<br />

3.6.4.1 sind die nicht überlappenden Peaks der Masse M1=48454,71D eines Antikörpers abgebildet.<br />

Ein Fitting der Hüllkurve ist hier nicht möglich, weil die Intensität in jedem zweiten<br />

Ladungszustand einen Ausschlag nach oben macht. Zunächst war nicht klar, woher dieses<br />

Verhalten herrührt. Folgende zwei Vermutungen lagen nahe: a) Es besteht ein Fehler im Programmcode<br />

b) eine nicht qualitativ erfasste Masse befindet sich im Spektrum.<br />

63

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!