Quantitative Analyse von Protein-Massenspektren
Quantitative Analyse von Protein-Massenspektren Quantitative Analyse von Protein-Massenspektren
Im Hinblick auf die technische Umsetzung gibt es noch Möglichkeiten zur Verbesserung. So ließe sich auf Kosten der Transparenz der Quantifizierungsprozess noch weiter beschleunigen, indem separate Schritte zusammengefasst werden. Gemeint sind der Abzug der Basislinie, die Auswahl der Ladungszustände und die Quantifizierung an sich. Ist eine Funktionserweiterung für Massfinder II vorgesehen, so empfiehlt sich auch ein Wechsel der GUI-Plattform. Mit der Skriptsprache Tcl/Tk bewegt man sich hier mit über 10.000 Zeilen Code bereits an den Grenzen des Machbaren. Aufgrund der Tatsache, dass die Sprache nicht typisiert ist, sind unvorhersehbare Laufzeitfehler vorprogrammiert. Es kann nicht jedes Szenario überprüft werden, weil die möglichen Kombinationen der Userinteraktion mit der Programmoberfläche nahezu unbegrenzt sind. Für eine solidere Grundlage bedarf es einer besser strukturierten Programmiersprache, die typisiert ist und zur Compile-Zeit bereits einen Großteil der Fehler abfängt. Da die GUI und die Logik in dem jetzigen Zustand bereits stark getrennt sind, lässt sich ein Wechsel auf eine andere Plattform für die Sicht mit verhältnismäßig wenig Aufwand durchführen. Als Alternative zu Tcl/Tk käme C/C++, C# oder Java in Frage, wobei Java die Ideologie der Betriebssystem-Unabhängigkeit am besten umsetzen würde. Bei der Methodik besteht an manchen Stellen noch Raum für Optimierung. So könnte man im Falle von Antikörpern die Quantifizierung auf den mittleren Ladungszustand beschränken, welcher am besten ausgeprägt ist. Die Randbereiche weisen meistens eine geringe Intensität auf und lassen sich aufgrund dessen durch Störfaktoren leichter beeinflussen und dadurch leichter verfälschen. Das Prinzip, dass ähnliche Spezien eine ähnliche Ladungsverteilung haben, könnte man für die bessere Bestimmung der Hüllkurve anwenden: Die Spektren weisen i.d.R. eine Hauptspezies auf, die gut repräsentiert ist. Für diese ist die Bestimmung der Hüllkurve meistens problemlos möglich. Die so gewonnen Parameter der Basisfunktionen könnten bis auf die Amplitude für Varianten der Hauptspezies wieder verwendet werden. D.h. die Parameter Mittelpunkt und Halbwertsbreite werden von der Hauptspezies übernommen und festgehalten. Das Fitting wird auf die Amplitude als freien Parameter beschränkt. Ein gänzlich anderer Ansatz für die Quantifizierung wäre es, den MaxEnt-Algorithmus hierzu zu verwenden. Die Schwierigkeit besteht darin, die Nichtlinearität des Algorithmus zu korrigieren. In [Schmieder97] wurde für NMR-Spektren bereits ein solcher Korrektur- Mechanismus entwickelt. Ob für ESI-Spektren auch die Möglichkeit besteht, die Nichtlinearität des MaxEnt Algorithmus zu korrigieren, muss untersucht werden. Eine interessante Möglichkeit wäre dies auf jeden Fall, weil dadurch eine komplette Automatisierung des Quantifizierungsprozess möglich wäre und trotzdem noch gute Ergebnisse erzielt werden. 86
Anhang A. Quantifizierungsergebnisse synthetischer Spektren Ergebnisse des Vergleichs zwischen verschiedenen Quantifizierungsarten anhand synthetischer Spektren. Die Referenz entspricht den tatsächlichen Werten. Die grauen Prozentzahlen entsprechen den von den jeweiligen Methoden gefundenen Verhältnissen. Die blauen Zahlen geben die Standardabweichung zur Referenz wieder. Bei manchen Datensätzen war eine Quantifizierung mit der entsprechenden Methode nicht möglich. Bei QA2 liegt das daran, dass keine nicht überlappenden Peaks gefunden wurden. Bei der manuellen Methode hingegen liegt das am zu schlechten Signal-zu-Rausch-Verhältnis des Spektrums. Molekül Massen Referenz Manuell MaxEnt In-House Lösung Basislinie: nicht abgezogen QA1 QA2 QA3 AK1 48801 65.1% 62.9% 62.6% 59.4% 53.2% 55.1% 56.6% (SK) 48963 10.8% 13.3% 13.7% 13.2% 14.5% 15.3% 15.1% 49090 5.1% 4.4% 4.1% 6.6% 8.4% 6.7% 6.2% 49123 5.8% 6.9% 6.5% 6.8% 10.2% 8.5% 8.0% 48929 13.2% 12.5% 13.2% 14.0% 13.7% 14.4% 14.2% 1.6% 1.8% 2.9% 6.1% 5.1% 4.4% Basislinie: Tal zu Tal Basislinie: Spline Basislinie: 4. Ableitung QA1 QA2 QA3 QA1 QA2 QA3 QA1 QA2 QA3 67.5% 70.1% 72.4% 53.8% 55.8% 57.5% 61.8% 65.6% 67.2% 9.3% 10.2% 9.7% 14.4% 15.2% 15.0% 9.2% 11.2% 10.9% 6.2% 3.8% 3.2% 8.2% 6.5% 5.8% 6.9% 5.0% 4.5% 8.0% 5.9% 5.1% 10.0% 8.3% 7.7% 8.6% 6.1% 4.9% 9.1% 10.0% 9.6% 13.6% 14.3% 14.1% 13.5% 12.2% 12.6% 2.5% 2.8% 3.8% 5.8% 4.8% 4.0% 2.2% 0.6% 1.1% Molekül Massen Referenz Manuell MaxEnt In-House Lösung Basislinie: nicht abgezogen QA1 QA2 QA3 AK1 23428 88.5% 86.4% 86.6% 83.4% 76.5% 82.4% 82.7% (LK) 23590 6.5% 7.6% 6.9% 6.3% 10.9% 8.4% 8.3% 23612 2.3% 6.0% 3.8% 4.6% 8.4% 5.0% 5.0% 23753 2.6% 0.0% 2.7% 5.7% 4.3% 4.3% 4.0% 2.5% 1.2% 3.2% 7.1% 3.5% 3.3% Basislinie: Tal zu Tal Basislinie: Spline Basislinie: 4. Ableitung QA1 QA2 QA3 QA1 QA2 QA3 QA1 QA2 QA3 84.5% 88.3% 90.9% 77.0% 77.0% 84.4% 82.0% 85.4% 87.3% 7.9% 6.2% 4.4% 10.7% 10.7% 7.2% 8.5% 5.9% 5.4% 5.2% 3.0% 2.2% 8.2% 8.2% 5.3% 7.2% 5.9% 4.9% 2.5% 2.6% 2.5% 4.1% 4.1% 3.0% 2.4% 2.8% 2.5% 2.5% 0.4% 1.6% 6.8% 6.8% 2.5% 4.2% 2.4% 1.5% 87
- Seite 36 und 37: Ein starkes Rauschen hat man z.B. d
- Seite 38 und 39: Nach optionaler Bestimmung der Hül
- Seite 40 und 41: 40 ∂ 0 = ∂a = 2 ⇒ ⇒ R ∑
- Seite 42 und 43: 3.3. Basislinie Die Basislinie enth
- Seite 44 und 45: Liste werden durch eine kubische Sp
- Seite 46 und 47: Dieser Mechanismus funktioniert nur
- Seite 48 und 49: tionen zu berechnen, multipliziert
- Seite 50 und 51: Der Algorithmus für die Berechnung
- Seite 52 und 53: 3.5. Simulation der Peakverbreiteru
- Seite 54 und 55: die Peakbreite nicht konstant ist.
- Seite 56 und 57: Um die Parameter der Basisfunktione
- Seite 58 und 59: 58 ⎛ df1 ⎜ ⎜ dx1 J ( x) = ⎜
- Seite 60 und 61: 60 2 R =1 − SSE SSM (3.6.2.1) SSE
- Seite 62 und 63: Um diese Probleme zu umgehen, werde
- Seite 64 und 65: Möglichkeit a) konnte nach einem B
- Seite 66 und 67: Ionisierungen beschränkt. Dies kan
- Seite 68 und 69: DLL ist die Methode DLLEXPORT int M
- Seite 70 und 71: statten gehen und zweitens nicht in
- Seite 72 und 73: ten Hüllkurve gezogen. Basierend a
- Seite 74 und 75: um vertreten sind, muss man Abstric
- Seite 76 und 77: Die Auswertung der Spektren findet
- Seite 78 und 79: Bei der manuellen Quantifizierung g
- Seite 80 und 81: Ein ähnliches Bild bietet sich, we
- Seite 82 und 83: Die Daten aus Anhang A sind in Tabe
- Seite 84 und 85: Ebenso wie bei der Simulation präs
- Seite 88 und 89: 88 Molekül Massen Referenz Manuell
- Seite 90 und 91: 90 Basislinie: Tal zu Tal Basislini
- Seite 92 und 93: B. Quantifizierungsergebnisse empir
- Seite 94 und 95: Molekül Massen Basislinie: nicht a
- Seite 96 und 97: Molekül Massen Basislinie: nicht a
- Seite 98 und 99: Auf die Abbildung der dritten Seite
- Seite 100 und 101: 100
- Seite 102 und 103: Haver05 Prof. Tom O’Haver, Introd
Im Hinblick auf die technische Umsetzung gibt es noch Möglichkeiten zur Verbesserung. So<br />
ließe sich auf Kosten der Transparenz der Quantifizierungsprozess noch weiter beschleunigen,<br />
indem separate Schritte zusammengefasst werden. Gemeint sind der Abzug der Basislinie, die<br />
Auswahl der Ladungszustände und die Quantifizierung an sich.<br />
Ist eine Funktionserweiterung für Massfinder II vorgesehen, so empfiehlt sich auch ein Wechsel<br />
der GUI-Plattform. Mit der Skriptsprache Tcl/Tk bewegt man sich hier mit über 10.000<br />
Zeilen Code bereits an den Grenzen des Machbaren. Aufgrund der Tatsache, dass die Sprache<br />
nicht typisiert ist, sind unvorhersehbare Laufzeitfehler vorprogrammiert. Es kann nicht jedes<br />
Szenario überprüft werden, weil die möglichen Kombinationen der Userinteraktion mit der<br />
Programmoberfläche nahezu unbegrenzt sind. Für eine solidere Grundlage bedarf es einer<br />
besser strukturierten Programmiersprache, die typisiert ist und zur Compile-Zeit bereits einen<br />
Großteil der Fehler abfängt. Da die GUI und die Logik in dem jetzigen Zustand bereits stark<br />
getrennt sind, lässt sich ein Wechsel auf eine andere Plattform für die Sicht mit verhältnismäßig<br />
wenig Aufwand durchführen. Als Alternative zu Tcl/Tk käme C/C++, C# oder Java in<br />
Frage, wobei Java die Ideologie der Betriebssystem-Unabhängigkeit am besten umsetzen<br />
würde.<br />
Bei der Methodik besteht an manchen Stellen noch Raum für Optimierung. So könnte man im<br />
Falle <strong>von</strong> Antikörpern die Quantifizierung auf den mittleren Ladungszustand beschränken,<br />
welcher am besten ausgeprägt ist. Die Randbereiche weisen meistens eine geringe Intensität<br />
auf und lassen sich aufgrund dessen durch Störfaktoren leichter beeinflussen und dadurch<br />
leichter verfälschen. Das Prinzip, dass ähnliche Spezien eine ähnliche Ladungsverteilung haben,<br />
könnte man für die bessere Bestimmung der Hüllkurve anwenden: Die Spektren weisen<br />
i.d.R. eine Hauptspezies auf, die gut repräsentiert ist. Für diese ist die Bestimmung der Hüllkurve<br />
meistens problemlos möglich. Die so gewonnen Parameter der Basisfunktionen könnten<br />
bis auf die Amplitude für Varianten der Hauptspezies wieder verwendet werden. D.h. die Parameter<br />
Mittelpunkt und Halbwertsbreite werden <strong>von</strong> der Hauptspezies übernommen und<br />
festgehalten. Das Fitting wird auf die Amplitude als freien Parameter beschränkt.<br />
Ein gänzlich anderer Ansatz für die Quantifizierung wäre es, den MaxEnt-Algorithmus hierzu<br />
zu verwenden. Die Schwierigkeit besteht darin, die Nichtlinearität des Algorithmus zu korrigieren.<br />
In [Schmieder97] wurde für NMR-Spektren bereits ein solcher Korrektur-<br />
Mechanismus entwickelt. Ob für ESI-Spektren auch die Möglichkeit besteht, die Nichtlinearität<br />
des MaxEnt Algorithmus zu korrigieren, muss untersucht werden. Eine interessante Möglichkeit<br />
wäre dies auf jeden Fall, weil dadurch eine komplette Automatisierung des Quantifizierungsprozess<br />
möglich wäre und trotzdem noch gute Ergebnisse erzielt werden.<br />
86