Quantitative Analyse von Protein-Massenspektren

Quantitative Analyse von Protein-Massenspektren Quantitative Analyse von Protein-Massenspektren

22.12.2012 Aufrufe

Im Hinblick auf die technische Umsetzung gibt es noch Möglichkeiten zur Verbesserung. So ließe sich auf Kosten der Transparenz der Quantifizierungsprozess noch weiter beschleunigen, indem separate Schritte zusammengefasst werden. Gemeint sind der Abzug der Basislinie, die Auswahl der Ladungszustände und die Quantifizierung an sich. Ist eine Funktionserweiterung für Massfinder II vorgesehen, so empfiehlt sich auch ein Wechsel der GUI-Plattform. Mit der Skriptsprache Tcl/Tk bewegt man sich hier mit über 10.000 Zeilen Code bereits an den Grenzen des Machbaren. Aufgrund der Tatsache, dass die Sprache nicht typisiert ist, sind unvorhersehbare Laufzeitfehler vorprogrammiert. Es kann nicht jedes Szenario überprüft werden, weil die möglichen Kombinationen der Userinteraktion mit der Programmoberfläche nahezu unbegrenzt sind. Für eine solidere Grundlage bedarf es einer besser strukturierten Programmiersprache, die typisiert ist und zur Compile-Zeit bereits einen Großteil der Fehler abfängt. Da die GUI und die Logik in dem jetzigen Zustand bereits stark getrennt sind, lässt sich ein Wechsel auf eine andere Plattform für die Sicht mit verhältnismäßig wenig Aufwand durchführen. Als Alternative zu Tcl/Tk käme C/C++, C# oder Java in Frage, wobei Java die Ideologie der Betriebssystem-Unabhängigkeit am besten umsetzen würde. Bei der Methodik besteht an manchen Stellen noch Raum für Optimierung. So könnte man im Falle von Antikörpern die Quantifizierung auf den mittleren Ladungszustand beschränken, welcher am besten ausgeprägt ist. Die Randbereiche weisen meistens eine geringe Intensität auf und lassen sich aufgrund dessen durch Störfaktoren leichter beeinflussen und dadurch leichter verfälschen. Das Prinzip, dass ähnliche Spezien eine ähnliche Ladungsverteilung haben, könnte man für die bessere Bestimmung der Hüllkurve anwenden: Die Spektren weisen i.d.R. eine Hauptspezies auf, die gut repräsentiert ist. Für diese ist die Bestimmung der Hüllkurve meistens problemlos möglich. Die so gewonnen Parameter der Basisfunktionen könnten bis auf die Amplitude für Varianten der Hauptspezies wieder verwendet werden. D.h. die Parameter Mittelpunkt und Halbwertsbreite werden von der Hauptspezies übernommen und festgehalten. Das Fitting wird auf die Amplitude als freien Parameter beschränkt. Ein gänzlich anderer Ansatz für die Quantifizierung wäre es, den MaxEnt-Algorithmus hierzu zu verwenden. Die Schwierigkeit besteht darin, die Nichtlinearität des Algorithmus zu korrigieren. In [Schmieder97] wurde für NMR-Spektren bereits ein solcher Korrektur- Mechanismus entwickelt. Ob für ESI-Spektren auch die Möglichkeit besteht, die Nichtlinearität des MaxEnt Algorithmus zu korrigieren, muss untersucht werden. Eine interessante Möglichkeit wäre dies auf jeden Fall, weil dadurch eine komplette Automatisierung des Quantifizierungsprozess möglich wäre und trotzdem noch gute Ergebnisse erzielt werden. 86

Anhang A. Quantifizierungsergebnisse synthetischer Spektren Ergebnisse des Vergleichs zwischen verschiedenen Quantifizierungsarten anhand synthetischer Spektren. Die Referenz entspricht den tatsächlichen Werten. Die grauen Prozentzahlen entsprechen den von den jeweiligen Methoden gefundenen Verhältnissen. Die blauen Zahlen geben die Standardabweichung zur Referenz wieder. Bei manchen Datensätzen war eine Quantifizierung mit der entsprechenden Methode nicht möglich. Bei QA2 liegt das daran, dass keine nicht überlappenden Peaks gefunden wurden. Bei der manuellen Methode hingegen liegt das am zu schlechten Signal-zu-Rausch-Verhältnis des Spektrums. Molekül Massen Referenz Manuell MaxEnt In-House Lösung Basislinie: nicht abgezogen QA1 QA2 QA3 AK1 48801 65.1% 62.9% 62.6% 59.4% 53.2% 55.1% 56.6% (SK) 48963 10.8% 13.3% 13.7% 13.2% 14.5% 15.3% 15.1% 49090 5.1% 4.4% 4.1% 6.6% 8.4% 6.7% 6.2% 49123 5.8% 6.9% 6.5% 6.8% 10.2% 8.5% 8.0% 48929 13.2% 12.5% 13.2% 14.0% 13.7% 14.4% 14.2% 1.6% 1.8% 2.9% 6.1% 5.1% 4.4% Basislinie: Tal zu Tal Basislinie: Spline Basislinie: 4. Ableitung QA1 QA2 QA3 QA1 QA2 QA3 QA1 QA2 QA3 67.5% 70.1% 72.4% 53.8% 55.8% 57.5% 61.8% 65.6% 67.2% 9.3% 10.2% 9.7% 14.4% 15.2% 15.0% 9.2% 11.2% 10.9% 6.2% 3.8% 3.2% 8.2% 6.5% 5.8% 6.9% 5.0% 4.5% 8.0% 5.9% 5.1% 10.0% 8.3% 7.7% 8.6% 6.1% 4.9% 9.1% 10.0% 9.6% 13.6% 14.3% 14.1% 13.5% 12.2% 12.6% 2.5% 2.8% 3.8% 5.8% 4.8% 4.0% 2.2% 0.6% 1.1% Molekül Massen Referenz Manuell MaxEnt In-House Lösung Basislinie: nicht abgezogen QA1 QA2 QA3 AK1 23428 88.5% 86.4% 86.6% 83.4% 76.5% 82.4% 82.7% (LK) 23590 6.5% 7.6% 6.9% 6.3% 10.9% 8.4% 8.3% 23612 2.3% 6.0% 3.8% 4.6% 8.4% 5.0% 5.0% 23753 2.6% 0.0% 2.7% 5.7% 4.3% 4.3% 4.0% 2.5% 1.2% 3.2% 7.1% 3.5% 3.3% Basislinie: Tal zu Tal Basislinie: Spline Basislinie: 4. Ableitung QA1 QA2 QA3 QA1 QA2 QA3 QA1 QA2 QA3 84.5% 88.3% 90.9% 77.0% 77.0% 84.4% 82.0% 85.4% 87.3% 7.9% 6.2% 4.4% 10.7% 10.7% 7.2% 8.5% 5.9% 5.4% 5.2% 3.0% 2.2% 8.2% 8.2% 5.3% 7.2% 5.9% 4.9% 2.5% 2.6% 2.5% 4.1% 4.1% 3.0% 2.4% 2.8% 2.5% 2.5% 0.4% 1.6% 6.8% 6.8% 2.5% 4.2% 2.4% 1.5% 87

Im Hinblick auf die technische Umsetzung gibt es noch Möglichkeiten zur Verbesserung. So<br />

ließe sich auf Kosten der Transparenz der Quantifizierungsprozess noch weiter beschleunigen,<br />

indem separate Schritte zusammengefasst werden. Gemeint sind der Abzug der Basislinie, die<br />

Auswahl der Ladungszustände und die Quantifizierung an sich.<br />

Ist eine Funktionserweiterung für Massfinder II vorgesehen, so empfiehlt sich auch ein Wechsel<br />

der GUI-Plattform. Mit der Skriptsprache Tcl/Tk bewegt man sich hier mit über 10.000<br />

Zeilen Code bereits an den Grenzen des Machbaren. Aufgrund der Tatsache, dass die Sprache<br />

nicht typisiert ist, sind unvorhersehbare Laufzeitfehler vorprogrammiert. Es kann nicht jedes<br />

Szenario überprüft werden, weil die möglichen Kombinationen der Userinteraktion mit der<br />

Programmoberfläche nahezu unbegrenzt sind. Für eine solidere Grundlage bedarf es einer<br />

besser strukturierten Programmiersprache, die typisiert ist und zur Compile-Zeit bereits einen<br />

Großteil der Fehler abfängt. Da die GUI und die Logik in dem jetzigen Zustand bereits stark<br />

getrennt sind, lässt sich ein Wechsel auf eine andere Plattform für die Sicht mit verhältnismäßig<br />

wenig Aufwand durchführen. Als Alternative zu Tcl/Tk käme C/C++, C# oder Java in<br />

Frage, wobei Java die Ideologie der Betriebssystem-Unabhängigkeit am besten umsetzen<br />

würde.<br />

Bei der Methodik besteht an manchen Stellen noch Raum für Optimierung. So könnte man im<br />

Falle <strong>von</strong> Antikörpern die Quantifizierung auf den mittleren Ladungszustand beschränken,<br />

welcher am besten ausgeprägt ist. Die Randbereiche weisen meistens eine geringe Intensität<br />

auf und lassen sich aufgrund dessen durch Störfaktoren leichter beeinflussen und dadurch<br />

leichter verfälschen. Das Prinzip, dass ähnliche Spezien eine ähnliche Ladungsverteilung haben,<br />

könnte man für die bessere Bestimmung der Hüllkurve anwenden: Die Spektren weisen<br />

i.d.R. eine Hauptspezies auf, die gut repräsentiert ist. Für diese ist die Bestimmung der Hüllkurve<br />

meistens problemlos möglich. Die so gewonnen Parameter der Basisfunktionen könnten<br />

bis auf die Amplitude für Varianten der Hauptspezies wieder verwendet werden. D.h. die Parameter<br />

Mittelpunkt und Halbwertsbreite werden <strong>von</strong> der Hauptspezies übernommen und<br />

festgehalten. Das Fitting wird auf die Amplitude als freien Parameter beschränkt.<br />

Ein gänzlich anderer Ansatz für die Quantifizierung wäre es, den MaxEnt-Algorithmus hierzu<br />

zu verwenden. Die Schwierigkeit besteht darin, die Nichtlinearität des Algorithmus zu korrigieren.<br />

In [Schmieder97] wurde für NMR-Spektren bereits ein solcher Korrektur-<br />

Mechanismus entwickelt. Ob für ESI-Spektren auch die Möglichkeit besteht, die Nichtlinearität<br />

des MaxEnt Algorithmus zu korrigieren, muss untersucht werden. Eine interessante Möglichkeit<br />

wäre dies auf jeden Fall, weil dadurch eine komplette Automatisierung des Quantifizierungsprozess<br />

möglich wäre und trotzdem noch gute Ergebnisse erzielt werden.<br />

86

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!