Reacción en cadena de la polimerasa (PCR) - FBMC

Reacción en cadena de la polimerasa (PCR) - FBMC Reacción en cadena de la polimerasa (PCR) - FBMC

fbmc.fcen.uba.ar
from fbmc.fcen.uba.ar More from this publisher
13.05.2013 Views

Genómica Aplicada Verano 2012 bres de los metabolitos y sus intensidades); copiar los datos de cada muestra (los pesos frescos deberían aparecer debajo del número de muestra) y ubicar los datos del ribitol en la primera fila. La estandarización se realiza: dividiendo el valor de intensidad de cada metabolito por la intensidad del ribitol y multiplicando por el peso fresco de la muestra (valor estandarizado = intensidad/int. Ribitol/ FW). 27.7) Una vez que todos los valores han sido estandarizados, se procede al análisis estadístico de los datos, calculando la media y desviación estándar para cada muestra, y relativizando el nivel de cada metabolito al control. Recordar que la aproximación propuesta en este trabajo NO permite la cuantificación absoluta de los compuestos, sino relativa al control. Para obtener valores absolutos, es necesario realizar una curva patrón –con concentraciones conocidas del/los compuesto/s que se desea cuantificar. 27.8) Finalmente puede utilizarse algún estadístico (una prueba de comparación de punto a punto --un test de Student- ) para evaluar las diferencias entre el control y las muestras. Bibliografia recomendada: Carrari F, Baxter C, Usadel B, Urbanczyk-Wochniak E, Zanor MI, Nunes-Nesi A, Nikiforova V, Centeno D, Ratzka A, Pauly M, Sweetlove L, Fernie AR. 2006. Integrated Analysis of Metabolite and Transcript Levels Reveals the Metabolic Shifts that Underlie Tomato Fruit Development and Highlight Regulatory Aspects of Metabolic Network Behavior. Plant Physiology 142(4):1380-1396. Fernie AR, Trethewey RN, Krotzky AJ and Willmitzer L. (2004). Metabolite profiling: from diagnostics to systems biology. Nature Reviews Molecular Cell Biology 5: 1-7. Lisec J, Schauer N, Kopka J, Willmitzer L, Fernie AR. (2006). Gas chromatography mass spectrometry–based metabolite profiling in plants. Nature Protocols 1: 387-396. Luedemann A, Strassburg K, Erban A, Kopka J (2008) TagFinder for the quantitative analysis of gas chromatography - mass spectrometry (GC-MS) based metabolite profiling experiments. Bioinformatics 24:732–737 Schauer N, Semel Y, Roessner U, Gur A, Balbo I, Carrari F, Pleban T, Perez-Melis A, Bruedigam C, Kopka J, Willmitzer L, Zamir D,. Fernie AR. 2006. Comprehensive metabolic profiling and phenotyping of interspecific introgression lines for tomato improvement. Nature Biotechnology 24(4): 447-454 Trabajo Práctico 13: Hacia la biología de sistemas: integración de datos transcriptómicos y metabólicos para el estudio de rutas metabólicas mediante redes neuronales Docentes: Laura Kamenetzky y Mariana López Diseñado por. Laura Kamenetzky Introducción La gran cantidad de datos que se generan con las tecnologías “ómicas” requiere contar con herramientas para la integración y análisis de datos heterogéneos (genómicos, transcriptómicos, metabolómicos, fenotípicos, fenómicos, entre otros). La correlación resultante de la integración de este tipo de datos se interpreta, desde un punto de vista biológico, como una regulación coordinada entre elementos de diferente origen (por ej transcriptos y metabolitos). Para la integración se utilizan métodos de agrupamiento (clustering) donde se exploran los datos desde el punto de vista de la existencia o no de relaciones y éstos se clasifican en clases. Existen diversos métodos de agrupamiento aplicables en el área biológica, uno de los más usados es el agrupamiento jerárquico (hierarchical cluster, HC). Con este método los resultados son representados en forma de dendograma que muestra las relaciones entre los datos generados por una matriz de distancia. En cambio, para resultados obtenidos con algoritmos de tipo no-jerárquico, se calculan primero las distancias a partir de un número predeterminado de grupos y luego se van colocando de forma iterativa los datos en los diferentes grupos hasta minimizar la dispersión interna de cada uno. El algoritmo más representativo de este tipo de agrupación es el de k-media. Para mejorar el desempeño de los algoritmos mencionados, se ha propuesto otro tipo de métodos como son los basados en técnicas de inteligencia computacional y en particular las redes neuronales artificiales del tipo mapas autoorganizativos (SOM del ingles Self-Organizing Maps) (Kohonen, 1982). Estos métodos han probado ser adecuados para manejar grandes dimensiones como las que se generan a partir de un alto volumen de datos y evidenciar, al mismo tiempo, patrones de relaciones ocultas en los datos (Hiraí el al., 2004). Especialmente en cuanto a la integración de datos de diferentes tipos, recientemente se ha propuesto un modelo para la agrupación y visualización de transcriptos y metabolitos en frutos de tomate de diferentes líneas de introgresión (IL) (Stegmayer et al., 2009). Asimismo se ha desarrollado un software (Milone et al., 2010) que permite utilizar este modelo facilitando la obtención de clusters (o neuronas) y a su vez permite visualizar los agrupamientos de manera de extraer la máxima información de este tipo de datos (anotación de genes, rutas metabólicas, entre otros). En este trabajo práctico se emplearán como datos de entrada los perfiles transcripcionales y metabólicos obtenidos a partir de frutos de tomate de 21 líneas de introgresión (IL). Las ILs fueron obtenidas utilizando como parentales a la especie cultivada Solanum lycopersicum y la especie silvestre Solanum pennelli (Eshed and Zamir, 1995). Estas ILs contienen, en homocigosis, un segmento de cromosoma de la especie silvestre en el fondo genético de la especie cultivada. Si se comparan estas líneas con el parental puede inferirse que los cambios son producto de la región introgresada. Los perfiles metabólicos se obtuvieron mediante la técnica de GC-MS. Los datos de expresión de genes se obtuvieron del laboratorio colaborador del Dr. Jim Giovanonni (Boyce Thompson Institute) utilizando la plataforma de TOM2 (http://ted.bti.cornell.edu/cgi-bin/TFGD/array/array_fabrication.cgi) que consiste en microarreglos de 12860 clones EST que representan ~8,500 loci independientes de tomate. Los datos fueron filtrados por calidad de cada spot siguiendo la metodología propuesta por Polanski and Kimmel (2007). Objetivo 34

Genómica Aplicada Verano 2012 Aprender a usar una herramienta bioinformática que sirva para integrar y ayudar a interpretar biológicamente los datos generados por las X-ómicas. En este ejemplo, los datos de transcriptómica y los de metabolómica provienen de frutos de tomate de una población de líneas introgresadas caracterizada genéticamente. Desarrollo del trabajo práctico Instalación del software. El software de integración de datos OmeSom v2.0 corre bajo otro programa. Seguir las instrucciones de instalación siguientes: 1) Se utilizará el programa MATLAB en versión académica, ver (7). Las instrucciones de instalación y uso se resumen en esta guía. Si desean ver información detallada del MATLAB se puede bajar un manual del programa desde (8). Luego de arrancar el programa setup aparece una ventana para elegir la forma de instalación: En la opcion “custom” desmarcar todo, dejar solo: -Matlab Distributed…… -Matlab … -Bioinformatics Toolbox -Signal Processing toolbox -Neural Networktoolbox -Statistics toolbox Copiar las carpetas de uso provistas por los docentes del omeSOM en la carpeta MATLAB. Uso del software 1) Abrir el programa MATLAB (doble click en el icono) 2) En el panel escibir: c:\archivosdeprograma\MATLAB\omesom….. (directorio de uso del MATLAB) 3) Se habilita un cursor en la ventana “COMMAND WINDOW”, escribir: >>omesom 4) Desplegar la ventana del menu IL-SOM model Abrir la solapa IL-SOM Model, clickear en “Create” Seleccionar el file omesom….data [Este file contiene los datos normalizados y relativizados al parental control (S. lycopersicum cultivado) de todos los metabolitos y transcriptos detectados. En total son 1159 transcriptos y 70 metabolitos provenientes de 21 ILs.] Aparece en la pantalla: 4.1) Elegir un mapa de dimensión 10 y la opción “patrones invertidos” (CLICKEAR DIRECTAMENTE OK). Que significa esta opción para este tipo de datos. ¿Por qué es interesante analizarlos? En la región inferior de la pantalla aparece el tiempo de ejecución “Training” en el panel de abajo a la derecha Training: 0/ 30 s Training: 1/ 39 s Training: 1/ 43 s …………………….. Training: 51/ 51 s Cuando termina aparece la opción neighborhood [press Enter for 0]: Apretar Enter 35

G<strong>en</strong>ómica Aplicada<br />

Verano 2012<br />

bres <strong>de</strong> los metabolitos y sus int<strong>en</strong>sida<strong>de</strong>s); copiar los datos <strong>de</strong> cada muestra (los pesos frescos <strong>de</strong>berían aparecer <strong>de</strong>bajo<br />

<strong>de</strong>l número <strong>de</strong> muestra) y ubicar los datos <strong>de</strong>l ribitol <strong>en</strong> <strong>la</strong> primera fi<strong>la</strong>. La estandarización se realiza: dividi<strong>en</strong>do el<br />

valor <strong>de</strong> int<strong>en</strong>sidad <strong>de</strong> cada metabolito por <strong>la</strong> int<strong>en</strong>sidad <strong>de</strong>l ribitol y multiplicando por el peso fresco <strong>de</strong> <strong>la</strong> muestra<br />

(valor estandarizado = int<strong>en</strong>sidad/int. Ribitol/ FW).<br />

27.7) Una vez que todos los valores han sido estandarizados, se proce<strong>de</strong> al análisis estadístico <strong>de</strong> los datos, calcu<strong>la</strong>ndo<br />

<strong>la</strong> media y <strong>de</strong>sviación estándar para cada muestra, y re<strong>la</strong>tivizando el nivel <strong>de</strong> cada metabolito al control. Recordar que<br />

<strong>la</strong> aproximación propuesta <strong>en</strong> este trabajo NO permite <strong>la</strong> cuantificación absoluta <strong>de</strong> los compuestos, sino re<strong>la</strong>tiva al<br />

control. Para obt<strong>en</strong>er valores absolutos, es necesario realizar una curva patrón –con conc<strong>en</strong>traciones conocidas <strong>de</strong>l/los<br />

compuesto/s que se <strong>de</strong>sea cuantificar.<br />

27.8) Finalm<strong>en</strong>te pue<strong>de</strong> utilizarse algún estadístico (una prueba <strong>de</strong> comparación <strong>de</strong> punto a punto --un test <strong>de</strong> Stud<strong>en</strong>t-<br />

) para evaluar <strong>la</strong>s difer<strong>en</strong>cias <strong>en</strong>tre el control y <strong>la</strong>s muestras.<br />

Bibliografia recom<strong>en</strong>dada:<br />

Carrari F, Baxter C, Usa<strong>de</strong>l B, Urbanczyk-Wochniak E, Zanor MI, Nunes-Nesi A, Nikiforova V, C<strong>en</strong>t<strong>en</strong>o D, Ratzka A, Pauly M, Sweetlove<br />

L, Fernie AR. 2006. Integrated Analysis of Metabolite and Transcript Levels Reveals the Metabolic Shifts that Un<strong>de</strong>rlie Tomato Fruit Developm<strong>en</strong>t<br />

and Highlight Regu<strong>la</strong>tory Aspects of Metabolic Network Behavior. P<strong>la</strong>nt Physiology 142(4):1380-1396.<br />

Fernie AR, Trethewey RN, Krotzky AJ and Willmitzer L. (2004). Metabolite profiling: from diagnostics to systems biology. Nature Reviews<br />

Molecu<strong>la</strong>r Cell Biology 5: 1-7.<br />

Lisec J, Schauer N, Kopka J, Willmitzer L, Fernie AR. (2006). Gas chromatography mass spectrometry–based metabolite profiling in p<strong>la</strong>nts.<br />

Nature Protocols 1: 387-396.<br />

Lue<strong>de</strong>mann A, Strassburg K, Erban A, Kopka J (2008) TagFin<strong>de</strong>r for the quantitative analysis of gas chromatography - mass spectrometry<br />

(GC-MS) based metabolite profiling experim<strong>en</strong>ts. Bioinformatics 24:732–737<br />

Schauer N, Semel Y, Roessner U, Gur A, Balbo I, Carrari F, Pleban T, Perez-Melis A, Bruedigam C, Kopka J, Willmitzer L, Zamir D,.<br />

Fernie AR. 2006. Compreh<strong>en</strong>sive metabolic profiling and ph<strong>en</strong>otyping of interspecific introgression lines for tomato improvem<strong>en</strong>t. Nature Biotechnology<br />

24(4): 447-454<br />

Trabajo Práctico 13: Hacia <strong>la</strong> biología <strong>de</strong> sistemas: integración <strong>de</strong> datos transcriptómicos y metabólicos para<br />

el estudio <strong>de</strong> rutas metabólicas mediante re<strong>de</strong>s neuronales<br />

Doc<strong>en</strong>tes: Laura Kam<strong>en</strong>etzky y Mariana López Diseñado por. Laura Kam<strong>en</strong>etzky<br />

Introducción<br />

La gran cantidad <strong>de</strong> datos que se g<strong>en</strong>eran con <strong>la</strong>s tecnologías “ómicas” requiere contar con herrami<strong>en</strong>tas para <strong>la</strong> integración<br />

y análisis <strong>de</strong> datos heterogéneos (g<strong>en</strong>ómicos, transcriptómicos, metabolómicos, f<strong>en</strong>otípicos, f<strong>en</strong>ómicos,<br />

<strong>en</strong>tre otros). La corre<strong>la</strong>ción resultante <strong>de</strong> <strong>la</strong> integración <strong>de</strong> este tipo <strong>de</strong> datos se interpreta, <strong>de</strong>s<strong>de</strong> un punto <strong>de</strong> vista biológico,<br />

como una regu<strong>la</strong>ción coordinada <strong>en</strong>tre elem<strong>en</strong>tos <strong>de</strong> difer<strong>en</strong>te orig<strong>en</strong> (por ej transcriptos y metabolitos). Para <strong>la</strong><br />

integración se utilizan métodos <strong>de</strong> agrupami<strong>en</strong>to (clustering) don<strong>de</strong> se exploran los datos <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> <strong>la</strong><br />

exist<strong>en</strong>cia o no <strong>de</strong> re<strong>la</strong>ciones y éstos se c<strong>la</strong>sifican <strong>en</strong> c<strong>la</strong>ses. Exist<strong>en</strong> diversos métodos <strong>de</strong> agrupami<strong>en</strong>to aplicables <strong>en</strong> el<br />

área biológica, uno <strong>de</strong> los más usados es el agrupami<strong>en</strong>to jerárquico (hierarchical cluster, HC). Con este método los<br />

resultados son repres<strong>en</strong>tados <strong>en</strong> forma <strong>de</strong> d<strong>en</strong>dograma que muestra <strong>la</strong>s re<strong>la</strong>ciones <strong>en</strong>tre los datos g<strong>en</strong>erados por una<br />

matriz <strong>de</strong> distancia. En cambio, para resultados obt<strong>en</strong>idos con algoritmos <strong>de</strong> tipo no-jerárquico, se calcu<strong>la</strong>n primero<br />

<strong>la</strong>s distancias a partir <strong>de</strong> un número pre<strong>de</strong>terminado <strong>de</strong> grupos y luego se van colocando <strong>de</strong> forma iterativa los datos <strong>en</strong><br />

los difer<strong>en</strong>tes grupos hasta minimizar <strong>la</strong> dispersión interna <strong>de</strong> cada uno. El algoritmo más repres<strong>en</strong>tativo <strong>de</strong> este tipo<br />

<strong>de</strong> agrupación es el <strong>de</strong> k-media. Para mejorar el <strong>de</strong>sempeño <strong>de</strong> los algoritmos m<strong>en</strong>cionados, se ha propuesto otro tipo<br />

<strong>de</strong> métodos como son los basados <strong>en</strong> técnicas <strong>de</strong> intelig<strong>en</strong>cia computacional y <strong>en</strong> particu<strong>la</strong>r <strong>la</strong>s re<strong>de</strong>s neuronales artificiales<br />

<strong>de</strong>l tipo mapas autoorganizativos (SOM <strong>de</strong>l ingles Self-Organizing Maps) (Kohon<strong>en</strong>, 1982). Estos métodos han<br />

probado ser a<strong>de</strong>cuados para manejar gran<strong>de</strong>s dim<strong>en</strong>siones como <strong>la</strong>s que se g<strong>en</strong>eran a partir <strong>de</strong> un alto volum<strong>en</strong> <strong>de</strong> datos<br />

y evid<strong>en</strong>ciar, al mismo tiempo, patrones <strong>de</strong> re<strong>la</strong>ciones ocultas <strong>en</strong> los datos (Hiraí el al., 2004). Especialm<strong>en</strong>te <strong>en</strong><br />

cuanto a <strong>la</strong> integración <strong>de</strong> datos <strong>de</strong> difer<strong>en</strong>tes tipos, reci<strong>en</strong>tem<strong>en</strong>te se ha propuesto un mo<strong>de</strong>lo para <strong>la</strong> agrupación y<br />

visualización <strong>de</strong> transcriptos y metabolitos <strong>en</strong> frutos <strong>de</strong> tomate <strong>de</strong> difer<strong>en</strong>tes líneas <strong>de</strong> introgresión (IL) (Stegmayer et<br />

al., 2009). Asimismo se ha <strong>de</strong>sarrol<strong>la</strong>do un software (Milone et al., 2010) que permite utilizar este mo<strong>de</strong>lo facilitando<br />

<strong>la</strong> obt<strong>en</strong>ción <strong>de</strong> clusters (o neuronas) y a su vez permite visualizar los agrupami<strong>en</strong>tos <strong>de</strong> manera <strong>de</strong> extraer <strong>la</strong> máxima<br />

información <strong>de</strong> este tipo <strong>de</strong> datos (anotación <strong>de</strong> g<strong>en</strong>es, rutas metabólicas, <strong>en</strong>tre otros).<br />

En este trabajo práctico se emplearán como datos <strong>de</strong> <strong>en</strong>trada los perfiles transcripcionales y metabólicos obt<strong>en</strong>idos<br />

a partir <strong>de</strong> frutos <strong>de</strong> tomate <strong>de</strong> 21 líneas <strong>de</strong> introgresión (IL). Las ILs fueron obt<strong>en</strong>idas utilizando como par<strong>en</strong>tales a <strong>la</strong><br />

especie cultivada So<strong>la</strong>num lycopersicum y <strong>la</strong> especie silvestre So<strong>la</strong>num p<strong>en</strong>nelli (Eshed and Zamir, 1995). Estas ILs<br />

conti<strong>en</strong><strong>en</strong>, <strong>en</strong> homocigosis, un segm<strong>en</strong>to <strong>de</strong> cromosoma <strong>de</strong> <strong>la</strong> especie silvestre <strong>en</strong> el fondo g<strong>en</strong>ético <strong>de</strong> <strong>la</strong> especie cultivada.<br />

Si se comparan estas líneas con el par<strong>en</strong>tal pue<strong>de</strong> inferirse que los cambios son producto <strong>de</strong> <strong>la</strong> región introgresada.<br />

Los perfiles metabólicos se obtuvieron mediante <strong>la</strong> técnica <strong>de</strong> GC-MS. Los datos <strong>de</strong> expresión <strong>de</strong> g<strong>en</strong>es se obtuvieron<br />

<strong>de</strong>l <strong>la</strong>boratorio co<strong>la</strong>borador <strong>de</strong>l Dr. Jim Giovanonni (Boyce Thompson Institute) utilizando <strong>la</strong> p<strong>la</strong>taforma <strong>de</strong> TOM2<br />

(http://ted.bti.cornell.edu/cgi-bin/TFGD/array/array_fabrication.cgi) que consiste <strong>en</strong> microarreglos <strong>de</strong> 12860 clones<br />

EST que repres<strong>en</strong>tan ~8,500 loci in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes <strong>de</strong> tomate. Los datos fueron filtrados por calidad <strong>de</strong> cada spot sigui<strong>en</strong>do<br />

<strong>la</strong> metodología propuesta por Po<strong>la</strong>nski and Kimmel (2007).<br />

Objetivo<br />

34

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!