14.05.2013 Views

Transcriptómica - FBMC

Transcriptómica - FBMC

Transcriptómica - FBMC

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Transcriptómica</strong>


¿Qué es la Información Biológica?<br />

Tres niveles básicos de información biológica:<br />

Genoma: la información genética común a todas las<br />

células del organismo.<br />

Transcriptoma: la parte del genoma que se expresa en<br />

una célula en una etapa específica de su desarrollo.<br />

Proteoma: las proteínas que interactuan para dar a la<br />

célula su carácter individual.<br />

Del GENOMA estático, único<br />

al PROTEOMA dinámico, múltiple.


La era de la genómica


La genómica se ha desarrollado como consecuencia<br />

de los avances en Biología Molecular e Informática.<br />

La introducción y popularización de las tecnologías<br />

de alta procesividad ha cambiado drásticamente la<br />

manera en que se abordan los problemas biológicos<br />

y se prueban las hipótesis.


Genómica funcional<br />

• El objetivo de la genómica funcional es<br />

generar un catálogo de todos los genes y de<br />

su función.<br />

• Para comprender el comportamiento de los<br />

sistemas biológicos y de los algoritmos<br />

genéticos que permiten el funcionamiento<br />

celular y el desarrollo de los organismos.


Genómica funcional<br />

• La genómica funcional engloba el estudio del:<br />

• Transcriptoma: conjunto completo de<br />

transcritos.<br />

• Proteoma: conjunto de proteínas codificadas<br />

por un genoma.<br />

• Interactoma: interacción de estos productos.


Genómica funcional<br />

• Planteamiento clásico:<br />

• Dirigido por una hipótesis.<br />

• Limitado el número de genes estudiados.<br />

• Planteamiento genómico:<br />

• No hay hipótesis de partida.<br />

• Información sobre miles de genes.


El paradigma pre-genómico<br />

…codifican<br />

proteínas...<br />

>protein kunase<br />

acctgttgatggcgacagggactgtatgctgatct<br />

atgctgatgcatgcatgctgactactgatgtgggg<br />

gctattgacttgatgtctatc....<br />

Genes en el<br />

DNA...<br />

…cuya estructura<br />

influye en la función...<br />

Del genotipo al<br />

fenotipo<br />

…producen el<br />

fenotipo final<br />

…además el<br />

ambiente...


¿Quién?<br />

Secuenciación<br />

genoma<br />

Espectrometría de masas<br />

para complejos proteícos<br />

¿Y quién más?<br />

La visión post-genómica<br />

Microarrays<br />

de DNA<br />

¿Donde, cómo y cuanto?<br />

SNPs<br />

Literatura,<br />

bases de datos<br />

¿Qué<br />

sabemos?<br />

¿En qué manera?


Transcriptoma


Estudio de los perfiles de expresión de todos<br />

los genes presentes en el genoma.<br />

El método más utilizado es el de microarrays de DNA,<br />

que permite el análisis simultaneo de la expresión de<br />

miles de genes.


DNA<br />

mRNA<br />

Transcripción<br />

G T A A T C C T C<br />

| | | | | | | | |<br />

C A T T A G G A G<br />

RNA<br />

polimerasa<br />

G U A A U C C


Sistemas de detección de la expresión génica<br />

• Pasado: técnicas tradicionales para medir la<br />

expresión génica, como Northern y RT-PCR.<br />

• Desarrollo tecnológico:<br />

• Expressed Sequenced Tags (ESTs).<br />

• Serial analysis gene expression (SAGE).<br />

• Suppression substractive hybridization (SSH).<br />

• Microarrays de DNA.


Cambio de escala: del gen al genoma


Tecnicas genómicas de alta procesividad<br />

• Independientes de conocimiento previo:<br />

• ESTs<br />

• SAGE<br />

• SSH<br />

• Dependientes de conocimiento previo:<br />

• Microarrays de DNA


ESTs<br />

(Expressed Sequenced Tags)<br />

• Generación de colecciones de ESTs<br />

(etiquetas de secuencia expresadas).<br />

• La complejidad de los genomas eucariotas<br />

hace aconsejable no abordar inicialmente el<br />

estudio del genoma completo.<br />

• Es preferible estudiar aquellos genes que se<br />

están expresando en un momento<br />

determinado de la vida del organismo.


ESTs


ESTs<br />

• Genoteca de cDNA: colección de fragmentos<br />

de DNA clonados que representan el conjunto<br />

de genes que se están expresando en un<br />

órgano o tejido determinado, o bajo una<br />

situación particular o momento de desarrollo.<br />

• Las genotecas de cDNA se secuencian de<br />

forma masiva para generar miles de<br />

secuencias parciales o ESTs de 200-500 bp.


ESTs


ESTs<br />

• Las diferencias en la expresión de genes<br />

pueden ser identificadas considerando el<br />

número de veces en que aparece<br />

representada una EST particular.<br />

• Las ESTs por su propia naturaleza, son<br />

incompletas y, hasta cierto punto, imprecisas.<br />

• Las ESTs también suelen ser suficientes<br />

para la identificación de los genes mediante<br />

comparación con las bases de datos.


Microarrays de DNA


Microarrays de DNA<br />

• Los microarrays de DNA surgen de la<br />

necesidad de analizar la cantidad de<br />

información procedente de los grandes<br />

proyectos de secuenciación de genomas.<br />

• Permiten elaborar mapas finos de<br />

transcripción y proporcionan información<br />

indirecta de los niveles de proteínas.


Microarrays de DNA<br />

• El análisis de microarrays de DNA es una nueva<br />

tecnología que permite estudiar simultáneamente la<br />

expresión de miles de genes y analizar su expresión<br />

bajo distintas condiciones experimentales.<br />

• Los microarrays de DNA constan de miles de<br />

conjuntos ordenados de moléculas de DNA de<br />

secuencia conocida depositados en un soporte sólido<br />

(~ 2 cm 2 ) como cristal, nylon o silicio.<br />

• Cada combinación (gen/muestra) se localiza de forma<br />

inequívoca en un punto del microarray.


Microarrays de DNA<br />

• Los microarrays de DNA permiten la medida<br />

simultánea de los niveles de expresión de miles de<br />

genes (sondas) en un solo experimento de<br />

hibridación con una mezcla compleja de DNA o RNA<br />

(dianas).<br />

• Sondas: secuencias de DNA conocidas<br />

(oligonucleótidos o productos de PCR) inmovilizadas<br />

ordenadamente sobre una superficie sólida.<br />

• Dianas: muestra problema de DNA o RNA marcada<br />

cuya abundancia será determinada por hibridación.


Microarrays de DNA - El concepto<br />

Medir el nivel de transcritos (mRNA) de un gran número<br />

de genes simultáneamente para determinar que genes<br />

se están expresando en la célula.<br />

CELL<br />

RNA


Microarrays de DNA – El objetivo<br />

• El objetivo de los experimentos con microarrays de<br />

DNA es comparar la expresión de múltiples genes<br />

(transcripción) en distintas condiciones:<br />

• Momentos distintos del tiempo<br />

• Tejidos distintos<br />

• Tejidos sanos o enfermos (p.e. Tumores)<br />

• Se basan en tecnologías conocidas como la<br />

hibridación y la fluorescencia.


Microarrays de DNA – Sondas<br />

• Cada sonda del microarray de DNA está diseñada<br />

para unirse a un gen de forma específica.<br />

• Diseño de sondas específicas:<br />

• Especificidad de secuencia.<br />

• Tms homogéneas.<br />

• Sin estructuras secundarias.<br />

• Cada sonda está dispuesta de forma ordenada sobre<br />

el microarray de DNA.


Microarrays de DNA – El resultado<br />

• Los microarrays de DNA están formados por 100 - 1<br />

millón de sondas de DNA sobre una superficie de<br />

1 cm por 1 cm (chip de DNA).<br />

• Los resultados de microarrays de DNA se basan en el<br />

concepto de “culpable por asociación”.<br />

• Genes que son co-regulados (patrón similar de<br />

comportamiento) es probable que estén<br />

funcionalmente relacionados formando parte del<br />

mismo proceso biológico.


El primer Microarray de DNA<br />

• 45 Genes de Arabidopsis y 3 genes control:<br />

total 48 señales.<br />

• Schena et al., (1995). Quantitative monitoring of gene expression<br />

patterns with a complementary DNA microarray. Science 270, 467-470.


Microarrays de DNA – Experimento básico<br />

• Un experimento básico de microarrays de DNA<br />

consiste en:<br />

1- Diseño y fabricación del microarray.<br />

2- Preparación de la muestra e hibridación.<br />

3- Escaneo del microarray.<br />

4- Análisis de imagen.<br />

5- Análisis de los resultados.


Diseño Array<br />

Diseño Sonda<br />

Microarrays de DNA<br />

PREGUNTA<br />

Diseño Experimental<br />

Preparación Muestra<br />

Hibridación<br />

Análisis de Imagen<br />

Preprocesamiento de datos<br />

Normalización<br />

Análisis Estadístico<br />

Análisis Avanzado de Datos<br />

Extracción de Genes Relevantes<br />

RESPUESTA<br />

Compra Chip/Array


Microarrays de DNA – Experimento básico


Diseño y fabricación


Diseño y fabricación<br />

• La primera fase del diseño del microarray de DNA<br />

consiste en la selección de los genes que se desean<br />

incorporar al experimento.<br />

• Las secuencias necesarias pueden obtenerse, por<br />

ejemplo, de una base de datos de ESTs.<br />

• Puede haber problemas en la identificación de las<br />

secuencias :<br />

• Errores de secuenciación<br />

• Splicing alternativo<br />

• Contaminación


Diseño y fabricación - Sondas<br />

• Una vez seleccionados los genes se realizan<br />

múltiples copias de cada uno mediante PCR, y los<br />

productos (sondas) se depositan en el sustrato.<br />

• Tipos de sondas:<br />

• Genotecas de cDNA (Stanford microarrays)<br />

• Oligonucleótidos (Affymetrix)<br />

• El soporte sólido (sustrato) del microarray suele ser<br />

cristal, y también membranas de nylon o plástico.


Preparación de la muestra


Preparación de la muestra<br />

1. Diseño experimental<br />

2. Realizar experimento<br />

3. Precipitar RNA<br />

4. Marcaje RNA<br />

¿Pregunta?<br />

¿Réplicas?<br />

mutante<br />

¿Eucariota/procariota?<br />

¿Pared celular?<br />

¿Amplificación?<br />

¿Directo o indirecto?<br />

¿Tipo de marcaje?<br />

silvestre


Microarrays de DNA:<br />

el paradigma de una técnica post-genómica<br />

Cy5 Cy3<br />

Arrays de cDNA Arrays de oligonucleótidos


Microarrays de DNA - La tecnología<br />

Stanford Microarrays<br />

Affymetrix<br />

(GENECHIP)


Stanford Microarrays


Stanford Microarrays – Arrays de cDNA<br />

Portas de cristal<br />

Hibridación<br />

Impresión de las sondas<br />

Post-procesamiento


Stanford microarrays – Impresión robótica<br />

Arrays de cDNA


Stanford microarrays – Impresión robótica<br />

• Tamaño del lunar: 100-300 µm (Ø)<br />

• Espaciado: 150-300 µm<br />

• Número lunares I. mecánica: 250-1000 lunares/cm 2<br />

• Número lunares Ink-jet: >2500 lunares/cm 2<br />

• Cantidad DNA:


Stanford microarrays – Perfiles de expresión génica<br />

Preparar Microarray<br />

Clones DNA PCR<br />

Aislar RNA y marcar<br />

Muestra A Aislar<br />

RNA<br />

Purificar<br />

productos<br />

Marcaje con Cy5<br />

Muestra B Aislar<br />

RNA Marcaje con Cy3<br />

Mezclar, hibridar sondas y analizar datos<br />

Hibridar al<br />

microarray<br />

Impresión<br />

robótica<br />

Lavar Analizar datos


Stanford microarrays: el proceso<br />

Cy5 Cy3


mRNA<br />

cDNA<br />

Cy5-cDNA<br />

Stanford microarrays<br />

Muestra A Muestra B<br />

IMPRESIÓN<br />

SONDAS<br />

mRNA<br />

cDNA<br />

Cy3-cDNA


Stanford microarrays – Detección marcaje<br />

• Las muestras hibridadas sobre el microarray se<br />

iluminan sucesivamente con luz láser de dos colores<br />

distintos para estimular la fluorescencia de uno u otro<br />

fluorocromo.<br />

• La cantidad de mRNA unido a una muestra se puede<br />

medir por la intensidad de la fluorescencia emitida al<br />

ser iluminada por el láser del color correspondiente.


Stanford microarrays – Detección marcaje<br />

• Las intensidades de las<br />

fluorescencias emitidas<br />

permiten determinar los<br />

niveles relativos de expresión<br />

de los genes en ambas<br />

muestras problema.


Stanford microarrays: problemas


Stanford microarrays: problemas


La tecnología Affymetrix


La tecnología Affymetrix - Genechip ®


La tecnología Affymetrix - Sondas<br />

• Arrays de oligonucleótidos: síntesis in situ de<br />

oligonucleótidos de 25 bases sobre una superficie<br />

cuadrada de cristal (1.3 cm x 1.3 cm) mediante<br />

fotolitografía.<br />

• 11-20 parejas de sondas específicas para cada gen.<br />

• Sobrerepresentación extremos 3´de los mRNA.<br />

• Seleccionadas para maximizar las temperaturas de<br />

hibridación y la especificidad.


La tecnología Affymetrix - Sondas<br />

• Tamaño del lunar: ~150 µm (Ø).<br />

• Densidad: 10.000-250.000 oligonucleótidos/cm 2 .<br />

• Millones de copias de cada oligonucleótido<br />

específico (10 7 -10 8 copias).<br />

• Un array de oligonucleótidos puede contener<br />

400.000 sondas (aproximadamente 20.000 genes).<br />

• El array de S. cerevisae contiene 6.000 oligos, que<br />

representan todos sus genes conocidos.


La tecnología Affymetrix - Sondas<br />

• Para cada gen existen dos sondas: una de homología<br />

perfecta (PM, Perfect Match) de 25 bases y otra con<br />

una error deliberado/mutación (MM, MisMatch) en la<br />

zona central.<br />

• Buena calidad de datos/ baja varianza.<br />

• La presencia de numerosos genes de control permite<br />

una casi perfecta normalización entre diferentes<br />

experimentos.


Microarrays de DNA - Comparativa<br />

Stanford microarrays:<br />

Flexible, también especies sin secuenciar<br />

Requiere menor presupuesto<br />

Calidad de datos: media-alta<br />

Affymetrix:<br />

No flexible, sólo especies secuenciadas<br />

Equipamiento caro<br />

Calidad de datos: alta


Análisis de imágen


Diseño Array<br />

Diseño Sonda<br />

Microarrays de DNA<br />

PREGUNTA<br />

Diseño Experimental<br />

Preparación Muestra<br />

Hibridación<br />

Análisis de Imagen<br />

Pre-procesamiento de datos<br />

Normalización<br />

Análisis Estadístico<br />

Análisis Avanzado de Datos<br />

Extracción de Genes Relevantes<br />

RESPUESTA<br />

Compra Chip/Array


Análisis de imágen<br />

• Esta nueva forma de experimentar requiere de<br />

nuevas herramientas de análisis y visualización de<br />

resultados.<br />

• Cada experimento de microarrays de DNA genera<br />

una gran cantidad de datos y es preciso realizar un<br />

procesamiento apropiado de los mismos.<br />

• Transformación de las imágenes en números.


Análisis de imágen – Escaneado<br />

Escaneado del porta


Análisis de imágen – Segmentación de los puntos<br />

Intensidad de los puntos: calculo de la media<br />

de los pixel en cada punto.<br />

Corrección del ruido de fondo: local o global.


Análisis de imágen – Evaluación calidad de los datos<br />

La mayor parte de las irregularidades se pueden<br />

detectar por las siguientes medidas:<br />

Variabilidad de la intensidad<br />

Desviación del tamaño de punto<br />

Desviación de la circularidad<br />

Intensidad de señal relativa al fondo<br />

Desviación de la posición en la parrilla<br />

En base a estas medidas, se pueden descartar puntos<br />

irregulares.


Análisis de imágen – Evaluación calidad de los datos<br />

Field Meta Row Meta Column Row Column Gene_ID Flag Signal Mean Background Mean<br />

A 1 1 1 2 ZY030076 0 4655 463<br />

A 1 1 1 3 ZY030066 0 15938 405<br />

A 1 1 1 4 ZY029209 0 7441 390<br />

A 1 1 1 5 ZY030089 0 1842 399<br />

A 1 1 1 6 ZY030084 0 6864 401<br />

A 1 1 1 7 ZY007003 2 471 481<br />

A 1 1 1 8 ZY006869 0 8576 447<br />

A 1 1 1 9 ZY007954 0 4965 405<br />

A 1 1 1 10 ZY006866 0 2236 374<br />

A 1 1 1 11 ZY006782 0 2088 355<br />

A 1 1 1 12 ZY006907 0 4726 342<br />

A 1 1 1 13 ZY006593 0 4437 338<br />

A 1 1 1 14 ZY006850 0 917 321<br />

Matriz de datos de expresión génica


Normalización


Diseño Array<br />

Diseño Sonda<br />

Microarrays de DNA<br />

PREGUNTA<br />

Diseño Experimental<br />

Preparación Muestra<br />

Hibridación<br />

Análisis de Imagen<br />

Pre-procesamiento de datos<br />

Normalización<br />

Análisis Estadístico<br />

Análisis Avanzado de Datos<br />

Extracción de Genes Relevantes<br />

RESPUESTA<br />

Compra Chip/Array


Normalización<br />

• Pre-procesamiento de datos iniciales previo al análisis<br />

estadístico y análisis avanzado de los datos.<br />

• Cada valor de intensidad proviene de una imagen<br />

independiente y es necesario hacer que estos valores<br />

sean comparables. Ajuste básico: igualar la intensidad<br />

media de las imágenes.<br />

• Las intensidades no son únicamente concentraciones de<br />

mRNA, hay múltiples fuentes de variación que pueden<br />

afectar y desviar seriamente la interpretación de los<br />

resultados.


Normalización – Fuentes de variación<br />

Contaminación de tejidos<br />

Degradación<br />

Purificación RNA<br />

Transcripción reversa<br />

Eficiencia de amplificación<br />

Eficiencia de marcaje<br />

(Cy3/Cy5)<br />

Soporte unión DNA<br />

Spotting<br />

Otros temas relacionados<br />

con la preparación del array<br />

Corrección del fondo<br />

Segmentación de la imagen<br />

Eficiencia y especificidad de<br />

hibridación<br />

Efectos espaciales


A<br />

B<br />

C<br />

Normalización<br />

(a) Después de normalización por intensidad media<br />

(b) Después de normalización por Lowess<br />

(c) Después de normalización teniendo en cuenta<br />

efectos espaciales<br />

Antes (izda.) y después normalización (dcha.).<br />

(A) BoxPlots<br />

(B) BoxPlots de subarrays<br />

(C) MA plots (ratio versus intensidad)


Análisis Estadístico


Diseño Array<br />

Diseño Sonda<br />

Microarrays de DNA<br />

PREGUNTA<br />

Diseño Experimental<br />

Preparación Muestra<br />

Hibridación<br />

Análisis de Imagen<br />

Pre-procesamiento de datos<br />

Normalización<br />

Análisis Estadístico<br />

Análisis Avanzado de Datos<br />

Extracción de Genes Relevantes<br />

RESPUESTA<br />

Compra Chip/Array


Análisis estadístico<br />

• Prácticamente cualquier técnica estadística tiene<br />

cabida en los estudios de microarrays de DNA.<br />

• La técnica de agrupamiento de datos más popular es<br />

el análisis de conglomerados:<br />

• A partir de la matriz de datos de expresión<br />

génica.<br />

• Busca formar “grupos naturales”<br />

(conglomerados o clusters) de genes o de<br />

condiciones experimentales que permitan<br />

responder las preguntas del estudio.


Análisis estadístico<br />

• El análisis de conglomerados<br />

permite visualizar aquellos<br />

genes cuyos perfiles de<br />

expresión son más similares.<br />

• Para facilitar la visualización los<br />

números vuelven a convertirse<br />

en colores.


Análisis estadístico<br />

• Otra forma usual de<br />

representar los datos es a<br />

través de un gráfico que<br />

muestre como varia la<br />

expresión del gen entre los<br />

distintos experimentos.


Análisis de resultados


Diseño Array<br />

Diseño Sonda<br />

Microarrays de DNA<br />

PREGUNTA<br />

Diseño Experimental<br />

Preparación Muestra<br />

Hibridación<br />

Análisis de Imagen<br />

Pre-procesamiento de datos<br />

Normalización<br />

Análisis Estadístico<br />

Análisis Avanzado de Datos<br />

Extracción de Genes Relevantes<br />

RESPUESTA<br />

Compra Chip/Array


Análisis de resultados<br />

• Una vez extraída la información de las imágenes hay que<br />

analizar e interpretar los resultados.<br />

• ¿Cómo es posible organizar, visualizar y explorar el<br />

significado de millones de datos de expresión de miles de<br />

genes bajo cientos de condiciones distintas?.<br />

• La forma de analizar los datos dependerá de lo que se<br />

desee averiguar.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!