Transcriptómica - FBMC
Transcriptómica - FBMC
Transcriptómica - FBMC
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Transcriptómica</strong>
¿Qué es la Información Biológica?<br />
Tres niveles básicos de información biológica:<br />
Genoma: la información genética común a todas las<br />
células del organismo.<br />
Transcriptoma: la parte del genoma que se expresa en<br />
una célula en una etapa específica de su desarrollo.<br />
Proteoma: las proteínas que interactuan para dar a la<br />
célula su carácter individual.<br />
Del GENOMA estático, único<br />
al PROTEOMA dinámico, múltiple.
La era de la genómica
La genómica se ha desarrollado como consecuencia<br />
de los avances en Biología Molecular e Informática.<br />
La introducción y popularización de las tecnologías<br />
de alta procesividad ha cambiado drásticamente la<br />
manera en que se abordan los problemas biológicos<br />
y se prueban las hipótesis.
Genómica funcional<br />
• El objetivo de la genómica funcional es<br />
generar un catálogo de todos los genes y de<br />
su función.<br />
• Para comprender el comportamiento de los<br />
sistemas biológicos y de los algoritmos<br />
genéticos que permiten el funcionamiento<br />
celular y el desarrollo de los organismos.
Genómica funcional<br />
• La genómica funcional engloba el estudio del:<br />
• Transcriptoma: conjunto completo de<br />
transcritos.<br />
• Proteoma: conjunto de proteínas codificadas<br />
por un genoma.<br />
• Interactoma: interacción de estos productos.
Genómica funcional<br />
• Planteamiento clásico:<br />
• Dirigido por una hipótesis.<br />
• Limitado el número de genes estudiados.<br />
• Planteamiento genómico:<br />
• No hay hipótesis de partida.<br />
• Información sobre miles de genes.
El paradigma pre-genómico<br />
…codifican<br />
proteínas...<br />
>protein kunase<br />
acctgttgatggcgacagggactgtatgctgatct<br />
atgctgatgcatgcatgctgactactgatgtgggg<br />
gctattgacttgatgtctatc....<br />
Genes en el<br />
DNA...<br />
…cuya estructura<br />
influye en la función...<br />
Del genotipo al<br />
fenotipo<br />
…producen el<br />
fenotipo final<br />
…además el<br />
ambiente...
¿Quién?<br />
Secuenciación<br />
genoma<br />
Espectrometría de masas<br />
para complejos proteícos<br />
¿Y quién más?<br />
La visión post-genómica<br />
Microarrays<br />
de DNA<br />
¿Donde, cómo y cuanto?<br />
SNPs<br />
Literatura,<br />
bases de datos<br />
¿Qué<br />
sabemos?<br />
¿En qué manera?
Transcriptoma
Estudio de los perfiles de expresión de todos<br />
los genes presentes en el genoma.<br />
El método más utilizado es el de microarrays de DNA,<br />
que permite el análisis simultaneo de la expresión de<br />
miles de genes.
DNA<br />
mRNA<br />
Transcripción<br />
G T A A T C C T C<br />
| | | | | | | | |<br />
C A T T A G G A G<br />
RNA<br />
polimerasa<br />
G U A A U C C
Sistemas de detección de la expresión génica<br />
• Pasado: técnicas tradicionales para medir la<br />
expresión génica, como Northern y RT-PCR.<br />
• Desarrollo tecnológico:<br />
• Expressed Sequenced Tags (ESTs).<br />
• Serial analysis gene expression (SAGE).<br />
• Suppression substractive hybridization (SSH).<br />
• Microarrays de DNA.
Cambio de escala: del gen al genoma
Tecnicas genómicas de alta procesividad<br />
• Independientes de conocimiento previo:<br />
• ESTs<br />
• SAGE<br />
• SSH<br />
• Dependientes de conocimiento previo:<br />
• Microarrays de DNA
ESTs<br />
(Expressed Sequenced Tags)<br />
• Generación de colecciones de ESTs<br />
(etiquetas de secuencia expresadas).<br />
• La complejidad de los genomas eucariotas<br />
hace aconsejable no abordar inicialmente el<br />
estudio del genoma completo.<br />
• Es preferible estudiar aquellos genes que se<br />
están expresando en un momento<br />
determinado de la vida del organismo.
ESTs
ESTs<br />
• Genoteca de cDNA: colección de fragmentos<br />
de DNA clonados que representan el conjunto<br />
de genes que se están expresando en un<br />
órgano o tejido determinado, o bajo una<br />
situación particular o momento de desarrollo.<br />
• Las genotecas de cDNA se secuencian de<br />
forma masiva para generar miles de<br />
secuencias parciales o ESTs de 200-500 bp.
ESTs
ESTs<br />
• Las diferencias en la expresión de genes<br />
pueden ser identificadas considerando el<br />
número de veces en que aparece<br />
representada una EST particular.<br />
• Las ESTs por su propia naturaleza, son<br />
incompletas y, hasta cierto punto, imprecisas.<br />
• Las ESTs también suelen ser suficientes<br />
para la identificación de los genes mediante<br />
comparación con las bases de datos.
Microarrays de DNA
Microarrays de DNA<br />
• Los microarrays de DNA surgen de la<br />
necesidad de analizar la cantidad de<br />
información procedente de los grandes<br />
proyectos de secuenciación de genomas.<br />
• Permiten elaborar mapas finos de<br />
transcripción y proporcionan información<br />
indirecta de los niveles de proteínas.
Microarrays de DNA<br />
• El análisis de microarrays de DNA es una nueva<br />
tecnología que permite estudiar simultáneamente la<br />
expresión de miles de genes y analizar su expresión<br />
bajo distintas condiciones experimentales.<br />
• Los microarrays de DNA constan de miles de<br />
conjuntos ordenados de moléculas de DNA de<br />
secuencia conocida depositados en un soporte sólido<br />
(~ 2 cm 2 ) como cristal, nylon o silicio.<br />
• Cada combinación (gen/muestra) se localiza de forma<br />
inequívoca en un punto del microarray.
Microarrays de DNA<br />
• Los microarrays de DNA permiten la medida<br />
simultánea de los niveles de expresión de miles de<br />
genes (sondas) en un solo experimento de<br />
hibridación con una mezcla compleja de DNA o RNA<br />
(dianas).<br />
• Sondas: secuencias de DNA conocidas<br />
(oligonucleótidos o productos de PCR) inmovilizadas<br />
ordenadamente sobre una superficie sólida.<br />
• Dianas: muestra problema de DNA o RNA marcada<br />
cuya abundancia será determinada por hibridación.
Microarrays de DNA - El concepto<br />
Medir el nivel de transcritos (mRNA) de un gran número<br />
de genes simultáneamente para determinar que genes<br />
se están expresando en la célula.<br />
CELL<br />
RNA
Microarrays de DNA – El objetivo<br />
• El objetivo de los experimentos con microarrays de<br />
DNA es comparar la expresión de múltiples genes<br />
(transcripción) en distintas condiciones:<br />
• Momentos distintos del tiempo<br />
• Tejidos distintos<br />
• Tejidos sanos o enfermos (p.e. Tumores)<br />
• Se basan en tecnologías conocidas como la<br />
hibridación y la fluorescencia.
Microarrays de DNA – Sondas<br />
• Cada sonda del microarray de DNA está diseñada<br />
para unirse a un gen de forma específica.<br />
• Diseño de sondas específicas:<br />
• Especificidad de secuencia.<br />
• Tms homogéneas.<br />
• Sin estructuras secundarias.<br />
• Cada sonda está dispuesta de forma ordenada sobre<br />
el microarray de DNA.
Microarrays de DNA – El resultado<br />
• Los microarrays de DNA están formados por 100 - 1<br />
millón de sondas de DNA sobre una superficie de<br />
1 cm por 1 cm (chip de DNA).<br />
• Los resultados de microarrays de DNA se basan en el<br />
concepto de “culpable por asociación”.<br />
• Genes que son co-regulados (patrón similar de<br />
comportamiento) es probable que estén<br />
funcionalmente relacionados formando parte del<br />
mismo proceso biológico.
El primer Microarray de DNA<br />
• 45 Genes de Arabidopsis y 3 genes control:<br />
total 48 señales.<br />
• Schena et al., (1995). Quantitative monitoring of gene expression<br />
patterns with a complementary DNA microarray. Science 270, 467-470.
Microarrays de DNA – Experimento básico<br />
• Un experimento básico de microarrays de DNA<br />
consiste en:<br />
1- Diseño y fabricación del microarray.<br />
2- Preparación de la muestra e hibridación.<br />
3- Escaneo del microarray.<br />
4- Análisis de imagen.<br />
5- Análisis de los resultados.
Diseño Array<br />
Diseño Sonda<br />
Microarrays de DNA<br />
PREGUNTA<br />
Diseño Experimental<br />
Preparación Muestra<br />
Hibridación<br />
Análisis de Imagen<br />
Preprocesamiento de datos<br />
Normalización<br />
Análisis Estadístico<br />
Análisis Avanzado de Datos<br />
Extracción de Genes Relevantes<br />
RESPUESTA<br />
Compra Chip/Array
Microarrays de DNA – Experimento básico
Diseño y fabricación
Diseño y fabricación<br />
• La primera fase del diseño del microarray de DNA<br />
consiste en la selección de los genes que se desean<br />
incorporar al experimento.<br />
• Las secuencias necesarias pueden obtenerse, por<br />
ejemplo, de una base de datos de ESTs.<br />
• Puede haber problemas en la identificación de las<br />
secuencias :<br />
• Errores de secuenciación<br />
• Splicing alternativo<br />
• Contaminación
Diseño y fabricación - Sondas<br />
• Una vez seleccionados los genes se realizan<br />
múltiples copias de cada uno mediante PCR, y los<br />
productos (sondas) se depositan en el sustrato.<br />
• Tipos de sondas:<br />
• Genotecas de cDNA (Stanford microarrays)<br />
• Oligonucleótidos (Affymetrix)<br />
• El soporte sólido (sustrato) del microarray suele ser<br />
cristal, y también membranas de nylon o plástico.
Preparación de la muestra
Preparación de la muestra<br />
1. Diseño experimental<br />
2. Realizar experimento<br />
3. Precipitar RNA<br />
4. Marcaje RNA<br />
¿Pregunta?<br />
¿Réplicas?<br />
mutante<br />
¿Eucariota/procariota?<br />
¿Pared celular?<br />
¿Amplificación?<br />
¿Directo o indirecto?<br />
¿Tipo de marcaje?<br />
silvestre
Microarrays de DNA:<br />
el paradigma de una técnica post-genómica<br />
Cy5 Cy3<br />
Arrays de cDNA Arrays de oligonucleótidos
Microarrays de DNA - La tecnología<br />
Stanford Microarrays<br />
Affymetrix<br />
(GENECHIP)
Stanford Microarrays
Stanford Microarrays – Arrays de cDNA<br />
Portas de cristal<br />
Hibridación<br />
Impresión de las sondas<br />
Post-procesamiento
Stanford microarrays – Impresión robótica<br />
Arrays de cDNA
Stanford microarrays – Impresión robótica<br />
• Tamaño del lunar: 100-300 µm (Ø)<br />
• Espaciado: 150-300 µm<br />
• Número lunares I. mecánica: 250-1000 lunares/cm 2<br />
• Número lunares Ink-jet: >2500 lunares/cm 2<br />
• Cantidad DNA:
Stanford microarrays – Perfiles de expresión génica<br />
Preparar Microarray<br />
Clones DNA PCR<br />
Aislar RNA y marcar<br />
Muestra A Aislar<br />
RNA<br />
Purificar<br />
productos<br />
Marcaje con Cy5<br />
Muestra B Aislar<br />
RNA Marcaje con Cy3<br />
Mezclar, hibridar sondas y analizar datos<br />
Hibridar al<br />
microarray<br />
Impresión<br />
robótica<br />
Lavar Analizar datos
Stanford microarrays: el proceso<br />
Cy5 Cy3
mRNA<br />
cDNA<br />
Cy5-cDNA<br />
Stanford microarrays<br />
Muestra A Muestra B<br />
IMPRESIÓN<br />
SONDAS<br />
mRNA<br />
cDNA<br />
Cy3-cDNA
Stanford microarrays – Detección marcaje<br />
• Las muestras hibridadas sobre el microarray se<br />
iluminan sucesivamente con luz láser de dos colores<br />
distintos para estimular la fluorescencia de uno u otro<br />
fluorocromo.<br />
• La cantidad de mRNA unido a una muestra se puede<br />
medir por la intensidad de la fluorescencia emitida al<br />
ser iluminada por el láser del color correspondiente.
Stanford microarrays – Detección marcaje<br />
• Las intensidades de las<br />
fluorescencias emitidas<br />
permiten determinar los<br />
niveles relativos de expresión<br />
de los genes en ambas<br />
muestras problema.
Stanford microarrays: problemas
Stanford microarrays: problemas
La tecnología Affymetrix
La tecnología Affymetrix - Genechip ®
La tecnología Affymetrix - Sondas<br />
• Arrays de oligonucleótidos: síntesis in situ de<br />
oligonucleótidos de 25 bases sobre una superficie<br />
cuadrada de cristal (1.3 cm x 1.3 cm) mediante<br />
fotolitografía.<br />
• 11-20 parejas de sondas específicas para cada gen.<br />
• Sobrerepresentación extremos 3´de los mRNA.<br />
• Seleccionadas para maximizar las temperaturas de<br />
hibridación y la especificidad.
La tecnología Affymetrix - Sondas<br />
• Tamaño del lunar: ~150 µm (Ø).<br />
• Densidad: 10.000-250.000 oligonucleótidos/cm 2 .<br />
• Millones de copias de cada oligonucleótido<br />
específico (10 7 -10 8 copias).<br />
• Un array de oligonucleótidos puede contener<br />
400.000 sondas (aproximadamente 20.000 genes).<br />
• El array de S. cerevisae contiene 6.000 oligos, que<br />
representan todos sus genes conocidos.
La tecnología Affymetrix - Sondas<br />
• Para cada gen existen dos sondas: una de homología<br />
perfecta (PM, Perfect Match) de 25 bases y otra con<br />
una error deliberado/mutación (MM, MisMatch) en la<br />
zona central.<br />
• Buena calidad de datos/ baja varianza.<br />
• La presencia de numerosos genes de control permite<br />
una casi perfecta normalización entre diferentes<br />
experimentos.
Microarrays de DNA - Comparativa<br />
Stanford microarrays:<br />
Flexible, también especies sin secuenciar<br />
Requiere menor presupuesto<br />
Calidad de datos: media-alta<br />
Affymetrix:<br />
No flexible, sólo especies secuenciadas<br />
Equipamiento caro<br />
Calidad de datos: alta
Análisis de imágen
Diseño Array<br />
Diseño Sonda<br />
Microarrays de DNA<br />
PREGUNTA<br />
Diseño Experimental<br />
Preparación Muestra<br />
Hibridación<br />
Análisis de Imagen<br />
Pre-procesamiento de datos<br />
Normalización<br />
Análisis Estadístico<br />
Análisis Avanzado de Datos<br />
Extracción de Genes Relevantes<br />
RESPUESTA<br />
Compra Chip/Array
Análisis de imágen<br />
• Esta nueva forma de experimentar requiere de<br />
nuevas herramientas de análisis y visualización de<br />
resultados.<br />
• Cada experimento de microarrays de DNA genera<br />
una gran cantidad de datos y es preciso realizar un<br />
procesamiento apropiado de los mismos.<br />
• Transformación de las imágenes en números.
Análisis de imágen – Escaneado<br />
Escaneado del porta
Análisis de imágen – Segmentación de los puntos<br />
Intensidad de los puntos: calculo de la media<br />
de los pixel en cada punto.<br />
Corrección del ruido de fondo: local o global.
Análisis de imágen – Evaluación calidad de los datos<br />
La mayor parte de las irregularidades se pueden<br />
detectar por las siguientes medidas:<br />
Variabilidad de la intensidad<br />
Desviación del tamaño de punto<br />
Desviación de la circularidad<br />
Intensidad de señal relativa al fondo<br />
Desviación de la posición en la parrilla<br />
En base a estas medidas, se pueden descartar puntos<br />
irregulares.
Análisis de imágen – Evaluación calidad de los datos<br />
Field Meta Row Meta Column Row Column Gene_ID Flag Signal Mean Background Mean<br />
A 1 1 1 2 ZY030076 0 4655 463<br />
A 1 1 1 3 ZY030066 0 15938 405<br />
A 1 1 1 4 ZY029209 0 7441 390<br />
A 1 1 1 5 ZY030089 0 1842 399<br />
A 1 1 1 6 ZY030084 0 6864 401<br />
A 1 1 1 7 ZY007003 2 471 481<br />
A 1 1 1 8 ZY006869 0 8576 447<br />
A 1 1 1 9 ZY007954 0 4965 405<br />
A 1 1 1 10 ZY006866 0 2236 374<br />
A 1 1 1 11 ZY006782 0 2088 355<br />
A 1 1 1 12 ZY006907 0 4726 342<br />
A 1 1 1 13 ZY006593 0 4437 338<br />
A 1 1 1 14 ZY006850 0 917 321<br />
Matriz de datos de expresión génica
Normalización
Diseño Array<br />
Diseño Sonda<br />
Microarrays de DNA<br />
PREGUNTA<br />
Diseño Experimental<br />
Preparación Muestra<br />
Hibridación<br />
Análisis de Imagen<br />
Pre-procesamiento de datos<br />
Normalización<br />
Análisis Estadístico<br />
Análisis Avanzado de Datos<br />
Extracción de Genes Relevantes<br />
RESPUESTA<br />
Compra Chip/Array
Normalización<br />
• Pre-procesamiento de datos iniciales previo al análisis<br />
estadístico y análisis avanzado de los datos.<br />
• Cada valor de intensidad proviene de una imagen<br />
independiente y es necesario hacer que estos valores<br />
sean comparables. Ajuste básico: igualar la intensidad<br />
media de las imágenes.<br />
• Las intensidades no son únicamente concentraciones de<br />
mRNA, hay múltiples fuentes de variación que pueden<br />
afectar y desviar seriamente la interpretación de los<br />
resultados.
Normalización – Fuentes de variación<br />
Contaminación de tejidos<br />
Degradación<br />
Purificación RNA<br />
Transcripción reversa<br />
Eficiencia de amplificación<br />
Eficiencia de marcaje<br />
(Cy3/Cy5)<br />
Soporte unión DNA<br />
Spotting<br />
Otros temas relacionados<br />
con la preparación del array<br />
Corrección del fondo<br />
Segmentación de la imagen<br />
Eficiencia y especificidad de<br />
hibridación<br />
Efectos espaciales
A<br />
B<br />
C<br />
Normalización<br />
(a) Después de normalización por intensidad media<br />
(b) Después de normalización por Lowess<br />
(c) Después de normalización teniendo en cuenta<br />
efectos espaciales<br />
Antes (izda.) y después normalización (dcha.).<br />
(A) BoxPlots<br />
(B) BoxPlots de subarrays<br />
(C) MA plots (ratio versus intensidad)
Análisis Estadístico
Diseño Array<br />
Diseño Sonda<br />
Microarrays de DNA<br />
PREGUNTA<br />
Diseño Experimental<br />
Preparación Muestra<br />
Hibridación<br />
Análisis de Imagen<br />
Pre-procesamiento de datos<br />
Normalización<br />
Análisis Estadístico<br />
Análisis Avanzado de Datos<br />
Extracción de Genes Relevantes<br />
RESPUESTA<br />
Compra Chip/Array
Análisis estadístico<br />
• Prácticamente cualquier técnica estadística tiene<br />
cabida en los estudios de microarrays de DNA.<br />
• La técnica de agrupamiento de datos más popular es<br />
el análisis de conglomerados:<br />
• A partir de la matriz de datos de expresión<br />
génica.<br />
• Busca formar “grupos naturales”<br />
(conglomerados o clusters) de genes o de<br />
condiciones experimentales que permitan<br />
responder las preguntas del estudio.
Análisis estadístico<br />
• El análisis de conglomerados<br />
permite visualizar aquellos<br />
genes cuyos perfiles de<br />
expresión son más similares.<br />
• Para facilitar la visualización los<br />
números vuelven a convertirse<br />
en colores.
Análisis estadístico<br />
• Otra forma usual de<br />
representar los datos es a<br />
través de un gráfico que<br />
muestre como varia la<br />
expresión del gen entre los<br />
distintos experimentos.
Análisis de resultados
Diseño Array<br />
Diseño Sonda<br />
Microarrays de DNA<br />
PREGUNTA<br />
Diseño Experimental<br />
Preparación Muestra<br />
Hibridación<br />
Análisis de Imagen<br />
Pre-procesamiento de datos<br />
Normalización<br />
Análisis Estadístico<br />
Análisis Avanzado de Datos<br />
Extracción de Genes Relevantes<br />
RESPUESTA<br />
Compra Chip/Array
Análisis de resultados<br />
• Una vez extraída la información de las imágenes hay que<br />
analizar e interpretar los resultados.<br />
• ¿Cómo es posible organizar, visualizar y explorar el<br />
significado de millones de datos de expresión de miles de<br />
genes bajo cientos de condiciones distintas?.<br />
• La forma de analizar los datos dependerá de lo que se<br />
desee averiguar.