secuenciación de ácidos nucleicos - Instituto de Biotecnología - UNAM

secuenciación de ácidos nucleicos - Instituto de Biotecnología - UNAM secuenciación de ácidos nucleicos - Instituto de Biotecnología - UNAM

18.05.2013 Views

INSTITUTO DE BIOTECNOLOGÍA-UNAM MÉTODOS FISICOQUÍMICOS EN BIOTECNOLOGÍA: SECUENCIACIÓN DE ÁCIDOS NUCLEICOS PROYECTO DE INVESTIGACIÓN: ROSALIA DE NECOCHEA CAMPION JUAN CARLOS CANUL TEC CUERNAVACA,MOR JUNIO 2004

INSTITUTO DE BIOTECNOLOGÍA-<strong>UNAM</strong><br />

MÉTODOS FISICOQUÍMICOS EN BIOTECNOLOGÍA:<br />

SECUENCIACIÓN<br />

DE ÁCIDOS NUCLEICOS<br />

PROYECTO DE INVESTIGACIÓN:<br />

ROSALIA DE NECOCHEA CAMPION<br />

JUAN CARLOS CANUL TEC<br />

CUERNAVACA,MOR JUNIO 2004


INDICE<br />

Algunos acontecimientos relevantes al <strong>de</strong>sarrollo <strong>de</strong> los 3<br />

métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong><br />

1.0 INTRODUCCIÓN 5<br />

1.1 Los orígenes <strong>de</strong> la investigación <strong>de</strong> los <strong>ácidos</strong> nucleícos 6<br />

1.2 La i<strong>de</strong>ntificación <strong>de</strong> los componentes 7<br />

1.3 El <strong>de</strong>scubrimiento <strong>de</strong> la estructura <strong>de</strong>l ADN 8<br />

2.0 FUNDAMENTOS TEÓRICOS 11<br />

2.1 Estructura <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> 11<br />

2.2 Función biológica <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> 12<br />

3.0 DESARROLLO HISTÓRICO 13<br />

3.1 Secuenciación <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> 13<br />

3.2 El método <strong>de</strong> <strong>de</strong>gradación química 17<br />

3.2.1 Ventajas y <strong>de</strong>sventajas 19<br />

3.3 El método enzimático 20<br />

3.3.1 Limitaciones <strong>de</strong>l método enzimático 21<br />

4.0 MÉTODOS CONTEMPORÁNEOS EN LA SECUENCIACIÓN 22<br />

4.1 Automatización <strong>de</strong>l método <strong>de</strong> Sanger 22<br />

4.1.1 La técnica <strong>de</strong> PCR y su relevancia a la <strong>secuenciación</strong> 23<br />

4.1.2 Polimerasa Taq 24<br />

4.1.3 Marcado <strong>de</strong> la ca<strong>de</strong>na <strong>de</strong> ADN 25<br />

4.1.4 Incorporación <strong>de</strong>l marcaje a la ca<strong>de</strong>na <strong>de</strong> ADN 26<br />

4.1.5 Secuenciación automatizada 28<br />

4.1.6 El <strong>de</strong>sarrollo <strong>de</strong> maquinas <strong>de</strong> <strong>secuenciación</strong> 29<br />

4.2 Secuenciación <strong>de</strong> ARN 31<br />

4.2.1 Métodos indirectos 31<br />

4.2.2 Métodos directos 33<br />

4.3 Resumen <strong>de</strong> enzimas utilizadas en la <strong>secuenciación</strong> 34<br />

5.0 ESTRATEGIAS Y APLICACIONES DE LA SECUENCIACIÓN DE 35<br />

ÁCIDOS NUCLEICOS<br />

5.1 Proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano 35<br />

5.2 Estrategias para la <strong>secuenciación</strong> <strong>de</strong> fragmentos gran<strong>de</strong>s 37<br />

5.2.1 “Chromosome Walking” 37<br />

5.2.2 “Shotgun Sequencing” 38<br />

5.3 Otras aplicaciones 40<br />

6.0 El FUTURO DE LA SECUENCIACION 41<br />

6.1 Secuenciación por hibridización 41<br />

6.2 Secuenciación a futuro sin fragmentación <strong>de</strong> ADN 41<br />

7.0 REFERENCIAS 43<br />

1


Figuras<br />

INDICE DE TABLAS Y FIGURAS<br />

Figura 1. Las bases presentes en los <strong>ácidos</strong> <strong>nucleicos</strong> 7<br />

Figura 2. Estructura química <strong>de</strong> los nucleótidos 8<br />

Figura 3. Estructura <strong>de</strong> la doble hélice <strong>de</strong>l ADN 11<br />

Figura 4. El método <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> Maxam y Gilbert 19<br />

Figura 5. Enzimas <strong>de</strong> restricción 20<br />

Figura 6. El método <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> Sanger 21<br />

Figura 7. La reacción <strong>de</strong> PCR 23<br />

Figura 8. Secuenciadora con <strong>de</strong>tección paralela para 96 caplilares 31<br />

Figura 9. La secuenciadora ABI PRISM 3700 32<br />

Figura 10. La estrategia <strong>de</strong> “chromosome walking” 38<br />

Figura 11. La estrategia <strong>de</strong> <strong>secuenciación</strong> “shotgun” 39<br />

Figura 12. Secuenciación por hibridización 41<br />

Tablas<br />

Tabla 1. 22<br />

Descubrimientos significativos que permitieron el <strong>de</strong>sarrollo <strong>de</strong> métodos<br />

automatizados <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong><br />

Tabla 2. 35<br />

Algunas <strong>de</strong> las enzimas que han tenido un papel importante<br />

en el <strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong><br />

2


Algunos acontecimientos relevantes al <strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong><br />

<strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> nucleícos<br />

1871. Johann Meisher <strong>de</strong>scribe el ácido <strong>de</strong>soxirribonucleico (ADN) en el<br />

esperma <strong>de</strong> la trucha.<br />

1944. Oswald Avery, Colin McLeod y Macyln McCarthy <strong>de</strong>muestran que el ADN<br />

es la substancia en don<strong>de</strong> resi<strong>de</strong> la información genética.<br />

1950. Erwin Chargaff <strong>de</strong>termina que las cantida<strong>de</strong>s <strong>de</strong> a<strong>de</strong>nina y timina, y <strong>de</strong><br />

citosina y guanina, son las mismas en el ADN: “reglas <strong>de</strong> Chargaff”.<br />

1952. Rosalind Franklin y Maurice Wilkins llevan a cabo estudios <strong>de</strong><br />

cristalografía <strong>de</strong> rayos X <strong>de</strong>l ADN.<br />

1953. James Watson y Francis Crick proponen el mo<strong>de</strong>lo <strong>de</strong> la doble hélice <strong>de</strong>l<br />

ADN.<br />

1958. Matthew Meselson y Frank Stahl <strong>de</strong>muestran que la replicación <strong>de</strong>l ADN<br />

es semiconservativa.<br />

1960. Arthur Kornberg <strong>de</strong>scubre y aísla la enzima ADN polimerasa.<br />

1961. Marshall Niremberger y Severo Ochoa establecen el código genético<br />

universal.<br />

1968. Matthew Meselson y Robert Yuan aíslan la primera endonucleasa <strong>de</strong><br />

restricción.<br />

1977. Allan Maxam y Walter Gilbert, y Fre<strong>de</strong>rick Sanger et al., <strong>de</strong>sarrollan<br />

simultáneamente métodos para la <strong>de</strong>terminación <strong>de</strong> la secuencia <strong>de</strong><br />

nucleótidos <strong>de</strong>l ADN.<br />

1978. F. Sanger y su equipo reportan la secuencia genómica completa <strong>de</strong>l<br />

virus øX174.<br />

1981. Se reporta la secuencia <strong>de</strong>l genoma <strong>de</strong> la mitocondria humana.<br />

1983. Marvin Carruthers y Leroy Hood <strong>de</strong>sarrollan un método para secuenciar<br />

automáticamente fragmentos <strong>de</strong> ADN <strong>de</strong> 5 a 75 pares <strong>de</strong> bases.<br />

3


1986. Leroy Hood y Lloyd Smith <strong>de</strong>sarrollan el primer secuenciador automático,<br />

que usa un láser que reconoce marcadores <strong>de</strong> fluorescencia en el ADN.<br />

1987. Kary Mullis <strong>de</strong>sarrolla la técnica <strong>de</strong> PCR que permite amplificar millones<br />

<strong>de</strong> veces fragmentos específicos <strong>de</strong> ADN.<br />

1988. Por iniciativa <strong>de</strong> Watson, el <strong>Instituto</strong> Nacional <strong>de</strong> Salud en EUA,<br />

establece la Oficina para la Investigación <strong>de</strong>l Genoma Humano.<br />

1990. Tres grupos <strong>de</strong>sarrollan simultáneamente el método <strong>de</strong> electroforesis<br />

capilar, que optimiza la automatización <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />

ADN.<br />

Se inicia el Proyecto <strong>de</strong>l Genoma Humano.<br />

1995. Se reporta la primera secuencia completa <strong>de</strong>l genoma <strong>de</strong> un organismo<br />

vivo, el <strong>de</strong> la bacteria Haemophilus influenzae.<br />

1996. Se reporta la primera secuencia <strong>de</strong>l genoma <strong>de</strong> un eucarionte, el <strong>de</strong> la<br />

levadura Saccharomyces cerevisiae.<br />

1998. Se reporta la primera secuencia <strong>de</strong>l genoma <strong>de</strong> un animal; el <strong>de</strong><br />

Caenorhabditis elegans.<br />

1999. Se reporta la secuencia nucleotídica <strong>de</strong>l cromosoma humano 22.<br />

2000. Se reporta la primera secuencia <strong>de</strong>l genoma <strong>de</strong> una planta, el <strong>de</strong><br />

Arabidopsis thaliana.<br />

2001. Se reporta por dos grupos en forma simultánea, la secuencia<br />

nucleotídica <strong>de</strong>l genoma humano.<br />

2002. Se reportan las secuencias nucleotídicas <strong>de</strong> los genomás <strong>de</strong>l ratón (Mus<br />

musculus) y <strong>de</strong>l arroz (Oryza sativa).<br />

4


1.0 INTRODUCCIÓN.<br />

El lento y tortuoso progreso que acompañó los inicios <strong>de</strong> la investigación <strong>de</strong> los<br />

<strong>ácidos</strong> <strong>nucleicos</strong> es representativo <strong>de</strong> lo limitado <strong>de</strong> las técnicas y la falta <strong>de</strong><br />

facilida<strong>de</strong>s en los períodos tempranos <strong>de</strong> la bioquímica. Las dificulta<strong>de</strong>s<br />

encontradas por los investigadores fueron muchas. Era difícil asegurar la<br />

homogeneidad <strong>de</strong>l material <strong>de</strong> trabajo. No existían métodos establecidos para<br />

el estudio <strong>de</strong> macromoléculas, y tampoco pautas para el aislamiento <strong>de</strong><br />

unida<strong>de</strong>s estructurales. Afortunadamente, algunas substancias cercanamente<br />

relacionadas fueron sintetizadas por químicos orgánicos en experimentos que<br />

usualmente no estaban relacionados con los <strong>ácidos</strong> <strong>nucleicos</strong>. Si la<br />

investigación <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> <strong>de</strong>be mucho a la química orgánica en su<br />

período inicial, el trabajo conjunto <strong>de</strong> la biología y la química han hecho <strong>de</strong> la<br />

investigación contemporánea <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> una rica fuente <strong>de</strong><br />

<strong>de</strong>scubrimiento e invención que ha transformado y mejorado la condición<br />

humana.<br />

En general, los <strong>ácidos</strong> <strong>nucleicos</strong> son polímeros lineales <strong>de</strong> nucleótidos.<br />

Pue<strong>de</strong>n tener <strong>de</strong>s<strong>de</strong> 80 nucleótidos, como en el tARN, hasta más <strong>de</strong> 10 8 pares<br />

<strong>de</strong> nucleótidos en un cromosoma eucariótico. El cromosoma <strong>de</strong> Escherichia<br />

coli tiene 4 x 10 6 pares <strong>de</strong> bases, 4Mpb. El ADN genómico <strong>de</strong> una sola célula<br />

humana tiene 3,900 Mpb. A un laboratorio <strong>de</strong> la mitad <strong>de</strong> la década <strong>de</strong> los<br />

setentas le habría tomado dos meses secuenciar 150 nucleótidos.<br />

Actualmente, un laboratorio especializado es capaz <strong>de</strong> secuenciar varios<br />

millones <strong>de</strong> nucleótidos al día. Des<strong>de</strong> esta perspectiva, resulta notoria la<br />

capacidad <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> <strong>de</strong> las tecnologías disponibles<br />

actualmente. Y es principalmente, el <strong>de</strong>sarrollo y la automatización <strong>de</strong> los<br />

métodos fisicoquímicos <strong>de</strong> macromoléculas biológicas, en general, lo que ha<br />

permitido lograr estos avances en el conocimiento <strong>de</strong>l material genético.<br />

A finales <strong>de</strong>l siglo pasado, se secuenciaron los primeros genomás,<br />

correspondientes a las bacterias Haemophilus Influenzae y Mycobacterium<br />

genitalium. Esfuerzos más recientes han permitido la <strong>de</strong>terminación <strong>de</strong><br />

secuencias genómicas más complejas. El primer eucarionte secuenciado fue<br />

Saccharomyces cerevisiae. Posteriormente se reportaron las secuencias <strong>de</strong> los<br />

genomás <strong>de</strong> Caenorhabditis elegans, <strong>de</strong> Drosophila melanogaster y <strong>de</strong><br />

Arabidopsis thaliana. A principios <strong>de</strong>l año 2001, dos grupos, <strong>de</strong> manera<br />

simultánea e in<strong>de</strong>pendiente, reportaron la secuencia <strong>de</strong>l genoma humano, y a<br />

fines <strong>de</strong>l año 2002 se reportó el genoma <strong>de</strong>l ratón y <strong>de</strong>l arroz.<br />

5


Con la <strong>de</strong>terminación <strong>de</strong> la secuencia nucleotídica <strong>de</strong>l genoma humano y<br />

la <strong>de</strong> otros organismos nos hemos a<strong>de</strong>ntrado en el conocimiento <strong>de</strong> la célula.<br />

Conociendo la secuencia <strong>de</strong> todos los genes <strong>de</strong> un organismo, es posible<br />

<strong>de</strong>ducir su proteoma. Asimismo, con la información que se tiene, es posible<br />

empezar el estudio integral y global <strong>de</strong> las re<strong>de</strong>s metabólicas y conocer la<br />

manera en que una célula regula la expresión genética en diferentes<br />

condiciones metabólicas. Sin embargo, este nuevo conocimiento es preliminar.<br />

Si bien po<strong>de</strong>mos enlistar todos los genes <strong>de</strong> una célula, la <strong>de</strong>terminación <strong>de</strong> las<br />

posibles interacciones entre sus productos es una meta a largo plazo todavía.<br />

Hay, pues, mucho más que conocer para enten<strong>de</strong>r el proceso mismo <strong>de</strong> la<br />

vida.<br />

En este trabajo se expone una breve perspectiva histórica <strong>de</strong> algunos <strong>de</strong><br />

los hechos que han repercutido sensiblemente en el avance <strong>de</strong> las tecnologías<br />

para la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> nucleícos. Des<strong>de</strong> el tortuoso camino que<br />

llevo a la elucidación <strong>de</strong> la estructura <strong>de</strong> la doble hélice, pasando por los<br />

esfuerzos iniciales para <strong>de</strong>sentrañar el lenguaje <strong>de</strong>l ADN (y <strong>de</strong> la vida) y los<br />

esfuerzos más recientes que inauguraron la era <strong>de</strong> la genómica. Una mirada<br />

hacia atrás siempre es importante, no sólo porque ayuda a consolidar los<br />

conceptos <strong>de</strong> una materia en particular, sino también porque se pue<strong>de</strong><br />

apren<strong>de</strong>r <strong>de</strong> las experiencias <strong>de</strong> otros. A<strong>de</strong>más, se presentan los fundamentos<br />

teóricos y físicos relacionados con la química <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.y su<br />

<strong>secuenciación</strong>. Finalmente, se citan algunas <strong>de</strong> las aplicaciones que han<br />

permitido profundizar en el conocimiento <strong>de</strong>l material genético <strong>de</strong> las células.<br />

1.1 Los orígenes <strong>de</strong> la investigación <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

La historia <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> iniciando en 1869, con los estudios<br />

<strong>de</strong>l bioquímico sueco Friedrich Miescher. En Tuebingen, Miescher extrajo un<br />

material <strong>de</strong> una fracción nuclear <strong>de</strong> leucocitos presentes en pus obtenido <strong>de</strong><br />

vendajes quirúrgicos. El material extraído, al cual <strong>de</strong>nomino nucleína, era rico<br />

en fósforo. En 1870, Miescher se movió a Basel, don<strong>de</strong> encontró que el<br />

extracto <strong>de</strong> esperma <strong>de</strong> salmón era una gran fuente <strong>de</strong> nucleína. La nucleína<br />

era una substancia albuminoi<strong>de</strong> y fuertemente ácida, combinada con una base<br />

nitrogenada que Miescher cristalizó y llamo protamina. De hecho, la nucleína<br />

era en realidad una nucleoproteína. Richard Altmann (1889) obtuvo el primer<br />

material libre <strong>de</strong> proteína, al cual dio el nombre <strong>de</strong> ácido nucleico. Jules<br />

Piccard, compañero <strong>de</strong> Miescher en Basel, hizo más estudios con la nucleína y<br />

encontró que también contenía guanina e hipoxantina. Sin embargo, ni<br />

Meischer, ni sus colegas y sucesores se imaginaron que el ácido nucleico<br />

pudiera llevar mensajes complejos en patrones repetidos <strong>de</strong> componentes más<br />

pequeños (Levine y Suzuki, 2000). La botella con el inocente polvo blanco se<br />

6


quedó en el anaquel <strong>de</strong>l laboratorio. Tuvieron que pasar varias décadas para<br />

revelar que, <strong>de</strong> hecho, era una botella <strong>de</strong> genes.<br />

1.2 La i<strong>de</strong>ntificación <strong>de</strong> los componentes.<br />

Lentamente se fueron llevando a cabo estudios más exactos para la<br />

i<strong>de</strong>ntificación <strong>de</strong> los componentes <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>. La guanina (G)<br />

había sido aislada <strong>de</strong>l guano; sin embargo, su relación con los <strong>ácidos</strong> <strong>nucleicos</strong><br />

se estableció hasta 1910, al compararla con el nucleósido que Phoebus<br />

Levene obtuvo <strong>de</strong>l ácido guanílico. Albrecht Kossel y A. Neumann aislaron la<br />

a<strong>de</strong>nina (A) y la timina (T) <strong>de</strong> la glándula <strong>de</strong>l timo. Ascoli y Steu<strong>de</strong>l<br />

<strong>de</strong>scubrieron la citosina (C) y el uracilo (U) (Schlenk, 1988).<br />

La ribosa y la <strong>de</strong>soxirribosa fueron aisladas por Levene en 1909 y 1930,<br />

respectivamente. En ambos casos, el aislamiento <strong>de</strong> los nucleósidos fue un<br />

requisito para proveer el material inicial. La hidrólisis con piridina <strong>de</strong>l ácido<br />

nucleico <strong>de</strong> levadura produjo fosfatos y los nucleósidos a<strong>de</strong>nosina, citosina,<br />

guanosina y uridina. Levene <strong>de</strong>terminó que en todos los nucleósidos la pentosa<br />

era una ribosa y nombró al ácido original como ácido ribonucleico (ARN). Los<br />

nucleósidos fueron i<strong>de</strong>ntificados como <strong>de</strong>rivados <strong>de</strong> las bases A, C, G y U<br />

(figura 1). En 1929, Levene i<strong>de</strong>ntificó la <strong>de</strong>soxirribosa <strong>de</strong>l ácido nucleico aislado<br />

<strong>de</strong>l tejido <strong>de</strong> la pantorrilla, al cual <strong>de</strong>nominó ácido <strong>de</strong>soxirribonucleico (ADN).<br />

Este ácido exhibía una mayor resistencia a la hidrólisis química que el ARN, y<br />

consiguió <strong>de</strong>gradarlo con enzimás, seguido <strong>de</strong> la hidrólisis ácida <strong>de</strong> sus<br />

<strong>de</strong>soxinucleótidos.<br />

En 1935, se <strong>de</strong>scubrió que el ADN podría ser cortado enzimáticamente<br />

en mononucleótidos, en presencia <strong>de</strong> arsenato. Usando este procedimiento,<br />

Klein y Thannhauser obtuvieron los <strong>de</strong>soxirribonucleótidos y establecieron que<br />

cada nucleótido está unido por un enlace fosfodiéster <strong>de</strong>l hidroxilo 5´ al<br />

hidroxilo 3´ <strong>de</strong> su otro vecino (figura 2).<br />

Figura 1. Las bases presentes en los<br />

<strong>ácidos</strong> <strong>nucleicos</strong>. Las bases guanina<br />

(G), a<strong>de</strong>nina (A) y citosina (C) existen<br />

en el ADN y el ARN. La timina (T) sólo<br />

se encuentra en el ADN y es<br />

substituida en el ARN por el uracilo<br />

(U). Estas bases están unidas<br />

covalentemente a los azúcares<br />

<strong>de</strong>soxirribosa y ribosa, para formar<br />

así los nucleótidos <strong>de</strong>l ADN y ARN,<br />

respectivamente (ver figura 3).<br />

7


De manera lenta y errática, las i<strong>de</strong>as provenientes <strong>de</strong> diversos campos<br />

empezaron a señalar al ADN como un participante <strong>de</strong> importancia en la vida <strong>de</strong><br />

la célula. El trabajo <strong>de</strong> Fred Griffith en 1928 y el <strong>de</strong> los investigadores Oswald<br />

Avery, Colin McLeod y Macyln McCarthy, en 1944, permitió <strong>de</strong>mostrar<br />

inequívocamente que la información genética resi<strong>de</strong> en el ADN. Esta<br />

contribución dio lugar a que un importante esfuerzo científico se enfocara en la<br />

<strong>de</strong>terminación <strong>de</strong> la composición y la estructura química <strong>de</strong> la molécula <strong>de</strong>l<br />

ADN. Pese a lo anterior, durante algún tiempo muchos bioquímicos insistieron<br />

en que el ADN era una molécula <strong>de</strong>másiado “tonta” como para llevar mucha<br />

información; los componentes <strong>de</strong>l ADN parecían muy simples y repetitivos<br />

como para ser portadores <strong>de</strong> información.<br />

Figura 2. Estructura<br />

química <strong>de</strong> los (a)<br />

ribonucleótidos y (b)<br />

<strong>de</strong>soxirribonucleótidos<br />

, constituyentes <strong>de</strong> los<br />

<strong>ácidos</strong> <strong>nucleicos</strong>. En el<br />

ARN, el C-1´ <strong>de</strong> la Dribosa<br />

está unido al N-<br />

9 <strong>de</strong> A o G, o al N-1 <strong>de</strong><br />

C o U. En el ADN, la 2´<strong>de</strong>soxi-D-ribosa<br />

está<br />

unida <strong>de</strong> la misma forma a las cuatro bases, pero la T toma el lugar <strong>de</strong>l U (los<br />

números con til<strong>de</strong> se refieren a los átomos <strong>de</strong> la pentosa; los números sin til<strong>de</strong> se<br />

refieren a los <strong>de</strong> la base nitrogenada). Los grupos fosfato pue<strong>de</strong>n estar unidos al<br />

C3´ o al C5´ <strong>de</strong> la pentosa. Si el grupo fosfato está ausente, el compuesto es un<br />

nucleósido. En todos los nucleótidos y nucleósidos naturales, el enlace Nglicosídico<br />

que une la base nitrogenada al C1´ <strong>de</strong>l azúcar es <strong>de</strong> configuración _<br />

(Voet & Voet, 1995).<br />

1.3 El <strong>de</strong>scubrimiento <strong>de</strong> la estructura <strong>de</strong>l ADN.<br />

A mediados <strong>de</strong>l siglo pasado, los investigadores no pudieron avanzar<br />

más en la elucidación <strong>de</strong> la estructura primaria <strong>de</strong>l ADN. Ninguno <strong>de</strong> los<br />

requerimientos claves para la <strong>de</strong>terminación <strong>de</strong> la secuencia estaba a la mano:<br />

no habían métodos para obtener muestras puras <strong>de</strong> ADN con una secuencia<br />

<strong>de</strong> bases homogénea, y tampoco estaban disponibles métodos para el corte <strong>de</strong><br />

ca<strong>de</strong>nas <strong>de</strong> ADN en una base específica. Consecuentemente, toda la atención<br />

se centró en la estructura secundaria.<br />

Dos experimentos in<strong>de</strong>pendientes <strong>de</strong>mostraron que el ADN poseía una<br />

estructura secundaria or<strong>de</strong>nada. Ambos <strong>de</strong>jaron información vital para sus<br />

8


sucesores, sin embargo, cada contribución tenía un error. En 1938, William<br />

Astbury obtuvo un patrón <strong>de</strong> difracción <strong>de</strong> rayos-x <strong>de</strong> fibras secas <strong>de</strong> ADN, y<br />

<strong>de</strong>dujo que el espacio <strong>de</strong> 3.34 Å a lo largo <strong>de</strong>l eje <strong>de</strong> la fibra correspondía al <strong>de</strong><br />

una sucesión cercana <strong>de</strong> nucleótidos planos. Éstos sobresalían<br />

perpendicularmente a lo largo <strong>de</strong>l eje <strong>de</strong> la molécula para formar una estructura<br />

relativamente rígida. Algunos años <strong>de</strong>spués, J. Gulland estudió la viscosidad y<br />

la birrefringencia <strong>de</strong> flujo <strong>de</strong>l ADN y postuló la presencia <strong>de</strong> puentes <strong>de</strong><br />

hidrógeno que unían a los grupos hidroxilo <strong>de</strong> la piridina y la purina y a algunos<br />

<strong>de</strong> los grupos aminos. Desafortunadamente, utilizó las formás tautoméricas<br />

enol para la timina y la guanina. La importancia <strong>de</strong> las formás tautoméricas<br />

correctas (ceto), se reconoció hasta 1953.<br />

Erwin Chargaff estudió la composición <strong>de</strong>l ADN <strong>de</strong> una amplia variedad<br />

<strong>de</strong> fuentes. Mediante cromatografía en papel separó los productos <strong>de</strong> la<br />

hidrólisis <strong>de</strong>l ADN y con espectroscopia ultravioleta cuantificó sus abundancias<br />

relativas. Sus datos mostraron que la proporción <strong>de</strong> purinas (A+G) siempre es<br />

igual a la proporción <strong>de</strong> pirimidinas (C-T) en el ADN <strong>de</strong> cualquier organismo.<br />

Aunque la proporción (G+C)/(A+T) varía <strong>de</strong> especie a especie, diferentes<br />

tejidos <strong>de</strong> una sola especie tienen la misma composición <strong>de</strong> ADN. Cualquier<br />

estructura propuesta para el ADN tenía que consi<strong>de</strong>rar este patrón (figura 3).<br />

Los patrones <strong>de</strong> difracción <strong>de</strong> rayos X realizados por Rosalind Franklin y<br />

Maurice Wilkins revelaron que el ADN podía tener dos estructuras secundarias<br />

posibles, cuya formación <strong>de</strong>pendía <strong>de</strong> la humedad relativa a la cual se<br />

obtuvieran los datos. La forma A <strong>de</strong>l ADN se obtuvo a baja humedad. En<br />

cambio, el patrón <strong>de</strong>l B-ADN prevalece a una humedad elevada. Éste patrón<br />

entrecruzado, representativo <strong>de</strong> las estructuras helicoidales, tiene una fuerte<br />

reflexión a 0.34 nm, que indica el espaciamiento entre los pares <strong>de</strong> bases<br />

adyacentes, y una reflexión a 3.4 nm que correspon<strong>de</strong> a un giro completo <strong>de</strong> la<br />

hélice. Franklin propuso que este comportamiento requería que los grupos<br />

fosfatos estuvieran expuestos al agua en el exterior <strong>de</strong> la hélice, con el<br />

corolario <strong>de</strong> que las bases estuvieran en el interior <strong>de</strong> la hélice.<br />

En 1953, James Watson y Francis Crick <strong>de</strong>scifraron la estructura <strong>de</strong>l<br />

ADN. Watson propuso que el número <strong>de</strong> nucleótidos en la célula unitaria<br />

cristalográfica favorecía una hélice <strong>de</strong> doble ca<strong>de</strong>na. Crick <strong>de</strong>dujo <strong>de</strong> los datos<br />

<strong>de</strong>l patrón <strong>de</strong> difracción que la estructura era una díada, es <strong>de</strong>cir, que tiene una<br />

asimetría tal que las ca<strong>de</strong>nas equivalentes son antiparalelas, es <strong>de</strong>cir, corren<br />

en direcciones opuestas a lo largo <strong>de</strong>l eje longitudinal. Sólo quedaba por<br />

resolver un problema: cómo construir el núcleo <strong>de</strong> la hélice, empacando las<br />

bases juntas en una estructura regular. A partir <strong>de</strong> las conclusiones <strong>de</strong> Gulland,<br />

Watson sabía que los puentes <strong>de</strong> hidrógeno unían las bases <strong>de</strong>l ADN. Esto lo<br />

9


convenció <strong>de</strong> que la esencia <strong>de</strong> la cuestión tenía que ser una regla que<br />

gobernara los puentes <strong>de</strong> hidrógeno entre las bases.<br />

Aconsejado por Jerry Donohue, Watson manipuló mo<strong>de</strong>los <strong>de</strong> las bases,<br />

en las formás tautoméricas ceto, apareando la A con la T y la G con la C.<br />

Encontró una relación simple y convincente que involucraba dos puentes <strong>de</strong><br />

hidrógeno para una pareja A·T y tres puentes <strong>de</strong> hidrógeno para una pareja<br />

G·C. La característica especial <strong>de</strong> este esquema <strong>de</strong> apareamiento <strong>de</strong> bases es<br />

que la geometría relativa <strong>de</strong> los enlaces uniendo las bases a las pentosas es<br />

virtualmente idéntico para los pares A·T y G·C. Resultó obvio que si una purina<br />

siempre se aparea con una pirimidina, entonces una secuencia irregular <strong>de</strong><br />

bases en una ca<strong>de</strong>na sencilla <strong>de</strong> ADN podría estar apareada regularmente en<br />

el centro <strong>de</strong> una doble hélice sin pérdida <strong>de</strong> simetría. Las reglas <strong>de</strong> Chargaff<br />

fueron reveladas directamente como una consecuencia obligatoria <strong>de</strong> una<br />

estructura <strong>de</strong> doble hélice para el ADN. Sobre todo, ya que la secuencia <strong>de</strong><br />

bases <strong>de</strong> una ca<strong>de</strong>na automáticamente <strong>de</strong>termina la <strong>de</strong> su pareja, Crick y<br />

Watson pudieron visualizar fácilmente cómo una ca<strong>de</strong>na sencilla podría ser el<br />

templado para la síntesis <strong>de</strong> una segunda ca<strong>de</strong>na <strong>de</strong> secuencia <strong>de</strong> bases<br />

complementaria (figura 3).<br />

El mo<strong>de</strong>lo <strong>de</strong> Watson y Crick <strong>de</strong> la estructura <strong>de</strong>l ADN fue aceptado<br />

rápidamente porque lograba dos cuestiones importantes. Primero, daba cuenta<br />

<strong>de</strong> toda la evi<strong>de</strong>ncia química y física disponible. Segundo, abría el camino para<br />

explicar, <strong>de</strong> manera más <strong>de</strong>tallada, como lleva a cabo el ADN las funciones<br />

necesarias para ser el portador <strong>de</strong> la información hereditaria. A partir <strong>de</strong> este<br />

momento, fue aparente que toda la información requerida para especificar la<br />

diversidad <strong>de</strong> las moléculas biológicas, necesaria para llevar a cabo las<br />

funciones <strong>de</strong> la célula, había que buscarla en la secuencia irregular <strong>de</strong> las<br />

bases nucleotídicas. Alexan<strong>de</strong>r Dounce, en 1950, postuló que el ARN era el<br />

templado que dirigía la síntesis <strong>de</strong> proteínas celulares y que una secuencia <strong>de</strong><br />

tres nucleótidos especificaba solo un aminoácido. El reconocimiento <strong>de</strong> varios<br />

tipos <strong>de</strong> ARN por Robert Holley no tardó en llegar. Más a<strong>de</strong>lante, Gobind<br />

Khorana sintetizó los 64 tri-ribonucleósidos difosfato y los poli-ribonucleótidos<br />

con secuencias repetidas <strong>de</strong> di-, tri- y tetranucleótidos que fueron usados como<br />

mARN para i<strong>de</strong>ntificar cada triplete <strong>de</strong>l código. Y el establecimiento <strong>de</strong>l código<br />

genético por Marshall Niremberg y Severo Ochoa fue el evento culminante.<br />

10


Figura 3. Representación esquemática <strong>de</strong> la estructura <strong>de</strong> la doble hélice <strong>de</strong>l ADN.<br />

En el texto se explica la configuración <strong>de</strong> la estructura.<br />

2.0 FUNDAMENTOS TEORICOS.<br />

2.1 Estructura <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

El ADN es una doble hélice. Cada una <strong>de</strong> las hélices es un polímero<br />

integrado por millones <strong>de</strong> nucleótidos que son los monómeros <strong>de</strong>l polímero.<br />

Cada nucleótido está formado por una <strong>de</strong>soxirribosa, una base púrica o<br />

pirimídica y un grupo fosfato. Las dos ca<strong>de</strong>nas <strong>de</strong> ADN son antiparalelas y se<br />

unen entre sí a través <strong>de</strong> puentes <strong>de</strong> hidrógeno que se forman entre las bases<br />

complementarias (A·T y G·C) <strong>de</strong> las dos hebras <strong>de</strong>l ADN. De esta manera, se<br />

obtiene una estructura tipo doble hélice, don<strong>de</strong> las bases <strong>de</strong> los nucleótidos se<br />

encuentran orientadas hacia el interior, mientras que los grupos fosfato y las<br />

<strong>de</strong>soxirribosas lo hacen hacia el exterior, formando los esqueletos fosfodiéster<br />

<strong>de</strong> cada hélice (figura 3). Los pares <strong>de</strong> nucleótidos se encuentran separados<br />

entre sí por 3.4 Å, cada diez pares <strong>de</strong> nucleótidos (34 Å) se alcanza una vuelta<br />

<strong>de</strong> la hélice. La diferencia fundamental entre todas las moléculas <strong>de</strong> ADN que<br />

forman el material genético <strong>de</strong> los seres vivos es la secuencia <strong>de</strong> los millones<br />

<strong>de</strong> estos cuatro tipos <strong>de</strong> nucleótidos con sus bases A, T, G y C en cada<br />

molécula <strong>de</strong> ADN.<br />

11


Al igual que en el ADN, los estudios <strong>de</strong> la estructura <strong>de</strong>l ARN empezaron<br />

con su estructura primaria. Esta búsqueda se logró en paralelo que la <strong>de</strong>l ADN,<br />

pero tuvo la complejidad extra <strong>de</strong>l grupo hidroxilo 2´ <strong>de</strong> los ribonucleótidos. A<br />

diferencia <strong>de</strong>l ADN, las moléculas <strong>de</strong> ARN constan generalmente <strong>de</strong> ca<strong>de</strong>nas<br />

únicas <strong>de</strong> polinucleótido, <strong>de</strong>bido a que se forman copiando la secuencia <strong>de</strong><br />

bases <strong>de</strong> una ca<strong>de</strong>na <strong>de</strong> ADN. El apareamiento <strong>de</strong> las bases <strong>de</strong> Watson-Crick<br />

en el ARN es normal, aunque el tARN es una rica fuente <strong>de</strong> pares <strong>de</strong> bases<br />

inusuales. Hoy se sabe que el ARN tiene una mayor versatilidad estructural<br />

que el ADN en la variedad <strong>de</strong> sus especies, en la diversidad <strong>de</strong> sus<br />

conformaciones, y en su reactividad química. Los ARNs naturales pue<strong>de</strong>n<br />

formar estructuras <strong>de</strong> doble ca<strong>de</strong>na o adoptar una forma globular compuesta<br />

por pequeños dominios dobles conectados por segmentos <strong>de</strong> ca<strong>de</strong>na sencilla.<br />

Las dobles hélices <strong>de</strong>l ARN sólo pue<strong>de</strong>n adoptar la forma A, ya que el hidroxilo<br />

2´ <strong>de</strong> la ribosa constituye un impedimento estérico.<br />

2.2 Función biológica <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

Las funciones <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> son <strong>de</strong> almacenamiento,<br />

expresión y replicación <strong>de</strong> la información biológica. En términos generales,<br />

todas las moléculas <strong>de</strong> ADN tienen una configuración similar. Sin embargo, el<br />

ADN <strong>de</strong> una <strong>de</strong>terminada especie <strong>de</strong> organismos tiene una secuencia <strong>de</strong><br />

bases propia: su estructura primaria está agrupada en unida<strong>de</strong>s funcionales<br />

llamadas genes. La información que contiene esta secuencia <strong>de</strong>sempeña<br />

diversas funciones. Los genes estructurales codifican para enzimás, proteínas<br />

estructurales y proteínas reguladoras. Otros tipos <strong>de</strong> genes codifican moléculas<br />

<strong>de</strong> ARN que no especifican la estructura primaria <strong>de</strong> un polipéptido, i.e., tARNs.<br />

El primer paso en la síntesis <strong>de</strong> proteínas es la síntesis <strong>de</strong> una molécula<br />

<strong>de</strong> ARN usando como mol<strong>de</strong> un segmento <strong>de</strong> una <strong>de</strong> las ca<strong>de</strong>nas <strong>de</strong>l ADN. En<br />

la transcripción, el or<strong>de</strong>n <strong>de</strong> los <strong>de</strong>soxirribonucleótidos <strong>de</strong> uno o varios genes<br />

se transfiere uno por uno a una secuencia <strong>de</strong> ribonucleótidos complementaria.<br />

Este proceso está mediado por la enzima ARN polimerasa; y al igual que la<br />

replicación <strong>de</strong>l ADN, siempre ocurre en la dirección 5' a 3'.<br />

Como los procariontes no tienen membrana nuclear, las moléculas <strong>de</strong><br />

ARN que se transcriben <strong>de</strong> los genes son inmediatamente traducidas a nivel <strong>de</strong><br />

los ribosomás para sintetizar las proteínas. En el caso <strong>de</strong> los eucariontes, los<br />

ARN transcritos son transportados <strong>de</strong>l núcleo al citoplasma, a través <strong>de</strong> la<br />

membrana nuclear. A<strong>de</strong>más, los genes <strong>de</strong> los eucariontes contienen intrones,<br />

estructuras <strong>de</strong> ADN que interrumpen la región <strong>de</strong>l gen que codifica para la<br />

proteína (exón). Al transcribirse un gen en los núcleos <strong>de</strong> las células <strong>de</strong> los<br />

eucariontes, el ARN resultante incluye tanto las regiones <strong>de</strong> los intrones como<br />

12


las <strong>de</strong> los exones. Esta molécula <strong>de</strong> ARN se “procesa” para dar lugar al mARN<br />

maduro que se exporta <strong>de</strong>l núcleo <strong>de</strong> la célula al citoplasma, don<strong>de</strong> luego se<br />

traduce en proteína.<br />

La información genética contenida en cada molécula <strong>de</strong> mARN se<br />

traduce en proteínas a través <strong>de</strong> un proceso enzimático que se realiza en los<br />

ribosomás. En la traducción participan principalmente tres tipos distintos <strong>de</strong><br />

ARN: el ARN ribosomal (rARN), que junto con varias proteínas forman los<br />

ribosomás; el ARN mensajero (mARN), que acarrea la información genética<br />

contenida en genes específicos <strong>de</strong>l ADN y los ARNs <strong>de</strong> transferencia (tARN),<br />

que sirven como adaptadores específicos para cada aminoácido durante el<br />

or<strong>de</strong>namiento lineal <strong>de</strong> éstos en la síntesis <strong>de</strong> proteínas, conforme la secuencia<br />

<strong>de</strong>l mARN.<br />

La síntesis <strong>de</strong> proteínas, que <strong>de</strong> facto es la traducción <strong>de</strong> la secuencia<br />

<strong>de</strong> nucleótidos presentes en el mARN, se lleva a cabo mediante la<br />

polimerización <strong>de</strong> amino<strong>ácidos</strong> en proteínas, a nivel <strong>de</strong> los ribosomás en<br />

dirección 5' a 3'. La secuencia <strong>de</strong>l mARN realiza la codificación en forma <strong>de</strong><br />

tripletes <strong>de</strong> bases (codones) <strong>de</strong> acuerdo con el código genético, incorporando<br />

en cada paso <strong>de</strong> lectura un aminoácido <strong>de</strong> la proteína. Cada tARN tiene una<br />

secuencia complementaria o anticodón para el codón <strong>de</strong>l aminoácido, que le<br />

permite reconocer el codón correcto sobre el mARN.<br />

3.0 DESARROLLO HISTORICO<br />

3.1 Secuenciación <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

Inicialmente, se pensaba que la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong><br />

era mucho más difícil que la <strong>de</strong> las proteínas, y muy poco progreso se hizo<br />

hasta 1960. Esto se <strong>de</strong>bió, en parte, a la falta <strong>de</strong> substratos puros <strong>de</strong>l tamaño<br />

a<strong>de</strong>cuado, con los cuales <strong>de</strong>sarrollar los métodos y en parte, a la composición<br />

<strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>. Se esperaba que la interpretación <strong>de</strong> los resultados <strong>de</strong><br />

la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> (cuatro monómeros) fuera más difícil<br />

que el <strong>de</strong> las proteínas (20 amino<strong>ácidos</strong>), y se tendrían que aislar productos <strong>de</strong><br />

<strong>de</strong>gradación más gran<strong>de</strong>s para po<strong>de</strong>r traslaparlos y <strong>de</strong>ducir sus secuencias.<br />

Por otro lado, el hecho <strong>de</strong> tener cuatro componentes solamente, se pensaba,<br />

haría más fáciles los analices finales. Al inicio, la dificultad predominante fue la<br />

interpretación <strong>de</strong> los resultados, pero a medida que las técnicas se fueron<br />

mejorando y que se fueron estudiando moléculas más largas, la cuestión <strong>de</strong>l<br />

análisis empezó a ser más importante. Hoy, la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong> es más rápida y simple que la <strong>secuenciación</strong> <strong>de</strong> proteínas.<br />

13


La estrategia básica <strong>de</strong> la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> es idéntica<br />

a la que se utiliza en la <strong>secuenciación</strong> <strong>de</strong> proteínas. Ésta involucra:<br />

1.- La <strong>de</strong>gradación específica y el fraccionamiento <strong>de</strong> los polinucleótidos<br />

<strong>de</strong> interés a fragmentos suficientemente pequeños para ser secuenciados.<br />

2.- La <strong>secuenciación</strong> <strong>de</strong> los fragmentos pequeños.<br />

3.- El or<strong>de</strong>namiento <strong>de</strong> los fragmentos a través <strong>de</strong> la repetición <strong>de</strong> los<br />

pasos anteriores, usando un procedimiento <strong>de</strong> <strong>de</strong>gradación que produce una<br />

serie <strong>de</strong> fragmentos <strong>de</strong> polinucleótidos que traslapan el punto <strong>de</strong> corte en la<br />

primera serie.<br />

El primer ácido nucleico en ser secuenciado fue el tARN Ala <strong>de</strong> levadura.<br />

La secuencia <strong>de</strong> este nucleótido <strong>de</strong> 76 bases fue realizada por Holley y<br />

colaboradores en siete años (Stewart y Letham, 1977). Ellos usaron métodos<br />

<strong>de</strong> <strong>secuenciación</strong> similares a los que se usaban para secuenciar proteínas; la<br />

hidrólisis parcial con enzimás y el fraccionamiento <strong>de</strong> los productos en<br />

columnas <strong>de</strong> intercambio iónico. El grupo <strong>de</strong> Holley introdujo el uso <strong>de</strong> la<br />

ribonucleasa T1 (<strong>de</strong> Aspergillus oryzae), la cual corta ARN <strong>de</strong>spués <strong>de</strong> residuos<br />

<strong>de</strong> guanina y <strong>de</strong> la ribonucleasa pancreática A, que corta <strong>de</strong>spués <strong>de</strong> residuos<br />

pirimídinicos.<br />

Poco <strong>de</strong>spués, Fre<strong>de</strong>rick Sanger y sus colaboradores dirigieron sus<br />

esfuerzos para <strong>de</strong>sarrollar técnicas <strong>de</strong> fraccionamiento más rápidas y simples,<br />

las cuales permitieron la <strong>secuenciación</strong> <strong>de</strong> ARN y luego <strong>de</strong> ADN. El grupo <strong>de</strong><br />

Sanger marcó el ARN con 32 P, y pudo <strong>de</strong>tectarlo mediante autoradiografías.<br />

A<strong>de</strong>más, introdujeron un método más sencillo para fraccionar los<br />

oligonucleótidos. Una técnica <strong>de</strong> separación bidimensional, con electroforesis<br />

en acetato <strong>de</strong> celulosa, seguido <strong>de</strong> la electroforesis <strong>de</strong> intercambio iónico en<br />

papel. Siguiendo este enfoque general, el grupo <strong>de</strong> Sanger <strong>de</strong>sarrollo varios<br />

métodos para estudiar los nucleótidos aislados (Sanger, 1988).<br />

Uno <strong>de</strong> los métodos consistía en someter a los oligonucleótidos<br />

digeridos con la ribonucleasa T1, a una digestión parcial con una exonucleasa<br />

5´ y correr los productos en una electroforesis sobre papel <strong>de</strong> dietilaminoetil<br />

(DEAE)-celulosa a pH 1.9. La <strong>de</strong>gradación secuencial <strong>de</strong>l extremo 5´ da una<br />

mezcla <strong>de</strong> fragmentos, en don<strong>de</strong> todos tienen el mismo extremo 3´ pero<br />

difieren en sus extremos 5´. En la electroforesis los fragmentos se or<strong>de</strong>nan por<br />

tamaño, y <strong>de</strong> la posición relativa <strong>de</strong> dos bandas adyacentes es posible<br />

i<strong>de</strong>ntificar la naturaleza <strong>de</strong> los nucleótidos, por los cuales ellos difieren. Otro<br />

método exitoso fue la técnica “correría <strong>de</strong> puntos” (“wan<strong>de</strong>ring spot”). Se<br />

14


<strong>de</strong>sarrolló un sistema bidimensional en el que primero se digería con una<br />

exonucleasa y los fragmentos obtenidos se or<strong>de</strong>naban <strong>de</strong> acuerdo a su<br />

tamaño, <strong>de</strong> tal manera que cada punto difería <strong>de</strong>l punto siguiente por un<br />

nucleótido. El sistema fue arreglado para que las posiciones relativas <strong>de</strong> dos<br />

puntos vecinos <strong>de</strong>pendieran <strong>de</strong> los nucleótidos por los cuales diferían. El<br />

método fue extendido para usarse con digestiones más complejas, pero no fue<br />

posible distinguir la A <strong>de</strong> la G con absoluta certidumbre. Con estos métodos, se<br />

secuenció el ARN ribosomal 5S <strong>de</strong> 120 residuos (Sanger, 1988). El arte <strong>de</strong><br />

secuenciar ARN por estás técnicas alcanzó su cenit en 1976, con la<br />

<strong>secuenciación</strong> <strong>de</strong>l genoma <strong>de</strong> 3,569 nucleótidos <strong>de</strong>l bacteriofago MS2 por<br />

Walter Fiers.<br />

El principal problema con la <strong>secuenciación</strong> <strong>de</strong>l ADN era su talla muy<br />

larga; el ADN más pequeño que se encontraba disponible era el <strong>de</strong> genomas<br />

<strong>de</strong> bacteriófagos <strong>de</strong> ca<strong>de</strong>na simple, <strong>de</strong> cerca <strong>de</strong> 5000 nucleótidos, como el<br />

øX174. Y éstos eran muy largos para po<strong>de</strong>r secuenciarlos con los métodos que<br />

existían hasta ese momento. Otra dificultad era la falta <strong>de</strong> enzimas <strong>de</strong><br />

restricción a<strong>de</strong>cuadas. No existía una enzima con una especificidad análoga a<br />

la <strong>de</strong> la ribonucleasa T1 para el ADN.<br />

Alre<strong>de</strong>dor <strong>de</strong> 1973, se usaron técnicas similares a las empleadas con el<br />

ARN para secuenciar ADN, y se pudieron <strong>de</strong>terminar unas pocas secuencias<br />

<strong>de</strong> unos 50 residuos. Sin embargo, los métodos eran lentos y laboriosos, y<br />

resultó obvio que si se iban a atacar secuencias vastas <strong>de</strong> materiales<br />

genéticos, se necesitaba un nuevo enfoque. Una alternativa a la hidrólisis<br />

parcial fue usar técnicas <strong>de</strong> copiado enzimático para la <strong>secuenciación</strong>. C.<br />

Weissmann y sus colaboradores <strong>de</strong>scubrieron que el bacteriófago Q_ tiene una<br />

ARN polimerasa que copia su propio ARN y <strong>de</strong>sarrollaron técnicas para marcar<br />

el ARN y <strong>de</strong>ducir su secuencia. La enzima obvia para copiar el ADN fue la ADN<br />

polimerasa.<br />

Un enfoque elegante para conseguir la digestión específica <strong>de</strong>l ADN,<br />

que pudo ser combinado con un procedimiento <strong>de</strong> copiado, fue sugerido por C.<br />

Chamberlin en 1963. La técnica hace referencia a que en condiciones<br />

normales los substratos <strong>de</strong> la ADN polimerasa son los <strong>de</strong>soxirribonucleósidos<br />

trifosfatos, pero si se remplaza el magnesio por manganeso en el medio, se<br />

pue<strong>de</strong>n usar ribonucleósidos trifosfatos. Si la incubación se hace con un<br />

ribonucleósido trifosfato, por ejemplo, el rCTP y tres <strong>de</strong>soxirribonucleósidos<br />

trifosfatos, se pue<strong>de</strong> construir una ca<strong>de</strong>na <strong>de</strong> ADN con todos los dCs<br />

remplazados por rCs. Estos enlaces son lábiles en soluciones alcalinas o<br />

pue<strong>de</strong>n ser digeridos con una ribonucleasa. De esta manera, se pue<strong>de</strong><br />

15


preparar una digestión específica en C y otras digestiones similares para<br />

escindir los otros residuos.<br />

Por otra parte, la ADN polimerasa requiere un ADN <strong>de</strong> ca<strong>de</strong>na sencilla<br />

como templado y un iniciador o “primer”. Éste es un oligonucleótido que<br />

contiene un extremo 3´ libre que es complementario con una ca<strong>de</strong>na mol<strong>de</strong> <strong>de</strong><br />

ADN y funciona como punto <strong>de</strong> inicio para la adición <strong>de</strong> nucleótidos. Sanger y<br />

su grupo utilizaron como templado el ADN <strong>de</strong> ca<strong>de</strong>na sencilla <strong>de</strong>l bacteriófago<br />

f1 y sintetizaron el iniciador con base en el método <strong>de</strong>sarrollado por Khorana.<br />

Como iniciador usaron un <strong>de</strong>soxirribonucleótido con una secuencia predicha a<br />

partir <strong>de</strong> la secuencia <strong>de</strong> amino<strong>ácidos</strong>, ya conocida, <strong>de</strong> una proteína <strong>de</strong> la<br />

superficie <strong>de</strong>l bacteriófago. Con este método, pudieron <strong>de</strong>terminar la secuencia<br />

<strong>de</strong> 80 nucleótidos. Sin embargo, para po<strong>de</strong>r sintetizar otros 80 residuos,<br />

necesitaban hacer otro iniciador. Este procedimiento era todavía lento para<br />

analizar muchos fragmentos.<br />

Hasta el momento, Sanger y su grupo habían obtenido en sus<br />

experimentos ADN altamente marcado, usando el substrato radioactivo con<br />

una actividad específica alta y en bajas concentraciones. Ellos observaron que<br />

cuando usaban 32 P-ATP, los productos <strong>de</strong> ADN formados se terminaban antes<br />

<strong>de</strong> que se incorporara una A. Debido, presumiblemente, a que a la enzima le<br />

faltaba ATP. Esto les sugirió un nuevo enfoque para secuenciar ADN. Si uno<br />

pue<strong>de</strong> producir una mezcla <strong>de</strong> fragmentos con el mismo extremo 5´ (que<br />

correspon<strong>de</strong> al extremo 5´ <strong>de</strong>l iniciador) y terminarlos en posiciones 3´<br />

correspondientes a las A´s, la <strong>de</strong>terminación <strong>de</strong> los tamaños relativos <strong>de</strong> todos<br />

esos fragmentos <strong>de</strong>bería producir una medida <strong>de</strong> la posición relativa <strong>de</strong> las<br />

A´s. Esto, combinado con datos similares <strong>de</strong> los otros tres nucleótidos, es todo<br />

lo que uno necesita para la <strong>de</strong>terminación completa <strong>de</strong> una secuencia.<br />

Paralelamente, se estudiaron otros métodos <strong>de</strong> fraccionamiento, y la<br />

electroforesis en gel <strong>de</strong> acrilamida resulto ser la más eficiente. Con esta técnica<br />

se pudieron separar nucleótidos <strong>de</strong> hasta 250 residuos <strong>de</strong> acuerdo a su<br />

tamaño. En el gel, los fragmentos más pequeños migran más rápido que los<br />

más gran<strong>de</strong>s, y cada uno pue<strong>de</strong> ser separado <strong>de</strong> sus vecinos, los cuales<br />

difieren en tamaño sólo por un nucleótido. Después <strong>de</strong> introducir ligeras<br />

modificaciones, <strong>de</strong>sarrollaron el método <strong>de</strong>l “más y menos”, con el que se<br />

<strong>de</strong>terminó la mayoría <strong>de</strong> la secuencia <strong>de</strong>l bacteriofago øX174. Sin embargo, el<br />

grupo <strong>de</strong> Sanger no tardaría en <strong>de</strong>sarrollar un método más eficiente y<br />

confiable: el enzimático, que se discute más a<strong>de</strong>lante.<br />

16


Después <strong>de</strong> 1975, se realizó un progreso dramático en la tecnología <strong>de</strong><br />

la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>. Tres avances hicieron esto posible:<br />

1.- El <strong>de</strong>scubrimiento <strong>de</strong> las endonucleasas <strong>de</strong> restricción, enzimás que<br />

cortan ADN <strong>de</strong> ca<strong>de</strong>na doble en secuencias específicas.<br />

2.- El <strong>de</strong>sarrollo <strong>de</strong> mejores técnicas <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> ADN.<br />

3.- El <strong>de</strong>sarrollo <strong>de</strong> técnicas <strong>de</strong> clonación que permitieron la adquisición<br />

<strong>de</strong> un segmento <strong>de</strong> ADN en las cantida<strong>de</strong>s necesarias para secuenciarlo.<br />

En 1977, se reportaron dos protocolos para la <strong>secuenciación</strong> <strong>de</strong> ADN. El<br />

primer método fue el <strong>de</strong> Maxam y Gilbert. Con este método, al igual que con el<br />

<strong>de</strong> Sanger, se obtiene una autoradiografía en don<strong>de</strong> pue<strong>de</strong> leerse una<br />

secuencia. Sin embargo, se <strong>de</strong>termina la secuencia <strong>de</strong> una molécula <strong>de</strong> ADN<br />

utilizando químicos que cortan en posiciones específicas fragmentos marcados<br />

en sus extremos 5´. El segundo método es el <strong>de</strong> Sanger. Éste utiliza un<br />

templado <strong>de</strong> ADN <strong>de</strong> ca<strong>de</strong>na sencilla para sintetizar la hebra complementaria,<br />

la cual se termina en posiciones específicas. En los dos casos, la secuencia <strong>de</strong><br />

la molécula se <strong>de</strong>termina por diferencias en los tamaños <strong>de</strong> los fragmentos<br />

generados.<br />

3.2 El método <strong>de</strong> <strong>de</strong>gradación química (Maxam and Gilbert, 1977).<br />

En este método, un fragmento <strong>de</strong> ADN <strong>de</strong> ca<strong>de</strong>na doble o sencilla se<br />

marca en los extremos 5´ o 3´ <strong>de</strong> una o ambas hebras con 32 P. Después,<br />

la muestra <strong>de</strong> ADN se divi<strong>de</strong> en cuatro alícuotas y se fragmenta en<br />

cuatro reacciones químicas distintas. Posteriormente, los fragmentos <strong>de</strong><br />

ADN generados pue<strong>de</strong>n ser separados por electroforesis en cuatro<br />

carriles distintos con base en su tamaño. Conociendo el nucleótido en el<br />

que se realizaron los cortes, se pue<strong>de</strong> inferir la secuencia <strong>de</strong> la molécula<br />

original (figura 4). Las reacciones químicas que se utilizan para<br />

fragmentar la molécula <strong>de</strong> ADN son las siguientes:<br />

1. Corte <strong>de</strong> las purinas. Las purinas a<strong>de</strong>nina y guanina se metilan<br />

con dimetil sulfato (DMS). Después, la reacción es tratada en<br />

condiciones alcalinas; la molécula <strong>de</strong> ADN se fragmenta en las<br />

purinas metiladas. Como resultado, se obtiene una serie <strong>de</strong><br />

bandas oscuras que correspon<strong>de</strong>n a las guaninas (las cuales se<br />

metilan 5 veces más rápido), y bandas claras que correspon<strong>de</strong>n a<br />

las a<strong>de</strong>ninas. Para interpretar fácilmente el patrón <strong>de</strong> bandas<br />

17


generadas, se pue<strong>de</strong> comparar contra un tratamiento que<br />

favorezca el corte <strong>de</strong> las a<strong>de</strong>ninas.<br />

2. Corte <strong>de</strong> a<strong>de</strong>ninas. Esta reacción es una variación <strong>de</strong> la anterior.<br />

Las purinas metiladas se tratan inicialmente con un ácido diluido.<br />

Esto favorece el corte <strong>de</strong> las a<strong>de</strong>ninas metiladas. Después <strong>de</strong> un<br />

tratamiento alcalino las guaninas también son cortadas. Este<br />

tratamiento genera una serie <strong>de</strong> bandas oscuras y claras que<br />

también correspon<strong>de</strong>n a las a<strong>de</strong>ninas, y las guaninas,<br />

respectivamente.<br />

3. Corte <strong>de</strong> pirimidinas. Esta reacción utiliza el reactivo hidracina,<br />

que corta las bases citosina y timina. Posteriormente, se trata con<br />

piperidina para completar la reacción.<br />

4. Corte <strong>de</strong> citosina. La presencia <strong>de</strong> NaCl 2M inhibe la reacción <strong>de</strong><br />

hidracina con tiamina, y el tratamiento posterior con piperidina,<br />

produce solamente fragmentos que terminan en citosina.<br />

Des<strong>de</strong> que se reporto este método, no se han encontrado reactivos<br />

químicos específicos que corten las bases A o T, por lo que se utiliza la<br />

estrategia <strong>de</strong> corte <strong>de</strong>scrita en la figura 4. Esta estrategia permite distinguir<br />

entre los nucleótidos que se encuentran al final <strong>de</strong> cada corte y <strong>de</strong>ducir la<br />

secuencia <strong>de</strong> ADN.<br />

18


1 2 3 4<br />

Figura 4. El método <strong>de</strong> Maxam y Gilbert para secuenciar ADN. Los números <strong>de</strong> los<br />

carriles en el gel correspon<strong>de</strong>n a los distintos tipos <strong>de</strong> corte que se <strong>de</strong>scriben en el<br />

texto.<br />

3.2.1 Ventajas y <strong>de</strong>sventajas <strong>de</strong>l método <strong>de</strong> <strong>de</strong>gradación química.<br />

La baja resolución obtenida cuando se reportó la técnica no se <strong>de</strong>bió a<br />

un factor inherente al método <strong>de</strong> Maxam-Gilbert, si no a una limitante <strong>de</strong> los<br />

geles <strong>de</strong> acrilamida. En un inicio, se consi<strong>de</strong>raba un logro po<strong>de</strong>r diferenciar el<br />

tamaño <strong>de</strong> 250 fragmentos y <strong>de</strong>terminar la secuencia <strong>de</strong> ese tamaño. El<br />

análisis <strong>de</strong> una secuencia en geles <strong>de</strong> acrilamida era complicado, ya que no se<br />

podía separar los fragmentos gran<strong>de</strong>s. Otro problema que comúnmente afecta<br />

la resolución <strong>de</strong> las bandas obtenidas en el gel es el ensanchamiento <strong>de</strong><br />

bandas cuyas secuencias favorecen la formación <strong>de</strong> estructuras secundarias.<br />

Para mejorar la resolución <strong>de</strong>l gel se ha reportado que el uso <strong>de</strong> geles <strong>de</strong><br />

acrilamida muy <strong>de</strong>lgados, en conjunto con un voltaje alto <strong>de</strong> corrimiento,<br />

produce bandas más <strong>de</strong>lgadas y mejor separadas (Sanger y Coulson, 1978).<br />

Otro aspecto <strong>de</strong>l método <strong>de</strong> Maxam-Gilbert que pue<strong>de</strong> ser un poco<br />

laborioso es la necesidad <strong>de</strong> separar y analizar individualmente las hebras <strong>de</strong>l<br />

ADN que se quiere secuenciar (Sanger et al., 1977). Esto se pue<strong>de</strong> realizar<br />

mediante enzimás <strong>de</strong> restricción (figura 5) que separen los extremos<br />

19


etiquetados para el análisis. Alternativamente, las dos hebras marcadas<br />

pue<strong>de</strong>n ser <strong>de</strong>snaturalizadas y separadas en un gel (Maxam y Gilbert, 1977).<br />

Hoy en día, el método más usado para la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong> es el método <strong>de</strong> Sanger. Sin embargo, es justo <strong>de</strong>cir que el método<br />

<strong>de</strong> Maxam-Gilbert es el más a<strong>de</strong>cuado para <strong>de</strong>terminar la secuencia <strong>de</strong><br />

fragmentos cortos <strong>de</strong> ADN, <strong>de</strong>bido a que pue<strong>de</strong> <strong>de</strong>terminar la secuencia <strong>de</strong>s<strong>de</strong><br />

la primera base. En cambio, el método <strong>de</strong> Sanger sólo permite la lectura a<br />

partir <strong>de</strong> la base 10-20 (Tahara et al., 1990).<br />

Figura 5. Las enzimás <strong>de</strong> restricción reconocen secuencias<br />

específicas <strong>de</strong> ADN y pue<strong>de</strong>n ser utilizadas para separar las<br />

hebras etiquetadas antes <strong>de</strong> secuenciar por el método <strong>de</strong><br />

Maxam-Gilbert.<br />

3.3 El método enzimático (Sanger et al., 1977).<br />

El método <strong>de</strong> <strong>secuenciación</strong> enzimático salió casi al mismo tiempo que<br />

el <strong>de</strong> Maxam y Gilbert, pero ha sido más utilizado. Esto se <strong>de</strong>be, en gran<br />

parte, a que se han realizado gran<strong>de</strong>s avances en la automatización <strong>de</strong><br />

esta técnica, lo cual se discutirá más a<strong>de</strong>lante. El método <strong>de</strong> Sanger se<br />

basa en el uso <strong>de</strong> la ADN polimerasa para sintetizar ca<strong>de</strong>nas <strong>de</strong> ADN<br />

con una terminación específica. Con este método se generan<br />

fragmentos <strong>de</strong> ADN <strong>de</strong> todos los tamaños posibles que se puedan<br />

distinguir entre sí, por el tipo <strong>de</strong> marcaje que llevan o por la<br />

incorporación <strong>de</strong> un terminador específico. Las enzimás <strong>de</strong>l tipo <strong>de</strong> la<br />

ADN polimerasa requieren <strong>de</strong> un templado <strong>de</strong> ADN <strong>de</strong> ca<strong>de</strong>na sencilla, y<br />

realizan la síntesis <strong>de</strong> la hebra complementaria extendiéndola a partir <strong>de</strong><br />

un iniciador en dirección 5’ a 3’. Entre los componentes <strong>de</strong> la reacción se<br />

incluyen nucleótidos que no tienen un grupo hidroxilo en su extremo 3’<br />

(ddNTP), para po<strong>de</strong>r obtener una terminación especifica en las ca<strong>de</strong>nas.<br />

Una vez que el ddNTP se incorpora como el residuo terminal, evita que<br />

la ca<strong>de</strong>na <strong>de</strong> ADN sintetizada continúe extendiéndose. La incorporación<br />

<strong>de</strong> los ddNTPs es al azar, <strong>de</strong> tal forma que se obtienen fragmentos <strong>de</strong><br />

todos los tamaños posibles que terminan en un residuo especifico.<br />

En el método <strong>de</strong> Sanger (1977), la estrategia es hacer cuatro<br />

reacciones diferentes <strong>de</strong> síntesis <strong>de</strong> ADN, utilizando un ddNTP distinto<br />

en cada tubo. Con la mezcla <strong>de</strong>l nucleótido normal (dNTP) y su<br />

20


terminador (ddNTP), se pue<strong>de</strong>n generar fragmentos complementarios <strong>de</strong><br />

diferentes tamaños que terminan en el mismo nucleótido. Después,<br />

estos fragmentos se pue<strong>de</strong>n separar en un gel <strong>de</strong> electroforesis con<br />

cuatro carriles distintos, para <strong>de</strong>terminar la secuencia <strong>de</strong>l templado<br />

(figura 6).<br />

Figura 6. El método <strong>de</strong> Sanger. Cuatro reacciones con ddNTPs diferentes permiten<br />

la síntesis <strong>de</strong> distintos fragmentos con una terminación específica. Estos<br />

fragmentos se pue<strong>de</strong>n separar por electroforesis y comparando los tamaños, se<br />

pue<strong>de</strong> <strong>de</strong>terminar la secuencia <strong>de</strong>l templado.<br />

El método <strong>de</strong> Sanger tiene varias ventajas sobre el método <strong>de</strong> Maxam-<br />

Gilbert (Blackburn y Gait, 1996). Las reacciones <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l método<br />

enzimático se pue<strong>de</strong>n realizar en unas horas, en cambio las <strong>de</strong>l método <strong>de</strong><br />

Maxam-Gilbert tardan al menos un día. Las reacciones <strong>de</strong>l método <strong>de</strong> Sanger<br />

son más “puras”, con menos contaminantes que puedan afectar la resolución<br />

<strong>de</strong>l gel.<br />

3.3.1 Limitaciones <strong>de</strong>l método enzimático.<br />

Cuando se reportó este método para la <strong>secuenciación</strong> <strong>de</strong> ADN, se usaba<br />

el fragmento Klenow <strong>de</strong> la polimerasa I, y sólo un ciclo <strong>de</strong> síntesis (incubando a<br />

37 ºC) para obtener fragmentos <strong>de</strong> distintos tamaños. Todos los fragmentos<br />

tenían incorporados en sus ca<strong>de</strong>nas, nucleótidos marcados con<br />

21<br />

32 P. El grupo


<strong>de</strong> Sanger reportó que con esta técnica se podía <strong>de</strong>terminar una secuencia <strong>de</strong><br />

hasta 300 nucleótidos, a partir <strong>de</strong> 15 bases <strong>de</strong>l iniciador, aproximadamente. Al<br />

momento <strong>de</strong> publicar esta técnica, también reportaron que la mayor dificultad<br />

era que los ddGTPs no estaban disponibles comercialmente. Des<strong>de</strong> entonces<br />

se ha experimentado con variaciones <strong>de</strong>l protocolo original y se han realizado<br />

gran<strong>de</strong>s avances en la automatización <strong>de</strong> este método. En la tabla 1 se<br />

resumen algunos <strong>de</strong> los avances más importantes que han permitido el<br />

<strong>de</strong>sarrollo <strong>de</strong> métodos automatizados para la <strong>secuenciación</strong> <strong>de</strong> ADN.<br />

4.0 MÉTODOS CONTEMPORÁNEOS EN LA SECUENCIACIÓN<br />

4.1 Automatización <strong>de</strong>l método <strong>de</strong> Sanger<br />

En la tabla 1 se resumen algunos <strong>de</strong> los avances mas importantes que<br />

han permitido el <strong>de</strong>sarrollo <strong>de</strong> métodos automatizados para la <strong>secuenciación</strong><br />

<strong>de</strong> ADN (usando el método <strong>de</strong> Sanger).<br />

Tabla 1. Descubrimientos significativos que permitieron el <strong>de</strong>sarrollo <strong>de</strong> los<br />

métodos automatizados <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

Avance Descripción Referencia<br />

Reacción en Técnica que permite la amplificación Mullis, 1990<br />

ca<strong>de</strong>na <strong>de</strong> la<br />

polimerasa<br />

(PCR)<br />

exponencial <strong>de</strong> un fragmento <strong>de</strong> ADN<br />

Polimerasa Taq Polimerasa termoestable que pue<strong>de</strong> Innis et al., 1988;<br />

utilizarse en el PCR<br />

Carballeira et al.,<br />

1990<br />

Marcaje <strong>de</strong>l El marcaje y el tipo <strong>de</strong> <strong>de</strong>tección utilizado Prober et al.,<br />

ADN para i<strong>de</strong>ntificar los fragmentos <strong>de</strong> ADN<br />

sintetizados<br />

1987; Igloi, 1998<br />

Secuenciadores Desarrollo <strong>de</strong> máquinas automatizadas Hunkapiller, et al.,<br />

automatizados con la capacidad <strong>de</strong>terminar la secuencia 1991; Lipshutz y<br />

<strong>de</strong> miles <strong>de</strong> pares <strong>de</strong> bases por día<br />

Fodor, 1994<br />

22


4.1.1 La técnica <strong>de</strong> PCR y su relevancia en la <strong>secuenciación</strong> <strong>de</strong> ADN.<br />

En 1985, el químico Kary Mullis <strong>de</strong>sarrolló la técnica <strong>de</strong> la reacción en<br />

ca<strong>de</strong>na <strong>de</strong> la polimerasa (PCR). Este método permite la amplificación<br />

exponencial <strong>de</strong> una molécula <strong>de</strong> ADN, generando millones <strong>de</strong> copias <strong>de</strong> un<br />

fragmento. Esto se lleva acabo con oligonucleótidos que contienen un grupo<br />

extremo 3´ libre, que es complementario con la ca<strong>de</strong>na mol<strong>de</strong> <strong>de</strong> ADN. Los<br />

“oligos” funcionan como punto <strong>de</strong> inicio para la adición <strong>de</strong> nucleótidos y para<br />

copiar la ca<strong>de</strong>na mol<strong>de</strong> en el PCR. Una vez que el oligonucleótido se une a su<br />

blanco, la polimerasa <strong>de</strong> ADN pue<strong>de</strong> seguir extendiendo la hebra<br />

complementaria. En una reacción típica <strong>de</strong> PCR se usan dos oligonucleótidos<br />

que flanquean la región <strong>de</strong> ADN que se <strong>de</strong>sea amplificar. El número <strong>de</strong> copias<br />

<strong>de</strong>l fragmento <strong>de</strong> ADN que se encuentra entre los dos oligonucleotidos se<br />

amplifica con varios ciclos <strong>de</strong> reacción.<br />

Cada ciclo <strong>de</strong> una reacción <strong>de</strong> PCR<br />

consta <strong>de</strong> tres pasos (figura 7):<br />

1) Desnaturalización <strong>de</strong> las hebras<br />

<strong>de</strong> ADN- El templado es el fragmento<br />

<strong>de</strong> ADN que se <strong>de</strong>sea amplificar, junto<br />

con la región que reconocen los<br />

oligonucleótidos. Para que el<br />

oligonucleótido se pueda unir, es<br />

necesario que el templado sea <strong>de</strong><br />

ca<strong>de</strong>na sencilla. Así que este paso <strong>de</strong>l<br />

PCR es para separar las ca<strong>de</strong>nas <strong>de</strong><br />

ADN, si el templado es <strong>de</strong> doble<br />

ca<strong>de</strong>na. A<strong>de</strong>más, en este paso se<br />

<strong>de</strong>shace cualquier tipo <strong>de</strong> estructura<br />

secundaria formada entre los<br />

segmentos complementarios <strong>de</strong> los<br />

oligonucleótidos y que pudiera<br />

interferir con su habilidad <strong>de</strong> unirse al<br />

templado. Típicamente, la<br />

<strong>de</strong>snaturalización <strong>de</strong>l ADN se hace<br />

con una incubación breve <strong>de</strong>l tubo <strong>de</strong><br />

reacción a una temperatura <strong>de</strong> 94 ºC.<br />

Figura 7. La reacción <strong>de</strong> PCR consiste en<br />

varios ciclos <strong>de</strong> 3 pasos. Las<br />

temperaturas y los tiempos indicados son<br />

ejemplos y varían <strong>de</strong>pendiendo <strong>de</strong> las<br />

características <strong>de</strong>l ADN que se <strong>de</strong>see<br />

amplificar.<br />

2) Temperatura <strong>de</strong> alineamiento - Esta temperatura se calcula con base en<br />

las características <strong>de</strong> los oligos que serán utilizados. La temperatura a la cual<br />

la mitad <strong>de</strong> los oligos están unidos a su blanco (Tm), se calcula tomando en<br />

cuenta el tamaño <strong>de</strong> los oligos y su contenido <strong>de</strong> GC (%GC). Después <strong>de</strong><br />

23


<strong>de</strong>snaturalizar las hebras <strong>de</strong> ADN, se incuba a una temperatura cercana a la<br />

Tm, para que los oligos puedan encontrar su región complementaria en el<br />

templado. y se unan a ella.<br />

3). Extensión <strong>de</strong> la ca<strong>de</strong>na <strong>de</strong> ADN - Este es el último paso <strong>de</strong> un ciclo <strong>de</strong><br />

reacción <strong>de</strong> PCR y normalmente se hace a 72 ºC, la temperatura óptima para<br />

la polimerasa <strong>de</strong> ADN. En este paso, la polimerasa extien<strong>de</strong> la ca<strong>de</strong>na<br />

complementaria <strong>de</strong>l templado. La síntesis <strong>de</strong> la ca<strong>de</strong>na complementaria tiene<br />

como punto <strong>de</strong> inicio el complejo oligonucleótido/templado. El tiempo <strong>de</strong><br />

incubación <strong>de</strong> este paso <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l tamaño <strong>de</strong>l segmento que se <strong>de</strong>sea<br />

amplificar. Como regla general se consi<strong>de</strong>ra que la polimerasa pue<strong>de</strong> sintetizar<br />

1,000 bases por minuto. En la reacción <strong>de</strong> PCR, típicamente, se llevan acabo<br />

<strong>de</strong> 30 a 40 ciclos <strong>de</strong> estos tres pasos, para lograr la amplificación <strong>de</strong>seada.<br />

La técnica <strong>de</strong> PCR resultó relevante para la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong> <strong>de</strong>bido a que se adaptó al método <strong>de</strong> Sanger, <strong>de</strong> tal forma que se<br />

pue<strong>de</strong> sintetizar un mayor número <strong>de</strong> copias <strong>de</strong> los fragmentos con una<br />

terminación específica. De esta forma, la señal <strong>de</strong>l marcaje que lleva cada<br />

fragmento aumenta, y es posible obtener lecturas más claras <strong>de</strong> los fragmentos<br />

gran<strong>de</strong>s, lo que a su vez, permite la lectura <strong>de</strong> secuencias más largas, una vez<br />

que se pueda superar el problema <strong>de</strong> la resolución <strong>de</strong> los geles.<br />

4.1.2 Polimerasa Taq.<br />

Cuando se <strong>de</strong>sarrolló el método <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> Sanger, se usó el<br />

fragmento Klenow <strong>de</strong> la polimerasa I <strong>de</strong> E. coli para hacer la síntesis <strong>de</strong> los<br />

fragmentos <strong>de</strong> ADN con una terminación específica (Sanger et al, 1977). En<br />

1957, se aisló la Polimerasa I y durante muchos años se pensó que era la<br />

única polimerasa que tenía E. coli (Brown, 1999). De hecho, su actividad es tan<br />

gran<strong>de</strong> que enmáscara la actividad <strong>de</strong> las otras polimerasas <strong>de</strong> esta bacteria, y<br />

hasta que se obtuvó una mutante que no producía la polimerasa I (polA), fue<br />

que se pudieron <strong>de</strong>tectar las otras enzimás (Lewin, 1997). El uso <strong>de</strong> esta<br />

enzima tiene algunas <strong>de</strong>sventajas, en comparación con las polimerasas que se<br />

aislaron <strong>de</strong> otros organismos, años <strong>de</strong>spués. La reacción <strong>de</strong> síntesis <strong>de</strong> ADN<br />

reportada por Sanger en 1977, es <strong>de</strong> un solo paso, y en esta se tienen que<br />

sintetizar todas las posibles combinaciones <strong>de</strong> fragmentos <strong>de</strong> ADN necesarios<br />

para <strong>de</strong>terminar la secuencia <strong>de</strong> un templado. La razón por la que la síntesis se<br />

realiza en un solo paso se <strong>de</strong>be a que la temperatura óptima para la actividad<br />

<strong>de</strong> Klenow es alre<strong>de</strong>dor <strong>de</strong> 37 ºC (temperatura óptima <strong>de</strong> crecimiento <strong>de</strong> E.<br />

coli). Por lo tanto, al elevar la temperatura para <strong>de</strong>snaturalizar los híbridos o<br />

estructuras secundarias <strong>de</strong>l ADN, se inactiva la Klenow, y es necesario añadir<br />

más enzima para hacer un segundo ciclo <strong>de</strong> síntesis <strong>de</strong> fragmentos <strong>de</strong> ADN.<br />

24


El uso <strong>de</strong> la Klenow para generar fragmentos <strong>de</strong> ADN en las reacciones<br />

<strong>de</strong> PCR y para síntetizarlo en la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> se fue<br />

reemplazando con otras polimerasas más estables, aisladas <strong>de</strong> organismos<br />

termófilos. Una <strong>de</strong> las polimerasas más conocidas, fue aislada <strong>de</strong> Thermus<br />

aquaticus, y se le dio el nombre <strong>de</strong> Taq (Innis et al., 1988). Dedido a que esta<br />

enzima es resistente a altas temperaturas, fue posible automatizar la reacción<br />

<strong>de</strong> PCR, sin necesidad <strong>de</strong> añadir enzima nueva en cada ciclo <strong>de</strong> reacción. La<br />

temperatura <strong>de</strong> extensión <strong>de</strong> las ca<strong>de</strong>nas <strong>de</strong> ADN se realiza a 72 ºC, en lugar<br />

<strong>de</strong> 37 ºC. Al hacer el alineamiento <strong>de</strong> los oligos a una temperatura más<br />

elevada, se obtiene una mayor especificidad y homogeneidad en los<br />

fragmentos generados para la reacción.<br />

Las polimerasas termoestables que se caracterizaron a finales <strong>de</strong> los<br />

80s contribuyeron a optimizar el método <strong>de</strong> Sanger para secuenciar <strong>ácidos</strong><br />

<strong>nucleicos</strong>. En ese tiempo, se reportó la purificación <strong>de</strong> polimerasas que podían<br />

sintetizar hasta 1500 bases <strong>de</strong> ADN por minuto, y que mantenían su actividad<br />

en un intervalo amplio <strong>de</strong> temperaturas elevadas (70-80 ºC) (Carballeira et al.,<br />

1990). Con estas enzimás, por fin fue posible obtener fragmentos uniformes <strong>de</strong><br />

ADN <strong>de</strong> hasta 1000 bases y se pudo <strong>de</strong>terminar una secuencia <strong>de</strong> este tamaño<br />

(Innis et al., 1988).<br />

4.1.3 Marcado <strong>de</strong> la ca<strong>de</strong>na <strong>de</strong> ADN.<br />

Se han explorado distintas maneras <strong>de</strong> marcar la ca<strong>de</strong>na <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong> sintetizados para la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> por el método<br />

<strong>de</strong> Sanger. Originalmente, se utilizaron nucleótidos marcados con 32 P en la<br />

mezcla <strong>de</strong> síntesis y algunos <strong>de</strong> éstos se incorporaban en la ca<strong>de</strong>na (Sanger et<br />

al., 1977). Los nucleótidos incorporados al final <strong>de</strong> la ca<strong>de</strong>na (ddNTPs) no<br />

llevaban ningún marcaje ( 32 P), sólo carecían <strong>de</strong>l grupo hidroxilo 3’ para evitar<br />

que se siguiera extendiendo la ca<strong>de</strong>na. Para po<strong>de</strong>r resolver el or<strong>de</strong>n <strong>de</strong> los<br />

fragmentos sintetizados <strong>de</strong> esta forma, era necesario separarlos en un gel <strong>de</strong><br />

archilamida <strong>de</strong> cuatro carriles distintos y luego tomarle una radiografía para<br />

<strong>de</strong>tectar el marcaje ( 32 P). En los años siguientes, se exploraron otros tipos <strong>de</strong><br />

marcas que no fueran radioactivas para etiquetar estos fragmentos <strong>de</strong> ADN<br />

(Igloi, 1998). Eventualmente, los fluoróforos fueron remplazando a los isótopos<br />

radioactivos, como el método preferido <strong>de</strong> marcaje (Prober et al., 1987). La<br />

razón <strong>de</strong> esto, es que marcar moléculas <strong>de</strong> ADN con isótopos radioactivos es<br />

laborioso, tardado, peligroso y caro (Smith et al., 1985). A<strong>de</strong>más, las<br />

propieda<strong>de</strong>s <strong>de</strong> las moléculas fluorescentes han contribuido al <strong>de</strong>sarrollo <strong>de</strong><br />

técnicas automatizadas <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>. Por ejemplo, la<br />

posibilidad hacer todas las reacciones <strong>de</strong> terminación específica en un solo<br />

tubo (Prober et al., 1987).<br />

25


Existen muchas diferentes etiquetas para los fragmentos <strong>de</strong> ADN. Las<br />

moléculas fluorescentes tienen varias propieda<strong>de</strong>s que se adaptaron con cierta<br />

facilidad hacia el <strong>de</strong>sarrollo <strong>de</strong> métodos automatizados para la <strong>secuenciación</strong><br />

<strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>, y las limitaciones en su uso se han ido resolviendo. Por<br />

ejemplo, se observó que una inconsistencia en la intensidad <strong>de</strong> la señal <strong>de</strong> los<br />

distintos fragmentos, podía complicar la interpretación <strong>de</strong> la información que se<br />

obtenía <strong>de</strong>l <strong>de</strong>tector (Bennett, 2003). Experimentando con distintos fluoróforos,<br />

se han encontrado algunos que dan una señal constante y que se pue<strong>de</strong>n<br />

distinguir entre si con mayor facilidad (Rosenblum et al., 1997). También, se<br />

observó que la modificación <strong>de</strong> los di<strong>de</strong>oxynucleótidos (ddNTPs) con algún<br />

componente fluorescente, pue<strong>de</strong> causar que la migración <strong>de</strong>l fragmento <strong>de</strong><br />

ADN en un gel <strong>de</strong> acrilamida sea un poco distinta, y causar dificultad en la<br />

interpretación <strong>de</strong> la secuencia. Prober et al. (1987) encontraron que era posible<br />

usar cuatro etiquetas fluorescentes <strong>de</strong> la misma familia y que estaban<br />

estructuralmente relacionados, pero con distintos rangos <strong>de</strong> absorción. La<br />

similitud <strong>de</strong> estructura provoca que la influencia sobre la migración <strong>de</strong> los<br />

distintos fragmentos sea mínima y facilita la interpretación <strong>de</strong> la secuencia.<br />

A<strong>de</strong>más, se ha intentado variar la proporción <strong>de</strong> nucleótidos que están<br />

en la mezcla <strong>de</strong> reacción. Ansorge et al. (1990) encontraron que la polimerasa<br />

T7 tiene preferencia por algunos nucleótidos. Observaron que si se usa una<br />

proporción equimolar <strong>de</strong> cada ddNTP, marcado con una molécula fluorescente,<br />

la magnitud <strong>de</strong> la señal que se obtiene es distinta, y se incrementa en el or<strong>de</strong>n<br />

A


ADN y no existen muchas posibilida<strong>de</strong>s <strong>de</strong> que el marcaje interfiera con el<br />

proceso enzimático <strong>de</strong> la síntesis. Sin embargo, en la práctica esta región ha<br />

sido difícil <strong>de</strong> modificar enzimáticamente porque es muy inerte. Kempe et al.<br />

(1985) reportaron que <strong>de</strong>spués <strong>de</strong> una incubación <strong>de</strong> 96 horas con ARN ligasa,<br />

sólo pudieron modificar 20% <strong>de</strong>l iniciador en el extremo 5’ con un marcador <strong>de</strong><br />

biotina.<br />

2. Marcaje incorporado en la ca<strong>de</strong>na- Se pue<strong>de</strong>n incorporar nucleótidos<br />

marcados a la ca<strong>de</strong>na <strong>de</strong> ADN durante su síntesis, tal como lo hicieron Sanger<br />

et al.(1997). Es importante que el marcaje no interfiera con la actividad <strong>de</strong> la<br />

polimerasa que incorpora los nucleótidos a la ca<strong>de</strong>na. Igloi (1998) reportó que<br />

sólo dos <strong>de</strong> las polimerasas termoestables, utilizadas comúnmente en la<br />

<strong>secuenciación</strong>, aceptan dNTPs fluorescentes como sustratos. A pesar <strong>de</strong> que<br />

el marcaje <strong>de</strong> ADN fue el primero en reportarse, no se ha utilizado tan<br />

ampliamente porque no tiene ventajas claras sobre los otros métodos.<br />

3. Marcaje <strong>de</strong>l nucleótido terminal- Este método <strong>de</strong> marcaje, claramente,<br />

es el más sencillo y el mejor por varias razones. En este caso, el nucleótido<br />

responsable <strong>de</strong> la terminación (ddNTP), es el que lleva la marca. Esto asegura<br />

que todas las ca<strong>de</strong>nas sintetizadas a partir <strong>de</strong> un templado, lleven incorporado<br />

una sola marca en el mismo lugar (al final <strong>de</strong> la ca<strong>de</strong>na, en el extremo 3’). De<br />

esta manera, se obtienen fragmentos que producen bandas uniformes y cuyas<br />

secuencias se pue<strong>de</strong>n <strong>de</strong>terminar más fácilmente. Sin embargo, esta no ha<br />

sido la razón principal por la que este método ha sido el más popular. Una<br />

ventaja adicional <strong>de</strong> tener el nucleótido terminal marcado, es que se pue<strong>de</strong>n<br />

usar nucleótidos terminales que lleven cuatro tipos distintos <strong>de</strong> marcaje (uno<br />

diferente para cada nucleótido). Esto implica que las cuatro reacciones <strong>de</strong><br />

terminación específica (ddATP, ddCTP, ddGTP, y ddTTP) se pue<strong>de</strong>n llevar<br />

acabo en el mismo tubo, y ya no se tienen que hacer por separado (Prober et<br />

al., 1987). A<strong>de</strong>más, <strong>de</strong>bido a que se pue<strong>de</strong> <strong>de</strong>terminar cual es el nucleótido<br />

terminal <strong>de</strong> los fragmentos <strong>de</strong> ADN con base en su señal, es posible resolver la<br />

secuencia <strong>de</strong> un templado con sólo un carril. Las bandas que se ven, emiten<br />

una señal distinta, <strong>de</strong>pendiente <strong>de</strong>l nucleótido terminal incorporado. El hecho<br />

<strong>de</strong> que las bandas puedan ser diferenciadas con un carril, elimina la variación<br />

que pue<strong>de</strong> ocurrir entre carriles. A<strong>de</strong>más, si por alguna razón se produce<br />

terminación inespecífica (en un dNTP), no se <strong>de</strong>tecta el fragmento, porque no<br />

lleva un ddNTP marcado al final. Hoy en día, este es el método que más se<br />

utiliza para marcar las ca<strong>de</strong>nas <strong>de</strong> ADN. Kelley (1994) reportó que la<br />

información obtenida en las primeras 300 bases <strong>de</strong> la <strong>secuenciación</strong>, es más<br />

precisa (98% contra 95%) utilizando terminadores (ddNTPs) que llevan una<br />

marca fluorescente en lugar <strong>de</strong> iniciadores con una marca fluorescente.<br />

27


4.1.5 Secuenciación automatizada<br />

Los hallazgos <strong>de</strong> la década <strong>de</strong> los 80s (mejores polimerasas, PCR,<br />

marcas fluorescentes) contribuyeron al <strong>de</strong>sarrollo <strong>de</strong> máquinas automatizadas<br />

capaces <strong>de</strong> <strong>de</strong>terminar miles <strong>de</strong> bases <strong>de</strong> secuencia por día. Las primeras<br />

máquinas <strong>de</strong> <strong>secuenciación</strong> salieron a finales <strong>de</strong> los 80s. En 1986, Smith et al.<br />

reportaron una técnica <strong>de</strong> <strong>secuenciación</strong> automatizada, basada en la<br />

terminación específica con cuatro diferentes fluoróforos. La mezcla <strong>de</strong> síntesis<br />

se cargaba en un solo carril <strong>de</strong> gel, en tubo, y se usaba un <strong>de</strong>tector óptico para<br />

<strong>de</strong>terminar la absorción <strong>de</strong> cada banda, casi al final <strong>de</strong>l tubo. Esta información<br />

pasaba directamente a una computadora y permitía obtener información<br />

precisa <strong>de</strong> hasta 200 pares <strong>de</strong> bases (pb) <strong>de</strong> la secuencia. Sin embargo,<br />

habían varias áreas que podían ser optimizadas para aumentar la longitud <strong>de</strong><br />

la secuencia obtenida: (1) el tamaño, diámetro y composición <strong>de</strong>l gel<br />

electroforético, (2) los reactivos para la reacción <strong>de</strong> <strong>secuenciación</strong>, (3) las<br />

condiciones <strong>de</strong> electroforesis, (4) equipo óptico/electrónico <strong>de</strong> <strong>de</strong>tección, (5) los<br />

marcadores fluorescentes (Smith et al., 1986).<br />

Posteriormente, se experimentó con el uso <strong>de</strong> una máquina que tenía un<br />

<strong>de</strong>tector óptico capaz <strong>de</strong> leer la información <strong>de</strong> cuatro carriles (Ansorge et al.,<br />

1987). En este caso, se reportó que era posible obtener información precisa <strong>de</strong><br />

más <strong>de</strong> 400 pb, usando solo un marcador fluorescente y separando las cuatro<br />

reacciones. Sin embargo, se reportó que a pesar <strong>de</strong> las aparentes ventajas <strong>de</strong>l<br />

uso <strong>de</strong> marcadores distintos y un carril <strong>de</strong> <strong>de</strong>tección, era mejor separar las<br />

reacciones para que los resultados no se vieran afectados por las diferencias<br />

(causantes <strong>de</strong> variación en la migración electroforética) o similitu<strong>de</strong>s (espectros<br />

<strong>de</strong> absorción traslapados) entre los marcadores (Ansorge et al, 1987).<br />

Ansorge et al. (1988) reportaron el primer protocolo que usaba<br />

marcadores fluorescentes en lugar <strong>de</strong> isótopos radioactivos para el método <strong>de</strong><br />

<strong>secuenciación</strong> <strong>de</strong> Maxam-Gilbert. Utilizaron un marcador que no interfería con<br />

la <strong>de</strong>gradación <strong>de</strong> la molécula <strong>de</strong> ADN y lograron secuenciar 50<br />

oligonucleótidos <strong>de</strong> 20 bases cada uno, en un sólo gel. En este reporte, los<br />

autores <strong>de</strong>muestran que también es factible automatizar el método <strong>de</strong> Maxam-<br />

Gilbert usando fluoróforos. Sin embargo, en los años siguientes no hubo<br />

muchos avances en esta área, ya que el <strong>de</strong>sarrollo <strong>de</strong> las técnicas<br />

automatizadas <strong>de</strong> <strong>secuenciación</strong> se enfocó principalmente en mejorar el<br />

método <strong>de</strong> Sanger.<br />

En 1994, se reportó el uso <strong>de</strong> la polimerasa termoestable “SequiTherm”,<br />

que es capaz <strong>de</strong> sintetizar fragmentos gran<strong>de</strong>s con terminación específica.<br />

Esto permitió <strong>de</strong>terminar hasta 1000 bases <strong>de</strong> una secuencia por reacción<br />

28


(Zimmmerman et al., 1994). Esto fue un gran hallazgo, porque a pesar <strong>de</strong> los<br />

avances en la automatización <strong>de</strong> la <strong>secuenciación</strong> la información que se<br />

obtenía <strong>de</strong>spués <strong>de</strong> unas 400 bases <strong>de</strong> secuencia era difícil <strong>de</strong> interpretar y<br />

susceptible a error. La excepción eran reacciones <strong>de</strong> <strong>secuenciación</strong> utilizando<br />

la polimerasa T7, con la cual era posible obtener hasta 700 bases <strong>de</strong><br />

secuencia con 99% <strong>de</strong> precisión, pero esta tenia la <strong>de</strong>sventaja <strong>de</strong> no ser<br />

termoestable (Ansorge et al., 1990; Church et al., 1994).<br />

4.1.6 El <strong>de</strong>sarrollo <strong>de</strong> máquinas <strong>de</strong> <strong>secuenciación</strong><br />

Después <strong>de</strong> que Smith et al. (1986) reportaron el uso <strong>de</strong> la primera máquina<br />

automatizada que usaba un <strong>de</strong>tector óptico para obtener la información <strong>de</strong><br />

<strong>secuenciación</strong> (la cual pasaba directamente a una computadora). Se empezó a<br />

experimentar con otros equipos y variaciones <strong>de</strong> la técnica <strong>de</strong> <strong>secuenciación</strong><br />

con el objetivo <strong>de</strong> mejorar el rendimiento con estas máquinas.<br />

a) Secuenciadoras basadas en geles tipo “slab”--Estas secuenciadoras<br />

usan un gel vertical para separar los fragmentos generados durante la<br />

reacción <strong>de</strong> <strong>secuenciación</strong> y tienen distintos sistemas <strong>de</strong> <strong>de</strong>tección para<br />

leer el or<strong>de</strong>n <strong>de</strong> los marcadores fluorescentes. Meldrum (2000) hace una<br />

comparación <strong>de</strong> algunas propieda<strong>de</strong>s <strong>de</strong> las máquinas comerciales más<br />

comunes que salieron en los 1990s:<br />

ABI PRISM 377 _ Esta secuenciadora salió a finales <strong>de</strong> los 80s. Se<br />

basaba en el uso <strong>de</strong> un carril para <strong>de</strong>tectar cuatro marcadores<br />

fluorescentes distintos. Usa una cámara CCD y es capaz <strong>de</strong> leer hasta<br />

200 bases por muestra por hora. Se pue<strong>de</strong>n cargar hasta 96 muestras<br />

en un solo gel y éstos se <strong>de</strong>tectan simultáneamente.<br />

ASTRAL _ Esta máquina usa un láser <strong>de</strong> Argón para iluminar las<br />

muestras lateralmente. Pue<strong>de</strong> <strong>de</strong>tectar más <strong>de</strong> cuatro marcadores<br />

distintos por muestra y es capaz <strong>de</strong> acomodar hasta 96 muestras por<br />

gel. En un experimento típico se pue<strong>de</strong>n obtener 300 bases <strong>de</strong><br />

secuencia por muestra en un tiempo <strong>de</strong> 7-8 hrs.<br />

LI-COR Mo<strong>de</strong>lo 4200 _ Esta máquina salió en 1997 y tiene un sistema<br />

<strong>de</strong> análisis que <strong>de</strong>tecta una longitud <strong>de</strong> onda cercana al infrarrojo. Esta<br />

máquina es capaz <strong>de</strong> <strong>de</strong>tectar los productos <strong>de</strong> 2 reacciones <strong>de</strong><br />

<strong>secuenciación</strong> simultáneos y bidireccionales, produciendo 2 veces más<br />

información <strong>de</strong> cada reacción <strong>de</strong> <strong>secuenciación</strong>. Tiene 64 carriles y se<br />

producen secuencias <strong>de</strong> hasta 1000 bases <strong>de</strong> cada extremo <strong>de</strong>l<br />

templado con una precisión <strong>de</strong>l 99%.<br />

29


Había mucho interés en reducir el tiempo requerido para obtener los<br />

datos <strong>de</strong> <strong>secuenciación</strong>, dado que esto era uno <strong>de</strong> los pasos limitantes<br />

para completar proyectos <strong>de</strong> <strong>secuenciación</strong>. La compañía MJ Research,<br />

Inc. introdujo una máquina en 1998 que llamaron el sistema “HUGE”.<br />

Ésta se basaba en el uso <strong>de</strong> un gel horizontal <strong>de</strong> poliacrilamida ultra<strong>de</strong>lgado<br />

(75 µm); Tenía 96 carriles y podía leer 450 bases por carril en<br />

90 minutos (Meldrum, 2000) . Este aparato se superó en 1999, cuando<br />

se introdujo el secuenciador “Clipper”, <strong>de</strong>sarrollado por la compañía<br />

Visible Genetics, Inc. Éste era capaz <strong>de</strong> secuenciar 400 bases en 30<br />

minutos en un gel <strong>de</strong> poliacrilamida con un grosor <strong>de</strong> 50 µm, o 1000<br />

bases en menos <strong>de</strong> cuatro horas (Yager et al., 1999).<br />

b) Secuenciadoras basadas en electroforesis capilar- El segundo tipo <strong>de</strong><br />

secuenciadoras automáticas se basaba en un sistema capilar para hacer<br />

la separación <strong>de</strong> los fragmentos <strong>de</strong> distinto tamaños. Los capilares se<br />

caracterizan por tener un diámetro pequeño (≈200 µm) y permiten hacer<br />

una separación rápida <strong>de</strong> alta resolución sin calentar la muestra (Huang<br />

y Mathies, 1994). Por mucho tiempo, esta técnica <strong>de</strong> separación se vio<br />

limitada por el problema <strong>de</strong> cómo <strong>de</strong>tectar múltiples capilares sin tener<br />

que usar múltiples <strong>de</strong>tectores. Por lo tanto, a pesar <strong>de</strong>l beneficio <strong>de</strong> que<br />

la separación capilar es muy rápida (1-2 horas con excelente resolución),<br />

no podía competir con las secuenciadoras que separaban las muestras<br />

en un gel tipo “slab” (Huang y Mathies, 1994; Behr et al., 1999). En<br />

1994, Huang y Mathies reportaron el uso <strong>de</strong> un aparato con un sistema<br />

<strong>de</strong> <strong>de</strong>tección paralelo <strong>de</strong> dos fluoróforos que podía leer la información <strong>de</strong><br />

25 capilares simultáneamente. Esta máquina era aproximadamente 10<br />

veces más rápida que las secuenciadoras típicas <strong>de</strong> geles tipo “slab”.<br />

Pronto empezaron a salir otras secuenciadoras automáticas que usaban<br />

separación por electroforesis capilar, con sistemas <strong>de</strong> <strong>de</strong>tección<br />

paralelos (figura 8) para multiples capilares, por ejemplo:<br />

CEQ 2000 (Evans, 2000) _ Esta secuenciadora tiene ocho capilares con<br />

un <strong>de</strong>tector <strong>de</strong> cuatro colores. Los pasos para preparar el gel, i.e., la<br />

<strong>de</strong>snaturalización <strong>de</strong> la muestra y la carga, son automatizadas. Este<br />

sistema es capaz <strong>de</strong> <strong>de</strong>terminar 500 bases <strong>de</strong> secuencia <strong>de</strong> cada capilar<br />

en 2 horas, o leer hasta 96 muestras automáticamente en un día.<br />

Secuenciadora MCE (Behr et al., 1999) _ Esta secuenciadora se<br />

<strong>de</strong>sarrolló en el <strong>Instituto</strong> Max-Planck. Tiene una <strong>de</strong>tección paralela <strong>de</strong> 96<br />

capilares (Figura 8) y es capaz <strong>de</strong> procesar 15,000 muestras sin<br />

intervención humana.<br />

30


Figura 8. Esta secuenciadora tiene un <strong>de</strong>tector paralelo capaz <strong>de</strong> leer la información<br />

<strong>de</strong> 96 capilares simultáneamente. Luz <strong>de</strong> un láser <strong>de</strong> Argón se guía por una fibra<br />

óptica (Fi) hasta el generador (PI) que distribuye la luz <strong>de</strong> forma uniforme por todos<br />

los capilares.<br />

MegaBACE 1000 _ Esta máquina también tiene 96 capilares y es posible<br />

obtener secuencias hasta <strong>de</strong> 800 pares <strong>de</strong> bases por corrida (Meldrum, 2000)<br />

ABI PRISM 3700 _ Esta es la secuenciadora que se utiliza en el <strong>Instituto</strong> <strong>de</strong><br />

<strong>Biotecnología</strong> <strong>de</strong> la <strong>UNAM</strong> (figura 9). Pue<strong>de</strong> <strong>de</strong>tectar 5 marcadores<br />

fluorescentes distintos y correr 24 horas sin intervención humana. Cuenta con<br />

96 capilares (y 8 <strong>de</strong> reserva) y se pue<strong>de</strong> recargar hasta cuatro veces<br />

automáticamente. Se pue<strong>de</strong>n hacer hasta 500 corridas sin necesidad <strong>de</strong><br />

cambiar los capilares. Cada corrida dura aproximadamente 2.5 hrs y <strong>de</strong>tecta un<br />

promedio <strong>de</strong> 550 bases por reacción <strong>de</strong> <strong>secuenciación</strong> (Meldrum, 2000).<br />

31


Figura 9. La secuenciadora ABI PRISM 3700. Es el aparato que actualmente se tiene<br />

en el IBt-<strong>UNAM</strong>. Hay una segunda máquina en el Centro <strong>de</strong> Investigación sobre<br />

Fijación <strong>de</strong> Nitrogeno (CIFN-<strong>UNAM</strong>). Pue<strong>de</strong> correr 768 reacciones <strong>de</strong> secuencia sin<br />

atención técnica en 36 horas. La longitud <strong>de</strong> las lecturas obtenidas es <strong>de</strong> un<br />

promedio <strong>de</strong> 600-700 bases” (kinish.cifn.unam.mx/~retligen/infrastructura.htm).<br />

4.2 Secuenciación <strong>de</strong> ARN<br />

Paralelo al <strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> ADN, también<br />

se reportaron avances en la <strong>secuenciación</strong> <strong>de</strong> ARN. Des<strong>de</strong> que Holley<br />

secuenció un tARN para Alanina en 1965, se han <strong>de</strong>sarrollado métodos <strong>de</strong><br />

<strong>secuenciación</strong> <strong>de</strong> ARN similares a los utilizados para secuenciar ADN<br />

(Blackburn y Gait, 1996). Básicamente, los métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> ARN<br />

se divi<strong>de</strong>n en 2 categorías.<br />

4.2.1 Métodos indirectos<br />

En este caso, el ARN se convierte primero a cADN con la enzima transcriptasa<br />

reversa y luego se usa el fragmento obtenido como templado para la reacción<br />

<strong>de</strong> <strong>secuenciación</strong>. En realidad, este método <strong>de</strong>termina la secuencia <strong>de</strong> una<br />

molécula <strong>de</strong> ADN a partir <strong>de</strong> la cual se infiere la secuencia <strong>de</strong> la molécula <strong>de</strong><br />

ARN. Este método indirecto es uno <strong>de</strong> los más comunes para la <strong>secuenciación</strong><br />

<strong>de</strong> ARN porque tiene todas las ventajas <strong>de</strong> la <strong>secuenciación</strong> <strong>de</strong> ADN.<br />

32


4.2.2 Métodos directos<br />

Estos métodos se utilizan para secuenciar la molécula <strong>de</strong> ARN cuando es<br />

complicado utilizar el método indirecto (Igloi, 1998). Esto suele suce<strong>de</strong>r con<br />

ARNs muy pequeños, o con estructuras secundarias extensas (ribosomales,<br />

transferencia). Todas estas técnicas requieren <strong>de</strong> que el ARN este en forma<br />

pura.<br />

a) Método enzimático-- En los primeros reportes se experimentó con una<br />

forma enzimática para secuenciar ARN directamente. En este caso,<br />

los autores Brownlee y Cartwright (1977) reportaron los resultados <strong>de</strong><br />

la <strong>secuenciación</strong> <strong>de</strong> una molécula <strong>de</strong> mARN <strong>de</strong> casi 200 pb.<br />

Utilizaron un iniciador marcado con 32 P y la transcriptasa reversa.<br />

Usando reacciones similares a las <strong>de</strong>l método <strong>de</strong> Sanger, los autores<br />

generaron fragmentos <strong>de</strong> cADN con una terminación específica dada<br />

por ddNTPs. Después, resolvieron el or<strong>de</strong>n <strong>de</strong> los fragmentos <strong>de</strong><br />

ADN generados en un gel <strong>de</strong> acrilamida. Se ha visto que la<br />

concentración <strong>de</strong>l ARN templado influye mucho en la resolución <strong>de</strong>l<br />

gel. Los autores Carpenter y Simon (1990) reportaron que cuanto<br />

mayor era la cantidad <strong>de</strong> ARN viral usado como templado, menor era<br />

la resolución obtenida en el gel <strong>de</strong> acrilamida <strong>de</strong>bido a que las<br />

bandas eran anchas, complicando la interpretación <strong>de</strong>l or<strong>de</strong>n. Ellos<br />

obtuvieron la mejor resolución utilizando 0.4 µg (0.75 pmol) <strong>de</strong> ARN<br />

como templado. En una reacción <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> rARN, Bakin y<br />

Ofengand (1992) obtuvieron la mejor resolución empleando 10 veces<br />

menos ARN, es <strong>de</strong>cir, solamente 0.13 pmol.<br />

A pesar <strong>de</strong> que se generan fragmentos <strong>de</strong> ADN, el método<br />

enzimático es un método directo porque el templado es una molécula<br />

<strong>de</strong> ARN. La marca se pue<strong>de</strong> incorporar a los fragmentos <strong>de</strong> ADN <strong>de</strong><br />

maneras alternativas a la usada por Brownlee y Cartwright en 1977.<br />

El uso <strong>de</strong> ddNTPs marcados tiene la ventaja <strong>de</strong> que los fragmentos<br />

que sufren una terminación prematura no se <strong>de</strong>tectan ni interfieren<br />

con la interpretación <strong>de</strong> la secuencia. La terminación prematura suele<br />

ser un problema más común en la <strong>secuenciación</strong> <strong>de</strong> ARN por la<br />

formación <strong>de</strong> estructuras secundarias que interfieren con la actividad<br />

<strong>de</strong> la transcriptasa reversa. A<strong>de</strong>más, la síntesis <strong>de</strong> fragmentos <strong>de</strong><br />

ADN a 37 ºC carece <strong>de</strong> las ventajas <strong>de</strong> las altas temperaturas que se<br />

pue<strong>de</strong>n usar con otras enzimas (polimerasa Taq).<br />

33


) Método químico-- En 1977 se presentó un método <strong>de</strong> ruptura química<br />

<strong>de</strong>l ARN similar al <strong>de</strong> Maxam y Gilbert (Donis-Keller et al., 1977). La<br />

molécula <strong>de</strong> ARN (en este caso ARN ribosomal) se marca con una<br />

molécula <strong>de</strong> 32 P en un extremo. Después se utilizaron nucleasas para<br />

hacer digestiones <strong>de</strong> la molécula <strong>de</strong> ARN marcado en distintos<br />

lugares. La RNAsa T1 corta las guaninas, la RNAsa U2 corta las<br />

a<strong>de</strong>ninas y una hidrólisis alcalina rompe todos los enlaces<br />

fosfodiéster (Donis-Keller et al., 1977). Se utiliza un gel <strong>de</strong> acrilamida<br />

para separar los fragmentos <strong>de</strong> estos tres tipos <strong>de</strong> ruptura, lo que<br />

permite <strong>de</strong>terminar el or<strong>de</strong>n <strong>de</strong> las guaninas, a<strong>de</strong>ninas y pirimidinas<br />

<strong>de</strong> una molécula <strong>de</strong> ARN ribosomal.<br />

A diferencia <strong>de</strong>l método enzimático, en el que se pue<strong>de</strong> usar un<br />

iniciador marcado para generar los fragmentos que serán<br />

secuenciados, el método químico requiere que la molécula <strong>de</strong> ARN<br />

sea marcada directamente. Esto se pue<strong>de</strong> hacer introduciendo una<br />

marca <strong>de</strong> 32 P en el extremo 5’ <strong>de</strong> la molécula con una cinasa T4, o en<br />

el extremo 3’ con una ligasa T4 (Blackburn and Gait, 1996).<br />

4.3 Resumen <strong>de</strong> enzimas usadas en la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />

<strong>nucleicos</strong>.<br />

En la tabla 2 se resumen algunas <strong>de</strong> las enzimas mas comunes utilizadas<br />

en la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>. Estas enzimas eran entre las<br />

primeras herramientas en la biología molecular y se aprovecharon sus<br />

activida<strong>de</strong>s naturales en la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />

34


Tabla 2- Algunas <strong>de</strong> las enzimas que han tenido un papel importante en el<br />

<strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong><br />

Enzima Función Referencia<br />

Fragmento Una polimerasa <strong>de</strong> ADN que utilizo Sanger en su reacción Sanger et<br />

Klenow <strong>de</strong> <strong>secuenciación</strong>. No es termoestable.<br />

al., 1977<br />

T7 Una polimerasa <strong>de</strong> ADN no termoestable que se utilizaba (Ansorge et<br />

frecuentemente en las reacciones <strong>de</strong> <strong>secuenciación</strong> con el<br />

Método Sanger. Se utilizaba frecuentemente para<br />

incorporar terminadores (ddNTPs) etiquetadas con un<br />

fluoroforo.<br />

al., 1990)<br />

Taq<br />

Una polimerasa termoestable aislada <strong>de</strong> T. aquaticus Innis et al.,<br />

polimerasa (termofilo). Fue una gran herramienta en el <strong>de</strong>sarrollo <strong>de</strong><br />

la técnica <strong>de</strong> PCR.<br />

1988<br />

Enzimas <strong>de</strong> El primero fue aislado <strong>de</strong> E. coli en 1968 por Matthew<br />

restricción Meselson y Robert Yuan. Son nucleasas que reconocen y<br />

cortan secuencias específicas <strong>de</strong> ADN (doble ca<strong>de</strong>na). Se<br />

utilizan en el método <strong>de</strong> <strong>de</strong>gradación química para aislar<br />

los fragmentos ( 32 Maxam y<br />

Gilbert,<br />

P) que serán secuenciados.<br />

1977<br />

Transcriptasa Una polimerasa <strong>de</strong> ADN que sintetiza una ca<strong>de</strong>na <strong>de</strong> ADN Brownlee y<br />

reversa utilizando una molécula <strong>de</strong> ARN como templado<br />

Cartwright,<br />

1977<br />

RNAsa T1 La RNAsa T1 corta las moléculas <strong>de</strong> ARN (ca<strong>de</strong>na sencilla) Donis-Keller<br />

en las guaninas.<br />

et al., 1977<br />

RNAsa U2 RNAsa U2 corta las moléculas <strong>de</strong> ARN (ca<strong>de</strong>na sencilla) Donis-Keller<br />

en las a<strong>de</strong>ninas.<br />

et al., 1977<br />

RNA ligasa Se utiliza para unir una marca radioactiva (<br />

32<br />

P) en el Blackburn y<br />

extremo 5’ <strong>de</strong> la molécula <strong>de</strong> ARN (ca<strong>de</strong>na sencilla). Gait, 1996<br />

Cinasa T4 Se utiliza para unir una marca radioactiva ( 32 P) en el Blackburn y<br />

extremo 3’ <strong>de</strong> la molécula <strong>de</strong> ARN (ca<strong>de</strong>na sencilla). Gait, 1996<br />

5.0 ESTRATEGIAS Y APLICACIONES DE LA SECUENCIACIÓN DE<br />

ÁCIDOS NUCLEICOS<br />

5.1 Proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano<br />

Uno <strong>de</strong> los factores principales que motivó el <strong>de</strong>sarrollo <strong>de</strong> la tecnología<br />

<strong>de</strong> las secuenciadoras automáticas fue el proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />

genoma humano. Tal vez ningún proyecto <strong>de</strong> <strong>secuenciación</strong> genómica ha<br />

recibido tanta atención como éste, concebido en Estados Unidos en 1988<br />

(Olson, 1993). En ese tiempo, la tecnología <strong>de</strong> <strong>secuenciación</strong> automatizada<br />

estaba en sus primeras etapas <strong>de</strong> <strong>de</strong>sarrollo, y era muy ambicioso intentar<br />

secuenciar un genoma <strong>de</strong> miles <strong>de</strong> millones <strong>de</strong> pb. Sin embargo, el comienzo<br />

35


<strong>de</strong> este proyecto se anunció oficialmente en 1990 por los <strong>de</strong>partamentos <strong>de</strong><br />

Salud y Energía con un presupuesto <strong>de</strong> 3 mil millones <strong>de</strong> dólares y la meta <strong>de</strong><br />

completar la secuencia en 15 años (Venter et al., 2001).<br />

¿De qué nos sirve la información <strong>de</strong> la secuencia <strong>de</strong> un genoma? De una<br />

forma muy general, los objetivos principales <strong>de</strong>l proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />

genoma humano eran los siguientes (Olson, 1993):<br />

a) Mejorar la infraestructura <strong>de</strong> la investigación genética - La secuencia<br />

<strong>de</strong>l genoma humano permitiría la ampliación <strong>de</strong>l conocimiento<br />

genético <strong>de</strong> nuestro organismo. Se pue<strong>de</strong>n utilizar técnicas como el<br />

PCR para analizar <strong>de</strong>talladamente ciertos segmentos <strong>de</strong>l genoma.<br />

Conociendo su secuencia, se pue<strong>de</strong>n diseñar oligonucleótidos que<br />

reconocen y se unen a secuencias complementarias en el ADN.<br />

b) Comparar el papel <strong>de</strong> una secuencia <strong>de</strong> ADN en los humanos y en<br />

los organismos mo<strong>de</strong>lo – Se pue<strong>de</strong>n comparar las secuencias <strong>de</strong> los<br />

genes i<strong>de</strong>ntificados en el genoma humano con los genes <strong>de</strong> otros<br />

organismos y conocer el grado <strong>de</strong> similitud o diferencia que existe<br />

entre dos especies. También se pue<strong>de</strong> inferir la función <strong>de</strong> ciertos<br />

genes con base en los conocimientos <strong>de</strong> otro gen similar, i<strong>de</strong>ntificado<br />

en otro organismo.<br />

c) Mejorar la bioquímica analítica <strong>de</strong>l ADN - Este era el reto más gran<strong>de</strong><br />

cuando se anunció el inicio <strong>de</strong>l proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />

genoma humano, ya que se refería a mejorar las herramientas para<br />

el análisis <strong>de</strong> ADN. Éste era un reto técnico, ya que para obtener la<br />

secuencia completa <strong>de</strong>l genoma humano en el tiempo propuesto era<br />

necesario <strong>de</strong>sarrollar la estrategia y las máquinas <strong>de</strong> <strong>secuenciación</strong><br />

con capacidad <strong>de</strong> secuenciar dos Mpb por año.<br />

La secuencia <strong>de</strong>l genoma humano se reportó en el 2001, cuatro años antes <strong>de</strong><br />

la fecha prevista (Venter et al., 2001). Esto se <strong>de</strong>be en parte a los esfuerzos <strong>de</strong><br />

más <strong>de</strong> 20 grupos internacionales que colaboraron para completar la<br />

secuencia, y a los avances en la tecnología <strong>de</strong> las secuenciadoras automaticas<br />

(la mayor parte <strong>de</strong> la secuencia se obtuvo con máquinas ABI PRISM 3700;<br />

figura 9). Pero la razón principal por la que se logró completar la secuencia fue<br />

un cambio en la estrategia <strong>de</strong> <strong>secuenciación</strong> (Internacional Human Genome<br />

Sequencing Consortium, 2001). La necesidad <strong>de</strong> tener una buena estrategia<br />

para secuenciar fragmentos gran<strong>de</strong>s <strong>de</strong> ADN (e.g, un cromosoma), fue<br />

evi<strong>de</strong>nte en el proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano.<br />

36


5.2 Estrategias para la <strong>secuenciación</strong> <strong>de</strong> fragmentos gran<strong>de</strong>s <strong>de</strong> ADN.<br />

5.2.1 “Chromosome Walking”<br />

Hay dos estrategias generales para secuenciar fragmentos gran<strong>de</strong>s <strong>de</strong><br />

ADN. La primera se llama caminata cromosomal “chromosome walking”<br />

(Brown, 1999; figura 10) y consiste en lo siguiente: (1) la fragmentación parcial<br />

<strong>de</strong>l ADN para su inserción en un vector <strong>de</strong> clonación; (2) la obtención <strong>de</strong> un<br />

banco <strong>de</strong> clonas <strong>de</strong> fragmentos que contienen segmentos que se traslapan y;<br />

(3) la <strong>secuenciación</strong> <strong>de</strong> una clona y la i<strong>de</strong>ntificación <strong>de</strong> una segunda que posea<br />

la continuación <strong>de</strong>l segmento que se está secuenciando. Este proceso se<br />

repite hasta que se completa la secuencia <strong>de</strong> la molécula original <strong>de</strong> ADN (e.g.,<br />

un cromosoma).<br />

Esta estrategia se utilizó originalmente en el proyecto <strong>de</strong> <strong>secuenciación</strong><br />

<strong>de</strong>l genoma humano. Tiene la ventaja <strong>de</strong> que se asegura la obtención <strong>de</strong> la<br />

secuencia completa <strong>de</strong> la molécula original <strong>de</strong> ADN. En teoría, no se requiere<br />

hacer <strong>secuenciación</strong> redundante; sin embargo, tiene varias <strong>de</strong>sventajas que<br />

afectan el tiempo y el costo <strong>de</strong> un proyecto <strong>de</strong> <strong>secuenciación</strong>. Primero, cada<br />

clona se tiene que analizar individualmente y en serie. No se pue<strong>de</strong> secuenciar<br />

la siguiente clona hasta no conocer la primer secuencia. Segundo, se requiere<br />

la síntesis <strong>de</strong> un enorme número <strong>de</strong> iniciadores para continuar la<br />

<strong>secuenciación</strong>. Suponiendo que cada iniciador empleado es único y sirve para<br />

secuenciar sólo una parte <strong>de</strong> una clona particular, se requiere sintetizar <strong>de</strong> 5 a<br />

10% <strong>de</strong> la secuencia total (Cantor y Smith, 1999). Tomando esto en cuenta, no<br />

es sorpren<strong>de</strong>nte que hasta 1998 sólo se había secuenciado el 5% <strong>de</strong>l genoma<br />

humano (Venter et al., 2001). Era necesario un cambio <strong>de</strong> estrategia para<br />

completar la secuencia <strong>de</strong>l genoma humano en el tiempo previsto.<br />

37


Figura 10. La estrategia “chromosome walking” permite <strong>de</strong>terminar la secuencia <strong>de</strong><br />

un fragmento enorme <strong>de</strong> ADN ensamblando muchas secuencias pequeñas <strong>de</strong><br />

distintas clonas (www.bio.miami.edu/dana/250/25003_10.htm).<br />

5.2.2 “Shotgun Sequencing”<br />

La segunda estrategia general para la <strong>secuenciación</strong> <strong>de</strong> fragmentos gran<strong>de</strong>s<br />

<strong>de</strong> ADN, se llama <strong>secuenciación</strong> tipo “shotgun” (figura 11). La gran diferencia<br />

entre esta estrategia y la anterior es que en el “shotgun” la <strong>secuenciación</strong> se<br />

hace a partir <strong>de</strong> fragmentos al azar. Después, se utiliza un programa <strong>de</strong><br />

cómputo para encontrar las regiones que se traslapan entre las secuencias<br />

individuales. Así se va ensamblando la secuencia <strong>de</strong>l fragmento original<br />

(Brown, 1999). Esta estrategia <strong>de</strong> <strong>secuenciación</strong> tiene la ventaja <strong>de</strong> que es<br />

rápida, requiere la síntesis <strong>de</strong> pocos iniciadores, y tiene una eficiencia<br />

comprobada (Cantor y Smith, 1999). Una <strong>de</strong> las <strong>de</strong>sventajas <strong>de</strong> esta estrategia<br />

es que requiere la redundancia <strong>de</strong> las secuencias para asegurar la obtención<br />

<strong>de</strong> una muestra completa <strong>de</strong>l ADN original. Otra <strong>de</strong>sventaja es que se requiere<br />

mucha tecnología computacional para ensamblar la secuencia original y que a<br />

veces quedan “gaps” (regiones <strong>de</strong>l fragmento original que no se secuenciaron).<br />

Utilizando esta estrategia <strong>de</strong> <strong>secuenciación</strong>, es necesario secuenciar al menos<br />

5 veces el ADN original para po<strong>de</strong>r lograr un muestreo completo (Venter et al.,<br />

38


2001). Tal vez, esta razón es suficiente para explicar la resistencia durante<br />

tanto tiempo para la realización <strong>de</strong>l proyecto <strong>de</strong>l genoma humano,<br />

consi<strong>de</strong>rando que es un genoma al menos 25 veces más gran<strong>de</strong> que cualquier<br />

otro genoma ya secuenciado (Internacional Human Genome Sequencing<br />

Consortium, 2001). Aun cuando Weber y Myers (1997) presentaron un plan<br />

para terminar la <strong>secuenciación</strong> <strong>de</strong>l genoma humano con esta estrategia,<br />

<strong>de</strong>mostrando que sería más rápido y menos costoso, su propuesta no fue bien<br />

recibida.<br />

Figura 11. En la estrategia “shotgun” se secuencian fragmentos al azar y luego<br />

usando un programa computacional se encuentran las regiones que se traslapan<br />

para <strong>de</strong>terminar la secuencia <strong>de</strong>l fragmento original<br />

(http://www.bioteach.ubc.ca/Bioinformatics/GenomeProjects/shotgun%201.gif).<br />

En 1998 se fundó la compañía <strong>de</strong> biotecnología Celera Genomics, con el<br />

propósito <strong>de</strong> completar el proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano<br />

utilizando la estrategia “shotgun” (Myers, 1999). La vali<strong>de</strong>z <strong>de</strong> esta estrategia<br />

fue establecida en el 2001 cuando Venter et al. (investigadores <strong>de</strong> Celera<br />

Genomics) reportaron que habían completado la <strong>secuenciación</strong> <strong>de</strong>l genoma<br />

humano en menos <strong>de</strong> un año.<br />

39


Al conocerse la secuencia <strong>de</strong>l genoma humano se hicieron varios hallazgos<br />

importantes (Venter et al., 2001; Internacional Human Genome Sequencing<br />

Consortium, 2001):<br />

a) El genoma está compuesto por 1% <strong>de</strong> exones, 24% <strong>de</strong> intrones y 75% <strong>de</strong><br />

regiones intergénicas.<br />

b) Hay entre 30,000 y 40,000 genes que codifican para proteínas.<br />

c) Se han i<strong>de</strong>ntificado más <strong>de</strong> 2.1 millones <strong>de</strong> polimorfismos <strong>de</strong> un solo<br />

nucleótido (SNPs) en el genoma. Éstos ocurren más o menos uno <strong>de</strong> cada<br />

1300 bases.<br />

Si se secuencia una región <strong>de</strong>l genoma <strong>de</strong> dos individuos, se encontrará que<br />

son 99.3% idénticos. En gran parte, las diferencias son cambios <strong>de</strong> una sola<br />

base conocidos como SNPs; se encontraran las dos alternativas en más <strong>de</strong> 1%<br />

<strong>de</strong> la población (Chiche et al., 2002). Dado que muchas enfermeda<strong>de</strong>s<br />

genéticas están asociadas a variaciones pequeñas como los SNPs, hay interés<br />

en utilizar la información <strong>de</strong>l proyecto <strong>de</strong>l genoma humano para i<strong>de</strong>ntificar los<br />

SNPs responsables <strong>de</strong> ciertas enfermeda<strong>de</strong>s (Tang et al., 2004).<br />

5.3 Otras aplicaciones<br />

El avance en la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> ha sido una herramienta<br />

que ha generado muchos conocimientos en el campo <strong>de</strong> la genómica. Hasta el<br />

2001 se habían reportado los genomas completos <strong>de</strong> 599 virus, 185 organelos,<br />

31 eubacterias, 7 arqueobacterias, un hongo, dos animales y una planta<br />

(Internacional Human Genome Sequencing Consortium, 2001). Las<br />

ramificaciones <strong>de</strong> tener esta información son innumerables, y su valor<br />

incalculable. Entre otras cosas, nos ha permitido enten<strong>de</strong>r cómo se asocian las<br />

enfermeda<strong>de</strong>s con la variabilidad genética, la función <strong>de</strong> genes caracterizados<br />

en otros organismos, el patrón <strong>de</strong> expresión <strong>de</strong> genes nuevos, el aislamiento<br />

<strong>de</strong> genes específicos por PCR, la similitud o variación genética entre especies<br />

diferentes, la organización <strong>de</strong> la información genética, el origen <strong>de</strong> algunos<br />

genes, etc. Hay cientos <strong>de</strong> ejemplos <strong>de</strong> cada una <strong>de</strong> estas categorías. Tal vez,<br />

lo que sea más importante recordar es que no parece haber límite en las<br />

aplicaciones <strong>de</strong> la información que se obtiene <strong>de</strong> la <strong>secuenciación</strong> <strong>de</strong> los<br />

<strong>ácidos</strong> <strong>nucleicos</strong>. Gracias a esta información, se han logrado avances en la<br />

investigación <strong>de</strong> áreas como la medicina, la química, la biología molecular, la<br />

sistemática, la proteómica, y mucho más.<br />

40


6.0 El FUTURO DE LA SECUENCIACION<br />

6.1 Secuenciación por hibridización<br />

Entre otras cosas el conocimiento <strong>de</strong> la secuencia <strong>de</strong> los genomas o los<br />

genes <strong>de</strong> los organismos también ha permitido <strong>de</strong>sarrollar nuevos métodos <strong>de</strong><br />

<strong>secuenciación</strong>. Como reportan Isaksson y Lan<strong>de</strong>gren (1999) uno <strong>de</strong> estos es<br />

la <strong>secuenciación</strong> por hibridización. Una forma en la cual pue<strong>de</strong> funcionar este<br />

método es utilizando “microarrays”. Estos son soportes pequeños en los<br />

cuales se imobilian pequeños fragmentos <strong>de</strong> ADN en un or<strong>de</strong>n conocido.<br />

Después se pasa la muestra <strong>de</strong> ADN (con secuencia <strong>de</strong>sconocida) y se<br />

cuantifica el grado <strong>de</strong> hibridización, y por consecuencia el grado <strong>de</strong> i<strong>de</strong>ntidad<br />

con las secuencias fijas en el soporte (Cantor y Smith, 1999). Esto parece<br />

funcionar especialmente bien en la i<strong>de</strong>ntificación <strong>de</strong> SNPs. Wang et al. (1998)<br />

reportaron que es posible i<strong>de</strong>ntificar el genotipo <strong>de</strong> un individuo analizando 500<br />

SNPs a la vez en un experimento <strong>de</strong> hibridización con un “microarray” <strong>de</strong><br />

oligonucleotidos. Una posibilidad para la <strong>secuenciación</strong> <strong>de</strong> acidos <strong>nucleicos</strong> a<br />

futuro, que discuten los autores Cantor y Smith (1999) es el hacer hibridización<br />

contra oligonucleotidos que formen palabras <strong>de</strong> tal forma que se pueda ir<br />

<strong>de</strong>terminando la secuencia sobrelapando los fragmentos (<strong>de</strong> 6-8 nucleótidos)<br />

con los cuales híbrida el fragmento secuenciado (Figura 12).<br />

Figura 12. La forma en la cual se pue<strong>de</strong> utilizar hibridización para secuenciar. La<br />

molécula <strong>de</strong> ADN se hibridiza contra pequeños oligonucleotidos que son como<br />

“palabras”. Después, se <strong>de</strong>termina la secuencia.<br />

6.2 Secuenciación a futuro sin fragmentación <strong>de</strong> ADN<br />

Los autores Cantor y Smith (1999) presentan algunas posibilida<strong>de</strong>s <strong>de</strong> cómo<br />

puedan evolucionar los métodos en la <strong>secuenciación</strong> <strong>de</strong> acidos <strong>nucleicos</strong>. Las<br />

posibilida<strong>de</strong>s se discuten en función <strong>de</strong> que po<strong>de</strong>r secuenciar moléculas<br />

individuales <strong>de</strong> ADN sin fragmentarlos en segmentos. Por ejemplo, usar<br />

moléculas <strong>de</strong> ADN fijas a un soporte que se van <strong>de</strong>gradando con una<br />

exonucleasa y algún <strong>de</strong>tector que <strong>de</strong>termine cuales son los nucleótidos que se<br />

van liberando (Cantor y Smith, 1999). Una segunda posibilidad es utilizar<br />

microscopia electronica para <strong>de</strong>terminar la secuencia <strong>de</strong> acidos <strong>nucleicos</strong> en<br />

41


una molécula <strong>de</strong> ADN. Esto se podría hacer tal vez marcando las bases<br />

individuales con algún metal pesado.<br />

Ninguno <strong>de</strong> estos dos métodos se ha implementado por dificulta<strong>de</strong>s en<br />

los <strong>de</strong>talles (Cantor y Smith, 1999). En el primer caso hay dos complicaciones:<br />

como marcar cada base con alguna etiqueta como un fluoroforo, y tener un<br />

<strong>de</strong>tector suficientemente sensible que sea capaz <strong>de</strong> <strong>de</strong>tectar un solo nucleótido<br />

marcado. En el segundo caso (microscopia electronica), no se pudo marcar<br />

cada base con algún metal sin tener reacciones laterales no <strong>de</strong>seadas (con<br />

otras bases la molécula <strong>de</strong> ADN). Sin embargo, tal vez a futuro, se logren<br />

resolver estas dificulta<strong>de</strong>s, o se <strong>de</strong>scubran otras alternativas eficientes para<br />

hacer la <strong>secuenciación</strong> <strong>de</strong> moléculas individuales <strong>de</strong> ADN.<br />

42


7.0 REFERENCIAS<br />

Ansorge, W., B. Sproat, J. Stegemann, C. Schwager and M. Zenke (1987)<br />

AutomatedDNA sequencing: ultrasensitive <strong>de</strong>tection of fluorescent bands<br />

during electrophoresis. Nucleic Acids Res 15(11): 4593-4602<br />

Ansorge, W. A. Rosenthal, B. Sproat, C. schwager, J. Stegemann and H. Voss<br />

(1988) Non-radioactive automated sequencing of oligonucleoti<strong>de</strong>s by<br />

chemical <strong>de</strong>gradation. Nucleic Acids Res 16(5): 2203-2206<br />

Ansorge, W., J. Zimmerman, C. Schwager, J. Stegemann, H. Erfle, and H. Voss<br />

(1990) One label, one tube, Sanger DNA sequencing in one and two<br />

lanes on a gel. Nucleic Acids Res 18(11): 3419-3420<br />

Bakin, A. and J. Ofengand (1992) A high sensitivity method for sequencing<br />

RNA: application to ribosomal RNA. BioTechniques 13(5):682-683<br />

Behr, S., M. Matzig, A. Levin, H. Eickhoff, C. Heller, (1999) A fully automated<br />

multicapillary electrophoresis <strong>de</strong>vice for DNA analysis. Electrophoresis<br />

20: 1492-1507<br />

Bennet, P. (2003) DNA sequencing and the human genome Project. Molecular<br />

Biology In Cellular Pathology. John Wiley & Sons, Ltd pp. 308-328<br />

Blackburn, G. M. and M. Gait (1996), Nucleic Acids in Chemistry and Biology,<br />

2 nd Ed., Oxford, U. Pr., NY, EUA.<br />

Brown, T.A. (1999) Genomes. Bios Scientific Publishers, Ltd. John Wiley &<br />

Sons, Inc, New York, USA. pp. 59-82<br />

Brownlee, G. and E. Carterwright (1977) Rapid gel sequencing of RNA by<br />

primed synthesis with reverse transcriptase. J Mol Biol 114: 93-117<br />

Cantor, C. and C. Smith (1999) Genomics: The science and technology behind<br />

the human genome project. John Wiley & Sons, Inc.<br />

Carballeira, N., M. Nazabal, J. Brito, O. Garcia (1990)Purification of a<br />

thermostable DNA polimerase from Thermus thermophilus HB8, useful in<br />

the polymerase Chain reaction. BioTechniques 9(3): 276-281<br />

Carpenter, C. and A. Simon (1990) Simplified RNA sequencing using di<strong>de</strong>oxy<br />

chain termination. BioTechniques 8(1): 26-27<br />

43


Chiche, J., A. Cariou, J. Mira (2002) Bench-to-bedsi<strong>de</strong> review: Fulfilling<br />

promises of the human genome project. Critical Care 6(3): 212-215<br />

Church, G. G. Gryan, N. Lakey, S. Kieffer-Higgins, L. Mintz, M. Temple, M.<br />

Rubenfield, L. Jaehn, H. Ghaziza<strong>de</strong>h, K. Robison, and P. Richterich<br />

(1994) Automated multiplex sequencing. Chapt 2. Automated DNA<br />

sequencing and analysis. Edit. Adams, M. C. Fields, J. Venter. Aca<strong>de</strong>mic<br />

Press, Inc. SD, USA. Pp. 11-16<br />

Donis-Keller, H. A. Maxam, and W. Gilbert (1977) Mapping a<strong>de</strong>nines, guanines,<br />

and pyrimidines in RNA. Nucleic Acids Res 4(8): 2527-2538<br />

Evans, T. (2000) Engineering in genomics. Developing and commercializing a<br />

DNA sequencer. IEE EMB 19(4): 117-120<br />

Huang, X. and R. Mathies (1994) Application of capillary array electrophoresis<br />

to DNA sequencing. Chapt 3. Automated DNA sequencing and<br />

analysis. Edit. Adams, M. C. Fields, J. Venter. Aca<strong>de</strong>mic Press, Inc.<br />

SD, USA. Pp. 17-28<br />

Hunkapiller, T., R. Kaiser, B. Koop, and L. Hood (1991) Large-scale and<br />

automated DNA sequence <strong>de</strong>termination. Science 25: 59-67<br />

Igloi, G. (1998) Strategies for introducing non-radioactive labels during the<br />

automated Sequence analysis of nucleic acids. Elec J Biotech 1(1): 23<br />

30<br />

Innis, M., D. Myambo, D. Gelfand, and M. Brow (1988) DNA sequencing with<br />

Thermus aquaticus DNA polymerase and direct sequencing of<br />

polymerase Chain reaction-amplified DNA. Proc Natl Acad Sci, 85:9436<br />

9440<br />

International Human Genome Sequencing Consortium (2001) Initial sequencing<br />

and analysis of the human genome. Nature 409: 860-921<br />

Isaksson, A. and U. Lan<strong>de</strong>gren (1999) Accessing genomic information:<br />

alternatives to PCR. Curr Opin Biotechnology 10: 11-15<br />

Kelley, J. (1994) Automated Dye-terminator DNA sequencing. Chapt 26.<br />

Automated DNA sequencing and analysis. Edit. Adams, M. C. Fields, J.<br />

Venter. Aca<strong>de</strong>mic Press, Inc. SD, USA. Pp. 175-181<br />

44


Kempe, T., W. Sundquist, F. Chow, and L. Hu (1985) Chemical and enzymatic<br />

biotin-labeling of oligo<strong>de</strong>oxyribonucleoti<strong>de</strong>s. Nucleic Acids Res 13:45-57<br />

Levine, J., Suzuki, D. El secreto <strong>de</strong> la vida. Dirección General <strong>de</strong> Divulgación<br />

<strong>de</strong> la ciencia, <strong>UNAM</strong>, México (2000).<br />

Lewin, B. (1997) Genes. Oxford University Press, Inc. New York. Pp. 472-477<br />

Lipshutz, R. and S. Fodor (1994) Advanced DNA sequencing technologies.<br />

Curr Opin Struct Biol 4:376-380<br />

Maxam, A. and W. Gilbert (1977) A new method for sequencing DNA. Proc Natl<br />

Acad Sci 74(2): 560-564<br />

Meldrum, D. (2000) Automation for genomics, part two: sequencers,<br />

microarrays, and future trends. Genome Res 10: 1288-1303<br />

Mullis, K (1990) The unusual origin of the polymerase chain reaction. Sci Am<br />

262(4):56-65<br />

Myers, G. (1999) Whole-genome DNA sequencing. Computing in Science &<br />

Engineering. IEEE pp. 33-43<br />

Olson, M. (1993) The human genome project. Proc Natl Acad Sci, USA. 90:<br />

4338-4344<br />

Prober, J. et al., (1987) A system for rapid DNA sequencing with fluorescent<br />

chain-terminating di<strong>de</strong>oxynucleoti<strong>de</strong>s. Science. 238: 336-341<br />

Rosenblum, B., L. Lee, S. Spurgeon, S. Khan, S. Menchen, C Heiner, and S.<br />

Chen (1997) New dye-labeled terminators for improved DNA sequencing<br />

patterns. Nucleic Acids Res 25(22):4500-4504<br />

Sanger, F., S. Nicklen, and A.R. Coulson (1977) DNA sequencing with chain<br />

terminating inhibitors. Proc Natl Acad Sci 74(12): 5463-5467<br />

Sanger, F. and A.R. Coulson (1978) The use of thin acrylami<strong>de</strong> gels for DNA<br />

sequencing. FEBS Lett 87(1): 107-110<br />

Sanger, F. (1988) Early nucleic acid chemistry. Trends Biochem Sci 13: 67-69<br />

45


Schlenk, F., (1988).Early nucleic acid chemistry, Trends Biochem. Sci., 13:<br />

67-69<br />

Smith, L., S. Fung, M. Hunkapiller, T. Hunkapiller, and L Hood (1985) The<br />

synthesis of oligonucleoti<strong>de</strong>s containing an aliphatic amino group at the<br />

5’ terminus: synthesis of fluorescent DNA primers for use in DNA<br />

sequence analysis. Nucleic Acids Res. 13(7): 2399-2412<br />

Smith, L. J. Sandlers, R. Kaiser, P. Hughes, C. Dodd, C. Connell, C. Heiner, S.<br />

Kent, and L. Hood (1986) Fluorescence <strong>de</strong>tection in automated DNA<br />

sequence analysis. Nature 321: 64-69<br />

Stewart, P. R. and D. Letham (1977), The ribonucleic acids, 2 nd Ed., Springer<br />

Verlag, NY, EUA, pp. 374.<br />

Tabor, S. and C. Richardson (1995) A single residue in DNA polymerases of<br />

the Escherichia coli DNA polymerase I family is critical for distinguishing<br />

between <strong>de</strong>oxy and di<strong>de</strong>oxyribonucleoti<strong>de</strong>s. Proc Natl Acad Sci, USA 92:<br />

6339-6343<br />

Tahara, T., J. Kraus, and L. Rosenberg (1990) Direct DNA sequencing of PCR<br />

Amplified genomic DNA by the Maxam-Gilbert method. BioTechniques<br />

8(4): 366-367<br />

Tang, K., P. Oeth, S. Kammerer, M. Denissenko, J. Ekblom, C. Jurinke, D. van<br />

<strong>de</strong>n Boom, A. Braun, and C. Cantor. (2004) Minin Disease<br />

susceptibility genes through SNP analyses and expression profiling<br />

using MALDI-TOF máss spectrometry. J. Proteome Res 3(2): 218-227<br />

Venter, C. et al. (2001) The sequence of the human genome. Science 291:<br />

1304-1351<br />

Voet, D. and J. Voet, (1995) Biochemistry, 2 nd Ed. John Wiley and Sons, Inc.<br />

NY, EUA<br />

Wang, D. et al. (1998) Large-scale i<strong>de</strong>ntification, mapping, and genotyping of<br />

single nucleoti<strong>de</strong> polymorphisms in the human genome. Science 280:<br />

1077-1082<br />

Watson, J. and F. Crick.(1953) Molecular structure of nucleic acids: structure for<br />

<strong>de</strong>oxyribose nucleic acids. Nature, 171: 737-738<br />

46


Weber, J. and E. Myers (1997) Human Whole-genome shotgun sequencing.<br />

Genome Res 7: 401-409<br />

Yager, T., L. Baron, R. Batra, A. Bouevitch, D. Chan, K. Chan, S. Darasch, R.<br />

Gilchrist, A. Izmailov, J. Lacroix, K. Marchellata, J. Renfrew, D. Rushlow,<br />

E. Stinbach, C. Ton, P. Waterhouse, H. Zaleski, J. Dunn, and J. Stevens<br />

(1999) High performance DNA sequencing, and the <strong>de</strong>tection of<br />

mutations and polymorphisms on the Clipper sequencer. Electophoresis<br />

20: 1280-1300<br />

Zimmermann, J., S. Wirmann, H. Voss, C. Schwager, and W. Ansorge (1994)<br />

Improved fluorescent cycle sequencing protocol allows reading nearly<br />

1000 bases. BioTechniques 17(2): 302-305<br />

47

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!