secuenciación de ácidos nucleicos - Instituto de Biotecnología - UNAM
secuenciación de ácidos nucleicos - Instituto de Biotecnología - UNAM secuenciación de ácidos nucleicos - Instituto de Biotecnología - UNAM
INSTITUTO DE BIOTECNOLOGÍA-UNAM MÉTODOS FISICOQUÍMICOS EN BIOTECNOLOGÍA: SECUENCIACIÓN DE ÁCIDOS NUCLEICOS PROYECTO DE INVESTIGACIÓN: ROSALIA DE NECOCHEA CAMPION JUAN CARLOS CANUL TEC CUERNAVACA,MOR JUNIO 2004
- Page 2 and 3: INDICE Algunos acontecimientos rele
- Page 4 and 5: Algunos acontecimientos relevantes
- Page 6 and 7: 1.0 INTRODUCCIÓN. El lento y tortu
- Page 8 and 9: quedó en el anaquel del laboratori
- Page 10 and 11: sucesores, sin embargo, cada contri
- Page 12 and 13: Figura 3. Representación esquemát
- Page 14 and 15: las de los exones. Esta molécula d
- Page 16 and 17: desarrolló un sistema bidimensiona
- Page 18 and 19: Después de 1975, se realizó un pr
- Page 20 and 21: 1 2 3 4 Figura 4. El método de Max
- Page 22 and 23: terminador (ddNTP), se pueden gener
- Page 24 and 25: 4.1.1 La técnica de PCR y su relev
- Page 26 and 27: El uso de la Klenow para generar fr
- Page 28 and 29: ADN y no existen muchas posibilidad
- Page 30 and 31: (Zimmmerman et al., 1994). Esto fue
- Page 32 and 33: Figura 8. Esta secuenciadora tiene
- Page 34 and 35: 4.2.2 Métodos directos Estos méto
- Page 36 and 37: Tabla 2- Algunas de las enzimas que
- Page 38 and 39: 5.2 Estrategias para la secuenciaci
- Page 40 and 41: 2001). Tal vez, esta razón es sufi
- Page 42 and 43: 6.0 El FUTURO DE LA SECUENCIACION 6
- Page 44 and 45: 7.0 REFERENCIAS Ansorge, W., B. Spr
- Page 46 and 47: Kempe, T., W. Sundquist, F. Chow, a
- Page 48: Weber, J. and E. Myers (1997) Human
INSTITUTO DE BIOTECNOLOGÍA-<strong>UNAM</strong><br />
MÉTODOS FISICOQUÍMICOS EN BIOTECNOLOGÍA:<br />
SECUENCIACIÓN<br />
DE ÁCIDOS NUCLEICOS<br />
PROYECTO DE INVESTIGACIÓN:<br />
ROSALIA DE NECOCHEA CAMPION<br />
JUAN CARLOS CANUL TEC<br />
CUERNAVACA,MOR JUNIO 2004
INDICE<br />
Algunos acontecimientos relevantes al <strong>de</strong>sarrollo <strong>de</strong> los 3<br />
métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong><br />
1.0 INTRODUCCIÓN 5<br />
1.1 Los orígenes <strong>de</strong> la investigación <strong>de</strong> los <strong>ácidos</strong> nucleícos 6<br />
1.2 La i<strong>de</strong>ntificación <strong>de</strong> los componentes 7<br />
1.3 El <strong>de</strong>scubrimiento <strong>de</strong> la estructura <strong>de</strong>l ADN 8<br />
2.0 FUNDAMENTOS TEÓRICOS 11<br />
2.1 Estructura <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> 11<br />
2.2 Función biológica <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> 12<br />
3.0 DESARROLLO HISTÓRICO 13<br />
3.1 Secuenciación <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> 13<br />
3.2 El método <strong>de</strong> <strong>de</strong>gradación química 17<br />
3.2.1 Ventajas y <strong>de</strong>sventajas 19<br />
3.3 El método enzimático 20<br />
3.3.1 Limitaciones <strong>de</strong>l método enzimático 21<br />
4.0 MÉTODOS CONTEMPORÁNEOS EN LA SECUENCIACIÓN 22<br />
4.1 Automatización <strong>de</strong>l método <strong>de</strong> Sanger 22<br />
4.1.1 La técnica <strong>de</strong> PCR y su relevancia a la <strong>secuenciación</strong> 23<br />
4.1.2 Polimerasa Taq 24<br />
4.1.3 Marcado <strong>de</strong> la ca<strong>de</strong>na <strong>de</strong> ADN 25<br />
4.1.4 Incorporación <strong>de</strong>l marcaje a la ca<strong>de</strong>na <strong>de</strong> ADN 26<br />
4.1.5 Secuenciación automatizada 28<br />
4.1.6 El <strong>de</strong>sarrollo <strong>de</strong> maquinas <strong>de</strong> <strong>secuenciación</strong> 29<br />
4.2 Secuenciación <strong>de</strong> ARN 31<br />
4.2.1 Métodos indirectos 31<br />
4.2.2 Métodos directos 33<br />
4.3 Resumen <strong>de</strong> enzimas utilizadas en la <strong>secuenciación</strong> 34<br />
5.0 ESTRATEGIAS Y APLICACIONES DE LA SECUENCIACIÓN DE 35<br />
ÁCIDOS NUCLEICOS<br />
5.1 Proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano 35<br />
5.2 Estrategias para la <strong>secuenciación</strong> <strong>de</strong> fragmentos gran<strong>de</strong>s 37<br />
5.2.1 “Chromosome Walking” 37<br />
5.2.2 “Shotgun Sequencing” 38<br />
5.3 Otras aplicaciones 40<br />
6.0 El FUTURO DE LA SECUENCIACION 41<br />
6.1 Secuenciación por hibridización 41<br />
6.2 Secuenciación a futuro sin fragmentación <strong>de</strong> ADN 41<br />
7.0 REFERENCIAS 43<br />
1
Figuras<br />
INDICE DE TABLAS Y FIGURAS<br />
Figura 1. Las bases presentes en los <strong>ácidos</strong> <strong>nucleicos</strong> 7<br />
Figura 2. Estructura química <strong>de</strong> los nucleótidos 8<br />
Figura 3. Estructura <strong>de</strong> la doble hélice <strong>de</strong>l ADN 11<br />
Figura 4. El método <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> Maxam y Gilbert 19<br />
Figura 5. Enzimas <strong>de</strong> restricción 20<br />
Figura 6. El método <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> Sanger 21<br />
Figura 7. La reacción <strong>de</strong> PCR 23<br />
Figura 8. Secuenciadora con <strong>de</strong>tección paralela para 96 caplilares 31<br />
Figura 9. La secuenciadora ABI PRISM 3700 32<br />
Figura 10. La estrategia <strong>de</strong> “chromosome walking” 38<br />
Figura 11. La estrategia <strong>de</strong> <strong>secuenciación</strong> “shotgun” 39<br />
Figura 12. Secuenciación por hibridización 41<br />
Tablas<br />
Tabla 1. 22<br />
Descubrimientos significativos que permitieron el <strong>de</strong>sarrollo <strong>de</strong> métodos<br />
automatizados <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong><br />
Tabla 2. 35<br />
Algunas <strong>de</strong> las enzimas que han tenido un papel importante<br />
en el <strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong><br />
2
Algunos acontecimientos relevantes al <strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong><br />
<strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> nucleícos<br />
1871. Johann Meisher <strong>de</strong>scribe el ácido <strong>de</strong>soxirribonucleico (ADN) en el<br />
esperma <strong>de</strong> la trucha.<br />
1944. Oswald Avery, Colin McLeod y Macyln McCarthy <strong>de</strong>muestran que el ADN<br />
es la substancia en don<strong>de</strong> resi<strong>de</strong> la información genética.<br />
1950. Erwin Chargaff <strong>de</strong>termina que las cantida<strong>de</strong>s <strong>de</strong> a<strong>de</strong>nina y timina, y <strong>de</strong><br />
citosina y guanina, son las mismas en el ADN: “reglas <strong>de</strong> Chargaff”.<br />
1952. Rosalind Franklin y Maurice Wilkins llevan a cabo estudios <strong>de</strong><br />
cristalografía <strong>de</strong> rayos X <strong>de</strong>l ADN.<br />
1953. James Watson y Francis Crick proponen el mo<strong>de</strong>lo <strong>de</strong> la doble hélice <strong>de</strong>l<br />
ADN.<br />
1958. Matthew Meselson y Frank Stahl <strong>de</strong>muestran que la replicación <strong>de</strong>l ADN<br />
es semiconservativa.<br />
1960. Arthur Kornberg <strong>de</strong>scubre y aísla la enzima ADN polimerasa.<br />
1961. Marshall Niremberger y Severo Ochoa establecen el código genético<br />
universal.<br />
1968. Matthew Meselson y Robert Yuan aíslan la primera endonucleasa <strong>de</strong><br />
restricción.<br />
1977. Allan Maxam y Walter Gilbert, y Fre<strong>de</strong>rick Sanger et al., <strong>de</strong>sarrollan<br />
simultáneamente métodos para la <strong>de</strong>terminación <strong>de</strong> la secuencia <strong>de</strong><br />
nucleótidos <strong>de</strong>l ADN.<br />
1978. F. Sanger y su equipo reportan la secuencia genómica completa <strong>de</strong>l<br />
virus øX174.<br />
1981. Se reporta la secuencia <strong>de</strong>l genoma <strong>de</strong> la mitocondria humana.<br />
1983. Marvin Carruthers y Leroy Hood <strong>de</strong>sarrollan un método para secuenciar<br />
automáticamente fragmentos <strong>de</strong> ADN <strong>de</strong> 5 a 75 pares <strong>de</strong> bases.<br />
3
1986. Leroy Hood y Lloyd Smith <strong>de</strong>sarrollan el primer secuenciador automático,<br />
que usa un láser que reconoce marcadores <strong>de</strong> fluorescencia en el ADN.<br />
1987. Kary Mullis <strong>de</strong>sarrolla la técnica <strong>de</strong> PCR que permite amplificar millones<br />
<strong>de</strong> veces fragmentos específicos <strong>de</strong> ADN.<br />
1988. Por iniciativa <strong>de</strong> Watson, el <strong>Instituto</strong> Nacional <strong>de</strong> Salud en EUA,<br />
establece la Oficina para la Investigación <strong>de</strong>l Genoma Humano.<br />
1990. Tres grupos <strong>de</strong>sarrollan simultáneamente el método <strong>de</strong> electroforesis<br />
capilar, que optimiza la automatización <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />
ADN.<br />
Se inicia el Proyecto <strong>de</strong>l Genoma Humano.<br />
1995. Se reporta la primera secuencia completa <strong>de</strong>l genoma <strong>de</strong> un organismo<br />
vivo, el <strong>de</strong> la bacteria Haemophilus influenzae.<br />
1996. Se reporta la primera secuencia <strong>de</strong>l genoma <strong>de</strong> un eucarionte, el <strong>de</strong> la<br />
levadura Saccharomyces cerevisiae.<br />
1998. Se reporta la primera secuencia <strong>de</strong>l genoma <strong>de</strong> un animal; el <strong>de</strong><br />
Caenorhabditis elegans.<br />
1999. Se reporta la secuencia nucleotídica <strong>de</strong>l cromosoma humano 22.<br />
2000. Se reporta la primera secuencia <strong>de</strong>l genoma <strong>de</strong> una planta, el <strong>de</strong><br />
Arabidopsis thaliana.<br />
2001. Se reporta por dos grupos en forma simultánea, la secuencia<br />
nucleotídica <strong>de</strong>l genoma humano.<br />
2002. Se reportan las secuencias nucleotídicas <strong>de</strong> los genomás <strong>de</strong>l ratón (Mus<br />
musculus) y <strong>de</strong>l arroz (Oryza sativa).<br />
4
1.0 INTRODUCCIÓN.<br />
El lento y tortuoso progreso que acompañó los inicios <strong>de</strong> la investigación <strong>de</strong> los<br />
<strong>ácidos</strong> <strong>nucleicos</strong> es representativo <strong>de</strong> lo limitado <strong>de</strong> las técnicas y la falta <strong>de</strong><br />
facilida<strong>de</strong>s en los períodos tempranos <strong>de</strong> la bioquímica. Las dificulta<strong>de</strong>s<br />
encontradas por los investigadores fueron muchas. Era difícil asegurar la<br />
homogeneidad <strong>de</strong>l material <strong>de</strong> trabajo. No existían métodos establecidos para<br />
el estudio <strong>de</strong> macromoléculas, y tampoco pautas para el aislamiento <strong>de</strong><br />
unida<strong>de</strong>s estructurales. Afortunadamente, algunas substancias cercanamente<br />
relacionadas fueron sintetizadas por químicos orgánicos en experimentos que<br />
usualmente no estaban relacionados con los <strong>ácidos</strong> <strong>nucleicos</strong>. Si la<br />
investigación <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> <strong>de</strong>be mucho a la química orgánica en su<br />
período inicial, el trabajo conjunto <strong>de</strong> la biología y la química han hecho <strong>de</strong> la<br />
investigación contemporánea <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> una rica fuente <strong>de</strong><br />
<strong>de</strong>scubrimiento e invención que ha transformado y mejorado la condición<br />
humana.<br />
En general, los <strong>ácidos</strong> <strong>nucleicos</strong> son polímeros lineales <strong>de</strong> nucleótidos.<br />
Pue<strong>de</strong>n tener <strong>de</strong>s<strong>de</strong> 80 nucleótidos, como en el tARN, hasta más <strong>de</strong> 10 8 pares<br />
<strong>de</strong> nucleótidos en un cromosoma eucariótico. El cromosoma <strong>de</strong> Escherichia<br />
coli tiene 4 x 10 6 pares <strong>de</strong> bases, 4Mpb. El ADN genómico <strong>de</strong> una sola célula<br />
humana tiene 3,900 Mpb. A un laboratorio <strong>de</strong> la mitad <strong>de</strong> la década <strong>de</strong> los<br />
setentas le habría tomado dos meses secuenciar 150 nucleótidos.<br />
Actualmente, un laboratorio especializado es capaz <strong>de</strong> secuenciar varios<br />
millones <strong>de</strong> nucleótidos al día. Des<strong>de</strong> esta perspectiva, resulta notoria la<br />
capacidad <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> <strong>de</strong> las tecnologías disponibles<br />
actualmente. Y es principalmente, el <strong>de</strong>sarrollo y la automatización <strong>de</strong> los<br />
métodos fisicoquímicos <strong>de</strong> macromoléculas biológicas, en general, lo que ha<br />
permitido lograr estos avances en el conocimiento <strong>de</strong>l material genético.<br />
A finales <strong>de</strong>l siglo pasado, se secuenciaron los primeros genomás,<br />
correspondientes a las bacterias Haemophilus Influenzae y Mycobacterium<br />
genitalium. Esfuerzos más recientes han permitido la <strong>de</strong>terminación <strong>de</strong><br />
secuencias genómicas más complejas. El primer eucarionte secuenciado fue<br />
Saccharomyces cerevisiae. Posteriormente se reportaron las secuencias <strong>de</strong> los<br />
genomás <strong>de</strong> Caenorhabditis elegans, <strong>de</strong> Drosophila melanogaster y <strong>de</strong><br />
Arabidopsis thaliana. A principios <strong>de</strong>l año 2001, dos grupos, <strong>de</strong> manera<br />
simultánea e in<strong>de</strong>pendiente, reportaron la secuencia <strong>de</strong>l genoma humano, y a<br />
fines <strong>de</strong>l año 2002 se reportó el genoma <strong>de</strong>l ratón y <strong>de</strong>l arroz.<br />
5
Con la <strong>de</strong>terminación <strong>de</strong> la secuencia nucleotídica <strong>de</strong>l genoma humano y<br />
la <strong>de</strong> otros organismos nos hemos a<strong>de</strong>ntrado en el conocimiento <strong>de</strong> la célula.<br />
Conociendo la secuencia <strong>de</strong> todos los genes <strong>de</strong> un organismo, es posible<br />
<strong>de</strong>ducir su proteoma. Asimismo, con la información que se tiene, es posible<br />
empezar el estudio integral y global <strong>de</strong> las re<strong>de</strong>s metabólicas y conocer la<br />
manera en que una célula regula la expresión genética en diferentes<br />
condiciones metabólicas. Sin embargo, este nuevo conocimiento es preliminar.<br />
Si bien po<strong>de</strong>mos enlistar todos los genes <strong>de</strong> una célula, la <strong>de</strong>terminación <strong>de</strong> las<br />
posibles interacciones entre sus productos es una meta a largo plazo todavía.<br />
Hay, pues, mucho más que conocer para enten<strong>de</strong>r el proceso mismo <strong>de</strong> la<br />
vida.<br />
En este trabajo se expone una breve perspectiva histórica <strong>de</strong> algunos <strong>de</strong><br />
los hechos que han repercutido sensiblemente en el avance <strong>de</strong> las tecnologías<br />
para la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> nucleícos. Des<strong>de</strong> el tortuoso camino que<br />
llevo a la elucidación <strong>de</strong> la estructura <strong>de</strong> la doble hélice, pasando por los<br />
esfuerzos iniciales para <strong>de</strong>sentrañar el lenguaje <strong>de</strong>l ADN (y <strong>de</strong> la vida) y los<br />
esfuerzos más recientes que inauguraron la era <strong>de</strong> la genómica. Una mirada<br />
hacia atrás siempre es importante, no sólo porque ayuda a consolidar los<br />
conceptos <strong>de</strong> una materia en particular, sino también porque se pue<strong>de</strong><br />
apren<strong>de</strong>r <strong>de</strong> las experiencias <strong>de</strong> otros. A<strong>de</strong>más, se presentan los fundamentos<br />
teóricos y físicos relacionados con la química <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.y su<br />
<strong>secuenciación</strong>. Finalmente, se citan algunas <strong>de</strong> las aplicaciones que han<br />
permitido profundizar en el conocimiento <strong>de</strong>l material genético <strong>de</strong> las células.<br />
1.1 Los orígenes <strong>de</strong> la investigación <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />
La historia <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> iniciando en 1869, con los estudios<br />
<strong>de</strong>l bioquímico sueco Friedrich Miescher. En Tuebingen, Miescher extrajo un<br />
material <strong>de</strong> una fracción nuclear <strong>de</strong> leucocitos presentes en pus obtenido <strong>de</strong><br />
vendajes quirúrgicos. El material extraído, al cual <strong>de</strong>nomino nucleína, era rico<br />
en fósforo. En 1870, Miescher se movió a Basel, don<strong>de</strong> encontró que el<br />
extracto <strong>de</strong> esperma <strong>de</strong> salmón era una gran fuente <strong>de</strong> nucleína. La nucleína<br />
era una substancia albuminoi<strong>de</strong> y fuertemente ácida, combinada con una base<br />
nitrogenada que Miescher cristalizó y llamo protamina. De hecho, la nucleína<br />
era en realidad una nucleoproteína. Richard Altmann (1889) obtuvo el primer<br />
material libre <strong>de</strong> proteína, al cual dio el nombre <strong>de</strong> ácido nucleico. Jules<br />
Piccard, compañero <strong>de</strong> Miescher en Basel, hizo más estudios con la nucleína y<br />
encontró que también contenía guanina e hipoxantina. Sin embargo, ni<br />
Meischer, ni sus colegas y sucesores se imaginaron que el ácido nucleico<br />
pudiera llevar mensajes complejos en patrones repetidos <strong>de</strong> componentes más<br />
pequeños (Levine y Suzuki, 2000). La botella con el inocente polvo blanco se<br />
6
quedó en el anaquel <strong>de</strong>l laboratorio. Tuvieron que pasar varias décadas para<br />
revelar que, <strong>de</strong> hecho, era una botella <strong>de</strong> genes.<br />
1.2 La i<strong>de</strong>ntificación <strong>de</strong> los componentes.<br />
Lentamente se fueron llevando a cabo estudios más exactos para la<br />
i<strong>de</strong>ntificación <strong>de</strong> los componentes <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>. La guanina (G)<br />
había sido aislada <strong>de</strong>l guano; sin embargo, su relación con los <strong>ácidos</strong> <strong>nucleicos</strong><br />
se estableció hasta 1910, al compararla con el nucleósido que Phoebus<br />
Levene obtuvo <strong>de</strong>l ácido guanílico. Albrecht Kossel y A. Neumann aislaron la<br />
a<strong>de</strong>nina (A) y la timina (T) <strong>de</strong> la glándula <strong>de</strong>l timo. Ascoli y Steu<strong>de</strong>l<br />
<strong>de</strong>scubrieron la citosina (C) y el uracilo (U) (Schlenk, 1988).<br />
La ribosa y la <strong>de</strong>soxirribosa fueron aisladas por Levene en 1909 y 1930,<br />
respectivamente. En ambos casos, el aislamiento <strong>de</strong> los nucleósidos fue un<br />
requisito para proveer el material inicial. La hidrólisis con piridina <strong>de</strong>l ácido<br />
nucleico <strong>de</strong> levadura produjo fosfatos y los nucleósidos a<strong>de</strong>nosina, citosina,<br />
guanosina y uridina. Levene <strong>de</strong>terminó que en todos los nucleósidos la pentosa<br />
era una ribosa y nombró al ácido original como ácido ribonucleico (ARN). Los<br />
nucleósidos fueron i<strong>de</strong>ntificados como <strong>de</strong>rivados <strong>de</strong> las bases A, C, G y U<br />
(figura 1). En 1929, Levene i<strong>de</strong>ntificó la <strong>de</strong>soxirribosa <strong>de</strong>l ácido nucleico aislado<br />
<strong>de</strong>l tejido <strong>de</strong> la pantorrilla, al cual <strong>de</strong>nominó ácido <strong>de</strong>soxirribonucleico (ADN).<br />
Este ácido exhibía una mayor resistencia a la hidrólisis química que el ARN, y<br />
consiguió <strong>de</strong>gradarlo con enzimás, seguido <strong>de</strong> la hidrólisis ácida <strong>de</strong> sus<br />
<strong>de</strong>soxinucleótidos.<br />
En 1935, se <strong>de</strong>scubrió que el ADN podría ser cortado enzimáticamente<br />
en mononucleótidos, en presencia <strong>de</strong> arsenato. Usando este procedimiento,<br />
Klein y Thannhauser obtuvieron los <strong>de</strong>soxirribonucleótidos y establecieron que<br />
cada nucleótido está unido por un enlace fosfodiéster <strong>de</strong>l hidroxilo 5´ al<br />
hidroxilo 3´ <strong>de</strong> su otro vecino (figura 2).<br />
Figura 1. Las bases presentes en los<br />
<strong>ácidos</strong> <strong>nucleicos</strong>. Las bases guanina<br />
(G), a<strong>de</strong>nina (A) y citosina (C) existen<br />
en el ADN y el ARN. La timina (T) sólo<br />
se encuentra en el ADN y es<br />
substituida en el ARN por el uracilo<br />
(U). Estas bases están unidas<br />
covalentemente a los azúcares<br />
<strong>de</strong>soxirribosa y ribosa, para formar<br />
así los nucleótidos <strong>de</strong>l ADN y ARN,<br />
respectivamente (ver figura 3).<br />
7
De manera lenta y errática, las i<strong>de</strong>as provenientes <strong>de</strong> diversos campos<br />
empezaron a señalar al ADN como un participante <strong>de</strong> importancia en la vida <strong>de</strong><br />
la célula. El trabajo <strong>de</strong> Fred Griffith en 1928 y el <strong>de</strong> los investigadores Oswald<br />
Avery, Colin McLeod y Macyln McCarthy, en 1944, permitió <strong>de</strong>mostrar<br />
inequívocamente que la información genética resi<strong>de</strong> en el ADN. Esta<br />
contribución dio lugar a que un importante esfuerzo científico se enfocara en la<br />
<strong>de</strong>terminación <strong>de</strong> la composición y la estructura química <strong>de</strong> la molécula <strong>de</strong>l<br />
ADN. Pese a lo anterior, durante algún tiempo muchos bioquímicos insistieron<br />
en que el ADN era una molécula <strong>de</strong>másiado “tonta” como para llevar mucha<br />
información; los componentes <strong>de</strong>l ADN parecían muy simples y repetitivos<br />
como para ser portadores <strong>de</strong> información.<br />
Figura 2. Estructura<br />
química <strong>de</strong> los (a)<br />
ribonucleótidos y (b)<br />
<strong>de</strong>soxirribonucleótidos<br />
, constituyentes <strong>de</strong> los<br />
<strong>ácidos</strong> <strong>nucleicos</strong>. En el<br />
ARN, el C-1´ <strong>de</strong> la Dribosa<br />
está unido al N-<br />
9 <strong>de</strong> A o G, o al N-1 <strong>de</strong><br />
C o U. En el ADN, la 2´<strong>de</strong>soxi-D-ribosa<br />
está<br />
unida <strong>de</strong> la misma forma a las cuatro bases, pero la T toma el lugar <strong>de</strong>l U (los<br />
números con til<strong>de</strong> se refieren a los átomos <strong>de</strong> la pentosa; los números sin til<strong>de</strong> se<br />
refieren a los <strong>de</strong> la base nitrogenada). Los grupos fosfato pue<strong>de</strong>n estar unidos al<br />
C3´ o al C5´ <strong>de</strong> la pentosa. Si el grupo fosfato está ausente, el compuesto es un<br />
nucleósido. En todos los nucleótidos y nucleósidos naturales, el enlace Nglicosídico<br />
que une la base nitrogenada al C1´ <strong>de</strong>l azúcar es <strong>de</strong> configuración _<br />
(Voet & Voet, 1995).<br />
1.3 El <strong>de</strong>scubrimiento <strong>de</strong> la estructura <strong>de</strong>l ADN.<br />
A mediados <strong>de</strong>l siglo pasado, los investigadores no pudieron avanzar<br />
más en la elucidación <strong>de</strong> la estructura primaria <strong>de</strong>l ADN. Ninguno <strong>de</strong> los<br />
requerimientos claves para la <strong>de</strong>terminación <strong>de</strong> la secuencia estaba a la mano:<br />
no habían métodos para obtener muestras puras <strong>de</strong> ADN con una secuencia<br />
<strong>de</strong> bases homogénea, y tampoco estaban disponibles métodos para el corte <strong>de</strong><br />
ca<strong>de</strong>nas <strong>de</strong> ADN en una base específica. Consecuentemente, toda la atención<br />
se centró en la estructura secundaria.<br />
Dos experimentos in<strong>de</strong>pendientes <strong>de</strong>mostraron que el ADN poseía una<br />
estructura secundaria or<strong>de</strong>nada. Ambos <strong>de</strong>jaron información vital para sus<br />
8
sucesores, sin embargo, cada contribución tenía un error. En 1938, William<br />
Astbury obtuvo un patrón <strong>de</strong> difracción <strong>de</strong> rayos-x <strong>de</strong> fibras secas <strong>de</strong> ADN, y<br />
<strong>de</strong>dujo que el espacio <strong>de</strong> 3.34 Å a lo largo <strong>de</strong>l eje <strong>de</strong> la fibra correspondía al <strong>de</strong><br />
una sucesión cercana <strong>de</strong> nucleótidos planos. Éstos sobresalían<br />
perpendicularmente a lo largo <strong>de</strong>l eje <strong>de</strong> la molécula para formar una estructura<br />
relativamente rígida. Algunos años <strong>de</strong>spués, J. Gulland estudió la viscosidad y<br />
la birrefringencia <strong>de</strong> flujo <strong>de</strong>l ADN y postuló la presencia <strong>de</strong> puentes <strong>de</strong><br />
hidrógeno que unían a los grupos hidroxilo <strong>de</strong> la piridina y la purina y a algunos<br />
<strong>de</strong> los grupos aminos. Desafortunadamente, utilizó las formás tautoméricas<br />
enol para la timina y la guanina. La importancia <strong>de</strong> las formás tautoméricas<br />
correctas (ceto), se reconoció hasta 1953.<br />
Erwin Chargaff estudió la composición <strong>de</strong>l ADN <strong>de</strong> una amplia variedad<br />
<strong>de</strong> fuentes. Mediante cromatografía en papel separó los productos <strong>de</strong> la<br />
hidrólisis <strong>de</strong>l ADN y con espectroscopia ultravioleta cuantificó sus abundancias<br />
relativas. Sus datos mostraron que la proporción <strong>de</strong> purinas (A+G) siempre es<br />
igual a la proporción <strong>de</strong> pirimidinas (C-T) en el ADN <strong>de</strong> cualquier organismo.<br />
Aunque la proporción (G+C)/(A+T) varía <strong>de</strong> especie a especie, diferentes<br />
tejidos <strong>de</strong> una sola especie tienen la misma composición <strong>de</strong> ADN. Cualquier<br />
estructura propuesta para el ADN tenía que consi<strong>de</strong>rar este patrón (figura 3).<br />
Los patrones <strong>de</strong> difracción <strong>de</strong> rayos X realizados por Rosalind Franklin y<br />
Maurice Wilkins revelaron que el ADN podía tener dos estructuras secundarias<br />
posibles, cuya formación <strong>de</strong>pendía <strong>de</strong> la humedad relativa a la cual se<br />
obtuvieran los datos. La forma A <strong>de</strong>l ADN se obtuvo a baja humedad. En<br />
cambio, el patrón <strong>de</strong>l B-ADN prevalece a una humedad elevada. Éste patrón<br />
entrecruzado, representativo <strong>de</strong> las estructuras helicoidales, tiene una fuerte<br />
reflexión a 0.34 nm, que indica el espaciamiento entre los pares <strong>de</strong> bases<br />
adyacentes, y una reflexión a 3.4 nm que correspon<strong>de</strong> a un giro completo <strong>de</strong> la<br />
hélice. Franklin propuso que este comportamiento requería que los grupos<br />
fosfatos estuvieran expuestos al agua en el exterior <strong>de</strong> la hélice, con el<br />
corolario <strong>de</strong> que las bases estuvieran en el interior <strong>de</strong> la hélice.<br />
En 1953, James Watson y Francis Crick <strong>de</strong>scifraron la estructura <strong>de</strong>l<br />
ADN. Watson propuso que el número <strong>de</strong> nucleótidos en la célula unitaria<br />
cristalográfica favorecía una hélice <strong>de</strong> doble ca<strong>de</strong>na. Crick <strong>de</strong>dujo <strong>de</strong> los datos<br />
<strong>de</strong>l patrón <strong>de</strong> difracción que la estructura era una díada, es <strong>de</strong>cir, que tiene una<br />
asimetría tal que las ca<strong>de</strong>nas equivalentes son antiparalelas, es <strong>de</strong>cir, corren<br />
en direcciones opuestas a lo largo <strong>de</strong>l eje longitudinal. Sólo quedaba por<br />
resolver un problema: cómo construir el núcleo <strong>de</strong> la hélice, empacando las<br />
bases juntas en una estructura regular. A partir <strong>de</strong> las conclusiones <strong>de</strong> Gulland,<br />
Watson sabía que los puentes <strong>de</strong> hidrógeno unían las bases <strong>de</strong>l ADN. Esto lo<br />
9
convenció <strong>de</strong> que la esencia <strong>de</strong> la cuestión tenía que ser una regla que<br />
gobernara los puentes <strong>de</strong> hidrógeno entre las bases.<br />
Aconsejado por Jerry Donohue, Watson manipuló mo<strong>de</strong>los <strong>de</strong> las bases,<br />
en las formás tautoméricas ceto, apareando la A con la T y la G con la C.<br />
Encontró una relación simple y convincente que involucraba dos puentes <strong>de</strong><br />
hidrógeno para una pareja A·T y tres puentes <strong>de</strong> hidrógeno para una pareja<br />
G·C. La característica especial <strong>de</strong> este esquema <strong>de</strong> apareamiento <strong>de</strong> bases es<br />
que la geometría relativa <strong>de</strong> los enlaces uniendo las bases a las pentosas es<br />
virtualmente idéntico para los pares A·T y G·C. Resultó obvio que si una purina<br />
siempre se aparea con una pirimidina, entonces una secuencia irregular <strong>de</strong><br />
bases en una ca<strong>de</strong>na sencilla <strong>de</strong> ADN podría estar apareada regularmente en<br />
el centro <strong>de</strong> una doble hélice sin pérdida <strong>de</strong> simetría. Las reglas <strong>de</strong> Chargaff<br />
fueron reveladas directamente como una consecuencia obligatoria <strong>de</strong> una<br />
estructura <strong>de</strong> doble hélice para el ADN. Sobre todo, ya que la secuencia <strong>de</strong><br />
bases <strong>de</strong> una ca<strong>de</strong>na automáticamente <strong>de</strong>termina la <strong>de</strong> su pareja, Crick y<br />
Watson pudieron visualizar fácilmente cómo una ca<strong>de</strong>na sencilla podría ser el<br />
templado para la síntesis <strong>de</strong> una segunda ca<strong>de</strong>na <strong>de</strong> secuencia <strong>de</strong> bases<br />
complementaria (figura 3).<br />
El mo<strong>de</strong>lo <strong>de</strong> Watson y Crick <strong>de</strong> la estructura <strong>de</strong>l ADN fue aceptado<br />
rápidamente porque lograba dos cuestiones importantes. Primero, daba cuenta<br />
<strong>de</strong> toda la evi<strong>de</strong>ncia química y física disponible. Segundo, abría el camino para<br />
explicar, <strong>de</strong> manera más <strong>de</strong>tallada, como lleva a cabo el ADN las funciones<br />
necesarias para ser el portador <strong>de</strong> la información hereditaria. A partir <strong>de</strong> este<br />
momento, fue aparente que toda la información requerida para especificar la<br />
diversidad <strong>de</strong> las moléculas biológicas, necesaria para llevar a cabo las<br />
funciones <strong>de</strong> la célula, había que buscarla en la secuencia irregular <strong>de</strong> las<br />
bases nucleotídicas. Alexan<strong>de</strong>r Dounce, en 1950, postuló que el ARN era el<br />
templado que dirigía la síntesis <strong>de</strong> proteínas celulares y que una secuencia <strong>de</strong><br />
tres nucleótidos especificaba solo un aminoácido. El reconocimiento <strong>de</strong> varios<br />
tipos <strong>de</strong> ARN por Robert Holley no tardó en llegar. Más a<strong>de</strong>lante, Gobind<br />
Khorana sintetizó los 64 tri-ribonucleósidos difosfato y los poli-ribonucleótidos<br />
con secuencias repetidas <strong>de</strong> di-, tri- y tetranucleótidos que fueron usados como<br />
mARN para i<strong>de</strong>ntificar cada triplete <strong>de</strong>l código. Y el establecimiento <strong>de</strong>l código<br />
genético por Marshall Niremberg y Severo Ochoa fue el evento culminante.<br />
10
Figura 3. Representación esquemática <strong>de</strong> la estructura <strong>de</strong> la doble hélice <strong>de</strong>l ADN.<br />
En el texto se explica la configuración <strong>de</strong> la estructura.<br />
2.0 FUNDAMENTOS TEORICOS.<br />
2.1 Estructura <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />
El ADN es una doble hélice. Cada una <strong>de</strong> las hélices es un polímero<br />
integrado por millones <strong>de</strong> nucleótidos que son los monómeros <strong>de</strong>l polímero.<br />
Cada nucleótido está formado por una <strong>de</strong>soxirribosa, una base púrica o<br />
pirimídica y un grupo fosfato. Las dos ca<strong>de</strong>nas <strong>de</strong> ADN son antiparalelas y se<br />
unen entre sí a través <strong>de</strong> puentes <strong>de</strong> hidrógeno que se forman entre las bases<br />
complementarias (A·T y G·C) <strong>de</strong> las dos hebras <strong>de</strong>l ADN. De esta manera, se<br />
obtiene una estructura tipo doble hélice, don<strong>de</strong> las bases <strong>de</strong> los nucleótidos se<br />
encuentran orientadas hacia el interior, mientras que los grupos fosfato y las<br />
<strong>de</strong>soxirribosas lo hacen hacia el exterior, formando los esqueletos fosfodiéster<br />
<strong>de</strong> cada hélice (figura 3). Los pares <strong>de</strong> nucleótidos se encuentran separados<br />
entre sí por 3.4 Å, cada diez pares <strong>de</strong> nucleótidos (34 Å) se alcanza una vuelta<br />
<strong>de</strong> la hélice. La diferencia fundamental entre todas las moléculas <strong>de</strong> ADN que<br />
forman el material genético <strong>de</strong> los seres vivos es la secuencia <strong>de</strong> los millones<br />
<strong>de</strong> estos cuatro tipos <strong>de</strong> nucleótidos con sus bases A, T, G y C en cada<br />
molécula <strong>de</strong> ADN.<br />
11
Al igual que en el ADN, los estudios <strong>de</strong> la estructura <strong>de</strong>l ARN empezaron<br />
con su estructura primaria. Esta búsqueda se logró en paralelo que la <strong>de</strong>l ADN,<br />
pero tuvo la complejidad extra <strong>de</strong>l grupo hidroxilo 2´ <strong>de</strong> los ribonucleótidos. A<br />
diferencia <strong>de</strong>l ADN, las moléculas <strong>de</strong> ARN constan generalmente <strong>de</strong> ca<strong>de</strong>nas<br />
únicas <strong>de</strong> polinucleótido, <strong>de</strong>bido a que se forman copiando la secuencia <strong>de</strong><br />
bases <strong>de</strong> una ca<strong>de</strong>na <strong>de</strong> ADN. El apareamiento <strong>de</strong> las bases <strong>de</strong> Watson-Crick<br />
en el ARN es normal, aunque el tARN es una rica fuente <strong>de</strong> pares <strong>de</strong> bases<br />
inusuales. Hoy se sabe que el ARN tiene una mayor versatilidad estructural<br />
que el ADN en la variedad <strong>de</strong> sus especies, en la diversidad <strong>de</strong> sus<br />
conformaciones, y en su reactividad química. Los ARNs naturales pue<strong>de</strong>n<br />
formar estructuras <strong>de</strong> doble ca<strong>de</strong>na o adoptar una forma globular compuesta<br />
por pequeños dominios dobles conectados por segmentos <strong>de</strong> ca<strong>de</strong>na sencilla.<br />
Las dobles hélices <strong>de</strong>l ARN sólo pue<strong>de</strong>n adoptar la forma A, ya que el hidroxilo<br />
2´ <strong>de</strong> la ribosa constituye un impedimento estérico.<br />
2.2 Función biológica <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />
Las funciones <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> son <strong>de</strong> almacenamiento,<br />
expresión y replicación <strong>de</strong> la información biológica. En términos generales,<br />
todas las moléculas <strong>de</strong> ADN tienen una configuración similar. Sin embargo, el<br />
ADN <strong>de</strong> una <strong>de</strong>terminada especie <strong>de</strong> organismos tiene una secuencia <strong>de</strong><br />
bases propia: su estructura primaria está agrupada en unida<strong>de</strong>s funcionales<br />
llamadas genes. La información que contiene esta secuencia <strong>de</strong>sempeña<br />
diversas funciones. Los genes estructurales codifican para enzimás, proteínas<br />
estructurales y proteínas reguladoras. Otros tipos <strong>de</strong> genes codifican moléculas<br />
<strong>de</strong> ARN que no especifican la estructura primaria <strong>de</strong> un polipéptido, i.e., tARNs.<br />
El primer paso en la síntesis <strong>de</strong> proteínas es la síntesis <strong>de</strong> una molécula<br />
<strong>de</strong> ARN usando como mol<strong>de</strong> un segmento <strong>de</strong> una <strong>de</strong> las ca<strong>de</strong>nas <strong>de</strong>l ADN. En<br />
la transcripción, el or<strong>de</strong>n <strong>de</strong> los <strong>de</strong>soxirribonucleótidos <strong>de</strong> uno o varios genes<br />
se transfiere uno por uno a una secuencia <strong>de</strong> ribonucleótidos complementaria.<br />
Este proceso está mediado por la enzima ARN polimerasa; y al igual que la<br />
replicación <strong>de</strong>l ADN, siempre ocurre en la dirección 5' a 3'.<br />
Como los procariontes no tienen membrana nuclear, las moléculas <strong>de</strong><br />
ARN que se transcriben <strong>de</strong> los genes son inmediatamente traducidas a nivel <strong>de</strong><br />
los ribosomás para sintetizar las proteínas. En el caso <strong>de</strong> los eucariontes, los<br />
ARN transcritos son transportados <strong>de</strong>l núcleo al citoplasma, a través <strong>de</strong> la<br />
membrana nuclear. A<strong>de</strong>más, los genes <strong>de</strong> los eucariontes contienen intrones,<br />
estructuras <strong>de</strong> ADN que interrumpen la región <strong>de</strong>l gen que codifica para la<br />
proteína (exón). Al transcribirse un gen en los núcleos <strong>de</strong> las células <strong>de</strong> los<br />
eucariontes, el ARN resultante incluye tanto las regiones <strong>de</strong> los intrones como<br />
12
las <strong>de</strong> los exones. Esta molécula <strong>de</strong> ARN se “procesa” para dar lugar al mARN<br />
maduro que se exporta <strong>de</strong>l núcleo <strong>de</strong> la célula al citoplasma, don<strong>de</strong> luego se<br />
traduce en proteína.<br />
La información genética contenida en cada molécula <strong>de</strong> mARN se<br />
traduce en proteínas a través <strong>de</strong> un proceso enzimático que se realiza en los<br />
ribosomás. En la traducción participan principalmente tres tipos distintos <strong>de</strong><br />
ARN: el ARN ribosomal (rARN), que junto con varias proteínas forman los<br />
ribosomás; el ARN mensajero (mARN), que acarrea la información genética<br />
contenida en genes específicos <strong>de</strong>l ADN y los ARNs <strong>de</strong> transferencia (tARN),<br />
que sirven como adaptadores específicos para cada aminoácido durante el<br />
or<strong>de</strong>namiento lineal <strong>de</strong> éstos en la síntesis <strong>de</strong> proteínas, conforme la secuencia<br />
<strong>de</strong>l mARN.<br />
La síntesis <strong>de</strong> proteínas, que <strong>de</strong> facto es la traducción <strong>de</strong> la secuencia<br />
<strong>de</strong> nucleótidos presentes en el mARN, se lleva a cabo mediante la<br />
polimerización <strong>de</strong> amino<strong>ácidos</strong> en proteínas, a nivel <strong>de</strong> los ribosomás en<br />
dirección 5' a 3'. La secuencia <strong>de</strong>l mARN realiza la codificación en forma <strong>de</strong><br />
tripletes <strong>de</strong> bases (codones) <strong>de</strong> acuerdo con el código genético, incorporando<br />
en cada paso <strong>de</strong> lectura un aminoácido <strong>de</strong> la proteína. Cada tARN tiene una<br />
secuencia complementaria o anticodón para el codón <strong>de</strong>l aminoácido, que le<br />
permite reconocer el codón correcto sobre el mARN.<br />
3.0 DESARROLLO HISTORICO<br />
3.1 Secuenciación <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>.<br />
Inicialmente, se pensaba que la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong><br />
era mucho más difícil que la <strong>de</strong> las proteínas, y muy poco progreso se hizo<br />
hasta 1960. Esto se <strong>de</strong>bió, en parte, a la falta <strong>de</strong> substratos puros <strong>de</strong>l tamaño<br />
a<strong>de</strong>cuado, con los cuales <strong>de</strong>sarrollar los métodos y en parte, a la composición<br />
<strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>. Se esperaba que la interpretación <strong>de</strong> los resultados <strong>de</strong><br />
la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> (cuatro monómeros) fuera más difícil<br />
que el <strong>de</strong> las proteínas (20 amino<strong>ácidos</strong>), y se tendrían que aislar productos <strong>de</strong><br />
<strong>de</strong>gradación más gran<strong>de</strong>s para po<strong>de</strong>r traslaparlos y <strong>de</strong>ducir sus secuencias.<br />
Por otro lado, el hecho <strong>de</strong> tener cuatro componentes solamente, se pensaba,<br />
haría más fáciles los analices finales. Al inicio, la dificultad predominante fue la<br />
interpretación <strong>de</strong> los resultados, pero a medida que las técnicas se fueron<br />
mejorando y que se fueron estudiando moléculas más largas, la cuestión <strong>de</strong>l<br />
análisis empezó a ser más importante. Hoy, la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />
<strong>nucleicos</strong> es más rápida y simple que la <strong>secuenciación</strong> <strong>de</strong> proteínas.<br />
13
La estrategia básica <strong>de</strong> la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> es idéntica<br />
a la que se utiliza en la <strong>secuenciación</strong> <strong>de</strong> proteínas. Ésta involucra:<br />
1.- La <strong>de</strong>gradación específica y el fraccionamiento <strong>de</strong> los polinucleótidos<br />
<strong>de</strong> interés a fragmentos suficientemente pequeños para ser secuenciados.<br />
2.- La <strong>secuenciación</strong> <strong>de</strong> los fragmentos pequeños.<br />
3.- El or<strong>de</strong>namiento <strong>de</strong> los fragmentos a través <strong>de</strong> la repetición <strong>de</strong> los<br />
pasos anteriores, usando un procedimiento <strong>de</strong> <strong>de</strong>gradación que produce una<br />
serie <strong>de</strong> fragmentos <strong>de</strong> polinucleótidos que traslapan el punto <strong>de</strong> corte en la<br />
primera serie.<br />
El primer ácido nucleico en ser secuenciado fue el tARN Ala <strong>de</strong> levadura.<br />
La secuencia <strong>de</strong> este nucleótido <strong>de</strong> 76 bases fue realizada por Holley y<br />
colaboradores en siete años (Stewart y Letham, 1977). Ellos usaron métodos<br />
<strong>de</strong> <strong>secuenciación</strong> similares a los que se usaban para secuenciar proteínas; la<br />
hidrólisis parcial con enzimás y el fraccionamiento <strong>de</strong> los productos en<br />
columnas <strong>de</strong> intercambio iónico. El grupo <strong>de</strong> Holley introdujo el uso <strong>de</strong> la<br />
ribonucleasa T1 (<strong>de</strong> Aspergillus oryzae), la cual corta ARN <strong>de</strong>spués <strong>de</strong> residuos<br />
<strong>de</strong> guanina y <strong>de</strong> la ribonucleasa pancreática A, que corta <strong>de</strong>spués <strong>de</strong> residuos<br />
pirimídinicos.<br />
Poco <strong>de</strong>spués, Fre<strong>de</strong>rick Sanger y sus colaboradores dirigieron sus<br />
esfuerzos para <strong>de</strong>sarrollar técnicas <strong>de</strong> fraccionamiento más rápidas y simples,<br />
las cuales permitieron la <strong>secuenciación</strong> <strong>de</strong> ARN y luego <strong>de</strong> ADN. El grupo <strong>de</strong><br />
Sanger marcó el ARN con 32 P, y pudo <strong>de</strong>tectarlo mediante autoradiografías.<br />
A<strong>de</strong>más, introdujeron un método más sencillo para fraccionar los<br />
oligonucleótidos. Una técnica <strong>de</strong> separación bidimensional, con electroforesis<br />
en acetato <strong>de</strong> celulosa, seguido <strong>de</strong> la electroforesis <strong>de</strong> intercambio iónico en<br />
papel. Siguiendo este enfoque general, el grupo <strong>de</strong> Sanger <strong>de</strong>sarrollo varios<br />
métodos para estudiar los nucleótidos aislados (Sanger, 1988).<br />
Uno <strong>de</strong> los métodos consistía en someter a los oligonucleótidos<br />
digeridos con la ribonucleasa T1, a una digestión parcial con una exonucleasa<br />
5´ y correr los productos en una electroforesis sobre papel <strong>de</strong> dietilaminoetil<br />
(DEAE)-celulosa a pH 1.9. La <strong>de</strong>gradación secuencial <strong>de</strong>l extremo 5´ da una<br />
mezcla <strong>de</strong> fragmentos, en don<strong>de</strong> todos tienen el mismo extremo 3´ pero<br />
difieren en sus extremos 5´. En la electroforesis los fragmentos se or<strong>de</strong>nan por<br />
tamaño, y <strong>de</strong> la posición relativa <strong>de</strong> dos bandas adyacentes es posible<br />
i<strong>de</strong>ntificar la naturaleza <strong>de</strong> los nucleótidos, por los cuales ellos difieren. Otro<br />
método exitoso fue la técnica “correría <strong>de</strong> puntos” (“wan<strong>de</strong>ring spot”). Se<br />
14
<strong>de</strong>sarrolló un sistema bidimensional en el que primero se digería con una<br />
exonucleasa y los fragmentos obtenidos se or<strong>de</strong>naban <strong>de</strong> acuerdo a su<br />
tamaño, <strong>de</strong> tal manera que cada punto difería <strong>de</strong>l punto siguiente por un<br />
nucleótido. El sistema fue arreglado para que las posiciones relativas <strong>de</strong> dos<br />
puntos vecinos <strong>de</strong>pendieran <strong>de</strong> los nucleótidos por los cuales diferían. El<br />
método fue extendido para usarse con digestiones más complejas, pero no fue<br />
posible distinguir la A <strong>de</strong> la G con absoluta certidumbre. Con estos métodos, se<br />
secuenció el ARN ribosomal 5S <strong>de</strong> 120 residuos (Sanger, 1988). El arte <strong>de</strong><br />
secuenciar ARN por estás técnicas alcanzó su cenit en 1976, con la<br />
<strong>secuenciación</strong> <strong>de</strong>l genoma <strong>de</strong> 3,569 nucleótidos <strong>de</strong>l bacteriofago MS2 por<br />
Walter Fiers.<br />
El principal problema con la <strong>secuenciación</strong> <strong>de</strong>l ADN era su talla muy<br />
larga; el ADN más pequeño que se encontraba disponible era el <strong>de</strong> genomas<br />
<strong>de</strong> bacteriófagos <strong>de</strong> ca<strong>de</strong>na simple, <strong>de</strong> cerca <strong>de</strong> 5000 nucleótidos, como el<br />
øX174. Y éstos eran muy largos para po<strong>de</strong>r secuenciarlos con los métodos que<br />
existían hasta ese momento. Otra dificultad era la falta <strong>de</strong> enzimas <strong>de</strong><br />
restricción a<strong>de</strong>cuadas. No existía una enzima con una especificidad análoga a<br />
la <strong>de</strong> la ribonucleasa T1 para el ADN.<br />
Alre<strong>de</strong>dor <strong>de</strong> 1973, se usaron técnicas similares a las empleadas con el<br />
ARN para secuenciar ADN, y se pudieron <strong>de</strong>terminar unas pocas secuencias<br />
<strong>de</strong> unos 50 residuos. Sin embargo, los métodos eran lentos y laboriosos, y<br />
resultó obvio que si se iban a atacar secuencias vastas <strong>de</strong> materiales<br />
genéticos, se necesitaba un nuevo enfoque. Una alternativa a la hidrólisis<br />
parcial fue usar técnicas <strong>de</strong> copiado enzimático para la <strong>secuenciación</strong>. C.<br />
Weissmann y sus colaboradores <strong>de</strong>scubrieron que el bacteriófago Q_ tiene una<br />
ARN polimerasa que copia su propio ARN y <strong>de</strong>sarrollaron técnicas para marcar<br />
el ARN y <strong>de</strong>ducir su secuencia. La enzima obvia para copiar el ADN fue la ADN<br />
polimerasa.<br />
Un enfoque elegante para conseguir la digestión específica <strong>de</strong>l ADN,<br />
que pudo ser combinado con un procedimiento <strong>de</strong> copiado, fue sugerido por C.<br />
Chamberlin en 1963. La técnica hace referencia a que en condiciones<br />
normales los substratos <strong>de</strong> la ADN polimerasa son los <strong>de</strong>soxirribonucleósidos<br />
trifosfatos, pero si se remplaza el magnesio por manganeso en el medio, se<br />
pue<strong>de</strong>n usar ribonucleósidos trifosfatos. Si la incubación se hace con un<br />
ribonucleósido trifosfato, por ejemplo, el rCTP y tres <strong>de</strong>soxirribonucleósidos<br />
trifosfatos, se pue<strong>de</strong> construir una ca<strong>de</strong>na <strong>de</strong> ADN con todos los dCs<br />
remplazados por rCs. Estos enlaces son lábiles en soluciones alcalinas o<br />
pue<strong>de</strong>n ser digeridos con una ribonucleasa. De esta manera, se pue<strong>de</strong><br />
15
preparar una digestión específica en C y otras digestiones similares para<br />
escindir los otros residuos.<br />
Por otra parte, la ADN polimerasa requiere un ADN <strong>de</strong> ca<strong>de</strong>na sencilla<br />
como templado y un iniciador o “primer”. Éste es un oligonucleótido que<br />
contiene un extremo 3´ libre que es complementario con una ca<strong>de</strong>na mol<strong>de</strong> <strong>de</strong><br />
ADN y funciona como punto <strong>de</strong> inicio para la adición <strong>de</strong> nucleótidos. Sanger y<br />
su grupo utilizaron como templado el ADN <strong>de</strong> ca<strong>de</strong>na sencilla <strong>de</strong>l bacteriófago<br />
f1 y sintetizaron el iniciador con base en el método <strong>de</strong>sarrollado por Khorana.<br />
Como iniciador usaron un <strong>de</strong>soxirribonucleótido con una secuencia predicha a<br />
partir <strong>de</strong> la secuencia <strong>de</strong> amino<strong>ácidos</strong>, ya conocida, <strong>de</strong> una proteína <strong>de</strong> la<br />
superficie <strong>de</strong>l bacteriófago. Con este método, pudieron <strong>de</strong>terminar la secuencia<br />
<strong>de</strong> 80 nucleótidos. Sin embargo, para po<strong>de</strong>r sintetizar otros 80 residuos,<br />
necesitaban hacer otro iniciador. Este procedimiento era todavía lento para<br />
analizar muchos fragmentos.<br />
Hasta el momento, Sanger y su grupo habían obtenido en sus<br />
experimentos ADN altamente marcado, usando el substrato radioactivo con<br />
una actividad específica alta y en bajas concentraciones. Ellos observaron que<br />
cuando usaban 32 P-ATP, los productos <strong>de</strong> ADN formados se terminaban antes<br />
<strong>de</strong> que se incorporara una A. Debido, presumiblemente, a que a la enzima le<br />
faltaba ATP. Esto les sugirió un nuevo enfoque para secuenciar ADN. Si uno<br />
pue<strong>de</strong> producir una mezcla <strong>de</strong> fragmentos con el mismo extremo 5´ (que<br />
correspon<strong>de</strong> al extremo 5´ <strong>de</strong>l iniciador) y terminarlos en posiciones 3´<br />
correspondientes a las A´s, la <strong>de</strong>terminación <strong>de</strong> los tamaños relativos <strong>de</strong> todos<br />
esos fragmentos <strong>de</strong>bería producir una medida <strong>de</strong> la posición relativa <strong>de</strong> las<br />
A´s. Esto, combinado con datos similares <strong>de</strong> los otros tres nucleótidos, es todo<br />
lo que uno necesita para la <strong>de</strong>terminación completa <strong>de</strong> una secuencia.<br />
Paralelamente, se estudiaron otros métodos <strong>de</strong> fraccionamiento, y la<br />
electroforesis en gel <strong>de</strong> acrilamida resulto ser la más eficiente. Con esta técnica<br />
se pudieron separar nucleótidos <strong>de</strong> hasta 250 residuos <strong>de</strong> acuerdo a su<br />
tamaño. En el gel, los fragmentos más pequeños migran más rápido que los<br />
más gran<strong>de</strong>s, y cada uno pue<strong>de</strong> ser separado <strong>de</strong> sus vecinos, los cuales<br />
difieren en tamaño sólo por un nucleótido. Después <strong>de</strong> introducir ligeras<br />
modificaciones, <strong>de</strong>sarrollaron el método <strong>de</strong>l “más y menos”, con el que se<br />
<strong>de</strong>terminó la mayoría <strong>de</strong> la secuencia <strong>de</strong>l bacteriofago øX174. Sin embargo, el<br />
grupo <strong>de</strong> Sanger no tardaría en <strong>de</strong>sarrollar un método más eficiente y<br />
confiable: el enzimático, que se discute más a<strong>de</strong>lante.<br />
16
Después <strong>de</strong> 1975, se realizó un progreso dramático en la tecnología <strong>de</strong><br />
la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>. Tres avances hicieron esto posible:<br />
1.- El <strong>de</strong>scubrimiento <strong>de</strong> las endonucleasas <strong>de</strong> restricción, enzimás que<br />
cortan ADN <strong>de</strong> ca<strong>de</strong>na doble en secuencias específicas.<br />
2.- El <strong>de</strong>sarrollo <strong>de</strong> mejores técnicas <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> ADN.<br />
3.- El <strong>de</strong>sarrollo <strong>de</strong> técnicas <strong>de</strong> clonación que permitieron la adquisición<br />
<strong>de</strong> un segmento <strong>de</strong> ADN en las cantida<strong>de</strong>s necesarias para secuenciarlo.<br />
En 1977, se reportaron dos protocolos para la <strong>secuenciación</strong> <strong>de</strong> ADN. El<br />
primer método fue el <strong>de</strong> Maxam y Gilbert. Con este método, al igual que con el<br />
<strong>de</strong> Sanger, se obtiene una autoradiografía en don<strong>de</strong> pue<strong>de</strong> leerse una<br />
secuencia. Sin embargo, se <strong>de</strong>termina la secuencia <strong>de</strong> una molécula <strong>de</strong> ADN<br />
utilizando químicos que cortan en posiciones específicas fragmentos marcados<br />
en sus extremos 5´. El segundo método es el <strong>de</strong> Sanger. Éste utiliza un<br />
templado <strong>de</strong> ADN <strong>de</strong> ca<strong>de</strong>na sencilla para sintetizar la hebra complementaria,<br />
la cual se termina en posiciones específicas. En los dos casos, la secuencia <strong>de</strong><br />
la molécula se <strong>de</strong>termina por diferencias en los tamaños <strong>de</strong> los fragmentos<br />
generados.<br />
3.2 El método <strong>de</strong> <strong>de</strong>gradación química (Maxam and Gilbert, 1977).<br />
En este método, un fragmento <strong>de</strong> ADN <strong>de</strong> ca<strong>de</strong>na doble o sencilla se<br />
marca en los extremos 5´ o 3´ <strong>de</strong> una o ambas hebras con 32 P. Después,<br />
la muestra <strong>de</strong> ADN se divi<strong>de</strong> en cuatro alícuotas y se fragmenta en<br />
cuatro reacciones químicas distintas. Posteriormente, los fragmentos <strong>de</strong><br />
ADN generados pue<strong>de</strong>n ser separados por electroforesis en cuatro<br />
carriles distintos con base en su tamaño. Conociendo el nucleótido en el<br />
que se realizaron los cortes, se pue<strong>de</strong> inferir la secuencia <strong>de</strong> la molécula<br />
original (figura 4). Las reacciones químicas que se utilizan para<br />
fragmentar la molécula <strong>de</strong> ADN son las siguientes:<br />
1. Corte <strong>de</strong> las purinas. Las purinas a<strong>de</strong>nina y guanina se metilan<br />
con dimetil sulfato (DMS). Después, la reacción es tratada en<br />
condiciones alcalinas; la molécula <strong>de</strong> ADN se fragmenta en las<br />
purinas metiladas. Como resultado, se obtiene una serie <strong>de</strong><br />
bandas oscuras que correspon<strong>de</strong>n a las guaninas (las cuales se<br />
metilan 5 veces más rápido), y bandas claras que correspon<strong>de</strong>n a<br />
las a<strong>de</strong>ninas. Para interpretar fácilmente el patrón <strong>de</strong> bandas<br />
17
generadas, se pue<strong>de</strong> comparar contra un tratamiento que<br />
favorezca el corte <strong>de</strong> las a<strong>de</strong>ninas.<br />
2. Corte <strong>de</strong> a<strong>de</strong>ninas. Esta reacción es una variación <strong>de</strong> la anterior.<br />
Las purinas metiladas se tratan inicialmente con un ácido diluido.<br />
Esto favorece el corte <strong>de</strong> las a<strong>de</strong>ninas metiladas. Después <strong>de</strong> un<br />
tratamiento alcalino las guaninas también son cortadas. Este<br />
tratamiento genera una serie <strong>de</strong> bandas oscuras y claras que<br />
también correspon<strong>de</strong>n a las a<strong>de</strong>ninas, y las guaninas,<br />
respectivamente.<br />
3. Corte <strong>de</strong> pirimidinas. Esta reacción utiliza el reactivo hidracina,<br />
que corta las bases citosina y timina. Posteriormente, se trata con<br />
piperidina para completar la reacción.<br />
4. Corte <strong>de</strong> citosina. La presencia <strong>de</strong> NaCl 2M inhibe la reacción <strong>de</strong><br />
hidracina con tiamina, y el tratamiento posterior con piperidina,<br />
produce solamente fragmentos que terminan en citosina.<br />
Des<strong>de</strong> que se reporto este método, no se han encontrado reactivos<br />
químicos específicos que corten las bases A o T, por lo que se utiliza la<br />
estrategia <strong>de</strong> corte <strong>de</strong>scrita en la figura 4. Esta estrategia permite distinguir<br />
entre los nucleótidos que se encuentran al final <strong>de</strong> cada corte y <strong>de</strong>ducir la<br />
secuencia <strong>de</strong> ADN.<br />
18
1 2 3 4<br />
Figura 4. El método <strong>de</strong> Maxam y Gilbert para secuenciar ADN. Los números <strong>de</strong> los<br />
carriles en el gel correspon<strong>de</strong>n a los distintos tipos <strong>de</strong> corte que se <strong>de</strong>scriben en el<br />
texto.<br />
3.2.1 Ventajas y <strong>de</strong>sventajas <strong>de</strong>l método <strong>de</strong> <strong>de</strong>gradación química.<br />
La baja resolución obtenida cuando se reportó la técnica no se <strong>de</strong>bió a<br />
un factor inherente al método <strong>de</strong> Maxam-Gilbert, si no a una limitante <strong>de</strong> los<br />
geles <strong>de</strong> acrilamida. En un inicio, se consi<strong>de</strong>raba un logro po<strong>de</strong>r diferenciar el<br />
tamaño <strong>de</strong> 250 fragmentos y <strong>de</strong>terminar la secuencia <strong>de</strong> ese tamaño. El<br />
análisis <strong>de</strong> una secuencia en geles <strong>de</strong> acrilamida era complicado, ya que no se<br />
podía separar los fragmentos gran<strong>de</strong>s. Otro problema que comúnmente afecta<br />
la resolución <strong>de</strong> las bandas obtenidas en el gel es el ensanchamiento <strong>de</strong><br />
bandas cuyas secuencias favorecen la formación <strong>de</strong> estructuras secundarias.<br />
Para mejorar la resolución <strong>de</strong>l gel se ha reportado que el uso <strong>de</strong> geles <strong>de</strong><br />
acrilamida muy <strong>de</strong>lgados, en conjunto con un voltaje alto <strong>de</strong> corrimiento,<br />
produce bandas más <strong>de</strong>lgadas y mejor separadas (Sanger y Coulson, 1978).<br />
Otro aspecto <strong>de</strong>l método <strong>de</strong> Maxam-Gilbert que pue<strong>de</strong> ser un poco<br />
laborioso es la necesidad <strong>de</strong> separar y analizar individualmente las hebras <strong>de</strong>l<br />
ADN que se quiere secuenciar (Sanger et al., 1977). Esto se pue<strong>de</strong> realizar<br />
mediante enzimás <strong>de</strong> restricción (figura 5) que separen los extremos<br />
19
etiquetados para el análisis. Alternativamente, las dos hebras marcadas<br />
pue<strong>de</strong>n ser <strong>de</strong>snaturalizadas y separadas en un gel (Maxam y Gilbert, 1977).<br />
Hoy en día, el método más usado para la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />
<strong>nucleicos</strong> es el método <strong>de</strong> Sanger. Sin embargo, es justo <strong>de</strong>cir que el método<br />
<strong>de</strong> Maxam-Gilbert es el más a<strong>de</strong>cuado para <strong>de</strong>terminar la secuencia <strong>de</strong><br />
fragmentos cortos <strong>de</strong> ADN, <strong>de</strong>bido a que pue<strong>de</strong> <strong>de</strong>terminar la secuencia <strong>de</strong>s<strong>de</strong><br />
la primera base. En cambio, el método <strong>de</strong> Sanger sólo permite la lectura a<br />
partir <strong>de</strong> la base 10-20 (Tahara et al., 1990).<br />
Figura 5. Las enzimás <strong>de</strong> restricción reconocen secuencias<br />
específicas <strong>de</strong> ADN y pue<strong>de</strong>n ser utilizadas para separar las<br />
hebras etiquetadas antes <strong>de</strong> secuenciar por el método <strong>de</strong><br />
Maxam-Gilbert.<br />
3.3 El método enzimático (Sanger et al., 1977).<br />
El método <strong>de</strong> <strong>secuenciación</strong> enzimático salió casi al mismo tiempo que<br />
el <strong>de</strong> Maxam y Gilbert, pero ha sido más utilizado. Esto se <strong>de</strong>be, en gran<br />
parte, a que se han realizado gran<strong>de</strong>s avances en la automatización <strong>de</strong><br />
esta técnica, lo cual se discutirá más a<strong>de</strong>lante. El método <strong>de</strong> Sanger se<br />
basa en el uso <strong>de</strong> la ADN polimerasa para sintetizar ca<strong>de</strong>nas <strong>de</strong> ADN<br />
con una terminación específica. Con este método se generan<br />
fragmentos <strong>de</strong> ADN <strong>de</strong> todos los tamaños posibles que se puedan<br />
distinguir entre sí, por el tipo <strong>de</strong> marcaje que llevan o por la<br />
incorporación <strong>de</strong> un terminador específico. Las enzimás <strong>de</strong>l tipo <strong>de</strong> la<br />
ADN polimerasa requieren <strong>de</strong> un templado <strong>de</strong> ADN <strong>de</strong> ca<strong>de</strong>na sencilla, y<br />
realizan la síntesis <strong>de</strong> la hebra complementaria extendiéndola a partir <strong>de</strong><br />
un iniciador en dirección 5’ a 3’. Entre los componentes <strong>de</strong> la reacción se<br />
incluyen nucleótidos que no tienen un grupo hidroxilo en su extremo 3’<br />
(ddNTP), para po<strong>de</strong>r obtener una terminación especifica en las ca<strong>de</strong>nas.<br />
Una vez que el ddNTP se incorpora como el residuo terminal, evita que<br />
la ca<strong>de</strong>na <strong>de</strong> ADN sintetizada continúe extendiéndose. La incorporación<br />
<strong>de</strong> los ddNTPs es al azar, <strong>de</strong> tal forma que se obtienen fragmentos <strong>de</strong><br />
todos los tamaños posibles que terminan en un residuo especifico.<br />
En el método <strong>de</strong> Sanger (1977), la estrategia es hacer cuatro<br />
reacciones diferentes <strong>de</strong> síntesis <strong>de</strong> ADN, utilizando un ddNTP distinto<br />
en cada tubo. Con la mezcla <strong>de</strong>l nucleótido normal (dNTP) y su<br />
20
terminador (ddNTP), se pue<strong>de</strong>n generar fragmentos complementarios <strong>de</strong><br />
diferentes tamaños que terminan en el mismo nucleótido. Después,<br />
estos fragmentos se pue<strong>de</strong>n separar en un gel <strong>de</strong> electroforesis con<br />
cuatro carriles distintos, para <strong>de</strong>terminar la secuencia <strong>de</strong>l templado<br />
(figura 6).<br />
Figura 6. El método <strong>de</strong> Sanger. Cuatro reacciones con ddNTPs diferentes permiten<br />
la síntesis <strong>de</strong> distintos fragmentos con una terminación específica. Estos<br />
fragmentos se pue<strong>de</strong>n separar por electroforesis y comparando los tamaños, se<br />
pue<strong>de</strong> <strong>de</strong>terminar la secuencia <strong>de</strong>l templado.<br />
El método <strong>de</strong> Sanger tiene varias ventajas sobre el método <strong>de</strong> Maxam-<br />
Gilbert (Blackburn y Gait, 1996). Las reacciones <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l método<br />
enzimático se pue<strong>de</strong>n realizar en unas horas, en cambio las <strong>de</strong>l método <strong>de</strong><br />
Maxam-Gilbert tardan al menos un día. Las reacciones <strong>de</strong>l método <strong>de</strong> Sanger<br />
son más “puras”, con menos contaminantes que puedan afectar la resolución<br />
<strong>de</strong>l gel.<br />
3.3.1 Limitaciones <strong>de</strong>l método enzimático.<br />
Cuando se reportó este método para la <strong>secuenciación</strong> <strong>de</strong> ADN, se usaba<br />
el fragmento Klenow <strong>de</strong> la polimerasa I, y sólo un ciclo <strong>de</strong> síntesis (incubando a<br />
37 ºC) para obtener fragmentos <strong>de</strong> distintos tamaños. Todos los fragmentos<br />
tenían incorporados en sus ca<strong>de</strong>nas, nucleótidos marcados con<br />
21<br />
32 P. El grupo
<strong>de</strong> Sanger reportó que con esta técnica se podía <strong>de</strong>terminar una secuencia <strong>de</strong><br />
hasta 300 nucleótidos, a partir <strong>de</strong> 15 bases <strong>de</strong>l iniciador, aproximadamente. Al<br />
momento <strong>de</strong> publicar esta técnica, también reportaron que la mayor dificultad<br />
era que los ddGTPs no estaban disponibles comercialmente. Des<strong>de</strong> entonces<br />
se ha experimentado con variaciones <strong>de</strong>l protocolo original y se han realizado<br />
gran<strong>de</strong>s avances en la automatización <strong>de</strong> este método. En la tabla 1 se<br />
resumen algunos <strong>de</strong> los avances más importantes que han permitido el<br />
<strong>de</strong>sarrollo <strong>de</strong> métodos automatizados para la <strong>secuenciación</strong> <strong>de</strong> ADN.<br />
4.0 MÉTODOS CONTEMPORÁNEOS EN LA SECUENCIACIÓN<br />
4.1 Automatización <strong>de</strong>l método <strong>de</strong> Sanger<br />
En la tabla 1 se resumen algunos <strong>de</strong> los avances mas importantes que<br />
han permitido el <strong>de</strong>sarrollo <strong>de</strong> métodos automatizados para la <strong>secuenciación</strong><br />
<strong>de</strong> ADN (usando el método <strong>de</strong> Sanger).<br />
Tabla 1. Descubrimientos significativos que permitieron el <strong>de</strong>sarrollo <strong>de</strong> los<br />
métodos automatizados <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>.<br />
Avance Descripción Referencia<br />
Reacción en Técnica que permite la amplificación Mullis, 1990<br />
ca<strong>de</strong>na <strong>de</strong> la<br />
polimerasa<br />
(PCR)<br />
exponencial <strong>de</strong> un fragmento <strong>de</strong> ADN<br />
Polimerasa Taq Polimerasa termoestable que pue<strong>de</strong> Innis et al., 1988;<br />
utilizarse en el PCR<br />
Carballeira et al.,<br />
1990<br />
Marcaje <strong>de</strong>l El marcaje y el tipo <strong>de</strong> <strong>de</strong>tección utilizado Prober et al.,<br />
ADN para i<strong>de</strong>ntificar los fragmentos <strong>de</strong> ADN<br />
sintetizados<br />
1987; Igloi, 1998<br />
Secuenciadores Desarrollo <strong>de</strong> máquinas automatizadas Hunkapiller, et al.,<br />
automatizados con la capacidad <strong>de</strong>terminar la secuencia 1991; Lipshutz y<br />
<strong>de</strong> miles <strong>de</strong> pares <strong>de</strong> bases por día<br />
Fodor, 1994<br />
22
4.1.1 La técnica <strong>de</strong> PCR y su relevancia en la <strong>secuenciación</strong> <strong>de</strong> ADN.<br />
En 1985, el químico Kary Mullis <strong>de</strong>sarrolló la técnica <strong>de</strong> la reacción en<br />
ca<strong>de</strong>na <strong>de</strong> la polimerasa (PCR). Este método permite la amplificación<br />
exponencial <strong>de</strong> una molécula <strong>de</strong> ADN, generando millones <strong>de</strong> copias <strong>de</strong> un<br />
fragmento. Esto se lleva acabo con oligonucleótidos que contienen un grupo<br />
extremo 3´ libre, que es complementario con la ca<strong>de</strong>na mol<strong>de</strong> <strong>de</strong> ADN. Los<br />
“oligos” funcionan como punto <strong>de</strong> inicio para la adición <strong>de</strong> nucleótidos y para<br />
copiar la ca<strong>de</strong>na mol<strong>de</strong> en el PCR. Una vez que el oligonucleótido se une a su<br />
blanco, la polimerasa <strong>de</strong> ADN pue<strong>de</strong> seguir extendiendo la hebra<br />
complementaria. En una reacción típica <strong>de</strong> PCR se usan dos oligonucleótidos<br />
que flanquean la región <strong>de</strong> ADN que se <strong>de</strong>sea amplificar. El número <strong>de</strong> copias<br />
<strong>de</strong>l fragmento <strong>de</strong> ADN que se encuentra entre los dos oligonucleotidos se<br />
amplifica con varios ciclos <strong>de</strong> reacción.<br />
Cada ciclo <strong>de</strong> una reacción <strong>de</strong> PCR<br />
consta <strong>de</strong> tres pasos (figura 7):<br />
1) Desnaturalización <strong>de</strong> las hebras<br />
<strong>de</strong> ADN- El templado es el fragmento<br />
<strong>de</strong> ADN que se <strong>de</strong>sea amplificar, junto<br />
con la región que reconocen los<br />
oligonucleótidos. Para que el<br />
oligonucleótido se pueda unir, es<br />
necesario que el templado sea <strong>de</strong><br />
ca<strong>de</strong>na sencilla. Así que este paso <strong>de</strong>l<br />
PCR es para separar las ca<strong>de</strong>nas <strong>de</strong><br />
ADN, si el templado es <strong>de</strong> doble<br />
ca<strong>de</strong>na. A<strong>de</strong>más, en este paso se<br />
<strong>de</strong>shace cualquier tipo <strong>de</strong> estructura<br />
secundaria formada entre los<br />
segmentos complementarios <strong>de</strong> los<br />
oligonucleótidos y que pudiera<br />
interferir con su habilidad <strong>de</strong> unirse al<br />
templado. Típicamente, la<br />
<strong>de</strong>snaturalización <strong>de</strong>l ADN se hace<br />
con una incubación breve <strong>de</strong>l tubo <strong>de</strong><br />
reacción a una temperatura <strong>de</strong> 94 ºC.<br />
Figura 7. La reacción <strong>de</strong> PCR consiste en<br />
varios ciclos <strong>de</strong> 3 pasos. Las<br />
temperaturas y los tiempos indicados son<br />
ejemplos y varían <strong>de</strong>pendiendo <strong>de</strong> las<br />
características <strong>de</strong>l ADN que se <strong>de</strong>see<br />
amplificar.<br />
2) Temperatura <strong>de</strong> alineamiento - Esta temperatura se calcula con base en<br />
las características <strong>de</strong> los oligos que serán utilizados. La temperatura a la cual<br />
la mitad <strong>de</strong> los oligos están unidos a su blanco (Tm), se calcula tomando en<br />
cuenta el tamaño <strong>de</strong> los oligos y su contenido <strong>de</strong> GC (%GC). Después <strong>de</strong><br />
23
<strong>de</strong>snaturalizar las hebras <strong>de</strong> ADN, se incuba a una temperatura cercana a la<br />
Tm, para que los oligos puedan encontrar su región complementaria en el<br />
templado. y se unan a ella.<br />
3). Extensión <strong>de</strong> la ca<strong>de</strong>na <strong>de</strong> ADN - Este es el último paso <strong>de</strong> un ciclo <strong>de</strong><br />
reacción <strong>de</strong> PCR y normalmente se hace a 72 ºC, la temperatura óptima para<br />
la polimerasa <strong>de</strong> ADN. En este paso, la polimerasa extien<strong>de</strong> la ca<strong>de</strong>na<br />
complementaria <strong>de</strong>l templado. La síntesis <strong>de</strong> la ca<strong>de</strong>na complementaria tiene<br />
como punto <strong>de</strong> inicio el complejo oligonucleótido/templado. El tiempo <strong>de</strong><br />
incubación <strong>de</strong> este paso <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l tamaño <strong>de</strong>l segmento que se <strong>de</strong>sea<br />
amplificar. Como regla general se consi<strong>de</strong>ra que la polimerasa pue<strong>de</strong> sintetizar<br />
1,000 bases por minuto. En la reacción <strong>de</strong> PCR, típicamente, se llevan acabo<br />
<strong>de</strong> 30 a 40 ciclos <strong>de</strong> estos tres pasos, para lograr la amplificación <strong>de</strong>seada.<br />
La técnica <strong>de</strong> PCR resultó relevante para la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />
<strong>nucleicos</strong> <strong>de</strong>bido a que se adaptó al método <strong>de</strong> Sanger, <strong>de</strong> tal forma que se<br />
pue<strong>de</strong> sintetizar un mayor número <strong>de</strong> copias <strong>de</strong> los fragmentos con una<br />
terminación específica. De esta forma, la señal <strong>de</strong>l marcaje que lleva cada<br />
fragmento aumenta, y es posible obtener lecturas más claras <strong>de</strong> los fragmentos<br />
gran<strong>de</strong>s, lo que a su vez, permite la lectura <strong>de</strong> secuencias más largas, una vez<br />
que se pueda superar el problema <strong>de</strong> la resolución <strong>de</strong> los geles.<br />
4.1.2 Polimerasa Taq.<br />
Cuando se <strong>de</strong>sarrolló el método <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> Sanger, se usó el<br />
fragmento Klenow <strong>de</strong> la polimerasa I <strong>de</strong> E. coli para hacer la síntesis <strong>de</strong> los<br />
fragmentos <strong>de</strong> ADN con una terminación específica (Sanger et al, 1977). En<br />
1957, se aisló la Polimerasa I y durante muchos años se pensó que era la<br />
única polimerasa que tenía E. coli (Brown, 1999). De hecho, su actividad es tan<br />
gran<strong>de</strong> que enmáscara la actividad <strong>de</strong> las otras polimerasas <strong>de</strong> esta bacteria, y<br />
hasta que se obtuvó una mutante que no producía la polimerasa I (polA), fue<br />
que se pudieron <strong>de</strong>tectar las otras enzimás (Lewin, 1997). El uso <strong>de</strong> esta<br />
enzima tiene algunas <strong>de</strong>sventajas, en comparación con las polimerasas que se<br />
aislaron <strong>de</strong> otros organismos, años <strong>de</strong>spués. La reacción <strong>de</strong> síntesis <strong>de</strong> ADN<br />
reportada por Sanger en 1977, es <strong>de</strong> un solo paso, y en esta se tienen que<br />
sintetizar todas las posibles combinaciones <strong>de</strong> fragmentos <strong>de</strong> ADN necesarios<br />
para <strong>de</strong>terminar la secuencia <strong>de</strong> un templado. La razón por la que la síntesis se<br />
realiza en un solo paso se <strong>de</strong>be a que la temperatura óptima para la actividad<br />
<strong>de</strong> Klenow es alre<strong>de</strong>dor <strong>de</strong> 37 ºC (temperatura óptima <strong>de</strong> crecimiento <strong>de</strong> E.<br />
coli). Por lo tanto, al elevar la temperatura para <strong>de</strong>snaturalizar los híbridos o<br />
estructuras secundarias <strong>de</strong>l ADN, se inactiva la Klenow, y es necesario añadir<br />
más enzima para hacer un segundo ciclo <strong>de</strong> síntesis <strong>de</strong> fragmentos <strong>de</strong> ADN.<br />
24
El uso <strong>de</strong> la Klenow para generar fragmentos <strong>de</strong> ADN en las reacciones<br />
<strong>de</strong> PCR y para síntetizarlo en la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> se fue<br />
reemplazando con otras polimerasas más estables, aisladas <strong>de</strong> organismos<br />
termófilos. Una <strong>de</strong> las polimerasas más conocidas, fue aislada <strong>de</strong> Thermus<br />
aquaticus, y se le dio el nombre <strong>de</strong> Taq (Innis et al., 1988). Dedido a que esta<br />
enzima es resistente a altas temperaturas, fue posible automatizar la reacción<br />
<strong>de</strong> PCR, sin necesidad <strong>de</strong> añadir enzima nueva en cada ciclo <strong>de</strong> reacción. La<br />
temperatura <strong>de</strong> extensión <strong>de</strong> las ca<strong>de</strong>nas <strong>de</strong> ADN se realiza a 72 ºC, en lugar<br />
<strong>de</strong> 37 ºC. Al hacer el alineamiento <strong>de</strong> los oligos a una temperatura más<br />
elevada, se obtiene una mayor especificidad y homogeneidad en los<br />
fragmentos generados para la reacción.<br />
Las polimerasas termoestables que se caracterizaron a finales <strong>de</strong> los<br />
80s contribuyeron a optimizar el método <strong>de</strong> Sanger para secuenciar <strong>ácidos</strong><br />
<strong>nucleicos</strong>. En ese tiempo, se reportó la purificación <strong>de</strong> polimerasas que podían<br />
sintetizar hasta 1500 bases <strong>de</strong> ADN por minuto, y que mantenían su actividad<br />
en un intervalo amplio <strong>de</strong> temperaturas elevadas (70-80 ºC) (Carballeira et al.,<br />
1990). Con estas enzimás, por fin fue posible obtener fragmentos uniformes <strong>de</strong><br />
ADN <strong>de</strong> hasta 1000 bases y se pudo <strong>de</strong>terminar una secuencia <strong>de</strong> este tamaño<br />
(Innis et al., 1988).<br />
4.1.3 Marcado <strong>de</strong> la ca<strong>de</strong>na <strong>de</strong> ADN.<br />
Se han explorado distintas maneras <strong>de</strong> marcar la ca<strong>de</strong>na <strong>de</strong> <strong>ácidos</strong><br />
<strong>nucleicos</strong> sintetizados para la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong> por el método<br />
<strong>de</strong> Sanger. Originalmente, se utilizaron nucleótidos marcados con 32 P en la<br />
mezcla <strong>de</strong> síntesis y algunos <strong>de</strong> éstos se incorporaban en la ca<strong>de</strong>na (Sanger et<br />
al., 1977). Los nucleótidos incorporados al final <strong>de</strong> la ca<strong>de</strong>na (ddNTPs) no<br />
llevaban ningún marcaje ( 32 P), sólo carecían <strong>de</strong>l grupo hidroxilo 3’ para evitar<br />
que se siguiera extendiendo la ca<strong>de</strong>na. Para po<strong>de</strong>r resolver el or<strong>de</strong>n <strong>de</strong> los<br />
fragmentos sintetizados <strong>de</strong> esta forma, era necesario separarlos en un gel <strong>de</strong><br />
archilamida <strong>de</strong> cuatro carriles distintos y luego tomarle una radiografía para<br />
<strong>de</strong>tectar el marcaje ( 32 P). En los años siguientes, se exploraron otros tipos <strong>de</strong><br />
marcas que no fueran radioactivas para etiquetar estos fragmentos <strong>de</strong> ADN<br />
(Igloi, 1998). Eventualmente, los fluoróforos fueron remplazando a los isótopos<br />
radioactivos, como el método preferido <strong>de</strong> marcaje (Prober et al., 1987). La<br />
razón <strong>de</strong> esto, es que marcar moléculas <strong>de</strong> ADN con isótopos radioactivos es<br />
laborioso, tardado, peligroso y caro (Smith et al., 1985). A<strong>de</strong>más, las<br />
propieda<strong>de</strong>s <strong>de</strong> las moléculas fluorescentes han contribuido al <strong>de</strong>sarrollo <strong>de</strong><br />
técnicas automatizadas <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>. Por ejemplo, la<br />
posibilidad hacer todas las reacciones <strong>de</strong> terminación específica en un solo<br />
tubo (Prober et al., 1987).<br />
25
Existen muchas diferentes etiquetas para los fragmentos <strong>de</strong> ADN. Las<br />
moléculas fluorescentes tienen varias propieda<strong>de</strong>s que se adaptaron con cierta<br />
facilidad hacia el <strong>de</strong>sarrollo <strong>de</strong> métodos automatizados para la <strong>secuenciación</strong><br />
<strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>, y las limitaciones en su uso se han ido resolviendo. Por<br />
ejemplo, se observó que una inconsistencia en la intensidad <strong>de</strong> la señal <strong>de</strong> los<br />
distintos fragmentos, podía complicar la interpretación <strong>de</strong> la información que se<br />
obtenía <strong>de</strong>l <strong>de</strong>tector (Bennett, 2003). Experimentando con distintos fluoróforos,<br />
se han encontrado algunos que dan una señal constante y que se pue<strong>de</strong>n<br />
distinguir entre si con mayor facilidad (Rosenblum et al., 1997). También, se<br />
observó que la modificación <strong>de</strong> los di<strong>de</strong>oxynucleótidos (ddNTPs) con algún<br />
componente fluorescente, pue<strong>de</strong> causar que la migración <strong>de</strong>l fragmento <strong>de</strong><br />
ADN en un gel <strong>de</strong> acrilamida sea un poco distinta, y causar dificultad en la<br />
interpretación <strong>de</strong> la secuencia. Prober et al. (1987) encontraron que era posible<br />
usar cuatro etiquetas fluorescentes <strong>de</strong> la misma familia y que estaban<br />
estructuralmente relacionados, pero con distintos rangos <strong>de</strong> absorción. La<br />
similitud <strong>de</strong> estructura provoca que la influencia sobre la migración <strong>de</strong> los<br />
distintos fragmentos sea mínima y facilita la interpretación <strong>de</strong> la secuencia.<br />
A<strong>de</strong>más, se ha intentado variar la proporción <strong>de</strong> nucleótidos que están<br />
en la mezcla <strong>de</strong> reacción. Ansorge et al. (1990) encontraron que la polimerasa<br />
T7 tiene preferencia por algunos nucleótidos. Observaron que si se usa una<br />
proporción equimolar <strong>de</strong> cada ddNTP, marcado con una molécula fluorescente,<br />
la magnitud <strong>de</strong> la señal que se obtiene es distinta, y se incrementa en el or<strong>de</strong>n<br />
A
ADN y no existen muchas posibilida<strong>de</strong>s <strong>de</strong> que el marcaje interfiera con el<br />
proceso enzimático <strong>de</strong> la síntesis. Sin embargo, en la práctica esta región ha<br />
sido difícil <strong>de</strong> modificar enzimáticamente porque es muy inerte. Kempe et al.<br />
(1985) reportaron que <strong>de</strong>spués <strong>de</strong> una incubación <strong>de</strong> 96 horas con ARN ligasa,<br />
sólo pudieron modificar 20% <strong>de</strong>l iniciador en el extremo 5’ con un marcador <strong>de</strong><br />
biotina.<br />
2. Marcaje incorporado en la ca<strong>de</strong>na- Se pue<strong>de</strong>n incorporar nucleótidos<br />
marcados a la ca<strong>de</strong>na <strong>de</strong> ADN durante su síntesis, tal como lo hicieron Sanger<br />
et al.(1997). Es importante que el marcaje no interfiera con la actividad <strong>de</strong> la<br />
polimerasa que incorpora los nucleótidos a la ca<strong>de</strong>na. Igloi (1998) reportó que<br />
sólo dos <strong>de</strong> las polimerasas termoestables, utilizadas comúnmente en la<br />
<strong>secuenciación</strong>, aceptan dNTPs fluorescentes como sustratos. A pesar <strong>de</strong> que<br />
el marcaje <strong>de</strong> ADN fue el primero en reportarse, no se ha utilizado tan<br />
ampliamente porque no tiene ventajas claras sobre los otros métodos.<br />
3. Marcaje <strong>de</strong>l nucleótido terminal- Este método <strong>de</strong> marcaje, claramente,<br />
es el más sencillo y el mejor por varias razones. En este caso, el nucleótido<br />
responsable <strong>de</strong> la terminación (ddNTP), es el que lleva la marca. Esto asegura<br />
que todas las ca<strong>de</strong>nas sintetizadas a partir <strong>de</strong> un templado, lleven incorporado<br />
una sola marca en el mismo lugar (al final <strong>de</strong> la ca<strong>de</strong>na, en el extremo 3’). De<br />
esta manera, se obtienen fragmentos que producen bandas uniformes y cuyas<br />
secuencias se pue<strong>de</strong>n <strong>de</strong>terminar más fácilmente. Sin embargo, esta no ha<br />
sido la razón principal por la que este método ha sido el más popular. Una<br />
ventaja adicional <strong>de</strong> tener el nucleótido terminal marcado, es que se pue<strong>de</strong>n<br />
usar nucleótidos terminales que lleven cuatro tipos distintos <strong>de</strong> marcaje (uno<br />
diferente para cada nucleótido). Esto implica que las cuatro reacciones <strong>de</strong><br />
terminación específica (ddATP, ddCTP, ddGTP, y ddTTP) se pue<strong>de</strong>n llevar<br />
acabo en el mismo tubo, y ya no se tienen que hacer por separado (Prober et<br />
al., 1987). A<strong>de</strong>más, <strong>de</strong>bido a que se pue<strong>de</strong> <strong>de</strong>terminar cual es el nucleótido<br />
terminal <strong>de</strong> los fragmentos <strong>de</strong> ADN con base en su señal, es posible resolver la<br />
secuencia <strong>de</strong> un templado con sólo un carril. Las bandas que se ven, emiten<br />
una señal distinta, <strong>de</strong>pendiente <strong>de</strong>l nucleótido terminal incorporado. El hecho<br />
<strong>de</strong> que las bandas puedan ser diferenciadas con un carril, elimina la variación<br />
que pue<strong>de</strong> ocurrir entre carriles. A<strong>de</strong>más, si por alguna razón se produce<br />
terminación inespecífica (en un dNTP), no se <strong>de</strong>tecta el fragmento, porque no<br />
lleva un ddNTP marcado al final. Hoy en día, este es el método que más se<br />
utiliza para marcar las ca<strong>de</strong>nas <strong>de</strong> ADN. Kelley (1994) reportó que la<br />
información obtenida en las primeras 300 bases <strong>de</strong> la <strong>secuenciación</strong>, es más<br />
precisa (98% contra 95%) utilizando terminadores (ddNTPs) que llevan una<br />
marca fluorescente en lugar <strong>de</strong> iniciadores con una marca fluorescente.<br />
27
4.1.5 Secuenciación automatizada<br />
Los hallazgos <strong>de</strong> la década <strong>de</strong> los 80s (mejores polimerasas, PCR,<br />
marcas fluorescentes) contribuyeron al <strong>de</strong>sarrollo <strong>de</strong> máquinas automatizadas<br />
capaces <strong>de</strong> <strong>de</strong>terminar miles <strong>de</strong> bases <strong>de</strong> secuencia por día. Las primeras<br />
máquinas <strong>de</strong> <strong>secuenciación</strong> salieron a finales <strong>de</strong> los 80s. En 1986, Smith et al.<br />
reportaron una técnica <strong>de</strong> <strong>secuenciación</strong> automatizada, basada en la<br />
terminación específica con cuatro diferentes fluoróforos. La mezcla <strong>de</strong> síntesis<br />
se cargaba en un solo carril <strong>de</strong> gel, en tubo, y se usaba un <strong>de</strong>tector óptico para<br />
<strong>de</strong>terminar la absorción <strong>de</strong> cada banda, casi al final <strong>de</strong>l tubo. Esta información<br />
pasaba directamente a una computadora y permitía obtener información<br />
precisa <strong>de</strong> hasta 200 pares <strong>de</strong> bases (pb) <strong>de</strong> la secuencia. Sin embargo,<br />
habían varias áreas que podían ser optimizadas para aumentar la longitud <strong>de</strong><br />
la secuencia obtenida: (1) el tamaño, diámetro y composición <strong>de</strong>l gel<br />
electroforético, (2) los reactivos para la reacción <strong>de</strong> <strong>secuenciación</strong>, (3) las<br />
condiciones <strong>de</strong> electroforesis, (4) equipo óptico/electrónico <strong>de</strong> <strong>de</strong>tección, (5) los<br />
marcadores fluorescentes (Smith et al., 1986).<br />
Posteriormente, se experimentó con el uso <strong>de</strong> una máquina que tenía un<br />
<strong>de</strong>tector óptico capaz <strong>de</strong> leer la información <strong>de</strong> cuatro carriles (Ansorge et al.,<br />
1987). En este caso, se reportó que era posible obtener información precisa <strong>de</strong><br />
más <strong>de</strong> 400 pb, usando solo un marcador fluorescente y separando las cuatro<br />
reacciones. Sin embargo, se reportó que a pesar <strong>de</strong> las aparentes ventajas <strong>de</strong>l<br />
uso <strong>de</strong> marcadores distintos y un carril <strong>de</strong> <strong>de</strong>tección, era mejor separar las<br />
reacciones para que los resultados no se vieran afectados por las diferencias<br />
(causantes <strong>de</strong> variación en la migración electroforética) o similitu<strong>de</strong>s (espectros<br />
<strong>de</strong> absorción traslapados) entre los marcadores (Ansorge et al, 1987).<br />
Ansorge et al. (1988) reportaron el primer protocolo que usaba<br />
marcadores fluorescentes en lugar <strong>de</strong> isótopos radioactivos para el método <strong>de</strong><br />
<strong>secuenciación</strong> <strong>de</strong> Maxam-Gilbert. Utilizaron un marcador que no interfería con<br />
la <strong>de</strong>gradación <strong>de</strong> la molécula <strong>de</strong> ADN y lograron secuenciar 50<br />
oligonucleótidos <strong>de</strong> 20 bases cada uno, en un sólo gel. En este reporte, los<br />
autores <strong>de</strong>muestran que también es factible automatizar el método <strong>de</strong> Maxam-<br />
Gilbert usando fluoróforos. Sin embargo, en los años siguientes no hubo<br />
muchos avances en esta área, ya que el <strong>de</strong>sarrollo <strong>de</strong> las técnicas<br />
automatizadas <strong>de</strong> <strong>secuenciación</strong> se enfocó principalmente en mejorar el<br />
método <strong>de</strong> Sanger.<br />
En 1994, se reportó el uso <strong>de</strong> la polimerasa termoestable “SequiTherm”,<br />
que es capaz <strong>de</strong> sintetizar fragmentos gran<strong>de</strong>s con terminación específica.<br />
Esto permitió <strong>de</strong>terminar hasta 1000 bases <strong>de</strong> una secuencia por reacción<br />
28
(Zimmmerman et al., 1994). Esto fue un gran hallazgo, porque a pesar <strong>de</strong> los<br />
avances en la automatización <strong>de</strong> la <strong>secuenciación</strong> la información que se<br />
obtenía <strong>de</strong>spués <strong>de</strong> unas 400 bases <strong>de</strong> secuencia era difícil <strong>de</strong> interpretar y<br />
susceptible a error. La excepción eran reacciones <strong>de</strong> <strong>secuenciación</strong> utilizando<br />
la polimerasa T7, con la cual era posible obtener hasta 700 bases <strong>de</strong><br />
secuencia con 99% <strong>de</strong> precisión, pero esta tenia la <strong>de</strong>sventaja <strong>de</strong> no ser<br />
termoestable (Ansorge et al., 1990; Church et al., 1994).<br />
4.1.6 El <strong>de</strong>sarrollo <strong>de</strong> máquinas <strong>de</strong> <strong>secuenciación</strong><br />
Después <strong>de</strong> que Smith et al. (1986) reportaron el uso <strong>de</strong> la primera máquina<br />
automatizada que usaba un <strong>de</strong>tector óptico para obtener la información <strong>de</strong><br />
<strong>secuenciación</strong> (la cual pasaba directamente a una computadora). Se empezó a<br />
experimentar con otros equipos y variaciones <strong>de</strong> la técnica <strong>de</strong> <strong>secuenciación</strong><br />
con el objetivo <strong>de</strong> mejorar el rendimiento con estas máquinas.<br />
a) Secuenciadoras basadas en geles tipo “slab”--Estas secuenciadoras<br />
usan un gel vertical para separar los fragmentos generados durante la<br />
reacción <strong>de</strong> <strong>secuenciación</strong> y tienen distintos sistemas <strong>de</strong> <strong>de</strong>tección para<br />
leer el or<strong>de</strong>n <strong>de</strong> los marcadores fluorescentes. Meldrum (2000) hace una<br />
comparación <strong>de</strong> algunas propieda<strong>de</strong>s <strong>de</strong> las máquinas comerciales más<br />
comunes que salieron en los 1990s:<br />
ABI PRISM 377 _ Esta secuenciadora salió a finales <strong>de</strong> los 80s. Se<br />
basaba en el uso <strong>de</strong> un carril para <strong>de</strong>tectar cuatro marcadores<br />
fluorescentes distintos. Usa una cámara CCD y es capaz <strong>de</strong> leer hasta<br />
200 bases por muestra por hora. Se pue<strong>de</strong>n cargar hasta 96 muestras<br />
en un solo gel y éstos se <strong>de</strong>tectan simultáneamente.<br />
ASTRAL _ Esta máquina usa un láser <strong>de</strong> Argón para iluminar las<br />
muestras lateralmente. Pue<strong>de</strong> <strong>de</strong>tectar más <strong>de</strong> cuatro marcadores<br />
distintos por muestra y es capaz <strong>de</strong> acomodar hasta 96 muestras por<br />
gel. En un experimento típico se pue<strong>de</strong>n obtener 300 bases <strong>de</strong><br />
secuencia por muestra en un tiempo <strong>de</strong> 7-8 hrs.<br />
LI-COR Mo<strong>de</strong>lo 4200 _ Esta máquina salió en 1997 y tiene un sistema<br />
<strong>de</strong> análisis que <strong>de</strong>tecta una longitud <strong>de</strong> onda cercana al infrarrojo. Esta<br />
máquina es capaz <strong>de</strong> <strong>de</strong>tectar los productos <strong>de</strong> 2 reacciones <strong>de</strong><br />
<strong>secuenciación</strong> simultáneos y bidireccionales, produciendo 2 veces más<br />
información <strong>de</strong> cada reacción <strong>de</strong> <strong>secuenciación</strong>. Tiene 64 carriles y se<br />
producen secuencias <strong>de</strong> hasta 1000 bases <strong>de</strong> cada extremo <strong>de</strong>l<br />
templado con una precisión <strong>de</strong>l 99%.<br />
29
Había mucho interés en reducir el tiempo requerido para obtener los<br />
datos <strong>de</strong> <strong>secuenciación</strong>, dado que esto era uno <strong>de</strong> los pasos limitantes<br />
para completar proyectos <strong>de</strong> <strong>secuenciación</strong>. La compañía MJ Research,<br />
Inc. introdujo una máquina en 1998 que llamaron el sistema “HUGE”.<br />
Ésta se basaba en el uso <strong>de</strong> un gel horizontal <strong>de</strong> poliacrilamida ultra<strong>de</strong>lgado<br />
(75 µm); Tenía 96 carriles y podía leer 450 bases por carril en<br />
90 minutos (Meldrum, 2000) . Este aparato se superó en 1999, cuando<br />
se introdujo el secuenciador “Clipper”, <strong>de</strong>sarrollado por la compañía<br />
Visible Genetics, Inc. Éste era capaz <strong>de</strong> secuenciar 400 bases en 30<br />
minutos en un gel <strong>de</strong> poliacrilamida con un grosor <strong>de</strong> 50 µm, o 1000<br />
bases en menos <strong>de</strong> cuatro horas (Yager et al., 1999).<br />
b) Secuenciadoras basadas en electroforesis capilar- El segundo tipo <strong>de</strong><br />
secuenciadoras automáticas se basaba en un sistema capilar para hacer<br />
la separación <strong>de</strong> los fragmentos <strong>de</strong> distinto tamaños. Los capilares se<br />
caracterizan por tener un diámetro pequeño (≈200 µm) y permiten hacer<br />
una separación rápida <strong>de</strong> alta resolución sin calentar la muestra (Huang<br />
y Mathies, 1994). Por mucho tiempo, esta técnica <strong>de</strong> separación se vio<br />
limitada por el problema <strong>de</strong> cómo <strong>de</strong>tectar múltiples capilares sin tener<br />
que usar múltiples <strong>de</strong>tectores. Por lo tanto, a pesar <strong>de</strong>l beneficio <strong>de</strong> que<br />
la separación capilar es muy rápida (1-2 horas con excelente resolución),<br />
no podía competir con las secuenciadoras que separaban las muestras<br />
en un gel tipo “slab” (Huang y Mathies, 1994; Behr et al., 1999). En<br />
1994, Huang y Mathies reportaron el uso <strong>de</strong> un aparato con un sistema<br />
<strong>de</strong> <strong>de</strong>tección paralelo <strong>de</strong> dos fluoróforos que podía leer la información <strong>de</strong><br />
25 capilares simultáneamente. Esta máquina era aproximadamente 10<br />
veces más rápida que las secuenciadoras típicas <strong>de</strong> geles tipo “slab”.<br />
Pronto empezaron a salir otras secuenciadoras automáticas que usaban<br />
separación por electroforesis capilar, con sistemas <strong>de</strong> <strong>de</strong>tección<br />
paralelos (figura 8) para multiples capilares, por ejemplo:<br />
CEQ 2000 (Evans, 2000) _ Esta secuenciadora tiene ocho capilares con<br />
un <strong>de</strong>tector <strong>de</strong> cuatro colores. Los pasos para preparar el gel, i.e., la<br />
<strong>de</strong>snaturalización <strong>de</strong> la muestra y la carga, son automatizadas. Este<br />
sistema es capaz <strong>de</strong> <strong>de</strong>terminar 500 bases <strong>de</strong> secuencia <strong>de</strong> cada capilar<br />
en 2 horas, o leer hasta 96 muestras automáticamente en un día.<br />
Secuenciadora MCE (Behr et al., 1999) _ Esta secuenciadora se<br />
<strong>de</strong>sarrolló en el <strong>Instituto</strong> Max-Planck. Tiene una <strong>de</strong>tección paralela <strong>de</strong> 96<br />
capilares (Figura 8) y es capaz <strong>de</strong> procesar 15,000 muestras sin<br />
intervención humana.<br />
30
Figura 8. Esta secuenciadora tiene un <strong>de</strong>tector paralelo capaz <strong>de</strong> leer la información<br />
<strong>de</strong> 96 capilares simultáneamente. Luz <strong>de</strong> un láser <strong>de</strong> Argón se guía por una fibra<br />
óptica (Fi) hasta el generador (PI) que distribuye la luz <strong>de</strong> forma uniforme por todos<br />
los capilares.<br />
MegaBACE 1000 _ Esta máquina también tiene 96 capilares y es posible<br />
obtener secuencias hasta <strong>de</strong> 800 pares <strong>de</strong> bases por corrida (Meldrum, 2000)<br />
ABI PRISM 3700 _ Esta es la secuenciadora que se utiliza en el <strong>Instituto</strong> <strong>de</strong><br />
<strong>Biotecnología</strong> <strong>de</strong> la <strong>UNAM</strong> (figura 9). Pue<strong>de</strong> <strong>de</strong>tectar 5 marcadores<br />
fluorescentes distintos y correr 24 horas sin intervención humana. Cuenta con<br />
96 capilares (y 8 <strong>de</strong> reserva) y se pue<strong>de</strong> recargar hasta cuatro veces<br />
automáticamente. Se pue<strong>de</strong>n hacer hasta 500 corridas sin necesidad <strong>de</strong><br />
cambiar los capilares. Cada corrida dura aproximadamente 2.5 hrs y <strong>de</strong>tecta un<br />
promedio <strong>de</strong> 550 bases por reacción <strong>de</strong> <strong>secuenciación</strong> (Meldrum, 2000).<br />
31
Figura 9. La secuenciadora ABI PRISM 3700. Es el aparato que actualmente se tiene<br />
en el IBt-<strong>UNAM</strong>. Hay una segunda máquina en el Centro <strong>de</strong> Investigación sobre<br />
Fijación <strong>de</strong> Nitrogeno (CIFN-<strong>UNAM</strong>). Pue<strong>de</strong> correr 768 reacciones <strong>de</strong> secuencia sin<br />
atención técnica en 36 horas. La longitud <strong>de</strong> las lecturas obtenidas es <strong>de</strong> un<br />
promedio <strong>de</strong> 600-700 bases” (kinish.cifn.unam.mx/~retligen/infrastructura.htm).<br />
4.2 Secuenciación <strong>de</strong> ARN<br />
Paralelo al <strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> ADN, también<br />
se reportaron avances en la <strong>secuenciación</strong> <strong>de</strong> ARN. Des<strong>de</strong> que Holley<br />
secuenció un tARN para Alanina en 1965, se han <strong>de</strong>sarrollado métodos <strong>de</strong><br />
<strong>secuenciación</strong> <strong>de</strong> ARN similares a los utilizados para secuenciar ADN<br />
(Blackburn y Gait, 1996). Básicamente, los métodos <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> ARN<br />
se divi<strong>de</strong>n en 2 categorías.<br />
4.2.1 Métodos indirectos<br />
En este caso, el ARN se convierte primero a cADN con la enzima transcriptasa<br />
reversa y luego se usa el fragmento obtenido como templado para la reacción<br />
<strong>de</strong> <strong>secuenciación</strong>. En realidad, este método <strong>de</strong>termina la secuencia <strong>de</strong> una<br />
molécula <strong>de</strong> ADN a partir <strong>de</strong> la cual se infiere la secuencia <strong>de</strong> la molécula <strong>de</strong><br />
ARN. Este método indirecto es uno <strong>de</strong> los más comunes para la <strong>secuenciación</strong><br />
<strong>de</strong> ARN porque tiene todas las ventajas <strong>de</strong> la <strong>secuenciación</strong> <strong>de</strong> ADN.<br />
32
4.2.2 Métodos directos<br />
Estos métodos se utilizan para secuenciar la molécula <strong>de</strong> ARN cuando es<br />
complicado utilizar el método indirecto (Igloi, 1998). Esto suele suce<strong>de</strong>r con<br />
ARNs muy pequeños, o con estructuras secundarias extensas (ribosomales,<br />
transferencia). Todas estas técnicas requieren <strong>de</strong> que el ARN este en forma<br />
pura.<br />
a) Método enzimático-- En los primeros reportes se experimentó con una<br />
forma enzimática para secuenciar ARN directamente. En este caso,<br />
los autores Brownlee y Cartwright (1977) reportaron los resultados <strong>de</strong><br />
la <strong>secuenciación</strong> <strong>de</strong> una molécula <strong>de</strong> mARN <strong>de</strong> casi 200 pb.<br />
Utilizaron un iniciador marcado con 32 P y la transcriptasa reversa.<br />
Usando reacciones similares a las <strong>de</strong>l método <strong>de</strong> Sanger, los autores<br />
generaron fragmentos <strong>de</strong> cADN con una terminación específica dada<br />
por ddNTPs. Después, resolvieron el or<strong>de</strong>n <strong>de</strong> los fragmentos <strong>de</strong><br />
ADN generados en un gel <strong>de</strong> acrilamida. Se ha visto que la<br />
concentración <strong>de</strong>l ARN templado influye mucho en la resolución <strong>de</strong>l<br />
gel. Los autores Carpenter y Simon (1990) reportaron que cuanto<br />
mayor era la cantidad <strong>de</strong> ARN viral usado como templado, menor era<br />
la resolución obtenida en el gel <strong>de</strong> acrilamida <strong>de</strong>bido a que las<br />
bandas eran anchas, complicando la interpretación <strong>de</strong>l or<strong>de</strong>n. Ellos<br />
obtuvieron la mejor resolución utilizando 0.4 µg (0.75 pmol) <strong>de</strong> ARN<br />
como templado. En una reacción <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong> rARN, Bakin y<br />
Ofengand (1992) obtuvieron la mejor resolución empleando 10 veces<br />
menos ARN, es <strong>de</strong>cir, solamente 0.13 pmol.<br />
A pesar <strong>de</strong> que se generan fragmentos <strong>de</strong> ADN, el método<br />
enzimático es un método directo porque el templado es una molécula<br />
<strong>de</strong> ARN. La marca se pue<strong>de</strong> incorporar a los fragmentos <strong>de</strong> ADN <strong>de</strong><br />
maneras alternativas a la usada por Brownlee y Cartwright en 1977.<br />
El uso <strong>de</strong> ddNTPs marcados tiene la ventaja <strong>de</strong> que los fragmentos<br />
que sufren una terminación prematura no se <strong>de</strong>tectan ni interfieren<br />
con la interpretación <strong>de</strong> la secuencia. La terminación prematura suele<br />
ser un problema más común en la <strong>secuenciación</strong> <strong>de</strong> ARN por la<br />
formación <strong>de</strong> estructuras secundarias que interfieren con la actividad<br />
<strong>de</strong> la transcriptasa reversa. A<strong>de</strong>más, la síntesis <strong>de</strong> fragmentos <strong>de</strong><br />
ADN a 37 ºC carece <strong>de</strong> las ventajas <strong>de</strong> las altas temperaturas que se<br />
pue<strong>de</strong>n usar con otras enzimas (polimerasa Taq).<br />
33
) Método químico-- En 1977 se presentó un método <strong>de</strong> ruptura química<br />
<strong>de</strong>l ARN similar al <strong>de</strong> Maxam y Gilbert (Donis-Keller et al., 1977). La<br />
molécula <strong>de</strong> ARN (en este caso ARN ribosomal) se marca con una<br />
molécula <strong>de</strong> 32 P en un extremo. Después se utilizaron nucleasas para<br />
hacer digestiones <strong>de</strong> la molécula <strong>de</strong> ARN marcado en distintos<br />
lugares. La RNAsa T1 corta las guaninas, la RNAsa U2 corta las<br />
a<strong>de</strong>ninas y una hidrólisis alcalina rompe todos los enlaces<br />
fosfodiéster (Donis-Keller et al., 1977). Se utiliza un gel <strong>de</strong> acrilamida<br />
para separar los fragmentos <strong>de</strong> estos tres tipos <strong>de</strong> ruptura, lo que<br />
permite <strong>de</strong>terminar el or<strong>de</strong>n <strong>de</strong> las guaninas, a<strong>de</strong>ninas y pirimidinas<br />
<strong>de</strong> una molécula <strong>de</strong> ARN ribosomal.<br />
A diferencia <strong>de</strong>l método enzimático, en el que se pue<strong>de</strong> usar un<br />
iniciador marcado para generar los fragmentos que serán<br />
secuenciados, el método químico requiere que la molécula <strong>de</strong> ARN<br />
sea marcada directamente. Esto se pue<strong>de</strong> hacer introduciendo una<br />
marca <strong>de</strong> 32 P en el extremo 5’ <strong>de</strong> la molécula con una cinasa T4, o en<br />
el extremo 3’ con una ligasa T4 (Blackburn and Gait, 1996).<br />
4.3 Resumen <strong>de</strong> enzimas usadas en la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong><br />
<strong>nucleicos</strong>.<br />
En la tabla 2 se resumen algunas <strong>de</strong> las enzimas mas comunes utilizadas<br />
en la <strong>secuenciación</strong> <strong>de</strong> <strong>ácidos</strong> <strong>nucleicos</strong>. Estas enzimas eran entre las<br />
primeras herramientas en la biología molecular y se aprovecharon sus<br />
activida<strong>de</strong>s naturales en la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong>.<br />
34
Tabla 2- Algunas <strong>de</strong> las enzimas que han tenido un papel importante en el<br />
<strong>de</strong>sarrollo <strong>de</strong> los métodos <strong>de</strong> <strong>secuenciación</strong><br />
Enzima Función Referencia<br />
Fragmento Una polimerasa <strong>de</strong> ADN que utilizo Sanger en su reacción Sanger et<br />
Klenow <strong>de</strong> <strong>secuenciación</strong>. No es termoestable.<br />
al., 1977<br />
T7 Una polimerasa <strong>de</strong> ADN no termoestable que se utilizaba (Ansorge et<br />
frecuentemente en las reacciones <strong>de</strong> <strong>secuenciación</strong> con el<br />
Método Sanger. Se utilizaba frecuentemente para<br />
incorporar terminadores (ddNTPs) etiquetadas con un<br />
fluoroforo.<br />
al., 1990)<br />
Taq<br />
Una polimerasa termoestable aislada <strong>de</strong> T. aquaticus Innis et al.,<br />
polimerasa (termofilo). Fue una gran herramienta en el <strong>de</strong>sarrollo <strong>de</strong><br />
la técnica <strong>de</strong> PCR.<br />
1988<br />
Enzimas <strong>de</strong> El primero fue aislado <strong>de</strong> E. coli en 1968 por Matthew<br />
restricción Meselson y Robert Yuan. Son nucleasas que reconocen y<br />
cortan secuencias específicas <strong>de</strong> ADN (doble ca<strong>de</strong>na). Se<br />
utilizan en el método <strong>de</strong> <strong>de</strong>gradación química para aislar<br />
los fragmentos ( 32 Maxam y<br />
Gilbert,<br />
P) que serán secuenciados.<br />
1977<br />
Transcriptasa Una polimerasa <strong>de</strong> ADN que sintetiza una ca<strong>de</strong>na <strong>de</strong> ADN Brownlee y<br />
reversa utilizando una molécula <strong>de</strong> ARN como templado<br />
Cartwright,<br />
1977<br />
RNAsa T1 La RNAsa T1 corta las moléculas <strong>de</strong> ARN (ca<strong>de</strong>na sencilla) Donis-Keller<br />
en las guaninas.<br />
et al., 1977<br />
RNAsa U2 RNAsa U2 corta las moléculas <strong>de</strong> ARN (ca<strong>de</strong>na sencilla) Donis-Keller<br />
en las a<strong>de</strong>ninas.<br />
et al., 1977<br />
RNA ligasa Se utiliza para unir una marca radioactiva (<br />
32<br />
P) en el Blackburn y<br />
extremo 5’ <strong>de</strong> la molécula <strong>de</strong> ARN (ca<strong>de</strong>na sencilla). Gait, 1996<br />
Cinasa T4 Se utiliza para unir una marca radioactiva ( 32 P) en el Blackburn y<br />
extremo 3’ <strong>de</strong> la molécula <strong>de</strong> ARN (ca<strong>de</strong>na sencilla). Gait, 1996<br />
5.0 ESTRATEGIAS Y APLICACIONES DE LA SECUENCIACIÓN DE<br />
ÁCIDOS NUCLEICOS<br />
5.1 Proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano<br />
Uno <strong>de</strong> los factores principales que motivó el <strong>de</strong>sarrollo <strong>de</strong> la tecnología<br />
<strong>de</strong> las secuenciadoras automáticas fue el proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />
genoma humano. Tal vez ningún proyecto <strong>de</strong> <strong>secuenciación</strong> genómica ha<br />
recibido tanta atención como éste, concebido en Estados Unidos en 1988<br />
(Olson, 1993). En ese tiempo, la tecnología <strong>de</strong> <strong>secuenciación</strong> automatizada<br />
estaba en sus primeras etapas <strong>de</strong> <strong>de</strong>sarrollo, y era muy ambicioso intentar<br />
secuenciar un genoma <strong>de</strong> miles <strong>de</strong> millones <strong>de</strong> pb. Sin embargo, el comienzo<br />
35
<strong>de</strong> este proyecto se anunció oficialmente en 1990 por los <strong>de</strong>partamentos <strong>de</strong><br />
Salud y Energía con un presupuesto <strong>de</strong> 3 mil millones <strong>de</strong> dólares y la meta <strong>de</strong><br />
completar la secuencia en 15 años (Venter et al., 2001).<br />
¿De qué nos sirve la información <strong>de</strong> la secuencia <strong>de</strong> un genoma? De una<br />
forma muy general, los objetivos principales <strong>de</strong>l proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />
genoma humano eran los siguientes (Olson, 1993):<br />
a) Mejorar la infraestructura <strong>de</strong> la investigación genética - La secuencia<br />
<strong>de</strong>l genoma humano permitiría la ampliación <strong>de</strong>l conocimiento<br />
genético <strong>de</strong> nuestro organismo. Se pue<strong>de</strong>n utilizar técnicas como el<br />
PCR para analizar <strong>de</strong>talladamente ciertos segmentos <strong>de</strong>l genoma.<br />
Conociendo su secuencia, se pue<strong>de</strong>n diseñar oligonucleótidos que<br />
reconocen y se unen a secuencias complementarias en el ADN.<br />
b) Comparar el papel <strong>de</strong> una secuencia <strong>de</strong> ADN en los humanos y en<br />
los organismos mo<strong>de</strong>lo – Se pue<strong>de</strong>n comparar las secuencias <strong>de</strong> los<br />
genes i<strong>de</strong>ntificados en el genoma humano con los genes <strong>de</strong> otros<br />
organismos y conocer el grado <strong>de</strong> similitud o diferencia que existe<br />
entre dos especies. También se pue<strong>de</strong> inferir la función <strong>de</strong> ciertos<br />
genes con base en los conocimientos <strong>de</strong> otro gen similar, i<strong>de</strong>ntificado<br />
en otro organismo.<br />
c) Mejorar la bioquímica analítica <strong>de</strong>l ADN - Este era el reto más gran<strong>de</strong><br />
cuando se anunció el inicio <strong>de</strong>l proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l<br />
genoma humano, ya que se refería a mejorar las herramientas para<br />
el análisis <strong>de</strong> ADN. Éste era un reto técnico, ya que para obtener la<br />
secuencia completa <strong>de</strong>l genoma humano en el tiempo propuesto era<br />
necesario <strong>de</strong>sarrollar la estrategia y las máquinas <strong>de</strong> <strong>secuenciación</strong><br />
con capacidad <strong>de</strong> secuenciar dos Mpb por año.<br />
La secuencia <strong>de</strong>l genoma humano se reportó en el 2001, cuatro años antes <strong>de</strong><br />
la fecha prevista (Venter et al., 2001). Esto se <strong>de</strong>be en parte a los esfuerzos <strong>de</strong><br />
más <strong>de</strong> 20 grupos internacionales que colaboraron para completar la<br />
secuencia, y a los avances en la tecnología <strong>de</strong> las secuenciadoras automaticas<br />
(la mayor parte <strong>de</strong> la secuencia se obtuvo con máquinas ABI PRISM 3700;<br />
figura 9). Pero la razón principal por la que se logró completar la secuencia fue<br />
un cambio en la estrategia <strong>de</strong> <strong>secuenciación</strong> (Internacional Human Genome<br />
Sequencing Consortium, 2001). La necesidad <strong>de</strong> tener una buena estrategia<br />
para secuenciar fragmentos gran<strong>de</strong>s <strong>de</strong> ADN (e.g, un cromosoma), fue<br />
evi<strong>de</strong>nte en el proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano.<br />
36
5.2 Estrategias para la <strong>secuenciación</strong> <strong>de</strong> fragmentos gran<strong>de</strong>s <strong>de</strong> ADN.<br />
5.2.1 “Chromosome Walking”<br />
Hay dos estrategias generales para secuenciar fragmentos gran<strong>de</strong>s <strong>de</strong><br />
ADN. La primera se llama caminata cromosomal “chromosome walking”<br />
(Brown, 1999; figura 10) y consiste en lo siguiente: (1) la fragmentación parcial<br />
<strong>de</strong>l ADN para su inserción en un vector <strong>de</strong> clonación; (2) la obtención <strong>de</strong> un<br />
banco <strong>de</strong> clonas <strong>de</strong> fragmentos que contienen segmentos que se traslapan y;<br />
(3) la <strong>secuenciación</strong> <strong>de</strong> una clona y la i<strong>de</strong>ntificación <strong>de</strong> una segunda que posea<br />
la continuación <strong>de</strong>l segmento que se está secuenciando. Este proceso se<br />
repite hasta que se completa la secuencia <strong>de</strong> la molécula original <strong>de</strong> ADN (e.g.,<br />
un cromosoma).<br />
Esta estrategia se utilizó originalmente en el proyecto <strong>de</strong> <strong>secuenciación</strong><br />
<strong>de</strong>l genoma humano. Tiene la ventaja <strong>de</strong> que se asegura la obtención <strong>de</strong> la<br />
secuencia completa <strong>de</strong> la molécula original <strong>de</strong> ADN. En teoría, no se requiere<br />
hacer <strong>secuenciación</strong> redundante; sin embargo, tiene varias <strong>de</strong>sventajas que<br />
afectan el tiempo y el costo <strong>de</strong> un proyecto <strong>de</strong> <strong>secuenciación</strong>. Primero, cada<br />
clona se tiene que analizar individualmente y en serie. No se pue<strong>de</strong> secuenciar<br />
la siguiente clona hasta no conocer la primer secuencia. Segundo, se requiere<br />
la síntesis <strong>de</strong> un enorme número <strong>de</strong> iniciadores para continuar la<br />
<strong>secuenciación</strong>. Suponiendo que cada iniciador empleado es único y sirve para<br />
secuenciar sólo una parte <strong>de</strong> una clona particular, se requiere sintetizar <strong>de</strong> 5 a<br />
10% <strong>de</strong> la secuencia total (Cantor y Smith, 1999). Tomando esto en cuenta, no<br />
es sorpren<strong>de</strong>nte que hasta 1998 sólo se había secuenciado el 5% <strong>de</strong>l genoma<br />
humano (Venter et al., 2001). Era necesario un cambio <strong>de</strong> estrategia para<br />
completar la secuencia <strong>de</strong>l genoma humano en el tiempo previsto.<br />
37
Figura 10. La estrategia “chromosome walking” permite <strong>de</strong>terminar la secuencia <strong>de</strong><br />
un fragmento enorme <strong>de</strong> ADN ensamblando muchas secuencias pequeñas <strong>de</strong><br />
distintas clonas (www.bio.miami.edu/dana/250/25003_10.htm).<br />
5.2.2 “Shotgun Sequencing”<br />
La segunda estrategia general para la <strong>secuenciación</strong> <strong>de</strong> fragmentos gran<strong>de</strong>s<br />
<strong>de</strong> ADN, se llama <strong>secuenciación</strong> tipo “shotgun” (figura 11). La gran diferencia<br />
entre esta estrategia y la anterior es que en el “shotgun” la <strong>secuenciación</strong> se<br />
hace a partir <strong>de</strong> fragmentos al azar. Después, se utiliza un programa <strong>de</strong><br />
cómputo para encontrar las regiones que se traslapan entre las secuencias<br />
individuales. Así se va ensamblando la secuencia <strong>de</strong>l fragmento original<br />
(Brown, 1999). Esta estrategia <strong>de</strong> <strong>secuenciación</strong> tiene la ventaja <strong>de</strong> que es<br />
rápida, requiere la síntesis <strong>de</strong> pocos iniciadores, y tiene una eficiencia<br />
comprobada (Cantor y Smith, 1999). Una <strong>de</strong> las <strong>de</strong>sventajas <strong>de</strong> esta estrategia<br />
es que requiere la redundancia <strong>de</strong> las secuencias para asegurar la obtención<br />
<strong>de</strong> una muestra completa <strong>de</strong>l ADN original. Otra <strong>de</strong>sventaja es que se requiere<br />
mucha tecnología computacional para ensamblar la secuencia original y que a<br />
veces quedan “gaps” (regiones <strong>de</strong>l fragmento original que no se secuenciaron).<br />
Utilizando esta estrategia <strong>de</strong> <strong>secuenciación</strong>, es necesario secuenciar al menos<br />
5 veces el ADN original para po<strong>de</strong>r lograr un muestreo completo (Venter et al.,<br />
38
2001). Tal vez, esta razón es suficiente para explicar la resistencia durante<br />
tanto tiempo para la realización <strong>de</strong>l proyecto <strong>de</strong>l genoma humano,<br />
consi<strong>de</strong>rando que es un genoma al menos 25 veces más gran<strong>de</strong> que cualquier<br />
otro genoma ya secuenciado (Internacional Human Genome Sequencing<br />
Consortium, 2001). Aun cuando Weber y Myers (1997) presentaron un plan<br />
para terminar la <strong>secuenciación</strong> <strong>de</strong>l genoma humano con esta estrategia,<br />
<strong>de</strong>mostrando que sería más rápido y menos costoso, su propuesta no fue bien<br />
recibida.<br />
Figura 11. En la estrategia “shotgun” se secuencian fragmentos al azar y luego<br />
usando un programa computacional se encuentran las regiones que se traslapan<br />
para <strong>de</strong>terminar la secuencia <strong>de</strong>l fragmento original<br />
(http://www.bioteach.ubc.ca/Bioinformatics/GenomeProjects/shotgun%201.gif).<br />
En 1998 se fundó la compañía <strong>de</strong> biotecnología Celera Genomics, con el<br />
propósito <strong>de</strong> completar el proyecto <strong>de</strong> <strong>secuenciación</strong> <strong>de</strong>l genoma humano<br />
utilizando la estrategia “shotgun” (Myers, 1999). La vali<strong>de</strong>z <strong>de</strong> esta estrategia<br />
fue establecida en el 2001 cuando Venter et al. (investigadores <strong>de</strong> Celera<br />
Genomics) reportaron que habían completado la <strong>secuenciación</strong> <strong>de</strong>l genoma<br />
humano en menos <strong>de</strong> un año.<br />
39
Al conocerse la secuencia <strong>de</strong>l genoma humano se hicieron varios hallazgos<br />
importantes (Venter et al., 2001; Internacional Human Genome Sequencing<br />
Consortium, 2001):<br />
a) El genoma está compuesto por 1% <strong>de</strong> exones, 24% <strong>de</strong> intrones y 75% <strong>de</strong><br />
regiones intergénicas.<br />
b) Hay entre 30,000 y 40,000 genes que codifican para proteínas.<br />
c) Se han i<strong>de</strong>ntificado más <strong>de</strong> 2.1 millones <strong>de</strong> polimorfismos <strong>de</strong> un solo<br />
nucleótido (SNPs) en el genoma. Éstos ocurren más o menos uno <strong>de</strong> cada<br />
1300 bases.<br />
Si se secuencia una región <strong>de</strong>l genoma <strong>de</strong> dos individuos, se encontrará que<br />
son 99.3% idénticos. En gran parte, las diferencias son cambios <strong>de</strong> una sola<br />
base conocidos como SNPs; se encontraran las dos alternativas en más <strong>de</strong> 1%<br />
<strong>de</strong> la población (Chiche et al., 2002). Dado que muchas enfermeda<strong>de</strong>s<br />
genéticas están asociadas a variaciones pequeñas como los SNPs, hay interés<br />
en utilizar la información <strong>de</strong>l proyecto <strong>de</strong>l genoma humano para i<strong>de</strong>ntificar los<br />
SNPs responsables <strong>de</strong> ciertas enfermeda<strong>de</strong>s (Tang et al., 2004).<br />
5.3 Otras aplicaciones<br />
El avance en la <strong>secuenciación</strong> <strong>de</strong> los <strong>ácidos</strong> <strong>nucleicos</strong> ha sido una herramienta<br />
que ha generado muchos conocimientos en el campo <strong>de</strong> la genómica. Hasta el<br />
2001 se habían reportado los genomas completos <strong>de</strong> 599 virus, 185 organelos,<br />
31 eubacterias, 7 arqueobacterias, un hongo, dos animales y una planta<br />
(Internacional Human Genome Sequencing Consortium, 2001). Las<br />
ramificaciones <strong>de</strong> tener esta información son innumerables, y su valor<br />
incalculable. Entre otras cosas, nos ha permitido enten<strong>de</strong>r cómo se asocian las<br />
enfermeda<strong>de</strong>s con la variabilidad genética, la función <strong>de</strong> genes caracterizados<br />
en otros organismos, el patrón <strong>de</strong> expresión <strong>de</strong> genes nuevos, el aislamiento<br />
<strong>de</strong> genes específicos por PCR, la similitud o variación genética entre especies<br />
diferentes, la organización <strong>de</strong> la información genética, el origen <strong>de</strong> algunos<br />
genes, etc. Hay cientos <strong>de</strong> ejemplos <strong>de</strong> cada una <strong>de</strong> estas categorías. Tal vez,<br />
lo que sea más importante recordar es que no parece haber límite en las<br />
aplicaciones <strong>de</strong> la información que se obtiene <strong>de</strong> la <strong>secuenciación</strong> <strong>de</strong> los<br />
<strong>ácidos</strong> <strong>nucleicos</strong>. Gracias a esta información, se han logrado avances en la<br />
investigación <strong>de</strong> áreas como la medicina, la química, la biología molecular, la<br />
sistemática, la proteómica, y mucho más.<br />
40
6.0 El FUTURO DE LA SECUENCIACION<br />
6.1 Secuenciación por hibridización<br />
Entre otras cosas el conocimiento <strong>de</strong> la secuencia <strong>de</strong> los genomas o los<br />
genes <strong>de</strong> los organismos también ha permitido <strong>de</strong>sarrollar nuevos métodos <strong>de</strong><br />
<strong>secuenciación</strong>. Como reportan Isaksson y Lan<strong>de</strong>gren (1999) uno <strong>de</strong> estos es<br />
la <strong>secuenciación</strong> por hibridización. Una forma en la cual pue<strong>de</strong> funcionar este<br />
método es utilizando “microarrays”. Estos son soportes pequeños en los<br />
cuales se imobilian pequeños fragmentos <strong>de</strong> ADN en un or<strong>de</strong>n conocido.<br />
Después se pasa la muestra <strong>de</strong> ADN (con secuencia <strong>de</strong>sconocida) y se<br />
cuantifica el grado <strong>de</strong> hibridización, y por consecuencia el grado <strong>de</strong> i<strong>de</strong>ntidad<br />
con las secuencias fijas en el soporte (Cantor y Smith, 1999). Esto parece<br />
funcionar especialmente bien en la i<strong>de</strong>ntificación <strong>de</strong> SNPs. Wang et al. (1998)<br />
reportaron que es posible i<strong>de</strong>ntificar el genotipo <strong>de</strong> un individuo analizando 500<br />
SNPs a la vez en un experimento <strong>de</strong> hibridización con un “microarray” <strong>de</strong><br />
oligonucleotidos. Una posibilidad para la <strong>secuenciación</strong> <strong>de</strong> acidos <strong>nucleicos</strong> a<br />
futuro, que discuten los autores Cantor y Smith (1999) es el hacer hibridización<br />
contra oligonucleotidos que formen palabras <strong>de</strong> tal forma que se pueda ir<br />
<strong>de</strong>terminando la secuencia sobrelapando los fragmentos (<strong>de</strong> 6-8 nucleótidos)<br />
con los cuales híbrida el fragmento secuenciado (Figura 12).<br />
Figura 12. La forma en la cual se pue<strong>de</strong> utilizar hibridización para secuenciar. La<br />
molécula <strong>de</strong> ADN se hibridiza contra pequeños oligonucleotidos que son como<br />
“palabras”. Después, se <strong>de</strong>termina la secuencia.<br />
6.2 Secuenciación a futuro sin fragmentación <strong>de</strong> ADN<br />
Los autores Cantor y Smith (1999) presentan algunas posibilida<strong>de</strong>s <strong>de</strong> cómo<br />
puedan evolucionar los métodos en la <strong>secuenciación</strong> <strong>de</strong> acidos <strong>nucleicos</strong>. Las<br />
posibilida<strong>de</strong>s se discuten en función <strong>de</strong> que po<strong>de</strong>r secuenciar moléculas<br />
individuales <strong>de</strong> ADN sin fragmentarlos en segmentos. Por ejemplo, usar<br />
moléculas <strong>de</strong> ADN fijas a un soporte que se van <strong>de</strong>gradando con una<br />
exonucleasa y algún <strong>de</strong>tector que <strong>de</strong>termine cuales son los nucleótidos que se<br />
van liberando (Cantor y Smith, 1999). Una segunda posibilidad es utilizar<br />
microscopia electronica para <strong>de</strong>terminar la secuencia <strong>de</strong> acidos <strong>nucleicos</strong> en<br />
41
una molécula <strong>de</strong> ADN. Esto se podría hacer tal vez marcando las bases<br />
individuales con algún metal pesado.<br />
Ninguno <strong>de</strong> estos dos métodos se ha implementado por dificulta<strong>de</strong>s en<br />
los <strong>de</strong>talles (Cantor y Smith, 1999). En el primer caso hay dos complicaciones:<br />
como marcar cada base con alguna etiqueta como un fluoroforo, y tener un<br />
<strong>de</strong>tector suficientemente sensible que sea capaz <strong>de</strong> <strong>de</strong>tectar un solo nucleótido<br />
marcado. En el segundo caso (microscopia electronica), no se pudo marcar<br />
cada base con algún metal sin tener reacciones laterales no <strong>de</strong>seadas (con<br />
otras bases la molécula <strong>de</strong> ADN). Sin embargo, tal vez a futuro, se logren<br />
resolver estas dificulta<strong>de</strong>s, o se <strong>de</strong>scubran otras alternativas eficientes para<br />
hacer la <strong>secuenciación</strong> <strong>de</strong> moléculas individuales <strong>de</strong> ADN.<br />
42
7.0 REFERENCIAS<br />
Ansorge, W., B. Sproat, J. Stegemann, C. Schwager and M. Zenke (1987)<br />
AutomatedDNA sequencing: ultrasensitive <strong>de</strong>tection of fluorescent bands<br />
during electrophoresis. Nucleic Acids Res 15(11): 4593-4602<br />
Ansorge, W. A. Rosenthal, B. Sproat, C. schwager, J. Stegemann and H. Voss<br />
(1988) Non-radioactive automated sequencing of oligonucleoti<strong>de</strong>s by<br />
chemical <strong>de</strong>gradation. Nucleic Acids Res 16(5): 2203-2206<br />
Ansorge, W., J. Zimmerman, C. Schwager, J. Stegemann, H. Erfle, and H. Voss<br />
(1990) One label, one tube, Sanger DNA sequencing in one and two<br />
lanes on a gel. Nucleic Acids Res 18(11): 3419-3420<br />
Bakin, A. and J. Ofengand (1992) A high sensitivity method for sequencing<br />
RNA: application to ribosomal RNA. BioTechniques 13(5):682-683<br />
Behr, S., M. Matzig, A. Levin, H. Eickhoff, C. Heller, (1999) A fully automated<br />
multicapillary electrophoresis <strong>de</strong>vice for DNA analysis. Electrophoresis<br />
20: 1492-1507<br />
Bennet, P. (2003) DNA sequencing and the human genome Project. Molecular<br />
Biology In Cellular Pathology. John Wiley & Sons, Ltd pp. 308-328<br />
Blackburn, G. M. and M. Gait (1996), Nucleic Acids in Chemistry and Biology,<br />
2 nd Ed., Oxford, U. Pr., NY, EUA.<br />
Brown, T.A. (1999) Genomes. Bios Scientific Publishers, Ltd. John Wiley &<br />
Sons, Inc, New York, USA. pp. 59-82<br />
Brownlee, G. and E. Carterwright (1977) Rapid gel sequencing of RNA by<br />
primed synthesis with reverse transcriptase. J Mol Biol 114: 93-117<br />
Cantor, C. and C. Smith (1999) Genomics: The science and technology behind<br />
the human genome project. John Wiley & Sons, Inc.<br />
Carballeira, N., M. Nazabal, J. Brito, O. Garcia (1990)Purification of a<br />
thermostable DNA polimerase from Thermus thermophilus HB8, useful in<br />
the polymerase Chain reaction. BioTechniques 9(3): 276-281<br />
Carpenter, C. and A. Simon (1990) Simplified RNA sequencing using di<strong>de</strong>oxy<br />
chain termination. BioTechniques 8(1): 26-27<br />
43
Chiche, J., A. Cariou, J. Mira (2002) Bench-to-bedsi<strong>de</strong> review: Fulfilling<br />
promises of the human genome project. Critical Care 6(3): 212-215<br />
Church, G. G. Gryan, N. Lakey, S. Kieffer-Higgins, L. Mintz, M. Temple, M.<br />
Rubenfield, L. Jaehn, H. Ghaziza<strong>de</strong>h, K. Robison, and P. Richterich<br />
(1994) Automated multiplex sequencing. Chapt 2. Automated DNA<br />
sequencing and analysis. Edit. Adams, M. C. Fields, J. Venter. Aca<strong>de</strong>mic<br />
Press, Inc. SD, USA. Pp. 11-16<br />
Donis-Keller, H. A. Maxam, and W. Gilbert (1977) Mapping a<strong>de</strong>nines, guanines,<br />
and pyrimidines in RNA. Nucleic Acids Res 4(8): 2527-2538<br />
Evans, T. (2000) Engineering in genomics. Developing and commercializing a<br />
DNA sequencer. IEE EMB 19(4): 117-120<br />
Huang, X. and R. Mathies (1994) Application of capillary array electrophoresis<br />
to DNA sequencing. Chapt 3. Automated DNA sequencing and<br />
analysis. Edit. Adams, M. C. Fields, J. Venter. Aca<strong>de</strong>mic Press, Inc.<br />
SD, USA. Pp. 17-28<br />
Hunkapiller, T., R. Kaiser, B. Koop, and L. Hood (1991) Large-scale and<br />
automated DNA sequence <strong>de</strong>termination. Science 25: 59-67<br />
Igloi, G. (1998) Strategies for introducing non-radioactive labels during the<br />
automated Sequence analysis of nucleic acids. Elec J Biotech 1(1): 23<br />
30<br />
Innis, M., D. Myambo, D. Gelfand, and M. Brow (1988) DNA sequencing with<br />
Thermus aquaticus DNA polymerase and direct sequencing of<br />
polymerase Chain reaction-amplified DNA. Proc Natl Acad Sci, 85:9436<br />
9440<br />
International Human Genome Sequencing Consortium (2001) Initial sequencing<br />
and analysis of the human genome. Nature 409: 860-921<br />
Isaksson, A. and U. Lan<strong>de</strong>gren (1999) Accessing genomic information:<br />
alternatives to PCR. Curr Opin Biotechnology 10: 11-15<br />
Kelley, J. (1994) Automated Dye-terminator DNA sequencing. Chapt 26.<br />
Automated DNA sequencing and analysis. Edit. Adams, M. C. Fields, J.<br />
Venter. Aca<strong>de</strong>mic Press, Inc. SD, USA. Pp. 175-181<br />
44
Kempe, T., W. Sundquist, F. Chow, and L. Hu (1985) Chemical and enzymatic<br />
biotin-labeling of oligo<strong>de</strong>oxyribonucleoti<strong>de</strong>s. Nucleic Acids Res 13:45-57<br />
Levine, J., Suzuki, D. El secreto <strong>de</strong> la vida. Dirección General <strong>de</strong> Divulgación<br />
<strong>de</strong> la ciencia, <strong>UNAM</strong>, México (2000).<br />
Lewin, B. (1997) Genes. Oxford University Press, Inc. New York. Pp. 472-477<br />
Lipshutz, R. and S. Fodor (1994) Advanced DNA sequencing technologies.<br />
Curr Opin Struct Biol 4:376-380<br />
Maxam, A. and W. Gilbert (1977) A new method for sequencing DNA. Proc Natl<br />
Acad Sci 74(2): 560-564<br />
Meldrum, D. (2000) Automation for genomics, part two: sequencers,<br />
microarrays, and future trends. Genome Res 10: 1288-1303<br />
Mullis, K (1990) The unusual origin of the polymerase chain reaction. Sci Am<br />
262(4):56-65<br />
Myers, G. (1999) Whole-genome DNA sequencing. Computing in Science &<br />
Engineering. IEEE pp. 33-43<br />
Olson, M. (1993) The human genome project. Proc Natl Acad Sci, USA. 90:<br />
4338-4344<br />
Prober, J. et al., (1987) A system for rapid DNA sequencing with fluorescent<br />
chain-terminating di<strong>de</strong>oxynucleoti<strong>de</strong>s. Science. 238: 336-341<br />
Rosenblum, B., L. Lee, S. Spurgeon, S. Khan, S. Menchen, C Heiner, and S.<br />
Chen (1997) New dye-labeled terminators for improved DNA sequencing<br />
patterns. Nucleic Acids Res 25(22):4500-4504<br />
Sanger, F., S. Nicklen, and A.R. Coulson (1977) DNA sequencing with chain<br />
terminating inhibitors. Proc Natl Acad Sci 74(12): 5463-5467<br />
Sanger, F. and A.R. Coulson (1978) The use of thin acrylami<strong>de</strong> gels for DNA<br />
sequencing. FEBS Lett 87(1): 107-110<br />
Sanger, F. (1988) Early nucleic acid chemistry. Trends Biochem Sci 13: 67-69<br />
45
Schlenk, F., (1988).Early nucleic acid chemistry, Trends Biochem. Sci., 13:<br />
67-69<br />
Smith, L., S. Fung, M. Hunkapiller, T. Hunkapiller, and L Hood (1985) The<br />
synthesis of oligonucleoti<strong>de</strong>s containing an aliphatic amino group at the<br />
5’ terminus: synthesis of fluorescent DNA primers for use in DNA<br />
sequence analysis. Nucleic Acids Res. 13(7): 2399-2412<br />
Smith, L. J. Sandlers, R. Kaiser, P. Hughes, C. Dodd, C. Connell, C. Heiner, S.<br />
Kent, and L. Hood (1986) Fluorescence <strong>de</strong>tection in automated DNA<br />
sequence analysis. Nature 321: 64-69<br />
Stewart, P. R. and D. Letham (1977), The ribonucleic acids, 2 nd Ed., Springer<br />
Verlag, NY, EUA, pp. 374.<br />
Tabor, S. and C. Richardson (1995) A single residue in DNA polymerases of<br />
the Escherichia coli DNA polymerase I family is critical for distinguishing<br />
between <strong>de</strong>oxy and di<strong>de</strong>oxyribonucleoti<strong>de</strong>s. Proc Natl Acad Sci, USA 92:<br />
6339-6343<br />
Tahara, T., J. Kraus, and L. Rosenberg (1990) Direct DNA sequencing of PCR<br />
Amplified genomic DNA by the Maxam-Gilbert method. BioTechniques<br />
8(4): 366-367<br />
Tang, K., P. Oeth, S. Kammerer, M. Denissenko, J. Ekblom, C. Jurinke, D. van<br />
<strong>de</strong>n Boom, A. Braun, and C. Cantor. (2004) Minin Disease<br />
susceptibility genes through SNP analyses and expression profiling<br />
using MALDI-TOF máss spectrometry. J. Proteome Res 3(2): 218-227<br />
Venter, C. et al. (2001) The sequence of the human genome. Science 291:<br />
1304-1351<br />
Voet, D. and J. Voet, (1995) Biochemistry, 2 nd Ed. John Wiley and Sons, Inc.<br />
NY, EUA<br />
Wang, D. et al. (1998) Large-scale i<strong>de</strong>ntification, mapping, and genotyping of<br />
single nucleoti<strong>de</strong> polymorphisms in the human genome. Science 280:<br />
1077-1082<br />
Watson, J. and F. Crick.(1953) Molecular structure of nucleic acids: structure for<br />
<strong>de</strong>oxyribose nucleic acids. Nature, 171: 737-738<br />
46
Weber, J. and E. Myers (1997) Human Whole-genome shotgun sequencing.<br />
Genome Res 7: 401-409<br />
Yager, T., L. Baron, R. Batra, A. Bouevitch, D. Chan, K. Chan, S. Darasch, R.<br />
Gilchrist, A. Izmailov, J. Lacroix, K. Marchellata, J. Renfrew, D. Rushlow,<br />
E. Stinbach, C. Ton, P. Waterhouse, H. Zaleski, J. Dunn, and J. Stevens<br />
(1999) High performance DNA sequencing, and the <strong>de</strong>tection of<br />
mutations and polymorphisms on the Clipper sequencer. Electophoresis<br />
20: 1280-1300<br />
Zimmermann, J., S. Wirmann, H. Voss, C. Schwager, and W. Ansorge (1994)<br />
Improved fluorescent cycle sequencing protocol allows reading nearly<br />
1000 bases. BioTechniques 17(2): 302-305<br />
47