Tecnologías de secuenciación de ADN

A pesar del gran avance obtenido a lo largo de los años en la técnica de secuenciación de Sanger, esta comenzó a quedarse rezagada con respecto a la demanda en cuanto a velocidad y efectividad necesarias para la secuenciación genómica. Su principal limitante es la obtención de clonas para hacer las librerías de ADN, adicionalmente, la secuenciación de Sanger a gran escala resulta inviable económicamente.


Debido a esto, se han desarrollado nuevas tecnologías de secuenciación masiva que permiten obtener genomas completos a costos razonables y cada vez más rápido. La secuenciación de ADN de alto rendimiento la llevan a cabo principalmente Centros Genómicos grandes que continuamente se encuentran optimizando los procesos de secuenciación y controles de calidad cuyo rendimiento promedio se compararía a la secuenciación de un genoma de mamífero completo en seis meses a un costo de 12 millones de dolares, con el objetivo de bajar los costos hasta mil dolares.

Las técnicas de secuenciación masiva más exitosas han sido las basadas en la ADN polimerasa. Los esfuerzos en el desarrollo de nuevas tecnologías se han centrado dos aspectos: Una mejor resolución de los fragmentos obtenidos y la rápida y fidedigna detección de los nucleótidos marcados con fluoróforos.

Pirosecuenciación

Una técnica de secuenciación que no está basada en el método de Sanger es la llamada Pirosecuenciación, descrita por primera vez en 1988. Esta técnica se basa en medir la producción de pirofosfato, que es convertida proporcionalmente a luz por una serie de reacciones enzimáticas. En esta técnica no se usan nucleótidos marcados con fluoroforos, en vez de eso, se añaden nucleótidos en cantidades controladas; una vez que la ADN polimerasa reconoce un par complementario extiende la cadena sintetizada de ADN, liberando el grupo pirofosfato del nucleótido, y se detiene cuando no lo encuentra. Para reiniciar la síntesis se añaden más nucleótidos. El pirofosfato es usado en una serie de reacciones enzimáticas para producir luz por medio de la luciferasa (la enzima usada por las luciérnagas para producir luz). La luz generada por la cascada enzimática se registra como una serie de destellos de luz llamada pirograma y corresponde con el orden de los nucleótidos complementarios, revelando así la secuencia de ADN.

A pesar de la elegancia y la efectividad en la pirosecuenciación, por ejemplo, para análisis serial de expresión de genes (SAGE, por sus siglas en inglés), para estudios de perfiles de polimorfismo por sustitución simple (SNP, por sus siglas en inglés), mapeo de genomas con relación a un genoma de referencia, este método tiene ciertas limitaciones; el largo de las secuencias que se pueden leer actualmente es de alrededor de 100 pares de bases (muy poco considerando que los métodos basados en la técnica de Sanger pueden leer cerca de 800 pares de bases), adicionalmente, las repeticiones de homopolímeros de más de cinco pares de bases no se pueden medir cuantitativamente de manera confiable, lo que supone ciertos problemas al momento de secuenciar de novo para descubrir nuevos perfiles de SNP.

Para convertir a la pirosecuenciación en una estrategia útil para la secuenciación a gran escala necesaria para estudios genómicos, la Corporación 454 desarrolló una tecnología optimizando el protocolo para volúmenes pequeños usando mini reactores del orden de picolitros y mostraron su utilidad secuenciando el genoma completo de Mycoplasma genitalium, de secuencia ya conocida, con una cobertura del 96% y una efectividad del 99.9% en una sola corrida de 4 horas, y la secuenciación y ensamblaje de novo del genoma bacteriano de Streptococcus pneumoniae.

El ensamblaje de secuencias obtenidas por métodos no derivados de la técnica de Sanger, a pesar de ser de mejor calidad (pero de segmentos más cortos) y con mayor cobertura tienen más dificultades cuando se presentan secuencias repetitivas, convirtiendo esto en un problema computacional. Sin embargo, también se han desarrollado estrategias se secuenciación que permiten subsanar problemas como este. Uno de esos métodos es el de secuenciación de finales pareados (PET, por sus siglas en Inglés; Paired-Ends Tags) que permite extraer segmentos cortos de ADN para secuenciación a partir de segmentos largos y un ensamblaje de estos segmentos.

Las mejoras en la velocidad de lectura, la eficiencia, la sensibilidad y la capacidad de llevar a gran escala la secuenciación de ADN generará a una reducción de costos cada vez mayor. La integración de tecnologías multidisciplinarias permitirá el desarrollo de dispositivos capaces de realizar análisis de genomas completos y su aplicación en temas de salud, ecología y bioremediación.

La microbiología en la era genómica

En el área de microbiología, la genómica ha brindado mucho campo de trabajo. Hace unas décadas se consideraba un gran logro tener el genoma completo de un representante de un taxón microbiano, hoy en día es totalmente inadecuado para describir las interrelaciones que hay en los géneros bacterianos. Uno de los aspectos que se han revolucionado con la genómica es la tipificación de bacterias, en donde se ha puesto en evidencia que los métodos tradicionalmente utilizados no son aplicables a estudios globales de clasificación bacteriana. Se ha visto, por ejemplo, que el genoma de una especie bacteriana es varias veces más grande que el genoma de una sola bacteria; el genoma de una especie bacteriana contiene secuencias “core” (que incluyen genes que codifican para proteínas involucradas en funciones esenciales como la traducción y la transcripción) y secuencias no esenciales que codifican para funciones de adaptación y son las que presentan mayores índices de variabilidad.

Otro aspecto importante dentro de la microbiología es la Metagenómica, que busca estudiar, a nivel genómico, a todos los microorganismos contenidos en un medio ambiente determinado; suelo, agua, heces, un medio acuático particular, los microorganismos de un hospital que causan infecciones nosocomiales, la cavidad oral, etc., que también permiten hacer estudios filogenéticos.

La genómica comparativa a revelado que cada vez que una nueva cepa es secuenciada se descubren cerca de 30 genes nuevos. Este descubrimiento nos lleva a un nuevo concepto; el Pangenoma, que es el repertorio completo de genes que tiene una especie. Esta teoría predice que existen dos grupos de genes en los microorganismos, uno contiene aquellos que son indispensables y que están presentes en todos los individuos de una especie, y otro grupo de genes no indispensables que pueden o no estar presentes en determinado organismo. Sólo se podrá tener un panorama completo de un Pangenoma al secuenciar los genomas completos de más organismos de la misma especie. Por ejemplo, en el caso de Bacillus anthracis, después de secuenciar cuatro genomas no se encontraron más genes nuevos, mientras que se estima que para conocer el Pangenoma completo del grupo B de Streptococcus y de Escherichia coli se necesitan más de cien genomas.


Ir al MAPA DEL SITIO para ver contenido de otras áreas (Bioquímica, Inmunología, Biología...)



BIBLIOGRAFIA

Hyman, E.D. (1988). A new method of sequencing DNA. Analytical Biochemistry Vol. 174. Issue 2:423-436.
Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlén, M., Nyrén, P. (1996). Real-time DNA sequencing using detection of pyrophosphate release. Analytical Biochemistry Vol. 242:84-89.
Margulies, M., et al. (2005). Genome sequencing in open microfabricated high density picoliter reactors. Nature Vol. 437:376-380.
Metzker, M.L. (2011). Emerging technologies in DNA sequencing. Genome Research 15:1767-1776.
Riesenfeld, C.S., Schloss, P.D., Handelsman, J. (2004). METAGENOMICS: genomic analysis of microbial communities. Annu. Rev. Genet. 38:525–52.
Tringe, S.G., Mering, C., et al. (2005). Comparative metagenomics of microbial communities. Science 308:554-557.
Werner, T. (2010). Next generation sequencing in functional genomics. Briefings in Bioinformatics Vol. 11 No. 5:499-511.