Mirando hacia atrás en la historia de la secuenciación, se han formado tres métodos de secuenciación, desde la secuenciación de Sanger en la década de 1970 hasta la segunda secuenciación en la década de 1990, y luego al método de secuenciación más largo. Los tres procedimientos de secuenciación brindaron soporte técnico para obtener secuencias genéticas de manera rápida y eficiente.
La reacción de terminación didesoxi desarrollada por Sanger en la década de 1970 puede completar la secuencia más larga de 1000 pb. Dado que la precisión de secuenciación de esta tecnología llega al 99,999%, se ha utilizado para completar la secuenciación del genoma (método Sanger modificado) en el Proyecto Genoma Humano. Sin embargo, no es adecuado para secuenciar genomas grandes debido a su bajo rendimiento (sólo se puede detectar una secuencia a la vez) y su alto costo.
La idea principal del método Sanger es construir cuatro sistemas de reacción (A, T, G, C), y añadir cebadores, ADN polimerasa, cuatro tipos de dNTP y una determinada proporción de ddNTP ( marcados radiactivamente) respectivamente. Mediante la adición de ddNTP se detiene la síntesis de la cadena complementaria. Por supuesto, la combinación de ddNTP es aleatoria, pero dentro de un tiempo determinado, ddNTP combinará todos los sitios. Aunque habrá ddNTP y dNTP unidos al mismo sitio, solo se detectarán d dNTP en experimentos de electroforesis en gel y autorradiografía, y la secuencia que se va a probar se puede deducir mediante complementación de bases.
Los experimentos de PCR aparecieron en 1983, por lo que si quieres establecer estos cuatro sistemas de reacción, no necesariamente tienes que tener múltiples cadenas plantilla. ¿Qué otros métodos existen además de la amplificación de tantas cadenas molde? En otras palabras, ¿cómo obtener estas cadenas de plantillas?
Existen diferentes plataformas para la secuenciación de segunda generación, entre ellas el secuenciador Roche 454, Illumina Solex/Hiseq y ABI solid fase, de las cuales Illumina Hiseq tiene una mayor cuota de mercado (75%). La característica principal del método de secuenciación de extremos pares de PE desarrollado por él es que el rendimiento mejora enormemente mediante la amplificación por PCR en puente.
Algunos términos que deben entenderse
Construyendo una biblioteca
El ultrasonido rompe las moléculas de ADN en fragmentos de secuencia de 300-800 pb de largo (el genoma humano tiene 300-500 pb) , aplánelo con enzima, luego agregue una base A al extremo 3 '(porque hay una T que sobresale en el extremo 3' del adaptador), luego agregue adaptadores complementarios a ambos extremos y luego amplifique mediante PCR para alcanzar un cierto concentración, formando una biblioteca de ADN monocatenario.
El enlazador tiene dos funciones principales, 1. Lograr una amplificación de puente de alta eficiencia; 2. Puede lograr una secuenciación de extremos emparejados.
La clave para unir la PCR es diseñar los adaptadores 5' y 3' de la secuencia a probar y los adaptadores complementarios de los carriles de la celda de flujo. El proceso de PCR puente se puede entender amplificando la hebra sentido, que incluye principalmente los siguientes pasos:
En resumen, debido al diseño del adaptador y las características del emparejamiento complementario, solo la hebra sentido puede entenderse. conservarse para la secuenciación.
El principio de secuenciación es secuenciar mientras se sintetiza, agregando una base fluorescente a la vez y detectando la señal fluorescente, y luego apagándola inmediatamente para completar la siguiente ronda de detección de señal de base. El orden de secuenciación de extremos pares es secuenciar primero la cadena sentido, luego secuenciar la secuencia índice y finalmente secuenciar la secuencia de la cadena antisentido.
Pasos de secuenciación para cada ronda de hebras sensoriales:
Después de secuenciar todas las hebras sensoriales, la síntesis se denomina elución y luego comienza la detección de la secuenciación índice. Primero, se secuencia el sitio de unión del cebador hasta el índice 1 y se eluye el producto sintetizado. Luego, p5 de la cadena sentido es complementaria a P5' en el carril para completar la secuenciación del índice2 y el producto se eluye.
Después de eliminar por lavado el producto index2, la doble hebra aún se obtiene mediante amplificación del puente y luego se desnaturaliza para obtener la hebra delantera original y la nueva hebra inversa, y se retira la hebra delantera medida. Luego, al igual que en la prueba directa, los cebadores se conectan primero, pero el sitio de conexión es el sitio de unión del cebador 2 y la secuencia de la cadena inversa se obtiene después de la prueba.
El proceso desde la generación de señales fluorescentes hasta la identificación de secuencias de bases incluye principalmente siete pasos: corrección de imágenes (es decir, corrección espacial), identificación de grupos, corrección de fluorescencia (es decir, corrección óptica), imágenes/preprocesamiento (es decir, calibración química), llamadas base, PF (algoritmo de filtrado de paso predeterminado de Illumina) y evaluación de calidad.
Entre ellos, el principio de funcionamiento de la cámara para identificar bases: se utiliza una cámara CCD (1) para identificar cada cúmulo y determinar sus coordenadas (2) extraer las cuatro longitudes de onda de A, G, C; y T respectivamente. Valor de intensidad de la señal para cada grupo.
Además, el proceso de toma de fotografías lleva bastante tiempo. La señal generada en un ciclo tarda unos 40 minutos en completar la colección de fotografías. Es más rápido utilizar la función de escaneo de su cámara.
En resumen, de acuerdo con el adaptador diseñado y el sitio de unión del cebador, la secuenciación de la cadena sentido, la cadena índice y la cadena antisentido se puede completar al mismo tiempo. Por supuesto, el control de calidad después de obtener datos de secuenciación implica otros conocimientos, y la interpretación de los resultados del control de calidad también requiere un estudio cuidadoso.
Tres vídeos para entender los principios de la secuenciación