El punto de partida de la secuenciación de próxima generación (NGS) desde 2005 ha sido la invención de Roche 454, Illumina GA/HiSeq, Life SOLiD/Ion Torrent y PacBio RS. Las nuevas tecnologías han mejorado enormemente el rendimiento de la secuenciación y han reducido los costos de secuenciación. Este artículo presenta principalmente la tecnología de secuenciación Illumina de la plataforma BGI, la tecnología de secuenciación SMRT RS de Pacific Biosciences, la tecnología de secuenciación Oxford Nanopore y la tecnología de secuenciación DNBSEQ TM.
Esta tecnología es actualmente la plataforma de secuenciación del genoma de próxima generación más utilizada. Utiliza tecnología de síntesis durante la secuenciación para lograr una secuenciación paralela a gran escala. Fue desarrollado por primera vez por Solexa, por lo que también se le llama tecnología de secuenciación Solexa. La plataforma de secuenciación Illumina tiene una variedad de instrumentos para elegir, como secuenciadores de la serie HiSeq adecuados para centros y empresas de secuenciación, secuenciadores MiSeq y NextSeq500 adecuados para laboratorios y hospitales pequeños y medianos para secuenciación de diagnóstico médico y secuenciación de diagnóstico médico dedicada. MiniSeq. Los modos de clasificación se dividen en modo de cantidad de paso alto y modo rápido. Entre ellos, el modelo de Qualcomm es compatible con más volúmenes de muestra y tipos de aplicaciones, mientras que la secuenciación en modo rápido es más rápida y el costo de una sola operación es menor;
Los principios de la tecnología de secuenciación Solexa han sido introducidos en detalle por los internautas "Starry Sky Idealist" en Zhihu y "Z_Y_H" en plataformas como "":
(Análisis detallado 2 principios de secuenciación generacional! ——Artículo de Starry Sky Idealist——Zhihu
(Artículo sobre secuenciación de extremos emparejados de Illumina-z_y_h-).
Lo siguiente es sólo un breve resumen. El primer paso de este método es configurar la preparación de la biblioteca de secuenciación (Figura 1). El genoma se divide en pequeños fragmentos, se completan ambos extremos, se agrega la cola 3' y se agrega un conector especial de Illumina (oligo-T en un extremo), que contiene un sitio de escisión enzimática y es una hebra circular no complementaria. para formar un enlazador "esférico". Cuando se corta con una enzima de restricción, se forma un extremo en forma de "Y" para que pueda replicarse paso a paso. Agregue un fragmento complementario al cebador de amplificación posterior al final de la doble hebra (logrado a través de dos repeticiones, con diferentes secuencias de cebador en ambos extremos, establecidas en P5 y P7), y agregue una etiqueta dentro del cebador (diferentes etiquetas en ambos extremos). ). Si es necesario, utilice la enzima Taq para despuntar las puntas. Para realizar bien el trabajo anterior, es necesario realizar la purificación. Solo las secuencias con adaptadores agregados correctamente se pueden usar en reacciones posteriores para eliminar impurezas como cebadores y enzimas. Las operaciones anteriores se pueden realizar en toda la biblioteca a la vez.
Después de la purificación, la biblioteca se amplifica y agrupa con el objetivo de amplificar la señal de secuenciación. En una celda de flujo con ocho carriles, la biblioteca de secuenciación desnaturalizada es específicamente complementaria a los oligonucleótidos (P5', P7') fijados en la pared de vidrio del carril y replicados en una ronda (5'-->:3'), el La plantilla se corta y se lava, y la cadena complementaria se sintetiza a partir del oligonucleótido fijado en el chip. Luego comienza la amplificación del puente, amplificando la biblioteca que contiene los fragmentos de ADN a aproximadamente 1000 copias, cada una con la misma secuencia de ADN, formando un grupo. El producto de amplificación final se reduce a una sola hebra y se puede utilizar para la secuenciación de extremos pares. Sin embargo, es una práctica común escindir selectivamente la secuencia directa o inversa del conector mediante escisión selectiva de 8-oxoguanosina (8-oxog) usando formamidopirimidinglucosidasa (Fpg) para evitar el efecto excesivo del espaciamiento cercano de las cadenas en la adición de secuencia. Si la secuencia inversa se corta primero, después de la medición, repita la reacción anterior hasta la escisión selectiva, corte la secuencia directa y realice la secuencia inversa.
El tercer paso es el proceso de secuenciación. La plataforma Illumina utiliza tecnología SBS y tecnología de terminador reversible de bloqueo de 3' para la secuenciación. La tecnología de terminación con blindaje reversible en el extremo 3' utiliza nucleótidos especiales con etiquetas fluorescentes. El grupo 3'-hidroxilo de este nucleótido está protegido por un grupo químico, lo que da como resultado que solo se agregue un nucleótido por síntesis de cadena de ADN. Pero cuando se registran imágenes de fluorescencia, el grupo de protección química se escinde mediante escisión enzimática, se restablece la conectividad en el extremo 3', y así sucesivamente.
Es concebible que inicialmente la biblioteca desnaturalizada contenga hebras complementarias de plantilla (las dos etiquetas son indistinguibles) y se secuencian simultáneamente en un proceso. Por lo tanto, al recopilar resultados de secuenciación de lectura única, es necesario identificar las hebras complementarias para evitar confusiones. empalme de secuencia. La secuenciación directa e inversa de extremos emparejados mejora en gran medida la eficiencia de la secuenciación.
Dado que la tecnología de secuenciación de Illumina utiliza el principio de amplificación y agrupación de señales, su longitud de lectura no puede alcanzar el nivel de secuenciación de primera generación, porque después de la amplificación a varios cientos de bases, debido al nucleótido Debido a la influencia de concentración y actividad enzimática, la adición de bases dentro del grupo ya no está sincronizada. Si no está sincronizada, la señal se confundirá, lo que dará como resultado secuencias de lectura inexactas.
Esta tecnología es una tecnología de secuenciación de ADN de una sola molécula en tiempo real lanzada por Pacific Biosciences, basada en el principio de secuenciar durante la síntesis. La característica principal de esta tecnología son las lecturas largas, con una secuencia promedio superior a 10 kb y la longitud de lectura más larga de hasta 40 kb. Utiliza células SMRT como portador de secuenciación. La celda SMRT es una pieza de metal de 100 nm de espesor, con 150.000 (2014) pequeños orificios de un diámetro de decenas de nanómetros en un lado, llamados guías de ondas de modo cero (ZMW), también conocidos como nanoporos. Durante la secuenciación, el sistema coloca la biblioteca de secuenciación, la ADN polimerasa y el ADNd con diferentes etiquetas fluorescentes en la parte inferior del nanoporo para la síntesis de ADN. Normalmente, el nanoporo inmoviliza la ADN polimerasa Phoenix y la plantilla de ADN.
Lo especial de este método es que la biblioteca de secuenciación no requiere amplificación, porque la guía de ondas de modo cero puede eliminar en gran medida el ruido de fondo de fluorescencia y la fluorescencia liberada por reacciones de una sola molécula también se puede medir con precisión. grabado. Además, se utilizó tecnología SMRT para detectar que la posición de unión del grupo fluorescente marcado y el desoxinucleótido no está en la base, sino en el tercer grupo fosfato del grupo 5' fosfato, de modo que cuando la plantilla de secuenciación de unión complementaria de dNTP y Después de la reacción de condensación del cebador de secuenciación, el grupo fluorescente se escinde junto con el pirofosfato, eliminando el paso de digestión enzimática.
En 2014, Oxford Nanopore lanzó varios secuenciadores basados en tecnología de secuenciación de nanoporos, como MinION, PromenthION, GridION, etc. El principio básico es aplicar un voltaje determinado a ambos extremos de un nanoporo lleno de electrolito, y la intensidad de la corriente a través del nanoporo se puede medir fácilmente. El diámetro del nanoporo sólo puede acomodar el paso de un nucleótido. Cuando los nucleótidos pasan, el nanoporo es bloqueado por los nucleótidos y la intensidad de la corriente que pasa se vuelve más débil. Debido a las diferentes conformaciones espaciales de las cuatro bases de nucleótidos, cuando pasan a través del nanoporo, los cambios en la intensidad de la corriente debilitada son diferentes. Por lo tanto, la secuenciación en tiempo real sólo se puede lograr detectando cambios en la intensidad de la corriente cuando el ADN pasa a través del nanoporo.
Este método no requiere amplificación de la biblioteca, puede leer moléculas individuales a largo plazo, en tiempo real, y puede reducir en gran medida los costos de secuenciación.
Esta tecnología se deriva de la genómica completa y se ha mejorado en BGI. Según el artículo del sitio web oficial de BGI, se explica brevemente el principio de este método.
Según el proceso de la Figura 2, BGI utiliza tecnología de nanoesferas de ADN para amplificar secuencias de ADN, en las que el ADN se divide en fragmentos de aproximadamente 100 pares de bases. Cada lado de este segmento está conectado al primer conector, el Conector 1. Los fragmentos de ADN ligados se amplifican y se forman fragmentos de secuencia conectados circularmente combinando adaptadores en ambos extremos. Corte el fragmento de ADN circular para agregar un segundo adaptador, el adaptador 2, y repita el proceso de amplificación y circularización. Se añaden al fragmento de ADN cuatro adaptadores, a saber, los adaptadores 1, 2, 3 y 4 (las secuencias de los cuatro adaptadores son diferentes, algunos son oligonucleótidos complementarios a los cebadores, algunos son marcadores, etc.) y se amplifica el producto final. a través del círculo rodante ADN circular para crear nanoesferas de ADN (DNB). En la amplificación con bola rodante, no se corta cada copia. En cambio, sin afectar la extensión, se utiliza un método determinado para desnaturalizar la amplificación para obtener un conjunto de nanoesferas de copias múltiples. Las nanoesferas están ancladas en una red de agujeros en el chip.
Utilizando la secuenciación de ligadura anclada a sonda (CPAS) y la secuenciación de extremos pares con amplificación de desplazamiento múltiple (MDA-PE) para aumentar la longitud de lectura de la secuenciación, se pueden detectar secuencias de extremos pares de 100 pb/150 pb. Hasta la fecha, las técnicas combinatorias de polimerización anclada a sonda no se han descrito en detalle. El principio específico de MDA-P es que después de secuenciar la primera cadena mediante extensión de replicación, bajo la acción de una polimerasa de alta fidelidad con función de desplazamiento de cadena, se elimina la plantilla de la primera cadena, se sintetiza la segunda cadena y se ancla la molécula de ADN. pares La segunda hebra está secuenciada.
En comparación con otras secuenciaciones de segunda generación, la tecnología de secuenciación DNBSEQ TM se basa en DNB y utiliza la plantilla original para la amplificación, que es diferente del crecimiento exponencial de la PCR.
Lo más importante es que no se acumularán errores durante el proceso de amplificación.
Cheng Haofeng. Tecnología de secuenciación del genoma de próxima generación [M]. Primera edición. Beijing: Science Press, 2016.
【2】¡Análisis detallado de los principios de la secuenciación de segunda generación! ——Artículo de Starry Sky Idealist - Zhihu.
[3] secuenciación de extremos emparejados de Illumina-Parte Z_Y_H-.
[4] Huada Technology-Productos y servicios-Secuenciación completa del exoma-Introducción del producto.
[5] Descifrando el genoma humano: secuenciación de próxima generación - (1) - Artículo de Zhou Jing - Lexicología.