Explicación del término del conocimiento de secuenciación

1. Profundidad de lectura Profundidad de lectura: el número de lecturas obtenidas al secuenciar una muestra se relaciona fácilmente con la cobertura de la secuenciación del genoma (cuántas regiones genómicas se han detectado) y la profundidad de secuenciación (el número de veces que se ha analizado un solo nucleótido); detectados o todos los núcleos). profundidad promedio de los glucósidos) confusión.

2. Longitud de lectura corta: la longitud máxima de lectura obtenida mediante la secuenciación es de 500 pb, y la longitud del fragmento de secuenciación común es de 100 a 300 pb. Las lecturas cortas y los fragmentos de secuenciación largos en este artículo representan la longitud de lectura corta. fragmentos de ARNm medidos y ARNm degradado.

3. Lectura larga Longitud de lectura larga: las lecturas de más de 1000 pb obtenidas mediante secuenciación representan ARNm de longitud completa o casi completa en este artículo.

4. Secuenciación directa de ARN (dRNA-seq): Una tecnología de secuenciación que secuencia directamente ARN en lugar de ADNc, generalmente utilizada para secuenciar ARNm de longitud completa o casi completa.

5. Múltiples lecturas de mapas y múltiples lecturas de alineación: Las lecturas secuenciadas a partir de regiones homólogas del transcriptoma no pueden confirmar con precisión el origen de sus transcripciones o genomas.

6. Lectura larga sintética Lectura larga sintética: un método para obtener una lectura larga combinando múltiples lecturas cortas.

7. Identificadores moleculares únicos (UMI): secuencias cortas o códigos de barras añadidos al construir bibliotecas de RNA-seq antes de la amplificación. Idealmente, cada transcripción está asociada con un identificador único, las lecturas que contienen ese identificador se derivan todas de esa transcripción y la transcripción se cuenta solo una vez cuando se cuantifica. Puede usarse para reducir el sesgo cuantitativo de RNA-seq, especialmente en experimentos unicelulares con cantidades iniciales bajas de ARN.

8. Longitud de lectura: La longitud de una única lectura de secuenciación. La longitud obtenida mediante secuenciación de ARN de lectura corta suele ser de 50-150 pb.

9. Sensibilidad: ¿Qué proporción de transcripciones en la muestra se detectarán? Cuanto mayor sea la sensibilidad, mayor será la relación. Se ve afectado por el procesamiento de muestras, la preparación de la biblioteca, la secuenciación y las preferencias computacionales.

10. Especificidad Especificidad: método que mide la proporción de transcripciones expresadas diferencialmente que se identifican correctamente, lo que se ve afectado por el procesamiento de muestras, la preparación de la biblioteca, la secuenciación y las preferencias computacionales.

11. Tasa de repetición: Proporción de lectura repetida: la proporción de lecturas de secuenciación en la misma posición en el transcriptoma. En las bibliotecas de RNA-seq, algunas transcripciones pueden tener altas tasas de repetición debido a sus altos niveles de expresión en la muestra. Los genes altamente expresados ​​tienen una alta tasa de duplicación, mientras que los genes poco expresados ​​pueden tener la tasa de duplicación más pequeña. Por lo tanto, RNA-seq enfrenta desafíos. La mayoría de las duplicaciones en esta técnica probablemente sean señales verdaderas de transcripciones altamente expresadas, y el resto se debe a un sesgo de amplificación y secuenciación.

12. Secuenciación de un solo extremo Secuenciación de un solo extremo (SE): Secuencia sólo un extremo de un fragmento de ADNc. Debido a su bajo coste, se suele utilizar en proyectos que sólo se centran en la expresión genética diferencial. (Fundación NGS - Principios de secuenciación de alto rendimiento)

13. Secuenciación de extremos emparejados Secuenciación de extremos emparejados (PE): secuencia ambos extremos de un fragmento de ADNc por separado, lo que permite secuenciar más bases del ADNc. Secuenciación para identificar mejor los sitios de empalme, que se utiliza a menudo en proyectos de análisis de expresión genética diferencial.

14. Replicación biológica: Se realizan múltiples pruebas en muestras de diferentes fuentes biológicas, como tejidos de tres individuos, para capturar cambios en los propios individuos biológicos, este cambio es el objeto que se estudia o es; ruido. Por el contrario, las réplicas técnicas son operaciones repetidas con la misma muestra (por ejemplo, tres veces en un tejido).

15. Matriz de expresión: el archivo de datos principal del proyecto de expresión diferencial RNA-seq. Cada fila representa un ARN, como un gen o una transcripción. Cada columna es una muestra de secuencia. Los valores de la matriz son las lecturas de cada ARN. Estas pueden ser estimaciones de recuento de isoformas de transcripción, que a menudo se normalizan antes de un análisis posterior.

16. Control interno de control incorporado: una biblioteca de ácidos nucleicos exógenos añadidos a la muestra a una concentración específica. Generalmente son ARN presintetizados en concentraciones variables y se utilizan para controlar la eficiencia de la reacción y las desviaciones del método técnico, así como los resultados falsos negativos.

17. Espatiomica: Método de análisis del transcriptoma que preserva la información espacial de cada transcrito en una muestra determinada (normalmente una sección de tejido).

18. ARN naciente: El ARN recién transcrito corresponde al ARN que ha sido procesado y transportado al citoplasma.

19. Grupo de traducción Grupo de traducción: conjunto de ARNm que se traducen en proteínas en células, tejidos u organismos.

20. Grupo estructural: Conjunto de estructuras secundarias y terciarias de ARN en células, tejidos u organismos.

21. Interactoma: Conjunto de interacciones moleculares en células, tejidos y organismos, incluidas las interacciones ARN-ARN o ARN-proteína.

22. Expresión genética diferencial (DGE) Genes diferenciales: genes cuya expresión ha cambiado significativamente en los dos grupos experimentales.