Debe aprender: 1. Conceptos básicos de informática (linux+perl+R o python+matlab)
2 Conocimientos básicos de bioinformática (secuenciación + base de datos + formato de datos)
3. Campos de investigación de la bioinformática (genoma completo, transcriptoma completo, exoma completo, captura de secuenciación de la región objetivo)
4. Campos de aplicación de la bioinformática (detección de tumores, diagnóstico prenatal, epidemiología, medicina personalizada)
Divide y vencerás:
1. Para los conceptos básicos de informática, debes leer tres libros y aprenderlos paso a paso. No es necesario buscar ningún libro deliberadamente. En términos generales, Linux lo es. La especialidad de Niao Ge, Perl es Little Camel y R es R en acción. Sin embargo, solo puedes comenzar leyendo un libro. Si realmente quieres convertirte en un novato, ¡debes leer más de cinco libros cada uno! Tengo esta versión impresa básica de alta definición en mi disco en la nube. Puedes ir a Taobao e imprimirla por solo unas pocas docenas de yuanes con envío gratuito. Aquellos que sean más exigentes con los libros también pueden comprar la versión original, que solo cuesta. ¡Más de cien yuanes!
2. Conocimientos básicos de bioinformática y secuenciación. Encuentre más de una docena de artículos sobre secuenciadores de primera, segunda y tercera generación en la biblioteca de Baidu y léalos atentamente. Luego vaya a Youku para descargar explicaciones animadas. de los principales secuenciadores convencionales, y luego eche un vistazo a la explicación genética de Chen Wei; primero, consulte las tres bases de datos principales: NCBI, ENSEMBL, UCSC y algunas otras sobre las que también puede aprender (uniprot, IMGT, KEGG, OMIN, TIGR, GO) La biblioteca Baidu también busca información por sí misma, pero esta vez debe ir al sitio web oficial, hacer clic en cada página y traducir cada una al chino para comprenderla a fondo; se hablará mucho sobre el formato de los datos. Esto se aprende principalmente lentamente durante el proceso del proyecto, o si tienes la oportunidad de ir a clase; de lo contrario, leerás. Inmediatamente lo olvidé, que incluye principalmente sam, vcf, fasta, fastq, bed, gtf, gff, genbank, ensembl. , psl, etc.
3. Campo de investigación de bioinformática, cada campo contiene principalmente una variedad de software. Se estima que hay cientos de software de uso común en general, solo personas que han estado en el. Es probable que la industria los utilice todos durante más de cinco o seis años. Además, esto requiere completamente capacitación en proyectos, no solo leer el manual del software, sino también investigar. las revisiones de los principales expertos.
a) Software de bioinformática básica (blast++ suite, fastqc, flash, blast, solexaQA, NGS-QC-toolkit, SRA-toolkit, fastx-toolkit)
b) snp-calling software relacionado (bwa, bowtie, samtools, GATK, VarScan.jar, annovar)
c) Software relacionado con el genoma (velvet, SOAPdenovo2, repetición, repetición, pilar, orthoMCL, inparanoid, clustw, músculo, MAFFT, quickparanoid, blast2go, RAxML, phyML)
d) Software relacionado con el transcriptoma (trinity, tophat, cufflinks, RseQC, RNAseq, GOseq, MISO, RSEM, khmer, screed, trimmomatic, transDecoder, vast-tools, picard-tools, htseq, cuffdiff, edgeR, DEseq, funnet, davidgo, wego, kobas, KEGG, Amigo, go)