Introducción a la Bioinformática

Contenidos 1 Pinyin 2 Referencia en inglés 3 Principales contenidos de investigación actual en bioinformática 3.1 Obtención de genomas completos de humanos y diversos organismos 3.2 Descubrimiento de nuevos genes y nuevos polimorfismos de un solo nucleótido 3.3 No codificación en el genoma Proteína 3.4 Estudio de la evolución biológica a nivel genómico 3.5 Estudio comparativo de genomas completos 3.6 Del genoma funcional a la biología de sistemas 3.7 Simulación de estructuras proteicas y diseño de fármacos 3.8 Investigación sobre la aplicación y desarrollo de la bioinformática 1 Pinyin

shēng wù xìn xī xué 2 Referencia en inglés

Bioinformática

La Bioinformática (Bioinformática) es una materia interdisciplinar emergente. Mucha gente pensará que la bioinformática implica tanto la biología como la física, por lo que debe ser un área temática muy amplia. De hecho, su connotación es muy específica y su alcance muy claro. La bioinformática surgió con la investigación del genoma, por lo que su contenido de investigación se desarrolla estrechamente con la investigación del genoma.

A grandes rasgos, la bioinformática se dedica a la adquisición, procesamiento, almacenamiento, distribución, análisis e interpretación de información biológica relevante para la investigación genómica. Esta definición incluye dos significados: uno es la recopilación, organización y servicio de datos masivos, es decir, gestionar estos datos es descubrir nuevos patrones a partir de ellos, es decir, hacer un buen uso de estos datos;

Específicamente, la bioinformática utiliza el análisis de información de la secuencia del ADN genómico como fuente para encontrar las regiones codificantes que representan proteínas y genes de ARN en la secuencia del genoma, al mismo tiempo que dilucida el genoma; Se descifra la esencia de la información de las regiones no codificantes que existen en grandes cantidades en la secuencia del ADN. Sobre esta base, se resumen y organizan los datos de los perfiles de transcripción y de las proteínas relacionados con la liberación y regulación de la información genética del genoma. Comprender las leyes del metabolismo, desarrollo, diferenciación y evolución.

La bioinformática también utiliza información de regiones codificantes del genoma para simular estructuras espaciales de proteínas y predecir funciones de proteínas, y combina esta información con información fisiológica y bioquímica sobre organismos y procesos vitales para dilucidar su mecanismo molecular y, finalmente, llevar a cabo realizamos diseño molecular de proteínas y ácidos nucleicos, diseño de fármacos y diseño de atención médica personalizada.

La informática genómica, el cálculo y la simulación de la estructura de las proteínas y el diseño de fármacos giran estrechamente en torno al dogma central de la transmisión de información genética y, por tanto, están inevitablemente conectados de forma orgánica.

¿Por qué la investigación genómica necesita apoyarse en la bioinformática? En primer lugar, con la investigación del genoma se ha producido un crecimiento explosivo de la información relacionada y existe una necesidad urgente de procesar cantidades masivas de información biológica. Desde que los científicos descifraron el genoma de Haemophilus influenzae con una longitud total de 1,8 millones de nucleótidos en 1995, se han secuenciado el genoma completo de unos 60 microorganismos y varios organismos eucariotas, como levaduras, nematodos, moscas de la fruta y Arabidopsis thaliana. En la primavera de 2001, los científicos anunciaron la secuencia de la mayor parte del genoma humano, es decir: un borrador de trabajo del genoma humano. Estos logros significan que la investigación del genoma entrará en una nueva etapa de extracción de información y análisis de datos. Según estadísticas de bases de datos internacionales, el número de bases de ADN era de 3.000 millones en diciembre de 1999, 6.000 millones en abril de 2000 y actualmente ha llegado a 14.000 millones, duplicándose aproximadamente cada 14 meses. Al mismo tiempo, el crecimiento del poder de procesamiento digital de los chips electrónicos de computadora equivale a duplicarse cada 18 meses. Como resultado, las computadoras pueden administrar y ejecutar de manera eficiente grandes cantidades de datos.

Sin embargo, la razón más fundamental es la complejidad de los datos genómicos. El llamado genoma de un determinado organismo se refiere a la suma de todo el material genético del organismo. El material genético de los organismos es un tipo de macromolécula biológica llamada ácido desoxirribonucleico (ADN), que está compuesto por cuatro tipos de nucleótidos conectados en serie, generalmente representados por los caracteres A, T, G y C. En términos sencillos, el código genético de un organismo es una larga cadena lineal de estos cuatro caracteres. Esta cadena suele ser muy larga. Por ejemplo, el código genético humano contiene 3.200 millones de caracteres. Al apilarlos se forma un "libro celestial" con más de 1 millón de páginas y 3.000 caracteres por página.

Este "libro celestial" contiene una gran cantidad de información sobre la estructura y función del cuerpo humano y el proceso de las actividades de la vida, pero sólo consta de 4 caracteres. No tiene léxico, sintaxis ni puntuación. Cada página es similar. . Cómo leerlo es un gran problema. En última instancia, la investigación del genoma consiste en transformar los problemas biológicos en problemas de procesamiento de símbolos digitales. Para resolver tales problemas, debemos desarrollar nuevas teorías, métodos, técnicas y herramientas analíticas, y debemos confiar en el procesamiento de información por computadora.

La participación en la investigación bioinformática debe tener una base científica multifacética. En primer lugar, requiere una cierta cantidad de potencia informática, incluido el correspondiente equipo de software y hardware. Es necesario disponer de varias bases de datos o poder comunicarse eficazmente con sistemas de bases de datos nacionales e internacionales. Debe haber un sistema de Internet desarrollado y estable; al mismo tiempo, la bioinformática requiere algoritmos y software potentes e innovadores. Sin innovación algorítmica, la bioinformática no puede lograr un desarrollo sostenido. Finalmente, debe establecer conexiones amplias y estrechas con la ciencia experimental, especialmente con métodos automatizados de investigación biológica a gran escala y de alto rendimiento y tecnologías de plataforma. Estas tecnologías no son sólo los principales métodos para generar datos bioinformáticos, sino también el medio clave para verificar los resultados de la investigación bioinformática. Por lo tanto, quienes se dedican a la investigación bioinformática también deben poseer conocimientos multidisciplinarios.

La investigación y aplicación de la bioinformática en mi país tiene cierta base, por lo que se espera lograr resultados revolucionarios. Esto es muy importante para fortalecer la fuerza de nuestro país en el campo de la investigación básica y ocupar una posición de liderazgo internacional en. algunos aspectos. La aplicación de los resultados de la bioinformática también producirá enormes beneficios sociales y económicos. 3 Principales contenidos actuales de la investigación en bioinformática 3.1 Obtención del genoma completo del ser humano y de diversos organismos

El objetivo principal de la investigación del genoma es obtener el conjunto completo de códigos genéticos humanos. El código genético humano tiene 3.200 millones de bases, pero los secuenciadores de ADN actuales sólo pueden leer de cientos a miles de bases por reacción. En otras palabras, para obtener el código genético completo de una persona, primero se debe dividir el genoma humano en pedazos, luego se deben secuenciar las secuencias de cada pequeño segmento y luego volver a unirlas.

Sin embargo, es fácil imaginar que si rompes un libro en pedazos del mismo tamaño, nunca podrás volver a armarlos correctamente. Esto se debe a que la conexión contextual del libro es deficiente. perdido al romperlo. ¿Qué hacer? Podemos tomar dos libros idénticos y romperlos en pedazos según diferentes métodos de desgarro. Al cruzar diferentes fragmentos y encontrar las mismas palabras, se puede restaurar parcialmente la conexión contextual del libro. Cuantos más libros rompas, más conexiones contextuales restaurarás. Por lo tanto, para obtener el conjunto completo del código genético de una persona, sus 3.200 millones de genes no pueden analizarse sólo una vez, sino muchas veces. Por ejemplo, el borrador de trabajo del genoma humano publicado en Nature and Science a principios de este año informó que contiene alrededor de 2.900 millones de bases, con una cobertura de mapa físico del 96% y una cobertura de secuencia del 94%. Más del 90% de los grupos de secuencia continua tienen más de 100.000 bases; aproximadamente el 25% de los grupos de secuencia continua tienen más de 10 millones de bases. En estas secuencias se encontraron entre 30.000 y 40.000 genes codificadores de proteínas. Obtener una imagen así equivale a analizar el genoma humano unas 5 veces. Para lograrlo, es necesario alinear y conectar decenas de millones de pequeños fragmentos, lo que a menudo se denomina empalme y ensamblaje de datos de secuencia del genoma.

Cada aspecto de la secuenciación del genoma a gran escala está estrechamente relacionado con el análisis de la información. Desde el muestreo y análisis de la densidad óptica del secuenciador, la lectura de bases, la identificación y eliminación de vectores, el empalme, el llenado de espacios en la secuencia, hasta la identificación de secuencias repetidas, la predicción del marco de lectura y la anotación de genes, cada paso depende estrechamente del software y la base de datos de bioinformática. Entre ellos, el empalme de secuencias y el llenado de espacios entre secuencias son los problemas principales más críticos. La dificultad no sólo viene por su enorme cantidad de datos, sino también por el hecho de que contiene secuencias muy repetitivas. Para ello, este proceso requiere particularmente que el diseño experimental y el análisis de la información estén constantemente vinculados. Por otro lado, se deben desarrollar algoritmos apropiados y el software correspondiente de acuerdo con los requisitos de los diferentes pasos para abordar diversos problemas complejos. Muchos centros de investigación del genoma de renombre en el mundo tienen sus propias estrategias de empalme y ensamblaje, y ese trabajo se completa en supercomputadoras.

Con un genoma completo, los humanos tendrán una comprensión más detallada y precisa de sí mismos.

Por ejemplo: se encontró que la porción de nuestro genoma que realmente codifica proteínas (llamadas exones) es muy pequeña, representando sólo el 1,1% las regiones entre exones (llamadas intrones) representan el 24%; representan el 75%, lo que significa que las regiones que no codifican proteínas representan la gran mayoría del genoma humano. Se descubrió que los genes que codifican proteínas humanas son más complejos que los genes de otros organismos y tienen métodos de empalme más ricos. Se ha descubierto que las duplicaciones de segmentos son comunes en el genoma, lo que refleja la compleja historia evolutiva de los humanos. Se descubrió que el cromosoma 13 humano es relativamente estable, mientras que el cromosoma 12 masculino y el cromosoma 16 femenino son variables, y así sucesivamente. 3.2 Descubrimiento de nuevos genes y nuevos polimorfismos de un solo nucleótido

El descubrimiento de nuevos genes es actualmente un tema candente en la investigación genómica internacional, y el uso de métodos bioinformáticos es un medio importante para descubrir nuevos genes. Por ejemplo: alrededor del 60% de los aproximadamente 6.000 genes contenidos en el genoma completo de la levadura de cerveza se obtuvieron mediante análisis de información.

(1) Clonación informática de genes

El uso de la base de datos EST para descubrir nuevos genes también se denomina clonación informática de genes. Las secuencias E ST son secuencias cortas de ADNc de expresión génica que transportan información sobre ciertos fragmentos del gen completo. En octubre de 2001, había más de 3,8 millones de secuencias E ST humanas en la base de datos EST de GenBank, que cubrían aproximadamente el 90% de los genes humanos.

Ya en 1996, mi país inició investigaciones para buscar nuevos genes mediante la clonación informática. Su principio es muy simple, es decir, encontrar todos los fragmentos EST que pertenecen al mismo gen y luego conectarlos. Dado que las secuencias E ST se generan aleatoriamente en muchos laboratorios de todo el mundo, debe haber una gran cantidad de pequeños fragmentos repetitivos entre muchas secuencias E ST que pertenecen al mismo gen. Utilizando estos pequeños fragmentos como marcadores, se pueden conectar diferentes E ST hasta que se generen aleatoriamente. se descubren en toda su longitud, por lo que podemos decir que encontramos un gen mediante clonación in silico. Si este gen no se había descubierto antes, hemos encontrado un gen nuevo. Sin embargo, el diseño de un programa de clonación informática es complicado y la cantidad de cálculos es enorme.

(2) Predecir nuevos genes a partir de secuencias de ADN genómico

Predecir nuevos genes a partir de secuencias genómicas es esencialmente distinguir las regiones codificantes de proteínas de las regiones no codificantes de proteínas en el genoma. en. Para los métodos teóricos, es necesario descubrir qué características matemáticas y físicas son diferentes en el área de codificación y en el área de no codificación. Al comparar estas secuencias con una base de datos de genes conocidos, se pueden descubrir nuevos genes.

El descubrimiento de nuevos genes profundizará aún más nuestra comprensión de las actividades de la vida. Según la revista "Nature" del 2 de diciembre de 1999, los datos sobre el cromosoma 22 humano han identificado 679 genes, el 55% de los cuales son desconocidos. Existen 35 enfermedades relacionadas con mutaciones en este cromosoma, como enfermedades del sistema inmunológico, cardiopatías congénitas y esquizofrenia. Sin embargo, sigue siendo una tarea muy importante y ardua integrar completa y correctamente todos los genes humanos, sus proteínas correspondientes y sus funciones relacionadas en un índice. El Grupo Internacional de Colaboración sobre el Genoma Humano está trabajando para establecer un "Índice de genes integrado" completo y el "Índice de proteínas integrado" relacionado.

(3) Descubrimiento del polimorfismo de un solo nucleótido (S NP)

Algunas personas fuman y beben pero viven más, mientras que otras padecen enfermedades desde la infancia para tratarlas; Tumores. Funciona muy bien para algunas personas y para otras nada. ¿porqué es eso? La respuesta está en las diferencias presentes en sus genomas. Muchas de estas diferencias se manifiestan como variaciones en una sola base, es decir, polimorfismos de un solo nucleótido (SNP).

Ahora se cree generalmente que la investigación de S NP es un paso importante hacia la aplicación del Proyecto Genoma Humano. Esto se debe principalmente a que S NP proporcionará una poderosa herramienta para el descubrimiento de grupos de alto riesgo, la identificación de genes relacionados con enfermedades, el diseño y prueba de medicamentos y la investigación básica en biología. S NP está ampliamente distribuido en el genoma y estudios recientes muestran que ocurre una vez cada 300 pares de bases en el genoma humano.

La gran cantidad de sitios de SNP brinda a las personas la oportunidad de descubrir mutaciones genómicas relacionadas con diversas enfermedades, incluidos los tumores. Desde un punto de vista experimental, es más fácil encontrar mutaciones genéticas relacionadas con enfermedades a través de SNP que a través de algunos SNP no lo hacen; No causa directamente la expresión de genes de enfermedades, pero se convierte en un marcador importante porque es adyacente a ciertos genes de enfermedades. S NP también juega un papel muy importante en la investigación básica. En los últimos años, el análisis del cromosoma Y S NP ha dado lugar a una serie de resultados importantes en los campos de la evolución humana, la evolución y la migración de poblaciones humanas. 3.3 Estudio sobre la estructura y función de las regiones proteicas no codificantes del genoma

Estudios recientes han demostrado que en microorganismos como las bacterias, las regiones proteicas no codificantes solo representan el 50% de toda la secuencia del genoma. 10% a 20%. Con la evolución de los organismos, hay cada vez más regiones no codificantes, y las secuencias no codificantes representan la gran mayoría de las secuencias del genoma en organismos superiores y genomas humanos. Esto indica que estas secuencias no codificantes deben tener funciones biológicas importantes. El entendimiento general es que están relacionados con la regulación de la expresión de genes.

En cuanto al genoma humano, hasta ahora sólo se han comprendido realmente las reglas de la región codificadora de proteínas (gen) en el ADN. Los últimos datos muestran que esta parte de la secuencia sólo representa el 1,1%. del genoma. La investigación relevante sobre la región codificante, que solo representa el 1,1% del genoma humano, ha generado decenas de premios Nobel. El número de resultados contenidos en la región no codificante del 98% será muy considerable, por lo que buscar las características codificantes. e información de estas regiones La regulación y las normas de expresión serán un tema candente durante mucho tiempo y son fuente de resultados importantes. 3.4 Estudio de la evolución biológica a nivel del genoma

En los últimos años, con el aumento masivo de datos sobre secuencias del genoma, el debate sobre las diferencias de secuencias y las relaciones evolutivas se ha vuelto cada vez más intenso. En primer lugar, se descubrió que los árboles evolutivos reconstruidos a partir de diferentes secuencias moleculares de una misma población pueden ser diferentes. Al mismo tiempo, la discusión sobre la relación entre "evolución vertical" y "evolución horizontal" está atrayendo gradualmente la atención de la gente. Es decir, en los últimos años se ha descubierto el "fenómeno de migración horizontal" de genes. Es decir: los genes pueden migrar entre poblaciones que existen al mismo tiempo. Aunque los resultados pueden dar lugar a diferencias de secuencia, esta diferencia no tiene nada que ver con la evolución. Incluso el análisis del genoma humano encontró que docenas de genes humanos sólo son similares a genes bacterianos, pero no se encuentran en moscas de la fruta ni en nematodos. Si utilizamos estas secuencias de genes humanos para estudiar la evolución, sacaremos conclusiones absurdas. Por lo tanto, las moléculas evolucionadas verticalmente deben seleccionarse como muestras en la investigación actual sobre la evolución molecular. En particular: en el análisis de la evolución molecular, "similitud" y "homología" son dos conceptos diferentes. La similitud solo refleja que los dos son similares y no contiene ninguna implicación relacionada con la evolución. La homología es la similitud relacionada con un mismo ancestro. 3.5 Estudio comparativo de genomas completos

En la era posgenómica, cada vez hay más datos genómicos completos. Con estos datos, las personas pueden analizar y estudiar una serie de cuestiones biológicas importantes, como por ejemplo: ¿De dónde surgió? la vida se origina? ¿Cómo evolucionó la vida? ¿Cómo se originó el código genético? ¿Estimar el número mínimo de genes necesarios para el organismo vivo independiente más pequeño? ¿Cómo hacen estos genes que los organismos cobren vida? etc. Estas grandes preguntas sólo pueden responderse a nivel del genoma. Por ejemplo, los genomas del ratón y del ser humano son similares en tamaño, contienen alrededor de 3 mil millones de pares de bases y tienen un número similar de genes, la mayoría de los cuales son homólogos. Pero hay tantas diferencias entre ratas y humanos. ¿A qué se debe esto? De manera similar, algunos científicos estiman que la diferencia genómica entre diferentes especies humanas es sólo del 0,1%; la diferencia entre simios es aproximadamente del 1%; Pero las diferencias entre sus fenotipos son sorprendentes. Por tanto, las razones de esta diferencia no sólo deben buscarse en los genes y las secuencias de ADN, sino también en el genoma completo y en las diferencias en la organización cromosómica. Este trabajo fue pionero en genómica comparada.

Los científicos descubrieron que todos los genes se pueden dividir en varias categorías según su función y filogenia, incluidos genes relacionados con la replicación, la transcripción, la traducción, las damas de honor moleculares, la producción de energía, el transporte de iones y varios metabolismos. Este trabajo también proporciona nuevas formas de clasificar proteínas. Al mismo tiempo, mediante la comparación de varios genomas completos, los científicos calcularon que el número mínimo de genes necesarios para mantener las actividades vitales es de unos 250. De manera similar, cuando comparamos los genomas del ratón y del ser humano, encontramos que aunque los tamaños del genoma y el número de genes son similares, la organización de los genomas es muy diferente.

Por ejemplo, el gen que existe en el cromosoma 1 del ratón se ha distribuido en siete cromosomas humanos: 1, 2, 5, 6, 8, 13 y 18. Los estudios han demostrado que dentro del mismo reino, las diferencias en el orden de ciertas proteínas ribosómicas pueden reflejar la relación genética entre especies. Cuanto más estrecha es la relación genética, más cercana es la secuencia de genes. De esta forma, se pueden estudiar las relaciones filogenéticas entre especies comparando el orden de los genes.

Mi país ha llevado a cabo secuenciaciones y análisis a gran escala de genomas microbianos completos desde 1998. Los que están actualmente en proceso y completados incluyen: las eubacterias de alta temperatura autoidentificadas de mi país de la familia Thermotogales, Thermotoga springbacki; Shigella flexneri; cepa de ictericia hemorrágica de Leptospira; Xanthomonas chrysanthemum; Si bien los científicos chinos han completado la secuenciación del 1% del genoma humano, recientemente también han completado un "borrador de trabajo" del genoma del arroz con 430 millones de pares de bases. Estos datos proporcionarán el material más directo para la investigación de nuestro país en este campo. 3.6 Del genoma funcional a la biología de sistemas

El número de genes expresados ​​en diferentes tejidos varía mucho. El número de genes expresados ​​en el cerebro es el mayor, con alrededor de 30.000 a 40.000 transcripciones. se expresan en el tejido. El mismo tejido expresa diferentes tipos y cantidades de genes en diferentes etapas del crecimiento y desarrollo individual. Algunos genes se expresan en la infancia, otros en la mediana edad y otros no se expresan hasta la vejez. No sólo necesitamos comprender la secuencia del gen, sino también la función del gen, es decir, necesitamos comprender el perfil de expresión del gen en diferentes tejidos en diferentes momentos. Esto se conoce comúnmente como investigación genómica funcional.

Para obtener perfiles de expresión génica se han desarrollado a nivel internacional nuevas tecnologías tanto a nivel de ácidos nucleicos como de proteínas. Se trata de tecnología de chip genético (o chip de ADN) a nivel de ácido nucleico y tecnología de separación de proteínas e identificación de secuencias a gran escala a nivel de proteína, también conocida como tecnología de proteoma. Dado que la densidad de puntos de muestra en el chip es muy alta, alcanzando cientos de miles por chip, la extracción de datos del perfil de expresión y el descubrimiento de conocimientos se han convertido en la clave del éxito de esta investigación. El desarrollo de la tecnología de biochips y proteomas se basa más en la teoría, la tecnología y la base de datos de la bioinformática. En el siguiente paso, la investigación genómica funcional se desarrollará en la dirección de sistemas complejos, es decir, explorará las interacciones de varias partes y niveles de sistemas biológicos, ingresando así al campo de la biología de sistemas. 3.7 Simulación de la estructura de proteínas y diseño de fármacos

La simulación de la estructura espacial de proteínas y el diseño de fármacos tienen una historia de 20 a 30 años. Con el rápido desarrollo de la investigación del genoma humano, este campo se enfrenta a una nueva tendencia: encontrar las secuencias de bases de 30.000 a 40.000 genes humanos está a la vuelta de la esquina y, por lo tanto, la determinación de las secuencias de aminoácidos de sus productos de expresión también será gradual. En este momento, predecir la estructura espacial de estas proteínas y lograr el diseño de fármacos específicos se ha convertido en una tarea urgente. Este también es un problema computacional a gran escala. 3.8 Investigación sobre la aplicación y el desarrollo de la bioinformática

Los resultados de la investigación en bioinformática no sólo tienen un importante valor teórico, sino que también pueden aplicarse directamente a la producción industrial, agrícola y a la práctica médica. Por lo tanto, los algoritmos, el software y las bases de datos de análisis y aplicación relacionados con la bioinformática tienen un valor económico importante y eventualmente se convertirán en productos básicos y brindarán beneficios económicos y sociales.

(1) Información genética relacionada con enfermedades y desarrollo de software y algoritmos relacionados

Muchas enfermedades están relacionadas con mutaciones genéticas o polimorfismos genéticos. Algunas personas estiman que existen alrededor de 1000 protooncogenes. relacionados con el cáncer. 1000, hay alrededor de 100 genes supresores de tumores. Más de 6.000 enfermedades humanas están asociadas con cambios en varios genes humanos. Más enfermedades son el resultado de interacciones entre el medio ambiente (incluidos los microorganismos que causan enfermedades) y los genes humanos (productos genéticos). Con la profundización del proyecto del genoma humano, cuando conozcamos la ubicación de todos los genes humanos en el cromosoma, sus características de secuencia (incluidos los S NP), sus patrones de expresión y las características de sus productos (ARN y proteínas), las personas podrán determinar eficazmente los mecanismos moleculares. de diversas enfermedades y desarrollar métodos diagnósticos y terapéuticos adecuados.

Para este fin, dos tareas bioinformáticas son importantes: una es construir una base de datos de información genética humana relacionada con enfermedades (incluida la base de datos S NP) y la otra es desarrollar algoritmos bioinformáticos para analizar eficazmente datos de genotipado, especialmente métodos computacionales para correlacionar. Datos de S NP con enfermedades y factores causales.

(2) Establecer una base de datos genómica relacionada con la cría de especies animales y vegetales mejoradas y desarrollar tecnología de cría asistida por marcadores moleculares

Basada en la distancia evolutiva entre las diferentes especies y la Homología de genes funcionales. Es relativamente fácil encontrar genes relacionados con diversos cultivos ganaderos y económicos y sus beneficios económicos, y comprender mejor las diversas vías y mecanismos de su desarrollo, crecimiento y resistencia al estrés. Sobre esta base, utilizando marcadores moleculares genómicos relevantes, podemos acelerar su reproducción y transformarlos según los deseos de las personas.

(3) Investigación y desarrollo de software de diseño de fármacos y tecnología de biología molecular basada en información biológica

La información del genoma humano proporciona nuevas moléculas candidatas y nuevos objetivos farmacológicos candidatos para el desarrollo de fármacos. Al mismo tiempo, el diseño de vectores de expresión, PCR y cebadores de hibridación comúnmente utilizados en biología molecular, así como diversos kits (incluidos chips de ADN) deben basarse en la información de secuencia de los ácidos nucleicos. La gran cantidad de información que proporciona la informática genómica abre un amplio espacio para el desarrollo de este tipo de tecnología.