La historia de descifrar el código genético

El descubrimiento del código genético fue la culminación de una maravillosa imaginación y una argumentación rigurosa en la década de 1950. El ARNm está compuesto por cuatro nucleótidos con diferentes bases: adenina (A), uracilo (U), citosina (C) y guanina (G). Al principio, los científicos sospecharon que si una base mide un aminoácido, sólo se pueden medir cuatro aminoácidos, lo que obviamente no es suficiente para medir los 20 aminoácidos en los organismos. Luego, combinando dos bases para determinar un aminoácido se pueden determinar dieciséis aminoácidos, lo que obviamente no es suficiente. Si se combinan tres bases para determinar un aminoácido, existen sesenta y cuatro combinaciones. Parece que un triplete de tres bases puede satisfacer la expresión de veinte aminoácidos, y aún queda algo. Después de todo, adivinar es sólo adivinar y requiere pruebas rigurosas.

Desde que se descubrió la estructura del ADN, los científicos han comenzado a estudiar los secretos de la elaboración de proteínas. George Gamov señaló que se necesitan tres ácidos nucleicos para codificar 20 aminoácidos. En 1961, Heinrich Matthaei y Nirenberg de los Institutos Nacionales de Salud convirtieron un ARN compuesto únicamente de uracilo (U) en un polipéptido compuesto únicamente de fenilalanina (Phe) en un entorno de sistema libre de células, descifrando así el primer codón (UUU). . Phe). Luego Hal Gobind Khorana descifró otros codones y luego Robert W. Hawley descubrió el ARNt responsable del proceso de transcripción. Del 65438 al 0968, Corana, Holly y Nirenberg compartieron el Premio Nobel de Fisiología o Medicina. Nirenberg y otros descubrieron que el microARN compuesto de tres nucleótidos puede promover la unión del correspondiente aminoácido ARNm al ribosoma. Sin embargo, el microARN no puede ser un péptido sintético, por lo que puede no ser fiable. Har Gobind sintetiza artificialmente ARNm con dos, tres o cuatro secuencias de nucleótidos conocidas, agrega aminoácidos marcados radiactivamente al sistema de traducción extracelular y luego analiza los aminoácidos en la composición de polipéptidos sintetizados.

A través de la comparación, podemos encontrar la misma parte del código triplete en el experimento y luego encontrar el mismo aminoácido en el polipéptido, de modo que podamos determinar que el código triplete es el código genético del aminoácido. Kolanna utilizó este método para descifrar todo el código genético y así ganó el Premio Nobel en 1968 junto con Nirenberg.

Más tarde, Nirenberg y otros utilizaron diferentes ARNm artificiales para realizar experimentos para observar los tipos de aminoácidos en la cadena polipeptídica, y luego utilizaron métodos estadísticos para calcular la frecuencia de codificación triplete en ARNm artificiales para analizar y sintetizar. Proteínas Correlación de varias frecuencias de aminoácidos. Con este método también se puede descubrir el código genético completo de los 20 aminoácidos. Finalmente, los científicos confirmaron aún más todos los codones utilizando varias cadenas de polinucleótidos que constan de tres nucleótidos para verificar los aminoácidos correspondientes. Una molécula de ADN es un polímero de cuatro nucleótidos. La diferencia entre estos cuatro nucleótidos radica en las diferentes bases, a saber, A, T, C y G. Si A, T, C y G representan cuatro nucleótidos respectivamente, entonces la molécula de ADN contendrá cuatro símbolos codificantes. Para un fragmento de ADN que contiene 1.000 pares de nucleótidos, las cuatro disposiciones codificadas pueden tener 41.000 formas, que en teoría pueden expresar información ilimitada.

Código Genético

¿Cómo se traduce el código genético? Primero, se utiliza una cadena de ADN como plantilla para sintetizar ARNm complementario. Según el principio de emparejamiento de bases complementarias, en esta cadena de ARNm, A se convierte en U, T se convierte en A, C se convierte en G y G se convierte en C. Por lo tanto, el código genético en este ARNm es la cadena de ADN complementaria del ADN molde original. son iguales, la única diferencia es que U reemplaza a T... Luego, el código genético del ARNm se traduce en la secuencia de aminoácidos de la cadena polipeptídica. Obviamente, la relación de código entre bases y aminoácidos no puede determinarse por una sola base. Por tanto, no se puede establecer el codón de una base. Si dos bases determinan un aminoácido, entonces las posibles combinaciones de codones de las dos bases serán 42=16. Esto es 4 tipos peor que los 20 tipos de aminoácidos existentes, lo que no es suficiente para su aplicación. Si cada tres bases determinan un aminoácido, las posibles combinaciones del código triplete serían 43 = 64. Son 44 aminoácidos más que 20, por lo que habrá codones redundantes. Se puede pensar que cada aminoácido específico está determinado por 1 o más códigos tripletes. El fenómeno de que un aminoácido esté determinado por más de un codón triplete se llama degeneración.

¿Qué aminoácidos codifica cada triplete? A partir de 1961, después de extensos experimentos, se utilizaron 64 códigos tripletes conocidos para encontrar sus aminoácidos correspondientes. 1966-1967 se completó el diccionario del código genético. La mayoría de los aminoácidos tienen varios códigos tripletes, que van del 6 al 2, que es el fenómeno de degeneración mencionado anteriormente. A excepción del triptófano y la metionina, solo existe una codificación triplete. Además, existen tres códigos tripletes UAA, UAG y UGA, que no codifican ningún aminoácido y son las señales de terminación para la síntesis de proteínas. El triplete que codifica AUG codifica formilmetionina en procariotas y metionina en eucariotas, y funciona como punto de partida para la síntesis. GUG codifica metionina, que también es el punto de partida de algunas biosíntesis. Al analizar el fenómeno de la degeneración, podemos ver que al determinar la primera y segunda base del código triplete, en ocasiones se puede determinar el mismo aminoácido sin considerar la tercera base. Por ejemplo, la prolina está codificada por los siguientes cuatro códigos tripletes: CCU, CCC, CCA y CCG. Es decir, en un código triplete, la primera y la segunda base son más importantes que la tercera base, que es la base de la degeneración.

Cuantos más codones sinónimos haya, mayor será la estabilidad de la herencia biológica. Porque cuando cambian las bases de la molécula de ADN, el código triplete formado después de la mutación puede traducirse al mismo aminoácido que el código triplete original, o aminoácidos con propiedades químicas similares, sin mostrar ninguna variación en la cadena polipeptídica ni significativa. cambios. Por tanto, la degeneración es de gran importancia para la estabilidad de la herencia biológica.