(1) Regulación del nivel de ADN
La regulación del nivel de ADN controla la expresión génica cambiando el número, el orden estructural y la actividad de los genes relacionados en el genoma. Dichos mecanismos reguladores incluyen la amplificación, reordenamiento o modificación química de genes. Algunos de estos cambios son reversibles.
1. Dosificación de genes y amplificación de genes
La demanda de ciertos productos genéticos en las células es mucho mayor que otros. Una forma en que las células mantienen esta proporción específica es variando las dosis de diferentes genes en el genoma. Por ejemplo, hay dos genes, A y B. Si sus eficiencias de transcripción y traducción son las mismas, si el número de copias del gen A es 20 veces mayor que el del gen B, entonces el producto del gen A también es 20 veces mayor. . Los genes de histonas son un ejemplo clásico de efectos de dosis genética. Para sintetizar grandes cantidades de histonas para formar cromatina, la mayoría de las especies contienen cientos de copias de genes de histonas en sus genomas.
La dosis de genes también se puede aumentar temporalmente mediante la amplificación de genes. Los ovocitos de anfibios como los sapos son 100 veces más grandes que las células somáticas normales y requieren la síntesis de grandes cantidades de ribosomas. Los ribosomas contienen moléculas de ARNr y la cantidad de genes de ARNr en el genoma está lejos de ser suficiente para satisfacer las necesidades del ovocito de sintetizar ribosomas. Así, durante el desarrollo de los ovocitos, el número de genes de ARNr aumenta temporalmente 4.000 veces. Las células precursoras de ovocitos, al igual que otras células somáticas, contienen alrededor de 500 genes de ARNr (ADNr). Después de la amplificación del gen, el número de copias del gen de ARNr llega a 2 × 106. Este número permite que el ovocito forme 1012 ribosomas para satisfacer las necesidades de grandes cantidades de síntesis de proteínas en el desarrollo embrionario temprano.
Antes de la amplificación genética, estos 500 genes de ARNr se disponen en tándem. Durante el proceso de amplificación de tres semanas, el ADNr ya no es un único fragmento de ADN continuo, sino que forma una gran cantidad de pequeños círculos, es decir, bucles de replicación, para aumentar el número de copias del gen. Esta amplificación del gen rRNA ocurre durante el desarrollo de los ovocitos en muchos organismos, incluidos peces, insectos y anfibios. Actualmente, se desconoce el mecanismo de amplificación de este gen.
En algunos casos, la amplificación de genes se produce en células anormales. Por ejemplo, muchos oncogenes en las células cancerosas humanas están altamente amplificados y expresados, lo que lleva a una reproducción y crecimiento celular fuera de control. La tasa de amplificación de ciertos oncogenes está altamente correlacionada con la progresión de la enfermedad y la diseminación de las células cancerosas.
2. Pérdida de genes
Durante el proceso de diferenciación celular de algunos eucariotas inferiores, algunas células somáticas pueden regular la expresión genética perdiendo algunos genes. Esta es una forma extrema de condicionamiento. .
Por ejemplo, después de que algunos protozoos, nematodos, insectos y crustáceos se desarrollan hasta cierta etapa, muchas células somáticas a menudo pierden el cromosoma completo o parte del cromosoma, mientras que solo aquellas células que se diferencian en células germinales en el futuro se conserva todo el conjunto de cromosomas. En los nematodos, una vez que el desarrollo individual alcanza una determinada etapa, los cromosomas de las células somáticas se rompen, formando muchos cromosomas pequeños. Algunos cromosomas pequeños no tienen centrómero y se pierden durante la división celular porque no pueden distribuirse normalmente y la reproducción se producirá más tarde.
Sin embargo, el fenómeno de la pérdida de genes no se ha encontrado en eucariotas superiores.
3.Reordenamiento del ADN (reordenamiento de genes)
El reordenamiento de genes se refiere al reordenamiento de secuencias de nucleótidos en las moléculas de ADN. Los reordenamientos de estas secuencias pueden formar nuevos genes y regular la expresión genética. Este reordenamiento está determinado por información genética específica en el genoma, y la secuencia del gen reordenado se transcribe en ARNm y se traduce en proteína.
Aunque el reordenamiento de la secuencia del ADN en el genoma no es una forma común, es un mecanismo importante para la regulación de algunos genes y juega un papel clave en el crecimiento y desarrollo de las células eucariotas.
(1) Conversión del tipo de apareamiento de levaduras.
La transformación del tipo apareamiento en la levadura de cerveza es el resultado de una reordenación del ADN. Hay dos tipos de levadura, tipo A y tipo alfa.
Los haploides A y α pueden producir diploide a/α, y los tetrámeros haploides se pueden formar mediante meiosis y esporulación, en los que la proporción de esporas de A y α es 2:2. Si las esporas de los genotipos A y α se cultivan por separado, no pueden aparearse entre sí porque solo tienen el mismo tipo de apareamiento que sus padres. Sin embargo, en la levadura existe una familia idéntica de tipos de apareamiento.
La espora haploide inicial (aquí α) se convierte en células madre y células yemas, y las células yemas crecen hasta convertirse en células hijas. Después de la siguiente división, tanto la célula madre como las células hijas recién formadas se transforman en el correspondiente tipo A de apareamiento, lo que da como resultado dos células de tipo α y dos de tipo A. Las células de los tipos de apareamiento correspondientes se fusionan para formar un cigoto diploide a/α (apareamiento). Después de la mitosis y la esporulación se forman esporas haploides. La base de este cambio de tipo de apareamiento es la reordenación del material genético. El gen MAT que controla el tipo de apareamiento se encuentra en el tercer cromosoma de la levadura, y MATa y MATα son alelos entre sí. Las células haploides que contienen MATa son de tipo apareante. Las células con el genotipo MATα son del tipo de apareamiento α. En ambos extremos del locus MAT, hay genes HMLa y HMRa similares al gen MAT, ubicados en los brazos izquierdo y derecho del cromosoma 3 respectivamente. Estos dos genes tienen la misma secuencia que MATα y MATa, pero hay un silenciador aguas arriba, por lo que no se expresan.
La acción de la endonucleasa HO desencadena una transformación de tipo intercambio (Figura 8-19). Esta endonucleasa escinde el ADN bicatenario de 24 pb en el gen MATa, y otra exonucleasa lo procesa de 5' a 3' para producir una secuencia de cola monocatenaria que sobresale en 3' (aproximadamente 500 nucleótidos). Esta secuencia monocatenaria se usa para insertar el gen MATa en la secuencia homóloga del gen MATα, y la secuencia HMLα se usa como plantilla para sintetizar una nueva secuencia del gen HMLα. Luego, HMLα se integra en la secuencia MATa mediante recombinación. lo que lleva a la conversión genética de MATa a MATα. Durante este proceso de recombinación, hay un potenciador recombinante (re) de 244 pb que desempeña un papel regulador cis en la recombinación, que es necesario para la transformación genética. Sin embargo, cuando RE no existe, la transformación genética no puede ocurrir. Esta re secuencia también se encuentra en el brazo izquierdo del cromosoma 3, cerca del sitio HMLα.
El gen MAT codifica una proteína reguladora que interactúa con el factor de transcripción MCM1 para regular la transcripción de otros genes. Los productos de los genes MATa y MATα actúan de manera diferente en MCM1 y, por lo tanto, exhiben diferentes patrones de expresión específicos de alelo. La proporción anormal de tetrasporas en hongos como la levadura de panadería también se debe a la transformación de genes producidos después de la recombinación.
(2) Reordenamiento del gen de anticuerpos animales
Un mamífero normal puede producir más de 108 moléculas de anticuerpos diferentes, cada una de las cuales tiene la capacidad de unirse a un antígeno específico. Los anticuerpos son proteínas y cada anticuerpo específico tiene una secuencia de aminoácidos diferente. Si la expresión genética de un anticuerpo es que un gen codifica una cadena polipeptídica, entonces un mamífero necesita más de 108 genes para codificar un anticuerpo, que es al menos el número de genes en todo el genoma (se estima que solo hay alrededor de 100 genes que codifican proteínas en el genoma humano.
Entonces, ¿mediante qué mecanismo los mamíferos forman tantas moléculas de anticuerpos diferentes?
Primero, echemos un vistazo a la estructura de las moléculas de anticuerpos (imagen). ). Los anticuerpos incluyen dos cadenas pesadas (H). Hay aproximadamente 440 aminoácidos y las dos cadenas ligeras (L) tienen aproximadamente 214 aminoácidos cada una. La diferencia entre diferentes moléculas de anticuerpo se encuentra principalmente en el extremo amino (terminal N) de. la cadena pesada y la cadena ligera, por lo que el extremo N se llama región variable (V), la longitud del extremo N es de aproximadamente 110 aminoácidos. Las secuencias del extremo carboxilo (terminal C) de diferentes anticuerpos son muy similares. , llamada región constante (C). La cadena ligera, la cadena pesada y dos cadenas pesadas del anticuerpo están conectadas mediante enlaces disulfuro formando una estructura de cuatro cadenas (H2L2).
En el genoma humano, la. Las cadenas pesadas y ligeras de todos los anticuerpos no están codificadas por genes completos fijos, sino que se forman mediante reordenamiento de diferentes segmentos de genes codificados genéticamente.
El gen de la cadena pesada completa está compuesto por VH, D, J y C, y el gen de la cadena ligera completa está compuesto por VL, J y C.
El cromosoma 14 humano tiene 86 cadenas pesadas Fragmentos de región de variación (VH), 30 fragmentos de región de diversidad (D), 9 fragmentos de región de unión (Jioning, J) y 11 fragmentos de región constante (C).
El gen de la cadena ligera se divide en tres segmentos, la región variable (VL), la región de unión (J) y la región constante (C). Las cadenas ligeras humanas se dividen en dos tipos: cadena ligera kappa (κ) y cadena ligera lambda (λ). El gen de la cadena ligera kappa se encuentra en el cromosoma 2 y el gen de la cadena ligera lambda se encuentra en el cromosoma 22. A medida que se desarrollan los linfocitos B, los genes de anticuerpos del genoma se encuentran en el ADN. Se forma el gen completo que codifica el anticuerpo (la estructura del gen de la cadena pesada del anticuerpo humano). Cuando se reorganiza cada molécula de cadena pesada, el segmento V se conecta al segmento D, luego al segmento J y finalmente al segmento C para formar un gen de cadena pesada de anticuerpo completo. Sólo hay un gen de anticuerpo reordenado en cada linfocito.
El reordenamiento de la cadena ligera es básicamente similar al de la cadena pesada (la imagen muestra la estructura genética de la cadena kappa del anticuerpo humano, la diferencia es que la cadena ligera está compuesta por tres fragmentos diferentes). .
Los genes de las cadenas pesada y ligera se reordenan, se transcriben y luego se traducen en proteínas. Las proteínas se conectan mediante enlaces disulfuro para formar moléculas de anticuerpos.
Control genético de la diversidad molecular en la producción de inmunoglobulinas;
Diferentes combinaciones de cadenas pesadas y ligeras, κ, λ, H;
En la cadena pesada, la combinación de los segmentos V, D, J y C;
La combinación de v y c en la cadena ligera kappa;
La combinación de v, j y c en la cadena ligera lambda cadena;
Además, los puntos de unión entre segmentos de genes también pueden moverse dentro de unos pocos pb.
Por lo tanto, se pueden producir moléculas de inmunoglobulina del orden de 109 a partir de aproximadamente 300 fragmentos de genes de anticuerpos.
3.Metilación y desmetilación del ADN
En las moléculas de ADN eucariotas, los hidrógenos del quinto carbono de unas pocas bases de citosina se pueden sustituir por un grupo metilo bajo catálisis, lo que da como resultado la metilación. de citosina.
La metilación suele producirse en el par de dinucleótidos 5’-CG-3’. A veces, ambas C en un par de dinucleótidos CG están metiladas, lo que se denomina metilación completa, mientras que la metilación de un solo C se denomina hemimetilación. La metilasa reconoce esta molécula de ADN hemimetilada y metila la citosina en la otra hebra.
La metilación del ADN puede provocar la inactivación de genes. Los genes expresados activamente están submetilados. La actividad de expresión se correlacionó negativamente con el grado de metilación. El grado de metilación puede mediar entre la activación completa y la represión completa de la transcripción. El ADN viral metilado y no metilado o los genes nucleares se introducen en células vivas respectivamente. Los genes metilados no se expresan, pero los genes no metilados pueden expresarse. Durante la ontogenia de las ratas, los niveles de metilación del ADN en el núcleo siguen aumentando. El hígado de embriones de 14 días tiene solo 8 metilaciones, mientras que el hígado de embriones de 18 días tiene 30 metilaciones, mientras que el grado de metilación del ADNr de hígados de ratas adultas llega a 60.
Algunos elementos transponibles Ac del maíz pierden su actividad genética transposasa sin ningún cambio en la secuencia del ADN porque la región rica en CG del gen está altamente metilada. La actividad del gen transposasa se puede restaurar después de la desmetilación mediante tratamiento químico.
(2) Regulación a nivel de transcripción
Genes domésticos y genes de lujo
En eucariotas superiores multicelulares, los mismos genes están presentes en todos los tipos de expresión celular. . Los productos de estos genes son necesarios para mantener la estructura y el movimiento normales de las células y participar en actividades vitales como la regeneración y el metabolismo. Debido a que sus funciones son esenciales para cada célula, estos genes se denominan genes de mantenimiento, como genes de histonas, genes de proteínas ribosómicas, genes de proteínas mitocondriales, genes de enzimas glicolíticas, etc. En los mamíferos hay aproximadamente 65.438 millones de genes constitutivos. Otro tipo de gen es un gen específico de tejido. También conocidos como genes de lujo, estos genes están relacionados con funciones específicas de las células y se expresan selectivamente en varios tejidos, como los genes de queratina en la epidermis, los genes de actina y los genes de miosina en las células musculares, etc.
Se estima que la suma de genes de lujo en varias células es mayor que el número de genes de mantenimiento.
La regulación de la expresión de los genes domésticos y de los genes del lujo suele producirse a nivel de transcripción.
Según los informes, la eficiencia de expresión de genes en bacterias puede aumentar más de mil veces después de la inducción. Este nivel extremo de regulación es difícil de producir en la expresión de genes eucariotas (excepto en levaduras). Se puede inducir a la mayoría de los genes eucariotas a aumentar su eficiencia de expresión varias o docenas de veces. La regulación del nivel transcripcional de la mayoría de los genes eucariotas es una regulación positiva.
1. Elementos que actúan en Cis y que regulan la expresión de genes eucariotas.
Los elementos que actúan en Cis se refieren a secuencias de nucleótidos específicas en moléculas de ADN que pueden regular la expresión génica. La actividad de los elementos que actúan en cis sólo afecta a los genes de la misma molécula de ADN. La mayor parte de esta secuencia de ADN se encuentra aguas arriba del gen o en el intrón.
Los elementos que actúan en cis de los genes eucariotas se pueden dividir en promotores, potenciadores y estatinas según sus funciones.
La estructura y función del promotor
El promotor es el sitio de unión de los factores de transcripción y la ARN polimerasa. Se encuentra aguas arriba del gen que regula y es adyacente al inicio de la transcripción. punto del gen.
Caja Tata: El centro está situado en la posición -30, que es el sitio de unión de reconocimiento de la ARN polimerasa II. Rico en bases AT, generalmente 8pb. Cambiar cualquiera de ellos reducirá significativamente la actividad transcripcional, que es la llamada caja de Hogness. Si se muta la secuencia TATA en el promotor del gen de la β-globina humana, la producción de β-globina se reducirá considerablemente, provocando anemia.
Caja CAAT: situada en -70 ~-80, * *tiene la secuencia GGCC(t)CAACT, que determina la frecuencia de inicio del promotor. La caja CAAT del gen de la β-globina de conejo cambió a TTCCAATCT y la eficiencia de transcripción fue solo de 12.
Caja GC: posición -110, GGGCGG. Mejora la actividad transcripcional.
Los promotores de genes eucariotas están compuestos por tres elementos, mientras que los promotores de genes procarióticos generalmente tienen solo dos elementos, el TATAbox está en la posición -10 y el TTGACAbox está en la posición -35.
La estructura y función de los potenciadores
Un potenciador, también conocido como potenciador de la transcripción, es un elemento regulador de largo alcance ubicado al menos 100 pb aguas arriba del punto de inicio de la transcripción, generalmente a -700 ~- 1000, por lo que también se le llama secuencia activadora aguas arriba, UAS).
Las regiones potenciadoras suelen abarcar entre 100 y 200 pb. Al igual que un promotor, consta de una o más secuencias de ADN distintivas, a menudo dispuestas de forma alternativa con una secuencia central de 8-100-200 pb y otras secuencias.
Los potenciadores también necesitan unirse a factores proteicos específicos (factores de transcripción) para mejorar la transcripción.
Estator
Es un elemento de acción cis, similar a un potenciador, pero juega un papel regulador negativo. Algunos lo llaman gen silencioso. Los elementos estáticos combinados con los correspondientes factores de transacción pueden hacer que el sistema de regulación anticipada sea inoperable.
2. Factores de acción trans en la regulación de genes eucariotas
Ya sea una secuencia promotora o potenciadora, su función reguladora transcripcional se logra mediante la interacción con proteínas de unión al ADN específicas.
La ARN polimerasa eucariótica se diferencia de la ARN polimerasa procariótica en que no puede iniciar la transcripción por sí misma, y la ARN polimerasa eucariótica purificada no puede iniciar la transcripción in vitro. Por lo tanto, antes de que la ARN polimerasa pueda iniciar la transcripción, se debe preensamblar un conjunto de factores de transcripción en el promotor.
Estos factores de transcripción no suelen ser componentes de la ARN polimerasa.
Las moléculas de proteínas que pueden reconocer directa o indirectamente varios elementos reguladores cis y unirse a ellos para regular la eficiencia de la transcripción genética se denominan factores de acción trans.
La proteína que puede activar la transcripción de genes eucariotas se llama factor de transcripción (TF). Es un factor de acción trans implicado en la regulación positiva y es utilizado por la ARN polimerasa durante el inicio de la transcripción requerida. cofactores.
Existen muchos tipos de proteínas de unión al ADN y muchos elementos reguladores en cis.
Es la interacción entre diferentes secuencias de ADN y diferentes proteínas de unión al ADN, así como la interacción entre proteínas, lo que constituye el complejo mecanismo de regulación de la transcripción genética.
Características estructurales de los factores transactuantes
Los factores transactuantes suelen tener tres dominios funcionales diferentes.
①El sitio donde el dominio de unión al ADN se une al elemento regulador cis.
Los estudios sobre las estructuras de un gran número de reguladores de la transcripción han demostrado que la mayoría de los dominios de unión al ADN tienen menos de 100 pb y generalmente tienen cuatro características estructurales: estructura hélice-giro-hélice (HTH) (hélice-giro-hélice) -hélice), estructura de dedos de zinc y cremallera de leucina.
②El dominio funcional que activa la transcripción genética generalmente consta de 20-100 aminoácidos. A veces, los factores de acción trans pueden tener más de un dominio de activación transcripcional. Sus características estructurales son: contiene muchas hélices α cargadas negativamente y es rico en glutamina o prolina.
③Dominio que se une a otros factores proteicos.
Diferentes factores transreguladores (factores de transcripción) interactúan con elementos reguladores cis para iniciar la transcripción con diferentes eficiencias.
2. Promotor selectivo
Algunos genes eucariotas tienen dos o más promotores para su expresión en diferentes células. Diferentes promotores pueden producir diferentes transcritos primarios y diferentes secuencias codificadoras de proteínas. El gen de la alcohol deshidrogenasa en Drosophila es un ejemplo típico. La estructura de este gen se muestra en la figura 8-31A. Se utilizan diferentes promotores para la transcripción en los estadios larvario (Figura 8-31B) y adulto (Figura 8-31C). Transcripción en la edad adulta.
(3) Regulación postranscripcional
En los eucariotas, los productos de transcripción de genes de proteínas se denominan colectivamente ARN heterogéneo nuclear, que debe procesarse para convertirse en moléculas de ARNm maduras. Como se mencionó en el Capítulo 3, el proceso de procesamiento consta de tres aspectos: tapado, cola y eliminación de intrones.
El proceso de empalme de intrones postranscripcional es de gran importancia en la regulación de la expresión génica.
Escisión selectiva del ARNm
Sabemos que a nivel de ADN, existe una diferencia evidente entre genes eucarióticos y genes procarióticos, es decir, los genes eucarióticos son discontinuos, y los exones se alternan con Los intrones y los exones e intrones se transcriben juntos durante la transcripción. Después de la transcripción, los intrones deben eliminarse para formar la molécula de ARNm madura. Este proceso se llama empalme.
El mismo transcrito primario puede escindirse y procesarse de diferentes maneras en diferentes células para formar diferentes moléculas de ARNm maduras, de modo que las proteínas traducidas pueden ser diferentes en contenido o composición (Figura empalme alternativo).
(4) Regulación del nivel de traducción
En eucariotas, la regulación de la expresión génica se produce principalmente a nivel de transcripción, pero la regulación del nivel de traducción también es importante.
La unión de proteínas represoras al ARNm puede impedir la traducción de proteínas.
La función de la ferritina es almacenar hierro en las células. La traducción del ARNm de ferritina depende del suministro de hierro. Cuando el hierro es suficiente, la ferritina se sintetiza en mayores cantidades. Cuando no hay hierro en la célula, la proteína represora se une al ARNm de ferritina, impidiendo la traducción. Cuando hay hierro presente en la célula, la proteína represora no se une al ARNm de ferritina, lo que permite la traducción.
El ARNm maduro se puede almacenar en estado inactivo.
Regulación postraduccional
La traducción de ARNm a proteína no supone el fin de la regulación de la expresión génica. Las cadenas polipeptídicas lineales derivadas directamente de los ribosomas no son funcionales y deben procesarse para volverse activas. Todavía existen una serie de mecanismos reguladores para el procesamiento postraduccional de proteínas.
1. Plegado de proteínas
Las cadenas polipeptídicas lineales deben plegarse en una determinada estructura espacial para tener funciones biológicas. En las células, el plegamiento de proteínas sólo se puede lograr con la ayuda de chaperonas.
2. Escisión de proteasa
Escisión final
Algunas proteínas de membrana y proteínas secretadas tienen una secuencia de aminoácidos hidrofóbica en el extremo amino, llamada péptido señal, que Se utiliza para localizar proteínas precursoras dentro de las células. El péptido señal debe escindir la cadena polipeptídica para funcionar.
La longitud inicial de la insulina formada en el páncreas de los vertebrados es de 65.438.005 aminoácidos y se denomina proinsulina. Durante el procesamiento, los 24 residuos de aminoácidos en el extremo amino se cortan para convertirse en proinsulina, y luego se corta la parte media, dejando las partes activas en ambos extremos, es decir, la cadena A de 265,4380 residuos de aminoácidos y los 30. residuos de la cadena de la base B. Las dos cadenas están unidas por dos enlaces disulfuro para formar insulina bioactiva.
Escisión de proteínas múltiples
Algunas cadenas polipeptídicas recién sintetizadas contienen secuencias de varias moléculas de proteínas y, tras la escisión, producen moléculas de proteínas con diferentes funciones. Por ejemplo, una proteasa escinde y finaliza una cadena polipeptídica producida por el hipotálamo, que incluye cuatro moléculas hormonales diferentes. Se cortan diferentes células de diferentes maneras y partes, produciendo así una variedad de hormonas diferentes para satisfacer las necesidades de crecimiento y desarrollo de diferentes células.
3. Modificación química de proteínas.
La modificación química simple consiste en agregar algunos grupos químicos pequeños, como grupos acetilo, metilo y fosfato, a las cadenas laterales de los aminoácidos, o al extremo amino o carboxilo. Este método de modificación es específico, diferentes proteínas pueden tener exactamente las mismas modificaciones y una misma proteína puede tener modificaciones completamente diferentes. Algunas proteínas tienen importantes funciones reguladoras en la expresión génica después de su activación por fosforilación.
Una modificación compleja es la glicosilación de proteínas, que es la adición de algunos carbohidratos de gran peso molecular a la cadena polipeptídica.
Los grupos sanguíneos ABO humanos también son ejemplos típicos de modificaciones químicas de las proteínas. El grupo sanguíneo ABO está controlado por un locus alélico complejo que codifica una enzima responsable de agregar grupos de azúcar a las moléculas de glicoproteína en la membrana de los glóbulos rojos. Hay tres alelos de este locus, que codifican tres enzimas diferentes. Una es agregar N-acetilgalactosamina a las glicoproteínas. Se muestra como tipo de sangre A. La segunda enzima es agregar galactosa a la glicoproteína, que se muestra como grupo sanguíneo B. El tercer gen codifica una enzima que no tiene ninguna función y no puede agregar azúcar a la glicoproteína, que se muestra como tipo de sangre. O.
4. Eliminar los intrones de proteínas.
Algunos de los productos iniciales de la traducción del ARNm, al igual que los productos iniciales de la transcripción del ADN, tienen secuencias de inteína, situadas en el medio de la secuencia de la cadena polipeptídica. Después del corte y empalme, los exones de la proteína se pueden unir para formar una proteína madura.
Los sitios de escisión de los intrones de proteínas están muy conservados. Los aminoácidos delante del intrón suelen ser cisteína, y sólo en raras ocasiones son serina, seguidos de histidina-asparagina, y luego la secuencia del exón del intrón suele ser cisteína, serina o treonina. Algunas secuencias dentro de los intrones también están muy conservadas.
Una característica importante de los intrones es su capacidad para automatizar el corte y el procesamiento. Por ejemplo, en el desarrollo embrionario de Drosophila existe una proteína erizo cuyo intrón puede dividir su propia proteína necesaria en dos moléculas de proteína funcionales.
Otra característica de los intrones es que algunos intrones escindidos tienen actividad endonucleasa. Esta enzima identifica una ubicación en una secuencia de ADN que corresponde a una secuencia codificante pero que no tiene una secuencia codificante propia y la corta para que la secuencia codificante del intrón pueda insertarse en esta ubicación. Si el gen en una célula asociada con el intrón es un híbrido, uno que contiene la secuencia codificante del intrón y el otro no, el intrón proteico escindido puede cortar el ADN sin la secuencia codificante.