Información

¿Qué porcentaje de empalme de ARN ocurre durante la transcripción?

¿Qué porcentaje de empalme de ARN ocurre durante la transcripción?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

El empalme puede ocurrir durante la transcripción o directamente después.

Estoy leyendo sobre la secuencia de ARN unicelular y, según este artículo, observaron que entre el 15 y el 25% de las lecturas contenían secuencias intrónicas sin empalmar.

Ahora asumiendo que la mayoría de las lecturas de la secuencia de ARN vendrán del ARN que ha terminado de transcribirse ...

¿Sugiere esto que el 75-85% de todos los genes se empalman durante la transcripción? En otras palabras, ¿el 80% de nuestros genes están completamente maduros (empalmados) inmediatamente después de la transcripción?


No creo que sea posible dar una respuesta concluyente a esta pregunta, porque a) es una cuestión de investigación activa yb) la tasa / porcentaje de transcripciones que son co-transcripcionalmente empalmadas por completo no es casi con certeza constante, pero lo hará Dependen de muchos factores y mecanismos regulatorios.

Otro detalle importante es que este análisis / artículo se basa en la secuenciación de ARNm, que utiliza cebadores oligo-dT para enriquecer las moléculas de ARNm poliadeniladas. Sin embargo, los cebadores oligo-dT también pueden unirse a tramos de A dentro de las moléculas de ARN (este proceso se denomina cebado interno) y, dado que tales tramos son más comunes en intrones en comparación con exones, esto puede contribuir a la abundancia de lecturas intrónicas en los datos de secuenciación de ARNm. (No tengo una buena fuente de literatura para este caso específico, pero es un 'problema' conocido con seguridad).

Quizás algunas de estas revisiones también sean útiles (no estoy seguro de si todas están disponibles gratuitamente):


James Crick (cofundador de la estructura secundaria del ADN) propuso que el ADN es una molécula de almacenamiento de información capaz de replicarse a sí misma. Además, propuso que la información que se transmitía tenía que ser "leída" por un organismo de fabricación dentro de la célula que unía los aminoácidos en una secuencia específica que finalmente sintetizaba una proteína. Esto se conoció como el dogma central de la biología molecular.

El dogma central de la biología molecular

El dogma central de la biología molecular sugiere que el ADN sirve como plantilla para la síntesis directa de una molécula de ARN mensajero (ARNm), en un proceso conocido como transcripción. En segundo lugar, el ARNm se "lee" en un ribosoma mediante ARN de transferencia (ARNt), que trabajan juntos para ensamblar una cadena específica de aminoácidos, que se ensamblan colectivamente para generar una proteína. Este proceso se conoce como traducción.


¿Qué sucede con la transcripción de genes durante el daño del ADN?

Las transcripciones del gen ASCC3 se encuentran en dos compartimentos celulares diferentes. La isoforma larga del ARNm (izquierda) es predominantemente citoplásmica, mientras que el ARN corto no codificante (ncRNA, derecha) está en el núcleo celular (azul). Crédito: Instituto Francis Crick

Es bien sabido que cuando el ADN de una célula se daña, la célula responde activando genes específicos que ayudan a defender la integridad de su genoma. Pero menos estudiado es el hecho de que la célula apaga la gran mayoría de sus otros genes.

Por primera vez, los científicos del Instituto Francis Crick han analizado este fenómeno a nivel molecular. Descubrieron que la transcripción de todos los genes se ralentiza rápida y dramáticamente en respuesta al daño del ADN. También descubrieron un ejemplo de un gen en el que se transcribió una versión no codificante más corta debido a esta desaceleración y mediante el llamado empalme alternativo. Este ARN no codificante ayuda a la célula a sobrevivir al daño del ADN.

La importancia del empalme alternativo sigue siendo un tema de debate, mientras que anteriormente se suponía que el proceso ayuda a crear una gran complejidad en la función de las proteínas a partir de un número limitado de genes, algunos investigadores han insistido recientemente en que el empalme alternativo no puede ser importante ya que el análisis proteómico ha demostrado que la mayoría los genes solo tienen una única forma de proteína, lo que implica que la mayoría de las transcripciones de genes alternativos no tienen una función.

El ejemplo funcional de empalme alternativo que describen los científicos de Crick es un gen llamado ASCC3. ASCC3 generalmente codifica una proteína, pero cuando hay daño en el ADN y la transcripción de genes se ralentiza, se transcribe una molécula de ARN mucho más corta del mismo gen. Sorprendentemente, esta forma no codifica una proteína, por lo que se conoce como ARN no codificante. Los investigadores descubrieron que, de hecho, este ARN no codificante alternativo es una transcripción estable que se encuentra en el núcleo de la célula y que juega un papel en la contrarrestación de la proteína original codificada por el mismo gen.

Jesper Svejstrup, quien dirigió el trabajo, dice: "Puede haber muchos otros genes como este; ciertamente sabemos que hay decenas de genes que parecen comportarse de manera similar en la respuesta al daño del ADN. Esas transcripciones alternativas de ARN no codificantes también pueden estar mejoradas". regulados en respuesta a otros tipos de estrés celular. De hecho, muchos, muchos genes en el genoma expresan formas cortas de ARN que casi siempre se ignoran porque no tiene sentido que puedan codificar proteínas.

"Ahora que sabemos que tanto un ARN que codifica una proteína como un ARN alternativo no codificante pero funcionalmente importante se pueden expresar a partir del mismo gen, los investigadores comenzarán a buscar funciones para sus transcripciones de ARN cortas y potencialmente no codificantes en cualquier sistema fisiológico que están funcionando. Nuestro trabajo también ilustra la relevancia fisiológica potencial y la relevancia para la enfermedad de tales transcripciones no estudiadas ".

El artículo, La irradiación UV induce un ARN no codificante que se opone funcionalmente a la proteína codificada por el mismo gen, se publica en Celda.


Resultados y discusión

Descripción del modelo de alto nivel

La Figura 1 presenta una ilustración esquemática de BRIE (consulte la sección "Métodos" para obtener definiciones precisas y detalles del procedimiento de estimación). La parte inferior de la figura representa el enfoque del modelo de mezcla estándar para la estimación de isoformas introducido en MISO [8] y Gemelos [7], donde las lecturas están asociadas con una variable de identidad de isoforma latente, distribuida multinomialmente contenida revisión de mezclas de modelos de isoformas). Este módulo toma como entrada los datos de scRNA-seq (lecturas alineadas) y forma la probabilidad de nuestro modelo bayesiano. A las variables de identidad multinomial se les asigna un a priori informativo en forma de un modelo de regresión (mitad superior de la Fig. 1), donde la probabilidad previa de las proporciones de inclusión se regresa contra las características derivadas de la secuencia. Fundamentalmente, los parámetros de regresión se comparten entre todos los genes y se pueden aprender a través de múltiples células individuales, lo que regulariza la tarea y permite predicciones sólidas frente a una cobertura muy baja. En la sección “Métodos” y material complementario, damos detalles de las características utilizadas. Si bien la clase de modelos de regresión que empleamos es diferente de las redes neuronales de [11], aún proporcionan un predictor de aprendizaje supervisado de alta precisión de empalme en conjuntos de datos de secuencia de ARN a granel. Archivo adicional 1: La Figura S1 muestra que el enfoque de regresión bayesiana de BRIE puede lograr un Pearson R por encima de 0,8 en conjuntos de prueba, lo que valida nuestra elección de modelo dentro de BRIE.

Una caricatura del método BRIE para la estimación de isoformas. BRIE combina una probabilidad calculada a partir de datos de secuencia de ARN (la parte de abajo) y una distribución previa informativa aprendida de 735 características derivadas de secuencia (cima)

Esta arquitectura permite efectivamente a BRIE intercambiar dos tareas simultáneamente: en ausencia de datos (genes de abandono), el previo informativo proporciona una forma de imputar los datos faltantes, mientras que para los genes muy cubiertos domina el término de probabilidad, lo que devuelve un modelo mixto. cuantificación. Para niveles intermedios de cobertura, BRIE utiliza el teorema de Bayes para compensar la imputación y la cuantificación.

Evaluación comparativa de BRIE en datos simulados

Para evaluar la mejora en la cuantificación de isoformas proporcionada por el previo informativo de BRIE, simulamos lecturas de RNA-seq para 11.478 eventos de omisión de exón humano y una característica correlacionada para conocer el previo (consulte los detalles en la sección "Métodos" y el archivo adicional 1: Figura S2 ). Como estamos interesados ​​en cuantificar los efectos de un previo informativo, comparamos el BRIE con métodos similares desarrollados para la secuencia de ARN a granel: MISO v0.5.3 [8], uno de los primeros métodos probabilísticos y todavía muy utilizados, y DICE-seq v0.2.6 [9], una modificación de MISO usando antecedentes informativos (para múltiples puntos de tiempo). Para completar, también comparamos con Kallisto [12], que se propuso recientemente como una de las herramientas de cuantificación más eficientes y robustas desde el punto de vista computacional. Para simular el efecto de la regresión anterior, introdujimos una variable auxiliar con correlación 0.8 con las proporciones de inclusión deseadas (el valor de correlación se eligió para que coincida con el rendimiento empírico de la regresión de BRIE antes de los datos masivos de RNA-seq en el archivo adicional 1: Figura S1 ). También consideramos el caso en el que la variable auxiliar de BRIE no está correlacionada con el índice de inclusión (denotado como BRIE.Null) como control. Gracias al previo informativo, BRIE también puede proporcionar una imputación para las transcripciones de abandono (ver más abajo), que otros métodos no pueden para mantener la simulación justa, no incluimos resultados sobre genes de abandono.

En la simulación, establecemos diferentes niveles de cobertura con RPK (lecturas por kilobase) que van de 25 a 400. La Figura 2 muestra claramente que una previa informativa puede traer mejoras de rendimiento muy sustanciales con una cobertura baja. En el nivel más bajo de RPK, BRIE logra una ganancia de casi el 20% en la correlación entre las estimaciones y la verdad del terreno. Además, este nivel de precisión es esencialmente mantenido por BRIE en todos los valores de cobertura. Curiosamente, BRIE.Null aún puede lograr una precisión comparable a los otros métodos en todos los valores de cobertura. Por lo tanto, incluso cuando no se pudiera aprender de manera efectiva un previo informativo, los resultados de BRIE no serían peores que usar un método de RNA-seq masivo de última generación.

BRIE mejora las estimaciones de isoformas mediante el uso de un previo informativo sobre datos simulados. a, b Con una cobertura muy baja, RPK = 25, un diagrama de dispersión entre las estimaciones de las tasas de inclusión de exón por BRIE y la verdad de la simulación. a BRIE.Null utiliza cinco características aleatorias distribuidas uniformemente para aprender la anterior. B BRIE usa una característica correlacionada con Pearson R= 0,8 a la verdad para conocer un previo informativo. C De Pearson R entre verdad y estimación por BRIE, BRIE.Null y otros tres métodos para diferentes coberturas. RPK lecturas por kilobase

Imputación de abandono en simulación

El previo informativo aprendido por BRIE también se puede utilizar para imputar el uso de isoformas cuando hay un abandono, es decir, cuando no se secuencian lecturas para una isoforma expresada. En los experimentos de scRNA-seq, los abandonos ocurren ampliamente [5], aunque a veces son difíciles de detectar con exactitud, a excepción de los ARN con picos. Aquí, podríamos definir groseramente el límite superior contando los eventos de omisión de exón expresados ​​en células a granel, pero no en una sola célula determinada. En el archivo adicional 1: Figura S3, vemos que después de eliminar los eventos de abandono, la correlación de los niveles de expresión entre una sola celda y las celdas a granel es dramáticamente mayor para estos eventos de empalme.

Como BRIE puede transferir información de un gen altamente expresado a genes de baja expresión a través de múltiples células, investigamos el desempeño de BRIE al imputar el uso de isoformas si ocurre un abandono. Por lo tanto, el perfil de expresión de una biblioteca masiva de RNA-seq y el perfil de probabilidad de abandono estimado de 96 bibliotecas de scRNA-seq de células humanas HCT116 [13] (ver archivo adicional 1: Figura S4) se utilizaron para la simulación (ver detalles de la simulación en la sección "Métodos"). Archivo adicional 1: La Figura S5 muestra que BRIE puede producir una buena imputación del uso de isoformas simplemente tomando la media de la información previa aprendida de las características de la secuencia de los genes expresados ​​(Pearson's R=0.6–0.7).

BRIE produce estimaciones de empalme sólidas sobre datos reales

Para evaluar el rendimiento de BRIE en datos de scRNA-seq reales, utilizamos 96 bibliotecas de scRNA-seq de células humanas HCT116 individuales del estudio de referencia de scRNA-seq de Wu et al. [13] (consulte la sección "Métodos" para obtener más detalles). Es importante destacar que también se obtuvo un conjunto de datos de secuencia de ARN a granel en las mismas condiciones a partir de un millón de células. Para explorar mejor el rendimiento en datos reales, ampliamos el conjunto de métodos de la competencia para incluir Cufflinks v2.2.1 [7], RSEM v1.3.0 y el método de cuantificación unicelular propuesto recientemente Census (en Monocle v2.2.0) basado en Cufflinks Fragmentos por kilobase por millón (FPKM) [14]. La Figura 3 muestra los resultados: BRIE supera claramente a todos los demás métodos por un amplio margen, tanto en términos de correlación entre las estimaciones de diferentes celdas individuales (Fig.3f) como en términos de correlaciones entre las estimaciones de celdas individuales individuales y el volumen (Fig. 3c). En la Fig. 3e yb se dan ejemplos de diagramas de dispersión para ambas comparaciones, que muestran claramente predicciones muy consistentes. En particular, el rendimiento de otros métodos se vio fuertemente degradado por la incapacidad de manejar las grandes tasas de abandono (ver Fig. 3a yd para DICE-seq, donde muchas estimaciones de empalme se centran en el valor previo no informativo de 0.5). La alta correlación entre las predicciones a granel y scRNA-seq es particularmente notable, ya que el análisis de los dos conjuntos de datos no se realiza con un previo compartido. Se encontraron niveles similares de correlación entre las estimaciones de empalme obtenidas por BRIE en celdas individuales y las estimaciones de RNA-seq a granel obtenidas por otros métodos (archivo adicional 1: Figura S6).

BRIE mejora las estimaciones de empalme mediante el uso de funciones de secuencia. C.A Correlación de Pearson entre células individuales y a granel en la proporción de inclusión de exón ψ en células HCT116. Gráfico de dispersión de ψ estimaciones de DICEseq (a) o estimado por BRIE (B). Diagrama de caja para todos los métodos (C) en 96 celdas. d – f Correlación de Pearson entre pares unicelulares. Gráfico de dispersión de ψ estimaciones de DICEseq (D) o estimado por BRIE (mi). Diagrama de caja para todos los métodos (F) en 4608 pares de células

Estas ventajas estadísticas se reflejan en una cuantificación más eficaz y segura: teniendo en cuenta los genes con una incertidumbre cuantificada inferior a 0,3 (un umbral adoptado, por ejemplo, en [15] para seleccionar para el análisis posterior), archivo adicional 1: la figura S7 muestra que BRIE retuvo 10,9 % de 11.478 genes en promedio de cada célula, en comparación con el 3,1% y el 5,6% de MISO y DICE-seq, respectivamente.

BRIE ofrece una mayor sensibilidad en los análisis de empalme diferencial

BRIE también se puede utilizar para la detección de empalmes diferenciales en diferentes conjuntos de datos. Para hacerlo, calculamos la razón de evidencia (factor de Bayes, BF) entre un modelo donde los dos conjuntos de datos se tratan como réplicas (hipótesis nula) y un modelo alternativo donde los dos conjuntos de datos se tratan como separados. Usamos el enfoque de relación de densidad de Savage-Dickey y lo relajamos para obtener estimaciones más sólidas (consulte la sección “Métodos”). Tenga en cuenta que hay varias formas en las que se pueden realizar comparaciones diferenciales: podríamos comparar grupos de células o células individuales, y podríamos compartir el aprendizaje del previo a través de condiciones, o aprender por separado. Todas estas opciones son compatibles con el software BRIE.

Para comparar la efectividad de esta estrategia, volvimos a recurrir a un estudio de simulación, investigando la capacidad del BRIE para detectar empalmes diferenciales a medida que variamos la cobertura y el alcance del efecto diferencial (consulte la sección “Métodos” para obtener detalles de la simulación). Esta evaluación comparativa es importante, ya que se podría esperar que el previo informativo impida la cuantificación diferencial. En la práctica, vemos que, para tamaños de efecto sustanciales (Δ ψ= 0,6), podemos detectar una fracción sustancial de genes empalmados diferencialmente ya a 50 RPK, mejorando aún más cuando el tamaño del efecto es 0,8 (archivo adicional 1: Figura S8a). También usamos la simulación para explorar el efecto de diferentes tamaños de biblioteca en nuestras comparaciones diferenciales. Hacemos esto fijando una de las celdas de comparación a un nivel de RPK. Los resultados que se muestran en el archivo adicional 1: Figura S8b, c demuestran que BRIE es resistente a los problemas de normalización. Esto no es sorprendente, ya que los algoritmos de cuantificación relativa normalmente combinan la normalización con la estimación (ver [14] para una discusión de este tema en el contexto de scRNA-seq).

Luego investigamos la efectividad de BRIE para detectar empalmes diferenciales en células reales. Para estimar un nivel de fondo de empalme diferencial entre células idénticas, consideramos nuevamente las 20 bibliotecas HCT116 de una sola célula de Wu et al. [13], y comparó todos los posibles pares de células. La Figura 4a muestra la fracción de genes denominados empalmados diferencialmente en diferentes umbrales de BF en este experimento de control. Como podemos ver, este número es siempre muy pequeño, alrededor del 1% en el umbral normalmente recomendado de BF = 10. Este nivel de llamada de fondo podría atribuirse en parte a la estocasticidad intrínseca o a la variabilidad fisiológica residual que no se controló en el experimento, como la fase del ciclo celular. Como comparación adicional, consideramos dos métodos de RNA-seq a granel para empalme diferencial, MISO y el rMATS propuesto recientemente [16]. Ambos métodos solo podrían llamar a un número insignificante de eventos, mucho menos que el número esperado de falsos positivos, lo que confirma que los métodos a granel no son adecuados para el análisis de empalme de scRNA-seq.

Detección de empalmes diferenciales entre células. a Porcentaje de eventos de corte y empalme diferencial entre células HCT116 humanas, detectadas por MISO, rMATS, BRIE y su modo con pesos compartidos (es decir, proporción de BRIE) con diferentes umbrales. MISO y BRIE usan el factor de Bayes (BF) y rMATS usa la tasa de descubrimiento falso (q valor). B Porcentaje de eventos de corte y empalme diferencial entre células embrionarias tempranas de ratón el día 6.5 o el día 7.75. El umbral es BF & gt10 para MISO y BRIE, y q& lt0.05 para rMATS. los diamante indica lecturas agrupadas de 20 celdas en cada grupo. C Un ejemplo de evento de omisión de exón en DNMT3B en tres células de ratón a los 6,5 días y tres células a los 7,75 días. los panel izquierdo es un diagrama de sashimi de la densidad de lectura y el número de lecturas de unión. los panel derecho muestra la distribución anterior como un curva azul y un histograma de la distribución posterior en negro, ambos aprendidos por BRIE. Para el histograma, el línea roja es la media y la líneas puntedas son el intervalo de confianza del 95%. BF Factor de Bayes

Luego consideramos un conjunto de datos de scRNA-seq de desarrollo temprano de ratón [17], y comparamos los perfiles transcriptómicos de células individuales de células de embriones de ratón a los 6,5 y 7,75 días. Comparamos los perfiles de las células individuales en el mismo momento y en diferentes momentos. Los resultados se resumen en la Fig. 4b. La comparación de células individuales a los 6,5 días produjo aproximadamente el 1% de los eventos denominados como significativamente diferenciales (BF ≥ 10) a los 6,5 días. La comparación de este resultado con nuestra investigación de las células HCT116 sugiere que las células murinas a los 6,5 días siguen siendo como una población homogénea, desde el punto de vista del corte y empalme.El porcentaje casi se duplicó a los 7,75 días, lo que sugiere que el empalme diferencial se vuelve más generalizado en esta última etapa de diferenciación. Una fracción similar de eventos de omisión de exón se denominó diferencialmente entre las células a los 7,75 días y las células a los 6,5 días. Para definir un grupo de eventos de omisión asociados a la diferenciación, consideramos los eventos que llamamos diferenciales en al menos el 10% de las comparaciones de 7,75 frente a 6,5. Los 159 eventos resultantes fueron altamente enriquecidos para términos de ontología génica de organelos y partes intracelulares (pag& lt0.01) (consulte el archivo adicional 2: Tablas S1 y S2). La Figura 4c muestra el ejemplo de DNMT3B, un regulador del mantenimiento de la metilación del ADN, que se sabe que se somete a un empalme alternativo funcionalmente relevante [18]. DNMT3B mostró un empalme diferencial entre 7,75 días y 6,5 días en 153 de 400 comparaciones entre células individuales individuales, destacando claramente el fuerte efecto de inclusión diferencial. Cuatro eventos de ejemplo más, todos los cuales muestran empalmes diferenciales en más de 100 pares de comparaciones, se presentan en el archivo adicional 1: Figura S9.

También comparamos directamente los dos grupos de células dentro de una sola prueba (7,75 frente a 6,5). Esto se puede lograr fácilmente asumiendo una relación de empalme compartida ψ en todas las celdas en una condición. Matemáticamente, esto equivale a multiplicar los términos de probabilidad asociados con cada celda, o en la práctica a combinar las lecturas de diferentes celdas. Si bien esto logra una mayor potencia (ver el punto de diamante en la Fig. 4b), pierde la cantidad considerable de heterogeneidad de celda a celda resaltada por el análisis de celda única. Sería interesante explorar una forma más refinada de agrupación parcial dentro del modelo jerárquico [19], o combinar BRIE con enfoques de agrupación de scRNA-seq que puedan identificar grupos de células más homogéneos [2].


Terminación de la transcripción y poliadenilación

La terminación de la transcripción no se comprende tan bien en eucariotas como en procariotas, pero sabemos que la terminación está acoplada con la poliadenilación del extremo 3 'de la transcripción.

Poliadenilación

Recuerde que la CTD del ARN pol II está fosforilada, se cree que la fosforilación en ubicaciones específicas de la CTD recluta proteínas que escinden el ARNm en una secuencia específica. Mientras que la ARN polimerasa II todavía se está transcribiendo, el pre-ARNm es escindido por un complejo proteico que contiene endonucleasas entre una secuencia consenso AAUAAA y una secuencia rica en GU. Esto libera el ARNm funcional del resto de la transcripción, que todavía está unido a la ARN polimerasa. Una enzima llamada poli (A) polimerasa (PAP) es parte del mismo complejo de proteínas que escinde el pre-ARNm e inmediatamente agrega una cadena de aproximadamente 200 nucleótidos A, llamada cola de poli (A) , hasta el extremo 3 'del pre-ARNm recién escindido. La cola poli (A) protege el ARNm de la degradación, ayuda a exportar el ARNm maduro al citoplasma y participa en la unión de proteínas implicadas en el inicio de la traducción. Como se muestra en la Figura 3-15, similar a la adición del casquete 5 ', la poliadenilación también ocurre en el núcleo de las células eucariotas.

Terminación

Una vez que se libera el ARNm, el ARN pol II continúa transcribiendo el ADN. La terminación ocurre cuando la interacción del ARN pol II con la plantilla de ADN se debilita y la ARN polimerasa se separa del ADN. No está claro exactamente cómo ocurre esto, pero se cree que una exonucleasa (llamada Rat1) se une al extremo recién escindido del ARN que sobresale del ARN pol II. La exonucleasa "mastica" el ARN a medida que avanza hacia la ARN polimerasa. Esta proteína puede ponerse al día con el ARN pol II y hacer que se detenga. Esta pausa puede permitir que otra proteína que tiene una función helicasa se una y desenrolle la interacción ADN / ARN que se encuentra cerca del sitio activo de la ARN polimerasa. Esto puede hacer que la interacción de la ARN polimerasa con la plantilla de ADN se vuelva muy débil, y la proteína puede "caerse" de la plantilla, terminando la transcripción (Figura 3-15).

Figura 3-15: Un modelo de terminación en eucariotas. (A) Se reconoce un sitio de escisión en el ARNm y (B) se escinde mediante una endonucleasa. Esto libera el ARNm. (C) La exonucleasa Rat1 comienza a escindir el extremo 5 'del ARN que todavía está unido a la ARN polimerasa II y la Polimerasa Poli A (PAP) se une al extremo 3' del ARNm. (D) Rat1 continúa "masticando" el ARN hasta que golpea físicamente el ARN pol II y desestabiliza la interacción de pol II con el ADN y finalmente se "cae". Además, la PAP agrega muchos nucleótidos de adenina al extremo 3 'del ARNm liberado. Tenga en cuenta que en este punto el ARNm tiene un límite de 5 ', se ha empalmado y, una vez poliadenilado, estará listo para exportarse fuera del núcleo.


El empalme de ARN representa un mecanismo postranscripcional para generar múltiples ARN o proteínas funcionales a partir de una sola transcripción. La evolución del empalme de ARN es un excelente ejemplo de la función darwiniana que sigue el concepto de forma. Es probable que se retenga una mutación que conduce a un nuevo ARNm (forma) que codifica una nueva proteína (función) funcional, y de esta manera, el genoma ha evolucionado gradualmente para codificar genes con múltiples isoformas, creando así un transcriptoma enormemente diverso. . Los avances en las tecnologías para caracterizar las poblaciones de ARN han conducido a una mejor comprensión del procesamiento del ARN en la salud y la enfermedad. En el corazón, el empalme alternativo se reconoce cada vez más como una capa importante de la regulación génica postranscripcional. Además, la identificación reciente de varios factores de empalme cardíaco, como la proteína 20 y SF3B1 del motivo de unión al ARN, no solo proporcionó información importante sobre los mecanismos subyacentes al empalme alternativo, sino que también reveló cómo estos factores de empalme afectan las propiedades funcionales del corazón. Aquí, revisamos nuestro conocimiento actual del empalme alternativo en el corazón, con un enfoque particular en el espliceosoma mayor y menor, los factores que controlan el empalme de ARN y el papel del empalme alternativo en el desarrollo y la enfermedad cardíacos.

Introducción

El empalme de ARN, un proceso postranscripcional necesario para formar un ARNm maduro, se descubrió a fines de la década de 1970. 1 Se han definido dos modos diferentes de empalme, es decir, empalme constitutivo y empalme alternativo. El empalme constitutivo es el proceso de eliminar intrones del pre-ARNm y unir los exones para formar un ARNm maduro. El empalme alternativo, por otro lado, es el proceso en el que los exones se pueden incluir o excluir en diferentes combinaciones para crear una matriz diversa de transcripciones de ARNm a partir de un solo pre-ARNm y, por lo tanto, sirve como un proceso para aumentar la diversidad del transcriptoma. El número estimado de eventos de empalme alternativo en el transcriptoma humano ha aumentado drásticamente en las últimas décadas. En la década de 1980, se pensaba que alrededor del 5% de los genes humanos estaban sujetos a empalmes alternativos. 2 En 2002, este número había aumentado al 60%, 3 y ahora, después de la implementación de tecnologías de secuenciación de próxima generación, sabemos que la gran mayoría, & gt95% de los ARNm, están sujetos a empalmes alternativos. 4 Sin embargo, la función de una gran fracción de estas isoformas de empalme queda por dilucidar. Además, se prevé que en diferentes tejidos, o en tejidos con diferentes estados patológicos, aún quedan por identificar nuevas isoformas. 5

El proceso de empalme se conserva en gran medida durante la evolución. El empalme es más frecuente en eucariotas multicelulares que en unicelulares debido al menor número de genes que contienen intrones en estos últimos. 6 Más adelante en la evolución, el empalme alternativo se vuelve más frecuente en los vertebrados que en los invertebrados. Curiosamente, se ha demostrado que un solo evento de omisión de exón en la proteína de unión al ARN (RBP), la proteína de unión al tracto de polipirimidina 1, dirige numerosos cambios de empalme alternativos entre especies, lo que indica que un solo evento de empalme puede amplificar la diversidad del transcriptoma entre especies. 7 La reciente observación de que el número total de genes que codifican proteínas no difiere mucho entre especies, alimentó la hipótesis de que el empalme alternativo contribuye en gran medida a la diversidad de organismos. Y de hecho, a medida que avanzamos en el árbol filogenético, aumenta la complejidad del empalme alternativo, con la mayor complejidad en los primates. 8,9

El objetivo de esta revisión es brindar una descripción general completa de todos los aspectos del empalme constitutivo y alternativo y sus reguladores, así como la importancia de estos diferentes aspectos en las enfermedades humanas, con un enfoque en el corazón. Además, discutimos posibles intervenciones terapéuticas y tratamos de descubrir posibles direcciones futuras de investigación.

Empalceosoma mayor y menor

El empalme de ARN lo realiza el espliceosoma, un complejo de ribonucleoproteína grande y dinámico compuesto por proteínas y ARN nucleares pequeños (snRNA), que se ensambla en el pre-ARNm (Figura 1). Las ribonucleoproteínas constan de 1 o 2 ARN nucleares pequeños (ARNsn U1, U2, U4 / U6 o U5) y un número variable de proteínas específicas del complejo. 10 Los análisis proteómicos de complejos espliceosomales humanos purificados han indicado que cientos de proteínas pueden asociarse con el espliceosoma durante el proceso de empalme. 11 Estas proteínas juegan un papel crítico no solo en el reconocimiento de los sitios de empalme sino también en el posicionamiento adecuado del pre-ARNm para la catálisis. A mediados de la década de 1990, dos décadas después del descubrimiento del empalme, Tarn y Steitz 12 identificaron un segundo espliceosoma. Este segundo espliceosoma se denominó espliceosoma menor y se dirige a una clase menor (& lt1%) de intrones (Figura 2). El espliceosoma menor es funcionalmente análogo al espliceosoma principal pero difiere en el uso de snRNA (los snRNA menores son U11, U12, U4atac / U6atac y U5). Debido a que el espliceosoma principal usa la ribonucleoproteína nuclear pequeña U2 (snRNP) y el espliceosoma menor el snRNP U12, los intrones principales se denominan intrones de tipo U2 y los intrones menores son intrones de tipo U12. Aunque el espliceosoma menor funciona de manera similar al espliceosoma principal, existen algunas diferencias claras. Primero, las secuencias del sitio de empalme 5 ', el sitio de empalme 3' y la secuencia del punto de ramificación difieren entre los 2 espliceosomas (Figura 2B y 2C). 13 En segundo lugar, el empalme realizado por el espliceosoma principal ocurre estrictamente en el núcleo, mientras que el empalme del espliceosoma menor ocurre principalmente en el citoplasma. 14 En tercer lugar, el empalme menor tiene una velocidad de empalme considerablemente más lenta y, por lo tanto, puede ser el paso limitante de la velocidad en la maduración de un ARNm. 15 Cuarto, el empalme menor rara vez produce isoformas alternativas 16 y parece que se usa principalmente como un mecanismo para controlar la expresión de genes que contienen intrones de clase menor. A este respecto, se sabe que la retención de un intrón de clase menor generalmente conduce a la degradación del transcrito. 17 La razón de la existencia de 2 espliceosomas diferentes no se comprende del todo, pero se ha sugerido que el espliceosoma menor actúa en el citoplasma para evitar la dependencia de un núcleo funcional. Esto tiene una gran ventaja cuando durante la división celular, la envoltura nuclear se rompe, todavía hay un pequeño empalme disponible. De acuerdo con esto, se ha demostrado que el corte y empalme menor es activo durante la mitosis y es importante para la proliferación celular. 14 La alta conservación evolutiva y el hecho de que el empalme menor solo ocurre en & lt1% de los intrones sugiere que el empalme menor no es un sustituto del empalme mayor, sino más bien un proceso separado. Quizás sirva como una verificación final del ARNm en el citoplasma y, por lo tanto, controla postranscripcionalmente la expresión de un subconjunto específico de genes. Aunque el espliceosoma menor es mucho menos abundante que el espliceosoma principal, 18 su importancia está subrayada por el hecho de que las mutaciones en los ARNpn del espliceosoma menor U4atac conducen a trastornos del desarrollo graves como el enanismo primordial osteodisplásico microcefálico tipo 1. 19 demostraron que el uso del espliceosoma menor aumenta rápidamente mediante la activación de la proteína quinasa activada por mitógeno p38 de la quinasa activada por estrés celular (MAPK) a través de la estabilización de U6atac. 17 Esto resultó en una mayor expresión de cientos de genes que contienen intrones menores. Debido a que los ARNm con intrones menores retenidos a menudo se degradan a través de la vía de desintegración mediada sin sentido (NMD) (Figura 2A), la activación de p38 MAPK puede desencadenar el uso de espliceosomas menores y, por lo tanto, controlar la expresión génica en respuesta al estrés.

Figura 1. Reacción de empalme de dos pasos. El empalme se produce en 2 pasos. trans-Reacción de esterificación para eliminar intrones y unir exones. En el primer paso, la ribonucleoproteína nuclear pequeña U1 (snRNP) se ensambla en el sitio de corte y empalme 5 'de un exón y el snRNP de U2 en la secuencia del punto de ramificación (BPS), justo aguas arriba del sitio de empalme 3' del exón adyacente / aguas abajo. Esta configuración se conoce como prespliceosoma. En adelante, U1 y U2 se unen mediante los complejos snRNPs U5 y U4 – U6 para formar el espliceosoma precatalítico. A continuación, los complejos U4-U6 se desenrollan, liberando U4 y U1 del complejo prespliceosomal. Esto permite que U6 se empareje de bases con el sitio de empalme 5 'y el BPS. El sitio de empalme 5 'se escinde, lo que conduce a un grupo OH 3' libre en el exón cadena arriba y una región intrónica ramificada en el exón cadena abajo, llamada intrón lariat. Durante el segundo paso, U5 se empareja con secuencias en el sitio de empalme 5 'y 3', colocando los 2 extremos juntos. El grupo 3 ′ OH del exón corriente arriba (5 ′) se fusiona con la unión intrón-exón 3 ′, uniendo así los 2 exones y escindiendo el intrón en forma de lazo intrónico en forma de lazo. Finalmente, el espliceosoma se desmonta y todos los componentes se reciclan para futuras reacciones de empalme.

Figura 2. Empalme mayor y menor. A, Empalmes mayores y menores. Los intrones principales se cortan y empalman, y los intrones menores se retienen (y el ARNm se degrada más a menudo posteriormente) o se empalma el intrón secundario y se forma un ARNm maduro. B, Las 4 señales de empalme básicas son el sitio donante de empalme 5 ', el sitio aceptor de empalme 3', la secuencia de puntos de ramificación (BPS) y el tracto de polipirimidina (PT). Los componentes splicosomales reconocen y se unen a estas secuencias y median en la reacción de corte y empalme. Los potenciadores y silenciadores de empalme intrónicos y exónicos determinan la tasa de inclusión de exones. El BPS (mayor, YNYURAY minor, UCCUUAACU) está ubicado de 20 a 50 pb aguas arriba del sitio de empalme 3 ', y el PT (Y10-12) está ubicado entre el BPS y el sitio de empalme 3' (N = cualquier nucleótido, Y = C o U, R = A o G y S = C o G). C, El empalme menor utiliza diferentes sitios de empalme 5 ′ y 3 ′ y BPS, y carece del PT. ESE indica potenciadores de empalme exónico ESS, silenciadores de empalme exónico ISE, silenciadores de empalme intrónico e ISS, silenciadores de empalme intrónico.

Diferentes tipos de empalmes alternativos

El empalme alternativo es el proceso en el que el espliceosoma elige incluir o excluir partes específicas del ARNm. Generalmente se observan cuatro modos de empalme alternativo: (1) omisión de exón, (2) uso de exón mutuamente excluyente, (3) selección del sitio de empalme alternativo y (4) retención de intrones (Figura 3A). La omisión de exones, la forma más frecuente de corte y empalme alternativo en eucariotas superiores, 20 denota la escisión de ≥1 exones y sus intrones circundantes de un pre-mRNA. El uso de exón mutuamente excluyente representa una forma de omisión de exón en la que se incluye uno u otro exón, pero nunca ambos, en el ARNm maduro. La selección del sitio de empalme alternativo se basa en la posibilidad de utilizar diferentes sitios de empalme en el extremo 5 'y 3' de un exón, lo que da como resultado exones más largos o más cortos del mismo transcrito. La última forma es la retención de intrones, un proceso en el que (parte de) un intrón se retiene en el transcrito de ARNm maduro.

Figura 3. Diferentes tipos de empalmes alternativos. A, Se muestran los diferentes tipos de empalmes. El proceso de escisión de intrones y unión de exones es un empalme constitutivo. La omisión de exones es la inclusión o exclusión de uno o más exones (conocidos como exones de casete). Los exones de casete pueden ser mutuamente excluyentes. La selección del sitio de empalme (SS) 5 'o 3' alternativo da como resultado exones más cortos o más largos. La retención de intrones es la inclusión de (parte de) un intrón en el ARNm maduro. BOtras formas de generar múltiples transcripciones de ARNm diferentes a partir de un solo gen son el uso alternativo del primer exón y la poliadenilación alternativa.

Estos diferentes eventos de empalme pueden tener múltiples consecuencias funcionales. Cuando el evento de corte y empalme ocurre en la región codificante del ARNm, el efecto más obvio es un cambio de isoforma, que conduce a funciones alteradas o incluso opuestas de la proteína. En segundo lugar, el empalme alternativo puede dar como resultado isoformas de ARNm con codones de parada prematuros que se degradan a través de la vía NMD. Aunque la vía NMD se identificó originalmente como una vía de vigilancia de errores, ha quedado claro que la NMD también sirve para regular la expresión génica. Como tal, la NMD inducida por empalme alternativo proporciona un medio para controlar la expresión de proteínas. 21 Finalmente, los eventos de corte y empalme alternativos que ocurren en las regiones no traducidas (UTR) 5 'o 3' pueden conducir a UTR alteradas, que a su vez pueden interferir con la estabilidad del ARNm, la accesibilidad del microARN y la localización del ARNm.

Además del corte y empalme alternativo, existen otros 2 procesos que pueden generar múltiples transcripciones de ARNm a partir de un único pre-ARNm o gen: poliadenilación alternativa (APA) y uso alternativo del primer exón (o uso alternativo del promotor Figura 3B). Los pre-ARNm eucariotas se procesan en su extremo 3 por escisión y la adición de una cola de poli (A). Curiosamente, la mayoría de los ARNm eucariotas tienen múltiples sitios de poliadenilación, y los estudios genómicos de los últimos años han indicado que aproximadamente el 70% de los genes humanos generan isoformas de ARNm alternativas que difieren en longitud en el extremo 3 'mediante un proceso llamado escisión y poliadenilación alternativas. 22 Las isoformas de APA generalmente difieren en su 3'UTR, pero en aproximadamente un tercio de los casos, también difieren en las secuencias de codificación. 23 Debido a que la 3'UTR generalmente alberga dominios funcionales como sitios de unión de microARN o RBP, la longitud de 3'UTR alterada por APA puede tener efectos profundos sobre la expresión génica. 24 El uso alternativo del primer exón ocurre cuando la maquinaria transcripcional comienza en un promotor diferente y conduce a diferentes isoformas de ARNm o proteínas en el extremo N terminal. Los 3 procesos, empalme alternativo, APA y uso alternativo del primer exón, parecen ser codependientes, pero queda por dilucidar cómo estos procesos están funcionalmente vinculados. 4,25,26 No obstante, el APA y el uso alternativo del primer exón son, aunque similares en el resultado del empalme alternativo, técnicamente no son empalmes alternativos, ya que no están mediados por el espliceosoma.

ARN empalmados y no codificantes

Aparte del corte y empalme de genes que codifican proteínas, también los ARN no codificantes largos (lncRNA) se someten a empalme alternativo, aunque en menor grado. 27 Esto podría deberse al menor número promedio de exones en los lncRNA. Curiosamente, la producción de muchos ARN no codificantes, como los microARN y los ARN nucleolares pequeños (ARNsno) se basa en el empalme.Estos ARN no codificantes residen en intrones y se cortan y empalman de su transcripción del anfitrión, después de lo cual se procesan. 28 La expresión de estos ARN no codificantes está estrechamente relacionada con la expresión de los ARNm de su huésped, y para los ARNsno, se ha sugerido que sus ARNm del huésped son simplemente un subproducto del proceso de producción de ARNsno. 29 Además, muchos ARN no codificantes diferentes (incluidos snoRNA, lncRNA y sno-lncRNA) están siendo reconocidos como reguladores del empalme alternativo. Se ha demostrado que el lncRNA MALAT1, por ejemplo, regula el nivel de expresión, la localización y la actividad de las proteínas SR (proteínas ricas en serina / arginina). 30 Se ha sugerido que MALAT1, al menos en parte, funciona como una esponja molecular para las proteínas SR. Por tanto, la regulación de MALAT1 regula indirectamente el corte y empalme de los objetivos de la proteína SR.

Otro ejemplo es la formación de ARN circulares. Durante mucho tiempo se pensó que los ARN circulares eran un subproducto accidental del empalme, pero resultaron estar altamente regulados, lo que sugiere roles funcionales específicos para esta nueva clase de ARN. 31 Los ARN circulares se sintetizan mediante empalme inverso, una forma de empalme en la que un sitio de empalme 5 'de un exón se liga al sitio de empalme 3' de un exón corriente arriba, creando así un ARN circular. Obviamente, formas relativamente desconocidas de empalme, como el empalme inverso, podrían aparecer como nuevos reguladores de los procesos biológicos.

Regulación del empalme

El empalme alternativo es un proceso dinámico y regulado y puede verse influenciado por una serie de variables como cis-secuencias reguladoras y trans-factores de acción, el proceso de transcripción y metilación del ADN / ARN. Juntas, estas características reguladoras del ARN conforman el código de empalme, un código que determina eventos o patrones de empalme alternativos. 32

Actualmente, se han identificado aproximadamente 1500 RBP en humanos. 33 Las RBP actúan como reguladores de diversos procesos postranscripcionales, incluido el empalme constitutivo y alternativo, el transporte y la localización del ARNm, la estabilidad del ARNm, la inhibición del microARN y la traducción del ARNm. Probablemente, las familias de RBP mejor descritas son la familia de proteínas SR y la familia de proteínas de ribonucleoproteína nuclear heterogénea (hnRNP). La mayoría de las proteínas de estas familias se expresan de forma ubicua y cumplen funciones críticas en el ensamblaje espliceosomal. Las proteínas SR se caracterizan por la presencia de al menos 1 motivo de reconocimiento de ARN y un dominio RS. El dominio de motivo de reconocimiento de ARN es necesario para la unión de ARN, mientras que el dominio RS funciona como un dominio de interacción de proteínas. Además de las 20 proteínas SR descritas, hay muchas proteínas adicionales que contienen dominios RS denominadas proteínas relacionadas con SR. 34 La familia de proteínas hnRNP recibe su nombre de su asociación con hnRNA, un término histórico que es sinónimo de pre-mRNA. Las proteínas hnRNP tienen al menos 1 motivo de unión al ARN y al menos 1 dominio funcional adicional responsable de la regulación de, por ejemplo, interacciones proteína-proteína o localización celular. 35 Sin embargo, debido a las propiedades y funciones similares de las proteínas SR y hnRNP, la distinción entre las 2 familias se ha difuminado a lo largo de los años. Además de las RBP expresadas de forma ubicua de las familias de proteínas SR y hnRNP, existen numerosas RBP específicas de tejido o enriquecidas en tejido. Aunque se cree que la mayoría de las RBP de las familias de proteínas SR y hnRNP son redundantes, la combinación de diferentes RBP (incluidas las RBP específicas de tejido) en el espliceosoma determina su especificidad en el reconocimiento de exones alternativos. La expresión de diferentes factores de empalme tiene efectos profundos sobre el resultado del empalme alternativo. Hay numerosos ejemplos en los que el equilibrio de diferentes factores de corte y empalme se regula de una manera específica de célula / tejido, 36 específica del desarrollo, 37 o específica de la enfermedad. 38 El equilibrio entre estos factores de empalme determina entonces la inclusión o exclusión de exones específicos. Quizás el mejor ejemplo es la función antagonista de las familias de proteínas muscleblind y CUG-BP y ETR-3-like factor (CELF). Durante el desarrollo, los niveles de proteína muscleblind y CELF determinan la inclusión de exones fetales y la exclusión de exones adultos en un conjunto de genes. 37 Además de regular el nivel de expresión de las RBP, también se puede controlar su actividad (p. Ej., Mediante fosforilación), y esto también afecta al pre-mRNA o al splicing alternativo. 39

El grado en el que un ARNm se empalma alternativamente también depende del uso de sitios de empalme fuertes y débiles. Los sitios de empalme fuertes generalmente conducen a empalmes constitutivos, ya que siempre los usa el espliceosoma. El uso de sitios de empalme débiles depende de factores como la secuencia del sitio de empalme, la posición del sitio de empalme y los factores de empalme ligados. Por ejemplo, ciLas secuencias reguladoras s conocidas como potenciadores de empalme intrónico, silenciadores de empalme intrónico, potenciadores de empalme exónico y silenciadores de empalme exónico pueden unirse mediante trans-activas RBP, que a su vez reclutan componentes espliceosomales. Según la secuencia y la posición del sitio en el pre-ARNm, transLas RBP que actúan pueden mejorar o disminuir la inclusión de exones. 40 Curiosamente, los sitios de empalme se pueden alterar mediante la edición de ARN, un proceso postranscripcional mediante el cual las células pueden realizar cambios discretos en nucleótidos específicos dentro de una molécula de ARN. Las proteínas responsables de este proceso son las adenosina desaminasas que actúan sobre el ARN (ADAR) y, al controlar la edición del ARN, estas proteínas pueden regular el empalme indirectamente, al afectar las secuencias del sitio de empalme. 41

Además, el proceso de transcripción en sí mismo puede tener un efecto fundamental en el empalme alternativo. A diferencia de lo que se ha pensado durante muchos años, el empalme no ocurre después de la transcripción, sino durante la transcripción. Como tal, la gran mayoría de los intrones humanos se empalman cuando la transcripción todavía se está llevando a cabo. 42 El pre-ARNm, por lo tanto, representa una entidad virtual. Además de ocurrir simultáneamente, resulta cada vez más claro que también mecánicamente, la transcripción y el empalme son procesos vinculados. Los 2 mecanismos que subyacen a la codependencia de los procesos son el acoplamiento de reclutamiento y el acoplamiento cinético. El acoplamiento de reclutamiento se basa en la capacidad de la maquinaria de transcripción para reclutar RBP que también son compartidos por la maquinaria de empalme. Por ejemplo, se sabe que el dominio carboxi-terminal de la ARN polimerasa II (Pol II) recluta el factor de corte y empalme rico en serina / arginina (SRSF) -3, una proteína SR implicada en la regulación del corte y empalme alternativo de fibronectina. 43 El acoplamiento cinético se basa en la velocidad a la que Pol II transcribe el ADN (tasa de elongación), lo que influye en la disponibilidad de sitios de empalme débiles y fuertes. Aunque Pol II transcribe ADN, el pre-ARNm está disponible para el espliceosoma, incluso cuando la transcripción no ha finalizado. Si el alargamiento mediado por Pol II es lento y se dispone de un sitio de empalme débil, la maquinaria de empalme hará uso del sitio de empalme débil. Sin embargo, si el alargamiento es rápido y los sitios de empalme débil y fuerte están disponibles más o menos simultáneamente, la maquinaria de empalme favorecerá el sitio de empalme fuerte sobre el sitio de empalme débil. Existen varios ejemplos de este fenómeno, 44,45 pero la evidencia más convincente la proporciona el uso de Pol II lento mutante, que da como resultado una tasa de elongación más lenta y un uso de exón alterado de la fibronectina. 46

El hecho de que las tasas de elongación de Pol II influyan en el empalme alternativo ha llevado a la hipótesis de que las modificaciones epigenéticas también podrían influir en el empalme alternativo porque estas modificaciones pueden influir en la estructura de la cromatina y, por lo tanto, en la tasa de elongación de Pol II. Recientemente, también se ha demostrado que la metilación del ADN está enriquecida en exones en comparación con sus intrones flanqueantes, 47 lo que sugiere que las modificaciones epigenéticas juegan un papel en el empalme. Resulta que la metilación del ADN se puede vincular a un empalme alternativo de aproximadamente el 20% de los exones empalmados alternativamente, 48 tanto a través del acoplamiento de reclutamiento 48 como del acoplamiento cinético. 49 Con respecto al acoplamiento cinético, Shukla et al 49 demostraron que la metilación de un sitio del factor de unión a CCCTC (CTCF) en el gen CD45 humano determinaba la tasa de inclusión del exón 5. Cuando el sitio CTCF no está metilado, CTCF puede unirse y servir como un obstáculo para Pol II, reduciendo efectivamente la tasa de alargamiento. Esto, a su vez, da como resultado la inclusión del exón. Por el contrario, cuando el sitio CTCF en el exón 5 está metilado, se inhibe la unión de CTCF y se excluye el exón, lo que demuestra que las tasas de elongación de Pol II están influenciadas por el estado de metilación del ADN. El posicionamiento de los nucleosomas y las modificaciones de las histonas también afectan al empalme (alternativo). Los nucleosomas son unidades de empaquetamiento de ADN que constan de proteínas histonas y una sección de ADN. Curiosamente, los nucleosomas se colocan preferentemente en los exones, con un promedio de 1 nucleosoma por exón. 6 Los intrones no carecen de nucleosomas, pero la distribución de los nucleosomas en los intrones es mucho más aleatoria. 50 Esto ha llevado a la idea de que los nucleosomas ayudan a la maquinaria de empalme a localizar exones. Los nucleosomas actúan como un speedbump para ralentizar el alargamiento, lo que proporciona más tiempo para que la maquinaria de empalme reconozca el sitio de empalme 3 '. 51 El hecho de que los exones alternativos estén más enriquecidos en nucleosomas que los exones constitutivos apunta hacia un papel regulador de los nucleosomas en el empalme alternativo también. 50 Al igual que los nucleosomas, las modificaciones de las histonas también se enriquecen en los exones. Para algunas modificaciones de histonas, esto es el resultado de una mayor densidad de nucleosomas en los exones, pero incluso cuando se corrigen por el enriquecimiento de nucleosomas, algunas modificaciones de histonas (como H3K36me3, H3K4me3 y H3K27me2) todavía aumentan, mientras que otras se reducen (como H3K9me3) . 52 Las marcas de histonas pueden influir en el empalme alternativo a través del acoplamiento cinético y de reclutamiento. 6,52,53 El vínculo entre la metilación del ADN y las modificaciones de las histonas está bien investigado, y recientemente Yearim et al 48 revelaron que el estado de metilación del ADN regula el reclutamiento de los componentes del espliceosoma a través de la proteína que contiene cromodominio HP1, que se ha demostrado que se une directamente a H3K9me3, una modificación de histona inducida por la metilación del ADN. Además de la metilación del ADN, también la metilación del ARN (N 6 -metiladenosina [m 6 A]) ha surgido en los últimos años como un factor importante en el corte y empalme alternativo. 54 En 2015, Liu et al 55 demostraron que la metilación del ARN afecta la estructura secundaria del ARN de tal manera que m 6 A abre el ARNm para interacciones con las RBP.

Factores de empalme en el corazón en desarrollo

Aunque la mayoría de los mecanismos generales que controlan el empalme alternativo no se han investigado en un contexto cardíaco (es decir, espliceosoma menor, acoplamiento de transcripción y empalme y metilación del ADN), se está volviendo evidente que el empalme alternativo juega un papel fundamental en el desarrollo, la homeostasis y enfermedad del corazón.

Utilizando una pantalla a gran escala con microarrays de empalme, Kalsotra et al 37 revelaron 63 eventos de empalme alternativos en el corazón del ratón en desarrollo. El análisis bioinformático de los intrones que flanquean estos eventos de empalme identificó motivos enriquecidos para CELF y proteínas muscleblind. Utilizando modelos de ratón transgénico y knockout, Kalsotra et al 37 muestran posteriormente que las proteínas CELF y muscleblind determinan más de la mitad de los 63 eventos de empalme regulados por el desarrollo observados. Durante el desarrollo del corazón, las proteínas CELF se regulan negativamente & gt10 veces, mientras que las proteínas muscleblind se regulan positivamente ~ 4 veces y parece que la expresión estoicastica de estas 2 proteínas determina en gran medida la expresión temporal de numerosas isoformas de empalme.

Recientemente se ha demostrado que la proteína de motivo de unión al ARN 24 (Rbm24) es un regulador importante de los eventos de empalme del corazón y del músculo esquelético. 56 Los ratones que carecen de Rbm24 mueren entre E12.5 y E14.5 debido a múltiples malformaciones cardíacas, que incluyen defectos del tabique ventricular, trabeculación y compactación reducidas y aurículas dilatadas. Sorprendentemente, la sarcomerogénesis se abolió casi por completo en los embriones knockout. El análisis del transcriptoma de los corazones de embriones mutantes reveló un empalme aberrante de 68 genes dependientes de Rbm24, de los cuales varios son importantes para la cardio y sarcomerogénesis. Aunque tanto muscleblind / CELF como Rbm24 regulan los eventos de empalme específicos de los músculos, solo hay una superposición de ~ 10% en sus objetivos, lo que sugiere que estas proteínas regulan diferentes procesos.

También se ha implicado a miembros de la familia de proteínas SR en la regulación del corte y empalme alternativo en el corazón en desarrollo. Un ejemplo es el ratón SRp38 - / -, descrito por Feng et al. 57 SRp38 (o SRSF10) es una proteína SR expresada de forma ubicua, aunque inusual. La mayoría de las proteínas SR actúan como activadores de empalme, pero SRp38 actúa principalmente como represor de empalme. La pérdida de SRp38 es embrionariamente letal, pero la mayoría de los embriones mutantes sobreviven hasta E15.5. Poco después, los embriones mutantes mueren debido a múltiples defectos cardíacos. Esto se atribuye a una dowregulation de triadina y calsequestrin2 y una proporción alterada de las isoformas de triadina 1 y 2. La triadina y la calsequestrin2 están involucradas en la regulación de la liberación de Ca 2+ del retículo sarcoplásmico, y la pérdida de SRp38 conduce a un aumento de las chispas de Ca 2+ del retículo sarcoplásmico, lo que indica un papel de SRp38 en la regulación de la liberación de Ca 2+.

El desarrollo cardíaco posnatal también va acompañado de importantes cambios de empalme alternativo, 58 y varios modelos de ratón han revelado un papel de los factores de empalme en el desarrollo cardíaco posnatal. Uno de los primeros ejemplos es el factor de corte y empalme alternativo ASF / SF2 (o SFRS1), que es una proteína SR que se expresa de forma ubicua y actúa como un regulador de corte y empalme constitutivo y alternativo. 59 Los ratones knockout para ASF / SF2 son embrionariamente letales y la ablación condicional específica del corazón causa un fenotipo cardíaco hipercontráctil causado por un defecto en la manipulación del Ca 2+. Los ratones knockout condicional ASF / SF2 mueren de 6 a 8 semanas después del nacimiento. La deleción de ASF / SF2 conduce a un empalme incorrecto de varios genes, incluida la proteína quinasa dependiente de Ca2 + / calmodulina (CamkIIδ), la troponina T cardíaca (cTnT) y la unión 3 del dominio LIM (LDB3). Curiosamente, el empalme alternativo aberrante de CamkIIδ, cTnT y LDB3 se presentó 20 días después del nacimiento, aunque ASF / SF2 se eliminó en las primeras etapas de la cardiogénesis. Esto podría significar que ASF / SF2 juega un papel crítico durante el período de transición de juvenil a adulto, pero es prescindible en etapas anteriores. El empalme incorrecto de CamkIIδ en corazones knockout ASF / SF2 da como resultado una manipulación de Ca 2+ alterada y defectos graves de acoplamiento de excitación-contracción, que a su vez conduce a miocardiopatía dilatada (DCM).

El factor de empalme 2 rico en SR (SRSF2 o SC35) es otra proteína SR que se expresa de forma ubicua. La deleción sistémica de SC35 en ratones produce letalidad embrionaria, incluso antes del inicio de la cardiogénesis. 60 Eludir este problema mediante la generación de un knockout específico del corazón de SC35 descubrió el papel de SC35 en el corazón, ya que estos ratones desarrollaron hipertrofia cardíaca y DCM entre las 5 y 6 semanas de edad. 60 Sorprendentemente, la vida útil de estos ratones mutantes no se vio afectada. El fenotipo de la enfermedad se asocia con una regulación a la baja del receptor de rianodina 2 (Ryr2) en los corazones con inactivación de SC35. Aunque no se proporcionó un mecanismo exacto, los autores especulan que RyR2 está mal empalmado y, por lo tanto, se deteriorará a través de la vía NMD. En conclusión, la ablación de SC35 en el corazón muestra que la expresión adecuada de este factor de empalme durante el desarrollo cardíaco posnatal es esencial para mantener la forma y función cardíacas.

Se sabe poco acerca de las funciones específicas de las proteínas hnRNP en el corazón, pero la deleción condicional de hnRNP U en el corazón del ratón produce DCM grave y es letal a las 2 semanas después del nacimiento. 61 Curiosamente, al igual que SRSF1, SRSF2 y SRFS10, hnRNP U es importante para el empalme adecuado de genes que manejan Ca 2+ como CamkIIδ, lo que sugiere que el empalme alternativo de genes que manejan Ca 2+ es fundamental en el desarrollo cardíaco posnatal temprano.

Empalme alternativo en caso de enfermedad

El empalme alternativo aberrante puede ser tanto la causa como la consecuencia de la enfermedad y se ha demostrado que puede afectar la gravedad y la susceptibilidad de la enfermedad. 62 Se han descrito mutaciones en genes necesarios para el funcionamiento adecuado del espliceosoma como causa de atrofia muscular espinal, retinitis pigmentosa y síndrome de Prader-Willi. 63–65 La atrofia muscular espinal, por ejemplo, es causada por la pérdida del gen superviviente de la neurona motora-1 (SMN1), que es necesario para el ensamblaje y transporte adecuados de snRNP. 63 Curiosamente, aunque SMN1 se expresa de forma ubicua, el fenotipo está restringido a las neuronas motoras. No está del todo claro por qué las neuronas motoras son más sensibles a la pérdida del ensamblaje y la función de snRNP dirigidos por SMN1, pero es probable que ciertos eventos de empalme sean más críticos para estas células. En el caso del síndrome de Prader-Willi, la pérdida de snoRNA y sno-lncRNA codificados en el locus SNURF / SNRNP provoca un empalme incorrecto del receptor de serotonina 2C y otros objetivos, pero nuevas líneas de evidencia sugieren un papel de estos snoRNA en la edición de ARN de la transcripción del receptor de serotonina 2C también. 28,66

Además de las mutaciones en los componentes espliceosomales, las mutaciones en los sitios de empalme pueden tener un efecto perturbador sobre el empalme. Curiosamente, un estudio reveló que una cantidad notable de ≤15% de las mutaciones conocidas que causan enfermedades parecen afectar los sitios de empalme en los pre-ARNm, en lugar de alterar la región codificante de proteínas de un ARNm. 67 Sin embargo, este estudio se llevó a cabo en una época en que el conocimiento del código de empalme era incompleto y, por lo tanto, descartó una gran cantidad de mutaciones que potencialmente causan anomalías en el empalme. Por lo tanto, se ha sugerido que el 15% puede ser una gran subestimación del número real, y que el porcentaje de mutaciones que causan enfermedades que causan anomalías en el empalme, tanto en los sitios de empalme como en los genes asociados al empalme, se acerca al 60%. 68,69

Los estudios sobre cambios de empalme alternativo en el corazón han revelado grandes diferencias entre el desarrollo o los estados de enfermedad. Curiosamente, al igual que la reactivación de genes fetales seleccionados, algunas isoformas de empalme fetal también se reexpresan en el corazón estresado o enfermo. 70 Por ejemplo, el corte y empalme de las proteínas sarcoméricas titina y miomesina se regula durante el desarrollo y sus isoformas fetales se reexpresan en el corazón estresado. 71 Aparte de la reexpresión de isoformas fetales, se sabe que el empalme alternativo se ve ampliamente alterado en la hipertrofia y la enfermedad cardíacas. La hipertrofia cardíaca puede ser fisiológica, reversible y adaptativa o progresar a hipertrofia patológica con cambios irreversibles y desadaptativos. Los mecanismos moleculares precisos que distinguen las 2 formas aún no se comprenden del todo, pero ha quedado claro que los perfiles de empalme alternativos de las 2 formas son diferentes. 72 En corazones de ratón hipertrofiados y defectuosos, los perfiles de empalme alternativos también se alteran, con las mayores diferencias en corazones defectuosos. 73 En humanos, Kong et al 74 fueron los primeros en utilizar un enfoque de todo el genoma para estudiar cambios de empalme alternativos en el corazón enfermo.El perfil de empalme de los corazones enfermos y de control difirió ampliamente y, posteriormente, los autores pudieron asignar correctamente las muestras al control o la enfermedad basándose únicamente en el perfil de empalme. Además, el empalme de 4 genes sarcoméricos clave, troponina T (TNNT) -2, TNNI3, MYH7 y FLNC, se alteraron significativamente en la miocardiopatía isquémica humana, DCM y estenosis aórtica. En el corazón sobrecargado de presión, incluso precedió al inicio de la insuficiencia cardíaca (IC). Además, la proporción de isoformas mayores: menores de solo 3 de estos genes, TNNT2, MYH7 y FLNC, fue suficiente para asignar correctamente las muestras al control o la enfermedad con una precisión de & gt98%, lo que podría ser útil como herramienta de diagnóstico.

Aunque no está mediado por el espliceosoma, un estudio reciente de nuestro grupo reveló que la formación del ARNm del extremo 3 'a través de APA también se altera en la HF. Al generar mapas de poliadenilación de todo el genoma en el corazón humano, se demostró que subconjuntos de genes mostraban alargamiento de 3'UTR, mientras que otros mostraban acortamiento de 3'UTR. Curiosamente, los genes con la longitud 3'UTR alterada a menudo estaban desregulados en los corazones defectuosos, con una correlación inversa entre la longitud 3'UTR y el nivel de expresión génica. Esto sugiere que, además del corte y empalme alternativo, los interruptores de isoformas mediados por APA también representan una capa importante de regulación génica en la HF. 75

Factores de empalme en el corazón enfermo

Apenas estamos comenzando a comprender las funciones de diferentes factores de empalme, y para muchas RBP, recientemente se ha revelado su papel en el corazón normal y enfermo (Tabla 1). Sorprendentemente, no se han descrito muchas mutaciones en los factores de corte y empalme que conduzcan a patologías cardíacas humanas. Hasta la fecha, solo las mutaciones en la proteína 20 del motivo de unión al ARN del factor de corte y empalme (RBM20) se han relacionado causalmente con la enfermedad cardíaca. 76–78 La falta de factores de empalme en la lista de genes causantes de enfermedades cardíacas podría tener múltiples explicaciones. Podría ser que las mutaciones en los factores de corte y empalme sean graves y embrionariamente letales. Varios modelos de ratón en los que se ha eliminado un factor de empalme (p. Ej., Rbm24, SC35, SRp20 y SRp38) apoyan esta idea. 56,57,60,79 Además, antes de la llegada de la secuenciación de próxima generación, la búsqueda de genes candidatos solía estar impulsada por hipótesis y, a menudo, no incluía factores de empalme y, en consecuencia, los genes que codifican factores de empalme simplemente no se secuenciaron en los pacientes afectados. . Solo recientemente ha sido posible buscar genes candidatos de una manera más amplia y, a menudo, imparcial, y los genes relacionados con el empalme se pueden secuenciar a mayor escala.

Tabla 1. Características y función conocida de los factores de empalme en el corazón

ASF indica factor de empalme alternativo CELF, CUG-BP y factor similar a ETR-3 DCM, miocardiopatía dilatada DM, distrofia miotónica HF, insuficiencia cardíaca hn-RNP, MBNL de ribonucleoproteína nuclear heterogénea, PKC de ceguera muscular, proteína quinasa C PTB, unión al tracto de polipirimidina RBM, proteína SF de motivo de unión a ARN, factor de empalme y SRSF, factor de empalme rico en serina / arginina.

* Estos artículos describen la regulación al alza de 17 factores de empalme, entre los que se encuentran Rbm25 y Luc7l3, en la insuficiencia cardíaca humana. Solo Rbm25 y Luc7l3 se caracterizaron molecularmente, pero los otros 15 factores de empalme probablemente también desempeñan un papel en el corazón.

Sin embargo, en 2009, Brauch et al 76 describieron mutaciones en RBM20 ser causal de DCM familiar. Desde entonces, mutaciones en RBM20 se han encontrado en múltiples cohortes, siendo responsable del 3% al 5% de todos los casos familiares de MCD. 77,78 Posteriormente, Guo et al. 80 ratas deficientes en Rbm20 con un fenotipo cardíaco que se asemeja mucho al DCM en individuos con RBM20 Se analizaron las mutaciones. La secuenciación de ARN de corazones de rata deficiente en Rbm20 y un portador de la mutación RBM20 humano reveló un conjunto de 30 genes empalmados alternativamente dependientes de RBM20 que se conservaron entre la rata y el ser humano. Uno de los eventos de empalme que dependen de Rbm20 es el de la región del resorte de titina, y se cree que es un determinante importante del fenotipo DCM. 80,81 En ratones, la pérdida de Rbm20 da como resultado una isoforma gigante de titina (N2BA-G), un aumento de la elasticidad basada en la titina y un mecanismo de Frank-Starling deficiente (es decir, la capacidad de aumentar la fuerza contráctil con aumento del sarcómero largo). 95 Además de los eventos de empalme alternativo en titina, ahora se sabe que RBM20 también regula eventos de empalme alternativo en CamkIIδ, Ryr2 y Cacna1c. 82 La pérdida de Rbm20 induce un cambio CamkIIδ de CamKIIδ-B y CamkIIδ-C a 2 isoformas más grandes (CamkIIδ-A y CamkIIδ-9). Esto potencialmente da como resultado una desregulación de la función normal de CamkIIδ y puede afectar la homeostasis de Ca 2+ y otras funciones de CamkIIδ. Los eventos de empalme alternativo en Ryr2 y Cacna1c también podrían afectar la homeostasis del Ca 2+, y juntos pueden contribuir al aumento del riesgo de muerte súbita cardíaca en RBM20 portadores de mutaciones. Sorprendentemente, la expresión de RBM20 varía mucho en corazones humanos enfermos y su expresión se correlaciona con el empalme de genes diana de RBM20. 82 Esto sugiere que también en RBM20 DCM con mutación negativa, RBM20 puede desempeñar un papel en la progresión de la enfermedad.

La regulación al alza de SF3B1, otro factor de empalme, puede ser suficiente para inducir una enfermedad cardíaca. SF3B1, un factor de empalme inducible por Hif1α, se regula al alza en el corazón humano y de ratón enfermo y coordina un cambio en las isoformas de cetohexokinasa. 89 La cetohexoquinasa es la enzima central que metaboliza la fructosa y existe en 2 isoformas: cetohexoquinasa-A y cetohexocinasa-C. Durante la hipertrofia y la insuficiencia, el corazón cambia hacia una mayor glucólisis a expensas del metabolismo de los ácidos grasos, 96 y el cambio inducido por SF3B1 de la cetohexoquinasa-A a la cetohexocinasa-C es necesario y suficiente para hacer cumplir la fructólisis en el cardiomiocito. Curiosamente, la pérdida específica del corazón de SF3B1 o cetohexokinasa previene el cambio metabólico y protege del crecimiento cardíaco patológico.

Los miembros de la familia de proteínas FOX también están desregulados en las enfermedades cardíacas. La expresión de Rbfox1 disminuye en los corazones defectuosos de humanos y ratones, y la pérdida de Rbfox1 agrava la HF inducida por sobrecarga de presión en ratones. 83 El análisis de empalme reveló un cambio de isoforma en la familia de genes del factor potenciador de miocitos-2 (Mef2), que involucra los exones α1 y α2 mutuamente excluyentes, que interfiere con la actividad transcripcional de Mef2. Sorprendentemente, la reexpresión de Rbfox1 en corazones de ratón sobrecargados de presión atenúa la hipertrofia y la insuficiencia cardíacas.

La expresión de Rbfox2 también se reduce en el corazón del ratón sobrecargado de presión, y la eliminación condicional de Rbfox2 conduce a DCM y HF. 85 El análisis de empalme de corazones sobrecargados de presión y corazones Rbfox2 - / - reveló un enriquecimiento en los eventos de empalme regulados por el desarrollo. Sorprendentemente, estos eventos de empalme se invirtieron con la pérdida de Rbfox2, lo que sugiere un papel de Rbfox2 en la fase descompensadora durante la enfermedad cardíaca.

Mutaciones en los sitios de empalme que conducen a la enfermedad cardíaca humana

En la actualidad, solo hay unos pocos ejemplos de mutaciones en los sitios de empalme que causan directamente la enfermedad cardíaca humana (Tabla 2). Una de las primeras mutaciones en el sitio de empalme que se ha informado que da como resultado una enfermedad cardíaca es una mutación en el sitio de empalme 5 'del exón 15 del corazón. TNNT2. 97 Una transición G-A interrumpe el sitio de empalme 5 'y conduce a variantes de ARNm truncado. Curiosamente, la interrupción del sitio de empalme conduce no solo a la omisión del exón 15, sino también a la activación de un sitio de empalme críptico en el exón 15, lo que da como resultado un segundo producto de empalme aberrante de TNNT2. En consecuencia, las contracciones sarcoméricas se alteran y sobreviene una miocardiopatía hipertrófica. En la misma línea, Bonne et al 98 reportaron una mutación en el sitio de empalme en proteína C de unión a miosina, que también codifica una proteína sarcomérica, que causa miocardiopatía hipertrófica. Curiosamente, como el TNNT2 mutación, la mutación en proteína C de unión a miosina interrumpe un sitio de empalme y simultáneamente activa un sitio de empalme críptico corriente abajo, lo que da como resultado un empalme aberrante del ARNm de la proteína C de unión a miosina.

Tabla 2. Mutaciones del sitio de empalme que se ha demostrado que son causantes de enfermedad cardíaca humana

RBP indica proteína de unión a ARN y SRSF, factor de corte y empalme rico en serina / arginina.

En DCM familiar, TTN es el gen mutado con más frecuencia, y en aproximadamente el 25% de los pacientes con MCD familiar idiopática, las mutaciones truncadas en TTN se encuentran. En particular, ~ 31% de las mutaciones truncadas en TTN son mutaciones en el sitio de empalme. 99 Estas mutaciones en el sitio de empalme alteran el TTN de longitud completa y cambian la rigidez pasiva del músculo cardíaco. Curiosamente, las isoformas de TTN cambian en la enfermedad cardíaca, 110 y el empalme aberrante de TTN podría ser tanto una causa como una consecuencia de la enfermedad cardíaca.

En algunos casos, en lugar de interrumpir un sitio de empalme, la mutación da lugar a un nuevo sitio de empalme. Por ejemplo en SCN5A, que codifica la subunidad α del canal de sodio cardíaco, una inserción de 4 pb en el exón 27 crea un sitio de empalme críptico, provocando una deleción de 96 pb que da como resultado la pérdida de dominios clave de SCN5A. 107 El canal mutante no expresa ninguna corriente de sodio y conduce al síndrome de Brugada, una enfermedad cardíaca que se caracteriza por un ECG anormal y un mayor riesgo de muerte súbita.

En la Tabla 2 se enumeran más ejemplos de genes con mutaciones en el sitio de empalme, y es probable que, con nuestro conocimiento actual de la importancia del empalme correcto y el uso de métodos de detección de todo el genoma, sigan muchos más.

Distrofia miotónica

La distrofia miotónica (DM), probablemente el trastorno asociado al empalme más conocido, es una enfermedad neuromuscular caracterizada por atrofia muscular, hipercontractilidad muscular, defectos de conducción cardíaca y miocardiopatía. Hay 2 tipos de DM: el tipo 1, que es causado por una expansión de las repeticiones de CUG en el 3′UTR del DMPK gen, y el tipo 2, que es causado por una expansión de las repeticiones CCUG en el intrón 1 en el ZNF9 gene. Los individuos sanos tienen de 5 a 40 repeticiones, mientras que los pacientes con DM tienen cientos o miles de estas repeticiones. 111 Los factores de empalme de la familia muscleblind y CELF están desregulados de manera antagónica (pero por separado) en la DM y parecen desempeñar un papel crucial en el desarrollo de la DM. En este sentido, se demostró que las proteínas muscleblind se secuestran en las repeticiones (C) CUG del ARN mutante y se agregan en focos nucleares, lo que interfiere con el empalme de los objetivos muscleblind. 112 En la DM tipo 1 (pero no en el tipo 2), CUGBP1 (o CELF) está hiperfosforilada por la proteína quinasa C y su actividad aumenta. 113 Además, la expresión de CELF está regulada por miR-23a y miR-23b, que están regulados a la baja en corazones con DM. 114,115 Las funciones antagonistas de muscleblind y CELF también se observan durante el desarrollo, y el efecto aditivo de pérdida de función de muscleblind y ganancia de función de CELF promueve un perfil de empalme de tipo embrionario en la DM. En ratones, tanto la pérdida de función de muscleblind como la ganancia de función de CELF son suficientes para inducir un fenotipo similar a DM. 86,87 Las anomalías cardíacas ocurren en & gt80% de los pacientes con DM, 115 pero los mecanismos moleculares exactos que subyacen a estas anomalías cardíacas no se comprenden completamente. Probablemente se relacione con las funciones alteradas de muscleblind y CELF, que se sabe que regulan el empalme de ClC-1, TNNT2 y TNNT3. 86 Aparte de las alteraciones del empalme, ahora se sabe que las repeticiones de CUG provocan una disminución general de la expresión de Mef2. 115 Esto, a su vez, conduce a una disminución de la expresión de los genes diana Mef2 y una reprogramación general del transcriptoma cardíaco.

Finalmente, aunque se acepta generalmente que las repeticiones de CUG son causantes de DM1, y se sabe que las repeticiones son necesarias y suficientes para inducir el fenotipo de la enfermedad, 116,117 no se puede descartar un papel de la propia DMPK, ya que los pacientes con DM1 tienen DMPK reducida en el citoplasma, 118 y los ratones con pérdida de DMPK muestran un fenotipo DM leve. 119

Potencial terapéutico del empalme alternativo

Hay varias formas de utilizar el empalme alternativo en la clínica, pero algunos enfoques son más prometedores que otros. En un entorno de diagnóstico, los perfiles de empalme alternativos o la expresión de isoformas de empalme específicas pueden usarse como biomarcadores para diferentes enfermedades humanas. La proporción combinada de isoformas mayores y menores de solo 3 genes cardíacos fue suficiente para asignar correctamente las muestras al estado sano o de enfermedad (miocardiopatía isquémica, DCM y estenosis aórtica). 74 Otro ejemplo es el uso diagnóstico de EH-miomesina, una isoforma fetal reexpresada de miomesina, como marcador de la MCD humana. Curiosamente, EH-myomesin marca específicamente DCM, y no miocardiopatía hipertrófica o DCM con un dispositivo de asistencia ventricular izquierda. 120

Con respecto a la terapia, un enfoque prometedor es el uso de oligonucleótidos antisentido (AON) para redirigir el empalme. Este enfoque se ha probado en una variedad de enfermedades, incluida la distrofia muscular de Duchenne, la atrofia muscular espinal 121, la progeria Hutchinson-Gilford 122 y la DM. 124 AON se unen a sitios de empalme de manera complementaria, bloqueando así el acceso de las RBP a su objetivo. En la distrofia muscular de Duchenne, los AON se utilizan para inducir la omisión del exón del exón que contiene la mutación patogénica en el gen de la distrofina, restaurando en parte la funcionalidad de la proteína distrofina. Estos AON ya se han probado en ensayos clínicos y han proporcionado resultados alentadores. En estos ejemplos, los AON se han utilizado con pérdida de función, ya que bloquean los sitios de empalme (tanto potenciadores como silenciadores de empalme). A la inversa, los AON también se pueden usar en una forma de ganancia de función, donde se unen a sus objetivos y mimetizan el efecto de un RBP 125 o sirven como un sitio de unión para los RBP. 126 En este caso, el AON comprendía una secuencia complementaria a su objetivo y está acoplado a un dominio RS sintético o un sitio de corte y empalme sintético. Otro enfoque es el uso de trans-splicing, una forma de empalme común en eucariotas inferiores, donde se empalman 2 transcripciones diferentes. Trans-splicing se basa en la introducción de una transcripción sana exógena, que posteriormente se puede empalmar junto con el pre-mRNA mutado. En resumen, una transcripción de tipo salvaje con una secuencia complementaria a un intrón corriente arriba del exón mutado y un fuerte sitio de empalme en el extremo 3 'se une al pre-ARNm mutado, y el espliceosoma luego empalma el segmento sano de tipo silvestre en el ARNm mutado, reemplazando al exón mutado. Esta técnica se llama ARN mediado por espliceosomas. trans-splicing (SMaRT) y se ha utilizado con éxito in vitro e in vivo en la distrofia muscular de Duchenne, 127 y es útil para pacientes con mutaciones que no permiten la omisión de exón como una forma de restaurar una proteína distrofina funcional. Otros enfoques posibles incluyen la (re) introducción de factores de empalme en tejido enfermo, por ejemplo, con el uso de virus adenoasociados. Los candidatos potenciales para esta intervención podrían ser RBM20 en RBM20 portadores de mutaciones, y muscleblind en pacientes con DM. También podría considerarse el uso de ARNi (por ejemplo, ARNip) para eliminar isoformas de empalme perjudiciales, o la introducción de isoformas de empalme protectoras con virus adenoasociados en enfermedades. Finalmente, el uso de moléculas pequeñas para alterar la actividad de RBP proporciona un medio para modular el empalme alternativo, pero un inconveniente importante aquí es el gran riesgo de efectos fuera del objetivo. 128

Conclusiones y direcciones futuras

El campo emergente de la biología del ARN, especialmente el empalme de ARN, ha dado grandes pasos hacia adelante en la última década. Se sabe mucho más sobre la regulación del empalme, el código de empalme está comenzando a desenredarse y la identificación de factores de empalme cruciales y sus funciones, como RBM20 y SF3B1 en el corazón, ha llevado a nuevos conocimientos sobre los mecanismos de la enfermedad. Aún así, la subestimación del número de moduladores de empalme, mutaciones de empalme e isoformas de empalme indica que el empalme se ve afectado en muchas más enfermedades de las que se pensaba anteriormente, y esto podría significar que ciertas enfermedades deberían volver a examinarse para detectar anomalías de empalme. En estudios anteriores, los microarrays se utilizaron predominantemente para interrogar la expresión génica y las diferencias de isoformas de empalme. Sin embargo, esta técnica tiene serias limitaciones, ya que está restringida por el diseño de la matriz de sondas y, por lo tanto, nunca capturará todas las isoformas de ARNm conocidas o posibles. Además, como se basa en genes previamente anotados, no se han analizado nuevas clases de genes como los lncRNA. Por lo tanto, es probable que en estos estudios se subestime en gran medida el número de eventos de empalme alternativo observados. Hoy en día, la secuenciación de ARN es el método de elección para estudiar las diferencias en la expresión tanto de genes como de isoformas. La ventaja de la secuenciación de ARN es que captura todas las isoformas de ARNm que están presentes, pero el análisis aún se ve obstaculizado por la falta de métodos estandarizados y la anotación incompleta de transcriptomas.

La expresión de isoformas correctas podría resultar de la misma importancia para la forma y función cardíacas adecuadas que la cantidad total de una transcripción que se expresa. El análisis del papel de las isoformas fetales y la corrección hacia isoformas beneficiosas podrían, por lo tanto, ser de igual importancia para la función cardíaca adecuada que corregir los niveles de expresión génica. Además, es interesante ver que se están identificando proteínas con funciones biológicas no relacionadas para que también desempeñen un papel en el empalme. Por ejemplo, recientemente se identificó que el factor de transcripción Tbx3, conocido clásicamente por su papel transcripcional crítico en el desarrollo y el destino celular, tiene capacidad de unión al ARN y también para coordinar el empalme. 129 Por lo tanto, es probable que el número de prácticas comerciales restrictivas identificadas aumente en los próximos años. Otro desafío será desentrañar los perfiles de empalme de diferentes factores de empalme y el papel cooperativo que estos factores de empalme pueden desempeñar. Los avances recientes en técnicas para interrogar la interacción proteína-ARN, como la secuenciación de alto rendimiento de ARN aislado por inmunoprecipitación de reticulación (HITS-CLIP para identificar objetivos de ARN de RBP) y la inmunoprecipitación de reticulación mejorada con ribonucleósidos fotoactivables (PAR-CLIP para identificar sitios de unión) of RBPs), podría utilizarse para obtener una comprensión más completa de las redes objetivo de RBP. En este sentido, muchos factores de empalme tienen objetivos genéticos superpuestos. Por ejemplo, CamkIIδ y LDB3 pueden ser empalmados por RBM20 y ASF / SF2, y será interesante ver hasta qué punto el empalme se coordina como perfiles de empalme global o como eventos individuales. Además, el intrigante concepto de reguladores de empalme maestros (cardíacos), es decir, factores de empalme que regulan redes enteras de transcripciones, esenciales para la diferenciación, especificación o compromiso de un tipo de célula o tejido específico, probablemente llamará la atención en los próximos años. . 130 La observación de que las mutaciones en transLas RBP que actúan pueden causar una enfermedad que se restringe a un solo tejido o compartimento celular, incluso cuando la RBP se expresa de forma ubicua (p. ej., pérdida de SMN1 en la atrofia muscular espinal), defiende el concepto de reguladores de corte y empalme maestros.

Además, algunos aspectos del empalme merecen más atención de la que habían recibido anteriormente. Por ejemplo, queda por determinar un posible papel del espliceosoma menor conservado altamente evolutivo en la enfermedad, quizás como un medio para controlar la expresión de un conjunto específico de genes. La regulación al alza de la actividad de p38 MAPK en enfermedades cardíacas sugiere que el espliceosoma menor es más activo en el corazón estresado. 131 Por lo tanto, podría ser interesante investigar el empalme menor en el contexto de la proliferación de miocitos o la regeneración cardíaca.

En conclusión, aunque se ha avanzado en nuestra comprensión del empalme alternativo, está claro que este conocimiento aún es limitado. En el lado positivo, nuestro conocimiento ya ha llevado a opciones terapéuticas prometedoras. Aún así, la identificación del código de empalme cardíaco y todos los componentes requeridos del empalme alternativo será crucial para una comprensión integral de este proceso dinámico y versátil en el corazón.


Limitaciones y perspectivas actuales

El empalme se ha estudiado intensamente, pero es solo uno de los procesos que determinan la composición química del ARNm. Los roles de la edición de ARN y las modificaciones de ARN ahora se están enfocando como posibles fuentes adicionales de heterogeneidad. Las técnicas de creación de perfiles de transcriptomas son poderosas debido al exquisito detalle que brindan, y las imágenes permiten a los investigadores seguir las células a lo largo del tiempo. Los esfuerzos futuros para combinar estas ventajas con el fin de generar estudios longitudinales de transcripción y empalme son prometedores, pero se encuentran en las primeras etapas [122]. Mientras tanto, el problema de interpretar las consecuencias fenotípicas de la variabilidad sigue siendo un desafío considerable.


2.5 - Transcripción y traducción

Se hace una copia complementaria del ADN en el núcleo para formar el ARNm. Este proceso es catalizado por la enzima. Polimerasa de ARN. Para copiar el ARNm, la doble hélice de ADN se desenrolla mediante Helicasa de ADN, con los enlaces de hidrógeno rompiéndose entre los pares de bases a copiar. El ADN se abre en el sitio de transcripción o posición del gen que necesita copiarse.

La cadena de codificación, o la hebra de sentido, es la plantilla para el ARNm. Sin embargo, el ARNm en realidad se construye contra el hebra antisentido. Tiene el mismo patrón que la hebra opuesta debido al emparejamiento de base complementario.

Los nucleótidos libres se emparejan con los nucleótidos del ADN. La única diferencia es que uracilo reemplaza a la timina, uniéndose a la adenina. La ARN polimerasa forma los enlaces fosfodiéster para formar la columna vertebral de la molécula de ARNm. Luego, el ARNm se desprende y abandona el núcleo a través de los poros nucleares de la membrana. Entra en el citoplasma para leer en los ribosomas. La doble hélice del ADN se reforma.

2.5.3 & # 8211 Describe el código genético en términos de codones compuestos por tripletes de bases

Cada secuencia de tres bases codifica un aminoácido, llamado código triplete. Estos grupos de tres se llaman codones.

Por cada aminoácido, tiene dos o tres tripletes que los codifican. Otros trillizos actúan como "comienzo' o 'paradacodones, que definen dónde comenzar y terminar la secuencia polipeptídica.

También hay múltiples tripletes que codifican estos codones de "puntuación".

2.5.4 & # 8211 Explicar el proceso de traducción que conduce a la formación de polipéptidos

Los aminoácidos se activan al combinarse con ARNt (transferencia de ARN) en el citoplasma. Las moléculas de ARNt tienen la forma de una hoja de trébol. Cada molécula se une a un aminoácido específico. codón, el otro extremo se une al aminoácido. El otro extremo tiene un anticodón, cuales
es el codón complementario del ARNm. El tRNA se une al aminoácido, catalizado por una enzima. Este proceso utiliza ATP.

Una vez que se ha transcrito la molécula de ARNm, se envía al ribosoma en el citoplasma o retículo endoplásmico para traducción. La proteína se forma a partir de polipéptidos, que se acumulan en los ribosomas. Los ribosomas se mueven a lo largo del ARNm y "leen" el código, comenzando en el codón de inicio.

A partir de aquí, las moléculas de ARNt, con sus aminoácidos, encuentran su codón complementario en el ARNm. Los aminoácidos se unen a los ribosomas para formar el cadenas polipeptídicas. El tRNA luego se separa del aminoácido y el mRNA, y se envía de regreso al citoplasma para encontrar más aminoácidos. Este proceso continúa hasta que se alcanza un codón de parada, momento en el que se libera la cadena polipeptídica.

Para proporcionar suficientes aminoácidos libres para la traducción, heterótrofos consumirlos en la proteína de su dieta.

El primer codón de la molécula de ARNm es AUG, el codón de inicio, que se une al anti-codón [UAC] de la molécula de ARNt. Esta molécula de ARNt transporta los aminoácidos Metionina. La unión de codón a anti-codón es antiparalelo.

Los polipéptidos formados con pliegues en su forma para la proteína como resultado de diversas fuerzas intermoleculares.

El proceso continúa hasta que se forma el polipéptido completo.

2.5.5 & # 8211 Discutir la relación entre un gen y un polipéptido

La teoría es que un gen forma un polipéptido. Esto es cierto en la mayoría de los casos, sin embargo, hay algunas excepciones:


Transcripción en procariotas y eucariotas (con diagrama)

En los organismos procariotas, la transcripción se produce en tres fases conocidas como inicio, alargamiento y terminación.

El ARN es sintetizado por una única enzima ARN polimerasa que contiene múltiples subunidades polipeptídicas. En E. coli, la ARN polimerasa tiene cinco subunidades: dos α, una β, una β 'y una subunidad σ (α2ββ’σ). Esta forma se llama holoenzima. La subunidad σ puede disociarse de las otras subunidades para dejar una forma conocida como enzima central.

Estas dos formas de la ARN polimerasa tienen diferentes roles en la transcripción:

(i) Iniciación:

La transcripción no puede comenzar de forma aleatoria, sino que debe comenzar específicamente al comienzo de un gen. Las señales para el inicio de la transcripción se producen en la secuencia promotora que se encuentra directamente corriente arriba de la secuencia transcrita del gen. El promotor contiene secuencias de ADN específicas que actúan como puntos de unión para la ARN polimerasa.

En E. coli, están presentes dos elementos de secuencia reconocidos por la ARN polimerasa conocida como secuencia -10 y secuencia -35. Las secuencias exactas pueden variar entre los promotores, pero todas se ajustan a un patrón general conocido como secuencia consenso. La subunidad σ de la ARN polimerasa es responsable de reconocer y unirse al promotor, probablemente en la caja -35.

En ausencia de la subunidad σ, la enzima aún puede unirse al ADN, pero la unión es más aleatoria. Cuando la enzima se une al promotor, inicialmente forma un complejo de promotor cerrado en el que el ADN del promotor permanece como una doble hélice. La enzima cubre aproximadamente 60 pares de bases del promotor, incluidas las cajas -10 y -35. Para permitir que comience la transcripción, la doble hélice se disocia parcialmente en la caja & # 8211 10, que es rica en enlaces A-1 débiles para dar un complejo promotor abierto.

La subunidad σ luego se disocia del complejo promotor abierto dejando la enzima central. Al mismo tiempo, los dos primeros ribonucleótidos se unen al ADN, se forma el primer enlace fosfodiéster y se inicia la transcripción (fig. 7.7).

(ii) Alargamiento:

Durante el alargamiento, la ARN polimerasa se mueve a lo largo de la molécula de ADN derritiendo y desenrollando la doble hélice a medida que avanza. La enzima agrega ribonucleótidos al extremo 3 & # 8242 de la molécula de ARN en crecimiento con el orden de adición determinado por el orden de las bases en la hebra molde.

En la mayoría de los casos, se transcribe una secuencia líder de longitud variable antes de que se alcance la secuencia codificante del gen. De manera similar, al final de la secuencia codificante se transcribe una secuencia final no codificante antes de que finalice la transcripción.

Durante la transcripción, solo una pequeña parte de la doble hélice se desenrolla en un momento dado. El área desenrollada contiene el ARN recién sintetizado emparejado con la hebra de ADN molde y se extiende sobre 12-17 bases.

El área desenrollada debe permanecer pequeña porque el desenrollado en una región requiere un enrollamiento excesivo en las regiones adyacentes y esto impone tensión a la molécula de ADN. Para superar este problema, el ARN se libera del ADN molde a medida que se sintetiza, lo que permite que se vuelva a formar la doble hélice del ADN (Fig. 7.8).

(iii) Terminación:

La terminación de la transcripción se produce de forma no aleatoria y tiene lugar en puntos específicos después del final de la secuencia de codificación. En E. coli, la terminación ocurre en secuencias conocidas como palíndromos. Estos son simétricos alrededor de su centro, de modo que a la primera mitad de la secuencia le sigue su complemento exacto en la segunda mitad.

En las moléculas de ARN monocatenario, esta característica permite que la primera mitad de la secuencia se empareje con la segunda mitad para formar lo que se conoce como una estructura de tallo-bucle (figura 7.9). Estos parecen actuar como señales de terminación. En algunos casos, la secuencia de tallo-bucle va seguida de una serie de 5-10 As en el ADN que forman pares de bases A-U débiles con el ARN recién sintetizado.

Se cree que la ARN polimerasa se detiene justo después del vástago-bucle y que los pares de bases débiles A-U se rompen provocando que la transcripción se separe de la plantilla. En otros casos, la ejecución de As está ausente y se produce un mecanismo diferente basado en la unión de una proteína llamada Rho (ρ) que interrumpe el emparejamiento de bases entre la plantilla y la transcripción cuando la polimerasa se detiene después del tallo-bucle. La terminación de la transcripción implica la liberación de la transcripción y la enzima central que luego puede volver a asociarse con la subunidad σ y pasar a otra ronda de transcripción (Fig. 7.9 y 7.10).

En muchas bacterias, los genes de funciones relacionadas se agrupan en operones. Un operón actúa como una sola unidad de transcripción y, por lo tanto, produce ARNm policistrónico. En eucariotas, generalmente solo se producen ARNm monocistrónicos.

Figura 7.10. Presentación esquemática de la síntesis de ARN por la polimerasa de E. coli

Transcripción en eucariotas:

La transcripción ocurre en eucariotas de una manera similar a procariotas. Sin embargo, la iniciación es más compleja, la terminación no implica estructuras de tallo-bucle y la transcripción se lleva a cabo mediante tres enzimas (ARN polimerasas I, II y III), cada una de las cuales transcribe un conjunto específico de genes y funciona de una manera ligeramente diferente.

La ARN polimerasa I transcribe genes que codifican tres de los cuatro ARN ribosómicos (18S, 28S y 5.8S). La enzima ARN polimerasa II transcribe genes que codifican proteínas. La unión de la ARN polimerasa II a su promotor implica varios elementos de secuencia de ADN diferentes y una serie de proteínas llamadas factores de transcripción. La ARN polimerasa III transcribe un conjunto de genes cortos que codifican los ARN de transferencia y el ARN ribosómico 5S.

A diferencia de la situación en los genes procariotas, la transcripción en eucariotas ocurre dentro del núcleo y el ARNm sale del núcleo al citoplasma para su traducción. El inicio y la regulación de la transcripción es más extenso que los procariotas. Otra diferencia importante entre procariotas y eucariotas radica en el hecho de que el ARNm de los eucariotas se procesa a partir de la transcripción del ARN primario, un proceso llamado maduración.

Inicialmente, en el extremo 5 & # 8242 se agrega una tapa (que consta de 7-metil guanosina o 7 mG) y una cola de poli A en el extremo 3 & # 8242 (Fig. 7.11) La tapa es una molécula químicamente modificada de guanosina trifosfato ( GTP). El transcrito de ARNm eucariota primario es mucho más largo y está localizado en el núcleo, cuando también se denomina ARN nuclear heterogéneo (ARNh) o pre ARNm.

Los ARNm primarios eucariotas se componen de dos tipos de segmentos, intrones no codificantes y exones codificantes. Los intrones se eliminan mediante un proceso llamado empalme de ARN. De un par de ribonucleoproteína nuclear pequeña (SnRNPs pronunciada & # 8220snurps & # 8221), una se une al sitio de empalme 5 & # 8242 y la otra al sitio de empalme 3 & # 8242.

Se forma un espliceosoma debido a la interacción entre SnRNP y otras proteínas. Este espliceosoma utiliza energía de ATP para cortar el ARN, libera los intrones y une dos exones adyacentes para producir ARNm maduro. Además, estas dos modificaciones postranscripcionales, la edición de ARN también puede tener lugar antes de que comience la traducción.

Procesamiento posterior a la transcripción:

La transcripción primaria suele ser más grande que los ARN funcionales. Se llama heterogéneo o ARNh, especialmente en el caso de ARNm.

Se requiere el procesamiento posterior a la transcripción para convertir la transcripción primaria en ARN funcionales.

Los precursores de ARN más grandes se escinden para formar ARN más pequeños. La transcripción primaria de ARNr es 45S en eucariotas.

Se escinde para formar lo siguiente:

El transcrito primario es escindido por la ribonucleasa-P (una enzima de ARN) para formar 5-7 precursores de ARNt,

Las transcripciones eucariotas poseen segmentos adicionales (intrones o secuencias intermedias). Son eliminados por nucleasas. La ribozima (una enzima de ARN) es un intrón de autoajuste involucrado en algunas de estas reacciones, además de catalizar la polimerización.


76 Procesamiento de ARN en eucariotas

Al final de esta sección, podrá hacer lo siguiente:

  • Describir los diferentes pasos en el procesamiento de ARN.
  • Comprender la importancia de los exones, intrones y empalme de ARNm
  • Explicar cómo se procesan los ARNt y los ARNr

Después de la transcripción, los pre-mRNA eucariotas deben someterse a varios pasos de procesamiento antes de que puedan traducirse. Los ARNt y ARNr eucariotas (y procariotas) también se procesan antes de que puedan funcionar como componentes en la maquinaria de síntesis de proteínas.

Procesamiento de ARNm

El pre-ARNm eucariota se somete a un procesamiento extenso antes de que esté listo para ser traducido. Las secuencias codificantes de proteínas eucariotas no son continuas, como ocurre en los procariotas. Las secuencias codificantes (exones) son interrumpidas por intrones no codificantes, que deben eliminarse para producir un ARNm traducible. Los pasos adicionales involucrados en la maduración del ARNm eucariota también crean una molécula con una vida media mucho más larga que la de un ARNm procariota. Los ARNm eucariotas duran varias horas, mientras que los típicos E. coli El ARNm no dura más de cinco segundos.

Los pre-mRNA se recubren primero con proteínas estabilizadoras de RNA que protegen al pre-mRNA de la degradación mientras se procesa y exporta fuera del núcleo. Los tres pasos más importantes del procesamiento de pre-ARNm son la adición de factores estabilizadores y de señalización en los extremos 5 & # 8242 y 3 & # 8242 de la molécula, y la eliminación de los intrones ((Figura)). En casos raros, la transcripción de ARNm se puede "editar" después de que se transcribe.


Los tripanosomas son un grupo de protozoos que incluyen al patógeno Trypanosoma brucei, que causa nagana en el ganado y enfermedad del sueño en humanos en grandes áreas de África ((Figura)). El tripanosoma se transporta picando moscas del género Glossina (comúnmente llamadas moscas tsetsé). Los tripanosomas, y prácticamente todos los demás eucariotas, tienen orgánulos llamados mitocondrias que suministran energía química a la célula. Las mitocondrias son orgánulos que expresan su propio ADN y se cree que son los restos de una relación simbiótica entre un eucariota y un procariota envuelto. El ADN mitocondrial de los tripanosomas exhibe una interesante excepción al dogma central: sus pre-ARNm no tienen la información correcta para especificar una proteína funcional. Por lo general, esto se debe a que al ARNm le faltan varios nucleótidos U. La célula realiza un paso de procesamiento de ARN adicional llamado edición de ARN para remediar esto.


Otros genes del genoma mitocondrial codifican ARN guía de 40 a 80 nucleótidos. Una o más de estas moléculas interactúa mediante el apareamiento de bases complementarias con algunos de los nucleótidos en la transcripción de pre-ARNm. sin embargo, el guía de ARN tiene más nucleótidos A que el pre-ARNm tiene nucleótidos U con los que unirse. En estas regiones, el ARN guía forma un bucle. Los extremos 3 & # 8242 de los ARN guía tienen una cola poli-U larga, y estas bases U se insertan en regiones de la transcripción de pre-ARNm en las que se enlazan los ARN guía. Este proceso está completamente mediado por moléculas de ARN. Es decir, los ARN guía, en lugar de las proteínas, sirven como catalizadores en la edición del ARN.

La edición de ARN no es solo un fenómeno de los tripanosomas. En las mitocondrias de algunas plantas, casi todos los pre-ARNm se editan. La edición de ARN también se ha identificado en mamíferos como ratas, conejos e incluso humanos. ¿Cuál podría ser la razón evolutiva de este paso adicional en el procesamiento de pre-ARNm? Una posibilidad es que las mitocondrias, que son restos de antiguos procariotas, tengan un método igualmente antiguo basado en ARN para regular la expresión génica. En apoyo de esta hipótesis, las ediciones realizadas en los pre-ARNm difieren según las condiciones celulares. Aunque especulativo, el proceso de edición de ARN puede ser un vestigio de una época primordial cuando las moléculas de ARN, en lugar de las proteínas, eran responsables de catalizar las reacciones.

5 y # 8242 Taponado

Mientras que el pre-mRNA todavía se está sintetizando, se añade un casquete de 7-metilguanosina al extremo 5 & # 8242 del transcrito en crecimiento mediante un enlace fosfato. Este grupo funcional protege el ARNm naciente de la degradación. Además, los factores involucrados en la síntesis de proteínas reconocen el casquete para ayudar a iniciar la traducción de los ribosomas.

3 y # 8242 Cola Poly-A

Una vez que se completa el alargamiento, el pre-mRNA es escindido por una endonucleasa entre una secuencia consenso AAUAAA y una secuencia rica en GU, dejando la secuencia AAUAAA en el pre-mRNA. Una enzima llamada poli-A polimerasa luego agrega una cadena de aproximadamente 200 residuos A, llamada cola poli-A. Esta modificación protege además al pre-mRNA de la degradación y también es el sitio de unión para una proteína necesaria para exportar el mRNA procesado al citoplasma.

Empalme de pre-ARNm

Los genes eucariotas se componen de exones, que corresponden a secuencias codificantes de proteínas (ex-en significa que son expresionado), y En tsecuencias continuas llamadas intrones (En t-ron denota su En tpapel auxiliar), que pueden estar implicados en la regulación génica, pero se eliminan del pre-mRNA durante el procesamiento. Las secuencias de intrones en el ARNm no codifican proteínas funcionales.

El descubrimiento de intrones fue una sorpresa para los investigadores en la década de 1970 que esperaban que los pre-ARNm especificaran secuencias de proteínas sin procesamiento adicional, como habían observado en procariotas. Los genes de eucariotas superiores contienen muy a menudo uno o más intrones. Estas regiones pueden corresponder a secuencias reguladoras, sin embargo, no está clara la importancia biológica de tener muchos intrones o de tener intrones muy largos en un gen. Es posible que los intrones ralenticen la expresión génica porque se tarda más en transcribir pre-ARNm con muchos intrones. Alternativamente, los intrones pueden ser restos de secuencias no funcionales que quedan de la fusión de genes antiguos a lo largo del curso de la evolución. Esto está respaldado por el hecho de que los exones separados a menudo codifican subunidades o dominios de proteínas separados.En su mayor parte, las secuencias de intrones se pueden mutar sin afectar finalmente al producto proteico.

Todos los intrones de un pre-mRNA deben eliminarse de forma completa y precisa antes de la síntesis de proteínas. Si el proceso se equivoca incluso en un solo nucleótido, el marco de lectura de los exones reunidos cambiaría y la proteína resultante sería disfuncional. El proceso de eliminación de intrones y reconexión de exones se denomina empalme ((Figura)). Los intrones se eliminan y degradan mientras el pre-ARNm todavía está en el núcleo. El empalme se produce mediante un mecanismo específico de secuencia que garantiza que los intrones se eliminarán y los exones se volverán a unir con la exactitud y precisión de un solo nucleótido. Aunque el intrón en sí no es codificante, el principio y el final de cada intrón está marcado con nucleótidos específicos: GU en el extremo 5 & # 8242 y AG en el extremo 3 & # 8242 del intrón. El empalme de pre-ARNm se realiza mediante complejos de proteínas y moléculas de ARN llamados espliceosomas.


Los errores en el empalme están implicados en cánceres y otras enfermedades humanas. ¿Qué tipo de mutaciones pueden provocar errores de empalme? Piense en diferentes resultados posibles si se producen errores de empalme.

& lt! & # 8211 & ltlink window = & # 8221new & # 8221 target-id = & # 8221fig-ch15_04_02 & # 8243 document = & # 8221 & # 8221 / & gtMutaciones en la secuencia de reconocimiento del espliceosoma en cada extremo del intrón, o en las proteínas y Los ARN que forman el espliceosoma pueden afectar el empalme. Las mutaciones también pueden agregar nuevos sitios de reconocimiento de espliceosomas. Los errores de empalme pueden provocar la retención de intrones en el ARN empalmado, la escisión de exones o cambios en la ubicación del sitio de empalme. & # 8211 & gt

Tenga en cuenta que pueden estar presentes más de 70 intrones individuales, y cada uno debe someterse al proceso de empalme, además de la protección 5 & # 8242 y la adición de una cola poli-A, solo para generar una única molécula de ARNm traducible.

Vea cómo se eliminan los intrones durante el empalme de ARN en este sitio web.

Procesamiento de ARNt y ARNr

Los ARNt y los ARNr son moléculas estructurales que desempeñan funciones en la síntesis de proteínas; sin embargo, estos ARN no se traducen por sí mismos. Los pre-rRNA se transcriben, procesan y ensamblan en ribosomas en el nucleolo. Los pre-ARNt se transcriben y procesan en el núcleo y luego se liberan en el citoplasma, donde se unen a los aminoácidos libres para la síntesis de proteínas.

La mayoría de los tRNA y rRNA en eucariotas y procariotas se transcriben primero como una molécula precursora larga que abarca múltiples rRNA o tRNA. Luego, las enzimas dividen los precursores en subunidades correspondientes a cada ARN estructural. Algunas de las bases de los pre-rRNA son metilado es decir, un –CH3 se añade un grupo funcional metilo para mayor estabilidad. Las moléculas de pre-ARNt también se someten a metilación. Al igual que con los pre-ARNm, la escisión de subunidades se produce en los pre-ARN eucariotas destinados a convertirse en ARNt o ARNr.

Los ARNr maduros constituyen aproximadamente el 50 por ciento de cada ribosoma. Algunas de las moléculas de ARN de un ribosoma son puramente estructurales, mientras que otras tienen actividades catalíticas o de unión. Los ARNt maduros adquieren una estructura tridimensional a través de regiones locales de emparejamiento de bases estabilizadas por enlaces de hidrógeno intramoleculares. El tRNA se pliega para colocar el sitio de unión del aminoácido en un extremo y el anticodón en el otro extremo ((Figura)). El anticodón es una secuencia de tres nucleótidos en un ARNt que interactúa con un codón de ARNm a través del apareamiento de bases complementarias.


Resumen de la sección

Los pre-ARNm eucariotas se modifican con una tapa de metilguanosina 5 & # 8242 y una cola poli-A. Estas estructuras protegen el ARNm maduro de la degradación y ayudan a exportarlo desde el núcleo. Los pre-ARNm también se someten a un empalme, en el que se eliminan los intrones y los exones se vuelven a conectar con precisión de un solo nucleótido. Sólo los ARNm terminados que se han sometido a protección 5 & # 8242, poliadenilación 3 & # 8242 y corte y empalme de intrones se exportan desde el núcleo al citoplasma. Los pre-rRNA y pre-tRNA se pueden procesar mediante escisión intramolecular, empalme, metilación y conversión química de nucleótidos. En raras ocasiones, la edición de ARN también se realiza para insertar bases faltantes después de que se ha sintetizado un ARNm.

Preguntas de conexión visual

(Figura) Los errores en el empalme están implicados en cánceres y otras enfermedades humanas. ¿Qué tipo de mutaciones pueden provocar errores de empalme? Piense en diferentes resultados posibles si se producen errores de empalme.

(Figura) Las mutaciones en la secuencia de reconocimiento del espliceosoma en cada extremo del intrón, o en las proteínas y ARN que forman el espliceosoma, pueden afectar el empalme. Las mutaciones también pueden agregar nuevos sitios de reconocimiento de espliceosomas. Los errores de empalme pueden provocar la retención de intrones en el ARN empalmado, la escisión de exones o cambios en la ubicación del sitio de empalme.

Preguntas de revisión

¿Qué paso de procesamiento de pre-ARNm es importante para iniciar la traducción?

¿Qué paso de procesamiento mejora la estabilidad de los pre-tRNA y pre-rRNA?

Un científico identifica un pre-ARNm con la siguiente estructura.


¿Cuál es el tamaño previsto del ARNm maduro correspondiente en pares de bases (pb), excluyendo la tapa 5 'y la cola poli-A de 3'?

Preguntas de pensamiento crítico

Los pacientes con leucemia linfocítica crónica a menudo albergan mutaciones sin sentido en su maquinaria de espliceosoma. Describe cómo esta mutación del espliceosoma cambiaría la ubicación final y la secuencia de un pre-mRNA.

Las mutaciones de espliceosoma sin sentido eliminarían el paso de empalme del procesamiento del ARNm, por lo que los ARNm maduros retendrían sus intrones y serían perfectamente complementarios a toda la secuencia de la plantilla de ADN. Sin embargo, los ARNm aún sufrirían la adición de la tapa 5 'y la cola poli-A y, por lo tanto, cada uno tiene el potencial de ser exportado al citoplasma para su traducción.

Glosario


Ver el vídeo: splicing mechanism and its importance overview (Febrero 2023).