Información

¿Por qué se puede respaldar el modelo genético principal encontrando mutaciones de novo en los casos afectados?

¿Por qué se puede respaldar el modelo genético principal encontrando mutaciones de novo en los casos afectados?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Encontré una frase que no puedo entender completamente en una publicación sobre la genética del autismo.

El modelo de gen principal unificado está respaldado por el aumento significativo de mutaciones de novo dañinas que se encuentran en sujetos con TEA en comparación con sus hermanos no afectados.

¿Está diciendo que, según el modelo genético principal, las mutaciones de novo comprenden la mayor parte del riesgo genético?


Ayuda a dar contexto y una cita de la fuente en preguntas como esta. Con un poco de investigación, identifiqué la fuente de la cita como Torre-Ubieta, "Avanzando en la comprensión de los mecanismos de la enfermedad del autismo a través de la genética".

La cita proviene de una sección del artículo que analiza los dos modelos genéticos principales diferentes de TEA: (1) el modelo poligénico (muchos genes que contribuyen con pequeñas influencias) y (2) el modelo del gen principal, donde se produce una variación de un solo gen responsable. Las dos primeras oraciones del párrafo que tiene la cita son:

El modelo genético principal unificado62,63 está respaldado por el aumento significativo de daños de novo mutaciones encontradas en sujetos con TEA en comparación con sus hermanos no afectados44,49. Un mayor apoyo para este modelo se ve en el fenómeno de que hay más SNV heredados que alteran la función de las proteínas en los genes conservados transmitidos de la madre a los individuos con TEA que en los hermanos no afectados.73.

La oración en cuestión (la primera) simplemente cita evidencia que respalda el segundo tipo de modelo; no afirma que la mayor parte del riesgo se deba a de novo mutaciones. En cuanto a como de novo mutaciones apoyan el modelo genético principal, es útil consultar los artículos citados en la oración. La revisión de las citas 44 y 49 muestra que las personas con TEA a menudo tienen raras de novo mutaciones que parecen incapacitar los genes, mientras que sus hermanos no afectados no lo hacen. Esto sugiere que la desactivación de un solo gen puede provocar TEA y, por lo tanto, encaja con el modelo de gen principal, pero no hace nada por el modelo poligénico, ya que supone que la diferencia de un gen tiene solo un efecto pequeño.

Permítanme agregar que los dos modelos no son mutuamente excluyentes: un modelo poligénico podría explicar la ocurrencia familiar observada de TEA, mientras que una de novo El modelo genético principal podría explicar por qué solo unos pocos miembros de una familia se ven afectados.


Los protooncogenes son genes que normalmente ayudan a las células a crecer. Cuando un protooncogén muta (cambia) o hay demasiadas copias de él, se convierte en un gen "malo" que puede encenderse o activarse permanentemente cuando se supone que no debe serlo. Cuando esto sucede, la célula crece sin control, lo que puede provocar cáncer. Este gen malo se llama oncogén.

Puede resultar útil pensar en una celda como en un automóvil. Para que funcione correctamente, es necesario que haya formas de controlar qué tan rápido va. Un protooncogén normalmente funciona de una manera muy parecida a un pedal de acelerador. Ayuda a que la célula crezca y se divida. Un oncogén podría compararse con un acelerador atascado, lo que hace que la célula se divida sin control.

Algunos síndromes de cáncer son causados ​​por mutaciones heredadas de protooncogenes que hacen que el oncogén se encienda (active). Pero la mayoría de las mutaciones que causan cáncer que involucran a los oncogenes se adquieren, no se heredan. Por lo general, activan los oncogenes mediante:

  • Reordenamientos cromosómicos: cambios en los cromosomas que colocan un gen junto a otro, lo que permite que un gen active al otro.
  • Duplicación de genes: tener copias adicionales de un gen, lo que puede hacer que produzca demasiada proteína.

Los descubrimientos

El laboratorio de Kern ha definido la frecuencia y las posiciones de las deleciones de material cromosómico y ha descubierto cambios mutacionales muy frecuentes que afectan al gen DPC4, el gen p16 y el gen p53. Se sabe que las mutaciones del gen K-ras son comunes en el cáncer de páncreas. Los genes K-ras mutantes estaban presentes en las muestras de heces de pacientes con cáncer de páncreas o con las lesiones precursoras del cáncer. Se descubrió un vínculo genético con el cáncer de mama familiar. Su trabajo ha sugerido un modelo para la biología del cáncer de páncreas, que se muestra en las mutaciones y el ciclo celular a continuación.

Mutaciones y ciclo celular & # 9660

En esta figura, los cambios genéticos del cáncer de páncreas se muestran en un marco teórico, enfatizando la interrupción de los controles del ciclo celular. Las mutaciones de Ras proporcionan un estímulo inadecuado para que las células crezcan en una fase llamada G1. Los genes p16 y p53 actúan en múltiples posiciones de puntos de control para restringir la progresión inapropiada de G1. Las mutaciones de DPC4 probablemente también afecten a esta fase.

El alelotipo del cáncer de páncreas & # 9660

En esta figura, los cambios genéticos del cáncer de páncreas se muestran en un marco teórico, enfatizando la interrupción de los controles del ciclo celular. Las mutaciones de Ras proporcionan un estímulo inadecuado para que las células crezcan en una fase llamada G1. Los genes p16 y p53 actúan en múltiples posiciones de puntos de control para restringir la progresión inapropiada de G1. Las mutaciones de DPC4 probablemente también afecten a esta fase.

Perfiles de mutación de línea celular & # 9660

Mutaciones K-Ras & # 9660

¿Por qué son importantes las mutaciones de K-ras?

Las mutaciones del gen K-Ras ocurren en más del 90% de los carcinomas pancreáticos. Ningún otro tumor humano se acerca en frecuencia mutacional. La vía ras es importante en la transmisión de señales que promueven el crecimiento desde los receptores de la superficie celular, eventualmente hacia el núcleo donde estas señales afectan la producción y regulación de otras proteínas clave. Es interesante que, aunque se espera que la mayoría de las mutaciones en los genes provoquen su inactivación, con los genes Ras sucede lo contrario: se vuelven más activos en la señalización. Esto se debe al diseño de ingeniería de la proteína. La señal ras se apaga mediante un interruptor molecular, que depende de la actividad de una enzima. En términos pintorescos, el nucleótido GTP (trifosfato de guanidina) activa el interruptor para mantenerlo en el estado "encendido". Una porción de la proteína Ras tiene una actividad enzimática (una GTPasa) que escinde el GTP. Esto apaga el interruptor después del breve período de encendido. En realidad, las mutaciones de Ras inactivan una función, como se espera que hagan la mayoría de las mutaciones. La GTPasa es inactivada por mutaciones. Pero esto ahora significa que GTP continúa activando el interruptor y la función de señalización Ras no se puede "apagar". Varias compañías farmacéuticas están investigando formas de reducir la función de señalización de Ras, que podría proporcionar una terapia racional para el cáncer de páncreas.

¿Dónde ocurren?

Las mutaciones de Ras involucran solo ciertos aminoácidos, aquellos que interfieren con la función de GTPasa. En el cáncer de páncreas, las mutaciones se observan esencialmente solo en la duodécima posición (codón o aminoácido 12), con raras excepciones en el codón 13. La mayoría de las mutaciones en el cáncer de páncreas cambian una glicina en el codón 12 por una valina o aspartato. La mutación a serina es bastante inusual en el cáncer de páncreas, un hallazgo peculiar ya que es una mutación común en otros tipos de tumores que tienen mutaciones K-ras.

¿Cuándo ocurren?

Ahora se sabe que las mutaciones de K-ras ocurren mucho antes de la formación del cáncer real. Se forman en las etapas precancerosas, dentro de lesiones denominadas PIN o neoplasia intraepitelial pancreática. Estos son conductos con clones de células neoplásicas tempranas que aún no han invadido a través de la pared del conducto. En realidad, estas lesiones se encuentran entre las neoplasias más comunes de los seres humanos y ocurren en casi un tercio de las personas mayores. Desafortunadamente, a menudo se les llama "hiperplasias", término que implica la falta de carácter neoplásico. De hecho, una estimación aproximada sugiere que menos del 1% de las lesiones se vuelven invasivas, es decir, se convierten en cáncer. Por lo tanto, en muchos aspectos, son similares a los adenomas del colon, casi un tercio de las personas desarrollarán adenomas, pero solo una pequeña proporción progresará a cáncer de colon. Un esfuerzo importante del laboratorio de Kern es determinar cuál de los cambios genéticos en PIN marcan las lesiones con alto riesgo de invasión. Las mutaciones de K-ras son poco frecuentes en las formas tempranas de PIN, pero se encuentran en la mayoría de las lesiones avanzadas. El PIN que tiene mutaciones de K-ras probablemente se desarrollará en el 10% de las personas durante la vida. Por tanto, las mutaciones de K-ras todavía no son el marcador específico de lesiones de alto riesgo que les gustaría identificar con fines diagnósticos. Debería ser obvio que un objetivo principal es el diagnóstico de neoplasias pancreáticas en la fecha más temprana posible, preferiblemente en las lesiones PIN avanzadas y antes de la formación de un cáncer franco que invade a través de la pared del conducto y se disemina a otros órganos del paciente.

Estos estudios se realizan en colaboración con el Dr. Ralph Hruban y sus esfuerzos por estudiar las mutaciones de K-Ras.

Mutaciones de p53 & # 9660

¿Por qué son importantes las mutaciones de p53?

El gen p53 sufre deleciones en casi el 90% de los cánceres de páncreas. Casi el 60-70% tiene una mutación puntual que inactiva la copia restante del gen. Entre los diversos tipos de tumores humanos, las mutaciones de p53 son las más conocidas. Se cree que p53 es un controlador maestro de ciertas vías supresoras de tumores. Se une a secuencias específicas de ADN y dirige la producción de ARN de genes cercanos, un proceso llamado activación transcripcional. Debido a que todas las mutaciones de p53 que ocurren naturalmente afectan la capacidad de p53 para unirse al ADN, esta importante función supresora de tumores se pierde.

¿Alguna pista de por qué ocurren?

En comparación con otros tipos de tumores, existe una preferencia peculiar por que los carcinomas pancreáticos tengan deleciones intragénicas, y en particular microdeleciones de 1-2 pares de bases (17% frente, por ejemplo, menos del 1% en el cáncer de colon). Estas deleciones se produjeron con frecuencia en series repetidas de nucleótidos únicos o pares de nucleótidos. La causa no está clara, pero las posibilidades son intrigantes, ya que tales mutaciones son del tipo que se observa con la exposición a sustancias químicas inductoras de mutaciones. Como antecedentes, se ha sugerido que la exposición a mutágenos endógenos o ambientales particulares podría estar relacionada con espectros de mutación específicos en p53. Por ejemplo, las mutaciones asociadas a aflatoxinas en el carcinoma hepatocelular implican muy frecuentemente un sitio particular dentro del gen p53. También se ha observado que se favorecen diferentes mutaciones en carcinomas de piel colorrectales, pulmonares o inducidos por UV. El conocimiento de los agentes causantes o los mecanismos de alteración genética podría proporcionar pistas sobre los procesos involucrados en la causa de los cánceres de páncreas. Uno esperaría utilizar este conocimiento para ayudar a reducir la incidencia de la enfermedad entre la población.

P16 Mutaciones & # 9660

¿Por qué son importantes las mutaciones de p16?

Las mutaciones del gen p16 ocurren en el cáncer de páncreas a una tasa mayor que la reportada en cualquier otro tipo de tumor. Casi el 90% de los tumores pierden una copia (denominada pérdida de heterocigosidad o LOH) por deleción. En el 40% de los casos, la otra copia también se pierde (denominada deleción homocigótica o HD). En otro 40%, una pequeña mutación en el gen p16 inactiva su función. El resto de los tumores generalmente desactivan el gen p16 mediante un proceso llamado metilación que, estrictamente hablando, no es una forma de mutación. p16 es uno de los inhibidores de las enzimas (denominadas quinasas dependientes de ciclina o CDK) que impulsan la progresión de una célula a través del ciclo de división.

¿No hubo controversia?

Los informes iniciales de análisis mutacionales de p16 en tumores humanos fueron controvertidos y se sugirió que las mutaciones en el gen p16 podrían seleccionarse o inducirse mediante cultivo de tejidos. Esto lo convertiría en un artefacto no relacionado con la tumorigénesis humana. La primera evidencia convincente de que un tumor humano adquiere mutaciones a un ritmo elevado se obtuvo a través del cribado mutacional del carcinoma de páncreas. Las mutaciones y deleciones, realizadas en xenoinjertos de cáncer de páncreas, se confirmaron en todos los tumores primarios originales disponibles. Además, las comparaciones de xenoinjertos paralelos, donde se tomaron múltiples injertos de los mismos tumores primarios, mostraron resultados consistentes, excluyendo así cualquier artefacto in vitro. Las mutaciones del gen p16 se informaron de manera variable en el carcinoma de células escamosas de esófago y en la línea germinal de algunos pacientes con melanoma familiar, pero estuvieron en gran parte ausentes en una amplia variedad de otros tumores que exhiben una alta frecuencia de pérdida de 9p. En parte, resulta que p16 sostiene deleciones de ambas copias, y estos cambios se pasaron por alto inicialmente, ya que este tipo de mutación es difícil de ver cuando los genetistas examinan directamente los tumores humanos. Ahora se cree que las inactivaciones de p16 son casi tan comunes como las mutaciones de p53 en múltiples tipos de cáncer humano.

¿Puedo contraer cáncer de páncreas familiar por una mutación p16?

Existe un síndrome llamado mola / melanoma atípico familiar, que se debe a mutaciones p16 que se transmiten dentro de una familia de padres a hijos. El riesgo de cáncer de páncreas es mayor en estas familias. Pero hasta la fecha, todas las familias con cáncer de páncreas que reportaron tener una mutación p16 heredada también han tenido melanomas dentro de la familia. Consulte a su médico si cree que su familia podría tener este síndrome, ya que hay pruebas disponibles para identificar a los miembros de la familia que portan el gen p16 mutante. Saber quién está en riesgo puede permitirles tomar medidas preventivas e intentar identificar las lesiones cutáneas en una etapa temprana y curable.

¿Y la p15?

Hay al menos otro gen supresor de tumores candidato, p15, ubicado cerca de p16. Debido a que las deleciones homocigóticas que involucran a p16 con frecuencia se extienden a marcadores flanqueantes distantes, se sabe que p15 también está involucrada por esas deleciones homocigóticas de 9p en el carcinoma pancreático. Pero p15 no está mutado en el cáncer de páncreas y, por lo tanto, no hay evidencia directa de que p15 sea un gen supresor de tumores en este tipo de tumor.

Mutaciones DPC4 & # 9660

¿Por qué buscaste este gen?

Las deleciones casi ubicuas (denominadas pérdida de heterocigosidad o LOH) del cromosoma 18q sugirieron la inactivación de un gen supresor de tumores muy importante que reside allí, cuya identidad se desconocía en ese momento. El 18q es uno de los brazos cromosómicos que se eliminan con más frecuencia entre una variedad de tipos de cáncer humano. No se había informado que un gen candidato en 18q, el gen DCC, estuviera mutado en el cáncer de páncreas. Así, durante años, continuó la búsqueda del gen esquivo.

¿Cómo lo encontraste?

El laboratorio decidió escanear el área sospechosa con múltiples marcadores, con el fin de evaluar la integridad del cromosoma. En un área pequeña (alrededor del 1% de la longitud del cromosoma, en la región denominada 18q21.1), encontraron múltiples deleciones pequeñas de un tipo que antes se pensaba que era bastante raro. Se trataba de deleciones que afectaban a ambas copias normales del cromosoma, denominadas "deleciones homocigóticas", y se encontraron en el 30% de los cánceres. Se clonó un gen de esta región. Debido a que este fue el cuarto locus que se investigó para esta forma especial de deleción en el cáncer de páncreas, llamaron al gen DPC4 (para Deleted in Pancreatic Cancer, locus 4). En varios casos que no tenían estas deleciones homocigotas, se encontraron otras formas de mutaciones que inactivarían este gen. En total, el 50% de los cánceres de páncreas, así como una menor proporción de otros cánceres (como tumores de vejiga, mama, pulmón, vías biliares y colon), experimentan una inactivación total del gen DPC4 debido a mutaciones. Se sospecha que el gen actúa normalmente para prevenir la aparición de tumores del páncreas y otros órganos, y también es uno de los pocos genes supresores de tumores conocidos.

¿Qué hace DPC4?

Una pista fascinante de la función bioquímica de esta proteína fue sugerida por una búsqueda informática de bases de datos de ADN en Internet. DPC4 es muy similar a un gen de la mosca de la fruta, Drosophila malanogaster, que se necesita en el desarrollo temprano de la mosca. Las señales son parte de la superfamilia de vías de señalización TGF-ß. Cuando usamos una estrategia genética para eliminar el gen TGF-ß en una célula cancerosa, descubrimos que también habíamos inactivo la vía TGF-ß. Estas vías generalmente actúan para promover la diferenciación (maduración a formas adultas normales) y retardar el crecimiento de las células. También se encuentran proteínas similares en el gusano. C. elegans. Recientemente, hemos descubierto que DPC4 se une a una secuencia específica en el ADN, lo que permite que DPC4 active la expresión de ciertos genes.

¿Qué hace TGF-ß?

El TGF-ß tiene un papel en humanos similar al de otras especies, y la mayoría de las células normales dejan de proliferar cuando se exponen al TGF-ß. Uno de los hallazgos más notables sobre las células tumorales de cualquiera de varios sitios del cuerpo es que la mayoría de ellas no son suprimidas por el TGF-ß. Por lo tanto, se espera que el hallazgo de mutaciones en DPC4 nos ayude a comprender una de las anomalías más básicas de los cánceres, que es su incapacidad para responder a las señales normales del propio cuerpo que deberían controlar su crecimiento. Quizás al encontrar una manera de superar este bloqueo a las señales de TGF-ß, podamos restablecer un medio natural y poderoso para frenar la trágica agresividad del cáncer.

Mutaciones MKK4 & # 9660

¿Por qué son importantes las mutaciones MKK4?

La inactivación del gen MKK4 ocurre en el cáncer de páncreas a una tasa baja, en aproximadamente el 4% de los casos. Pero este es un tipo nuevo e inesperado de vía supresora de tumores, y puede tener mucho que enseñarnos. MKK4 es parte de un sistema de señalización que se estimula en presencia de estrés en la célula (incluida la quimioterapia) y puede controlar la diferenciación y la muerte celular programada, denominada apoptosis. Una vez que conocemos las funciones de los otros miembros de la vía, es posible que encontremos más mutaciones en otros genes.

Mutaciones del receptor TGF-ß y del receptor de activina & # 9660

¿Qué hace TGF-ß?

El TGF-ß es una proteína producida y liberada por las células, por lo que está presente en todos los tejidos e incluso en la sangre. La mayoría de las células normales dejan de proliferar cuando se exponen a niveles más altos de TGF-ß. Uno de los hallazgos más notables sobre las células tumorales de cualquiera de varios sitios del cuerpo es que la mayoría de ellas no son suprimidas por el TGF-ß. Cuando estudiamos los problemas del sistema TGF-ß en los cánceres, estamos tratando de comprender una de las anomalías más básicas de los cánceres, que es su incapacidad para responder a las señales normales del propio cuerpo que deberían controlar su crecimiento. Quizás al encontrar una manera de restaurar estas señales de TGF-ß, podamos restablecer un medio natural y poderoso para frenar la trágica agresividad del cáncer.

¿Por qué son importantes los receptores de TGF-ß?

Las células tienen receptores en su superficie que están hechos especialmente para enviar señales a través de la célula cuando la célula entra en contacto con ciertos tipos de moléculas.Los receptores de TGF-ß tienen esta función. Envían señales a través de ciertas vías en la célula. Una de las vías más importantes incluye la proteína Dpc4, que a menudo está mutada en el cáncer de páncreas. Las mutaciones o deleciones de los receptores de TGF-ß es, por tanto, otra forma en que las células cancerosas se vuelven resistentes a los controles de crecimiento normales que operan en el cuerpo. Hay dos tipos de receptor de TGF-ß, llamados receptor de tipo I y receptor de tipo II. Aproximadamente el 2% de los cánceres de páncreas tienen mutaciones de cada tipo de receptor. Fuimos los primeros en encontrar mutaciones del receptor de tipo II en el cáncer de páncreas y los primeros en encontrar la inactivación genética del receptor de tipo II en cualquier tipo de cáncer.

¿Qué pasa con la activina?

Hay otras proteínas similares al TGF-ß, y estas otras proteínas también necesitan su propio sistema receptor. Uno de estos se llama activina. No se sabe mucho sobre la activina en los cánceres, pero parece que suprime el crecimiento celular al igual que lo hace el TGF-ß. Sin embargo, la mayor parte de la atención se centró en TGF-ß. Decidimos echar un vistazo al sistema de activina y fuimos los primeros en encontrar mutaciones del receptor de activina tipo 1B en el cáncer humano. Aproximadamente el 2% de los cánceres de páncreas tienen inactivación genética del receptor de activina tipo 1B, que se esperaría que evite que la activina cumpla su función de controlar la cantidad de células cancerosas.

BRCA2 y # 9660

Este es un gen del cáncer de mama, ¿verdad?

Si y no. El laboratorio usó RDA para identificar una deleción homocigótica en un cáncer de páncreas, y esta deleción incluyó la ubicación del gen BRCA2 que se buscaba como causa de cáncer de mama familiar. Con la ayuda de la localización disponible de este cáncer de páncreas, otros investigadores encontraron el BRCA2. Luego, el laboratorio buscó mutaciones de BRCA2 y las encontró en casi el 7% de los cánceres de páncreas esporádicos. Parece que los cánceres de mama, de ovario y de páncreas pueden presentarse a tasas más altas en familias que heredan una mutación en el gen BRCA2. No obstante, algunas de estas familias tienen muy pocos casos de cáncer y, sin el beneficio de los estudios genéticos, el patrón de cáncer no parecerá obviamente familiar, sino que parecerá esporádico.

LKB1 / STK11 - El gen Peutz-Jeghers & # 9660

Esto se refiere a un síndrome que se da en familias, ¿verdad?

Sí, a principios de este siglo, un médico llamado Dr. Peutz describió a pacientes que tenían múltiples pólipos en el tracto intestinal. Más tarde, el Dr. Jeghers informó de casos adicionales, algunos de ellos estudiados aquí en Johns Hopkins. A fines de la década de 1980, el Dr. Giardiello de Hopkins informó que las personas con este síndrome tenían un alto riesgo de desarrollar cáncer de páncreas. En 1999, el Laboratorio Kern, el Dr. Hruban y colaboradores en los Países Bajos trabajaron juntos para encontrar la prueba de esta asociación. Se sabía que los pacientes con este síndrome tenían una copia mutante del gen LKB1 / STK11. El grupo de Hopkins descubrió que en uno de los cánceres de estos pacientes, se perdió la copia normal restante del gen. Luego también mostraron que alrededor del 5% de los cánceres de páncreas y biliares de pacientes sin este síndrome, también tenían mutaciones o deleciones de este gen. Por tanto, este gen actúa para prevenir la aparición del cáncer de páncreas, y cada año se producen alteraciones genéticas del gen en miles de cánceres de páncreas.

ADN telomérico y mitocondrial & # 9660

¿Los telómeros hacen qué?

Los telómeros son los extremos de los cromosomas. Son como tapas en un poste de cerca, estructuras especiales que evitan que los cromosomas se desmoronen cuando eso sucede, el cromosoma puede perder (eliminar) genes de la región, o el extremo roto puede unirse con otros cromosomas para formar una translocación. Hemos descubierto que prácticamente todas las formas tempranas de neoplasia pancreática, las precursoras del cáncer, tienen telómeros dramáticamente cortos. Creemos que esta es la razón subyacente de muchos de los cambios genéticos en los conductos pancreáticos, cambios que durante un período de décadas pueden conducir a la evolución de un cáncer. Sin la pérdida de tanto ADN telomérico, es posible que las personas nunca padezcan cáncer de páncreas.

¿Qué tienen que ver las mitocondrias con el cáncer?

La respuesta a esta pregunta puede resultar sorprendente. Las mitocondrias son las centrales energéticas de la célula, en las que se consume oxígeno para producir energía química para otras funciones celulares. Las mitocondrias no se encuentran en el núcleo celular donde reside la mayor parte del ADN celular, y las mitocondrias de hecho tienen su propio ADN separado. La gran mayoría de los cánceres de páncreas tienen mutaciones en el ADN mitocondrial. Pero estas mutaciones rara vez parecen tener un efecto sobre las funciones mitocondriales normales. Estas mutaciones pueden ser un acompañamiento bastante normal del envejecimiento. Todavía no sabemos si las mitocondrias tienen un papel especial en ayudar a producir cánceres. Pero debido a que las células de cáncer de páncreas tienen un aumento tan dramático en la cantidad de ADN mitocondrial en comparación con las células normales, en el futuro puede ser más fácil detectar el cáncer mediante la detección de mutaciones mitocondriales que mediante la detección de mutaciones en el ADN nuclear.

Varios cromosomas & # 9660

1p, 3p, 6p y amp q, 8p, 10q, 12q, 13q, 18p, 21q, 22q

Una hoja de ruta para futuros descubrimientos.

El alelotipo nos mostró una gran cantidad de sitios cromosómicos que se eliminan en el cáncer de páncreas. Se sabe que algunos de estos tienen genes mutantes. Por ejemplo, las deleciones de 17p (el brazo corto del cromosoma 17) ayudan a inactivar los genes p53 y MKK4 que residen allí. El gen p16 está en 9p, el gen DPC4 en 18q. Pero hay otros brazos cromosómicos que no se eliminan de manera tan universal, pero para los que se han visto pérdidas en el 40-60% de los cánceres de páncreas. Estos sitios se enumeran anteriormente y también se sospecha que albergan genes supresores de tumores. Debido a la gran cantidad de estos sitios, es probable que desempeñen un papel importante en la determinación del comportamiento agresivo del tumor. Algunos se describen con más detalle:

1p - Una región del brazo corto del cromosoma 1 se pierde en casi el 50% de los cánceres. El gen p18, que codifica un inhibidor de la quinasa dependiente de ciclina muy similar a p16, se encuentra en esta región de 1p, pero no está mutado en los cánceres, por lo que el gen supresor de tumores en 1p sigue siendo desconocido.

8p - Una región del brazo corto del cromosoma 8 se pierde en casi el 50% de los cánceres. En una región de este cromosoma, se conoce una línea celular que tiene deleciones de ambas copias, pero aún no está claro que exista un gen supresor de tumores allí.

18p - Las pérdidas de 18p probablemente se deben a la pérdida de una copia completa del cromosoma 18, incluidos los brazos corto (p) y largo (q). Dado que el laboratorio ha identificado un gen supresor de tumores importante (DPC4) en el brazo q, ven la pérdida del brazo p como una "mutación pasajera", llevada inocentemente por las pérdidas que inactivan uno o más genes en 18q. Ambas copias del gen DCC se eliminan en algunos cánceres de páncreas, pero el DCC es un gen tan grande que es difícil de estudiar.

22q - Un gen supresor de tumores denominado Schwannomin (SCH) se encuentra en el cromosoma 22q y está mutado en la neurofibromatosis tipo 2. No encontraron mutaciones de SCH en el cáncer de páncreas. Una vez más, es probable que otro gen supresor de tumores se encuentre en el cromosoma y esté esperando a ser descubierto.

Imagen FISH de cáncer de páncreas & # 9660

Hibridación in situ fluorescente (FISH) utilizando una pintura cromosómica para el cromosoma 13 (en verde) y una sonda cercana al gen BRCA2 (en rojo), aplicada a una propagación en metafase de la línea celular de cáncer de páncreas Colo357. Esta línea celular tiene una translocación cerca, pero no exactamente, del gen BRCA2. Si miras con atención, verás que el color verde se extiende a ambos lados de los puntos rojos, lo que indica que el gen BRCA2 está contenido por completo en una parte no perturbada del cromosoma 13. Las múltiples formas del cromosoma 13, incluidas las dos 'cara a cara' y los reordenamientos "de la cabeza a la cola" que producen una versión doble del cromosoma, así como algunas copias normales del cromosoma, ilustran bien los extraños reordenamientos cromosómicos que pueden observarse en el cáncer de páncreas. Tenga en cuenta también las ocho copias del cromosoma en lugar de las dos normales. Esta es una de las manifestaciones de la propiedad de las células cancerosas llamada 'aneuploidía', donde se altera el número y la estructura de los cromosomas.


Modelos tempranos de transmisión y heredabilidad de la enfermedad en el trastorno bipolar

En algunas familias, el trastorno bipolar se ha transmitido a lo largo de varias generaciones, y se asemeja mucho a un trastorno mendeliano (10, 11). Esta observación había inspirado originalmente a los investigadores a estudiar raros, grandes pedigríes multigeneracionales bajo el supuesto de un solo gen con gran tamaño de efecto y herencia autosómica dominante, recesiva o ligada al cromosoma X (12, 13). Después del entusiasmo inicial apoyado por fuertes señales de ligamiento genético, se descubrió rápidamente que estos resultados no podían replicarse (14). La penetrancia incompleta, la heterogeneidad etiológica y los eventos de recombinación podrían haber contribuido al fracaso de la replicación. Sin embargo, también era probable que los datos no respaldaran el modelo de enfermedad subyacente. Después de todo, no todos los estudios de segregación habían apoyado un modelo de enfermedad construido sobre un único locus de enfermedad principal (15 & # x0201318). La alta frecuencia en la población del trastorno bipolar también distingue claramente la enfermedad de los trastornos mendelianos raros. Como consecuencia, la idea de un único locus de riesgo mayor fue rápidamente rechazada (19, 20).


Genética del TEA

Identificación de genes de riesgo de TEA candidatos

Siguiendo la clasificación del autismo por Kanner, se llevaron a cabo esfuerzos de investigación para determinar la etiología de la enfermedad. Aunque inicialmente se asumió que era de origen ambiental, una mejor comprensión del papel de la genética en la salud humana pronto sugirió lo contrario. En 1977, Folstein y Rutter (1977) realizaron estudios de gemelos sobre la base de la observación de que la incidencia entre hermanos era 50 & # x00D7 más alta que el promedio. Descubrieron que los gemelos monocigóticos tenían más probabilidades de compartir un diagnóstico que los gemelos dicigóticos, lo que sugiere una influencia genética. Bailey y col. (1995) apoyaron este hallazgo, documentando una concordancia del 60% para gemelos monocigóticos versus pares dicigóticos sin concordancia. Además, se encontró que el riesgo de que un niño tenga TEA es proporcional al porcentaje del genoma que comparten con un hermano o padre afectado (Constantino et al., 2010 Risch et al., 2014 Sandin et al., 2014). Para el cambio de siglo, se estableció que los TEA tenían algún componente genético, aunque los genes involucrados seguían siendo un misterio.

Los primeros estudios de cariotipo que documentan anomalías cromosómicas empezaron a aclarar qué regiones del genoma estaban implicadas (Gillberg y Wahlstr & # x00F6m, 1985). Los loci de susceptibilidad adicionales criban regiones implicadas en los cromosomas 7q, 1p, 3q, 16p y 15q (IMGSAC, 1998 Barrett et al., 1999 Buxbaum et al., 2001 International Molecular Genetic Study of Autism Consortium [IMGSAC], 2001 Liu et al. , 2001 Auranen et al., 2002 Lamb et al., 2002 Shao et al., 2003 Risch et al., 2014). Sin embargo, para investigar con resolución a nivel genético, los primeros estudios tuvieron que utilizar el enfoque candidato. Los objetivos hipotéticos incluían genes de regiones cromosómicas sospechosas que desempeñaban un papel fundamental en el desarrollo neurológico, como homeobox (Hox) familia o Wnt genes. Como era de esperar, muchos de los primeros estudios que utilizaron este método no fueron en gran medida concluyentes (Krebs et al., 2002 Lamb et al., 2002 Talebizadeh et al., 2002 Zhang et al., 2002). A partir de 2001, el enfoque candidato experimentó un éxito moderado con hallazgos que respaldan reelin (RELN), homeobox relacionado con aristaless (Arx), proteína de unión a metil-CpG 2 (MeCP2), neuroligina 3 (NLGN3), neuroligina 4 (NLGN4), complejo de esclerosis tuberosa 2 (TSC2) y ubiquitina proteína ligasa E3A (UBE3A) & # x2019s participación en la etiología del TEA (Persico et al., 2001 Str & # x00F8mme et al., 2002 Carney et al., 2003 Jamain et al., 2003 Serajee et al., 2003 Jiang et al., 2004).

A principios de la década de 2000, el advenimiento de la secuenciación de alto rendimiento revolucionó la investigación genética y permitió a los investigadores estudiar los TEA a nivel de todo el genoma. La tecnología de secuenciación confirmó rápidamente que la etiología de los TEA era multigénica y muy heterogénea, con muy pocas de las mismas variantes patogénicas presentes en un porcentaje significativo de individuos afectados. Ahora se sabe que el caso promedio es producto de muchas variaciones que aumentan la susceptibilidad. Solo un puñado de enfermedades relacionadas con el TEA tienen causas monogénicas, como el síndrome de Rett, el síndrome de X frágil, la esclerosis tuberosa y el síndrome de Schuurs & # x2013Hoeijmakers (Artuso et al., 2011 Stern et al., 2017 Woodbury-Smith y Scherer, 2018) . Desde entonces, se han realizado docenas de estudios genéticos a gran escala en pacientes con TEA y sus familias, lo que ha llevado a la identificación de cientos de genes de riesgo. Si bien estas proteínas tienen diversas funciones, la mayoría de los impactos reproducibles provienen de dos amplias clases de proteínas: las involucradas en la formación de sinapsis y las involucradas en la regulación transcripcional y las vías de remodelación de la cromatina (De Rubeis et al., 2014).

Los genes de riesgo relacionados con la sinapsis incluyen aquellos que codifican proteínas de adhesión celular, como neuroliginas, neurexinas y cadherinas, proteínas de ciclo de vesículas sinápticas, sinapsina-1 (SYN1) y sinapsina-2 (SYN2), proteínas transportadoras de iones, como la subunidad alfa 2 del canal dependiente de voltaje del sodio. (SCN2A), subunidad alfa1 E del canal controlado por voltaje de calcio (CACNA1E), subunidad auxiliar beta 2 del canal controlado por voltaje de calcio (CACNB2), subfamilia Q del canal controlado por voltaje de potasio, miembros 3 y 5 (KCNQ3 y KCNQ5), subunidad controlada por voltaje de potasio miembro de la subfamilia D del canal 2 (KCND2), proteína de señalización del receptor de glutamato SH3 y dominios múltiples de repetición de anquirina 3 (SHANK3), proteína activadora de GTPasa Ras sináptica 1 (SYNGAP1) y subunidad gamma3 del receptor de ácido gamma-aminobutírico tipo A (GABRG3) (Jamain et al. al., 2003 Durand et al., 2012 Schmunk y Gargus, 2013 Gioved & # x00ED et al., 2014 Stessman et al., 2017). En vivo Los datos apoyan la implicación de la patología de la sinapsis y la formación anormal de redes neuronales en el TEA.

Los loci de susceptibilidad adicionales impactan la transcripción de otras proteínas a través de varios mecanismos. Por ejemplo, varios estudios han encontrado un aumento de novo carga de mutación en elementos reguladores de genes de riesgo de TEA en pacientes (Turner et al., 2016, 2017 Short et al., 2018). La amplia clase de genes de susceptibilidad que impactan las vías de transcripción y remodelación de la cromatina incluye MeCP2, UBE3A, proteína de unión a ADN de helicasa de cromodominio 8 (CHD8), homeobox neuroprotector dependiente de la actividad (ADNP), elemento transponible pogo derivado con dominio ZNF (POGZ), proteína de retraso mental X frágil (FMRP) y caja de horquilla de unión de ARN (RBFOX) genes (Carney et al., 2003, p. 2 Samaco et al., 2005 De Rubeis et al., 2014 Stessman et al., 2017 Tran et al., 2019). Estas variantes patógenas tienen el potencial de inducir efectos extremadamente generalizados. Por ejemplo, Tran et al. (2019) mostró recientemente que FMRP y proteína 1 relacionada con X frágil (FXRP1) Las mutaciones pueden resultar en una actividad enzimática de edición de ARN anormal, lo que da como resultado un sesgo global para la hipoedición de adenosina a inosina en los cerebros con TEA. Los diversos fenotipos que pueden resultar se analizan con más detalle en la sección de epigenética.

Mosaicismo somático y riesgo de TEA

Se pensaba convencionalmente que las variaciones que causaban enfermedades eran familiares / heredadas y estaban presentes en todas las células del cuerpo. Sin embargo, el papel del mosaicismo somático, que es el resultado de una mutación del ADN post-cigótico, se reconoce cada vez más como crucial para diversas enfermedades del neurodesarrollo, incluido el autismo (Poduri et al., 2013 Ronemus et al., 2014 D & # x2019Gama y Walsh , 2018). Durante la neurogénesis, cada progenitor da lugar a aproximadamente cinco variantes de un solo nucleótido (SNV) por día a medida que el cerebro se desarrolla rápidamente (Bae et al., 2018 D & # x2019Gama y Walsh, 2018). Los estudios estiman que de de novo variaciones patógenas, aproximadamente el 5 & # x20137% son poszigóticos, aunque se han informado estimaciones de hasta el 22% (Acuña-Hidalgo et al., 2015 Freed y Pevsner, 2016 Krupp et al., 2017 Lim et al., 2017). La mayoría de las mutaciones son inofensivas, pero las variaciones en los exones pueden ser extremadamente perjudiciales. Las variaciones somáticas patógenas se han relacionado con el TEA, el síndrome de Rett, la esclerosis tuberosa, la discapacidad intelectual, la esquizofrenia y muchos otros trastornos (Clayton-Smith et al., 2000 Bourdon et al., 2001 Qin et al., 2010 Gilissen et al., 2014 Acuña-Hidalgo et al., 2015 Tyburczy et al., 2015 Freed y Pevsner, 2016 Dou et al., 2017 Doyle et al., 2017 Krupp et al., 2017 D & # x2019Gama y Walsh, 2018).

Hasta hace poco, nuestra comprensión del mosaicismo somático en los TEA se limitaba principalmente a los informes de casos (Oliveira et al., 2003 Sauter et al., 2003 Papanikolaou et al., 2006 Havlovicova et al., 2007 Yurov et al., 2007 Castermans et al. ., 2008 Kakinuma et al., 2008 Vorstman et al., 2011). Varias investigaciones recientes de datos de secuenciación completa del exoma (WES) de grandes cohortes han sido fundamentales para dar forma a nuestra comprensión del papel del mosaicismo somático, que actualmente se estima que representa aproximadamente el 3 & # x20135% de los casos de TEA simplex (Freed y Pevsner, 2016 Krupp et al., 2017). Lim y col. (2017) utilizaron el análisis WES de 5.947 familias afectadas por TEA y determinaron que las variaciones somáticas en los individuos autistas tenían más probabilidades de estar en exones críticos que las variaciones en los hermanos de control. Curiosamente, encontraron que las variantes patogénicas habían mejorado la expresión en la amígdala, un área crítica para la respuesta emocional y la conciencia social (Rasia-Filho et al., 2000). En otro gran estudio de WES, los nuevos genes de riesgo identificados se enriquecieron en el cerebelo, lo que sugiere una posible dificultad de coordinación que podría estar relacionada con los trastornos de la marcha comunes en los niños autistas (Dou et al., 2017). Freed y Pevsner (2016) analizaron 2.388 familias e identificaron un sesgo de verificación de variaciones del mosaico patógeno en los individuos con TEA en relación con los hermanos no afectados. Estos estudios de secuenciación a gran escala de mutaciones post-cigóticas han confirmado genes candidatos previamente implicados, como SCN2A, además de revelar docenas de nuevos genes de riesgo y establecer el mosaicismo somático como un factor significativo en la etiología de los TEA (Lim et al., 2017).

Las CNV contribuyen a la susceptibilidad al TEA

Las variaciones del número de copias (CNV) son variantes estructurales submicroscópicas en los cromosomas que incluyen duplicaciones, deleciones, translocaciones e inversiones, que a veces se extienden varias kilobases (Marshall et al., 2008). La NVC puede heredarse o surgir de novo (Thapar y Cooper, 2013).Muchos genes pueden verse afectados por estos cambios, pero no todos son necesariamente causantes de enfermedades. Los estudios han encontrado una mayor carga de NVC génicas raras en individuos autistas, lo que implica estas variantes en la patología del TEA (Sebat et al., 2007 Pinto et al., 2010 Pizzo et al., 2019). La NVC ahora se entiende como un factor contribuyente extremadamente importante en la susceptibilidad a los TEA, y las estimaciones actuales postulan que estas variaciones causan directamente aproximadamente el 10% de los casos de TEA (Geschwind, 2011).

Se han realizado estudios sobre cómo las CNV individuales contribuyen a los TEA para las variantes estructurales más frecuentes, como las duplicaciones de 16p11.2. La mayoría de los 25 genes de esta región son muy activos durante el desarrollo del sistema nervioso y son fundamentales para una formación adecuada (Blaker-Lee et al., 2012). Si bien la alteración de muchos genes involucrados en el desarrollo sugiere un mecanismo para los diversos síntomas observados en el TEA, Golzio et al. (2012) informaron que solo un gen en la región 16p11.2, el dominio de tetramerización del canal de potasio que contiene 13 (KCTD13), parece ser el principal impulsor de la enfermedad neuropsiquiátrica. Se cree que las duplicaciones o deleciones de este gen afectan la transmisión sináptica a través de la regulación alterada del miembro de la familia A (homólogo de Ras) (RHOA) (Escamilla et al., 2017). Sin embargo, Escamilla et al. (2017) también planteó la hipótesis de que KCTD13 es poco probable que las deleciones por sí solas sean suficientes para la enfermedad. Los modelos de ratón sugieren otro gen en la región 16p11.2 como impulsor de la enfermedad & # x2013 proteína quinasa 3 activada por mitógenos (MAP3) & # x2013 con deleciones que dan como resultado una citoarquitectura cortical alterada y un tamaño cerebral reducido (Pucilowska et al., 2015). Probablemente, el verdadero impulsor de la enfermedad en las duplicaciones o deleciones de 16p11.2 no proviene de un solo gen, sino de una interacción de los 25 que contribuyen a la susceptibilidad. Iyer y col. (2018) investigaron sistemáticamente la interacción entre genes en la región 16p11.2, utilizando RNAi en Drosophila para probar 565 caídas por pares. Además de 24 interacciones modificadoras descubiertas entre pares de genes dentro de la región 16p11.2, también encontraron 46 interacciones entre genes 16p11.2 y otros involucrados en el neurodesarrollo (Iyer et al., 2018). Esto sugiere fuertemente que la modificación de las interacciones dentro de las CNV dan como resultado los fenotipos complejos observados y puede que no se aclare a partir de estudios con genes únicos, un fenómeno que probablemente sea cierto para otras regiones de CNV además de 16p11.2.

Los mecanismos de enfermedad de otras NVC se estudian con menos frecuencia debido a la escasez de regiones comúnmente afectadas. Incluso las NVC asociadas a TEA más prevalentes, como 15q11-13 y 16p11.2, solo están presentes en aproximadamente el 1% de los casos de autismo (Kumar et al., 2008 Marshall et al., 2008 Weiss et al., 2008 Marshall y Scherer, 2012). Además, no se conocen CNV con estudios completos de penetrancia que encuentren CNV con una correlación significativa con el TEA que a menudo detecten a portadores no TEA, o hermanos TEA sin la variante (Marshall et al., 2008). Un enfoque útil en medio de esta heterogeneidad es evaluar las redes funcionales comunes afectadas. En repetidas ocasiones, los estudios han demostrado que los individuos autistas tienen deleciones en genes sinápticos, como SHANK3, similar a la dipeptidil peptidasa 10 (DPP10), neuroliginas y neurexinas (The Autism Genome Project Consortium et al., 2007 Marshall et al., 2008 Glessner et al., 2009 Pinto et al., 2010, 2014 Marshall y Scherer, 2012). Otros conjuntos de genes funcionales comunes con NVC raras incluyen los involucrados en la proliferación y el desarrollo celular, la regulación de la cromatina y las vías de la ubiquitina (Glessner et al., 2009 Pinto et al., 2010, 2014).

Con ciertas NVC, la dosis del número de copias parece afectar el fenotipo de la enfermedad. Por ejemplo, Horev et al. (2011) observaron un efecto dependiente de la dosis y un cambio en la estructura del cerebro en ratones con deleciones y duplicaciones de 16p11.2, pero este efecto no es el establecido en humanos (Kumar et al., 2008). Otro estudio que investiga CNV en el locus que contiene el UBE3A El gen también informa una correlación positiva entre la duplicación y los rasgos autistas en ratones, así como una disminución de la transmisión sináptica glutamatérgica (Smith et al., 2011). En humanos, Stefansson et al. (2014) analizaron una región de CNV 15q11.2 de individuos autistas y encontraron dos áreas del cerebro con efectos estructurales y funcionales dependientes de la dosis. Curiosamente, algunos controles sin TEA / esquizofrénicos que fueron diagnosticados con dislexia y disstaxia también exhibieron los mismos cambios estructurales (Stefansson et al., 2014). En otro estudio con humanos, Girirajan et al. (2013) informaron un efecto dependiente de la dosis a partir de su análisis de microarrays con CNV identificadas en genes asociados con TEA, encontrando una correlación positiva entre el aumento del tamaño de la duplicación y el aumento de la gravedad del autismo, pero sin correlación entre el tamaño de la duplicación y el coeficiente intelectual no verbal. Las NVC suelen contribuir de forma crítica y compleja al riesgo de TEA, pero los pacientes con variantes estructurales similares pueden tener fenotipos muy variables. Las siguientes secciones discutirán cómo los modificadores no causales juegan un papel importante en la modulación de la patogenicidad de la NVC.

Regulación epigenética y TEA

Los genes con funciones moduladoras epigenéticas están muy involucrados en la susceptibilidad al TEA. Una revisión reciente de 215 genes candidatos estimó que el 19,5% son reguladores epigenéticos, lo que sugiere el potencial de diversos fenotipos de enfermedades a partir de unas pocas variantes patógenas (Duffney et al., 2018). Otro estudio sugirió que los genes de riesgo con alta penetrancia se ubicaban típicamente en el núcleo e involucrados en la modulación de la expresión, o vinculados a la red de interacción proteína-proteína esencial para guiar el patrón de desarrollo del SNC (Casanova et al., 2016). Los estudios de gemelos demuestran en particular las profundas formas en que la epigenética puede modular el fenotipo de la enfermedad, por ejemplo, un estudio de 50 pares de gemelos monocigóticos discordantes para el TEA informó sobre numerosas regiones metiladas diferencialmente asociadas al autismo, con patrones de metilación en algunos sitios de CpG comunes a los grupos de síntomas (Wong et al. ., 2014).

Aunque la comunidad científica y médica todavía tiene mucho que aprender sobre la modulación epigenética de los TEA, han surgido patrones de estudios epigenómicos a gran escala. Los loci de susceptibilidad a menudo incluyen genes implicados en la metilación, como KMT2C, lisina metiltransferasa 5B (KMT5B) y lisina desmetilasa 6B (KDM6B) proteínas remodeladoras de cromatina, incluidas MeCP2, CHD8 y proteínas de unión / empalme de ARN POGZ, como FMRP y la familia RBFOX, proteínas de modificación postraduccional como UBE3A, proteína ligasa 1 de ubiquitina E3 de bomba mental (MIB1) o factores de transcripción como ADNP y sexo adicional peines como 3 (ASXL3) (De Rubeis et al., 2014). Los objetivos de estas proteínas pueden variar de unos pocos a cientos, y a menudo incluyen vías previamente implicadas en el autismo, como la formación sináptica. Para demostrar cómo las mutaciones en un solo regulador epigenético pueden modificar muchos otros genes de riesgo, analizaremos más en profundidad dos genes de susceptibilidad clave: MeCP2 y UBE3A.

MeCP2 es un modificador de cromatina que está implicado de forma constante en el TEA. En un individuo sano, se ha demostrado que la acción de unión de MeCP2 regula muchos genes con función sináptica, como GABRB3, factor neurotrófico derivado del cerebro (BDNF), homeobox 5 sin distal (DLX5), proteína de unión al factor de crecimiento similar a la insulina 3 (IGFBP3), quinasa dependiente de ciclina como 1 (CDKL1), protocadherina beta 1 (PCDHB1), protocadherina 7 (PCDH7) y el homólogo A de lin-7 (LIN7A) (Samaco et al., 2005 Kubota y Mochizuki, 2016). También cumple funciones postraduccionales (Cheng y Qiu, 2014). Además, MeCP2 es el factor limitante de la velocidad en la regulación de la formación de sinapsis glutamatérgica durante el desarrollo, lo que implica su participación en otro aspecto importante de la patología del TEA (Chao et al., 2007). Se ha demostrado que la MeCP2 se reduce en la corteza frontal de los individuos con TEA debido al aumento de la metilación de su promotor (Samaco et al., 2005 Nagarajan et al., 2006, 2008).

UBE3A, una proteína ligasa de ubiquitina E3, es un segundo regulador epigenético importante fuertemente implicado en la patología del TEA. Está modulado por MeCP2, pero puede ser causal por sí solo (Samaco et al., 2005, p. 2). UBE3A se encuentra en la región cromosómica 15q11-13, que comúnmente se duplica en el autismo. Los efectos dependientes de la dosis se han correlacionado positivamente con la reducción de la transmisión sináptica excitadora, el retraso de la primera palabra y la regresión psicomotora (Guffanti et al., 2011 Smith et al., 2011 Xu et al., 2018). El mecanismo de la actividad patológica de UBE3A & # x2019s puede plantearse como hipótesis basándose en su función como ubiquitina ligasa, que se dirige a las proteínas para su degradación, pero la investigación aún está revelando exactamente cómo se producen estas alteraciones dependientes de la dosis. Lee y col. (2014) identificaron cuatro proteínas relacionadas con el proteosoma que eran sustratos directos de UBE3A. Sobreexpresión de UBE3A y uno de sus sustratos, la subunidad del proteasoma 26S, no ATPasa 4 (Rpn10), condujo a una mayor acumulación de proteínas ubiquitinadas, lo que sugiere un desequilibrio proteostático. La salud del proteosoma ha estado fuertemente implicada en el crecimiento de la columna dendrítica, vinculando UBE3A con una de las patologías clave observadas en el autismo (Hamilton et al., 2012 Puram et al., 2013). Su participación en la señalización de Wnt también podría causar una perturbación significativa durante el desarrollo (Yi et al., 2017). MeCP2 y UBE3A son solo dos ejemplos de cómo un gen alterado puede tener efectos de gran alcance.

Los estudios epigenéticos a gran escala también han ayudado a lograr una imagen más amplia de la mala regulación epigenética en los TEA. Sun y col. (2016) realizaron un estudio de asociación de histonas en todo el acetiloma en 257 muestras de corteza prefrontal y temporal post-mortem. Sorprendentemente, encontraron que & # x003E68% de los casos sindrómicos e idiopáticos compartían una firma de acetiloma común en aproximadamente 5,000 regiones potenciadoras (Sun et al., 2016). Curiosamente, un modelo de ratón SHANK3 de autismo mostró fenotipos de comportamiento rescatados cuando se trató con un potente inhibidor de histona desacetilasa, lo que refuerza el papel de la epigenética en el TEA (Qin et al., 2018). Ladd-Acosta y colaboradores midieron más de 485.000 loci CpG en tejido cerebral post-mortem de 40 individuos e identificaron cuatro regiones metiladas diferencialmente. Se encontraron tres sitios en el tejido cortical: la proteína transmembrana rica en prolina 1 (PRRT1) 3 & # x2019 UTR, regiones promotoras de tetraspanina 32 (TSPAN32), y C11orf21. El último sitio, un promotor alternativo para el pseudogén 3 de la subunidad A de flavoproteína del complejo succinato deshidrogenasa (SDHAP3), se encontró en tejido cerebeloso (Ladd-Acosta et al., 2014). Las vías afectadas implicadas en estos estudios y otros incluyen la transmisión sináptica, la función inmune, el transporte de iones y los genes GABAérgicos (Nardone y Elliott, 2016 Sun et al., 2016 Andrews et al., 2017 Zhubi et al., 2017).

Mor y col. (2015) adoptó un enfoque diferente, utilizando pequeños datos de secuenciación de ARN y correlacionando los resultados con los datos de metilación del ADN de todo el genoma para encontrar miARN desregulados. Los miARN que se expresaron significativamente en el cerebro con TEA se vincularon a la función sináptica, de acuerdo con los datos de muchos otros estudios. También descubrieron un vínculo con el receptor de oxitocina (OXTR) gen, sugiriendo atenuado OXTR expresión en el cerebro autista. Este hallazgo fue respaldado por un estudio que encontró que las membranas fetales del parto prematuro se habían hipermetilado OXTR, potencialmente vinculando un factor de riesgo ambiental a un mecanismo patológico (Behnia et al., 2015). Otro gen de riesgo con funciones epigenéticas es el homeobox 2 grabado (EN2), un gen homeobox con un patrón de metilación inusual en el TEA que se ha hipotetizado que causa un crecimiento cerebeloso anormal de Purkinje (James et al., 2013). La lista de genes de riesgo de TEA con funciones epigenéticas es amplia, lo que sugiere un mecanismo por el cual pocas mutaciones pueden resultar en una mala regulación generalizada de la expresión génica. Debido a esto, los genes con funciones epigenéticas y sus sustratos pueden ser objetivos prometedores de las terapias. Por ejemplo, mutaciones en FMRP, un remodelador de cromatina, da como resultado anomalías generalizadas en la expresión génica, pero un estudio reciente encontró que la inhibición del bromodominio diana de FMRP que contiene 4 (BRD4) alivió muchas de las características de la enfermedad (Korb et al., 2017). Las proteínas con función de regulación epigenética también pueden ser objetivos clave de los modificadores de enfermedades, un concepto que se discutirá más adelante en esta revisión.

Los genes de riesgo de TEA se superponen con otras enfermedades

Los estudios de secuenciación a gran escala de las principales enfermedades psiquiátricas han revelado una gran superposición en los loci de riesgo, lo que desafía la clasificación de estas afecciones como trastornos distintivos. En 2013, el Cross-Disorder Group del Psychiatric Genomics Consortium (PGC) realizó un estudio masivo con 33,332 casos y 27,888 controles con el fin de identificar variantes patogénicas compartidas entre TEA, esquizofrenia, trastorno bipolar, TDAH y trastorno depresivo mayor (Cross- Grupo de Trastornos del Consorcio de Genómica Psiquiátrica, 2013 Grupo de Trastornos Cruzados del Consorcio de Genómica Psiquiátrica et al., 2013). Además de establecer diversos grados de cruce por pares, encontraron loci que alcanzaron importancia en todo el genoma para los cinco trastornos cerca de los siguientes genes: inhibidor de inter-alfa-tripsina cadena pesada 3 (ITIH3), arsenito metiltransferasa (AS3MT), subunidad alfa1 C del canal dependiente de voltaje de calcio (CACNA1C), y CACNB2. Glessner y col. (2017) también han realizado un metanálisis a gran escala de variantes estructurales en las mismas enfermedades y variantes estructurales correlacionadas en los loci del dedicador de citocinesis 8 (DOCK8) y motivo KN y dominios de repetición anquirina 1 (KANK1) con las cinco condiciones. Schork y col. (2019) planteó recientemente la hipótesis de que la regulación genética anormal en la glía radial y las interneuronas durante la mitad de la gestación es un mecanismo de riesgo compartido, después de usar GWAS para identificar loci de susceptibilidad en genes que incluyen la fosfodiesterasa 1A (PDE1A), subunidad 1C del inhibidor regulador de la proteína fosfatasa 1 (PPP1R1C), RHOA, miembro 11 de la superfamilia de inmunoglobulinas (IGSF11), y el dominio VPS10 relacionado con sortilina que contiene el receptor 3 (SORC3).

Los estudios también informan genes de susceptibilidad compartidos en un conjunto más restringido de enfermedades psiquiátricas. Por ejemplo, se ha encontrado que el TEA, la discapacidad intelectual (DI) y la esquizofrenia comparten loci de riesgo en los objetivos de FMRP, CHD5, CHD8, SCN2Ay neurexina 1 (NRXN1) (Iossifov et al., 2014 Wang et al., 2019). Wang y col. (2019) también encontraron puntos en común entre TEA, DI y trastorno bipolar con una mayor incidencia de de novo variantes patogénicas en el regulador circadiano periódico 1 (PER1) y lisina metiltransferasa 2C (KMT2C). Khanzada y col. (2017) encontraron 23 genes de susceptibilidad comunes al TEA, el trastorno bipolar y la esquizofrenia, incluido el receptor de dopamina D2 (DRD2), subunidad alfa 7 nicotínica del receptor colinérgico (CHRNA7), Receptor 2A de 5-hidroxitriptamina (HTR2A), miembro de la familia 6 de portadores de solutos 3 (SLC6A3) y triptófano hidroxilasa 2 (TPH2). Los genes hit estaban involucrados principalmente en la homeostasis de la dopamina y la serotonina, lo que sugiere un mecanismo potencial de regulación emocional anormal observado en los tres trastornos (Khanzada et al., 2017). El inmenso cruce revelado en estos estudios sugiere de manera intrigante algún nivel de etiología compartida entre las condiciones psiquiátricas, a pesar de tener presentaciones clínicamente distintas.

De las otras cuatro enfermedades evaluadas en el estudio PGC, la enfermedad más altamente correlacionada con el TEA fue la esquizofrenia (Cross-Disorder Group of the Psychiatric Genomics Consortium et al., 2013). Estudios epidemiológicos previos habían sugerido su vínculo, informando un mayor riesgo de TEA en niños con padres esquizofrénicos y una comorbilidad significativa de esquizofrenia y autismo de inicio en el niño (Rapoport et al., 2009 Sullivan et al., 2012). Un informe de seguimiento del estudio PGC de 2013 estimó que la correlación genética entre las dos enfermedades era del 23%, con loci de riesgo compartido que incluyen varios genes involucrados en el neurodesarrollo, como el cuadro forkhead P1 (FOXP1), exostosina glicosiltransferasa 1 (EXT1), astrotactina 2 (ASTN2), mono-ADP ribosilasa 2 (MACROD2) e histona desacetilasa 4 (HDAC4) (Grupo de trabajo sobre trastornos del espectro autista del Consorcio de Genómica Psiquiátrica, 2017). Además de los genes de susceptibilidad implicados en el neurodesarrollo, otros estudios también han informado de una susceptibilidad compartida en genes que afectan la remodelación de la cromatina, la respuesta al estrés oxidativo y el metabolismo de los lípidos (McCarthy et al., 2014 Lim et al., 2017).

Muchos estudios también han encontrado una correlación significativa entre los rasgos de puntuación autista y TDAH. Esto incluye un estudio de síntomas autistas en probandos y hermanos con TDAH, correlación de rasgos autistas en una muestra de gemelos con TDAH y una asociación entre rasgos autistas y TDAH en la población general (Reiersen et al., 2007 Ronald et al., 2008 Mulligan et al. ., 2009 Stergiakouli et al., 2017). Nijmeijer y col. (2010) identificaron cinco loci genéticos específicos que se asociaron con rasgos de TEA en niños con TDAH: 7q36, 16p13, 18p11, 15q24 y 12q24. Un estudio que investiga la superposición de variantes estructurales patológicas en el TDAH y el TEA encontró una superposición significativa en genes relacionados con una amplia variedad de procesos, incluida la vía de señalización del receptor nicotínico y la división celular (Martin et al., 2014). La heredabilidad compartida de los TEA y el TDAH todavía se está explorando y se analiza con más detalle en una revisión de Rommelse et al. (2010).

Dado que el TEA es una enfermedad multigénica y muy heterogénea que a menudo coexiste con otras afecciones, puede ser difícil distinguir qué genes realmente tienen un riesgo superpuesto de múltiples afecciones psiquiátricas y qué variaciones son responsables de los fenotipos de enfermedades comunes. Por ejemplo, el gen de la ubiquitina ligasa UBE3A está implicado tanto en el autismo como en el síndrome de Angelman, una afección distinta del TEA pero con síntomas similares, como defectos del movimiento y del habla. Curiosamente, el síndrome de Angelman generalmente se asocia con UBE3A deleciones, mientras que el TEA puede ser causado por duplicaciones & # x2013 pero el mismo individuo puede ser diagnosticado con ambos síndromes (Peters et al., 2004 Williams et al., 2010 Smith et al., 2011 Kalsner y Chamberlain, 2015 Yi et al. , 2015). Otro ejemplo es la discapacidad intelectual, que coexiste con el autismo en aproximadamente el 45% de los casos (Lai et al., 2014).Múltiples estudios han encontrado que los TEA y la discapacidad intelectual comparten loci de riesgo (Pinto et al., 2010 McCarthy et al., 2014), pero los fenotipos superpuestos son un factor de confusión potencial. De manera similar, otros genes de riesgo para TEA son reguladores epigenéticos cuyos efectores están asociados con diferentes enfermedades (Samaco et al., 2005 Pinto et al., 2010 Michaelson et al., 2017). La interacción y superposición entre los trastornos psiquiátricos es compleja y queda mucho por discernir con respecto a los mecanismos de enfermedad compartidos.


Análisis de asociación de todo el genoma del trastorno depresivo

Como se señaló anteriormente, los genes & # x0003e20 se han asociado con el inicio de la DD y se han confirmado mediante metanálisis. En la mayoría de los casos, estas asociaciones involucran genes que no están directamente relacionados con las teorías generales de la etnopatogenia de la depresión. Los estudios de asociación parecían estar relacionados con la transición a métodos de análisis de asociación de todo el genoma sin ninguna sugerencia sobre los factores de riesgo genéticos de la depresión.

En la primera etapa de los GWAS, las familias con miembros que han experimentado múltiples eventos de depresión, un curso severo del trastorno o una edad temprana en su inicio clínico se analizaron con especial interés en pacientes con formas monogénicas raras de depresión. Los resultados de estos estudios se resumen en la Tabla & # x200B Tabla 3. 3. Estos estudios han informado asociaciones con regiones genómicas extendidas (incluso siempre que los cromosomas de longitud completa), y la identificación de los genes candidatos parece ser provisional. Esta identificación se basa principalmente en los genes candidatos a DD mapeados anteriormente en estas regiones del genoma.

Tabla 3

Mapeo de los loci asociados con la predisposición a diferentes formas de depresión en estudios familiares utilizando paneles SNP de marcadores de ADN.

ReferenciaFenotipo clínicoCromosomaGen candidato
(101)Depresión recurrente de inicio temprano15q25.3 & # x0201326.2NTRK3 (receptor de neurotrofina 3)
(102)Depresión recurrente, trastorno bipolar predominante en la depresión12q23N / A
(103)Depresión con inicio temprano (31 años de edad) depresión con ansiedadcromosomas 3centr, 7p y 18qN / A
(104)Depresión recurrente sin síntomas de trastorno bipolar1p36, 12q23.3-q24.11 y 13q31.1-q31.3N / A
(105)Desorden depresivocromosomas 17 y 8SLC6A4 (miembro 4 de la familia de portadores de solutos 6)

Los GWAS se han utilizado cada vez más en la última década para identificar loci que controlan rasgos complejos. En este análisis, se identifican desde cientos de miles hasta varios millones de SNP distribuidos por todo el genoma en grupos de personas que tienen un rasgo de interés particular. El análisis de las asociaciones de genotipo y fenotipo permite establecer un vínculo entre la variante alélica en alguna región particular del genoma con el rasgo estudiado. La principal diferencia entre los GWAS y los estudios de genes candidatos que utilizan el método case & # x02013control es que no existe una hipótesis preliminar para explicar la contribución de las variantes polimórficas de genes al desarrollo de una patología de interés. Sin embargo, para que un estudio logre resultados estadísticamente significativos, su algoritmo requiere muestras muy grandes tanto de pacientes como de personas sanas. Puede ser extremadamente difícil lograr la homogeneidad clínica en muestras muy grandes, especialmente cuando se estudian enfermedades psiquiátricas porque siempre existe un factor de subjetividad que afecta la precisión diagnóstica en las clasificaciones internacionales relevantes sin casi ningún método instrumental para evaluar la condición del paciente.

Varios estudios han buscado loci asociados con el TDM o síntomas individuales de depresión. Los resultados se resumen en la Tabla & # x200B Tabla 4. 4. Esta tabla se centra principalmente en aquellos estudios que analizaron principalmente el riesgo de depresión como enfermedad y no los endofenotipos (p. Ej., Edad de inicio clínico, gravedad de síntomas particulares, respuestas de los pacientes a la terapia). Además, Table & # x200B Table4 4 incluye los resultados estadísticamente más significativos de los artículos analizados.

Cuadro 4

Estudios de asociación de todo el genoma de los trastornos depresivos mayores (TDM) y los trastornos depresivos recurrentes (TDM).

ReferenciaFenotipo clínicoMarcador de ADN con el valor P más pequeñoPAG-valorGen cerca de SNPFunción genética, vía metabólica
(106)MDDrs27151487.7 & # x000d7 10 & # x022127 PCLO (proteína citomatriz presináptica piccolo)La proteína codificada por este gen es parte de la matriz citoesquelética presináptica involucrada en la formación de zonas sinápticas activas y transporte de vesículas sinápticas.
(107)RDDrs42380105.80 & # x000d7 10 & # x022126 CCND2 (ciclina D2)La proteína codificada por este gen está involucrada en el control de la regulación del ciclo celular (transición Gl / S) en un complejo con las quinasas CDK4 o CDK6.
(108)RDDrs9416742
rs999845
1.30 & # x000d7 10 & # x022127
3.1 & # x000d7 10 & # x022126
BICC1 (homólogo bicaudal C 1)Codifica una proteína de unión a ARN que participa en la regulación de la expresión génica mediante la modulación de la traducción de proteínas en la embriogénesis.
(109)MDDrs2765501
rs7713917
1,66 & # x000d7 10 & # x022127

El primer GWAS de una gran muestra representativa (1738 pacientes con DD, 1802 controles) fue informado por Sullivan et al. (106). En este estudio, ninguna asociación con ninguno de los SNP alcanzó el valor de significación generalizada. La máxima significancia se encontró para el rs2715148 (pag = 7.7 & # x000d7 10 & # x022127). Además, en esta región genómica cerca PCLO gen 10 SNP más se asociaron con DD con una significación relativamente baja (pag = 10 & # x022125-10 & # x020136). Fueron mapeados a una región de 167 kb donde PCLO fue localizado (106). La proteína PCLO se localiza en la matriz citoplásmica de la zona activa presináptica y desempeña un papel importante en la neurotransmisión monoaminérgica cerebral. Un posible papel de esta región en el inicio de la depresión fue confirmado por Hek et al. (115), que mostró una asociación entre el SNP rs2522833 en PCLO y DD en un estudio poblacional de los Países Bajos (115). Aragam y col. (113) encontraron una estrecha asociación estadísticamente significativa entre el desarrollo de DD para el SNP rs2715148 (PAG = 5,64 & # x000d7 10 & # x022127) en PCLO en mujeres (113). Este estudio encontró otro SNP en LGSN que se asoció con la aparición de DD en hombres (rs9352774, PAG = 2,26 & # x000d7 10 & # x022124). Este gen se expresa activamente en el cristalino humano y codifica una proteína relacionada con GS-I y, en menor grado, con glutamina sintetasas GS-II. Esta proteína puede desempeñar un papel en el intercambio de glutamato tanto en la retina como en el sistema nervioso.

Se encontró un papel del glutamato en la DD en un GWAS realizado por Rietschel et al. (109). Encontraron una asociación entre DD y el rs7713917 SNP (PAG = 5.87 & # x000d7 10 & # x022125) ubicado en una supuesta región reguladora de HOMER1, que codifica proteínas implicadas en procesos glutaminérgicos a través de la interacción con los receptores metabotrópicos de glutamato mGluR1 y mGluR5.

Reiteramos que las asociaciones descubiertas en la mayoría de los GWAS no alcanzaron un nivel de significación en todo el genoma, principalmente debido a la arquitectura genética de los rasgos complejos que predisponen a la depresión. Los ajustes del nivel de significación de todo el genoma son muy rigurosos, y creemos que también se deben considerar los marcadores SNP con un valor de probabilidad cercano al nivel de umbral de todo el genoma.

Algunos estudios han alcanzado un nivel de significación de todo el genoma. Kohli y col. (112) fueron los primeros en informar una asociación entre los DD y el SNP rs1545843 en SLC6A15 (familia de portadores de solutos 6, transportador de aminoácidos neutros, miembro 15) en un modelo recesivo del efecto de este polimorfismo sobre el riesgo de DD (112). Este gen codifica el transportador de aminoácidos neutros, y se demostró que diferentes alelos rs1545843 tienen diferentes SLC6A15 niveles de expresión en el hipocampo de pacientes epilépticos. Los autores presentaron evidencia adicional para apoyar la participación de esta asociación y mostraron que la presencia del alelo de riesgo se correlacionó con una menor SLC6A15 expresión en el hipocampo, menor volumen del hipocampo e integridad neuronal en vivo. Menor expresión de Slc6a15 También se observó en el hipocampo de ratones con elevada susceptibilidad al estrés crónico.

Kohli y col. (112) reportaron abundantes datos en apoyo de la asociación entre SLC6A15 y DD. Sin embargo, el GWAS posterior no reveló asociaciones significativas con este gen. Los datos obtenidos en los GWAS a menudo no son reproducibles, y solo un gen, PCLO, parecía estar asociado con DD en dos GWAS.

El Consorcio de Genómica Psiquiátrica (PGC) realizó un metanálisis de los datos de GWAS. A diferencia de los metanálisis convencionales, que resumen los datos estadísticos de cada análisis de constituyente examinado, el estudio PGS reunió y examinó datos genotípicos y fenotípicos individuales de pacientes de diferentes centros de investigación. El PGS publicó los resultados de su análisis comparativo de todo el genoma de 9240 muestras recolectadas de pacientes con DD y 9519 muestras de un grupo de control de nueve poblaciones europeas (122). Sin embargo, en el análisis de PGS, ninguno de los SNP identificados en estudios anteriores alcanzó un nivel de significación de todo el genoma. Los SNP con los valores más significativos fueron rs11579964 (PAG = 1.0 & # x000d7 10 & # x022127), que se asignó cerca CNIH4, NVL, y WDR26y rs7647854 (PAG = 6.5 & # x000d7 10 & # x022127), que se asignó cerca C3orf70 y EHHADH. Un estudio replicativo posterior realizado con una muestra independiente (6783 pacientes con TDM y 50,695 controles) no confirmó las asociaciones mencionadas.

Por lo tanto, no se ha demostrado que ningún locus esté asociado consistentemente con un DD a un nivel de significancia de genoma completo. Tampoco se han reproducido las asociaciones que se muestran en muestras independientes. Esta falta de importancia y reproducibilidad puede reflejar las características particulares de la metodología GWAS, que se ha centrado en sitios polimórficos con una alta frecuencia de alelos menores (& # x0003e5%) en el análisis asociativo. Estas variantes polimórficas frecuentes en sí mismas probablemente no son patogénicamente esenciales, pero puede haber vínculos de desequilibrio con variantes raras de genes asociados con la patogénesis de DD. Estas variantes raras pueden ser específicas para diferentes poblaciones. Como resultado, cualquier asociación entre la enfermedad y un sitio polimórfico frecuente se puede encontrar en una muestra y puede reflejar el enlace de desequilibrio de este sitio polimórfico con una variante rara, patógenamente significativa en esa muestra. Sin embargo, el sitio patógeno significativo puede faltar en otra muestra y, como consecuencia, no se encontrará una asociación de polimorfismo frecuente con la aparición de DD. Además, se ha informado del importante papel de las variantes genómicas raras (una frecuencia & # x0003c1%) en asociación con otros trastornos mentales, como la esquizofrenia y el autismo (123, 124).

Para superar estos problemas, la transición del análisis de marcadores de ADN polimórficos mediante microarrays a la secuenciación de ADN de baja cobertura puede proporcionar una nueva dirección para la investigación para identificar variantes genéticas asociadas a DD. El primer estudio de este tipo se realizó dentro del Proyecto CONVERGE (125) e incluyó la secuenciación del genoma con una cobertura promedio de 1,7 & # x000d7 en & # x0003e9000 mujeres chinas 5000 mujeres de este grupo eran pacientes con depresión melancólica, que se reconoce como una forma más severa de depresión. Este estudio encontró dos loci que tienen una asociación a un nivel de significancia 10 & # x022128: uno en el lado 5 & # x02032 de SIRT1 (SNP rs12415800) y el otro en un LHPP intrón (SNP rs35936514). Esta asociación se confirmó en una muestra independiente de mujeres chinas melancólicas, y los valores de significancia combinados para las dos muestras fueron 2.53 & # x000d7 10 & # x0221210 para SIRT1 y 6.45 & # x000d7 10 & # x0221212 para LHPP. Es importante señalar que ambos SNP asociados ocurren con frecuencia (p. Ej., Las frecuencias alélicas mínimas fueron 45,3 y 26,2%), sin embargo, ninguno de los dos está incluido en los microarreglos utilizados ampliamente para la tipificación de marcadores SNP y, por lo tanto, puede haber sido ignorado en GWAS anteriores.

Un análisis más detallado de los datos en este proyecto mostró que los SNP frecuentes representaron el 20 & # x0201330% de la dispersión del riesgo de DD, lo que sugirió que la heredabilidad de DD se distribuye uniformemente en todos los cromosomas con una localización preferencial de los SNP asociados a DD tanto en la codificación como en las áreas de genes 3 & # x02032-no traducidas. Los pacientes con DD mostraron una frecuencia elevada de mutaciones únicas en las regiones codificantes de genes, principalmente en los genes expresados ​​activamente en el tejido nervioso (126).

Es importante destacar que este estudio incluyó un grupo étnico específico (chino Han), que es suficientemente homogéneo, y solo mujeres, que muestran un nivel de heredabilidad más alto como se mencionó anteriormente, con una forma severa de DD. Este diseño incluyó un enfoque más riguroso para la inclusión de muestras y la consideración de factores como el sexo de los pacientes, la variación clínica de la DD, la edad de inicio clínico y otros factores que pueden afectar el riesgo de enfermedad y su progresión. Sin embargo, estos factores pueden no ejercer influencia sobre el riesgo de desarrollo de DD, por ejemplo, recientemente se demostró que la edad de inicio clínico no afecta los resultados del análisis de asociación en la muestra CONVERGE de China (127).

Otro estudio también encontró que la etnia era importante (128). Ese estudio incluyó un análisis combinado de los resultados obtenidos en la investigación CONVERGE de chinos y de estudios realizados por el PGC en diferentes poblaciones europeas. Estos estudios encontraron que algunos SNP influyen en el riesgo de aparición de DD en los dos grupos étnicos mencionados pero, al mismo tiempo, detectaron un conjunto de SNP específicos para cada grupo étnico. La mayor contribución de factores genéticos en ambos grupos étnicos se observó en mujeres y en pacientes con depresión recurrente.

Powers y col. (116) intentó incluir factores ambientales en los GWAS (116). Incluyeron como factor los eventos que provocan estrés al incluir pares de pacientes de casos y # x02013control en el estudio & # x02014a método denominado coincidencia de puntuación de propensión. Este análisis les permitió reducir la heterogeneidad de las muestras con respecto al factor de estrés y comparar pacientes con DD y controles sanos expuestos a estresores similares.

La estructura genética de la depresión parece ser extremadamente complicada e involucra una gran cantidad de loci, que causan varios efectos fenotípicos y muestran complejas interacciones entre los locus. Los estudios de la estructura genética sugieren la necesidad de una transición del análisis de SNP individuales al de conjuntos de SNP y, finalmente, para incluir una puntuación de riesgo poligénico, como se utiliza en la investigación genética de la esquizofrenia (129).

Para abordar un problema similar, se ha utilizado con éxito una estrategia para estudiar redes de genes creadas uniendo señales de numerosos SNP y el posterior análisis funcional de las vías de señalización y metabólicas. Este enfoque proporciona un aumento en el poder del análisis comparativo de señales débiles de numerosos loci. El estudio de Song et al. (130) es un ejemplo de tal análisis. Sobre la base de un GWAS de muestras de cohortes europeas, los autores llevaron a cabo una búsqueda y análisis de genes y SNP vinculados a DD con estos SNP para descubrir vías de señal que vinculan estos genes entre sí (130). Se descubrió que cinco rutas de señales resultantes desempeñan un papel en la patogénesis de la DD. Se afirmó que tres de ellos estaban relacionados de alguna manera con la regulación negativa de la expresión génica (GO: 0016481, GO: 0045934, GO: 0010629) y estaban relacionados con algunos SNP asociados a DD: rs3213764 en ATF7IP rs2301721 en HOXA7 rs6720481 en LRRFIP1 rs2229742 en NRIP1.

Okbay y col. (118) y Hyde et al. (131) ofrecieron un enfoque alternativo para el muestreo (118, 131). Para diagnosticar las DD, compilaron un cuestionario para ser completado por los encuestados. La depresión se diagnosticó sobre la base de las respuestas de los encuestados al cuestionario sin un diagnóstico clínico por parte de un psiquiatra. Aunque se puede cuestionar la precisión del diagnóstico, el cuestionario incluía preguntas sobre una amplia gama de rasgos fenotípicos, y los encuestados no pudieron asociarlos con ningún diagnóstico. Los datos de biobancos o servicios de genotipado masivo como 23 y Me les permitieron aumentar notablemente el tamaño de la muestra. Por ejemplo, el estudio de Hyde et al. (131) incluyeron & # x0003e450,000 personas, y el análisis de los datos de su cuestionario les permitió diagnosticar la depresión en aproximadamente 120,000 participantes (131). Las muestras de este tamaño son un orden de magnitud mayor que las incluidas en los estudios de PGC o el Proyecto CONVERGE, y ayudan a minimizar los problemas causados ​​por errores de diagnóstico de DD. Los autores lograron identificar 17 marcadores SNP en 15 loci cuyo nivel de significancia fue & # x0003e5 & # x000d7 10 & # x022128, lo que refleja el tamaño de la muestra analizada. Los marcadores de ADN detectados difieren de los asociados a DD en los estudios de PGC, aunque ambos analizaron muestras de origen europeo. Por tanto, queda por resolver el problema de la reproducibilidad de los resultados obtenidos en los GWAS.

Una forma posible de resolver este problema es realizar un metanálisis de los estudios de GWA. Este análisis fue realizado por Wray et al. (121). Este metanálisis identificó 44 loci independientes que eran estadísticamente significativos (PAG & # x0003c 5 & # x000d7 10 & # x022128). De estos loci, 30 son nuevos y 14 fueron significativos en un estudio previo de TDM o síntomas depresivos, y 6 loci compartieron con esquizofrenia. Así, el aumento de tamaños muestrales en el metaanálisis, por un lado, permite confirmar los resultados obtenidos anteriormente con GWAS para los loci asociados a TDM descritos anteriormente. Por otro lado, aumenta la potencia del estudio, al aumentar el tamaño de la muestra, permitiendo identificar nuevos loci asociados al TDM.

Se propusieron varios métodos para calcular el puntaje de riesgo genético (GRS): puntaje de riesgo genético de recuento simple (SC-GRS), puntaje de riesgo genético ponderado por razón de probabilidades (OR-GRS), puntaje de riesgo genético de regresión logística directa (DL-GRS), puntaje poligénico puntaje de riesgo genético (PG-GRS) y puntaje de riesgo genético ponderado por varianza explicada (EV-GRS). Actualmente, el método más utilizado es la puntuación de riesgo poligénico (PGRS) (132). Este enfoque se ha utilizado para obtener evidencia de un efecto genético incluso cuando ningún marcador individual es significativo, para establecer una base genética común para trastornos relacionados y para construir modelos de predicción de riesgo (133). Actualmente, se proponen enfoques alternativos para el análisis estadístico de los datos de GWAS, donde el análisis no es de marcadores de ADN individuales, sino de sus combinaciones.Recientemente, se han publicado varios artículos utilizando PGRS para el TDM y otros trastornos psiquiátricos (134 & # x02013136). Se demostró la posibilidad de utilizar el PGRS para evaluar la contribución acumulativa de varias variantes polimórficas de genes a la formación de endofenotipos de MDD. Whalley y col. (135), utilizando el PGRS, dividió el TDM en dos subtipos, uno de los cuales se acerca a la esquizofrenia (135).


Trastorno neurológico no diagnosticado previamente vinculado a mutaciones en el gen IRF2BPL

Un equipo internacional de científicos, incluidos investigadores de Baylor College of Medicine, ha descubierto mutaciones de genes IRF2BPL que están asociados con un trastorno neurológico no diagnosticado previamente en siete personas no relacionadas. Los investigadores proponen que estas mutaciones que causan enfermedades conducen a una pérdida de función de la proteína y que el gen IRF2BPL es necesario para el correcto funcionamiento y mantenimiento de las neuronas. El estudio aparece en el American Journal of Human Genetics.

“Este proyecto comenzó cuando nuestro colega y autor correspondiente de este estudio, el Dr. Loren D.M. Pena, profesora asociada de pediatría, y la Dra. Vandana Shashi, profesora de pediatría en el sitio clínico de Duke de la red de enfermedades no diagnosticadas (UDN), nos conectaron con un paciente que presentaba una afección neurológica grave sin diagnóstico ”, dijo el autor correspondiente, el Dr. Hugo Bellen, profesor de genética y neurociencia humana y molecular en el Baylor College of Medicine e investigador del Instituto Médico Howard Hughes. "El ADN del paciente y de la familia había sido secuenciado e indicó que el gen IRF2BPL era un candidato que podría estar causando la enfermedad ".

Desafortunadamente, la función normal del gen candidato es poco conocida, pero los investigadores del Centro de Selección de Organismos Modelo de la UDN dirigido por los Dres. Bellen, Michael Wangler y Shinya Yamamoto, profesores asistentes de genética molecular y humana en el Baylor College of Medicine, ya estaban interesados ​​en este gen porque estaba en una lista de genes candidatos al autismo. Además, el primer autor, el Dr. Paul Marcogliese, asociado postdoctoral de genética molecular y humana en Baylor, estaba creando reactivos para estudiar el gen en la mosca de la fruta.

“Ya tenía algo de experiencia e interés en este gen, así que cuando recibimos este primer caso a través de la UDN, me ofrecí como voluntario para llevar a cabo este proyecto porque ya tenía herramientas para estudiar el gen”, dijo Marcogliese.

Después del primer paciente, llegaron seis más. Cinco de ellos presentaron características neurológicas similares: nacieron sanos pero, entre las edades de 3 a 5 años, comenzaron a mostrar regresión progresiva y severa del neurodesarrollo, incluyendo falta de coordinación, bajo tono muscular y fuerza muscular (hipotonía) y pérdida de la control total de los movimientos corporales (ataxia). Alrededor de su décimo cumpleaños, la mayoría de ellos estaban en silla de ruedas. Los otros dos casos se presentaron con características más leves, mostrando retraso en el desarrollo global y convulsiones.

Conexión del gen IRF2BPL con un trastorno neurológico no diagnosticado

Las investigaciones de los investigadores mostraron que los cinco individuos que presentaban la afección neurológica más grave portaban una mutación sin sentido de IRF2BPL, es decir, una mutación que introduce una señal de "parada" dentro de la región codificante de la proteína del gen. Este tipo de mutación da como resultado la producción de una proteína truncada que generalmente no puede cumplir la función de la proteína normal.

Los dos individuos que presentan condiciones neurológicas más leves, por otro lado, portan una mutación sin sentido. En este caso, la mutación cambió una sola "letra" en el código genético de la proteína, lo que resultó en la sustitución de un aminoácido, los componentes básicos de las proteínas, por otro en la proteína producida por el gen. Tanto las mutaciones sin sentido como las sin sentido son de novo, o nuevos en los pacientes, lo que significa que no están presentes en sus padres. Las mutaciones también son dominantes, solo una de las dos copias del gen es defectuosa en los pacientes, y esto es suficiente para causar la enfermedad.

Para obtener más información sobre los genes IRF2BPL que podría relacionarlo con el trastorno neurológico humano, los investigadores llevaron a cabo experimentos en la mosca de la fruta. Este modelo animal expresa un gen llamado pozos, que es el equivalente de la mosca de la fruta a la IRF2BPL.

“Nuestros estudios demostraron que el gen conocido como pozos se expresa ampliamente en el cerebro de la mosca de la fruta ”, dijo Bellen, quien también es miembro del Instituto de Investigación Neurológica Jan y Dan Duncan en el Hospital Infantil de Texas. "Pérdida completa de pozos fue letal en el desarrollo temprano de la mosca. Curiosamente, encontramos que derribar parcialmente pozos resultó en una neurodegeneración que afectó progresivamente las funciones motoras a medida que las moscas envejecían. Entonces, una característica común entre la condición humana y la mosca es que ambas son un tipo progresivo de neurodegeneración ".

Los investigadores también analizaron lo que estaba sucediendo a nivel celular, específicamente las consecuencias de derribar pozos solo en las neuronas sensibles a la luz o fotorreceptores en los ojos de la mosca de la fruta.

“Observamos que los fotorreceptores están bien mientras las moscas son jóvenes, pero muestran signos de degeneración en las moscas envejecidas”, dijo Marcogliese. "Los estudios de microscopía electrónica revelaron una serie de estructuras celulares alteradas y la acumulación de gotitas de lípidos, que se sabe que afectan negativamente la función neuronal".

Además, los investigadores modificaron genéticamente las moscas de la fruta para expresar la mutación. IRF2BPL genes encontrados en los pacientes. Expresar las mutaciones sin sentido graves en las moscas resultó en una pérdida drástica de la función y la expresión de una de las mutaciones sin sentido que causa una condición neurológica más sutil en los humanos resultó en una pérdida parcial de la función en las moscas.

"Tomados en conjunto, nuestros hallazgos indican que IRB2BPL y pozos son genes esenciales para el sistema nervioso tanto de los humanos como de las moscas de la fruta y su pérdida o alteración da como resultado una variedad de afecciones neurológicas ”, dijo Marcogliese. "A continuación, queremos encontrar formas de mejorar o prevenir la afección".

“La asociación médico-investigador fue particularmente emocionante, ya que el trabajo con las moscas de la fruta proporcionó evidencia convincente adicional de que IRF2BPL es una proteína importante para el desarrollo y el mantenimiento neurológico ”, dijo Peña. “El trabajo con las moscas de la fruta también fue crucial a la hora de proporcionar información para clasificar las variantes en IRF2BPL como un diagnóstico probable ".

“Nuestras próximas metas son trabajar con moscas de la fruta para estudiar la biología del proceso que conduce a la neurodegeneración y desarrollar un modelo de ratón de la condición humana en el que podamos probar terapias potenciales”, dijo Bellen.

Para obtener la lista completa de contribuyentes y su afiliación, visite este enlace.

Este trabajo fue financiado por las subvenciones U01HG007672, U01HG007703 y U54NS093793 R01GM067858 y R24OD022005 de la Red de Enfermedades No Diagnosticadas y un Premio de Pantalla Funcional de la Fundación Simons (368479). El Instituto Nacional de Trastornos Neurológicos y Accidentes Cerebrovasculares proporcionó más apoyo con el número de premio K08NS092898, los Ángeles Guardianes de Jordan, y la subvención U54HD083092 al Centro de Investigación de Discapacidades Intelectuales y del Desarrollo (IDDRC) Neurovisualization Core.


Para obtener más información sobre esta condición genética, visite la Fundación Stand by Eli y His Beautiful Smiles.


Resultados

Un total de 4.340 S. cerevisiae- y 8.871 S. sensu stricto-Los genes de Novo específicos se originan a partir de regiones sinténicas conservadas en Saccharomycetaceae Levaduras

los S. sensu stricto El complejo contiene al menos cinco especies de levadura estrechamente relacionadas:S. cerevisiae, S. paradoxus, S. mikatae, S. kudriavzevii, y S. uvarum—Cuyos genomas han sido bien secuenciados (Scannell et al. 2011). Dentro del complejo, S. cerevisiae tiene el mejor genoma anotado, por lo que fue elegida como nuestra especie de referencia. Saccharomyces uvarum es el pariente más lejano de las especies, y se estima que divergió del antepasado común de S. cerevisiae ∼20 Ma. Para obtener un análisis completo de genes de novo en S. sensu stricto levaduras, primero recolectamos diferentes fuentes de S. cerevisiae CDS que incluyen todos los marcos de lectura abiertos (ORF) anotados en el Saccharomyces Base de datos del genoma (SGD, la base de datos más utilizada en levaduras), pequeñas secuencias traducidas identificadas mediante el perfil de ribosomas (Carvunis et al. 2012), y los primeros CDS de las transcripciones de los datos de secuenciación de isoformas de transcripciones (TIF-seq) si los CDS fueran no anotado previamente por SGD (Pelechano et al. 2013). En la levadura, la traducción de proteínas generalmente comienza desde el primer codón de inicio de la transcripción, por lo que solo el primer CDS de cada transcripción se consideró como nuestro candidato. Además, si las transcripciones se solapaban con las de los genes existentes, solo se seleccionaron los CDS que estaban en marcos diferentes de los genes existentes. Por lo tanto, nuestros CDS candidatos no consistían en formas truncadas o expandidas de genes existentes. Las unidades de transcripción identificadas por los datos de TIF-seq proporcionaron transcripciones de resolución de pares de bases con estructuras de terminación y finalización, lo que garantiza que sean productos de transcripción maduros (Pelechano et al. 2013). Estos CDS obtenidos a partir de datos de TIF-seq representaron una fuente de datos inexplorada, ya que no se habían analizado en estudios de genes de novo anteriores. Los CDS de estos diferentes recursos se denominaron sgdCDS, smORF y txCDS, respectivamente, para los datos SGD, perfiles de ribosomas y TIF-seq. Filtramos los CDS con posibles intrones, sin evidencia de transcripción obvia o de corta duración antes de realizar más análisis (fig. 1A, panel izquierdo, consulte Materiales y métodos para obtener más detalles).

Identificación de genes de novo en el Saccharomyces sensu stricto complejo. (A) Fuentes de datos y canalización analítica para la identificación de genes de novo. sgdCDS, smORF y txCDS (recuadros azules) representan los CDS recopilados a partir de datos de SGD, perfiles de ribosomas y TIF-seq, respectivamente. El cuadro rosa representa todos los CDS recopilados después del filtrado de datos. El recuadro verde indica genes sin similitud proteica en noSaccharomycetaceae especies (genes candidatos de novo). Los cuadros llenos de color verde representan S. cerevisiae-específico (edad 0) o S. sensu stricto-genes de novo específicos (edad 1). Los números en rojo representan los pasos analíticos mencionados en los métodos. Los números entre paréntesis son el número de CDS en cada paso o grupo. (B) La mayoría de los CDS se superponen con genes antiguos o se localizan en regiones sinténicas. (C) Todos los CDS posibles en las regiones superpuestas o sinténicas se anotan y comparan con los genes candidatos de novo. Para los candidatos de novo que se superponen con ScANC, incluimos regiones proximales de ScANC de 3 kb para detectar posibles ortólogos. Para candidatos de novo con sintenia conservada, buscamos en toda la región sinténica entre dos genes antiguos flanqueantes (ScANCa y ScANCb) en busca de posibles ortólogos. Este proceso se repitió para los 20 Saccharomycetaceae levaduras. (D) Asignaciones de edad de los candidatos de novo. Los círculos grises indican nodos filogenéticos de Saccharomycetaceae levaduras determinadas por un estudio previo (Marcet-Houben y Gabaldon 2015). El círculo rojo indica el evento WGD. Se enumeran las especies que pertenecen a cada rama filogenética. El número de genes candidatos de novo con las edades correspondientes se muestra a la derecha.

Identificación de genes de novo en el Saccharomyces sensu stricto complejo. (A) Fuentes de datos y canalización analítica para la identificación de genes de novo. sgdCDS, smORF y txCDS (recuadros azules) representan los CDS recopilados a partir de datos de SGD, perfiles de ribosomas y TIF-seq, respectivamente. El cuadro rosa representa todos los CDS recopilados después del filtrado de datos. El recuadro verde indica genes sin similitud proteica en noSaccharomycetaceae especies (genes candidatos de novo). Los cuadros llenos de color verde representan S. cerevisiae-específico (edad 0) o S. sensu stricto- genes de novo específicos (edad 1). Los números en rojo representan los pasos analíticos mencionados en los métodos. Los números entre paréntesis son el número de CDS en cada paso o grupo. (B) La mayoría de los CDS se superponen con genes antiguos o se localizan en regiones sinténicas. (C) Todos los CDS posibles en las regiones superpuestas o sinténicas se anotan y comparan con los genes candidatos de novo. Para los candidatos de novo que se superponen con ScANC, incluimos regiones proximales de ScANC de 3 kb para detectar posibles ortólogos. Para candidatos de novo con sintenia conservada, buscamos en toda la región sinténica entre dos genes antiguos flanqueantes (ScANCa y ScANCb) en busca de posibles ortólogos. Este proceso se repitió para los 20 Saccharomycetaceae levaduras. (D) Asignaciones de edad de los candidatos de novo. Los círculos grises indican nodos filogenéticos de Saccharomycetaceae levaduras determinadas por un estudio previo (Marcet-Houben y Gabaldon 2015). El círculo rojo indica el evento WGD. Se enumeran las especies que pertenecen a cada rama filogenética. El número de genes candidatos de novo con las edades correspondientes se muestra a la derecha.

Dado que la información sinténica es fundamental para determinar los orígenes y edades de los genes de novo, nuestra línea analítica consistió en múltiples pasos de análisis de sintenia para minimizar los posibles errores en la asignación de genes de novo (fig. 1A, panel derecho, consulte Materiales y métodos para obtener más detalles). Después de excluir CDS con posibles ortólogos en Saccharomycetaceae levaduras, los 20.958 CDS restantes se sometieron a comparaciones sintéticas. Estudios previos han determinado la información de sintetizador de 21 Saccharomycetaceae levaduras y también las S. cerevisiae genes antiguos (ScANC), definidos como genes derivados de un ancestro común previo a la duplicación del genoma completo (WGD) (Byrne y Wolfe 2005 Gordon et al. 2009). Esta información se utilizó para rastrear los posibles orígenes de nuestros candidatos de novo. Cuando se analizaron los 20.958 CDS candidatos, se encontró que la mayoría de ellos (19.450 de 20.958 o 93%) estaban localizados en regiones sinténicas o superpuestos con genes antiguos (fig. 1B). A continuación, identificamos todos los CDS posibles en los sinenios conservados en otras especies de levadura y luego comparamos estos CDS con nuestros genes candidatos para encontrar posibles ortólogos correspondientes (fig. 1C).

Después de anotar todos los CDS de éxito de BLAST en cada Saccharomycetaceae genoma de levadura, el tiempo de divergencia de las especies más distantes que portan un CDS homólogo correspondiente se consideró como la edad de cada CDS candidato. Adaptamos los nodos filogenéticos de Saccharomycetaceae levaduras definidas por un estudio anterior (Marcet-Houben y Gabaldon 2015), y los CDS candidatos con edad 0 o 1 años se consideraron como S. cerevisiae-específico o S. sensu stricto-genes de novo específicos, respectivamente (fig. 1D). En total, se confirmó que el 68% de los CDS candidatos (13,211 / 19,450 = 68%) se originaron en S. sensu stricto levaduras, incluidos 4.340 genes de edad 0 y 8.871 genes de edad 1. Más del 97% de los genes de novo identificados eran del grupo txCDS (tabla complementaria S1, Material complementario en línea), que no se había considerado en estudios anteriores.

Las detecciones de ortólogos en regiones sinténicas proporcionan un método sólido para la determinación de genes de novo

Para comprender cómo se distribuyen los genes de novo identificados entre las diferentes fuentes de CDS, todos los genes candidatos de las tres fuentes se agruparon según la edad (fig. 2A). El grupo smORF tuvo la mayor proporción (90%) de genes de edad 0 y edad 1. Para determinar si nuestro proceso proporciona una herramienta sólida para la identificación de genes de novo, comparamos nuestra lista con otros tres estudios de genes de levadura de novo a gran escala (Ekman y Elofsson 2010 Carvunis et al. 2012 Tsai et al. 2012). Los genes de edad 0 y edad 1 de sgdCDS se compararon por primera vez, ya que todos los demás estudios a gran escala han incluido sgdCDS en sus análisis. Curiosamente, solo el estudio de Carvunis et al. (2012) identificaron una cohorte similar de genes de novo, pero sus asignaciones de edad fueron significativamente diferentes de las nuestras, especialmente para el grupo de edad 0 (figura 2B y figura suplementaria S1A, material complementario en línea). Muchos genes clasificados como S. cerevisiae-específicos según nuestro análisis fueron considerados S. sensu stricto-genes específicos de Carvunis et al. (Carvunis et al. 2012). Para investigar esta discrepancia, examinamos cada caso individual y encontramos que las edades de los genes a menudo estaban mal asignadas en el estudio anterior a pesar de que existían secuencias de ADN similares en otros. S. sensu stricto especies, carecen del codón de iniciación, tienen codones de parada prematuros tempranos o contienen pequeñas deleciones que desplazan la mayoría de los marcos de lectura abiertos (figura suplementaria S1B, material suplementario en línea). Dos ejemplos, YCR024C-B y YLR112W, se muestran en detalle en la figura complementaria S2, Material complementario en línea. Estos resultados revelan claramente el problema común de la asignación de edades en el estudio de Carvunis et al. (2012).

Comparaciones de la asignación de edad de genes entre diferentes estudios. (A) Distribución de edades de genes para diferentes fuentes de CDS. (B) Comparaciones de edad de genes entre diferentes estudios de todo el genoma. En el grupo sgdCDS, identificamos 47 genes de edad 0 y 50 genes de edad 1, muchos de los cuales no fueron identificados o asignados a diferentes edades en otros estudios. (C) Los factores que contribuyen a la exclusión de 755 sgdCDS de novo identificados en estudios previos de todo el genoma. Además, consulte las figuras complementarias S1-S3, Material complementario en línea, para obtener comparaciones detalladas.

Comparaciones de la asignación de edad de genes entre diferentes estudios. (A) Distribución de edades de genes para diferentes fuentes de CDS. (B) Comparaciones de edad de genes entre diferentes estudios de todo el genoma. En el grupo sgdCDS, identificamos 47 genes de edad 0 y 50 genes de edad 1, muchos de los cuales no fueron identificados o asignados a diferentes edades en otros estudios. (C) Los factores que contribuyen a la exclusión de 755 sgdCDS de novo identificados en estudios previos de todo el genoma. Además, consulte las figuras complementarias S1-S3, Material complementario en línea, para obtener comparaciones detalladas.

Aparte de los 97 genes de novo también confirmados por nuestra cartera, 755 sgdCDS se consideraron genes de novo en estudios previos de todo el genoma, pero no se incluyeron en nuestra lista (Ekman y Elofsson 2010 Carvunis et al. 2012 Tsai et al. 2012). Investigamos cómo puede haber surgido esta inconsistencia. Nuestros datos mostraron que una de las principales causas de la exclusión de estos genes son los bajos niveles de transcripción (fig.2C). En nuestra tubería, solo los genes candidatos que tenían al menos dos copias de ARNm con estructuras completas de los datos de TIF-seq se consideraron para un análisis adicional. Aproximadamente el 74% de los genes de novo identificados en estudios anteriores fueron excluidos por este criterio. Sin embargo, dado que los datos de TIF-seq se obtuvieron a partir de células que crecen en medio que contiene glucosa o galactosa, existe la posibilidad de que esos CDS no transcritos puedan expresarse en otras condiciones más específicas. El 24% restante de los eventos de exclusión se debieron nuevamente a la asignación errónea de edades de genes en estudios anteriores (figura 2C y figura complementaria S1C, material complementario en línea).

En nuestro análisis, el 76% de los genes de novo previamente identificados que se encontró que tenían antepasados ​​pre-WGD eran del estudio de Ekman et al. Ekman y sus colegas no usaron TBLASTN para encontrar genes codificantes similares, sino que se basaron en la anotación del genoma original en sus especies seleccionadas (Ekman y Elofsson 2010). Por lo tanto, podrían obtenerse genes huérfanos falsos positivos si los genes ortólogos de estas especies no se anotaran correctamente. Como ejemplo, el HOR7 El gen se clasificó como un gen de novo en estudios anteriores (Ekman y Elofsson 2010 Carvunis et al. 2012), pero se encontró que se conservaba en Saccharomycetaceae levaduras en nuestra tubería (Fig. suplementaria S3, Material suplementario en línea). Secuencias de proteínas similares de HOR7 también se han identificado a través de un enfoque de detección de ortólogos sinténicos anteriores (Byrne y Wolfe 2005). Solo unos pocos genes de novo identificados por Tsai et al. (2012) se observaron en nuestra lista (fig. 2B y tabla complementaria S1, Material complementario en línea). En su estudio, se utilizó un enfoque conservador y solo se obtuvieron unos pocos genes candidatos. Sin embargo, la mayoría de ellos no fueron respaldados por los datos de la transcripción. Las comparaciones detalladas entre nuestros datos y otros estudios de todo el genoma indican que solo cuando todos los CDS posibles se anotan completamente en las regiones sinténicas de cada genoma y se utilizan para la comparación (fig. 1C) se puede determinar con precisión la edad del gen.

Los genes de novo ocurren a menudo en regiones no conservadas

¿Cómo surgen los genes de novo durante la evolución? Analizamos las regiones sinténicas correspondientes para 21 levaduras para ver si ya existían secuencias de ADN homólogas antes de la aparición de genes de novo. Usando TBLASTN para buscar las regiones sinténicas, pudimos encontrar secuencias homólogas de genes de edad 0 en S. sensu stricto especies, apoyando la evolución de novo de nuestros candidatos. Sin embargo, la probabilidad de encontrar secuencias similares disminuyó rápidamente con el aumento de la distancia genética, disminuyendo del 63% en S. paradoxus hasta ∼28% en S. uvarum (mi valor & lt 10 −2, fig. 3A), la especie más distante de este grupo. Más allá del grupo de genes de la edad 1, solo se encontraron niveles insignificantes de secuencias homólogas. De manera similar, cuando buscamos en las regiones sinténicas secuencias homólogas de genes de edad 1, apenas fueron detectables en otros grupos de edad (fig. 3B). Estos resultados sugieren que los genes de novo a menudo surgieron de secuencias no conservadas, de acuerdo con una observación previa (Ekman y Elofsson 2010). Además, calculamos la puntuación de conservación de la secuencia (Edgar 2004) y mostramos que las puntuaciones de edad 0 y 1 eran de hecho significativamente más bajas que las de ScANC (fig. 3C).

Los genes de novo se originan a partir de secuencias no conservadas. (A) Las proporciones de genes de edad 0 con secuencias de ADN homólogas identificadas disminuyen rápidamente con respecto a la divergencia de especies en Saccharomyces sensu stricto especies. (B) Sólo una pequeña proporción de genes de edad 0 y edad 1 tienen secuencias de ADN homólogas en las regiones sinténicas de las especies de 1 a 6 años y de 2 a 6 años, respectivamente. Dos diferentes mi Se aplicaron valores de corte (10 -2 y 10 -4) para TBLASTN, pero los resultados fueron similares. (C) La conservación de la secuencia es menor en las regiones que contienen genes de novo (prueba de Mann-Whitney, PAG value & lt2.2e-16, ScANCs versus edad 0, o ScANCs versus edad 1). Las puntuaciones de conservación en diferentes grupos de CDS se calcularon utilizando secuencias de ADN ortólogas en S. sensu stricto levaduras.

Los genes de novo se originan a partir de secuencias no conservadas. (A) Las proporciones de genes de edad 0 con secuencias de ADN homólogas identificadas disminuyen rápidamente con respecto a la divergencia de especies en Saccharomyces sensu stricto especies. (B) Sólo una pequeña proporción de genes de edad 0 y edad 1 tienen secuencias de ADN homólogas en las regiones sinténicas de las especies de 1 a 6 años y de 2 a 6 años, respectivamente. Dos diferentes mi Se aplicaron valores de corte (10 -2 y 10 -4) para TBLASTN, pero los resultados fueron similares. (C) La conservación de la secuencia es menor en las regiones que contienen genes de novo (prueba de Mann-Whitney, PAG value & lt2.2e-16, ScANCs versus edad 0, o ScANCs versus edad 1). Las puntuaciones de conservación en diferentes grupos de CDS se calcularon utilizando secuencias de ADN ortólogas en S. sensu stricto levaduras.

La mayoría de los genes de novo están bajo la influencia de las estructuras de los genes antiguos

La abundancia de genes de novo en el S. sensu stricto complejo nos permite analizar sus características generales. Primero investigamos cuántos de nuestros genes de novo se superponían con ScANC, ya que algunos estudios indicaron que los genes de novo tienden a superponerse con genes antiguos existentes (Knowles y McLysaght 2009 Carvunis et al. 2012 Murphy y McLysaght 2012 Neme y Tautz 2013). De hecho, una gran proporción de nuestros genes de novo se superponían con ScANC (47% en los genes de edad 0 y 79% en los genes de edad 1, fig. 4A).

La mayoría de los genes de novo están asociados con genes antiguos. (A) Una gran proporción de genes de novo se superponen con genes antiguos. Los genes antiguos (ScANC) se definen como Saccharomyces cerevisiae genes con antepasados ​​pre-WGD. (B, C) Distribución de genes de novo con posiciones relativas o distancias a las ScANC más cercanas. Todos los CDS con al menos dos transcripciones se mostraron en (B) y solo los CDS con transcripciones & gt40 se mostraban en (C). Además, consulte la figura complementaria S4, Material complementario en línea, para la distribución de genes de novo con longitudes más largas (al menos 150 o 300 nt). (D) La asociación de genes de novo con genes antiguos no se debe simplemente a la naturaleza compacta de los genomas de levadura. Se utilizaron CDS intergénicos (intCDS) para representar el origen aleatorio de los CDS en el genoma de la levadura. Se compararon las distancias al ScANC más cercano de CDS que no se solapaban con ScANC entre diferentes grupos de CDS. El resultado mostró que los genes de edad 0 y edad 1 estaban mucho más cerca de ScANC en comparación con las distancias entre intCDS y ScANC (prueba de Mann-Whitney, PAG value & lt2.2e-16) en la cadena de sentido.

La mayoría de los genes de novo están asociados con genes antiguos. (A) Una gran proporción de genes de novo se superponen con genes antiguos. Los genes antiguos (ScANC) se definen como Saccharomyces cerevisiae genes con antepasados ​​pre-WGD. (B, C) Distribución de genes de novo con posiciones relativas o distancias a las ScANC más cercanas. Todos los CDS con al menos dos transcripciones se mostraron en (B) y solo los CDS con transcripciones & gt40 se mostraban en (C). Además, consulte la figura complementaria S4, Material complementario en línea, para la distribución de genes de novo con longitudes más largas (al menos 150 o 300 nt). (D) La asociación de genes de novo con genes antiguos no se debe simplemente a la naturaleza compacta de los genomas de levadura. Se utilizaron CDS intergénicos (intCDS) para representar el origen aleatorio de los CDS en el genoma de la levadura. Se compararon las distancias al ScANC más cercano de CDS que no se solapaban con ScANC entre diferentes grupos de CDS. El resultado mostró que los genes de edad 0 y edad 1 estaban mucho más cerca de ScANC en comparación con las distancias entre intCDS y ScANC (prueba de Mann-Whitney, PAG value & lt2.2e-16) en la cadena de sentido.

Cuando se analizaron más a fondo las posiciones relativas y las direcciones de transcripción de ScANC y genes de novo, encontramos que para aquellos genes de novo que no se solapaban con ScANC, la mayoría de ellos estaban cerca de ScANC (es decir, dentro de 250 bp fig. 4B). Además, la transcripción de genes de novo y las ScANC superpuestas o más cercanas a menudo iban en la misma dirección. También realizamos los mismos análisis utilizando genes de novo que expresan al menos 40 copias de ARNm en los datos de TIF-seq o genes de novo con longitudes de CDS más largas (al menos 150 o 300 nt). Se observaron patrones similares (figura 4C y figura complementaria S4, material complementario en línea), lo que sugiere que las características observadas de genes de novo no estaban sesgadas por diferentes niveles de expresión o longitudes de genes. Es posible que la asociación de genes de novo con ScANC se deba simplemente a la naturaleza compacta de los genomas de levadura. Usamos los CDS intergénicos (intCDS) para representar el origen aleatorio de los CDS en el genoma de la levadura y probamos si también estaban estrechamente asociados con ScANC. Identificamos 34,918 intCDSs no superpuestos con longitudes de CDS & gt60 nt de regiones sinténicas y medimos su distancia al gen antiguo más cercano. Los resultados mostraron que los genes de edad 0 y edad 1 estaban mucho más cerca de ScANC en comparación con intCDS (prueba de Mann-Whitney, PAG value & lt 2.2e-16) en la cadena con sentido (fig. 4D), pero no en la cadena antisentido (PAG valor & gt 0,5).

Curiosamente, aunque las transcripciones de genes de novo pueden comenzar en sentido ascendente, interno o descendente de ScANC, la mayoría de ellas terminan cerca del sitio de terminación de sus ScANC asociados si se transcriben en la misma dirección (figura complementaria S5, Material complementario en línea). Para evitar el sesgo de los genes de baja expresión que eran más susceptibles a errores experimentales, volvimos a analizar los genes de novo que presentaban las transcripciones de & gt40 en los datos de TIF-seq. La mayoría de los genes de novo en este grupo eran de los tipos iniciados internamente y en sentido ascendente de ScANC (figura 5A y figura suplementaria S4C y tabla S2, material complementario en línea). De acuerdo con el patrón general, casi todos los tipos de genes de novo en sentido ascendente, interno y descendente terminaron cerca de los sitios de terminación de sus ScANC asociados (distancia media = 0 pb, figura 5B). La naturaleza superpuesta y los sitios de coterminación sugieren que es probable que la formación y regulación de genes de novo estén influenciadas por las estructuras de genes antiguos.

Las estructuras de transcripción de genes de novo a menudo se ven afectadas por ScANC. (A) Los genes de novo cuyas transcripciones están en la misma dirección y se superponen con la de un ScANC asociado se clasificaron además en tipos "aguas arriba", "internas" o "aguas abajo" según las posiciones relativas de sus codones de iniciación y parada con respecto a el del ScANC asociado. Las regiones más oscuras de las transcripciones corresponden a CDS. Aquí solo se muestran los genes de novo con transcripciones de & gt40 en registros de datos TIF-seq. Además, consulte las figuras complementarias S4 y S5, Material complementario en línea, para ver la distribución de todos los genes de novo y el ejemplo de diferentes tipos de genes de novo. (B) Los genes proximales de novo a menudo terminan en los mismos sitios que las ScANC asociadas. Para evitar el sesgo de los genes de baja expresión, solo se analizaron los genes con transcripciones de & gt40 en los datos de TIF-seq. TSS, sitio de inicio de la transcripción. TTS, sitio de terminación de la transcripción. (C) El tipo corriente arriba de genes de novo se expresan en niveles más altos que otros tipos (prueba de Mann-Whitney, PAG value & lt2.2e-16 para todas las comparaciones por pares).

Las estructuras de transcripción de genes de novo a menudo se ven afectadas por ScANC. (A) Los genes de novo cuyas transcripciones están en la misma dirección y se superponen con la de un ScANC asociado se clasificaron además en tipos "aguas arriba", "internas" o "aguas abajo" según las posiciones relativas de sus codones de iniciación y parada con respecto a el del ScANC asociado. Las regiones más oscuras de las transcripciones corresponden a CDS. Aquí solo se muestran los genes de novo con transcripciones de & gt40 en los registros de datos de TIF-seq. Además, consulte las figuras complementarias S4 y S5, Material complementario en línea, para ver la distribución de todos los genes de novo y el ejemplo de diferentes tipos de genes de novo. (B) Los genes proximales de novo a menudo terminan en los mismos sitios que las ScANC asociadas. Para evitar el sesgo de los genes de baja expresión, solo se analizaron los genes con transcripciones de & gt40 en los datos de TIF-seq. TSS, sitio de inicio de la transcripción. TTS, sitio de terminación de la transcripción. (C) El tipo corriente arriba de genes de novo se expresan en niveles más altos que otros tipos (prueba de Mann-Whitney, PAG value & lt2.2e-16 para todas las comparaciones por pares).

Dado que los genes con niveles de expresión más altos pueden tener una mayor probabilidad de influir en la fisiología celular, también comparamos los niveles de transcripción de diferentes tipos de genes de novo. El resultado de este análisis muestra que el tipo corriente arriba de genes de novo es más probable que se exprese en niveles altos (fig. 5C).

Los genes de Novo exhiben diferentes niveles de conservación de estructuras y secuencias en S. cerevisiae y S. paradoxus Poblaciones

Saber si los genes de novo identificados son funcionales sigue siendo un desafío. Los genes funcionales suelen mostrar signos de selección positiva o negativa. Los datos de población nos permiten evaluar el nivel de conservación de genes de novo. Analizamos las secuencias del genoma de 93 S. cerevisiae cepas recolectadas de diversas ubicaciones geográficas y nichos ecológicos (Strope et al. 2015). Dado que las estructuras de los genes de novo son bastante dinámicas entre las poblaciones (Palmieri et al. 2014 Yang et al. 2015), utilizamos varios criterios para juzgar su conservación, incluido el mantenimiento de los codones de inicio, la variación de longitud de los CDS y la divergencia de la secuencia de proteínas. (fig. 6A, consulte Materiales y métodos para obtener más detalles).

Los datos de la población revelan diferentes niveles de conservación de proteínas entre los genes de la edad 1 y los genes de la edad 0. (A) Los cambios en genes de novo que se observan comúnmente entre 93 diferentes Saccharomyces cerevisiae son. Los cambios estructurales incluyeron pérdida de codones de inicio y variación de longitud de CDS. Solo los cambios de longitud & gt15 pb se consideraron variantes verdaderas. La divergencia de secuencia se determinó mediante la identidad de secuencia de proteínas a través de alineamientos por pares. Los genes de la edad 1 están más conservados que los genes de la edad 0 en términos de estructura y secuencia. Además, consulte la figura complementaria S6, Material complementario en línea, para la comparación de genes de novo y CDS intergénicos. (B) Se aplican diferentes pruebas para detectar posibles fuerzas de selección en diferentes tipos de CDS de edad 1 entre especies y poblaciones. El tipo interno de genes de novo fue significativamente diferente de todos los demás tipos en dN / dS (prueba de Mann-Whitney, PAG valor ≤3.86e-15). Genes portadores de la edad 1 S. paradoxus Se seleccionaron ortólogos y & gt150 pb para el análisis. (C) El tipo interno de genes de edad 1 fue el menos variable en los cambios estructurales. Se analizaron diferentes tipos de genes de edad 1 para la conservación de la estructura de CDS en S. cerevisiae y S. paradoxus poblaciones.

Los datos de la población revelan diferentes niveles de conservación de proteínas entre los genes de la edad 1 y los genes de la edad 0. (A) Los cambios en genes de novo que se observan comúnmente entre 93 diferentes Saccharomyces cerevisiae son. Los cambios estructurales incluyeron pérdida de codones de inicio y variación de longitud de CDS. Solo los cambios de longitud & gt15 pb se consideraron variantes verdaderas. La divergencia de secuencia se determinó mediante la identidad de secuencia de proteínas a través de alineamientos por pares. Los genes de la edad 1 están más conservados que los genes de la edad 0 en términos de estructura y secuencia. Además, consulte la figura complementaria S6, Material complementario en línea, para la comparación de genes de novo y CDS intergénicos. (B) Se aplican diferentes pruebas para detectar posibles fuerzas de selección en diferentes tipos de CDS de edad 1 entre especies y poblaciones. El tipo interno de genes de novo fue significativamente diferente de todos los demás tipos en dN / dS (prueba de Mann-Whitney, PAG valor ≤3.86e-15). Genes portadores de la edad 1 S. paradoxus Se seleccionaron ortólogos y & gt150 pb para el análisis. (C) El tipo interno de genes de edad 1 fue el menos variable en los cambios estructurales. Se analizaron diferentes tipos de genes de edad 1 para la conservación de la estructura de CDS en S. cerevisiae y S. paradoxus poblaciones.

A pesar de que los genes de la edad 0 y la edad 1 tienen puntuaciones más bajas que los genes antiguos (figura 6A), los genes de la edad 0 son significativamente diferentes de los genes de la edad 1 para los tres criterios (prueba de Mann-Whitney, mantenimiento del codón de inicio, PAG & lt 2,2 × 10 −16 variación de longitud de CDS, PAG & lt 2,2 × 10 −16 identidad de secuencia de proteínas, PAG & lt 2,2 × 10 −16) (figura 6A). La baja conservación de los genes de edad 0 en S. cerevisiae Las poblaciones sugieren que los genes de edad 0 se encuentran todavía en una etapa temprana de formación genética. Para aquellos que no han desarrollado funciones que contribuyan a la aptitud celular, se espera que acumulen mutaciones aleatorias en las poblaciones. De hecho, se observaron niveles similares de conservación en genes de edad 0 y CDS intergénicos que es más probable que no sean funcionales (figura suplementaria S6, Material suplementario en línea).

Utilizando los datos de la población, podríamos analizar más a fondo si los diferentes tipos de genes de edad 1 estaban sujetos a diferentes fuerzas de selección. Realizamos varias pruebas (NI: prueba de índice de neutralidad, DoS: prueba de dirección de selección, MK: prueba de McDonald-Kreitman y dN / dS) para detectar signos de selección utilizando 785 genes de edad 1 que son & gt150 nt y tienen ortólogos compartidos entre 94 S. cerevisiae y 5 S. paradoxus poblaciones (consulte Materiales y métodos para obtener más detalles). Nuestros datos mostraron que el tipo no superpuesto de genes de novo tenía más probabilidades de estar bajo selección purificadora (mediana de NI = 1.098, mediana de DoS = -0.017, fig. 6B). Por el contrario, el tipo interno de genes fue significativamente diferente de otros tipos en dN / dS (prueba de Mann-Whitney, PAG valor ≤ 3.86e-15) y la mediana de dN / dS es 3.43, lo que sugiere que probablemente estaban bajo selección positiva. Dado que la estructura CDS del tipo interno fue la menos variable (fig. 6C), sugirió que los valores altos de dN / dS no se deben simplemente a cambios estructurales. Para otros tipos de genes, no se desviaron fuertemente de la neutralidad y probablemente bajo una selección débil o neutral en general.

Finalmente, utilizamos límites estrictos en dN / dS (& lt 0.5), DoS (& lt 0) y conservación estructural (& gt 95% de ScANCs más conservados) para recolectar un grupo de genes de novo que tenían más probabilidades de ser funcionales.Cincuenta y cuatro genes candidatos pasaron estos criterios y representaron buenos candidatos para ensayos funcionales adicionales (tabla complementaria S3, Material complementario en línea).

Muchos genes de novo con altos niveles de transcripción muestran evidencia de traducción de proteínas

Nuestro análisis indicó que la mayoría de los genes de novo surgieron de regiones que se superponen con genes antiguos. Sin embargo, la evidencia de proteínas para genes sobreimpresos es muy limitada (tabla complementaria S1, Material complementario en línea). Buscamos evidencia de traducción de proteínas en los genes sobreimpresos utilizando datos de perfiles de ribosomas de estudios anteriores (Ingolia et al. 2009 Brar et al. 2012). Dado que la sobreimpresión de genes de novo en nuestra lista estaba siempre en marcos diferentes de los ScANC superpuestos, examinamos si las señales de ribosoma se enriquecían en dos marcos diferentes en las regiones de sobreimpresión (ejemplos de genes total o parcialmente superpuestos que se muestran en la figura complementaria S7, Material suplementario en línea y consulte Materiales y métodos para obtener más detalles). Nuestro análisis mostró que las señales de traducción aumentaron significativamente en el marco alternativo en regiones que contienen CDS de novo (fig. 7A), lo que sugiere que muchos genes de novo sobreimpresos podrían traducirse.

Muchos genes de novo altamente expresados ​​se traducen y exhiben patrones de localización de proteínas específicos. (A) El perfil del ribosoma de los CDS de sobreimpresión indica un aumento de las señales de traducción del marco alternativo en las regiones que contienen CDS de novo. La trama con las señales de ribosoma más altas en la región específica de ScANC se define como trama 0. La otra trama con señales mejoradas en la región de sobreimpresión se asigna como trama 1. La trama restante es la trama 2. El enriquecimiento específico de la trama se analizó en CDS que están (a) totalmente superpuestos (incluido el tipo interno de genes de novo) o (b) parcialmente superpuestos (incluidos los tipos aguas arriba y aguas abajo) con ScANC. Los resultados mostraron que las señales de los ribosomas en el marco 1 se enriquecieron significativamente en las regiones que contienen CDS de novo (prueba de Mann-Whitney, ScANC + de novo frente a ScANC específico, PAG value & lt2.2e-16 y = 6.8e-16 para genes totalmente superpuestos y parcialmente superpuestos, respectivamente). No se observó enriquecimiento en el marco 2 (prueba de Mann-Whitney, ScANC + de novo frente a ScANC específico, PAG valor = 1 y = 0,98 para genes totalmente superpuestos y parcialmente superpuestos, respectivamente). En el panel derecho, el perfil de ribosoma de tres fotogramas diferentes en cada CDS estaba representado por una línea gris. Además, consulte la figura complementaria S7, Material complementario en línea, para ver ejemplos de dos genes de sobreimpresión. (B, C) Detección de proteínas de longitud completa de genes de novo mediante Western blot. Para examinar si las proteínas de longitud completa se tradujeron a partir de genes de novo, seleccionamos diferentes tipos de genes candidatos (tabla 1) que se expresaron para las transcripciones de & gt40 en los datos de TIF-seq para realizar el análisis de transferencia Western. Estos genes candidatos se fusionaron con GFP (B) o TAP (C) etiquetas y estaban bajo el control de sus propios promotores. Entre los 14 candidatos, 10 exhibieron señales de proteína de fusión detectables. La glucosa-6-fosfato deshidrogenasa (G6PDH) sirvió como control de carga. (D) Algunas proteínas de novo mostraron patrones de localización especiales. La proteína de fusión de GFP de txCDS9817 representó un patrón de localización citosólico general. Se observó que otras cinco proteínas de fusión de GFP se localizan en mitocondrias, periferia celular, ER o puntos citosólicos. Además, consulte la figura complementaria S8, Material complementario en línea, para conocer las características de las proteínas en los genes de novo.

Muchos genes de novo altamente expresados ​​se traducen y exhiben patrones de localización de proteínas específicos. (A) El perfil del ribosoma de los CDS de sobreimpresión indica un aumento de las señales de traducción del marco alternativo en las regiones que contienen CDS de novo. La trama con las señales de ribosoma más altas en la región específica de ScANC se define como trama 0. La otra trama con señales mejoradas en la región de sobreimpresión se asigna como trama 1. La trama restante es la trama 2. El enriquecimiento específico de la trama se analizó en CDS que están (a) totalmente superpuestos (incluido el tipo interno de genes de novo) o (b) parcialmente superpuesto (incluidos los tipos aguas arriba y aguas abajo) con ScANC. Los resultados mostraron que las señales de los ribosomas en el marco 1 se enriquecieron significativamente en las regiones que contienen CDS de novo (prueba de Mann-Whitney, ScANC + de novo frente a ScANC específico, PAG value & lt2.2e-16 y = 6.8e-16 para genes totalmente superpuestos y parcialmente superpuestos, respectivamente). No se observó enriquecimiento en el marco 2 (prueba de Mann-Whitney, ScANC + de novo frente a ScANC específico, PAG valor = 1 y = 0,98 para genes totalmente superpuestos y parcialmente superpuestos, respectivamente). En el panel derecho, el perfil de ribosoma de tres fotogramas diferentes en cada CDS estaba representado por una línea gris. Además, consulte la figura complementaria S7, Material complementario en línea, para ver ejemplos de dos genes de sobreimpresión. (B, C) Detección de proteínas de longitud completa de genes de novo mediante Western blot. Para examinar si las proteínas de longitud completa se tradujeron a partir de genes de novo, seleccionamos diferentes tipos de genes candidatos (tabla 1) que se expresaron para las transcripciones de & gt40 en los datos de TIF-seq para realizar el análisis de transferencia Western. Estos genes candidatos se fusionaron con GFP (B) o TAP (C) etiquetas y estaban bajo el control de sus propios promotores. Entre los 14 candidatos, 10 exhibieron señales de proteína de fusión detectables. La glucosa-6-fosfato deshidrogenasa (G6PDH) sirvió como control de carga. (D) Algunas proteínas de novo mostraron patrones de localización especiales. La proteína de fusión de GFP de txCDS9817 representó un patrón de localización citosólico general. Se observó que otras cinco proteínas de fusión de GFP se localizan en las mitocondrias, la periferia celular, el RE o los puntos citosólicos. Además, consulte la figura complementaria S8, Material complementario en línea, para conocer las características de las proteínas en los genes de novo.

Para confirmar aún más la traducción de genes de novo, examinamos experimentalmente las señales de proteínas de 14 genes de novo que presentaban al menos 40 copias de ARNm en el conjunto de datos de TIF-seq, que representa cada categoría individual de estructuras de transcripción (tabla 1). Se eligieron más genes de novo del tipo interno (siete genes) ya que este tipo de gen rara vez se informa. Se construyeron y examinaron proteínas de fusión GFP o TAP usando transferencias Western. Entre los genes elegidos, el 71% de ellos (10/14), incluidos cinco genes de novo de tipo interno, exhibieron señales detectables en condiciones normales de crecimiento (tabla 1, fig. 7B y C).

Resumen de genes de novo examinados por localización GFP u occidental.

Escribe . Nombre de CDS. Edad de los genes. Longitud del gen (nt). Tamaño previsto de la proteína de fusión (kD). Occidental . Localización de proteínas. Característica de proteínas. Conservación de la población.
Interno txCDS98171 108 G: 31.04 / T: 25.37 G / T Citoplasma Y
txCDS130731 135 G: 31,67 / T: 26,00 T Y
txCDS198111 69 G: 29,43 / T: 23,77 GRAMO Mitocondrias Y
txCDS46411 99 G: 30,67 / T: 25,01 GRAMO Mitocondrias Y
txCDS113941 81 G: 29,93 / T: 24,26 T Y
txCDS183990 108 G: 30,64 / T: 24,98 Y
txCDS154701 138 G: 31,77 / T: 26,10 TM, SP norte
Río arriba txCDS174161 225 G: 35,27 / T: 29,61 G / T Periferia celular SP Y
Río abajo txCDS196591 111 G: 30,83 / T: 25,16 G / T SP norte
Antisentido txCDS26511 108 G: 30,35 / T: 24,68 G / T ER TM norte
txCDS124141 177 G: 34,08 / T: 28,42 T norte
No superpuesto txCDS22401 192 G: 33,89 / T: 28,22 TM Y
YLR112W0 420 G: 42,63 / T: 36,97 Y
YJL118W1 660 G: 52,31 / T: 46,65 T Compuesto punteado Y
Escribe . Nombre de CDS. Edad de los genes. Longitud del gen (nt). Tamaño previsto de la proteína de fusión (kD). Occidental . Localización de proteínas. Característica de proteínas. Conservación de la población.
Interno txCDS98171 108 G: 31.04 / T: 25.37 G / T Citoplasma Y
txCDS130731 135 G: 31,67 / T: 26,00 T Y
txCDS198111 69 G: 29,43 / T: 23,77 GRAMO Mitocondrias Y
txCDS46411 99 G: 30,67 / T: 25,01 GRAMO Mitocondrias Y
txCDS113941 81 G: 29,93 / T: 24,26 T Y
txCDS183990 108 G: 30,64 / T: 24,98 Y
txCDS154701 138 G: 31,77 / T: 26,10 TM, SP norte
Río arriba txCDS174161 225 G: 35,27 / T: 29,61 G / T Periferia celular SP Y
Río abajo txCDS196591 111 G: 30,83 / T: 25,16 G / T SP norte
Antisentido txCDS26511 108 G: 30,35 / T: 24,68 G / T ER TM norte
txCDS124141 177 G: 34,08 / T: 28,42 T norte
No superpuesto txCDS22401 192 G: 33,89 / T: 28,22 TM Y
YLR112W0 420 G: 42,63 / T: 36,97 Y
YJL118W1 660 G: 52,31 / T: 46,65 T Compuesto punteado Y

Nota. — Filas en gris: genes sin evidencia de proteínas en este estudio. Tamaño previsto y occidental: G representa el tamaño / señal de GFP y T representa el tamaño / señal de TAP. Características de la proteína: TM representa el dominio transmembrana y SP representa el péptido señal. Conservación de la población: definida por la figura 6A.

Resumen de genes de novo examinados por localización GFP u occidental.

Escribe . Nombre de CDS. Edad de los genes. Longitud del gen (nt). Tamaño previsto de la proteína de fusión (kD). Occidental . Localización de proteínas. Característica de proteínas. Conservación de la población.
Interno txCDS98171 108 G: 31.04 / T: 25.37 G / T Citoplasma Y
txCDS130731 135 G: 31,67 / T: 26,00 T Y
txCDS198111 69 G: 29,43 / T: 23,77 GRAMO Mitocondrias Y
txCDS46411 99 G: 30,67 / T: 25,01 GRAMO Mitocondrias Y
txCDS113941 81 G: 29,93 / T: 24,26 T Y
txCDS183990 108 G: 30,64 / T: 24,98 Y
txCDS154701 138 G: 31,77 / T: 26,10 TM, SP norte
Río arriba txCDS174161 225 G: 35,27 / T: 29,61 G / T Periferia celular SP Y
Río abajo txCDS196591 111 G: 30,83 / T: 25,16 G / T SP norte
Antisentido txCDS26511 108 G: 30,35 / T: 24,68 G / T ER TM norte
txCDS124141 177 G: 34,08 / T: 28,42 T norte
No superpuesto txCDS22401 192 G: 33,89 / T: 28,22 TM Y
YLR112W0 420 G: 42,63 / T: 36,97 Y
YJL118W1 660 G: 52,31 / T: 46,65 T Compuesto punteado Y
Escribe . Nombre de CDS. Edad de los genes. Longitud del gen (nt). Tamaño previsto de la proteína de fusión (kD). Occidental . Localización de proteínas. Característica de proteínas. Conservación de la población.
Interno txCDS98171 108 G: 31.04 / T: 25.37 G / T Citoplasma Y
txCDS130731 135 G: 31,67 / T: 26,00 T Y
txCDS198111 69 G: 29,43 / T: 23,77 GRAMO Mitocondrias Y
txCDS46411 99 G: 30,67 / T: 25,01 GRAMO Mitocondrias Y
txCDS113941 81 G: 29,93 / T: 24,26 T Y
txCDS183990 108 G: 30,64 / T: 24,98 Y
txCDS154701 138 G: 31,77 / T: 26,10 TM, SP norte
Río arriba txCDS174161 225 G: 35,27 / T: 29,61 G / T Periferia celular SP Y
Río abajo txCDS196591 111 G: 30,83 / T: 25,16 G / T SP norte
Antisentido txCDS26511 108 G: 30,35 / T: 24,68 G / T ER TM norte
txCDS124141 177 G: 34,08 / T: 28,42 T norte
No superpuesto txCDS22401 192 G: 33,89 / T: 28,22 TM Y
YLR112W0 420 G: 42,63 / T: 36,97 Y
YJL118W1 660 G: 52,31 / T: 46,65 T Compuesto punteado Y

Nota. — Filas en gris: genes sin evidencia de proteínas en este estudio. Tamaño previsto y occidental: G representa el tamaño / señal de GFP y T representa el tamaño / señal de TAP. Características de la proteína: TM representa el dominio transmembrana y SP representa el péptido señal. Conservación de la población: definida por la figura 6A.

Integración potencial de genes de Novo en redes funcionales actuales en S. cerevisiae

Además de la evidencia de traducción, buscamos estructuras de dominio conocidas en genes de novo. Aparte del dominio transmembrana que se informó en un estudio anterior (Carvunis et al. 2012), se detectaron péptidos dirigidos a mitocondrias y péptidos señal en nuestras proteínas de novo (figura suplementaria S8, Material suplementario en línea). Curiosamente, los dominios transmembrana y los péptidos señal se encontraron en proporciones de aproximadamente la mitad de los encontrados para los genes antiguos, lo que sugiere que las proteínas recién formadas pueden generar fácilmente estas dos características.

Los genes de novo validados en nuestros experimentos de transferencia Western se examinaron más a fondo para determinar sus patrones de localización. Curiosamente, la mitad de estas proteínas de novo (5/10) exhibieron patrones de localización muy distintos (fig. 7D). Las proteínas codificadas por txCDS19811 y txCDS4641 se localizaron en las mitocondrias. Las proteínas codificadas por txCDS17416 y txCDS2651 se enriquecieron en la periferia celular y el retículo endoplásmico (ER), respectivamente. La proteína codificada por YJL118W formaron estructuras puntiformes. Estos resultados sugieren que las proteínas de novo pueden interactuar con el antiguo sistema de transporte y se mantienen de forma estable en diferentes compartimentos celulares.


Información del autor

Afiliaciones

CNRS, UMR 7232, Observatoire Océanologique, Avenue du Fontaulé, BP44, 66650, Banyuls-sur-Mer, Francia

Romain Blanc-Mathieu, Evelyne Derelle, Nigel Grimsley, Hervé Moreau y Gwenaël Piganeau

UPMC Univ Paris 06, Observatoire Océanologique, Sorbonne Universités, Avenue du Fontaulé, 66650, Banyuls-sur-Mer, Francia

Romain Blanc-Mathieu, Evelyne Derelle, François-Yves Bouget, Nigel Grimsley, Hervé Moreau y Gwenaël Piganeau

Departamento de Biotecnología Vegetal y Bioinformática, Universidad de Gante, Technologiepark 927, B-9052, Gante, Bélgica

Bram Verhelst, Stephane Rombauts y Yves Van de Peer

Departamento de Biología de Sistemas Vegetales, VIB, Technologiepark 927, B-9052, Gante, Bélgica

Bram Verhelst, Stephane Rombauts y Yves Van de Peer

CNRS, UMR 7621, Observatoire Océanologique, Avenue du Fontaulé, BP44, 66650, Banyuls-sur-Mer, Francia

Universidad de Warwick, Coventry, Reino Unido

LIRMM e Institut de Biologie Computationelle, CNRS y Universite Montpellier, 34095, Montpellier Cedex 5, Francia

Annie Château y Eric Rivals

Facultad de Ciencias de la Vida, Universidad de Sussex, Brighton, Reino Unido

UMR 7247, Centre INRA de Nouzilly, Nouzilly, Francia

Departamento de Energía de EE. UU. Instituto Conjunto del Genoma, Walnut Creek, CA, 94598, EE. UU.

Departamento de Genética, Instituto de Investigación Genómica, Universidad de Pretoria, Pretoria, Sudáfrica

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

Autor correspondiente


El cazador de genes

Louis M. Kunkel es un hombre enjuto, de mediana estatura, con mucha energía, tranquila pasión y notable persistencia. El profesor de pediatría y genética tiene muy poco interés en la publicidad, pero sin embargo se convirtió en un héroe en la década de 1980 cuando descubrió no solo un marcador para el gen de la distrofia muscular de Duchenne (DMD), sino el gen en sí y la proteína que especifica, por lo tanto. facilitando el diagnóstico de portadores y fetos afectados. Trabajando en el nexo de la investigación de laboratorio y la aplicación clínica durante sus 30 años en el Children's Hospital Boston, todavía está en contacto con pacientes con DMD y sus familias a quienes vio hace mucho tiempo. Su sufrimiento lo ha impulsado a impulsar el uso de la genética y la genómica en su búsqueda por idear métodos mejorados de diagnóstico y tratamiento. Su historia es una historia aleccionadora de cuán altas son todavía las barreras para los científicos que se esfuerzan por poner a trabajar la genómica para atacar una enfermedad genética.

La DMD, el más común y grave de los tipos de distrofia muscular de dos puntuaciones, condena a sus víctimas, casi todos los niños, a una sucesión de cirugías, así como a un curso de esteroides que no pueden hacer más que retrasar su inevitable confinamiento en un hospital. silla de ruedas alrededor de los 10 años. Mueren a los 20 o 30 años cuando les fallan el corazón y los músculos respiratorios. Un tercio de las víctimas también experimenta retraso mental. Una tragedia adicional es que la enfermedad surge solo gradualmente, y se hace evidente a la edad de cuatro o cinco años cuando un niño tiene problemas para levantarse o correr. Como Kunkel le dijo en voz baja a un grupo de periodistas visitantes en 1998, “La mayoría de las familias de Duchenne están desesperadas. Es muy triste interactuar con ellos. Vi a un niño a los cinco. Ahora tiene 19 años, está en silla de ruedas y necesita un respirador. Participé en un beneficio para su familia. Es inusual que un laboratorio de investigación básica interactúe con los pacientes. Pone todo en perspectiva. Agrega una dimensión distinta a la curiosidad intelectual ”.

A pesar de esa pasión, la búsqueda de Kunkel de una cura para la DMD subraya cuán desafiante sigue siendo la gran promesa de la genómica (poner al descubierto las causas de la enfermedad y descubrir remedios) 10 años después de que se redactaron las primeras secuencias del genoma humano. Su trabajo también ilustra la determinación de un número cada vez mayor de investigadores en todo el mundo de intensificar, no aflojar, la búsqueda de la terapia y la prevención basadas en el genoma. Los biólogos que trabajan con esos datos buscan las causas moleculares, no solo los síntomas, de enfermedades raras y comunes, con el fin de producir métodos específicos para combatir las enfermedades de las personas.

Pero a pesar de los enormes avances en la comprensión de las funciones de muchos de los 20.000 genes humanos, los investigadores están descubriendo que las causas genéticas subyacentes de una sola enfermedad pueden estar no solo en simples sustituciones de subunidades de ADN, sino también en deleciones, inserciones, reversiones, etc. y variaciones en el número de copias de secuencias repetidas. Están aprendiendo que diversas vías bioquímicas en la célula viva pueden conducir al mismo resultado. Se enfrentan a la paradoja de que la multiplicidad de causas puede complicar la comprensión de una enfermedad y, sin embargo, puede abrir más oportunidades para controlarla o prevenirla.

La desconcertante variedad de anomalías genéticas que pueden dañar un sistema biológico significa que la comprensión de la enfermedad desde una perspectiva genética requerirá que los científicos secuencien los genomas de un gran número de pacientes individuales, y luego agreguen, almacenen y vinculen esos datos a historias clínicas individuales en un escala masiva. Como se han dado cuenta Kunkel y muchos otros, este paradigma de investigación plantea preocupaciones éticas contrapuestas sobre la privacidad y los derechos de los pacientes a saber si tienen una predisposición a una enfermedad. El momento de resolver estos grandes problemas está más cerca de lo que la mayoría de la gente cree.

Cuando Kunkel comenzó a buscar genes relacionados con enfermedades a principios de la década de 1980, se centró en una de las miles de enfermedades raras relacionadas con mutaciones en genes individuales, no enfermedades comunes como el cáncer o la diabetes. Pero la convicción entre los científicos y el público por igual de que la genética representa una gran parte del riesgo de enfermedades humanas ya era común. Las pruebas prenatales, comenzando con enfermedades como el síndrome de Down y Tay-Sachs, comenzaron a extenderse en la década de 1970 y se intensificaron en la década de 1980 después del aislamiento de genes relacionados con la corea de Huntington, la fibrosis quística, el cáncer de mama y cientos de otras afecciones, incluida la enfermedad de Kunkel. objetivo: DMD. Todo esto sucedía apenas una década después de que la ciencia biológica aprendiera a aislar genes, a transferirlos de un organismo a otro con fines industriales y de investigación, y a detallar las subunidades del código de vida incrustadas en el ADN. Hablando con un grupo de reporteros en 1989, Kunkel dijo que la medicina hasta ese momento tenía que enfocarse en las enfermedades causadas por factores que invaden el exterior, y apenas comenzaba a comprender las enfermedades hereditarias y los cánceres que surgen dentro de nosotros.

Kunkel, de hecho, es uno de los investigadores cuyo éxito en la búsqueda de genes relacionados con enfermedades ayudó a cristalizar la idea de un Proyecto del Genoma Humano, el impulso internacional para explicar todas las subunidades del ADN humano. Este mayor de los esfuerzos enfocados en la historia de la biología ha producido una explosión intelectual llena de sorpresas, como una miríada de controles genéticos recién descubiertos en el genoma mismo y las proteínas que lo envuelven. Los avances tecnológicos que lo acompañan ya están permitiendo a los investigadores tomar muestras de la herencia genética de miles de personas y leer completamente el ADN de cientos de personas, no solo para precisar más causas de enfermedades, sino también para comenzar a orientar las decisiones terapéuticas en la clínica. El pasado octubre, Naturaleza publicó una encuesta de 93 importantes centros genómicos de todo el mundo que utilizan, en total, unos 1.250 de una nueva generación de máquinas de secuenciación ultrarrápidas. La revista calculó que 2.700 secuencias humanas estarían completas para fines de ese mes y 30.000 para fines de 2011. No obstante, hay mucha impaciencia con el surgimiento dolorosamente lento de aplicaciones médicas basadas en la genómica, lo que genera críticas que toda la empresa ha sido promocionado.

En 1986, después de que Kunkel y tres de sus colegas de Children clonaron el gen de la DMD, inmediatamente siguieron adelante en una búsqueda de un año del producto del gen, una proteína a la que llamaron distrofina. La mutación que conduce a la DMD impide la fabricación de esta molécula, un miembro crucial de un complejo de moléculas que repara los músculos después del estrés de las contracciones frecuentes. Sin distrofina, los músculos se desgarran y desgastan prematuramente a medida que se flexionan y no pueden regenerarse, lo que deja a los pacientes con DMD prácticamente sin músculo al final de sus cortas vidas.

Como descubrió el grupo de Kunkel, la distrofina, como todas las decenas de miles de proteínas del cuerpo, incluidas las involucradas en cientos de trastornos genéticos, se compone de su propia combinación única de 20 tipos de moléculas pequeñas llamadas aminoácidos.

Estos aminoácidos están organizados en orden de acuerdo con el código genético del ADN, que a su vez se explica por las cuatro "bases" llamadas adenina, timina, guanina y citosina (A, T, G y C) que se encadenan en ángulos rectos. a las hebras gemelas de azúcar-fosfato de la doble hélice del ADN. Los trillizos compuestos de estas cuatro bases individuales forman palabras de código, o "codones", cada uno de los cuales significa que un aminoácido particular se instalará en ese punto de la proteína en forma de cadena. También hay codones para comenzar y detener, como la letra mayúscula al comienzo de una oración o un punto al final. La cadena de codones de ADN que deletrea una proteína en particular se copia en un "mensajero" (hecho del ARN químico relacionado) que se mueve desde el núcleo de una célula a las plataformas de ensamblaje de proteínas globulares llamadas ribosomas.

La distrofina, compuesta por unos 3.800 aminoácidos, es un blanco cruelmente fácil para las mutaciones genéticas. Su secuencia de ADN está codificada por 79 tramos separados, llamados exones, que se encuentran dispersos a lo largo de dos millones y medio de los tres mil millones de "letras" del ADN. En pacientes con DMD, una mutación sumando o restando solo uno La letra de ADN cambia el "marco de lectura" para que el resto del mensaje se convierta en un galimatías.

Debido a que la distrofina es una puerta de granero de un objetivo genético, siguen surgiendo nuevos tipos de mutaciones. En la década de 1980, un tercio de los aproximadamente 600 niños que nacían con DMD en los Estados Unidos cada año eran víctimas de un cambio genético "esporádico" que surgía en sus madres. En los casos restantes, la madre había heredado el defecto de ella madre. Se estima que una mujer de cada 5.000 es portadora, pero muchas aún no lo saben. Los futuros padres a menudo carecen de un historial médico familiar que pueda alertarlos para que se hagan una prueba a ellos mismos o al feto. Cuando a un niño se le diagnostica DMD, el triste deber del médico es informar a los padres sobre el curso esperado de una enfermedad sin cura. (Kunkel recuerda que una madre trajo a su hijo afectado de cuatro años a la clínica de Children's, con un hijo más joven que aún no había sido diagnosticado).

La búsqueda de una cura por parte de Kunkel y sus colegas, en rivalidad y cooperación con grupos científicos de todo el mundo, se centró en encontrar una forma de suministrar la proteína faltante. ¿Pero cómo? La inyección de la forma normal no puede funcionar porque la distrofina es tan grande que no puede penetrar las paredes de las células musculares. También se han probado varias formas de transferencia celular o terapia génica y todas han fracasado. Como ocurre con muchas enfermedades hereditarias raras pero catastróficas, la búsqueda ha sido urgente, pero ha resultado larga y frustrante.

A principios de la década de 1980, el grupo de Kunkel se había enfrentado a predicciones casi universales de que sería imposible mapear el cromosoma X, que ya se sabe que es el sitio del defecto genético implicado en la DMD. Las técnicas moleculares anticuadas para el mapeo de genes eran engorrosas y largas. El ADN extraído de las células se manipuló y midió directamente, y todos los datos se introdujeron en computadoras a mano. Para localizar el sitio específico (que resultó estar en el brazo corto del cromosoma), comenzaron a "caminar" en ambas direcciones a lo largo de las hebras de ADN, comparando constantemente cada tramo con el área correspondiente de ADN normal para encontrar secciones faltantes. Después de tres años, los primeros frutos fueron "marcadores" cerca de la secuencia culpable. Tres años más tarde, se encontró el gen en sí.

En los últimos 30 años, las formas de Kunkel de descubrir las contribuciones genéticas a las enfermedades han cambiado drásticamente, de un mundo "húmedo" de manipulación de muestras de ADN a uno en gran parte "seco" de instrumentos automatizados, computadoras y software elaborado. Estos avances tecnológicos, sin duda, han ayudado a acercar la línea de meta en la carrera por las soluciones. Pero el volumen cada vez mayor de datos electrónicos está creando enormes desafíos de interpretación.

Kunkel admite que nunca esperó que tomaran tanto tiempo para que surgieran las terapias. Sin embargo, él y muchos otros en la academia y la industria farmacéutica siguen así. Hoy en día, prestan mucha atención a la propia maquinaria genética que ha fallado. Utilizando una forma de terapia génica que Kunkel llama "corrección genética", esperan engañar a la maquinaria de síntesis de proteínas de las células musculares para que creen al menos una forma truncada de distrofina. En un enfoque actual, los investigadores agregan sustancias químicas especiales a medida que una enzima copia el ADN en instrucciones del ARN mensajero para hacer que la proteína que induce a la enzima copiadora salte una cantidad suficiente de los 79 exones de distrofina para restaurar el marco de lectura correcto del resto. La distrofina acortada resultante, idealmente, modificaría la gravedad de la enfermedad del paciente de la variante de Duchenne a otra, llamada Becker, que permite una vida más larga y menos dolorosa. (Las víctimas de Becker nacen con proteínas de distrofina acortadas).

Otros enfoques considerados prometedores son el uso de sustancias químicas para obligar al ADN a "leer" un codón de parada prematuro, de modo que produzca una proteína más completa, y un esfuerzo por impulsar la producción natural del cuerpo de una proteína relacionada, la utrofina, que podría hacer al menos parte del trabajo de la distrofina. Varios de estos métodos han entrado en ensayos clínicos en los Estados Unidos y en otros lugares.

Recientemente, el laboratorio de Kunkel se ha centrado en otro frente importante en la búsqueda de curas o paliativos para la DMD. Esto implica ampliar el número de "organismos modelo" de laboratorio adecuados, en los que se pueden probar posibles tratamientos para la distrofia muscular, más allá de los ratones modificados genéticamente. Él y sus colegas, incluidos Jeffrey R. Guyon y Genri Kawahara, estaban emocionados al descubrir que una forma de distrofia muscular ocurre en uno de los organismos más utilizados en la biología del desarrollo: el prolífico pez cebra de corta vida, cuyos embriones transparentes ofrecen vistas claras de los efectos de las mutaciones en el músculo. Con el fin de revertir el trastorno del pez cebra, el laboratorio de Kunkel está probando una biblioteca de unos 4.000 medicamentos estudiados de cerca pero obsoletos o archivados y ya ha encontrado varios que parecen prometedores.

Mientras tanto, aunque el progreso en la búsqueda de un tratamiento Para la DMD ha sido lento, un área se ha beneficiado enormemente: el proceso de localizar y secuenciar los genes y sus proteínas ha tenido un efecto rápido, dramático y creciente en la calidad de diagnóstico.

En medicina, donde el diagnóstico tiende a anteponerse a la cura, la identificación de un gen y su proteína abre opciones hasta ahora no disponibles. Una mujer que es portadora de DMD, señala Kunkel, puede haber visto morir a su hermano a causa de la enfermedad. Ahora puede hacerse una prueba en el útero y, si el feto masculino es normal, llevarlo a término. La fertilización in vitro, incluido el diagnóstico genético antes de la implantación de un óvulo, está cada vez más disponible. El conocimiento genético también ha hecho que el diagnóstico sea menos doloroso y riesgoso: las biopsias musculares de recién nacidos y niños pequeños pueden reemplazarse por simples estudios de ADN. Este progreso ha llevado a un fuerte aumento en la proporción de mujeres estadounidenses que saben que son portadoras del defecto crítico de la DMD. Como consecuencia, el frecuente "esporádico", de novo las mutaciones involucradas en la DMD ahora representan más de la mitad de los nacidos vivos de las víctimas, en comparación con un tercio de hace un cuarto de siglo.

El diagnóstico genético ha sido impulsado por nuevas herramientas para explorar la herencia hereditaria del cuerpo. Uno de ellos es el "chip de ADN" (un pequeño rectángulo de vidrio con una amplia gama de pozos microscópicos, un "microarray", que contiene muestras de ADN que pueden analizar las variaciones en el genoma de un individuo en un millón de puntos por un costo de unos pocos cientos de dólares. ). Otro es la máquina de secuenciación de ADN. Las computadoras y el software que lo acompañan han ido aumentando en velocidad y precisión a un ritmo vertiginoso, reduciendo rápidamente el costo de hacer una secuencia completa del genoma de una persona. Hace menos de una década era del orden de $ 100 millones o más. (La primera secuencia completa de un individuo nombrado, el co-descubridor del ADN James Watson, le costó a 454 Life Sciences, con sede en Connecticut, y a su socio, el centro del genoma del Baylor College of Medicine, aproximadamente 1 millón de dólares en 2007.) A un ritmo aún más rápido que en la electrónica, varias generaciones de nuevas tecnologías en competencia han reducido el precio original en cuatro órdenes de magnitud a $ 10,000, y se espera un recorte adicional a $ 1,000 dentro de un par de años. (En 2010, Illumina, con sede en San Diego, redujo su cargo de $ 48,000 a $ 19,500 para una persona, $ 13,500 por persona para un grupo de cinco y $ 9,500 cuando lo receta un médico). Varios centros académicos también han comenzado a usar un atajo: secuenciación sólo el ADN del “exoma” que codifica las proteínas, a un costo de aproximadamente la mitad del de una secuencia completa, para encontrar el cambio genético exacto que causa una enfermedad. Pronto, el costo de secuenciar los completo El genoma probablemente igualará el precio que ahora se paga para probar un soltero defecto genético, que promete mayores avances al por mayor en la escala del análisis genómico.

Estos rápidos desarrollos han convencido a Isaac S. (Zak) Kohane, un colega de Kunkel en Children's y director de la Biblioteca Countway en la Facultad de Medicina de Harvard, y a sus compañeros de trabajo de que la medicina está entrando en un mundo en el que decenas de miles, incluso millones, de los pacientes es probable que se conviertan en participantes de la investigación genética a largo plazo. Esta tendencia intensifica las preocupaciones que primero preocuparon a Kohane en la década de 1980, cuando simultáneamente estaba cursando un doctorado en la Universidad de Boston y trabajando para obtener un doctorado en el MIT en inteligencia artificial en relación con la toma de decisiones médicas. Se convenció de que los datos médicos del paciente de todos los proveedores de atención deben estar no solo centralizados y fácilmente disponibles para el paciente, sino también fácilmente accesibles para la investigación y el tratamiento, incluso si se respeta la privacidad del paciente.

En un mundo médico con millones de pacientes que participan en la investigación genética, los objetivos principales de años y décadas de estudio cooperativo serían ajustar los tratamientos a las características heredadas de las personas, para realizar un seguimiento de si las personas realmente contraen una enfermedad a la que están predispuestos, y desentrañar la verdadera mezcla de influencias genéticas y ambientales sobre la enfermedad. En contraste con la práctica habitual en los estudios genéticos actuales, los participantes podrían recuperar sus datos personales si así lo quisieran y recibir asesoramiento genético. El objetivo es un nuevo trato entre voluntarios e investigadores genéticos. Kohane y sus colegas sienten que este nuevo acuerdo es imperativo y técnicamente alcanzable.si investigadores y médicos reconocerán que los participantes están capaz de procesar información médica compleja.

Kunkel, quien se desempeña como asesor principal de la Muscular Dystrophy Association, un grupo de defensa de pacientes de EE. UU. Con un presupuesto anual de $ 160 millones, y también dirige el programa de genómica en Children's, ha sido un firme defensor de ese modelo de paciente-participante. Now Children's ha creado la Asociación Genética, en la que los participantes podrán ver sus resultados si lo desean. El programa comenzó a inscribir participantes la primavera pasada, comenzando con el propio departamento de medicina del desarrollo del hospital, y para fines del otoño había reclutado a unos 650 voluntarios. La aspiración, dice Kunkel, es registrar un total de 10,000 en "uno o dos años".

Un objetivo principal de Gene Partnership es concentrarse en las mutaciones reales que contribuyen a la enfermedad. Pero para reunir el poder estadístico necesario para detectar estas agujas en un pajar, Kunkel, Kohane y sus colegas saben que necesitan persuadir a un gran número de pacientes para que se inscriban en estudios similares. Los investigadores de todo el mundo deberán poder compartir ampliamente esos datos, comparando los antecedentes médicos de los pacientes con sus perfiles genéticos y, al mismo tiempo, reconocer las preocupaciones de Kohane: el almacenamiento de grandes cantidades de información biológica íntima, la clave de este nuevo tipo de medicina, en Turn plantea nuevos dilemas éticos.

El equipo de Gene Partnership prevé que cuando un gran número de personas aprenda más sobre sus riesgos de contraer enfermedades específicas y su sensibilidad a los medicamentos, es probable que entablen nuevos tipos de conversaciones con sus cuidadores médicos. Una cuestión importante será si los resultados de las pruebas genéticas ofrecen falsas alarmas u ocultan problemas reales. Este problema se agudizó para Kunkel cuando un estudio sobre el autismo que él y Kohane estaban realizando pareció mostrar que dos de los niños participantes tenían una mutación asociada con la leucemia. Kohane recuerda haber perdido “dos noches de sueño” sobre si decírselo o no a los padres. Aunque volver a probar los datos reveló que el aparente vínculo con la leucemia resultó de un artefacto experimental, Kohane, Kunkel y sus compañeros de trabajo comenzaron a pensar en los detalles prácticos de un sistema que transmitiría información de riesgo a los pacientes-participantes mientras se mantenía la privacidad.

El grupo ha planteado estos problemas repetidamente en forma impresa. Un artículo de 2007 en Ciencias, en particular, abogó por “restablecer el pacto entre investigador y paciente” defendiendo lo que se ha convertido en la Asociación Genética. Prevían que los pacientes añadieran muestras e información como quisieran, o que se retiraran de la cohorte si así lo deseaban. Los pacientes recibirían sus propios registros médicos (como ya ocurre en algunos centros de salud, incluidos los operados por la Administración de Veteranos). Los pacientes-participantes controlarían cuándo fueron contactados eligiendo cuándo “sintonizar” las alertas sobre los descubrimientos y su impacto clínico potencial. Estas "transmisiones" dirigidas a los sujetos anónimos de la Asociación Genética incorporarían características cuidadosamente descritas que los destinatarios reconocerían. Las alertas también pueden incluir solicitudes de los investigadores de información adicional o muestras. Para que el plan funcione, admiten Kohane y los demás, sería necesario abordar los problemas de baja "alfabetización en salud", falta de acceso a Internet y elaborar principios sobre qué decir a los participantes y cuándo.

Estos planes están tomando forma en medio de mucho escepticismo sobre la medicina personalizada. Los críticos preguntan intencionadamente si las lecturas de los genomas de las personas (las primeras versiones comerciales ya están disponibles) son realmente útiles desde el punto de vista médico. Las enfermedades comunes están relacionadas con varios, incluso muchos, genes que interactúan, y con una complicada batería de controles que apenas están comenzando a estudiarse. Las funciones que especifican muchos genes aún no están claras. En los últimos cinco años, a través de "estudios de asociación de todo el genoma", los investigadores que utilizan chips de ADN han descubierto varios cientos de factores genéticos relacionados con enfermedades comunes, pero la mayoría de estos agregan solo un pequeño porcentaje al riesgo de una persona de una enfermedad en particular, y la mayoría son solo vecinos de los verdaderos sospechosos. La atención se centra en la idea de que los verdaderos villanos son mutaciones raras pero "penetrantes", todavía en gran parte desapercibidas, que requieren un "microscopio" más potente que el que proporcionan los chips. Por lo tanto, la secuenciación completa de la totalidad o parte de los genomas de muchos pacientes individuales, a precios cercanos a los de una tomografía computarizada, parece cada vez más atractiva, aunque comprender el impacto total del genoma en la salud se encuentra en el futuro.

A pesar de la lenta implementación del tratamiento basado en genes en entornos clínicos, una firme creencia en la medicina genómica sigue impulsando la investigación de secuenciación tanto privada como pública. La principal incógnita sigue siendo simplemente cuando Se producirán cambios a gran escala en la atención médica.. Por supuesto, este fue también el caso cuando se descubrió el organismo responsable de la tuberculosis en 1882, 40 años antes de que se desarrollara una vacuna compensatoria y 60 años antes de que se desarrollara una droga compensatoria.

El impulso hacia las aplicaciones médicas parece difícil hoy no solo por las complejidades biológicas de las enfermedades, sino también por la estructura y regulación de la industria farmacéutica. El producto farmacéutico preferido es un fármaco “superventas” que puede ser utilizado por millones, un mercado lo suficientemente grande como para sufragar las grandes inversiones de tiempo y dinero necesarias para desarrollar fármacos y llevarlos a cabo mediante complejas pruebas de seguridad y eficacia en animales y luego en seres humanos. Las enfermedades raras como la DMD no son rentables bajo este régimen.

Pero este cálculo puede ser anulado algún día, la investigación en genómica indica cada vez más que existe una influencia genética en la eficacia de varios medicamentos, desde los que se utilizan para la quimioterapia contra el cáncer hasta los anticoagulantes como Plavix. La tendencia hacia lo que se llama "estratificación genética", un tema de creciente interés para la Administración de Drogas y Alimentos de los Estados Unidos, va en contra de los éxitos de taquilla, apuntando en cambio a un mercado mucho más fragmentado en el que los medicamentos se adaptan a las características genéticas de los subgrupos. En el tratamiento del cáncer, por ejemplo, las compañías de seguros pueden ver cada vez más el sentido de las pruebas genéticas si un régimen de medicamentos de $ 50,000 al año funciona solo en un subconjunto de la población de pacientes. Dos importantes centros de tratamiento del cáncer, el Hospital General de Massachusetts y Sloan-Kettering en Nueva York, ya han comenzado a implementar planes para extender gradualmente las pruebas genéticas a todos sus pacientes con cáncer, y la secuenciación parcial o completa del genoma de una persona puede convertirse eventualmente en el estándar de oro para atencion al paciente.

La base genética de la mayoría de las enfermedades aún no se conoce por completo, pero el tamiz más fino de la secuenciación del genoma completo ya es útil para diagnosticar y abordar afecciones, como la DMD, que involucran cambios genéticos raros pero significativos. Es por eso que la empresa genómica global se está disparando en números, dólares, sitios de investigación y compromiso comercial. Mirando hacia atrás en su carrera, Kunkel dice simplemente: “La promesa estaba ahí. Nunca dije que sería fácil ".

Victor K. McElheny ’57, NF ’63, es el autor del recientemente publicado Dibujar el mapa de la vida: dentro del proyecto del genoma humano (Libros básicos).