Información

¿Qué es la aleatorización mendeliana y cómo se utiliza para inferir la causalidad en epidemiología?

¿Qué es la aleatorización mendeliana y cómo se utiliza para inferir la causalidad en epidemiología?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Los estudios de las características y enfermedades humanas están intrínsecamente confinados a los estudios observacionales, conocidos como estudios epidemiológicos. Esto puede hacer que sea muy difícil determinar qué causa realmente una enfermedad o rasgo en particular, y qué es solo un subproducto o biomarcador de la enfermedad.

Aleatorización mendeliana es una técnica estadística utilizada por epidemiólogos genéticos para determinar causal efectos, por ejemplo, si un biomarcador influye realmente en el riesgo de enfermedad, o si es solo una asociación estadística.

Desde lo básico, ¿cómo se puede utilizar la genética para determinar asociaciones causales entre rasgos (como marcadores sanguíneos) y un mayor riesgo de enfermedad, y en qué suposiciones se basa esto?


Los estudios epidemiológicos analizan datos de cohortes observacionales en humanos para tratar de vincular estadísticamente el riesgo de enfermedad y los biomarcadores. Por ejemplo, es un hecho bien conocido que fumar aumenta el riesgo de cáncer de pulmón, sin embargo, antes de la década de 1950, se consideraba ampliamente lo contrario hasta que la evidencia observacional resultó irrefutable (Levin, 1950).

Confuso

Sin embargo, inferir la causalidad utilizando datos de observación puede ser complicado. Por ejemplo, existe una asociación estadística muy fuerte entre las ventas de helados y el riesgo de ahogamiento en el Reino Unido. En este ejemplo, está bastante claro que la asociación es aturdido - es decir, hay una variable 'oculta' que no hemos tenido en cuenta que vincula el 2. Es fácil inferir que la venta de helados no aumenta el riesgo de ahogamiento, pero los 2 están correlacionados porque ambos las ventas y el riesgo de ahogamiento aumentan en la misma época del año; ambos se correlacionan positivamente con los rasgos de "buen tiempo".

En el ejemplo anterior, es fácil decir que la relación se confunde. Sin embargo, en un estudio hipotético sobre diabetes tipo 2 que encuentra que un mayor hematocrito en sangre (% del volumen de sangre compuesto por glóbulos rojos) se asocia con mayores probabilidades de ser diabético, es menos claro si un mayor hematocrito aumenta la susceptibilidad / riesgo de padecer diabetes. diabético, o si la diabetes aumenta el hematocrito. Los estudios longitudinales que siguen a los mismos individuos durante muchos años ayudan a determinar Cuál vino primero - esto se basa en la suposición de que si el hematocrito elevado se asocia con un mayor riesgo de diabetes 5 años después, es más probable que el hematocrito se causal, y tiene un biomarcador de riesgo de diabetes (aunque todavía no puede decir que es causal, puede ser solo un indicador de otro rasgo 'oculto', o el efecto puede ser mediado por otro marcador no medido).

Causalidad

Los estudios de asociación de todo el genoma (GWA) se han vuelto cada vez más populares desde la finalización del proyecto del genoma humano, y actualmente (15 de agosto de 2012) hay 7039 variantes genéticas (SNP, polimorfismos de un solo nucleótido) documentadas en el catálogo de estudios publicados de GWA ( www.genome.gov/gwastudies). Estos SNP se han asociado sólidamente con rasgos como el 'riesgo de diabetes tipo 2' o los 'niveles de adiponectina en sangre', mediante grandes estudios epidemiológicos genéticos, generalmente con muchos miles de participantes muestreados.

El punto clave sobre las asociaciones de SNP es que siempre se conoce la dirección del efecto; un SNP en particular puede afectar sus niveles de adiponectina, pero la adiponectina no afecta los SNP que hereda.

Aleatorización mendeliana

En un estudio observacional que encuentra una asociación entre (por ejemplo) los niveles circulantes de triglicéridos y la diabetes tipo 2 (usando glucosa e insulina en ayunas como 'sustitutos') no es posible determinar la dirección causal; ¿Los triglicéridos aumentan el riesgo de diabetes o viceversa? (Este es un estudio de caso real de De Silva, et al. 2011).

Partiendo del supuesto de que la herencia de los SNP es esencialmente aleatoria (es decir, no se ve afectada por el rasgo que está midiendo, en este ejemplo, los triglicéridos), es posible determinar el efecto causal de los triglicéridos sobre el riesgo de diabetes. Nota: esto solo es posible para rasgos (como los niveles de triglicéridos en suero) que tienen SNP identificados por estudios de GWA.

En primer lugar, ya ha calculado la asociación entre los niveles de triglicéridos (en este estudio se asoció un aumento de 1 desviación estándar (DE) en los triglicéridos, con un Odds Ratio (OR) de 2.68, con diabetes tipo 2 en casi 10,000 Participantes). Por ser un estudio transversal, solo se reporta una asociación, sin implicaciones causales… ¡todavía!

Ingrese los SNP

Habiendo identificado los SNP que aumentan los niveles de triglicéridos (en el momento del estudio, se informaron 10 en la literatura), es necesario medir o inferir el genotipo de cada participante para estos SNP (generalmente esto se realiza en grandes estudios de cohortes, que luego se utilizan para muchos proyectos individuales diferentes).

A continuación, se obtiene una "puntuación" combinada para cada individuo. Esto es conceptualmente muy simple; si un individuo tiene 4 de los 10 alelos que elevan los triglicéridos, se le asigna una puntuación de 4, y así sucesivamente. Esto se complica por el hecho de que los SNP tienen diferentes efectos sobre los triglicéridos, por lo que en su lugar se deriva una 'puntuación de alelos ponderada' (en pocas palabras, el coeficiente de la asociación SNP ~ triglicéridos se tiene en cuenta al agregar puntuaciones de alelos de riesgo). Al utilizar este tipo de puntuación, se puede estimar una estimación "por alelo" de los efectos;

A continuación, se determina la asociación entre los niveles de triglicéridos y la puntuación del alelo (mediante análisis de regresión lineal, ajustado por edad y sexo, ya que se sabe que afectan a los triglicéridos). En realidad, hay 2 formas de realizar el siguiente análisis, la primera de las cuales es conceptualmente más simple, pero la segunda es más sólida.

Método 1: el enfoque de la 'triangulación'

Las dos asociaciones observadas calculadas hasta ahora (los niveles trigonométricos por DE están asociados con la diabetes y la puntuación de SNP por alelo está asociada con los niveles de triglicéridos por DE) se pueden usar para calcular un esperado asociación. Esto se obtiene simplemente multiplicando los 2 coeficientes. A continuación se muestra la representación de 'triangulación' de esto;

Esta esperado La asociación entre los SNP que aumentan los triglicéridos y el riesgo de diabetes solo es cierta si los triglicéridos elevados aumentan el riesgo de diabetes. los observado Entonces se puede calcular la asociación entre la puntuación SNP y la diabetes. Si las estimaciones esperadas y observadas son similares, los triglicéridos aumentan el riesgo de diabetes y son un biomarcador causal. Si la asociación observada es nula (o, al menos, mucho más pequeña), es probable que los triglicéridos sean secundarios.

Método 2: el análisis de variables instrumentales

Este método es para los estadísticos más resistentes. Las variables instrumentales son variables derivadas y representan un intermedio entre una 'causa' propuesta y el 'efecto' o resultado (en este caso, se propone que los alelos que elevan los triglicéridos 'causan' diabetes, y esto está mediado por los propios niveles de triglicéridos) .

Mediante una regresión lineal, se extraen los "valores ajustados" de un modelo con niveles de triglicéridos como resultado y la puntuación SNP ponderada como única variable independiente. Estos valores ajustados representan la varianza en los triglicéridos que predice la puntuación SNP. Estamos utilizando los SNP como instrumento aquí, ya que influyen directamente en el biomarcador (exposición, es decir, triglicéridos) y no se ven afectados ni por la exposición ni por el resultado (diabetes). La suposición importante aquí es que el efecto de los SNP en el resultado no se confunde y solo puede ser mediado por la exposición; esto es cierto para los genotipos (Lawlor, et al. 2008).

Luego, al determinar la asociación entre la variable derivada y la diabetes, sabrá si la proporción de la variación de triglicéridos predicha por los SNP está asociada con la diabetes; de ser así, los triglicéridos aumentan el riesgo de diabetes.

Resultados

El estudio realizó ambos tipos de análisis de aleatorización mendeliana y no encontró evidencia que sugiera una asociación causal entre los triglicéridos y los fenotipos de diabetes.

Por tanto, la aleatorización mendeliana es una herramienta útil para inferir la causalidad con biomarcadores. No es necesariamente una evidencia concluyente, pero puede ayudar a distinguir los biomarcadores de particular importancia e interés (con respecto a las intervenciones) de aquellos que son solo marcadores de la enfermedad.


El uso de la aleatorización mendeliana para identificar los factores de riesgo de cáncer causales: promesas y limitaciones.

El uso de análisis observacionales, como los estudios epidemiológicos clásicos o los ensayos controlados aleatorios (ECA), para inferir la causalidad del cáncer puede ser problemático debido tanto a razones éticas como a cuestiones técnicas, como las variables de confusión y la causalidad inversa. La aleatorización mendeliana (MR) es una técnica epidemiológica que utiliza variantes genéticas como sustitutos de las exposiciones en un intento de determinar si existe un vínculo causal entre una exposición y un resultado. Dado que las variantes genéticas se asignan aleatoriamente durante la meiosis de acuerdo con la primera y segunda leyes de heredabilidad de Mendel, la RM puede considerarse como un ECA "natural" y, por lo tanto, es menos vulnerable a los problemas antes mencionados. La RM tiene el potencial de ayudar a identificar nuevos, y validar o refutar factores de riesgo modificables previamente implicados en el cáncer, pero no está exento de limitaciones. Esta revisión proporciona una breve descripción de la historia y los principios de la RM, así como una guía para la metodología básica de la RM. Luego, la mayor parte de la revisión examina varias limitaciones de la RM con más detalle, discutiendo algunas de las soluciones propuestas a estos problemas. La revisión finaliza con una breve sección que detalla la implementación práctica de la RM, con ejemplos de su uso en el estudio del cáncer y una evaluación de su utilidad para identificar los rasgos de predisposición al cáncer. © 2020 Los Autores. El Journal of Pathology publicado por John Wiley & amp Sons Ltd en nombre de la Sociedad de Patología de Gran Bretaña e Irlanda.


¿Por qué es importante la inferencia causal?

La enfermedad psiquiátrica presenta un problema de salud pública mundial, y una de cada cuatro personas experimenta una enfermedad mental en su vida [1]. Para reducir esta carga global de enfermedades mentales, la prevención es clave. Actualmente, las estrategias de prevención sólidas son limitadas y, por lo tanto, necesitamos identificar nuevos factores de riesgo modificables que puedan convertirse en intervenciones exitosas. Un requisito previo para una intervención eficaz es una relación causal entre el factor de riesgo modificado y el riesgo de enfermedad mental [2]. Aunque no garantiza el éxito de la intervención, establecer la causalidad es un primer paso importante.


¿De qué supuestos depende la aleatorización mendeliana?

Las variables instrumentales válidas se definen mediante tres supuestos clave (tabla 1, figura 1): que se asocian con el factor de riesgo de interés (el supuesto de relevancia) que no comparten una causa común con el resultado (el supuesto de independencia) y que no lo hacen. afectar el resultado excepto a través del factor de riesgo (el supuesto de restricción de exclusión). Una sola variante genética podría cumplir de manera plausible con estas condiciones si se comprende bien el proceso biológico que vincula la variante con el factor de riesgo. Pero en muchos casos, los estudios de aleatorización mendeliana incluyen múltiples variantes genéticas, que pueden usarse en análisis de sensibilidad para evaluar los supuestos subyacentes. Generalmente, las tres suposiciones clave deben ser válidas para cada una de las variantes genéticas. Describimos estrategias comunes para evaluar la plausibilidad de estos supuestos y damos ejemplos, cuando es posible, de estudios publicados.

Tres supuestos clave que deben cumplirse para que un estudio de aleatorización mendeliano sea válido

Ejemplos de asignación al azar mendeliana y posibles violaciones de los supuestos. (A) Un diagrama causal simplificado que muestra la confusión de la asociación del consumo de alcohol y la presión arterial con una enfermedad o privación social existente. Los supuestos de la variable instrumental son que las variantes genéticas están asociadas con el factor de riesgo, que no tienen otra influencia en el resultado, excepto a través del alcohol, y que no existen factores de confusión de la asociación variantes genéticas-resultado. (B) La confusión por ascendencia podría ocurrir si las variantes asociadas con el consumo de alcohol tuvieran diferentes frecuencias en diferentes grupos étnicos en la población de la muestra y si las diferencias culturales afectaran la presión arterial entre los grupos étnicos. Esto violaría el supuesto de la segunda variable instrumental: el supuesto de independencia. (C) Un ejemplo de pleiotropía horizontal, en la que las variantes genéticas asociadas con el consumo de alcohol también afectan el consumo de tabaco (violando el tercer supuesto: el supuesto de restricción de exclusión). (D) Un ejemplo de pleiotropía vertical, en el que el efecto de ALDH2 La enfermedad coronaria está mediada por la presión arterial. Este ejemplo no viola los supuestos de asignación al azar mendeliana y no causa sesgo.

Fuentes de datos en la asignación al azar mendeliana

Históricamente, un estudio típico de asignación al azar mendeliana requería medidas de genotipos (variantes en ALDH2 gen), factor de riesgo (consumo de alcohol) y resultado (presión arterial) de la misma muestra de personas. Este enfoque se conoce como asignación al azar mendeliana de muestra única. La aleatorización mendeliana de dos muestras involucra dos poblaciones de estudio separadas, por ejemplo, datos sobre el ALDH2 el genotipo y el consumo de alcohol se miden en una muestra, y ALDH2 el genotipo y la presión arterial en el otro.1723 Este diseño tiene dos ventajas. En primer lugar, no es necesario medir el factor de riesgo ni el resultado en todos los estudios, lo que es particularmente útil si son difíciles o costosos de medir. En segundo lugar, permite utilizar los resultados resumidos de los estudios de asociación de todo el genoma, que pueden ser muy grandes (a menudo & gt50 000) y, por tanto, muy precisos (tabla 2 y tabla 3).

Fuentes de datos disponibles públicamente para dos estudios de aleatorización mendeliana de muestra

Bases de datos de resultados de estudios de asociación de todo el genoma

El poder estadístico suele ser mucho mayor en dos estudios de muestra. Estas ventajas vienen con dos suposiciones adicionales: se supone que las dos muestras representan la misma población subyacente, y la superposición de participantes entre las dos muestras puede causar un sesgo hacia la asociación factor de riesgo-resultado.1739

Variantes genéticas únicas o múltiples

Las aplicaciones más simples de la aleatorización mendeliana utilizan una única variante genética como instrumento para el factor de riesgo. Algunos de los estudios publicados más persuasivos utilizan una única variante genética con una función relativamente bien entendida, por lo que las suposiciones básicas pueden estar respaldadas por el conocimiento biológico. Un ejemplo de ello es el uso de una variante sin sentido en el PCSK9 gen, que modifica la función de la proproteína convertasa subtilisina / kexina tipo 9, una enzima que degrada el receptor de lipoproteínas de baja densidad (LDL) en los hepatocitos. PCSK9 Las variantes están asociadas con concentraciones sanguíneas alteradas de colesterol LDL y riesgo de enfermedad cardíaca.4041 Esto proporciona más evidencia de que el colesterol LDL causa enfermedad cardíaca y también indica que los medicamentos que inhiben la PCSK9 pueden tener beneficios cardiovasculares. Esto se confirmó en ensayos clínicos de fase III4243.

Sin embargo, en la mayoría de las circunstancias, las variantes genéticas individuales explican de forma individual sólo una proporción muy pequeña de la variación en un fenotipo que los investigadores pueden denominar "instrumentos débiles", sobre todo en tamaños de muestra modestos. Es probable que los estudios que utilicen variantes con efectos modestos en muestras pequeñas tengan un poder estadístico muy bajo y puedan estar sesgados. Para superar esto, los investigadores han desarrollado métodos que utilizan múltiples variantes genéticas que explican colectivamente más de la variación en un factor de riesgo que una sola variante y, por lo tanto, tienen más poder estadístico. Una forma de usar múltiples variantes genéticas es usar polimorfismos de un solo nucleótido (SNP, la forma más común de variación del ADN entre las personas) como instrumentos individuales en un modelo de regresión estadística en el contexto de una o dos muestras de datos (enfoque de múltiples instrumentos). La segunda forma es agregar las variantes en una puntuación de alelos (también llamada puntuación de riesgo genético, puntuación de genes o puntuación de alelos multilocus) .16 La puntuación de alelos es efectivamente una única variable instrumental que puede usarse para predecir el factor de riesgo en un análisis de asignación al azar mendeliana.

Las variantes genéticas en estos puntajes a menudo se ponderan por sus asociaciones con el factor de riesgo para maximizar el poder estadístico. Muchas investigaciones recientes de aleatorización mendeliana de rasgos complejos (como la presión arterial, el IMC o los lípidos en sangre) 44 han utilizado múltiples variantes porque pueden ayudar a identificar la pleiotropía u otras violaciones de los supuestos subyacentes.

Pleiotropía genética

Las variantes genéticas pueden afectar el resultado a través de vías distintas del factor de riesgo de interés (los llamados efectos pleiotrópicos horizontales, figura 1C). Las variantes genéticas asociadas al consumo de alcohol, por ejemplo, pueden afectar otras conductas como el tabaquismo, lo que invalidaría la restricción de exclusión. Cuando se utilizan variantes genéticas únicas o múltiples, las estimaciones de aleatorización mendeliana requieren que las variantes genéticas no tengan tales efectos pleiotrópicos horizontales.16 Esto significa que los resultados podrían estar sesgados si una variante genética o una puntuación alélica tiene efectos pleiotrópicos sobre el resultado que no están mediados por el factor de riesgo de interés (figura 2). Las variantes genéticas también pueden afectar el resultado a través de una vía afectada por el factor de riesgo de interés (efectos pleiotrópicos verticales, figura 1D). Esto no invalida los supuestos de la variable instrumental y no da lugar a sesgos.

Ejemplo de pleiotropía genética en aleatorización mendeliana: colesterol HDL y riesgo de enfermedad cardíaca. Es probable que las variantes asociadas con el colesterol HDL tengan efectos pleiotrópicos sobre el riesgo de enfermedad cardíaca porque también se asocian con el colesterol LDL y los triglicéridos.245 Por lo tanto, la estimación de aleatorización mendeliana ponderada por varianza inversa, que asume que no hay pleiotropía, proporciona evidencia (sesgada) de un papel protector para el colesterol HDL en enfermedades coronarias. Pero las estimaciones que utilizan MR Egger, mediana ponderada y modo ponderado, que permiten la pleiotropía genética, se atenúan hacia el nulo. El estimador MR Egger asume que para las variantes con efectos pleiotrópicos sobre la enfermedad coronaria, la magnitud de estos efectos no se correlaciona con la magnitud de los efectos de las variantes sobre el colesterol HDL. Estos resultados sugieren que la estimación ponderada de la varianza inversa está impulsada por la pleiotropía genética19464748 y que es poco probable que el colesterol HDL tenga un papel causal importante en el desarrollo de la enfermedad coronaria. CHD = enfermedad coronaria ERFC = Colaboración de factores de riesgo emergentes HDL-C = colesterol unido a lipoproteínas de alta densidad SD = desviación estándar

Se han desarrollado varios métodos que permiten la pleiotropía genética. 194647 Estos proporcionan análisis de sensibilidad útiles para explorar si un hallazgo depende del supuesto de que todas las variantes no tienen efectos pleiotrópicos. Uno de estos enfoques, conocido como estimador mediano, puede proporcionar evidencia confiable siempre que al menos la mitad de las variantes genéticas no tengan efectos pleiotrópicos.4749 Un segundo método, conocido como regresión MR Egger, permite que todas las variantes tengan efectos pleiotrópicos, siempre que sean no es proporcional a los efectos de las variantes sobre el factor de riesgo de interés.19 Un análisis exhaustivo de los efectos genéticos de los rasgos cruzados indica que la magnitud de las asociaciones de todo el genoma son generalmente independientes entre los rasgos que no están relacionados causalmente, por lo que la suposición puede ser plausible para muchas relaciones potenciales.50 La regresión de MR Egger produce estimaciones menos precisas que otros métodos, debido a una penalización de potencia. La mayoría de estos métodos asumen que el factor de riesgo tiene el mismo efecto en todos.


Aleatorización mendeliana (MR)

La RM es una técnica epidemiológica que se ha desarrollado como un medio no solo para evitar las trampas clásicamente asociadas con los ECA, como las variables de confusión, sino también para examinar los factores causales de fenotipos que no serían apropiados para los ECA, por ejemplo, la altura. Se basa en el hecho de que las variantes genéticas —en la práctica, en su mayoría polimorfismos comunes— se asignan aleatoriamente durante la meiosis de acuerdo con la primera y segunda leyes de herencia de Mendel, mitigando así el problema de la causalidad inversa.

Un ejemplo temprano del concepto de RM provino de Katan en 1986, donde describió el problema de determinar si la asociación entre el colesterol sérico bajo y el cáncer era realmente causal, o resultaba de la presencia de variables de confusión como la dieta y el tabaquismo, o de la causalidad inversa. Para resolver esto, utilizó el hecho de que la apolipoproteína E (APOE) es polimórfico, con los diferentes alelos que codifican isoformas con potencia variable con respecto a la eliminación del colesterol del plasma. Katan concluyó que si el colesterol sérico bajo de hecho causara cáncer, los miembros de la población con las potentes isoformas APOE deberían tener una mayor frecuencia de cáncer, una distribución que difiera de la mencionada implicaría que no existe relación entre el colesterol sérico bajo y el cáncer. [8]. Un estudio realizado en 2009 utilizó RM en un intento de evaluar esta relación y no encontró un mayor riesgo de cáncer entre los grupos de pacientes de edad avanzada categorizados por APOE genotipo [9].

Una propuesta similar con el objetivo de realizar una evaluación imparcial de los trasplantes alogénicos de médula ósea (BMT) provino de Gray y Wheatley en 1991 y es donde se originó el término "asignación al azar mendeliana". Gray y Wheatley señalaron que una comparación entre los TMO alogénicos y la quimioterapia en el tratamiento de la leucemia era problemática en los casos en los que se disponía de un donante compatible con antígeno leucocitario humano (HLA), no sería ético negar el TMO a un paciente [10]. Su solución fue comparar la supervivencia de los pacientes que recibieron TMO de hermanos compatibles con HLA con hermanos no compatibles con HLA: debido a que el estado de HLA se asigna en el momento de la concepción, es decir, antes del inicio de la enfermedad, se evita el sesgo de selección (que se analiza a continuación) [ 10]. Ensayos posteriores en pacientes con leucemia mieloide aguda (LMA) que prueban la propuesta de Gray y Wheatley han encontrado de hecho que la compatibilidad HLA en TMO alogénico redujo la recaída y puede proporcionar una ventaja de supervivencia [11, 12].

  1. Los IV (los SNP que se utilizan) deben estar vinculados de forma clara y cuantificable a las exposiciones en cuestión.
  2. Los IV no deben estar vinculados de ninguna manera a ninguna variable de confusión.
  3. Los IV deben estar vinculados al resultado solo a través de la (s) exposición (es) en cuestión.


Conclusión

Los profesionales clínicos y de la salud pública se basan en saber si una exposición en particular causa una enfermedad en particular porque la intervención y los cambios de política dependen de este conocimiento. Sin embargo, determinar la causalidad mediante la investigación epidemiológica es una propuesta engañosa que se basa en el conocimiento de la biología, fisiología y / o toxicología subyacente de cualquier estudio existente in vitro o en animales y lecturas cuidadosas de la literatura epidemiológica existente sobre un tema determinado. Todos los casos de enfermedad tienen múltiples causas, y estas no actúan simultáneamente. Es probable que cada caso de enfermedad tenga una combinación ligeramente diferente de causas contribuyentes. Sin embargo, no es necesario que conozcamos todas las causas posibles antes de tomar medidas, ya que podemos prevenir algunos casos (evitar que se llenen algunos frascos) interviniendo incluso en una sola causa conocida.


Presión arterial y enfermedad coronaria.

Otro ejemplo es la asociación entre la presión arterial y la enfermedad coronaria. Una puntuación de riesgo genético asociada con una disminución de 1.6 mm Hg en la presión arterial sistólica corresponde a una razón de probabilidades de enfermedad coronaria de 0.91 (intervalo de confianza del 95%: 0.89 a 0.92) .18 Suponiendo una asociación lineal, esto implica una razón de probabilidades de 0.55 ( 0,47 a 0,61) para una disminución de 10 mm Hg en comparación con el riesgo relativo de un metanálisis de 0,78 (0,73 a 0,83) en los ensayos y 0,75 (0,73 a 0,77) en los estudios de cohorte19. la reducción de la presión arterial de las variantes genéticas es mucho mayor que la de la intervención.

Interpretación del resultado de un estudio de asignación al azar mendeliana

Un estudio de aleatorización mendeliana prueba si un factor de riesgo está asociado causalmente con el resultado de una enfermedad al examinar si existen diferencias en el resultado entre grupos genéticamente definidos con diferentes niveles promedio del factor de riesgo de interés.

Hay tres errores al interpretar el resultado de un estudio de asignación al azar mendeliana:

Fracaso de los supuestos clave: El supuesto clave es que la variante genética que está asociada con el factor de riesgo divide a la población en grupos que son similares a los brazos de tratamiento en un ensayo aleatorizado en el que todos los posibles factores de confusión están equilibrados entre los grupos. Esto requiere la falta de pleiotropía de la variante, la ausencia de desequilibrio de ligamiento con otras variantes funcionales y la ausencia de estratos de población ocultos (ver texto). Si alguna de estas condiciones no se cumple, las estimaciones de la aleatorización mendeliana pueden ser engañosas

Sobreinterpretación de un hallazgo nulo: las diferencias en el factor de riesgo entre los grupos genéticos suelen ser pequeñas en comparación con su variación general. Un hallazgo nulo podría simplemente reflejar que las pequeñas diferencias entre los grupos no dan como resultado diferencias lo suficientemente grandes en el resultado como para distinguirlas de manera confiable de las diferencias al azar en un tamaño de muestra limitado. En algunos casos, se requieren tamaños de muestra de decenas de miles para proporcionar la potencia suficiente para interpretar de manera confiable un hallazgo nulo8

Sobreinterpretación de un hallazgo positivo: si bien la hipótesis de la aleatorización mendeliana se relaciona con los grupos genéticos, uno de los objetivos de la aleatorización mendeliana es determinar el efecto potencial de una intervención clínica en el factor de riesgo de interés. Las diferencias cualitativas y cuantitativas entre la comparación de grupos genéticos y la intervención propuesta significan que el efecto causal estimado por la aleatorización mendeliana podría no traducirse directamente en el efecto observado sobre el resultado de modificar el factor de riesgo en la práctica.


Abstracto

La aleatorización mendeliana (MR) es un campo floreciente que implica el uso de variantes genéticas para evaluar las relaciones causales entre exposiciones y resultados. Los estudios de RM pueden ser sencillos, por ejemplo, las variantes genéticas dentro o cerca del locus de codificación que está asociado con las concentraciones de proteínas pueden ayudar a evaluar su papel causal en la enfermedad. Sin embargo, una relación más compleja entre las variantes genéticas y una exposición puede dificultar la interpretación de los resultados de la RM. En esta revisión, describimos algunos de estos desafíos en la interpretación de los análisis de RM, incluidos los de estudios que utilizan variantes genéticas para evaluar la causalidad de múltiples rasgos (como los aminoácidos de cadena ramificada y el riesgo de diabetes mellitus) estudios que describen variantes pleiotrópicas (por ejemplo, Proteína C reactiva y su contribución a la enfermedad coronaria) y aquellas que investigan variantes que alteran el funcionamiento normal de una exposición (por ejemplo, colesterol HDL o IL-6 y enfermedad coronaria). Además, se discuten los estudios de RM sobre variantes que codifican enzimas responsables del metabolismo de una exposición (como el alcohol), además de los que evalúan los efectos de las variantes sobre exposiciones dependientes del tiempo (superóxido dismutasa extracelular), exposiciones acumulativas (colesterol LDL) y exposiciones superpuestas (triglicéridos y colesterol no HDL). Desarrollamos las características moleculares de cada relación y proporcionamos explicaciones para las posibles asociaciones causales. Al hacerlo, esperamos contribuir a evaluaciones más fiables de los resultados de la RM.


2. MATERIALES Y MÉTODOS

2.1 GWAS ginecológico y de IMC en japonés

Enfermedad ginecológica GWAS se realizó como se describió anteriormente. 2 Brevemente, inscribimos casos de OC, UEC, UCC, UF y endometriosis, y compartimos controles femeninos sin enfermedades ginecológicas, malignas y relacionadas con MHC del BioBank Japan Project (BBJ), luego realizamos análisis de asociación bajo el modelo lineal generalizado. 2 Los datos de BMI GWAS se adoptaron de un informe anterior, 17 y volvimos a realizar el análisis utilizando datos genéticos de individuos BBJ no superpuestos sin enfermedades ginecológicas bajo el modelo lineal generalizado. Estos estudios se establecieron, publicaron y fue el GWAS más grande entre los japoneses. En el BMI GWAS original, las asociaciones de las variantes principales se replicaron en múltiples cohortes de biobancos, lo que sugiere su solidez. El IMC se midió por peso (kg), dividido por la altura al cuadrado (m 2) y no ajustado por la relación cintura-cadera. Tanto hombres como mujeres se incluyeron en el BMI GWAS para garantizar una estimación válida de las variantes asociadas al IMC aumentando el tamaño de la muestra, lo que luego evita sesgos en el análisis de RM. Entre las variantes de plomo informadas anteriormente en el BMI GWAS japonés, 17 seleccionamos las disponibles tanto en BMI como en GWAS ginecológico. Confirmamos que la asociación de las variantes relacionadas con el IMC era lo suficientemente fuerte (PAG-valor & lt 5,0 × 10 −8) que se utilizarán como variables instrumentales en el análisis de RM. Cuando las variantes de plomo no estaban disponibles en GWAS ginecológico, variantes proxy en desequilibrio de ligamiento (LD) (r 2 ≥ 0,5 en sujetos de Asia oriental de la fase 3v5 del Proyecto 1000 Genoma) fueron seleccionados. Este estudio fue aprobado por el comité de ética de la Facultad de Medicina de la Universidad de Osaka. Los datos de genotipos se depositan en el Centro Nacional de Base de Datos de Biociencias, con el número de acceso hum0014 en https://ddbj.nig.ac.jp/jga/viewer/view/study/JGAS00000000114.

2.2 Análisis de RM

Adoptamos el método MR de dos muestras implementado en el paquete TwoSample MR (http://www.mrbase.org/) del software estadístico R (v.3.5.1). Se aplicaron 2 tipos de análisis de RM, los métodos de ponderación de la varianza inversa (IVW) y MR-Egger. Estimamos el efecto del IMC como exposición sobre enfermedades ginecológicas como resultados, adoptando las variantes asociadas significativamente (PAG & lt 5,0 × 10 −8) con el IMC como variables instrumentales. Aplicamos la corrección de Bonferroni para evaluar la importancia de la asociación, tanto en el análisis de descubrimiento como en el de replicación, el umbral de significancia se calculó como una tasa de error de tipo 1 α = .05 dividido por el número de métodos y fenotipos probados en el análisis. Como prueba de sensibilidad, aplicamos una prueba de heterogeneidad, un análisis de dejar uno fuera y gráficos de embudo implementados en el paquete TwoSampleMR. También aplicamos el método de suma residual y valor atípico de pleiotropía de aleatorización mendeliana (MR-PRESSO) implementado en el paquete R mr-presso y evaluamos el efecto pleiotrópico.

2.3 Estudio de replicación en biobancos europeos del Reino Unido

Aplicamos los mismos métodos a las estadísticas resumidas públicamente disponibles de la población europea. Obtuvimos las estadísticas resumidas de la enfermedad ginecológica GWAS del UK Biobank (UKBB) (http://www.nealelab.is/uk-biobank, Códigos de fenotipo: C56, C54, C53, D25 y N80). The summary statistics of the BMI GWAS conducted among the subjects not overlapping with those in UKBB were obtained from the GIANT consortium (https://portals.broadinstitute.org/collaboration/giant/index.php/GIANT_consortium_data_files). 18


  • APA
  • Autor
  • BIBTEX
  • Harvard
  • Estándar
  • RIS
  • Vancouver

Research output : Contribution to journal › Article (Academic Journal)

T1 - Using molecular genetic information to infer causality in observational data

T2 - Mendelian randomisation

N2 - Determining whether associations between lifestyle behaviours and health outcomes are causal is difficult in observational data. However, as genetic variants associated with these behaviours are discovered, this will provide opportunities for testing causality using Mendelian randomisation methods. These use genetic variants as proxies for exposures to minimise biases associated with observational data, enabling stronger causal inference. Here we review the principles and main approaches for conducting Mendelian randomisation studies, and discuss recent methodological developments for investigating more complex causal pathways. Mendelian randomisation offers considerable promise for improving our understanding of the causal relationships between lifestyle behaviours and health outcomes, and its application will increase as more genetic variants robustly associated with behavioural phenotypes are identified.

AB - Determining whether associations between lifestyle behaviours and health outcomes are causal is difficult in observational data. However, as genetic variants associated with these behaviours are discovered, this will provide opportunities for testing causality using Mendelian randomisation methods. These use genetic variants as proxies for exposures to minimise biases associated with observational data, enabling stronger causal inference. Here we review the principles and main approaches for conducting Mendelian randomisation studies, and discuss recent methodological developments for investigating more complex causal pathways. Mendelian randomisation offers considerable promise for improving our understanding of the causal relationships between lifestyle behaviours and health outcomes, and its application will increase as more genetic variants robustly associated with behavioural phenotypes are identified.


Ver el vídeo: Causalidad en Epidemiología - IASNUT (Febrero 2023).