Información

Libro de recomendación: rasgos complejos y arquitectura genética compleja

Libro de recomendación: rasgos complejos y arquitectura genética compleja


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy buscando un libro (o cualquier buena fuente de información) que ofrezca una discusión en profundidad y modelos sobre la evolución y el análisis de rasgos complejos y arquitectura genética compleja. ¿Tienes alguna sugerencia?

Definiría rasgos complejos como aquellos cuya variación en la población se explica por muchos loci genéticos y factores ambientales.


Sugerencias:

Genética evolutiva: conceptos y estudios de caso: conceptos y estudios de caso

Editado por Lexington Charles W. Fox Departamento de Entomología Universidad de Kentucky, Facultad de Ciencias de la Vida Universidad de Manchester Jason B. Wolf Conferencista

La teoría matemática de la selección, recombinación y mutación.

por R Bürger (como lo sugiere @ rg255 en los comentarios)

Genética y análisis de rasgos cuantitativos de Lynch y Walsh

(como lo sugiere @kmm en los comentarios)

PD: Díganos si encontró uno mejor.


Los análisis de asociación epigenómica y genotipo-fenotipo revelan una arquitectura genética conservada de rasgos complejos en bovinos y humanos.

La falta de anotaciones funcionales integrales en una amplia gama de tejidos y tipos de células dificulta gravemente las interpretaciones biológicas de la variación fenotípica, la evolución adaptativa y la domesticación del ganado. Aquí utilizamos una combinación de epigenómica comparativa, estudio de asociación de todo el genoma (GWAS) y análisis de firma de selección, para arrojar luz sobre la posible evolución adaptativa en el ganado.

Resultados

Hicimos un mapa cruzado de 8 marcas de histonas de 1300 muestras de humanos a bovinos, cubriendo 178 tipos únicos de tejidos / células. Al analizar de manera uniforme 723 RNA-seq y 40 conjuntos de datos de secuenciación de bisulfito de genoma completo (WGBS) en ganado, validamos que las marcas de histonas en el mapa cruzado capturaron la expresión y metilación específicas del tejido, lo que refleja la biología relevante para el tejido. Mediante la integración de marcas de histonas específicas de tejido con mapas cruzados con GWAS a gran escala y resultados de firmas de selección, detectamos por primera vez tejidos y tipos de células relevantes para 45 características económicamente importantes y selección artificial en el ganado. Por ejemplo, los tejidos inmunes están significativamente asociados con rasgos de salud y reproducción, múltiples tejidos para la producción de leche y rasgos de conformación corporal (que reflejan su arquitectura altamente poligénica) y tiroides para la selección diferente entre ganado vacuno y lechero. De manera similar, detectamos tejidos relevantes para 58 rasgos complejos y enfermedades en humanos y observamos que los rasgos inmunes y de fertilidad en humanos se correlacionaron significativamente con los del ganado en términos de tejidos relevantes, lo que facilitó la identificación de genes causales para dichos rasgos. Por ejemplo, PIK3CG, un gen altamente expresado específicamente en células mononucleares, se asoció significativamente tanto con la edad de la menopausia en humanos como con el nacimiento muerto de hijas en el ganado. ICAM, un gen específico de células T, se asoció significativamente con enfermedades alérgicas en humanos y metritis en ganado.

Conclusión

En conjunto, nuestros resultados destacaron que la epigenómica comparativa junto con GWAS y los análisis de firmas de selección podrían proporcionar conocimientos biológicos sobre la variación fenotípica y la evolución adaptativa. El ganado puede servir como modelo para los rasgos complejos humanos, proporcionando información adicional más allá de los organismos modelo de laboratorio, particularmente cuando haya más fenotipos nuevos disponibles en un futuro próximo.


Modelado de la arquitectura genética de rasgos complejos con marcadores moleculares

Autor (es): Rongling Wu, Wei Hou, Yuehua Cui, Hongying Li, Tian Liu, Song Wu, Chang-Xing Ma, Departamento de Estadística de Yanru Zeng, Universidad de Florida, Gainesville, FL 32611 EE. UU.

Afiliación:

Nombre de la revista: Patentes recientes sobre nanotecnología

Volumen 1, Número 1, 2007




Abstracto:

Comprender el control genético de los rasgos heredados cuantitativamente es fundamental para la investigación genética agrícola, evolutiva y biomédica. Se puede dilucidar una imagen detallada de la arquitectura genética de los rasgos cuantitativos con un mapa genético bien saturado de marcadores moleculares. Los parámetros que cuantifican la arquitectura genética de un rasgo incluyen el número de loci de rasgos cuantitativos individuales (QTL), sus posiciones genómicas, sus acciones e interacciones genéticas y su capacidad de respuesta a factores bióticos o abióticos. Se han desarrollado una variedad de diseños genéticos y modelos estadísticos para estimar y probar estos parámetros de modelado de arquitectura. Con la disponibilidad de marcadores de polimorfismo de un solo nucleótido muy abundantes, se pueden identificar variantes de secuencia de ADN, es decir, nucleótidos de rasgo cuantitativo (QTN), que contribuyen a la variación cuantitativa. Un área activa de reciente aparición, el mapeo funcional, ha demostrado su valor para desentrañar la maquinaria genética de los rasgos dinámicos a nivel de QTL o QTN que cambian sus fenotipos con el tiempo u otras variables. El mapeo funcional proporciona un marco cuantitativo para probar la interacción entre los efectos genéticos y la formación y el desarrollo de rasgos y, por lo tanto, apela a impulsar el análisis genético estadístico y el modelado en el contexto de la biología del desarrollo. Se han patentado algunos de los métodos estadísticos para el mapeo genético.

Patentes recientes sobre nanotecnología

Título: Modelado de la arquitectura genética de rasgos complejos con marcadores moleculares

VOLUMEN: 1 ASUNTO: 1

Autor (es):Rongling Wu, Wei Hou, Yuehua Cui, Hongying Li, Tian Liu, Song Wu, Chang-Xing Ma y Yanru Zeng

Afiliación:Departamento de Estadística, Universidad de Florida, Gainesville, FL 32611 EE. UU.


2 ¿Cómo debemos entender la causalidad?

Gran parte de la literatura filosófica clásica sobre causalidad se ha centrado en la cuestión básica de qué cuenta como causa, es decir, qué condiciones debe satisfacer una relación para calificar como relación de causa y efecto. Las preocupaciones centrales incluyen si la causalidad se puede analizar de manera no circular, en términos de nociones que no presuponen causalidad, o cuáles son las relaciones de causalidad. [2] La mayor parte de este trabajo no es de utilidad inmediata para problemas científicos específicos como los que se refieren a esta colección de artículos.

En las últimas décadas, sin embargo, se han desarrollado varios marcos novedosos para pensar sobre la causalidad que son directamente aplicables en nuestro contexto. Un ejemplo clave es el enfoque de modelado causal desarrollado en Spirtes et al., [3] que proporciona herramientas formales para inferir estadísticamente modelos causales a partir de datos. Un enfoque relacionado se deriva del modelado de ecuaciones estructurales, [4] e incluye el marco intervencionista de Woodward [5] (ver también ref. [6]). Nos centraremos en el enfoque de Woodward aquí.

El enfoque intervencionista se basa en la idea de que las relaciones causales, a diferencia de las meras correlaciones estadísticas, pueden explotarse con fines de manipulación y control. Para dos variables X y Y para estar relacionado causalmente, tiene que existir alguna intervención en X que cambia el valor de Y bajo una variedad de condiciones de fondo. [5] Una intervención en un gen, a través de perturbaciones de sobreexpresión, knock-down o knock-out, a menudo resulta en un cambio fenotípico correspondiente. Como ejemplo clásico de la genética del desarrollo, si elimináramos una copia del gen brachyury del genoma de un ratón, resultaría en una reducción de la longitud de la cola y defectos en las vértebras sacras. a la letalidad embrionaria. [7] Tales declaraciones de "si-entonces" con respecto a lo que sucedería bajo diversas condiciones posibles se denominan condicionales contrafactuales o contrafactuales.

El intervencionismo se considera un tipo de “teoría contrafactual” de la causalidad, [8-10] porque las relaciones entre variables que son manipulables en el sentido intervencionista generan verdaderos enunciados contrafácticos. Las visiones contrafácticas de la causalidad interpretan las causas como diferenciadoras. [8] El siguiente contrafactual, si X no había tenido el valor X1, luego Y no hubiera tenido el valor y1—Es decir que el valor de X hace una diferencia en el valor de Y. En biología, las teorías contrafactuales han sido más productivas que las explicaciones anteriores de la causalidad basadas en regularidades / leyes, [11, 12] o la transferencia de materia o energía. [13-15] Hay pocas leyes estrictas en biología, si es que hay alguna, y no es práctico ni deseable rastrear siempre procesos biológicos complejos en términos de flujos en unidades físicas subyacentes.


RESULTADOS

Reconstrucción de mapas genéticos y QTL de semillas para M × N RIL

En este estudio se utilizó una población de EIR derivada de los genotipos parentales de la soja Minsoy y Noir 1. Estudios previos que involucraban esta población M × N RIL se basaron en mapas genéticos construidos a partir de datos de marcadores de polimorfismo de longitud de fragmentos de restricción y repetición de secuencia simple (Lark et al., 1995 Mansur et al., 1993). Para aumentar la precisión de este estudio de mapeo, obtuvimos datos de marcadores SNP de 1536 loci en el genoma secuenciado de la soja (Schmutz et al., 2010) y reconstruimos un mapa genético de soja de 2500 cM a partir de 557 marcadores (Supl. Tabla S1) que se encontraron segregar dentro de la población M × N RIL. Veinticuatro LG con una distancia entre marcadores promedio de 4,7 cM (Supl. Tabla S2) formaron el mapa genético para esta población, utilizando la secuencia del genoma de la soja (Schmutz et al., 2010) para la alineación de los marcadores de referencia.

Se han identificado múltiples QTL para la composición de semillas en los RIL M × N (Lark et al., 1994 Mansur et al., 1993 Orf et al., 1999). Las plantas de soja del genotipo Minsoy típicamente producen semilla amarilla con mayor contenido de aceite y menor contenido de proteína que el genotipo Noir 1 de semilla negra. En ensayos de campo de 1992 a 2002, el contenido promedio de aceite de semilla fue de 17.43 ± 1.03% de Minsoy y 15.29 ± 0.34% de Noir 1. Para estos mismos ensayos, el contenido promedio de proteína de semilla fue 35.16 ± 0.15% de Minsoy y 37.35 ± 0.84 % de Noir 1. Dentro de los RIL M × N, el contenido promedio de aceite de semilla osciló entre 13,64 y 19,20%. El contenido medio de proteína de la semilla en los RIL M × N osciló entre 31,14% y 38,24%. Calculamos las posiciones de QTL sobre la base del mapa genético recientemente perfeccionado utilizando datos de aceite de semillas y proteínas recopilados durante el lapso de dos décadas (Supl. Tabla S3).

Los análisis de QTL de semillas combinados para los RIL M × N destacaron un QTL para el aceite de semilla en Chr 8 y dos QTL para la proteína de semilla en Chr 4 y 6 que se calcularon para explicar del 10 al 38% de la variación de rasgos observada en la población. La existencia de QTL coincidente de aceite de semilla y proteína con efectos alélicos opuestos (Suplemento Tabla S3) para el QTL en Chr 6 y 8 también confirma la correlación inversa que se ha observado entre estos rasgos (Brim y Burton, 1979). Según el mapa genético de consenso (soybase.org, verificado el 13 de diciembre de 2013) y las posiciones correspondientes de los marcadores SNP, los tres QTL parecen coincidir con la evidencia previa de un QTL de aceite de semilla o proteína en la soja. El intervalo QTL de proteína de semilla en Chr 4 coincide con Prot 19-1 (Stombaugh et al., 2004) y Prot 7-2 (Orf et al., 1999) QTL de proteína de semilla. Asimismo, la proteína de semilla y el QTL de aceite en Chr 6 se colocalizan con Oil 23-1 (Hyten et al., 2004), Oil 4-6 y Protein 21-3 (Kabelka et al., 2004) de semilla QTL. El QTL de aceite y proteína de semilla en Chr 8 coincide con el QTL de semilla de Oil 1-1 (Mansur et al., 1993) y Prot 17–4 (Tajuddin et al., 2003).

Acumulación de transcripciones de genes en todo el genoma durante la maduración temprana de semillas

Como evaluación inicial de la variación del rasgo de expresión génica, Minsoy y Noir 1 fueron evaluados para perfiles de acumulación de transcripciones de 30,681 genes en etapas de maduración temprana y media de la semilla de soja en desarrollo utilizando ARN total procesado para hibridación con Affymetrix Soy GeneChip. Se encontró que un total de 200 genes (Supl. Tabla S4) se expresaban significativamente diferencialmente entre Minsoy y Noir 1 a un FDR del 5% y en una proporción de cambio de dos o más veces. Las transcripciones de genes implicados en la función de transporte de lípidos se encontraban entre las que se expresaban diferencialmente entre los dos genotipos.

Los datos de acumulación de transcripciones se recogieron de la etapa de semilla verde inmadura (Suplemento Fig. S1, Suplemento Tabla S5) correspondiente a la maduración temprana de la semilla al inicio de la acumulación de reserva de 93 miembros de la población M × N RIL. Es de interés notar que los datos de acumulación de transcripciones en más de 16,344 genes apoyaron la variación genética no aditiva a través de la segregación transgresiva donde los valores de acumulación de transcripciones de genes para la población de RIL se extendieron más allá del rango de los valores parentales. Estudios anteriores informaron un fenómeno similar en otras especies (Brem y Kruglyak, 2005 Hammond et al., 2011 Potokina et al., 2008 West et al., 2007). Dentro de la población M × N RIL, la segregación transgresora describió los patrones de acumulación de transcripciones de más del 50% de los rasgos de expresión génica evaluados dentro de la población. Previamente se observó una variación transgresiva para los rasgos reproductivos, morfológicos y de las semillas, incluido el rendimiento de semillas, evaluados dentro de la población M × N RIL (Mansur et al., 1993). Estos resultados contrastaron notablemente con el número de transcripciones de genes (200) que se expresaron diferencialmente entre los padres Minsoy y Noir 1.

Detección de eQTL globales en la semilla de soja inmadura

El mapeo de intervalo compuesto identificó 28.470 eQTL para 15.568 genes únicos expresados ​​en la semilla inmadura (Supl. Fig. S1) de la población M × N RIL (Fig. 1A). Se mapearon de cero a seis eQTL para cada rasgo de expresión génica, y las puntuaciones de LOD para estos eQTL variaron de 3,38 a 89,37. Se descubrió que estos eQTL explican desde un pequeño porcentaje hasta casi el 100% de la variación observada en un rasgo de expresión génica dado; sin embargo, se encontró que el rango de variación atribuida se encuentra predominantemente entre el 10 y el 20%. Una pequeña parte del eQTL mapeado (3824 o 13,4%) se clasificó como cisreguladores que actúan en función de la proximidad de la ubicación física del gen a la posición genética del eQTL, y el resto del eQTL se clasifica como trans-reguladores que actúan. Debido a que aún no se ha demostrado que estos eQTL actúen en cis o trans, pueden denominarse más apropiadamente reguladores locales o distantes (Rockman y Kruglyak, 2006), respectivamente, pero los términos más familiares cis-actuando y trans-actuación se utilizan para mayor claridad. En este estudio, el eQTL de un gen se definió como cis-actuando si el gen se mapea en el mismo cromosoma y se encuentra dentro de 1,575 Mb de la ubicación física del marcador SNP cerca del eQTL. Esta distancia se basó en el espaciado promedio entre marcadores de los marcadores SNP utilizados para el mapa genético. Aumentar la distancia permitida a 5 Mb o 10 Mb amplió el número de candidatos cis-actuando eQTL a aproximadamente 19 o 21% del número total de eQTL. La proporción de eQTL en cualquier cromosoma dado que se encontró cis-actuación varió del 10,5%, en Chr 7, al 49,6%, en Chr 3.

Loci de rasgos cuantitativos de expresión en todo el genoma (eQTL) en la semilla inmadura de la población de soja de líneas endogámicas recombinantes Minsoy × Noir 1. (A) Un diagrama de dispersión de eQTL de la ubicación de genes físicos en megabases totales frente a la ubicación genética de eQTL en centimorgans totales. Cada punto eQTL está codificado por colores para representar la acumulación de transcripciones regulada positivamente por el alelo Minsoy (rojo) o el alelo Noir 1 (azul). Las flechas indican ejemplos específicos de sesgo alélico. (B) La frecuencia de eQTL asignada a cada ubicación genética se representa gráficamente a lo largo de los 20 cromosomas de la soja (Chr). Una línea amarilla discontinua indica el umbral para los puntos de acceso de eQTL.

Patrones de regulación genética en la semilla de soja inmadura

Se observó que varios loci genéticos contenían significativamente más eQTL de lo que se esperaba que apareciera por distribución aleatoria (Fig. 1B). Se calculó un umbral basado en el percentil 95 del número máximo de eQTL detectado en cualquier locus dado cuando se distribuyeron aleatoriamente 28.470 eQTL en cada intervalo. Se identificaron las posiciones en las que el número de loci mapeados alcanzó su punto máximo por encima del umbral de 39 eQTL por locus genético y representan puntos críticos de regulación putativos de la transcripción génica. Muchos de estos se asignaron a posiciones contiguas que probablemente representan el mismo punto de acceso, y después de tener en cuenta el número de genes por intervalo, se consideraron 54 puntos de acceso enriquecidos para eQTL.

La posición física del gen y la posición genética de los eQTL de todo el genoma para cada gen se representan en un gráfico de dispersión de eQTL (Fig. 1A). Cis-Los eQTL actuantes están representados por la diagonal formada a través del diagrama de dispersión de eQTL. Todos los demás puntos del diagrama de dispersión representan trans-actuando eQTL. El LOD promedio de un cis-actuando eQTL fue mayor (11,65) que el LOD promedio de un trans-actuando eQTL (5.65) en general. Este resultado confirma informes anteriores que cis-actuando eQTL son típicamente de mayor efecto (mayor LOD) que trans-eQTL en estudios de genoma completo (Brem y Kruglyak, 2005 Brem et al., 2002 Drost et al., 2010 Keurentjes et al., 2007 Kirst et al., 2005 Morley et al., 2004 Schadt et al., 2003 Vuylsteke et al., 2005 West et al., 2007).

En general, el número de eQTL con efectos alélicos que influyen en la acumulación de transcripciones en cualquier dirección fue aproximadamente igual, con un 50,18% atribuido al alelo Minsoy y un 49,82% al alelo Noir 1. Por lo tanto, fue notable que varios puntos críticos de eQTL mostraran un fuerte sesgo direccional para los efectos alélicos de un solo padre. Este sesgo direccional se muestra mediante los códigos de color para los efectos alélicos en la Fig. 1A. En Chr 12, por ejemplo, una línea vertical de 147 eQTL mapeado (rojo = Minsoy) por encima de la posición genética 1554 cM, por ejemplo, muestra un sesgo direccional para el alelo Minsoy (136 Minsoy, 11 Noir 1). En la dirección opuesta, en otro hotspot eQTL en Chr 8 a 1023 cM, existe un sesgo direccional para el alelo Noir 1 (105 Noir 1, 20 Minsoy). Se encontraron ejemplos de tal sesgo direccional en cada cromosoma.

Validación del conjunto de datos global eQTL a través del mapeo eQTL de genes involucrados en la biosíntesis de flavonoides

La regulación transcripcional de la bien estudiada vía de biosíntesis de flavonoides tiene lugar en la semilla inmadura. Al extraer el conjunto de datos de eQTL para todos los genes que anotan en la categoría de ontología genética de la vía de biosíntesis de flavonoides, encontramos que & gt20% del eQTL identificado para genes en esta vía (ajustado PAG valor = 2,06 × 10 –4) mapeado a un intervalo Chr 8 (∼904 cM total, Fig. 2A, Supl. Tabla S6). Además, el eQTL para los genes de la vía de biosíntesis de flavonoides poseía todos efectos aditivos con el alelo Noir 1, el genotipo con color de semilla negro (versus amarillo). De estos genes, el eQTL para un solo gen candidato, el CHS1 genGlyma08g11610), fue identificado como un cis-regulador de actuación. Usando una medición cuantitativa de la pigmentación de la cubierta de la semilla y el mapa genético ensamblado para la población M × N RIL, también se identificó un QTL de pigmentación de la cubierta de la semilla en el intervalo Chr 8 (Suplemento Tabla S3) y representó más del 77% de la cubierta de la semilla. rasgo de pigmentación (LOD & gt 40) (Fig. 2B). La posición de este QTL de pigmentación de la cubierta de la semilla es consistente con la ubicación genómica de un grupo repetitivo de genes CHS que controla la pigmentación de la cubierta de la semilla a través de la generación de pequeños ARN que regulan negativamente a todos los miembros de la familia de genes CHS (Tuteja et al., 2009).

(A) Ubicación genética frente a loci de rasgos cuantitativos de expresión (eQTL) gráfico de dispersión de ubicación genética de eQTL para genes que anotan la vía de biosíntesis de flavonoides. Ocho genes involucrados en la biosíntesis de flavonoides, particularmente genes de calcona sintasa (CHS), mapeados en el cromosoma (Chr) 8 locus ∼904 cM. El Chr 8 cis-actuando eQTL para CHS1 se identificó en el locus del inhibidor para el color de la cubierta de la semilla. Cada punto eQTL está codificado por colores para representar la acumulación de transcripciones regulada positivamente por el alelo Minsoy (rojo) o el alelo Noir 1 (azul). (B) El QTL de pigmentación de la cubierta de la semilla se asigna a Chr 8 y se colocaliza con el punto de acceso eQTL de biosíntesis de flavonoides.

Regulación transcripcional de genes específicos de semillas

Para identificar puntos críticos de eQTL específicos para la regulación de genes de semillas, se identificaron genes que acumulan transcripciones solo en el tejido de semillas de soja. Los datos de secuenciación de ARN (ARN-seq) se obtuvieron de tejidos de soja, incluidas semillas, vainas, hojas, flores, raíces y nódulos descritos previamente en un atlas de expresión de genes de soja (Severin et al., 2010b) y combinados con ARN- datos seq de una línea casi isogénica relacionada (datos de archivo de lectura de secuencia en BioProject PRJNA208048). Se describió la acumulación diferencial de transcripciones de genes del par de líneas casi isogénicas (HiPro y LoPro) para cuatro etapas de semillas (Bolon et al., 2010). HiPro es una línea de alto contenido de proteína de semilla y bajo contenido de aceite de semilla que es casi idéntica en genotipo a la línea de bajo contenido de proteína de semilla y alto contenido de aceite de semilla LoPro, excepto por las regiones de introgresión (Severin et al., 2010a) que incluyen la principal proteína de semilla LG I QTL en Chr 20 (Bolon et al., 2010). Aquí, los datos de los 14 tejidos de la soja (hoja, flor, vaina, cáscara [2 etapas], semilla [7 etapas], raíz y nódulo) se utilizaron para ambos genotipos para identificar genes con expresión específica de semilla. El eQTL para estos genes específicos de semillas se destacaron del conjunto de datos eQTL global (Supl. Tabla S7). Se encontraron grupos de genes específicos de semillas eQTL en puntos calientes en Chr 20 (2498 cM total, Fig. 3A) y Chr 13 (1627 cM total, Fig. 3A). La ubicación de estos hotspots de eQTL específicos de la semilla no correspondía al hotspot de eQTL con el mayor número de eQTL (Chr 7, Fig. 1B) o al hotspot de eQTL para la biosíntesis de flavonoides (Chr 8, Fig. 2A).

(Página anterior) Regulación de genes específicos de la semilla y de la ruta de la semilla en tres puntos críticos de loci de rasgos cuantitativos de expresión (eQTL). Cada punto eQTL está codificado por colores para representar la acumulación de transcripciones regulada positivamente por el alelo Minsoy (rojo) o el alelo Noir 1 (azul). Las flechas de colores resaltan los puntos de acceso eQTL indicados. A) Un gráfico de dispersión de eQTL para genes específicos de semillas muestra un enriquecimiento de eQTL específico de semillas que se colocalizan en un punto de acceso eQTL en el cromosoma (Chr) 20 y otro en Chr 13. B) Un gráfico de dispersión de eQTL para genes de fotosíntesis revela puntos de acceso de eQTL en Chr 7, 13 y 20. C) Un diagrama de dispersión de eQTL para genes que anotan en la biosíntesis de ácidos grasos muestra dos loci principales enriquecidos en genes de biosíntesis de ácidos grasos eQTL en Chr 20 y Chr 7. D) El mapeo de eQTL para genes de oleosina muestra que la mayoría de los genes de oleosina están influenciados en uno de los dos loci, Chr 20 o Chr 13, también con efectos direccionales. El punto de acceso eQTL en Chr 20 es común a todos los anteriores. La acumulación de transcripciones de genes con eQTL en estas categorías está predominantemente regulada al alza con el alelo Noir 1 en los hotspots Chr 7 y Chr 13 eQTL mientras que están regulada al alza con el alelo Minsoy en el hotspot Chr 20 eQTL.

Regulación transcripcional de vías funcionales de semillas específicas

Los genes con eQTL en el hotspot eQTL específico de la semilla (2498 cM total) en Chr 20 se examinaron para el enriquecimiento en categorías funcionales específicas. Según las anotaciones de Gene Ontology, las categorías más enriquecidas en el hotspot Chr 20 fueron para la fotosíntesis (ajustada PAG valor = 4,65 × 10 –16) y proceso biosintético de ácidos grasos (ajustado PAG valor = 7,1 × 10 –8) (Supl. Fig. S2). Posteriormente se destacaron las eQTL para todos los genes con anotaciones del proceso de fotosíntesis o de biosíntesis de ácidos grasos. Se encontró que el gen de la fotosíntesis eQTL se agrupaba en tres regiones del genoma, incluyendo puntos calientes en Chr 7, 20 y 13 (Fig. 3B, Supl. Tabla S8). Se encontraron puntos calientes para eQTL de genes de biosíntesis de ácidos grasos en Chr 20 y 7 (Fig. 3C, Supl. Tabla S9 y S10). El examen del hotspot en Chr 7 también mostró que estaba enriquecido en eQTL del gen de la fotosíntesis (ajustado PAG valor = 3,5 × 10 –30) (Supl. Fig. S3). Cabe señalar que la mayoría de los genes de biosíntesis de ácidos grasos, fotosíntesis y específicos de semillas con eQTL que se asignaron al hotspot en Chr 20 (∼2498 cM) mostraron una regulación positiva de la acumulación de transcripciones con la presencia del alelo Minsoy (Fig. 3A– 3C, Suplemento Fig. S4 – S5, Suplemento Tablas S7 – S9) a pesar de la existencia de más eQTL del efecto Noir 1 (137 frente a 132) en este locus. Sorprendentemente, ocho eQTL para genes de oleosina también se mapearon específicamente en este intervalo en Chr 20 (Fig. 3D, Supl. Tabla S9). La expresión de estos genes de oleosina se incrementó con la presencia del alelo Minsoy, el genotipo con mayor cantidad de aceite de semilla (Orf et al., 1999), consistente con la evidencia de que las semillas con mayor contenido de aceite poseen más oleosinas (Parthibane et al., 2012a Siloto et al., 2006).

Regulación multifacética de la expresión de genes de semillas y sus relaciones con los hotspots de eQTL

Se observaron patrones complejos de sesgo direccional para genes regulados por múltiples eQTL. Creamos una red (Fig. 4, Supl. Tabla S11) a partir de los datos de eQTL para observar las conexiones entre los tres hotspots de eQTL en Chr 20, 7 y 13 (Fig. 3) con genes para rutas funcionales de semillas específicas agrupadas en estos Puntos calientes. Se encontró que la mayoría de estos genes con eQTL en el hotspot Chr 20 estaban regulados positivamente con el alelo Minsoy en el hotspot Chr 20 (Fig. 4, Supl. Tabla S11). En contraste, se encontró que la mayoría de estos genes con eQTL en los hotspots Chr 7 y 13 estaban regulados positivamente con el alelo Noir 1 en los respectivos loci. Es de destacar que se observaron patrones de sesgo direccional opuesto para algunos genes regulados por más de un eQTL. Un ejemplo de este fenómeno implicó un subconjunto de genes con mapeo de eQTL al intervalo cM total de ∼2493 a 2498 en Chr 20 y ∼797 cM en Chr 7 (Fig. 4, Suplemento Fig. S5, Suplemento Tabla S12). Esta red mostró que los niveles de transcripción para un subconjunto de genes se regulan positivamente con la presencia del alelo Minsoy en el locus 2493, y los niveles de transcripción de los mismos genes se regulan positivamente con la presencia del alelo Noir 1 en el locus 797. Los genes con niveles de transcripción regulados al alza con el alelo Minsoy incluían varios genes relacionados con la fotosíntesis, incluidos genes para plastocianinas, PsaN (Subunidad del centro de reacción del fotosistema I PSI-N), PsaF (Fotosistema I subunidad F), y LHCB3 y LHCB5 (proteínas de unión a clorofila que captan la luz). Regulación al alza de los niveles de transcripción de genes relacionados con la biosíntesis de ácidos grasos, que incluyen FAH1 (Ácido graso hidroxilasa 1) y MOD1 (Mosaic Death 1), una subunidad de la proteína transportadora enoil-acil (ACP) reductasa de un complejo que cataliza la síntesis de novo de ácidos grasos (Mou et al., 2000) también correspondió a la presencia del alelo Minsoy. Además, los 12 eQTL que se asignaron al intervalo de 2493 a 2498 cM para las transcripciones de genes de biosíntesis de ácidos grasos se regularon positivamente con la presencia del alelo Minsoy, mientras que los nueve eQTL que se asignaron al locus 797 cM para genes de biosíntesis de ácidos grasos se regularon positivamente con la presencia del alelo Noir 1. Estos hallazgos son consistentes con la presencia de un mayor contenido de aceite de semilla en el padre Minsoy versus el padre Noir 1 y el papel de la fotosíntesis y la biosíntesis de ácidos grasos en la acumulación de aceite de semilla.

Conexiones entre tres puntos críticos de loci de rasgos cuantitativos de expresión principal (eQTL) implicados en los principales procesos de semillas y específicos de semillas. Una representación en red muestra interacciones entre fotosíntesis, biosíntesis de ácidos grasos (FA), oleosina y otros genes específicos de semillas con eQTL compartido representado por separado en la Fig. 3. La Tabla complementaria S8 muestra los datos de genes y eQTL representados en este diagrama. Los nodos grises en la parte superior representan los tres puntos calientes principales de eQTL en los loci en los cromosomas (Chr) 7 (∼797 cM total), 13 (∼1627 cM total) y 20 (2493–2498 cM total). Nodos verdes = genes de fotosíntesis. Nódulos rosados ​​= genes de biosíntesis de ácidos grasos. Nódulos anaranjados = genes de oleosina. Nódulos amarillos = genes específicos de la semilla distintos de los genes de oleosina. Las conexiones de genes con acumulación de transcripciones reguladas positivamente por la presencia del alelo Minsoy se muestran con líneas rojas. Las conexiones de genes con acumulación de transcripciones reguladas positivamente por la presencia del alelo Noir1 se muestran con líneas azules. Las líneas onduladas indican genes que están dentro cis-Distancias de actuación desde el lugar del punto de acceso.

Candidatos de genes reguladores en el hotspot eQTL de semillas del cromosoma 20

Se encontró que dos eQTL eran candidatos cis-reguladores que actúan de los 269 eQTL en el locus 2498 (Suplemento Tabla S9): uno de los genes de oleosina (Glyma20g33850) y un BME3 (Blue Micropylar End 3) Gen del factor de transcripción GATA (motivo de unión al ADN) (Glyma20g32050). Aunque existen varios genes de oleosina en la soja, el gen de la oleosina Glyma20g33850 alineado con la mayor homologa a la OLE3 (Oleosina 3) gen en maní (Arachis hypogaea L.). Recientemente se demostró que la oleosina 3 de la semilla de maní inmadura posee biosíntesis de diacilglicerol y actividad enzimática de hidrólisis de fosfatidilcolina que proporciona evidencia de un papel directo en el aumento del contenido de aceite a través de la biosíntesis de triacilglicerol a partir de monoacilglicerol (Parthibane et al., 2012a). Secuenciación del BME3 El gen de la soja en los genotipos Minsoy versus Noir 1 reveló polimorfismos de secuencia correspondientes a mutaciones sin sentido en cuatro aminoácidos (T → A, Q → L, V → F, S → T) conservados entre los factores de transcripción BME3 de soja y Arabidopsis. El motivo vinculante para BME3, WGATAR, también se encontró en las regiones promotoras de 251 de los 257 genes con mapeo de eQTL en el locus 2498.

El examen de los 319 genes ubicados en el hotspot Chr 20 eQTL mostró que solo había ocho genes específicos de semillas y 34 genes de factores de transcripción en esta ubicación. Los datos de acumulación de transcripciones de genes de perfiles de RNA-seq compilados a partir de líneas casi isogénicas HiPro y LoPro con contenido de aceite y proteína de semilla contrastante (Bolon et al., 2010 Severin et al., 2010b) muestran que el gen específico de semilla con la expresión más alta en este locus está el gen de la oleosina Glyma20g33850 (Fig. 5A, Suplemento Tabla S13). Además, la acumulación de transcripciones de genes fue mayor en el genotipo con mayor contenido de aceite de semilla (LoPro, Fig. 5B, Supl. Tabla S13). Entre los genes del factor de transcripción en este locus, la acumulación de transcripciones para el BME3 gen del factor de transcripción Glyma20g32050 también fue el más alto, con una acumulación de transcripción general ligeramente mayor en el genotipo LoPro (Fig. 5C, Supl. Tabla S13). Los altos niveles de expresión génica destacaron estos dos genes de entre los 319 genes que se demostró que residen en el hotspot Chr 20 eQTL en el genoma de la soja de referencia. Además, estos mismos dos genes (Glyma20g33850 y Glyma20g32050) fueron los únicos genes en este locus con semilla eQTL en los M × N RIL que se cartografiaron de nuevo en el locus Chr 20 eQTL.

Evidencia de secuenciación de ácido ribonucleico (RNA-seq) para genes ubicados en el hotspot de loci de rasgos cuantitativos de expresión (eQTL) en el cromosoma (Chr) 20. (A) El y El eje muestra RNA-seq RPKM (lecturas por kilobase de transcripción por millón de lecturas mapeadas) recuentos para cada tejido representado como una barra de color. Los genes específicos de la semilla en el locus se muestran a través del X eje con barras de colores que representan diferentes etapas de la semilla. Ocho genes específicos de la semilla residen en este locus, y el gen específico de la semilla con la mayor evidencia de acumulación de transcripciones es el gen de la oleosina. Glyma20g33850. (B) El y El eje muestra los recuentos de RPKM de secuencia de ARN para cada genotipo (LoPro = Rojo, HiPro = Azul) representado como una barra de color. los X El eje muestra una línea de tiempo de las etapas de desarrollo de las semillas. Transcript accumulation of Glyma20g33850 is higher in LoPro than HiPro during seed development. (C) The y axis shows RNA-seq RPKM counts for each tissue represented as a colored bar (leaf, flower, pod, shell [stages –1 and –2], seed [stages –2, –1, 0, 1, 2, 3, 4], root, and nodule tissues). Transcription factor genes at the locus are shown across the X eje. The transcription factor gene at this locus with the greatest evidence for transcript accumulation is the GATA (DNA binding motif) gene Glyma20g32050. Supplemental Table S13 shows the RNA-seq read evidence for genes in this region in LoPro vs. HiPro across this range of tissues.

EQTL that Colocalize with Seed Phenotypic QTL

To identify other potential genes and pathways that correlate with seed oil and protein accumulation in the immature seed, we also examined eQTL for colocalization with seed oil and protein QTL locations mapped in the M × N RIL population. Expression QTL for 1598 unique genes were found to map to seed oil and protein QTL intervals in this population (Suppl. Fig. S6, purple bars represent seed QTL intervals from Suppl. Table S3). A list of 129 unique genes with cis-acting eQTL that colocalized to the region of a seed protein or oil QTL was compiled and included genes with lipid-associated annotations (Suppl. Table S14). A cis-acting eQTL that overlaps an oil QTL on Chr 8 was also mapped for a gene with homology to the COMATOSE (CTS) ATP-binding cassette (ABC) transporter gene in Arabidopsis.


Mapping trigenic interactions quantitatively and surveying the global trigenic landscape

To explore the trigenic interaction landscape, we designed query strains that sampled three key quantitative features of our global digenic interaction network (7). We designed query strains carrying mutations in two genes spanning a range of the following features: (1) digenic interaction strength, (2) number of digenic interactions (average digenic interaction degree), and (3) digenic interaction profile similarity (Fig. 1A and table S1). Gene pairs were selected to fill bins of varying digenic interaction attributes and to cover all major biological processes in the cell, thus producing a sample that would provide a diverse survey of the trigenic interaction landscape. We largely focused on unambiguous singletons because duplicated genes represent a relatively small subset of genes and thus can only represent a small fraction of the global trigenic interaction network. For this survey, we constructed 151 double-mutant query strains and 302 single-mutant strains, encompassing 47 temperature-sensitive alleles of different essential genes and 255 deletion alleles of nonessential genes. The query strains in this set were selected to span the different digenic attribute bins according to predefined thresholds (table S1). An additional 31 double-mutant queries fell outside of the defined thresholds but were included for validation and comparison purposes (data S1 to S3) (16). The fitness of the resulting query strains was measured using a quantitative growth assay, and the behavior of the single- and double-mutant query strains showed strong agreement with our previously published data set (figs. S1 and S2 and data S4) (7, 15).

(A) Criteria for selecting query strains for sampling trigenic interaction landscape of singleton genes in yeast. The gene pairs were grouped into three general categories based on a range of features: (1) Digenic interaction strength. Gene pairs were directly connected by zero to very weak (digenic interaction score: 0 to –0.08, norte = 74 strains), weak (–0.08 to –0.1, norte = 32), or moderate (<–0.1, norte = 45) negative digenic interactions. (2) Number of digenic interactions. Gene pairs had a low (10 to 45 interactions, norte = 50), intermediate (46 to 70, norte = 53), or high (>71, norte = 48) average digenic interaction degree (denoted by the number of black edges of each node). (3) Digenic interaction profile similarity. Gene pairs had low (score: –0.02 to 0.03, norte = 46 represented by genes A and B, which show a relatively low overlap of genetic interactions with genes K to R), intermediate (0.03 to 0.1, norte = 59 represented by genes C and D, which display an intermediate overlap of genetic interactions), or high (>0.1, norte = 46, represented by genes E and F, which display a relatively high level of overlap of genetic interactions) functional similarity, as measured by digenic interaction profile similarity and coannotation to the same GO term(s). Query mutant genes were either nonessential deletion mutant alleles (Δ) or conditional temperature-sensitive (ts) alleles of essential genes. (B) Diagram illustrating the triple-mutant SGA experimental strategy. To quantify a trigenic interaction, three types of screens are conducted in parallel. To estimate triple-mutant fitness, a double-mutant query strain carrying two desired mutated genes of interest (red and blue filled circles) is crossed into a diagnostic array of single mutants (black filled circle). Meiosis is induced in heterozygous triple mutants, and haploid triple-mutant progeny is selected in sequential replica pinning steps. In parallel, single-mutant control query strains are used to generate double mutants for fitness analysis. (C) Triple-mutant SGA quantitative scoring strategy. The top equation shows the quantification of a digenic interaction, where εij is the digenic interaction score, ƒij is the observed double-mutant fitness, and the expected double-mutant fitness is expressed as the product of single-mutant fitness estimates ƒIƒj. In the bottom equation, the trigenic interaction score (τijk) is derived from the digenic interaction score, where ƒijk is the observed triple-mutant fitness and ƒIƒjƒk is the triple-mutant fitness expectation expressed as the product of three single-mutant fitness estimates. The influence of digenic interactions is subtracted from the expectation, and each digenic interaction is scaled by the fitness of the third mutation.

Trigenic interaction screening required development and implementation of three operational components. First, synthetic genetic array (SGA) analysis—an automated form of yeast genetics that is often used to cross a query gene mutation into an array of single mutants to generate a defined set of haploid double mutants (6)—was adapted such that a double-mutant query strain could be crossed into an array of single mutants to generate triple mutants for trigenic interaction analysis (Fig. 1B). Because the identification of a trigenic interaction requires comparison with the corresponding double mutants, we also conducted screens in which the individual mutants of the query gene pair were scored for digenic interactions (Fig. 1B). Second, for experimental feasibility, we assembled a diagnostic array of 1182 strains, comprising 990 nonessential gene deletion mutants and 192 essential gene mutants carrying temperature-sensitive alleles, which combine to span

20% of the yeast genome (data S5). The diagnostic array was designed to be highly representative of the rest of the genome in terms of exhibited genetic interaction profiles (fig. S3). Briefly, array strains were selected from a larger genetic interaction data set for their ability to represent different regions of the global network in a minimally redundant way. This was accomplished by iteratively selecting strains to maximize the performance of profile similarities when predicting coannotations to a functional gold standard (17). Third, we developed a scoring method, the τ-SGA score, which combines double- and triple-mutant fitness estimates derived from colony size measurements to identify trigenic interactions quantitatively (Fig. 1C). The τ-SGA score differs from the MinDC score reported previously (18), because it accounts for all cases in which two of the genes are not independent, resulting in an expectation that contains digenic interaction effects scaled by the fitness of the noninteracting genes (fig. S4) (16). The final trigenic τ-SGA interaction score then accounts for digenic effects but also enables detection of trigenic interactions in which digenic effects of insufficient explanatory power can be found.

We focused exclusively on the analysis of deleterious negative trigenic interactions for two reasons. First, quantitative scoring of negative genetic interactions is often more accurate than that for positive interactions because there is a greater signal-to-noise ratio for negative genetic interactions. Hence, negative genetic interactions are associated with lower false-positive and false-negative rates than positive interactions (8), a feature that is important for the robust statistical analysis necessary to differentiate true trigenic interactions from the extensive background digenic network. Second, negative digenic interactions are generally more functionally informative than positive digenic interactions (8), and thus the large-scale mapping of a negative trigenic interaction network is expected to provide the most mechanistic insight into gene function and pathway wiring.


The Jones Lab

We study the evolution of complex traits by simulating phenotypes determined by multiple loci and environmental effects. These traits harbor genetic variation, which is critical for evolution to occur. The genetic variance is often summarized in a matrix, called the GRAMO-matrix, which contains additive genetic variances and additive genetic covariances. los GRAMO-matrix describes the genetic architecture of complex traits. The Jones Lab, in collaboration with Steve Arnold (Oregon State University) and Reinhard Bürger (University of Vienna), has been using individual-based simulations to study the evolution of the genetic architecture (and other related issues).

The software we have used for our papers is freely available on GitHub. To learn more about these packages, consult our program note:

Jones, A. G., R. Bürger, and S. J. Arnold. 2018. The GRAMO-matrix simulator family: software for research and teaching. Journal of Heredity 109:825-829.

To write your own GRAMO-matrix simulation software, consult Adam Jones’ book:

C++ for Biologists: Evolutionary Models

(A free pdf is available here, or a hard copy can be purchased from Amazon)

Here is a summary of the available software packages:

G-matrix Simulator 2014: A Windows-based simulator that contains the code to produce the results reported by Jones et al. 2003, 2004 and 2012. This simulator has a graphical user interface and only works on Windows-based machines. Relevant papers:

Jones, A. G., S. J. Arnold, and R. Bürger. 2003. Stability of the G-matrix in a population experiencing pleiotropic mutation, stabilizing selection, and genetic drift. Evolution 57:1747-1760.

Jones, A. G., S. J. Arnold, and R. Bürger. 2004. Evolution and stability of the G-matrix on a landscape with a moving optimum. Evolution 58:1639-1654.

Jones, A. G., R. Bürger, S. J. Arnold, P. A. Hohenlohe, and J. C. Uyeda. 2012. The effects of stochastic and episodic movement of the optimum on the evolution of the G-matrix and the response of the mean to selection. Journal of Evolutionary Biology 25:2210-2231.

G-matrix Home Version: This version of the simulator is similar to the 2014 version under the hood, but it has been streamlined to make it more usable in an instructional setting. This version is used in the Evolutionary Quantitative Genetics Workshop offered by Steve Arnold and Joe Felsenstein every summer.

G-matrix Command Line: A version of the simulator without a graphical user interface. The source code should compile for any operating system with a standard C++ compiler.

Local Adaptation and Epistasis: With this simulator, we explored the effects of pleiotropy and epistasis on the evolution of local adaptation. We also investigated the feasibility of detecting the loci affecting the trait in genome-wide scans of population differentiation. The results of this study are reported in the following paper:

Jones, A. G., S. J. Arnold, and R. Bürger. 2019. The effects of epistasis and pleiotropy on genome-wide scans for adaptive outlier loci. Journal of Heredity, in press.


Book Recommendation: Complex Traits and Complex Genetic Architecture - Biology

The research interest of our group is to understand the genetic architecture of complex quantitative traits important to modern agriculture, environmental quality, evolutionary biology, and biomedicine. We study fundamental genetic processes that underlie phenotypic variation and evolution across time and space scales and functional signals. The extraordinarily high complexity of such genetic processes has prompted and intrigued us to develop powerful experimental designs and statistical models for dissecting their underlying mechanisms with the aid of analytical tools from other disciplines, such as control theory and game theory.

In nature, no cell or organism can grow in isolation. Instead, they exist with other interacting members in a community or ecosystem. We have incorporated evolutionary game theory to model how such ecological interactions affect the phenotypic formation of any individual in a population. Mathematical equations have been established to quantify the independent growth of an individual (i.e., growth by assuming that it is in isolation) and its interactive growth with other conspecifics in the shared environment. Our group is interested in developing game-theoretic models for mapping ecological QTLs that mediate independent growth vs. interactive growth through competition and collaboration. These models are being generalized to ecological interactions that take place at a wide range of levels of organization from proteins and RNA to cells to complex organisms.

We have always enjoyed generating aggressive ideas for our genetic and genomic research. On one hand, we have developed new theory, designs, and methods simulated from the latest discoveries of quantitative genetics and biology, which are used for next-level hypothesis tests by other researchers. On the other hand, established theoretical ideas are further used to design new experiments and collect new experimental data from which to gain new insight into various genetic processes.

The Liu Lab

Statistical Genetics: We are interested in developing novel statistical methods and computational tools for analyzing large scale genomic datasets. We have developed methods for analyzing rare variant association studies using sequence data, approaches for integrating multiple omics datasets, as well as efficient tools for large scale data analysis. Our methods and tools are being actively applied in hundreds of genetic studies worldwide.

Addition Genetics: We are actively pursuing a better understanding on the genetic basis for nicotine addiction. To do so, we seek to aggregate very large datasets on tobacco use phenotypes (in collaboration with the GSCAN consortium), integrate phenotypes of nicotine metabolites, smoking topography and tobacco use (in collaboration with TCORS at Penn State), and develop powerful and scalable methods that enable these analyses.

Functional Biology of X-inactivation We aim to understand the genetic regulation of X-inactivation using integrative genomics approach and apply these methods to study lupus genetics.


Abstracto

Core Ideas

  • Functional mapping uncovers the genetic architecture of shoot growth dynamics.
  • Gibberellic acid is an underlying component for natural variation for shoot growth dynamics in rice.
  • Genomic prediction is effective for improving early growth dynamics.

Early vigor is an important trait for many rice (Oryza sativa L.)-growing environments. However, genetic characterization and improvement for early vigor is hindered by the temporal nature of the trait and strong genotype × environment effects. We explored the genetic architecture of shoot growth dynamics during the early and active tillering stages by applying a functional modeling and genomewide association (GWAS) mapping approach on a diversity panel of ∼360 rice accessions. Multiple loci with small effects on shoot growth trajectory were identified, indicating a complex polygenic architecture. Natural variation for shoot growth dynamics was assessed in a subset of 31 accessions using RNA sequencing and hormone quantification. These analyses yielded a gibberellic acid (GA) catabolic gene, OsGA2ox7, which could influence GA levels to regulate vigor in the early tillering stage. Given the complex genetic architecture of shoot growth dynamics, the potential of genomic selection (GS) for improving early vigor was explored using all 36,901 single-nucleotide polymorphisms (SNPs) as well as several subsets of the most significant SNPs from GWAS. Shoot growth trajectories could be predicted with reasonable accuracy using the 50 most significant SNPs from GWAS (0.37–0.53) however, the accuracy of prediction was improved by including more markers, which indicates that GS may be an effective strategy for improving shoot growth dynamics during the vegetative growth stage. This study provides insights into the complex genetic architecture and molecular mechanisms underlying early shoot growth dynamics and provides a foundation for improving this complex trait in rice.

Abreviaturas

E arly vigor , defined as a plant's ability to accumulate shoot biomass rapidly during early developmental stages, is critical for stand establishment, resource acquisition, and, ultimately, yield. The rapid emergence of leaves leads to early canopy closure, which reduces soil evaporation, thereby improving seasonal water use efficiency and conserving water for later vegetative growth and grain production. In rice, early vigor is a particularly important trait for regions where rice is direct seeded ( Mahender et al., 2015 ). As the cost of labor rises, a shift from the labor-intensive practice of transplanted rice to direct-seeded rice is the expected solution to solve this problem ( Mahender et al., 2015 ).

Several studies have examined seedling vigor in rice and elucidated the underlying genetic basis using conventional phenotyping strategies under field and greenhouse conditions ( Redoña and Mackill, 1996 Lu et al., 2007 Cairns et al., 2009 Rebolledo et al., 2012a 2012b , 2015 Liu et al., 2014 ). In a recent study by Rebolledo et al (2015) , multiple vigor-related traits such as plant morphology and nonstructural carbohydrates were quantified in a rice diversity panel of 123 rosal japonés varieties ( Rebolledo et al., 2015 ). The authors integrated multiple phenotypic metrics in a functional–structural plant model, called Ecomeristem, and performed GWAS mapping using phenotypic metrics and model parameters as trait values ( Luquet et al., 2012 Rebolledo et al., 2015 ). Such multitrait approaches provide a more comprehensive understanding of the biochemical and genetic basis of early vigor than conventional single trait approaches.

Early vigor is a function of time. The timing of developmental switches that initiate tiller formation and rapid exponential growth are a crucial component of this trait. However, despite this temporal dimension, most studies have assessed the genetic basis of early vigor at one or a few discrete time points ( Redoña and Mackill, 1996 Lu et al., 2007 Cairns et al., 2009 Rebolledo et al., 2012a 2012b , 2015 Liu et al., 2014 ). Such approaches are overly simplistic and may only provide a snapshot of the genetic determinants that cumulatively influence the final biomass. However, sampling for biomass at high frequencies over a developmental window for mapping populations using conventional destructive phenotyping approaches would require tens to hundreds of thousands of plants and be highly labor-intensive. With the advent of high-throughput image-based phenomic platforms, plants can be phenotyped nondestructively more frequently throughout their growth cycle to examine the temporal dynamics of physiological and morphological traits ( Berger et al., 2010 Golzarian et al., 2011 Busemeyer et al., 2013 Topp et al., 2013 Moore et al., 2013 Würschum et al., 2014 Hairmansis et al., 2014 Slovak et al., 2014 Yang et al., 2014 Honsdorf et al., 2014 Chen et al., 2014 Bac-Molenaar et al., 2015 ).

Mathematical equations that describe a developmental or physiological process can be applied to this high-resolution temporal data to describe temporal growth trajectories using mathematical parameters. Several models, such as logistic, exponential, and power-law functions, have been used to describe plant growth ( Paine et al., 2012 ). These approaches enhance the temporal resolution of phenotyping and, when combined with association or linkage mapping, improve the power to detect genetic associations for complex traits compared with traditional cross-sectional approaches ( Wu and Lin, 2006 Xu et al., 2014 Campbell et al., 2015 ). However, despite the recent advances in phenotyping technologies, the genetic basis of early growth dynamics in rice or other cereals remains largely unexplored.

Multiple and sometimes uncorrelated phenotypes determine the rate and extent of vegetative growth in crops. We hypothesize that capturing growth dynamics at a higher temporal resolution can help elucidate the genetic basis of this trait. To this end, we sought to examine the genetic architecture of temporal shoot growth dynamics during the early and active tillering stages (8–27 d after transplanting (DAT) and 19–41 DAT) in rice. A panel of ∼360 diverse rice accessions was phenotyped using a nondestructive image-based platform and temporal trends in shoot growth were modeled with a power-law function ( Zhao et al., 2011 ). We provide insights into the genetic basis of shoot growth by using GWAS analysis. The underlying molecular mechanisms were explored using RNA sequencing on a subset of the diversity panel during the early tillering stage. Genomic selection of the model parameters and daily estimates of shoot biomass suggest that GS may be an effective strategy for improving early vigor in rice.


Book Recommendation: Complex Traits and Complex Genetic Architecture - Biology

How does genetic variation impact phenotypic traits, both at the organismal and cellular level (including an emphasis on gene regulation)? What are the molecular pathways from genetic variation to cellular and organismal phenotypes? Why does so much of the genome contribute to the genetic basis of complex traits?

Our lab includes people trained in a variety of different fields using computational and experimental approaches to tackle these problems. We often work on problems where there are no off-the-shelf statistical methods. Thus, an important part of our work is in developing appropriate statistical and computational approaches that can yield new insights into biological data.

Useful links

Lab News

And welcome to our new PhD students Alyssa Fortier y Roshni Patel and new postdocs: Sahin Naqvi, Jeff Spence, Hakhamanesh Mostafavi y Clemens Weiss!

May: New papers include our latest work on understanding genetic architecture of complex traits (the "Omnigenic 2" paper) with Xuanyao Liu and Yang Li: [Link] and our paper with the Criswell, Marson and Greenleaf labs on the chromatin structure of immune cells (led by Diego in our lab, with Michelle Nguyen and Anja Mezger): [Link] Congratulations to Diego, Xuanyao, Yang and the rest of the teams!

January: Bienvenido a Shaila Musharoff who is joining us this month!

Diciembre: Farewell to David y Emily! They will both be greatly missed. David will be starting his own lab at NY Genome Center, and Emily is taking her genomics expertise into the consulting world.

9/18/2018. News roundup:

Comings and goings:
August: Welcome to our new postdocs Jake Freimer y Yuval Simons!

Eilon took a job as one of the first scientists at the new firm Insitro, founded by Daphne Koller. Bon Voyage to Eilon!

Emily defended her thesis! Congratulations Emily! She will stay in the lab through the end of the year to finish papers.

enhorabuena a Natalie y Ben, both lab alumni, on their lovely wedding.

July: Lab alumna Alexis Battle was awarded early tenure in Biomedical Engineering at Johns Hopkins. Wonderful news!

Junio: Hannah M received the Robert Baynard Textor award from the Department of Anthropology, for 'creativity in anthropology'. Well done, and well-deserved, Hannah!

May: Arbel graduated and moved to a postdoc position in Molly Przeworski's lab at Columbia. In August he and his wife Maya welcomed twin baby boys! ¡Felicidades! This is the third twin pair in the lab in the last 7 years. Is this a significant enrichment?

Jonathan's plenary talk from PEQG on the Omnigenic model (with Evan, Yang and Xuanyao) is online here.

March: Natalie graduated and moved to a position as a staff scientist at Ancestry. Congratulations Natalie! We miss you!

January: Kelley has moved to start her own lab in the Department of Genome Sciences at University of Washington. We are excited to follow her progress in Washington!

10/25/2017. News roundup:

October: ASHG: Natalie gave a well-received plenary talk to 7000 people on her side-project on conference gender dynamics and Nasa, Yang, Emily and David also gave very nice platform presentations. Well done everyone!

Actualizar: Nasa won ASHG's best student talk (for work with Melina Claussnitzer). Well done!!

We have several papers out or about to come out in journals: Eilon on using cfDNA to measure transplant rejection Yang and David on LeafCutter (splicing) Diego on estimating cell types driving complex traits Arbel on NAGC in gene duplicates Jessica on triclosan and microbiomes (working with Ami's lab).

enhorabuena a Ziyue on her wedding!

September: Yang y Xun moved on to start their own labs. Bon voyage!!

enhorabuena a Harold who has been awarded a prestigious Hannah Gray postdoc-faculty fellowship from HHMI.

Junio: Bienvenido Nasa, Hannah and Margaret to the lab!

6/22/2017. News roundup for the last few months:

Junio: release of our perspective piece on the 'omnigenic' model of complex traits, with lead authors Evan Boyle y Yang Li [PDF Link]. Our paper stimulated a lot of discussion on social media and elsewhere, including Ed Yong's article in the Atlantic and in Stanford news.

May: Congratulations to 3 of our postdocs who have accepted assistant professor faculty positions for the coming academic year: Kelley Harris (U Washington, Genome Sciences), Yang Li (U Chicago, Genetic Medicine), and Xun Lan (Tsinghua U, Basic Medical Sciences).

Y Kelley also received a prestigious faculty transition award through the CASI program at Burroughs Wellcome Fund.

Natalie y Arbel received graduate fellowships from CEHG. Well done! Y Jonathan will become co-director of CEHG starting in June.

Diego's paper on inferring cell types that drive disease is up on bioRxiv.

April: Kelley had a very nice paper building on striking results from her PhD work: Rapid evolution of the human mutation spectrum, out this month in eLife [Link].

Harold, Evan y David each have new papers out about their work with other labs: Sleuth [Harold] and Cas9 Binding [Evan] and ASE for detecting GxE [David].

March: Anand has moved to a data scientist position at Facebook. We'll miss his amazing technical expertise and informal contributions to many projects in the lab! Bon Voyage, Anand!

December 2016. Arbel y Anand's work on how recurrent mutation alters the site frequency spectrum in large samples is now out in PLOS Genetics: [Link]. ¡Felicidades!

Natalie had a fun article in which she applied computational methods to study the history of the journal Genética since 1917 [Link]. [Timelapse plot of author locations]

Noviembre. Yair, Evan, y Natalie's paper on SDS and polygenic adaptation: Detection of human adaptation during the past 2000 years is out now in Science [Link]. ¡Felicidades!

9/20/2016. Bienvenido a Harold Pimentel who joined the lab last month!

También, Eilon has a paper out in Nature Genetics showing trans-interactions (i.e., trans-eQTLs) between MHC protein alleles and the expression of T cell receptor genes. With help from Leah Sibener and Chris Garcia we were able to interpret these in terms of physical interactions in the protein structure [Link]

6/1/2016. Lots of exciting news to report from April and May:

Anil's paper on using ribosome profiling data to detect novel open reading frames is now online at eLife [Link].

Xun's paper on the evolution of gene duplicates was published in Science [Link]. This received some nice attention, including in a blog post by Francis Collins.

Yair, Evan and Natalie's paper on very recent polygenic adapation is now out on bioRxiv [Link]. This got lots of attention, including news pieces in Nature and Science.

Yair y Yang both gave talks at Cold Spring's Biology of Genomes Meeting. It was also great to see talks from lab alumni Alexis Battle, Joe Pickrell y Dan Gaffney, and to get to hang out with many other colleagues, friends, and other lab alumni.

Here you can see a pair of great sketches of Yang and Yair, drawn by Alex Cagan.

4/28/2016. Well done Yang, whose paper RNA splicing is a primary link between genetic variation and disease is out today [Link]. This paper uses data from 7 years of joint projects between our lab and Yoav's lab to provide a detailed accounting of the links between genetic variation, variation in gene regulation and disease.

3/29/2016. Congrats to Evan (NSF predoc!). Also to Yang y David K on their Leafcutter paper on quantification of RNA splicing, out now on bioRxiv.

1/4/2016. Farewell and best wishes to Bryce (postdoc, Alkes Price lab, Harvard) and to Graham y Kyle, starting their own labs at the Salk Institute and UCSD, respectively.

11/20/2015. enhorabuena a Bryce for his masterful PhD defense in Chicago. It was a bittersweet occasion, marking the end of the U Chicago era.

9/14/2015. Bryce and Graham's WASP paper (QTL mapping with allele-specific reads) is out today in Nature Methods.

8/18/2015. We enjoyed a farewell dinner at the Counter on Friday for Audrey y Towfique (starting their own labs at U of Idaho and Mt Sinai, respectively). Bon voyage!

A big welcome to Kelley Harris y Ziyue Gao who are joining us as new postdocs from Rasmus Nielsen and Molly Przeworski's labs!

Welcome to short term visitor Dan Lawson and also Alexis Battle who is back to visit us briefly this month.

Congrats to Eilon and Michal on birth of their son Yuval!

In the grants department, well done to Kelley (NRSA), David G (EMBO/LLHF), Yang (CEHG), Jessica (NSF predoc)! And Natalie and Evan got a pair of internal research grants, one from Genetics and one from Systems Biology. Prestigio.

5/22/2015. JKP nearly done teaching. Catching up on news: Congratulations to Graham who is taking a faculty job at the Salk Institute!!

And congratulations to Towfique who is taking a faculty job at Mt Sinai.

And more congrats to Yang who has been awarded a CEHG postdoc fellowship for next year!

Y Xun's paper on evolution of gene duplications is out on bioRxiv.

4/2/2015. enhorabuena a David G. who has won a Dan David Prize scholarship!

3/31/2015. Congratulations to former lab member Melissa Hubisz, now at Cornell, for winning an NSF predoc award! Also well done to Jessica, Emily and Evan for honorable mentions.

12/18/2014. Alexis, Zia and Sidney's paper on the relationship between genetic variation and phenotypic variation in RNA, ribosomes, and proteins is out today. ¡Felicitaciones!

12/16/2014. enhorabuena a Cristina who completed her Ph.D defense in CS yesterday!!

12/04/2014. Anil and Heejung's paper on using multi-scale approaches to model DNase data at TF binding sites is out on bioRxiv.

11/11/2014. Our new website SciReader for scientific recommendations is out in beta release. You can check it out here: SciReader.org. Well done Priya, Natalie, Yonggan!

11/11/2014. Bryce and Graham's paper and software on unbiased allele-specific read mapping and powerful QTL mapping is out on bioRxiv and the corresponding WASP software is on GitHub.

9/22/2014. Lots of new arrivals this month: David, Yang, Anand and Emily visiting scholars: Audrey, Towfique and Kyle. ¡Bienvenido!

8/07/2014. This week we are moving into our long-term lab space in the Clark Center! We are very happy to be in the new space. In other news, Anand has been awarded a CEHG fellowship for next year. Well done, Anand!

6/24/2014. Alexis will be starting her own lab next month at Johns Hopkins in the departments of CS and Biostats [Link]. We wish her all the very best in her new position!!

6/24/2014. Well done to Eilon on winning the prestigious EMBO fellowship! David Golan, who will be joining in September has been awarded the Rothschild and Fulbright fellowships. Congrats to both!!

6/24/2014. Xun and Nick's paper on genetic influences on DNA methylation is out on bioRxiv [Link].

4/29/2014. Anil's fastSTRUCTURE paper is now out in Genetics: Link.

Alexis will be speaking next week at Biology of Genomes about her work with Zia and Sydney on understanding the effects of genetic variation on mRNA, translation and proteins.

4/2/2014. Darren Cusanovich's paper on knockdown of TFs in LCLs (with Yoav's lab) is out now in PLOS Genetics: Link. Choongwon Jeong's paper on adaptive introgression of high altitude adaptations from Sherpa into Tibetans (collaboration with Anna Di Rienzo's lab), is out now in Nature Communications: Link.

4/1/2014. Bon voyage to Heejung Kim she spent the winter term visiting us from Matthew's lab in Chicago.

3/1/2014. Welcome to Yair who has now arrived from Chicago with his family!

2/10/2014. Our paper on genetic load in human populations, joint with Guy Sella's lab, is out now in Nature Genetics. Well done to Yuval Simons (in Guy's lab) and Michael Turchin (now in Matthew Stephens' lab)! Link.

2/10/2014. Welcome to our new postdoc Eilon Sharon, who has moved here from Eran Segal's lab. Eilon will be joint with Hunter Fraser's lab. Welcome also to this term's rotation students: Peyton Greenside, Natalie Telis, Diego Calderon, Arbel Harpak and Emily Glassberg!

12/6/2013. Joe Davis has written a great blog post about Graham and Bryce's recent paper on genetic variation and histone modification.

12/4/2013. fastSTRUCTURE is out! Links to Anil's manuscript and beta-release software are here.

12/4/2013. Thanks to Christine Vogel for her perspective on Zia's evolution of mRNA/protein paper.

11/12/2013. Welcome to Yonggan and Priya who are joining the lab this month!

11/12/2013. Congrats to Jack/Athma/Roger whose paper on DNase QTLs was chosen as one of the top papers of 2012 in Regulatory and Systems Genomics at the RECOMB/ISCB meeting.

11/1/2013. There's a nice perspective in NRG by Hannah Storey on 4 recent papers--including one by Graham and Bryce--that studied the effects of genetic variation on histone mods.

10/30/2013. Kudos to Shyam for winning the prestigious Charles Epstein Trainee Research Award (postdoc division) for his talk at ASHG on historical inference for African populations. Graham Coop is a previous winner from our lab (in 2007).

10/22/2013. Congratulations to lab alum Joe Pickrell who has just accepted a position as one of the first faculty at the New York Genome Center. Además, Zia Khan is now in transit to his first faculty position--in CS at U. Maryland. Good luck to both!

10/22/2013. Darren's paper on knockdown experiments targeting 59 TFs is out on ArXiv.

10/17/2013. Zia and Graham/Bryce have a pair of papers out in Science today: evolution of protein expression in primates and effects of genetic variation on histone modifications. Congrats to Zia, Graham and Bryce!

10/17/2013. Ben Voight's 2006 paper on selection was highlighted in a nice blog article by Emma Ganley as part of the 10th anniversary celebrations at PLOS Biology.

10/11/2013. Welcome to our first two Stanford rotation students: Ilana Arbisser from the Biology department and Michael Sikora from Genetics!

8/1/2013. We are delighted to be moving to Stanford University. This will be a fantastic academic environment and a great place to live. That said, we will miss our many friends at the University of Chicago, where the lab was based for 12 years.

8/1/2013. Welcome to our newest postdoc Alexis Battle! It's great to have her onboard.

8/1/2013. Welcome to Anil, Stoyan and Xun, who are arriving at Stanford this month. The rest of the lab will follow soon or work from Chicago during the transitional period.

Hello World. The lab moves to Stanford on 8/1/2013, after 12 years at the University of Chicago.


Ver el vídeo: Sesión Académica - Historia genética y arquitectura de rasgos complejos en 6,000 genomas mexicanos (Noviembre 2022).