Información

Herramientas para modelar y visualizar el crecimiento de células.

Herramientas para modelar y visualizar el crecimiento de células.


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy buscando un programa / aplicación GUI / paquete que me ayude a hacer simulaciones para el crecimiento celular. Tengo un modelo matemático microscópico, y el escenario es básicamente el siguiente: comienzo con una celda en forma de varilla caracterizada por su centro y ángulo de dirección, crece hasta que alcanza cierta longitud, se divide en dos celdas idénticas cuyos ángulos cambian aleatoriamente y el proceso continúa.

¿Existe algún programa o paquete que pueda usar para tal situación? Encontré varios en GitHub, pero en su mayoría eran para procesos biológicos muy complicados. Uso Python / Julia / Matlab y puedo codificar, pero me preguntaba si hay herramientas para escenarios tan simples.


Modelado de sistemas biológicos

Modelado de sistemas biológicos es una tarea importante de la biología de sistemas y la biología matemática. [a] Biología de sistemas computacionales [b] [1] tiene como objetivo desarrollar y utilizar algoritmos eficientes, estructuras de datos, herramientas de visualización y comunicación con el objetivo de modelar por computadora los sistemas biológicos. Implica el uso de simulaciones por computadora de sistemas biológicos, incluidos los subsistemas celulares (como las redes de metabolitos y enzimas que comprenden el metabolismo, las vías de transducción de señales y las redes reguladoras de genes), tanto para analizar como para visualizar las complejas conexiones de estos procesos celulares. [2]

Una propiedad emergente inesperada de un sistema complejo puede ser el resultado de la interacción de la causa y el efecto entre partes integradas más simples (ver organización biológica). Los sistemas biológicos manifiestan muchos ejemplos importantes de propiedades emergentes en la compleja interacción de componentes. El estudio tradicional de los sistemas biológicos requiere métodos reductivos en los que se recopilan cantidades de datos por categoría, como la concentración en el tiempo en respuesta a un cierto estímulo. Las computadoras son fundamentales para el análisis y el modelado de estos datos. El objetivo es crear modelos precisos en tiempo real de la respuesta de un sistema a los estímulos ambientales e internos, como un modelo de una célula cancerosa para encontrar debilidades en sus vías de señalización, o un modelo de mutaciones en los canales iónicos para ver los efectos en los cardiomiocitos y a su vez, la función de un corazón que late.


Principios y métodos emergentes de modelado de células enteras

Los modelos de células completas predicen el fenotipo a partir del genotipo al representar cada función genética.

Los modelos de células completas podrían transformar la biociencia, la bioingeniería y la medicina.

Existen muchos desafíos para lograr modelos de células completas.

Las nuevas tecnologías de medición y modelado están permitiendo rápidamente el modelado de células completas.

Los esfuerzos en curso para crear herramientas de modelado escalables acelerarán el modelado de células completas.

Los modelos computacionales de células completas tienen como objetivo predecir los fenotipos celulares a partir del genotipo mediante la representación del genoma completo, la estructura y concentración de cada especie molecular, cada interacción molecular y el entorno extracelular. Los modelos de células completas tienen un gran potencial para transformar la biociencia, la bioingeniería y la medicina. Sin embargo, quedan numerosos desafíos para lograr modelos de células completas. Sin embargo, los investigadores están comenzando a aprovechar los avances recientes en tecnología de medición, bioinformática, intercambio de datos, modelado basado en reglas y simulación multi-algorítmica para construir los primeros modelos de células completas. Anticipamos que los esfuerzos en curso para desarrollar herramientas de modelado de células completas escalables permitirán modelos mucho más completos y precisos, incluidos modelos de células humanas.


Resultados y discusión

Medidas de control de calidad para experimentos de cribado CRISPR

Además de la determinación de genes esenciales con MAGeCK, un propósito central de MAGeCK-VISPR es recopilar mediciones de control de calidad (QC) en varios niveles (http://www.bioinformatics.babraham.ac.uk/projects/fastqc). Las medidas propuestas (Tabla 1) se pueden dividir en cuatro categorías: nivel de secuencia, nivel de recuento de lecturas, nivel de muestra y nivel de gen (Fig. 2).

La vista de control de calidad (QC) de VISPR, el marco de visualización de MAGeCK-VISPR. Las medidas incluyen la distribución del contenido de GC (a), calidad base mediana (B), la distribución de la calidad media de la secuencia (C), el número de sgRNA de recuento cero (D), Índice de Gini (mi), el número total de lecturas y el porcentaje de lecturas asignadas (F), Gráfico de análisis de componentes principales (PCA) (gramo), distribución normalizada del recuento de lecturas (h, I) y correlaciones muestrales por pares (j). Los resultados mostrados son de ESC (a-F) y conjunto de datos de melanoma (gramo-j)

Las mediciones de CC a nivel de secuencia tienen como objetivo detectar problemas con la secuenciación, de forma similar a otros experimentos de secuenciación de próxima generación (NGS). Se informan dos mediciones: la distribución del contenido de GC de la muestra (Fig. 2a) y la distribución de la calidad base de las lecturas de secuenciación (Fig. 2b, c). Idealmente, las lecturas de secuenciación deben tener cualidades de base razonables (valor mediano & gt25), y las muestras del mismo experimento deben tener distribuciones de contenido de GC similares.

El segundo nivel de mediciones de QC se basa en los recuentos de lecturas de sgRNA recopilados de MAGeCK. Las lecturas de secuenciación sin procesar se mapean primero en secuencias de ARNg de la biblioteca sin que se toleren desajustes. Después de eso, el número de lecturas de secuenciación, lecturas mapeadas (y de ahí el porcentaje de lecturas mapeadas), sgRNA con recuento de lectura cero y el índice de Gini de distribución del recuento de lectura se informan para cada muestra (Fig. 2d-f). El porcentaje de lecturas mapeadas es un buen indicador de la calidad de la muestra, y la baja capacidad de mapeo podría deberse a un error de secuenciación, error de síntesis de oligonucleótidos o contaminación de la muestra. El buen poder estadístico del análisis posterior se basa en lecturas suficientes (preferiblemente más de 300 lecturas) para cada sgRNA, con un número bajo de sgRNA de recuento cero en la biblioteca de plásmidos o puntos de tiempo tempranos. El índice de Gini, una medida común de la desigualdad de ingresos en economía, puede medir la uniformidad de los recuentos de lecturas de sgRNA [14]. Es perfectamente normal que los puntos de tiempo posteriores en los experimentos de selección positiva tengan un índice de Gini más alto, ya que algunos clones supervivientes (algunos sgRNA con recuentos extremadamente altos) podrían dominar el grupo final mientras que la mayoría de las otras células mueren (más sgRNA con recuento cero ). Por el contrario, un índice de Gini alto en la biblioteca de plásmidos, en puntos de tiempo tempranos o en experimentos de selección negativa puede indicar irregularidades en la síntesis de oligonucleótidos CRISPR, baja eficiencia de transfección viral y sobre selección, respectivamente.

El control de calidad del nivel de muestra (Fig. 2g-j) comprueba la coherencia entre las muestras. MAGeCK-VISPR informa las distribuciones de recuentos de lectura normalizados por diagramas de caja y funciones de distribución acumulativa. También calcula las correlaciones de Pearson por pares de los recuentos de lecturas de registros de muestras y extrae las muestras de los primeros tres componentes de un análisis de componentes principales (PCA). Las réplicas biológicas o las muestras con condiciones similares deben tener distribuciones de recuento de lecturas similares y correlaciones más altas, y aparecer más cercanas entre sí en el gráfico de PCA. Los gráficos de PCA también pueden identificar los posibles efectos de los lotes si las pantallas se realizan en diferentes lotes.

Finalmente, el control de calidad a nivel genético determina el grado de selección negativa en las pantallas. Dado que la eliminación de genes ribosomales conduce a un fenotipo de selección negativa fuerte [1, 2], la importancia de la selección negativa en genes ribosomales puede evaluarse en MAGeCK-VISPR mediante análisis de enriquecimiento de Ontología Genética (GO) utilizando GOrilla [15]. Un experimento de selección negativa que funcione debería tener una PAG valor (& lt0.001), aunque muchos buenos experimentos podrían tener mucho más pequeño PAG valores (& lt1e-10, consulte la sección A del archivo adicional 1).

Llamar a genes esenciales en múltiples condiciones con MAGeCK-MLE

MAGeCK-VISPR incluye un nuevo algoritmo, "MAGeCK-MLE", para estimar la esencialidad de los genes en diversas condiciones de detección utilizando un enfoque de estimación de máxima verosimilitud (MLE). En comparación con el algoritmo MAGeCK original que utiliza la agregación de rango robusto ("MAGeCK-RRA") que solo puede comparar muestras entre dos condiciones, MAGeCK-MLE puede modelar diseños experimentales complejos. Además, MAGeCK-MLE modela explícitamente la eficacia de la desactivación del sgRNA, que puede variar en función de diferentes contenidos de secuencia y estructuras de cromatina [11, 12]. En MAGeCK-MLE, el recuento de lectura de un sgRNA I gen objetivo gramo en la muestra j se modela como una variable aleatoria binomial negativa (NB). La media de la distribución NB (μ ij) depende de tres factores: la profundidad de secuenciación de la muestra j (s j), la eficacia de nocaut del sgRNA I, y una combinación lineal de los efectos en diferentes condiciones (es decir, diferentes tratamientos farmacológicos) en los genes gramo. Si sgRNA I anula el gen objetivo gramo eficientemente, entonces μ ij se modela como:

Los efectos de r diferentes condiciones se representan como la puntuación "β gramo", Una medida de selecciones de genes similar al término de" cambio logarítmico "en el análisis de expresión diferencial. La presencia o ausencia de cada condición en cada muestra se codifica en elementos binarios de la matriz de diseño d jr, y se puede obtener a partir de diseños de experimentos. "βLas puntuaciones reflejan el grado de selección en cada condición: β gramo & gt0 (o & lt0) significa gramo se selecciona positiva (o negativamente) en la condición r. μ ij también depende de β I0, la abundancia inicial de sgRNA que normalmente se mide en plásmido o el día 0 del experimento.

Los valores de β, junto con la información de si un sgRNA es eficiente, se puede estimar maximizando la probabilidad logarítmica conjunta de observar todos los recuentos de lectura de sgRNA de gramo en todas las muestras diferentes y se optimizan mediante un algoritmo de maximización de expectativas (EM). En el algoritmo EM, MAGeCK-MLE determina iterativamente la eficiencia de eliminación de cada sgRNA en función de la estimación actual de "β"Puntuaciones (el paso E), y utiliza la información de eficiencia de knockout actualizada para volver a calcular"β"Puntuaciones (el paso M). Al examinar los patrones de recuentos de lectura de cada sgRNA en todas las muestras, el algoritmo EM minimiza el efecto de sgRNA ineficientes. En la sección de Métodos se presenta una descripción detallada del método.

Probamos los algoritmos MAGeCK en cuatro conjuntos de datos públicos. Los dos primeros conjuntos de datos (el conjunto de datos 'ESC' y 'leucemia') corresponden a experimentos de selección negativa en células madre embrionarias de ratón (ESC) y dos líneas celulares de leucemia humana (KBM7 y HL-60), respectivamente (Fig.3a yb) [1, 4]. En ambos conjuntos de datos, las células se cultivaron con su condición de crecimiento natural y se produjeron selecciones negativas en las células después de que se activa CRISPR / Cas9. Los otros dos conjuntos de datos (conjunto de datos de desactivación y activación de "melanoma") son diferentes cribados CRISPR en la línea de células de melanoma humano A375 que alberga una mutación BRAF V600E (Figuras 4 y 5). Las células se trataron con el inhibidor de BRAF vemurafenib (PLX) o el control de dimetilsulfóxido (DMSO) y se cribaron con GeCKO [2] o con bibliotecas de mediador de activación sinérgico CRISPR / dCas9 (SAM) [5]. Estos dos conjuntos de datos incluyen múltiples condiciones experimentales que son difíciles de comparar directamente usando el algoritmo original MAGeCK-RRA. En el conjunto de datos de knockout de melanoma, las células estaban bajo selección de 7 o 14 días [2]. En el conjunto de datos de activación del melanoma, se utilizaron dos fármacos diferentes (puromicina y zeocina) para seleccionar células con infección lentiviral, y se perfilaron los tratamientos con DMSO y PLX en una selección de 3 o 21 días [5].

Las puntuaciones de esencialidad genética (β puntuaciones) informadas por MAGeCK-MLE en dos condiciones. a, B los β puntuaciones de dos líneas celulares de leucemia en el conjunto de datos de leucemia (a) y dos réplicas biológicas de células ESC de ratón en el conjunto de datos ESC (B). En (a), también están marcados algunos genes impulsores conocidos y genes específicos del tipo de célula. Estos genes pueden desempeñar funciones distintas en dos subtipos de leucemia diferentes (HL60: leucemia mieloide aguda KBM7: leucemia mieloide crónica), incluidos CDK6 y TRIB1 para HL60 y RUNX1 en KBM7. Se requiere CDK6 en el crecimiento de la LMA [17] y se observa una sobreexpresión de TRIB1 en los pacientes con LMA en comparación con los pacientes con LMC [18]. Por otro lado, las frecuentes mutaciones de pérdida de función de RUNX1 se observan en transformaciones de LMC a LMA [19]. C Una ilustración de genes seleccionados diferencialmente identificados por algoritmos de comparación de dos condiciones (como RRA, rectángulos azules). MAGeCK-MLE puede distinguir aún más los genes específicos del tipo celular (puntos rojos) de otros genes. Los genes específicos del tipo de célula son genes que no tienen esencialidad en una condición, pero una fuerte esencialidad en la otra, y generalmente son más interesantes biológicamente.

los β puntuaciones de MAGeCK-MLE en el conjunto de datos de knockout de melanoma. a Una vista de agrupamiento de k-medias de β puntuaciones de todas las condiciones de los genes seleccionados superiores (k = 4). Solo genes con el 1% más alto o más bajo β Se muestran las puntuaciones en condiciones de tratamiento de 14 días con DMSO o PLX. B La distribución de puntuaciones en cuatro condiciones utilizando diferentes algoritmos. El rectángulo rojo en MAGeCK-MLE indica genes en el grupo 4 en la Fig. 4a, o genes que están fuertemente seleccionados positivamente en la condición PLX de 14 días. Algunos genes validados en el estudio original están marcados con puntos rojos, incluidos NF1, NF2, MED12 y CUL3

los β puntuaciones de MAGeCK-MLE en el conjunto de datos de activación del melanoma. a Una vista de agrupamiento de k-medias de β puntuaciones de todas las condiciones de los genes seleccionados superiores (k = 5). Solo genes con el 1% más alto o más bajo β Se muestran las puntuaciones en las condiciones de tratamiento de 21 días con DMSO o PLX. B la media β puntuaciones de genes en el grupo 5 de A (genes seleccionados consistentemente positivos en condiciones de zeocina y puromicina), así como β decenas de estos genes en el conjunto de datos knockout de melanoma. Similar a (a), el algoritmo de agrupación de k-medias se aplica a los genes seleccionados (k = 4)

En comparaciones de dos condiciones, MAGeCK-MLE da resultados similares con métodos existentes como MAGeCK-RRA, RSA y RIGER. Todos los algoritmos identificaron genes que son comúnmente esenciales para diferentes tipos de células [16], así como genes seleccionados positivamente conocidos en condiciones tratadas con PLX en dos conjuntos de datos de melanoma (Fig. 3 ver también la Sección A y B del archivo adicional 1). En el conjunto de datos de leucemia, los algoritmos de comparación de dos condiciones (como MAGeCK-RRA) identificaron genes que se seleccionan diferencialmente en dos líneas celulares mediante una comparación directa de HL60 y KBM7 (Fig. 3a) [10]. Sin embargo, no todos estos genes son igualmente interesantes desde el punto de vista biológico, ya que MAGeCK-MLE los distinguió en dos grupos: genes que tienen poco efecto en uno (puntuaciones β cercanas a cero) pero un fuerte efecto de selección en la otra línea celular (puntuaciones β absolutas grandes ) y genes que tienen efectos débiles y opuestos en dos líneas celulares (Fig. 3c). El primer grupo de genes suele ser más interesante desde el punto de vista biológico, ya que son genes específicos del tipo de célula. Esto incluye algunos genes conductores conocidos (como BCR en KBM7), así como genes que pueden ser funcionales en un solo tipo de célula: CDK6 y TRIB1 en HL60 [17, 18] y RUNX1 en KBM7 [19].

Una de las ventajas de MAGeCK-MLE sobre otros métodos es que permite comparaciones precisas de las esencialidades de los genes en múltiples condiciones y experimentos en una sola ejecución (Fig. 4 y Sección C del archivo adicional 1). En el conjunto de datos de knockout de melanoma, un agrupamiento de k-medias de las puntuaciones β de los genes seleccionados principales demostró que estos genes tienen varias esencialidades en todas las condiciones (Fig. 4a). Algunos de los genes se seleccionan universalmente positiva o negativamente en todas las condiciones (grupo 3), mientras que otros tienen una esencialidad diferente en diferentes condiciones (grupos 1, 2 y 4). Los genes del grupo 4 son particularmente interesantes ya que muestran una fuerte selección positiva en la condición tratada con PLX de 14 días. De hecho, los genes cuyo knockout conduce a una fuerte selección positiva en las células tratadas con PLX se encuentran en el grupo 4, incluidos NF1, NF2, MED12, CUL3 [2]. Por el contrario, los grupos de mediciones de k-means de otros algoritmos no revelaron el fuerte efecto de los genes en el grupo 4 (Sección C del archivo adicional 1). Esto se debe a que sus distribuciones de puntuación son similares en diferentes condiciones (Fig. 4b), y no reflejan el hecho de que una condición (tratamiento PLX de 14 días) induce una selección positiva mucho más fuerte que otras condiciones [2]. Esto se debe en parte a que MAGeCK-RRA, RIGER y RSA utilizan un método basado en rangos para comparar sgRNA entre dos condiciones, que pueden perder información cuantitativa.

Otro ejemplo del uso de MAGeCK-MLE en múltiples afecciones se demuestra en el conjunto de datos de activación del melanoma, donde las células se sometieron a diferentes métodos de selección (usando puromicina o zeocina), tratamientos con medicamentos (DMSO o PLX) y duraciones (tratamiento de 3 o 21 días). ) (Figura 5). De forma similar al conjunto de datos de desactivación del melanoma, realizamos un agrupamiento de k-medias de las puntuaciones β del gen seleccionado en la parte superior. Muchos genes seleccionados positivamente dependen del método de selección, que puede no ser biológicamente interesante. Por ejemplo, los genes de los grupos 2 y 4 corresponden a genes seleccionados positivamente que son específicos de la selección con puromicina o zeocina, respectivamente. Un pequeño conjunto de genes (grupo 5) se seleccionan constantemente tanto en zeocina como en puromicina, incluidos genes que están validados en el estudio original, por ejemplo, EGFR, GPR35, LPAR1 / 5 [5]. Además, examinamos los genes en el grupo 5 (Fig. 5b), y nos centramos en genes seleccionados positivamente en el experimento de activación CRISPR pero fuertemente seleccionados negativamente en el experimento de eliminación. Estos genes incluyen EGFR y BRAF, dos quinasas conocidas que impulsan la progresión del melanoma y la resistencia a PLX [20, 21], y CRKL, una proteína quinasa que activa la vía RAS y JUN. Se ha informado que la amplificación de CRKL conduce a la resistencia a los fármacos frente a los inhibidores de EGFR mediante la activación de las vías descendentes del EGFR [22], lo que implica su papel potencial en la resistencia a los fármacos PLX.

Visualización de medidas de control de calidad y esencialidad genética con VISPR

VISPR (VISualización de pantallas crisPR) es una interfaz basada en web para la visualización interactiva del control de calidad de la pantalla CRISPR y los resultados de la comparación. El acceso interactivo es proporcionado por una interfaz de navegador basada en HTML5, mientras que las visualizaciones se realizan con Vega [23], una gramática de visualización declarativa sobre Documentos basados ​​en datos (D3) [24]. VISPR proporciona tres tipos de vistas para la exploración interactiva del cribado CRISPR: una vista de control de calidad, una vista de resultados y una vista de comparación de experimentos. La vista de control de calidad muestra las mediciones de CC descritas anteriormente (Fig. 2).

En la vista de resultados, los resultados del cribado se pueden explorar de forma interactiva. Contiene una tabla que muestra los resultados de la comparación de cada gen (Fig. 6a). La tabla se puede ordenar por diferentes columnas y filtrar (desde "Buscar") a través de nombres de genes o expresiones regulares. Además, la distribución de PAG los valores se muestran como función de distribución acumulativa (CDF) (Fig. 6b) y como un histograma (Fig. 6c). Para cada gen, los recuentos de sgRNA normalizados en todas las muestras se pueden mostrar en una visualización de coordenadas paralelas (Fig. 6d). Si están disponibles, las predicciones de eficiencia de nocaut [11] y las coordenadas genéticas de cada sgRNA se muestran como ejes separados. Los ejes se pueden reordenar o activar o desactivar, y los sgRNA se pueden resaltar seleccionando rangos en cada eje. Los genes seleccionados en la tabla se destacan en el CDF, lo que permite evaluar su ocurrencia dentro del PAG distribución de valores de todos los genes.

El resultado y las vistas comparativas de VISPR. La vista de resultados incluye una tabla de comparación de genes (a), la distribución de PAG valores como CDF (B) e histograma (C), y los recuentos de sgRNA normalizados en todas las muestras de genes seleccionados junto con las posiciones de los cromosomas y la eficiencia predicha (D). La vista de comparación de VISPR (mi) muestra la superposición entre genes significativos en diferentes condiciones seleccionables y experimentos como un diagrama de Euler. Los resultados mostrados son de ESC (a, D) y conjunto de datos de melanoma (B, C, mi)

VISPR proporciona varias formas de explorar más a fondo los resultados del análisis. Los genes individuales se pueden ver en Ensembl [25] e IGV [26]. Los genes seleccionados pueden visualizarse en términos de su red de interacción y función a través de GeneMANIA [27]. El análisis funcional se puede realizar con GOrilla [15], una herramienta de análisis de enriquecimiento de ontología genética (GO) en línea. GOrilla toma una lista clasificada de genes (aquí basada en el PAG valores informados por MAGeCK) para realizar un análisis de enriquecimiento sin umbral. Los enriquecimientos resultantes del término GO se pueden utilizar más para el control de calidad a nivel de gen.

La vista de comparación de VISPR puede comparar diferentes experimentos visualizando los genes significativos comunes y exclusivos a través de diagramas de Euler (Fig. 6e). Al hacer clic en los segmentos del diagrama de Euler, se abren las vistas de resultados de los experimentos correspondientes. Por ejemplo, al hacer clic en la intersección entre dos experimentos se abrirán vistas de resultados "restringidas" para cada experimento, donde solo se muestran los genes significativos comunes. Estas vistas proporcionan las mismas características que las vistas de resultados sin restricciones descritas anteriormente. Sin embargo, en este caso, el análisis de enriquecimiento de GO con GOrilla se realiza con los genes mostrados (es decir, los genes de la intersección) como primer plano y los otros genes del experimento como fondo.

Las visualizaciones que se muestran en VISPR se pueden descargar como archivos SVG listos para publicación. Además, se proporciona una interfaz de línea de comandos para almacenar visualizaciones como especificaciones Vega. Este formato permite a los usuarios modificar y diseñar la salida de VISPR mediante programación.

Implementación del flujo de trabajo MAGeCK-VISPR con Snakemake

Implementamos el flujo de trabajo MAGeCK-VISPR con el sistema de gestión de flujo de trabajo Snakemake [13], permitiendo la ejecución automática de algunas o todas las funciones de MAGeCK-VISPR: control de calidad, análisis genético esencial y visualización. Elegir un sistema de gestión de flujo de trabajo como Snakemake tiene varias ventajas. Primero, los pasos del flujo de trabajo se pueden paralelizar y ejecutar automáticamente en estaciones de trabajo, servidores y clústeres de cómputo sin la modificación del flujo de trabajo. En segundo lugar, Snakemake realiza un seguimiento de los metadatos (como la fecha de creación, la entrada y los archivos de registro) de todos los archivos intermedios y de resultados generados. De esta manera, los datos, métodos y parámetros utilizados se documentan de manera integral para cada análisis (también llamado procedencia de los datos), un requisito importante de la ciencia reproducible. MAGeCK-VISPR proporciona una interfaz de línea de comandos para inicializar el flujo de trabajo en un directorio de trabajo determinado. Esto instala la definición de flujo de trabajo como un llamado Snakefile, junto con un archivo de configuración y documentación. El archivo de configuración se utiliza para definir ubicaciones de datos brutos y parámetros adicionales para MAGeCK-VISPR. Una vez configurado, Snakefile se puede ejecutar con Snakemake. Dado que Snakefile está instalado en el directorio de trabajo dado, el usuario puede modificarlo o ampliarlo fácilmente.

Proporcionamos todos los componentes del flujo de trabajo como paquetes Conda [28], de modo que MAGeCK-VISPR se puede instalar con un solo comando. Opcionalmente, el administrador de paquetes de Conda puede crear entornos aislados para el flujo de trabajo para, por ejemplo, congelar o comparar diferentes versiones de software o publicar instantáneas de una instancia de flujo de trabajo MAGeCK-VISPR junto con todos los datos y el software usado. Esto aumenta aún más la reproducibilidad de los resultados generados.


Facultad

Intereses de investigación: Mi investigación se encuentra en el área de la biología de sistemas computacionales, cuyo objetivo es comprender mejor los sistemas biológicos mediante el uso de modelos informáticos. Mis áreas activas de investigación incluyen el desarrollo de software de modelado y simulación como autor del popular simulador Gepasi y líder del simulador COPASI (con U. Kummer) y he participado activamente en el desarrollo de SBML, el lenguaje de marcado de biología de sistemas y la propuesta MIRIAM para modelo de anotación. Mi grupo también construye modelos bioquímicos, actualmente esto implica modelos de metabolismo del hierro, traducción eucariota y metabolismo central microbiano. A través de este trabajo, he sido pionero en la aplicación de la optimización numérica global en el modelado cinético bioquímico y estoy interesado en usar técnicas formales de identificación de sistemas en biología de sistemas, particularmente para modelos de ingeniería inversa a partir de datos. Mi investigación requiere un amplio enfoque interdisciplinario y trabajo con personas de la mayoría de áreas de la ciencia, ya sea en mi propio grupo de investigación o como colaboradores.

Miembros del laboratorio:

--Dr. Sherli Koshy-Chenthittayil (becaria postdoctoral) está desarrollando modelos de biopelículas de especies mixtas.

--Dr. Hasan Baig (becario postdoctoral) está trabajando en el desarrollo del software COPASI.

--Joe Masison (estudiante de MD / PhD) está desarrollando modelos multiescala del metabolismo del hierro.

--Aidan Riley (estudiante) está contribuyendo al desarrollo del software COPASI.

Catedrático de Biología Molecular, Microbiana y Estructural

Profesor asistente de biología celular

Profesor asociado de genética y biología del desarrollo
Laboratorio Blinov

Profesor Emérito de Biología Molecular, Microbiana y Estructural

Profesor Asistente de Ingeniería Biomédica
Investigador, Centro de Biología de Sistemas del Cáncer de Yale
Facultad visitante, Universidad de Yale

Intereses de investigación: El objetivo de nuestro laboratorio es comprender la interacción de una célula con sus vecinas y el microambiente. Con un enfoque particular en el microambiente tumoral, nuestro objetivo es desentrañar el lenguaje que emplean las células para conversar entre sí, cómo la gramática y el contenido del lenguaje se adaptan al entorno y cómo las células se comportan en respuesta. Utilizamos una amplia gama de técnicas, que incluyen microscopía en vivo, bioinformática, ingeniería de tejidos, nanofabricación, patrones celulares, biología evolutiva y genética para responder preguntas fundamentales en biología y medicina. Nuestro enfoque fisiológico actual implica comprender cómo surgen nuevos fenotipos dentro de las poblaciones de cáncer por sus interacciones vecinas, la base evolutiva de la tolerancia metastásica y la maduración cardíaca para el modelado de enfermedades.

Miembros del laboratorio:

--Yasir Suhail es un becario postdoctoral que trabaja en la dependencia de la metástasis del cáncer en el entorno estromal circundante.

--Visar Ajeti es becario postdoctoral.

Profesor, Departamento de Biología Celular

Catedrático de Ciencias de la Computación e Ingeniería

Profesor Distinguido Patronato

Intereses de investigación: Mi laboratorio se centra en el desarrollo de nuevas tecnologías experimentales y computacionales para ayudarnos a comprender los mecanismos subyacentes a la función celular. Tenemos un esfuerzo de larga data dirigido a desarrollar y caracterizar sondas fluorescentes de potencial de membrana. Este esfuerzo continúa, utilizando diseño y síntesis de químicos orgánicos para desarrollar mejores indicadores de voltaje más sensibles. Este trabajo ha dado lugar a un interés continuo en la organización de las vías de señalización a lo largo de la membrana celular y dentro del citoplasma. Estamos interesados ​​en la cuestión muy general de cómo se utiliza la intrincada organización espacial de las moléculas en las células para controlar la función celular. Esto es especialmente cierto en el caso de las células neuronales y estamos investigando activamente la biología celular de las espinas dendríticas en el tejido cerebral. Esto nos motivó a desarrollar una plataforma de software de modelado computacional muy general llamada "Virtual Cell", en la que hemos creado un marco para usar la simulación por computadora para explorar los mecanismos biológicos celulares. Los modelos se construyen de forma natural a partir de imágenes experimentales de estructuras celulares y subcelulares combinadas con datos bioquímicos y electrofisiológicos. Hemos utilizado el sistema "Virtual Cell" para explicar el patrón de actividad eléctrica y de señalización en células neuronales y no neuronales. Más recientemente, hemos desarrollado un nuevo software llamado SpringSaLaD que puede modelar interacciones moleculares a escala subcelular. Esto nos permite explorar cómo la forma de las moléculas individuales controla sus interacciones, lo que en última instancia conduce a respuestas a nivel celular.

Miembros del laboratorio:

Profesor y Vicepresidente de Genética y Biología del Desarrollo

Investigar Intereses: Nuestro grupo está interesado en los mecanismos de transducción de señales. La capacidad de una célula para recibir señales del entorno circundante y responder a esas señales de manera adecuada es literalmente una cuestión de vida o muerte. Ya sea que una célula prolifere, se diferencie o muera, donde se adherirá o migrará, prácticamente todos los aspectos de su comportamiento dependen de la capacidad para interpretar las señales con precisión. La señalización no solo es fundamental para el desarrollo normal y la función diaria de un organismo, sino que la señalización desregulada es la base de muchas enfermedades humanas como el cáncer y los trastornos autoinmunes. Ahora se aprecia que uno de los elementos centrales de la maquinaria de señalización es la formación altamente regulada y específica de complejos proteína-proteína. El hecho de que la señalización se base en la unión de proteínas entre sí presenta oportunidades extraordinarias: la unión se puede utilizar como un medio para identificar componentes críticos de las vías de señalización y también proporciona la base para estrategias para inhibir esas vías en el laboratorio o en la clínica. Utilizamos una combinación de técnicas bioquímicas y biológicas celulares para comprender las vías de señalización, como las que controlan la proliferación celular y la organización del citoesqueleto. También estamos buscando activamente nuevos enfoques proteómicos para identificar interacciones proteicas funcionalmente importantes y para caracterizar interacciones a escala global.

Miembros del laboratorio:

--Kazuya Machida es un profesor asociado residente en el laboratorio que desarrolla herramientas para mapear la utilización del sitio de unión del dominio SH2 en las células como un biomarcador de cáncer.

--Grace Curley-Jones es una estudiante de la UConn que trabaja con el Dr. Machida en el mapeo de dominios SH2

Catedrático de Biología Celular

Catedrático de Biología Celular

Intereses de investigación: La investigación en mi laboratorio se centra en los mecanismos moleculares del transporte intracelular y la organización del citoesqueleto de microtúbulos. Los melanóforos, células pigmentarias de los vertebrados inferiores, son células grandes que transportan sincrónicamente miles de gránulos de pigmento delimitados por la membrana, ya sea rápidamente al centro celular para formar un agregado compacto o para dispersarse uniformemente por todo el citoplasma. Durante la agregación, los gránulos se mueven a lo largo de los microtúbulos usando dineína citoplásmica, pero la dispersión implica tanto el transporte inicial dependiente de los microtúbulos a la periferia por la Kinesina II como luego un movimiento de difusión lento a lo largo de los filamentos de actina dispuestos al azar. El transporte está regulado por una cascada de señalización de la proteína quinasa A (PKA) y, por lo tanto, proporciona un sistema único para estudiar el papel del citoesqueleto en el transporte intracelular, los mecanismos de conmutación entre los dos principales sistemas de transporte y la regulación de la actividad de las moléculas motoras mediante la transducción de señales. mecanismos. Utilizamos biología molecular y bioquímica junto con microscopía de fluorescencia de células vivas, fotoblanqueo, fotoactivación y microinyección de sondas motoras específicas para comprender los mecanismos moleculares que subyacen a la regulación del transporte intracelular.

Profesor asociado de biología celular

Profesor asistente de biología celular

Intereses de investigación: Nuestra investigación se encuentra en la intersección de la medicina de sistemas computacionales y la biología de sistemas, la biología matemática y la bioinformática. Trabajamos en el diseño, desarrollo de software y aplicación de algoritmos matemáticos para el modelado, simulación y control de sistemas biológicos. En biología molecular, los sistemas de nuestro interés incluyen redes reguladoras de genes y redes de señalización intracelular donde nuestro objetivo es comprender y controlar los intrincados programas regulatorios de las células. We are focused on Cancer research (cancer reversion mechanisms and reversion of chemotherapy resistance) in breast cancer and leukemia.

Lab members:

--Lauren Marazzi is a MD/PhD student working on quantitative analysis of chemotherapy resistance reversion and cancer reversion in triple negative breast cancer using mathematical modeling and control theory.

Associate Professor of Genetics and Developmental Biology

Research Interests: Research in our laboratory focuses on developing quantitative imaging tools that reveal dynamics of cellular signaling at high spatial and temporal resolution (biosensors), or that enable optical control of signaling proteins at with temporal and spatial precision (optogenetics). These tools are used with live cell microscopy to understand signaling networks underlying cellular function including cell polarity cell motility, axon guidance and development of dendritic spines in neurons. In building biosensors we use structural design strategies with fluorescent proteins to optimize FRET-based activity reporters for signaling proteins. Multiple live cell imaging modalities are used in the lab including TIRF, confocal, intensity-based ratiometric imaging, and fluorescence lifetime microscopy (FLIM). Optogenetics has generated much interest as it allows precise control of signaling in living systems using genetic engineering of natural photosensory proteins. We are exploring the use of the flavin-binding LOV (light-oxygen-voltage) domain from the plant photoreceptor phototropin. We used this technology to produce a genetically-encoded photoactivatable analog of Rac (PA-Rac) that enables precise modulation of Rac activity at regions that are submicrons in size and capable of controlling activation with microseconds precision in living cells. Current projects in the lab focus on extending such technology to other signaling proteins.

Lab members:

--Yuezhe Li is a PhD student working on the role of primary cilia on insulin signaling of pancreatic beta cells.

Assistant Professor of Cell Biology

Research Interests: My lab is focused on developing membrane potential probes to image neuronal and cardiac activities. We use synthetic organic chemistry, genetic techniques, optical spectroscopy and microscopy to decode cells' secrets.

Lab members:

Associate Professor of Genetics and Developmental Biology

Lab Website: Yu Lab

Research Interests: The Yu lab is interested in developing new microscopy imaging techniques. Currently our works are focused on two related areas: (1) Live cell single-molecule dynamics. We are working on techniques that allows better visualization of individual biomolecules in a living specimen using modern fluorescence microscopy techniques. We are particularly interested in understanding how protein molecules’ behavior changes during signal transduction, and how individual proteins are made during gene expression. See the following publications from more details: Das et al. PNAS 112(3), E267 Oh et al., PNAS 109(35):14024. (2) Super-resolution microscopy. For a long time fluorescence microscopy had suffered from the curse of the so-called “diffraction-limited resolution”, which sets a fundamental limit on what is the smallest object the microscope can see. In the last decade, however, many new forms of microscopy design have emerged with the goal of breaking this resolution limit. Collectively, they are often called “super-resolution optical microscopy”. The lab is actively working on this new field trying to further improve the imaging quality of these new technologies. For more detail, check out these recent papers: Yu J et al. PNAS 201912634 Elmokadem A et al. Biophysical J 109(9):1772

Lab Members:

--Nizam ud Din is a postdoc fellow working on developing SH2 imaging techniques to understand the spatial distribution of phosphoproteome in cells during signal transduction.

--Meagan Cauble is a postdoc fellow studying the mechanisms of the growth factor pathways in vertebral disk in response to tissue damage.


Abstracto

To discern how mechanical forces coordinate biological outcomes, methods that map cell-generated forces in a spatiotemporal manner, and at cellular length scales, are critical. In their native environment, whether it be within compact multicellular three-dimensional structures or sparsely populated fibrillar networks of the extracellular matrix, cells are constantly exposed to a slew of physical forces acting on them from all directions. At the same time, cells exert highly localized forces of their own on their surroundings and on neighboring cells. Together, the generation and transmission of these forces can control diverse cellular activities and behavior as well as influence cell fate decisions. To thoroughly understand these processes, we must first be able to characterize and measure such forces. However, our experimental needs and technical capabilities are in discord—while it is apparent that we should study cell-generated forces within more biologically relevant 3D environments, this goal remains challenging because of caveats associated with complex “sensing–transduction–readout” modalities. In this Review, we will discuss the latest techniques for measuring cell-generated forces. We will highlight recent advances in traction force microscopy and examine new alternative approaches for quantifying cell-generated forces, both of individual cells and within 3D tissues. Finally, we will explore the future direction of novel cellular force-sensing tools in the context of mechanobiology and next-generation biomaterials design.


12918_2011_787_MOESM1_ESM.ZIP

Additional file 1: ML-Rules demo program The ZIP file comprises a prototype tool of ML-Rules including a model editor, the simulator, and a rudimentary line chart visualization of simulation trajectories. Also a user manual and several example models are part of the tool package. To start the demo tool, please unzip the file and execute the run.jar file. Java Runtime Environment (Version 6 or higher) is required for execution. (ZIP 6 MB)

12918_2011_787_MOESM2_ESM.PDF

Additional file 2: Example models The PDF file contains descriptions of the entire example models including initial solutions and parameter values that have been used for the simulation studies. (PDF 560 KB)


Spatial modelling of brief and long interactions between T cells and dendritic cells

In the early phases of an immune response, T cells of appropriate antigen specificity become activated by antigen-presenting cells in secondary lymphoid organs. Two-photon microscopy imaging experiments have shown that this stimulation occurs in distinct stages during which T cells exhibit different motilities and interactions with dendritic cells (DCs). In this paper, we utilize the Cellular Potts Model, a model formalism that takes cell shapes and cellular interactions explicitly into account, to simulate the dynamics of, and interactions between, T cells and DCs in the lymph node paracortex. Our three-dimensional simulations suggest that the initial decrease in T-cell motility after antigen appearance is due to ‘stop signals’ transmitted by activated DCs to T cells. The long-lived interactions that occur at a later stage can only be explained by the presence of both stop signals and a high adhesion between specific T cells and antigen-bearing DCs. Furthermore, our results indicate that long-lasting contacts with T cells are promoted when DCs retract dendrites that detect a specific contact at lower velocities than other dendrites. Finally, by performing long simulations (after prior fitting to short time scale data) we are able to provide an estimate of the average contact duration between T cells and DCs.

Nombre del archivo Descripción
imcb7100054-sup-0001.mpgapplication/mpg, 2 MB Material suplementario
imcb7100054-sup-0002.mpgapplication/mpg, 2 MB Material suplementario
imcb7100054-sup-0003.mpgapplication/mpg, 2 MB Material suplementario
imcb7100054-sup-0004.mpgapplication/mpg, 2 MB Material suplementario
imcb7100054-sup-0005.mpgapplication/mpg, 2 MB Material suplementario
imcb7100054-sup-0006.docapplication/doc, 14 KB Material suplementario

Tenga en cuenta: El editor no es responsable del contenido o la funcionalidad de la información de apoyo proporcionada por los autores. Cualquier consulta (que no sea contenido faltante) debe dirigirse al autor correspondiente del artículo.


Challenges and future directions

The accuracy of agent-based simulations relies on both the agents and virtual environment capturing key features and processes necessary for the emergence of a required collective behaviour. These are not always well understood and so close integration with biologists developing cellular models is essential to ensure that key agent behaviours and environmental factors are present. The Synthetic Biology Open Language (SBOL) [68] and SBML [69] are standards to aid in the exchange of genetic design information and unambiguous definition of biochemical models. Having agent-based tools exploit these formats directly would enable existing curated intracellular models to drive agent behaviours. This would help to validate their function when exposed to realistic extracellular factors, and provide clearer links between model parameters of relevance to the cell biology and desired population-level features. Furthermore, the integration of tools designed to efficiently model the reaction networks inside cells (e.g. Smoldyn [70] or NFsim [71]), and the application of whole-cell models [72] to provide detailed behavioural responses would enable accurate simulations. At present, most tools do not provide these features due to the extensive computational demands of simulating large and complex multi-scale models. However, as the availability of cheap high-performance computing grows, and agent-based tools are updated to better exploit these resources, large multi-scale modelling will become viable.

Many real-world applications of synthetic biology require cells to robustly function within complex environments. Faithfully representing key aspects of these environments is essential to ensure that simulations produce accurate results. The use of microfluidics to study single-cell dynamics has seen significant growth in synthetic biology [73]. Such devices impose intricate boundaries on cells that both physically restricts their movement and controls the flow of nutrients sustaining them. Although the role of fluid flows on natural biofilms has been investigated [74], there is a lack of agent-based modelling tools that incorporate the full range of physical processes that might be experienced by a cell, hampering the ability for them to fully describe many systems of this type.

A significant challenge when capturing the complexity of cellular populations is the typical number of individuals involved. Colonies of bacteria will far exceed 100 million cells. At this size, if only the position of each cell is maintained, over 1 GB of raw data would need to be updated for each time point of a simulation. The execution of models at these scales requires the adoption of efficient parallelizable algorithms and high-performance computing architectures. These allow for a simulation to be broken down into many smaller parts and large numbers of processing units used to solve each concurrently. A shift to highly parallel computing architectures has already taken place in molecular dynamics simulations, leading to huge leaps in the speed and scale of problems that can be solved [75]. Some attempts have also been made to use this approach for synthetic biology applications, e.g. CellModeller [63] exploits graphics processing units (GPUs) to accelerate simulations, but these optimizations often come at the cost of limiting the range of possible agent behaviours and the complexity of the virtual environment. While several of the general-purpose modelling frameworks (e.g. FLAME and Repast) do support these types of large-scale simulation, they also lack the biologically relevant built-in features (e.g. cell growth and simulation of genetic networks) that are critical for the efficient development of synthetic biology-related simulations. To further mitigate some of these computational difficulties, attempts have also been made to employ alternative forms of modelling. Hybrid approaches in which an agent-based model is combined with continuous models has been shown to significantly reduce the computational demands of some forms of simulation [76], and dynamic network-based models can be used to simplify the virtual environment, while still ensuring that interactions between cells are fully captured [77–80].

The large number of agent-based modelling tools raises the question: why do so many exist? This is partially due to historic reasons. As various sub-fields of biology have applied agent-based models, they each have developed tools containing the specific features they require. Although this makes it easier for them to tailor models to their specific needs, it also leads to numerous tools all focused on slightly different problems. It is conceivable that a single tool could eventually encapsulate the functionality of all of these. Some efforts in this direction have already begun with Chaste and BSim being built around a ‘plug-n-play’ architecture where simulations are built from a set of available modules. Because users can also define their own modules from scratch, the functionality of the tool can be easily extended in new ways. Intuitively, it would seem that this type of approach will eventually become the standard. However, this flexibility makes it impossible to highly optimize the interactions between modules. This results in less efficient simulations. Therefore there is always likely to be a range of modelling tools available, especially for specific areas that require the highest performance simulations.

In summary, our knowledge of the inner workings of cells has grown significantly over recent years. This has supported the development of genetically engineered cells able to sustainably produce useful chemicals [4] and implement novel behaviours [1–3,27,28,36,81–83]. Nevertheless, synthetic biology has struggled to effectively scale systems beyond individual cells to the rational engineering of multicellular collective functions. Agent-based modelling offers a way to explore the links between single-cell behaviours and population-level phenomena [9]. This will help to support the next wave of synthetic biology applications that exploit large populations of cells to implement robust functionalities at scale.


ACKNOWLEDGEMENTS

We are grateful to two anonymous reviewers for their suggestions, as well as to Y. Caraglio (CIRAD) for his comments on some aspects of plant architecture. We thank LIAMA, the French Embassy in China, the National Natural Science Foundation of China (NSFC, # 60073007, 60473110), the Chinese Academy of Forestry, as well as the French research institutes CIRAD, INRA and INRIA for their support and funding of the organization of PMA06. We are very grateful to the editors at Annals of Botany for their kind co-operation in editing this Special Issue on plant growth modelling and applications.


Ver el vídeo: TODAS herramientas para MODELAR. ESCULPIR con ARCILLA POLIMERICA, principiantes y profesionales (Febrero 2023).