BMC Systems Biology, 2007; 1: 4-4 (más artículos en esta revista)

Cualitativa redes: un enfoque simbólico para analizar las redes de señalización biológica

BioMed Central
A Marc Schaub (marc.schaub @ a3.epfl.ch) [1], A Thomas Henzinger (tah@epfl.ch) [1], Jasmin Fisher (jasmin.fisher @ epfl.ch) [1]
[1] Escuela de Informática y Ciencias de la Comunicación EPFL, 1015 Lausanne, Suiza

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.

Resumen
Fondo

Un objetivo central de la biología de sistemas es el modelo y analizar las vías de señalización biológicas que interactúan entre sí para formar redes complejas. Aquí presentamos cualitativa redes, una extensión de las redes de operadores booleanos. Con este marco, utilizamos métodos formales de verificación para comprobar si un modelo es coherente con el laboratorio experimental de las observaciones en las que se basa. Si el modelo no se ajusta a los datos, le recomendamos que una versión revisada del modelo y la nueva hipótesis se ponen a prueba en silico.

Resultados

Consideramos que las redes de elementos que van más de una pequeña finito de dominio que permite más flexibilidad que los valores booleanos, objetivo y añadir funciones que permiten al modelo de un rico conjunto de comportamientos. Proponemos un algoritmo simbólico para analizar el estado de equilibrio de estas redes, lo que nos permite ampliar a un sistema que consta de 144 elementos estatales y espacios de aproximadamente 10 86 estados. Nos ilustran la utilidad de este enfoque a través de un modelo de la interacción entre la muesca y la vías de señalización Wnt en la piel de mamíferos, y su extenso análisis.

Conclusión

Se introduce un enfoque para la construcción de modelos computacionales de sistemas biológicos que se extiende el marco de las redes de operadores booleanos y utiliza métodos de verificación formal para el análisis del modelo. Este enfoque puede a escala multicelulares complejos modelos de vías, y por lo tanto es una herramienta útil para el análisis de complejos sistemas biológicos. Las hipótesis formuladas durante silico-en las pruebas sugieren nuevas vías para explorar experimentalmente. Por lo tanto, este enfoque tiene el potencial de complementar de manera eficiente los estudios experimentales en biología.

Fondo

El emergente campo de la biología de sistemas tiene como objetivo lograr alto nivel de comprensión de complejos sistemas biológicos mediante el estudio de la estructura y dinámica de funciones celulares [1, 2]. La construcción y el análisis de modelos que describen los procesos biológicos son el núcleo fundamental de este nuevo enfoque. Ciencias de la computación proporciona métodos para simular y analizar estos modelos. Esto permite realizar experimentos in silico que den lugar a nuevas predicciones y, por tanto, complemento de los enfoques tradicionales de experimentación. Teniendo en cuenta la biología de sistemas de un punto de vista también permite el uso de métodos aplicados a la ingeniería de sistemas artificiales. Una amplia gama de formalismos originarios de la informática ya han sido utilizados para modelar los sistemas biológicos. Estos cálculos incluyen el proceso [3], Statecharts Live y los gráficos de secuencias [4 - 6], las variantes de redes de Petri [7 - 9], y modelos híbridos [10, 11]. Recientemente, el término ejecutable biología se ha propuesto para los modelos que constan de un algoritmo que imita el comportamiento de un sistema biológico estudiado [12].

Ejecutables modelos de sistemas biológicos pueden ser analizados mediante métodos formales de verificación, que fueron diseñados originalmente para la validación de los sistemas informáticos. Dos posibles enfoques son las pruebas y los modelos de control. Modelo de control [13] consiste en una exploración exhaustiva del estado-el espacio de un determinado sistema, a fin de comprobar que no siempre se adhiere a una serie de requisitos. En el caso de los sistemas biológicos, los requisitos se derivan de observaciones experimentales. La coherencia de un modelo putativo ejecutable puede ser probado por lo tanto, con respecto a los datos en los que el modelo se basa [14] (cf. [6], donde este método ha dado lugar a nuevas predicciones sobre el desarrollo de vulval Caenorhabditis elegans, [15 - 17 ] Donde se utiliza para el análisis bioquímico de redes, y [18, 19] para el análisis probabilístico de los modelos).

Con el fin de construir ejecutable modelos biológicos de las vías, es necesario definir con precisión las interacciones entre los componentes bioquímicos. Una de las formalismo ampliamente utilizado para representar las interacciones en la biología son booleanos redes [20, 21]. Una red booleana consiste en un conjunto de variables booleanas que representan la actividad bioquímica de componentes, tales como las proteínas o los genes. Una función booleana se asocia a cada uno de los componentes. Esta función actualiza el valor de la componente correspondiente a cada una de las etapas de la ejecución de una red de operadores booleanos. En el contexto de las vías biológicas, una red booleana puede construirse a partir de un gráfico que representa las interacciones bioquímicas. Cada nodo de este gráfico representa un componente bioquímico. Los arcos de la gráfica se utilizan para representar las interacciones entre los componentes. Su peso puede ser positivo (para la activación) o negativo (por inhibición). Este gráfico se usa para definir las funciones booleanas para cada componente. La función establece el valor de un componente de verdad si la cantidad de activación es superior a la cantidad de inhibición. De lo contrario el valor del componente se establece a falso. Boolean redes, por lo tanto, proporcionan una vista muy resumieron las proteínas de actividad o expresión génica. Este nivel de abstracción a menudo se corresponde con el disponible cualitativo de los datos experimentales. Por otra parte, las interacciones entre los componentes están representados en forma muy parecida a la de diagrama de modelos que son ampliamente utilizados por los biólogos. Boolean redes, por lo tanto, parece ser muy adecuado para el análisis cualitativo de los procesos biológicos. Se han utilizado recientemente para modelar una gran variedad de sistemas biológicos, como la Arabidopsis thaliana flor morfogénesis [22], la influencia de los estímulos físicos en la célula destino [23], el segmento de red de genes de polaridad en Drosophila melanogaster [24] y la levadura del ciclo celular [25]. Boolean redes se han extendido en varias formas, incluyendo redes probabilísticas Boolean [26] y el denominado enfoque generalizado lógico utilizando multivalued niveles de concentración [27]. La lógica generalizada se ha combinado con métodos de verificación formal [16], y la limitación de programación se utilizó para encontrar constantes estados de grandes redes [28].

En este trabajo, proponemos una ampliación de las redes booleanas llamado cualitativa redes. Nosotros utilizamos este marco para construir un modelo ejecutable que se analizaron utilizando métodos de verificación formal. Se introduce dos modificaciones al marco redes booleanas. En primer lugar, utilizar las variables discretas en lugar de variables booleanas que representan para la expresión de genes y proteínas de los niveles de actividad. En segundo lugar, la captura de una rica serie de interacciones entre los componentes que sólo la activación e inhibición. Cualquier función de la situación actual del sistema puede ser usado para definir la meta hacia la cual un componente se moverá en el próximo paso. En cada paso, el nivel de un componente de los cambios hacia esta meta a más de un nivel. Nosotros utilizamos el modelo de simulación y control para verificar que la aplicación cualitativa de la red se adhiere a un conjunto de especificaciones derivadas de las observaciones experimentales de laboratorio. Si es necesario, podemos incorporar nuevas hipótesis en el modelo (iterativo de mejora). Una vez que estos se ponen a prueba en silico-, también deben ser validados experimentalmente. Proponemos que los estados estables del sistema biológico corresponden a lo infinitamente visitó los estados de la modelo ejecutable. Se introduce un algoritmo eficiente simbólico para verificar si todos los estados visitados hasta el infinito de una red cualitativa satisfacer el pliego de condiciones. Consideramos que la ejecución de este algoritmo para los modelos de diferente tamaño y complejidad, y demostrar que puede utilizarse para analizar grandes y complejas redes cualitativa. Nos ilustran la capacidad cualitativa de las redes para proporcionar una representación válida cualitativa de un estudiado sistema biológico utilizando un modelo de la incoherente tipo de alimentación-1 bucle de avance en la E. coli gal sistema.

Nuestro enfoque para el modelado de vías de señalización permite la detección de lagunas en la comprensión mecanicista de los procesos estudiados, y sugiere nuevas interacciones bioquímicas en un nivel similar de la abstracción a la observada en los modelos de diagrama. Nos ilustran este enfoque multicelulares por un modelo de la interacción entre la muesca y la Wnt vías en mamíferos células de la piel.

Resultados
Cualitativa redes

En este estudio se propone un enfoque para la construcción de modelos ejecutable de vías de señalización que se basa en redes cualitativa, una extensión de las redes de operadores booleanos. En esta sección, en primer lugar explicar de qué manera las vías biológicas pueden ser modeladas utilizando las redes de operadores booleanos y, a continuación, definir cualitativa redes. Las interacciones biológicas en las vías puede ser representada como una ventaja ponderado interacción gráfica G (V, E). Un nodo v iV representa un componente biológico, como un gen o una proteína. Un borde e ijE de nodo v i v a nodo j tiene un peso α ij, que corresponde al efecto de la componente representado por v i en el componente representado por v j. La activación es especificada por un valor positivo de α ij, la inhibición de un valor negativo. Este gráfico, por lo tanto, representa el tipo de interacción entre los componentes así como su fuerza de manera similar a los modelos de diagrama utilizado por los biólogos. Li et al. proponer el uso de redes de operadores booleanos para estudiar las interacciones definirse de un gráfico [25].

Una red booleana B (C, M) consta de un conjunto de componentes C y una lista de funciones booleanas F. Cada componente c iC tiene un estado, lo cual puede tener dos valores: c i = 1 si el componente está activo y c i = 0 si el componente está ausente o inactivo. Usamos k para representar el número de componentes (k = | C |). El estado s de una red booleana corresponde al vector (c 1, ..., c k) ∈ (0, 1) k de los estados de todos los componentes de la red booleanos. Una función booleana f iF se le asigna a cada componente. Esta función mapas de la situación actual del sistema a un valor booleano que representa el siguiente estado de la componente correspondiente (f i: (0, 1 → k) (0,1)). El tiempo en las redes booleanas está representada por una discreta variable t. Usamos la notación c i (t) y s (t) para representar el estado de un componente, respectivamente, el estado del sistema en su conjunto, en el momento t. El valor de cada proteína en el próximo paso del tiempo se calcula mediante la aplicación de la función booleana correspondiente al estado actual del sistema:

c i (t + 1) = f i (s (t)) (1)

Habida cuenta de una interacción gráfica G (V, E), una red booleana B (C, M) pueden obtenerse de la siguiente manera: cada nodo de V corresponde a un componente en C. La función lógica debe reproducir el siguiente comportamiento para cada uno de los componentes: si el acumulado de activación es superior al acumulado de inhibición, el estado del componente está definida como activa (1) y, viceversa, si la inhibición es superior a la activación, se configura a inactivos (0). Por lo tanto, la función lógica que corresponde a cada componente se define como sigue:

f i ( s ) = ( 0 si Σ c j s α j i c j < 0 1 si Σ c j s α j i c j > 0 c i si Σ c j s α j i c j = 0 MathType MTEF @ @ @ 5 + 5 = @ feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGMbGzdaWgaaWcbaGaemyAaKgabeaakiabcIcaOiabdohaZjabcMcaPiabg2da9maaceqabaqbaeqabmGaaaqaaiabicdaWaqaaiabbMgaPjabbAgaMnaaqafabaacciGae8xSde2aaSbaaSqaaiabdQgaQjabdMgaPbqabaGccqWGJbWydaWgaaWcbaGaemOAaOgabeaaaeaacqWGJbWydaWgaaadbaGaemOAaOgabeaaliabgIGiolabdohaZbqab0GaeyyeIuoakiabgYda8iabicdaWaqaaiabigdaXaqaaiabbMgaPjabbAgaMnaaqafabaGae8xSde2aaSbaaSqaaiabdQgaQjabdMgaPbqabaGccqWGJbWydaWgaaWcbaGaemOAaOgabeaaaeaacqWGJbWydaWgaaadbaGaemOAaOgabeaaliabgIGiolabdohaZbqab0GaeyyeIuoakiabg6da + iabicdaWaqaaiabdogaJnaaBaaaleaacqWGPbqAaeqaaaGcbaGaeeyAaKMaeeOzay2aaabuaeaacqWFXoqydaWgaaWcbaGaemOAaOMaemyAaKgabeaakiabdogaJnaaBaaaleaacqWGQbGAaeqaaaqaaiabdogaJnaaBaaameaacqWGQbGAaeqaaSGaeyicI4Saem4CamhabeqdcqGHris5aOGaeyypa0JaeGimaadaaaGaay5Eaaaaaa @ @ 759C

Hacemos extensivo el marco booleanos red mediante el uso de dominios discretos para representar el estado de un componente y al permitir que un rico conjunto de la interacción entre los componentes. El estado de un componente activo puede tener varios valores, en lugar de ser simplemente ON. Estos valores corresponden a los niveles cualitativos de la expresión de genes o proteínas de actividad, por ejemplo, baja, media, alta. Esta representación, por lo tanto, es un término medio entre la abstracción y booleanos modelos cuantitativos. El uso de dominios discretos requiere modificar la forma en que las actualizaciones de la red se definen. Se introduce un objetivo función que calcula el discreto nivel que se benefician de un componente se mueve en el próximo paso. La función objetivo no se limita a modelar la activación e inhibición. Cada función del estado actual del sistema puede ser utilizado como función objetivo. Esto hace posible modelo de interacciones que no pueden ser representados en gráficos de interacción. Un ejemplo de ello es complexation, donde la cantidad de proteína producida es limitada por la disponibilidad de las proteínas necesarias para la interacción. Esta situación puede ser modelado utilizando el mínimo del nivel de estas proteínas como objetivo función. Más funciones elaborar objetivo también se puede utilizar para representar situaciones en las que el efecto de una determinada activando o inhibiendo borde depende del nivel de proteínas adicionales. Llamamos a este marco ampliado cualitativa red. En los siguientes párrafos, se hace una detallada descripción cualitativa de las redes.

Una red cualitativa Q (C, T, N) consta de un conjunto de componentes C y una lista de funciones T meta. El estado de un componente c iC es un valor entre 0 y N. Estos valores representan los niveles cualitativos de los componentes con el más bajo 0 y N el nivel más alto posible para ese componente. Para cada uno de los componentes c i, existe un objetivo función objetivo iT que especifica el nivel hacia el que el valor del componente debe moverse. Esta función se calcula sobre el estado del sistema en su conjunto (objetivo i: (0, ..., N) (k → 0, ..., N)). En cada paso, el valor del estado de un componente sólo puede aumentar o disminuir de un solo nivel. El valor de cada componente en el próximo paso del tiempo, por lo tanto, se computa como sigue:

c i ( t + 1 ) = ( c i ( t ) -- 1 si t un r g e t i ( S ( t ) ) < c i ( t ) c i ( t ) + 1 si t un r g e t i ( S ( t ) ) > c i ( t ) c i ( t ) si t un r g e t i ( S ( t ) ) = c i ( t ) ( 2 ) MathType MTEF @ @ @ 5 + 5 = @ feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = = vr0 vr + aGpcqWGJbWydaWgaaWcbaGaemyAaKgabeaakiabcIcaOiabdsha0jabcMcaPaqaaiabdogaJnaaBaaaleaacqWGPbqAaeqaaOGaeiikaGIaemiDaqNaeiykaKcabaGaeeyAaKMaeeOzayMaeeiiaaIaemiDaqNae8xyaeMae8NCaiNae83zaCMaemyzauMaemiDaq3aaSbaaSqaaiabdMgaPbqabaGccqGGOaakcqWGtbWucqGGOaakcqWG0baDcqGGPaqkcqGGPaqkcqGH9aqpcqWGJbWydaWgaaWcbaGaemyAaKgabeaakiabcIcaOiabdsha0jabcMcaPaaaaiaawUhaaiaaxMaacaWLjaWaaeWaaeaacqaIYaGmaiaawIcacaGLPaaaaaa @ @ 9F11

Cuando N = 1, esta actualización función es equivalente a la función de actualización de las redes booleanas (Ecuación 1). De ello se deduce que cualitativa redes son una generalización de las redes de operadores booleanos: la red cualitativa Q (C, H, 1) es equivalente a la red Boolean B (C, F).

Un tipo particular de la función objetivo se obtiene directamente de la calidad gráfica que describe el sistema biológico estudiado. Se utiliza para modelar la activación e inhibición de una manera similar a la que se describen las redes de operadores booleanos. En las redes booleanas, la suma de todas las contribuciones fue suficiente para decidir sobre el próximo valor de un componente. Aquí tenemos que obtener un objetivo función que va más de (0, ..., N), y para que los valores intermedios son significativos. Con el fin de obtener la función objetivo para el componente c i, calcular por separado el monto de activación y actuar i el importe de la inhibición de hab i la sensación de este componente. Ambos de estos valores se adaptan de manera que sean proporcionales a la cantidad ponderada de activación, inhibición, respectivamente. Cuando la activación de todos los componentes están en su punto más alto valor, luego actuar i = N. Del mismo modo, cuando la inhibición de todos los componentes están en su valor más alto después de hab i = N.

un c t i ( s ) = Σ α j i > 0 α j i c j Σ α j i > 0 α j i i n h i ( s ) = Σ α j i < 0 α j i c j Σ α j i < 0 α j i MathType MTEF @ @ @ 5 + 5 = @ feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakqaabeqaaiabdggaHjabdogaJjabdsha0naaBaaaleaacqWGPbqAaeqaaOGaeiikaGIaem4CamNaeiykaKIaeyypa0ZaaSaaaeaadaaeqbqaaGGaciab = f7aHnaaBaaaleaacqWGQbGAcqWGPbqAaeqaaOGaem4yam2aaSbaaSqaaiabdQgaQbqabaaabaGae8xSde2aaSbaaWqaaiabdQgaQjabdMgaPbqabaWccqGH + aGpcqaIWaamaeqaniabggHiLdaakeaadaaeqbqaaiab = f7aHnaaBaaaleaacqWGQbGAcqWGPbqAaeqaaaqaaiab = f7aHnaaBaaameaacqWGQbGAcqWGPbqAaeqaaSGaeyOpa4JaeGimaadabeqdcqGHris5aaaaaOqaaiabdMgaPjabd6gaUjabdIgaOnaaBaaaleaacqWGPbqAaeqaaOGaeiikaGIaem4CamNaeiykaKIaeyypa0ZaaSaaaeaadaaeqbqaaiab = f7aHnaaBaaaleaacqWGQbGAcqWGPbqAaeqaaOGaem4yam2aaSbaaSqaaiabdQgaQbqabaaabaGae8xSde2aaSbaaWqaaiabdQgaQjabdMgaPbqabaWccqGH8aapcqaIWaamaeqaniabggHiLdaakeaadaaeqbqaaiab = f7aHnaaBaaaleaacqWGQbGAcqWGPbqAaeqaaaqaaiab = f7aHnaaBaaameaacqWGQbGAcqWGPbqAaeqaaSGaeyipaWJaeGimaadabeqdcqGHris5aaaaaaaa @ @ 7AA5

La función objetivo es la diferencia entre el importe de la activación y la cantidad de inhibición. Cuando no hay inhibición, la salida de la función objetivo corresponde a la cantidad de activación. El nivel del componente no deberá exceder la suma de la activación. Cuando el importe de la inhibición es superior a la cantidad de activación, el valor de la función objetivo es cero. Tenemos que considerar un caso especial cuando todos los bordes de un componente son las inhibiciones. En este caso, debemos asumir que el mecanismo principal para la presencia de este componente no es el modelo, y que, a falta de inhibición, el objetivo función de esta variable devolverá el valor máximo. Obtenemos la siguiente definición de la función objetivo:

t un r g e t i ( s ) = ( Max ( 0 , un c t i ( s ) -- i n h i ( s ) ) si m un x ( α j i ) > 0 N -- i n h i ( s ) si m un x ( α j i ) 0 ( 3 ) MathType MTEF @ @ @ 5 + 5 = @ feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWG0baDieGacqWFHbqycqWFYbGCcqWFNbWzcqWGLbqzcqWG0baDdaWgaaWcbaGaemyAaKgabeaakiabcIcaOiabdohaZjabcMcaPiabg2da9maaceqabaqbaeaabiGaaaqaaiGbc2gaTjabcggaHjabcIha4jabcIcaOiabicdaWiabcYcaSiabdggaHjabdogaJjabdsha0naaBaaaleaacqWGPbqAaeqaaOGaeiikaGIaem4CamNaeiykaKIaeyOeI0IaemyAaKMaemOBa4MaemiAaG2aaSbaaSqaaiabdMgaPbqabaGccqGGOaakcqWGZbWCcqGGPaqkcqGGPaqkaeaacqqGPbqAcqqGMbGzcqqGGaaicqWFTbqBcqWFHbqycqWF4baEcqGGOaakiiGacqGFXoqydaWgaaWcbaGaemOAaOMaemyAaKgabeaakiabcMcaPiabg6da + iabicdaWaqaaiabd6eaojabgkHiTiabdMgaPjabd6gaUjabdIgaOnaaBaaaleaacqWGPbqAaeqaaOGaeiikaGIaem4CamNaeiykaKcabaGaeeyAaKMaeeOzayMaeeiiaaIae8xBa0Mae8xyaeMae8hEaGNaeiikaGIae4xSde2aaSbaaSqaaiabdQgaQjabdMgaPbqabaGccqGGPaqkcqGHKjYOcqaIWaamaaaacaGL7baacaWLjaGaaCzcamaabmaabaGaeG4mamdacaGLOaGaayzkaaaaaa @ @ 84BD

Utilizamos las redes cualitativa ejecutable para definir modelos de sistemas biológicos. La lista de funciones meta especifica de qué forma las diferentes moléculas en el sistema influyen mutuamente. Al crear un modelo basado en la comprensión mecanicista de un proceso biológico, utilizar esta información para definir un conjunto de funciones objetivo. En caso necesario, separar la representación de la actividad de proteínas a partir de la expresión a nivel del gen correspondiente. Esto es útil para modelar los casos en los que hay interacciones a nivel de la transcripción, así como proteína-proteína interacciones. Durante el proceso de análisis, podemos modificar la definición de las funciones objetivo. Si bien cualitativa redes para permitir cualquier tipo de función objetivo, usamos un subconjunto de las funciones específicas que representan las interacciones biológicas, como la activación / inhibición de la función se ha descrito anteriormente. De esta forma se garantiza la hipótesis de que las nuevas interacciones entre los componentes se definen en un nivel donde tienen un claro significado biológico. La aplicación de modelos se definen como redes cualitativo se describe en la sección Métodos.

Iterativo modelo de mejora

Un modelo en general, y un ejecutable modelo en particular, está destinado a representar la forma en que el sistema de estudio que funciona realmente. Por lo tanto, es natural esperar que el modelo sería coherente con los datos obtenidos de experimentos de laboratorio con este sistema. Nosotros utilizamos el modelo de simulación y control [13], lo que permite comprobar oficialmente a todas las ejecuciones del modelo formal en contra de un pliego de condiciones. Al explorar todos los posibles estados y transiciones del modelo podemos determinar si tiene algún requisito para el modelo. En el caso de que la propiedad no se sostiene, el modelo-algoritmo de control de suministros un contador ejemplo: una ejecución del sistema que no cumple un determinado requisito. Nosotros utilizamos la información proporcionada por este segundo ejemplo, para proponer modificaciones cualitativas de la red que represente al sistema estudiado.

Nuestra metodología cualitativa en el uso de redes es la mejora de proceso iterativo (Figura 1]. Hacemos hincapié en que el uso de redes cualitativa no se limita a esta metodología. Las ventajas de múltiples valores, funciones flexibles objetivo, y los algoritmos de análisis que a continuación se sugieren, se pueden utilizar independientemente de la metodología de modelado elegido por el usuario.

El proceso iterativo de mejora consta de los siguientes. En primer lugar, obtener un conjunto de especificaciones de laboratorio antes de los resultados experimentales. Construimos un primer putativo modelo basado en la actual comprensión mecanicista de los procesos biológicos estudiados y las hipótesis de trabajo que nos gustaría evaluar. A continuación, utilizar métodos formales de verificación para comprobar si el modelo propuesto se ajusta a la especificación. Si el modelo no esta prueba, deducir que el modelo no se ajusta a los datos. Estamos contra el uso de ejemplos, para sugerir un modelo revisado de hacer nuevas hipótesis. El nuevo modelo se evaluaron una vez más, y estos pasos se repiten hasta que no se encuentra contradicción entre el modelo y las especificaciones. En este punto, tal vez habríamos tenido que modificar nuestra hipótesis, tanto en los descartes de verificar las hipótesis y en la adición de supuestos que son necesarias para que el modelo para cumplir con las especificaciones establecidas. El modelo resultante, y la correspondiente nueva serie de hipótesis, se sabe que ser coherentes con los resultados experimentales. En esta etapa, es posible consultar el modelo para obtener más conocimientos sobre el sistema biológico. Esto puede hacerse ya sea mediante la modificación del modelo para evaluar mediante la adición o especificaciones que podría proporcionar información adicional sobre el comportamiento del sistema. Las hipótesis y los cambios en el modelo conduce a comportamientos interesantes son candidatos a la validación experimental. El resultado de ese experimento, si se confirma la información obtenida del análisis computacional o no, puede ser añadido al pliego de condiciones. Esto crea una segunda, exterior, la mejora de bucle que combina computacional y validación experimental.

Las especificaciones derivadas de los resultados experimentales de laboratorio se pueden dividir en dos categorías. Bajo nivel de especificaciones implican cambios en el nivel de proteína o actividad de expresión génica (por ejemplo, la sobre expresión de una proteína conduce a una disminución de otra proteína). Alto Nivel especificaciones considerar los cambios a nivel celular, tales como células suerte o la susceptibilidad a la carcinogénesis. Dado que sólo podemos observar el nivel de proteínas individuales, tenemos que definir la forma en que estos se refieren a cambios a nivel celular. Resultados experimentales que suelen estar relacionados con la manipulación, como el gen de expresión o eliminatorias. Estas manipulaciones dar lugar a cambios en el comportamiento del modelo. La sección Métodos da detalles adicionales sobre cómo se definen las especificaciones y verificado.

Este enfoque iterativo mejora se puede aplicar a muy no-determinista modelos, por lo tanto, la utilización de modelos de control. Cualitativa redes, al igual que las redes booleanas, tienen un comportamiento determinista, y por lo tanto, es suficiente para llevar a cabo la ejecución por un estado inicial, y verificar si cada una de estas ejecuciones cumple las especificaciones. Si algunas ejecuciones hacer cumplir el pliego de condiciones, pero otros no lo hacen, entonces el modelo no es lo suficientemente limitada, y tenemos que formular hipótesis que permitan evitar las ejecuciones que no se ajusten a las especificaciones. Lo ideal sería que la nueva hipótesis no contradicen la actual comprensión mecanicista del sistema, sino más bien sugerir otros putativo interacciones entre los componentes. Si hay una especificación que no está satisfecho por cualquier ejecución del modelo, entonces hay una contradicción entre la comprensión mecanicista del sistema y los datos experimentales. En este caso, las modificaciones necesarias para el modelo para satisfacer el requisito se sugieren alternativas mecanicista de los modelos estudiados sistema que están más en consonancia con los datos experimentales.

En las siguientes secciones, se describen dos métodos adicionales para analizar el modelo durante el proceso de mejora: el uso de la no-determinismo en partes del modelo, y el cálculo eficiente de todos los estados visitados hasta el infinito.

Uso de la no-determinismo

En el caso de que cada interacción en el modelo es definido con precisión, enumerativa redes son deterministas. No determinismo, sin embargo, puede utilizarse para representar las interacciones desconocidas. En particular, en lugar de estudiar una completa multicelulares modelo, el modelo de una única célula puede ser estudiado por que representan entre las interacciones celulares no deterministically.

El nivel de proteínas que son externos a la célula siguen el modelo de no-determinista variables. Estas variables no pueden saltar arbitrariamente de un valor a otro valor, pero sólo un cambio de nivel por el paso del tiempo. En cada paso del tiempo, la variable puede aumentar, disminuir o permanecer constante. Esto es suficiente para capturar cualquier posible comportamiento ya que las actualizaciones de componentes están limitadas por la ecuación 2. El conjunto de posibles comportamientos del estado de esta proteína es, por tanto, un superconjunto de los posibles comportamientos de cualquier posible objetivo función.

En lugar de la simulación, el uso de cheques modelo, que explora todas las posibles ejecuciones de un no-determinista del sistema. Esto lleva al análisis de un superconjunto de las posibles ejecuciones de cualquier modelo con más limitado entre las interacciones celulares. En caso de no ejecución del sistema cumple con la especificación, entonces es imposible que cualquier modelo de esta célula entre ellos pueden satisfacer las especificaciones, no importa la forma en que el celular entre las interacciones están definidas. Si algunas ejecuciones satisfacer las especificaciones, pero otros no, entonces no es posible predecir el comportamiento de la celda con más limitado entre las interacciones celulares. Este enfoque es, por tanto, útil para averiguar si la mejora debe realizarse a nivel de la inter-comunicación celular o en el nivel intracelular.

Encontrar infinitamente visitó Estados

Nosotros proponemos un algoritmo eficiente simbólico para el cálculo de lo infinitamente visitó los estados de una red cualitativa. El estado S se dice que es infinitamente visitó si hay una ejecución de la red en la que el estado parece infinitamente a menudo. En un contexto biológico, lo infinitamente visitó los estados corresponden a los estados estables del sistema. En el contexto de especificación basada en el análisis del modelo, por lo tanto, estamos interesados en saber si la especificación tiene infinitamente en todos los estados visitados. Esto captura el hecho de que, a diferencia de los sistemas informatizados, sistema biológico no tienen un estado inicial, sino que continuamente se comportan. Después de la división celular, por ejemplo, las dos células resultantes tendrían niveles de proteínas que se encuentran en un nivel cualitativo similar a los niveles en la célula original. Los Estados que no son infinitamente visitó por lo que puede considerarse como inestables estados. Si el modelo se encuentra en tal estado, su capacidad de evolucionar hacia un estado infinitamente visitó en una limitada serie de medidas y, a continuación, siendo infinitamente en los estados visitados por tiempo indefinido. Por lo tanto, no insistir en que el pliego tiene en los Estados que no son infinitamente visitado.

Análisis de redes booleanas también incluir estudios de los atractores del modelo. En discretas, modelos deterministas, atractores son los bucles de uno o más Estados que son visitados a menudo infinitamente. Cuestiones de interés incluyen: el sistema no acabar en uno o varios atractores, y lo que las condiciones iniciales conducen a que atractor. Este análisis requiere la exploración de las ejecuciones a partir de todos los estadios iniciales. El número de posibles estados iniciales es exponencial en el número de variables, y, por tanto, tratamos de podar mediante el uso de la información disponible sobre el sistema. En caso de que no biológicamente significativo definición del conjunto de estado inicial existe, es necesario considerar todos los estados como inicial. En este caso, enumerativa exploración es prácticamente insoluble incluso para los relativamente pequeños modelos. En la sección Métodos, mostramos un algoritmo simbólico para encontrar todos los atractores de un modelo, basado en la representación compacta de conjuntos de estados mediante diagramas binarios de decisión (BDDs) [29].

El algoritmo que proponemos utiliza la estructura de redes multicelulares cualitativa entrelazados por la composición y cálculo de los estados visitados hasta el infinito. En primer lugar, considerar un modelo parcial que consiste sólo de la primera celda. El comportamiento de los componentes en células vecino se resumieron por lo que les permite cambiar no deterministically. Estamos calcular el conjunto de infinitamente visitó los estados de este modelo parcial. Este conjunto contiene la proyección de cualquier infinitamente visitó el estado de modelo completo en las variables del modelo parcial. Usamos esta información para calcular el infinitamente visitó los estados de un modelo parcial que consiste en las dos primeras células. Este proceso se repite para obtener el modelo completo y el conjunto de estados visitados hasta el infinito. Además, este algoritmo optimizar el uso de la partición de transición relaciones [30]. Sobre la base de las funciones objetivo de la lista cualitativa red, definir una relación de transición para una única célula. A continuación, utilizarlo varias veces para calcular el siguiente estado del sistema multicelulares, en lugar de utilizar una única relación de transición para todo el modelo. Los métodos sección contiene una descripción detallada de este algoritmo.

Modelado de red motivos cualitativos utilizando redes

Transcripción reglamento redes contienen patrones que se producen significativamente más a menudo en una verdadera red que en una red de azar con las mismas características. Estos patrones son llamados motivos de red [31]. Los múltiples valores cualitativos utilizados por las redes puedan ser necesarias para el modelo con exactitud el comportamiento cualitativo de los motivos comunes de la red de una manera que sería difícil, si no imposible, para lograr con valores booleanos. Nos ilustran esta capacidad de examinar el caso de la incoherente tipo de alimentación-1-forward loop (I1-FFL) en E. coli.

En este motivo, el factor de transcripción activa X Y factor de transcripción de genes y Z, y factor de transcripción Y Z reprime. El tiempo de respuesta se define como el tiempo necesario para Z para aumentar a medio camino a su estado de equilibrio. En comparación con la regulación simple (sólo se activa X Z), el I1-FFL tiene un corto tiempo de respuesta a la activación de X. X Cuando se activa, el nivel de ambos Y y Z empezar a aumentar. Una vez que el nivel de Y supera el umbral de la represión de la promotora Z, se iniciará la represión Z. Como consecuencia de ello, el nivel de disminuye Z comienza hacia un bajo estado de equilibrio. El tiempo de respuesta es, pues, más corto, debido a que el estado de equilibrio a nivel de Z es inferior al de la simple activación, pero su tasa de transcripción inicial es el mismo en ambos casos. Este comportamiento se ha observado tanto usando modelos cuantitativos [32] y experimental en el sistema de galones en E. coli [33].

En el sistema de galones (Figura 2a], una I1-FFL vincula el activador CRP a la galactosa utilización operón galETK. Cuando hay hambre de glucosa, CRP se activa. CRP entonces se activa tanto galETK y Gals, y Gals galETK inhibe, por lo tanto, el I1-FFL motivo. Además, β-D-galactosa o D-fucosa (en adelante denominado Gals de hab) unbind Gals galETK de la región promotora, por lo tanto, la anulación de su efecto inhibidor. Por último, Gals negativamente auto-regula su propia expresión. Estamos construir un modelo de red cualitativa de este sistema sobre la base de estas interacciones. Este modelo debe cumplir dos requisitos para ser realistas. En primer lugar, la activación de CRP debe conducir a la activación de galETK independientemente del nivel de Gals de hab. En segundo lugar, el tiempo necesario de galETK a aumentar a medio camino a su estado de equilibrio tiene que ser más corto cuando Gals hab está ausente que cuando está presente. Figura 2b muestra la evolución en el tiempo del nivel de galETK después de CRP se activa para ambos casos. Este resultado es cualitativamente similar a las mediciones experimentales de la expresión galETK realizado por Mangan et al. [33].

Cualitativa redes son capaces de proporcionar aproximaciones cualitativas realista del comportamiento de red más comunes motivos, como otros tipos de piensos de avance y los bucles de retroalimentación regulada motivos que aparecen en la transcripción de desarrollo de redes [34].

Estudio de caso: un modelo de la interacción entre la muesca y vías de señalización Wnt

Nosotros aplicamos nuestro enfoque de modelado a un modelo que representa el crosstalk entre los Wnt y Notch en vías de mamíferos queratinocitos. Ambas vías de desempeñar un papel clave en el control de la proliferación celular y la diferenciación, se han vinculado a varios tipos de cáncer. En primer lugar, presentar los antecedentes biológicos, a continuación, introducir el modelo cualitativo red para una única célula y para un modelo con cinco celdas que representan las múltiples capas de la epidermis de mamíferos. Se define un conjunto de especificaciones derivadas de las perturbaciones de laboratorio experimental en estas vías, y utilizarlos para analizar las posibles ejecuciones del modelo.

Análisis del desempeño

En esta sección se describe el desempeño de la simbólica algoritmo usado para calcular todos los estados visitados hasta el infinito de una red cualitativa. En primer lugar, considerar las variaciones de la Notch / Wnt modelo descrito anteriormente. A continuación, utiliza un modelo arbitrario para demostrar que el método puede ser aplicado a modelos más complejos de interacciones entre los componentes. Por último, nos indican que nuestro algoritmo tiene un mejor rendimiento que los algoritmos más simples simbólico. La sección Métodos da más detalles sobre los ajustes utilizados para estos análisis.

El cómputo de todos los infinitamente visitó los estados de los cinco células Notch / Wnt modelo toma 21 minutos. Este modelo tiene 4 60 ≈ 10 36 estadios iniciales. Se trata de un número significativamente mayor que antes estudiados por Boolean redes (por ejemplo, el modelo utilizado por Li et al. [25] 2 11 = 2048 estados). Con el fin de evaluar el desempeño de nuestro algoritmo simbólico en modelos más grandes, ampliar la Notch / Wnt modelo hasta 12 células. Añadimos las células tanto para la capa basal (en el lado izquierdo del modelo) y para la capa suprabasal (en la parte derecha del modelo). Al igual que en los cinco células modelo, el nivel de los receptores Notch está configurado a off en la capa basal, y un alto contenido de la capa suprabasal. Si bien el modelo original tiene sólo una celda con un nivel intermedio del receptor Notch, introducir una segunda celda en el modelo más grande con el fin de obtener un gradiente. Estos modelos se han desarrollado con fines de análisis del rendimiento solamente, y no proporcionan información adicional biológica. El cuadro 1 muestra el tiempo necesario para calcular el conjunto de todos los estados visitados hasta el infinito para los modelos con 3 a 12 células. Los resultados muestran que podemos calcular el conjunto de infinitamente visitó los estados de un modelo que cuenta con más de 10 86 estadios iniciales.

Se observa que la adición de una celda en la capa basal tiene un impacto significativamente menor en el desempeño de añadir una celda en la capa suprabasal. Esto se debe al hecho de que los posibles comportamientos de las células en la capa basal son muy limitadas debido a la falta de señalización Notch. En general, el rendimiento de algoritmos simbólico depende de la forma compacta la representación de los conjuntos de estados y la relación de transición. Esta complejidad está directamente relacionada con la estructura del modelo. En el caso de redes cualitativa, la elección de una combinación diferente de las funciones objetivo tiene un impacto sobre el rendimiento a pesar de que el número de componentes siendo el mismo. He aquí una pequeña ilustración de la construcción de una red arbitraria cualitativos (Figura 5], que no tiene sentido biológico, salvo que sólo utilizamos la activación / inhibición de la función objetivo. Este modelo contiene el mismo número de componentes celulares como por las Notch / Wnt modelo. Las interacciones entre los componentes son más complejos. Con el fin de comparar la complejidad de los dos modelos, consideramos que el tamaño de la BDD utilizados para representar la relación de transición de una única célula. Este tamaño, medido como el número de nodos en la BDD, se refiere más o menos a la memoria requerida. La arbitrariedad cualitativa red se representa mediante nodos 279'504 BDD, en comparación con el 39'564 BDD nodos de la Notch / Wnt modelo. Este aumento de complejidad se refleja en el cumplimiento de lo infinitamente visitó los estados de cálculo. Al considerar sólo tres células de este cálculo toma 33 segundos para el Notch / Wnt modelo, y 113 minutos para la arbitraria cualitativa red.

Nuestro algoritmo interleaves la composición de un multi-celular con el modelo de cálculo infinitamente visitó los estados. Este enfoque supera simbólico algoritmos que calcular directamente el conjunto de infinitamente visitó los estados de la modelo completo. La aplicación del algoritmo directo a los modelos de la Notch / Wnt vía con cuatro o más células falla, porque la representación simbólica de los conjuntos de los estados se vuelve demasiado grande. En los tres modelos de células, las necesidades de nuestro algoritmo de 33 segundos y el algoritmo directa 231 segundos. La ventaja de la primera informática infinitamente visitó los estados en los modelos parciales es que los conjuntos de potencialmente infinitamente visitó los estados es menor que en el algoritmo directo. Esto se ilustra en el Cuadro 2, que proporciona detalles acerca de la aplicación de nuestro método a las diez de células Notch / Wnt modelo. Para cada modelo parcial, indicar el conjunto inicial de los estados de empezar, así como el conjunto de infinitamente visitó los estados de la modelo parcial después de la computación. En particular, cabe señalar que el cálculo de lo infinitamente visitó los estados de completar el modelo comienza a partir de un conjunto de aproximadamente 10 13 estados. Un algoritmo que calcula directamente infinitamente visitó todos los estados comienza a partir de la serie de todos los estados del sistema (aproximadamente 10 72).

El enfoque simbólico que proponemos es capaz de calcular el infinitamente visitó los estados de grandes redes multicelulares cualitativa y manejar modelos complejos. En la sastrería algoritmo específicamente para las redes cualitativo, podemos analizar que los modelos más grandes de la informática directamente infinitamente visitó los estados.

Discusión

En este trabajo, ampliar las redes booleanas cualitativa a las redes, redes que permiten a las variables a tener valores discretos que representan los niveles cualitativos de la actividad de proteínas o la expresión génica. Mediante la introducción de una función objetivo, permitir que un rico conjunto de interacciones entre los componentes. Proponemos un método para el análisis cualitativo de redes, que utiliza la verificación formal de las especificaciones derivadas de observaciones experimentales para mejorar iterativamente el modelo. Con el fin de analizar de manera eficiente las propiedades de infinitamente visitó los estados de grandes modelos, se introduce un algoritmo simbólica que se basa en la estructura de nuestro método de modelado. Nosotros aplicamos este método para construir y analizar un modelo multicelulares de las interacciones entre la Wnt y Notch de mamíferos en vías de queratinocitos. Se demuestra que la propuesta simbólica algoritmo puede ser aplicado a grandes y complejos modelos multicelulares.

Modelo de análisis de enfoque

Nuestro enfoque es modelado encaminadas a utilizar métodos de verificación formal para el análisis de redes de señalización en un proceso iterativo de mejora que se basa en las especificaciones que se derivan directamente de los resultados experimentales. Este trabajo formal, por lo tanto, combina métodos de verificación con el formalismo utilizado ampliamente booleanos de red, y su extensión a los ámbitos cualitativo. Desde booleanos redes son un caso particular de las redes cualitativo, el enfoque iterativo mejora puede aplicarse directamente a las redes booleanas también.

Nuestro método permite la construcción de un modelo con un nivel de abstracción que es similar a la comúnmente utilizada en biología celular, y para analizar utilizando las especificaciones que se derivan directamente de los estudios experimentales. Este enfoque es, por tanto, útil para los biólogos a determinar las lagunas existentes entre la hipótesis mecanicista descripción de un itinerario de interés, y los datos experimentales sobre la hipótesis de que se ha formulado. Por otra parte, el análisis cuidadoso de contrarrestar ejemplos encontrados mediante este enfoque puede dar lugar a nuevas hipótesis sobre la manera de conciliar el modelo con los datos experimentales. Nos ilustran la utilidad de este enfoque de un ejemplo que demuestra que podemos inferir una interacción conocida a partir del análisis de un modelo en que esta interacción se hace caso omiso a propósito. Se sabe que en mamíferos los queratinocitos, Notch se activa la expresión de su ligando dentada. A los efectos de este ejemplo, podemos hacer caso omiso de dicha información, y consideran que Notch inhibe la expresión del ligando Delta, como es el caso en Drosophila cuando la construcción de nuestro modelo original. Ese modelo no es capaz de reproducir la especificación de tipo salvaje (tal como está formulado en la sección de resultados), y por lo tanto, hemos identificado una brecha entre el modelo y la hipótesis de los datos experimentales. El contador ejemplo trazas obtenemos indican que el modelo no es capaz de reproducir la señalización Notch sostenido que es necesario, a fin de reproducir lo observado el comportamiento de tipo salvaje. Esto sugiere que el tipo de interacción entre Notch y su ligando en queratinocitos tiene que ser cambiado a la inhibición de la activación. La aplicación de este cambio en el modelo y luego ejecutar el algoritmo de verificación de nuevo pone de manifiesto que el modelo modificado es compatible con todas las especificaciones. Esto significa que nuestro proceso de refinamiento nos permite inferir la hipótesis de que fue dejado fuera en este ejemplo. Por otra parte, un planteamiento similar, aunque utilizando un formalismo diferente, ha dado lugar a nuevos conocimientos biológicos sobre el desarrollo en vulval C. elegans [6].

Creemos que la posibilidad de silico-en la ejecución de modelos putativo es una forma eficaz para ayudar a los biólogos comprender el comportamiento de un complejo de señalización de redes. Ejemplo contra el trazado es útil no sólo para detectar que un modelo no se comporta como se esperaba, sino también para proporcionar una base concreta en la que uno puede razón acerca de por qué esto es así. Además, de consultar el modelo, interesante ejecuciones podría sugerir nuevos experimentos para ser probados en el laboratorio. Por lo tanto, esperamos que la aplicación de nuestra metodología de modelado a otros sistemas biológicos, ayudará a proporcionar nuevos conocimientos biológicos.

Un ámbito en el que nuestro enfoque parece ser especialmente útil es el análisis celular de la comunicación celular en modelos multicelulares. Dado el tamaño de esos modelos, algoritmos eficientes son obligatorios. El uso eficiente de la modularidad en multicelulares modelos simbólicos de nuestro algoritmo lo hace especialmente adecuado para el análisis de células-células procesos de comunicación junto con las vías intracelulares complejo, un nivel de detalle que sería insoluble para enumerativa o algoritmos más simples simbólico. La utilidad de este algoritmo se extiende más allá del alcance de nuestro enfoque de mejoramiento iterativo. El cómputo de los atractores de redes booleanas, por ejemplo, es principalmente hacer uso de métodos enumerativa. Tales métodos se intratable, incluso para los pequeños modelos, y desde las redes booleanas son un caso particular de las redes cualitativo, nuestro algoritmo simbólico puede aplicarse directamente a este problema.

Modelado de enfoque

Además de ser muy adecuado para nuestra verificación formal basada en la mejora enfoque iterativo, utilizando cualitativa red tiene varias ventajas en comparación con el uso de otros marcos existentes, tal uso de modelos cuantitativos ecuaciones diferenciales y las redes de operadores booleanos. En esta sección, hablamos de estas ventajas y, a continuación, destacar los beneficios de separar claramente el modelado de un sistema que utiliza un marco bien definido como cualitativa de las redes de su aplicación.

Uso de variables cualitativas discretas establece, permite el modelado en un nivel de abstracción que es similar a la utilizada en muchos estudios biológicos. Métodos cuantitativos, como la ecuación diferencial basado en modelos, permiten continua y precisa de modelado de la ejecución de un sistema, sino que requieren de ajuste de varios parámetros que a menudo no están fácilmente disponibles para muchos sistemas biológicos. El importe de precisión proporcionada por estos métodos puede ser innecesaria para analizar un supuesto modelo sobre la base de resultados experimentales que sólo proporcionan los niveles cualitativos de los componentes del sistema. Los resultados obtenidos mediante modelos cualitativos red de redes motivos que se producen con frecuencia, como el I1-FFL, indican que el enfoque cualitativo redes proporciona una aproximación realista cualitativo de los observados experimentalmente el comportamiento del sistema.

La mejora enfoque iterativo utilizado para la construcción de un modelo coherente, así como nuestros algoritmos de análisis se puede aplicar a redes de operadores booleanos. Sin embargo, la ampliación de las redes booleanas permite tanto a crear modelos más detallados en términos de granularidad, y para un modelo más rico conjunto de las interacciones biológicas, gracias a la introducción de la función objetivo. El uso de más de dos niveles si es necesario un resultado experimental no puede formularse como un requisito más de valores booleanos. Este es el caso si, por ejemplo, la eliminación de un gen conduce a un aumento en el nivel de proteína B, pero la combinación de genes knockout A y B lleva a un aumento significativamente mayor. Un ejemplo adicional para que al menos tres niveles se necesita es el caso cuando en un experimento el nivel de disminuye una proteína, mientras que en otro se incrementa.

Las ventajas de utilizar redes cualitativa no se limitan a la mayor potencia expresiva del pliego de condiciones. Boolean redes no son suficientes para modelar algunas de las pautas observadas. Por ejemplo, la acción de dos activadores de la transcripción de un gen puede ser acumulativo, mientras que las redes booleanas sólo permiten modelar el caso en que la presencia de un factor de transcripción es suficiente para que ocurra la transcripción. Por otra parte, mientras que la influencia de la I1-FFL motivo por el tiempo de respuesta puede ser modelado utilizando redes cualitativa, este no es el caso con las redes de operadores booleanos. En el caso de los estudiados ejemplo, el requisito de que la presencia de CRP necesariamente conduce a la activación de galETK implica que, en una red booleana, el valor de galETK necesariamente dependen directamente sobre el valor de PCR, así como la contribución de las necesidades Gals para ser ignorada. Un ejemplo aún más sencillo que no puede ser reproducida por las redes booleanas es negativa auto-regulación, cuando un factor de transcripción reprime su propia expresión. Negativo auto-regulación se ha demostrado que conducen a los tiempos de respuesta más rápido [43]. En las redes booleanas, es necesario hacer caso omiso de la regulación negativa de automóviles, ya que considerando un inhibidor de la interacción con un componente propio daría lugar a oscilaciones.

Estos ejemplos ilustran la necesidad de ampliar las redes booleanas a la composición cualitativa de dominio. Dependiendo de la estructura de la red y estudiado las especificaciones correspondientes, booleanos redes pueden sin embargo ser suficiente en algunos casos. Dado que todavía es posible utilizar el mismo enfoque de análisis, los valores booleanos se debe utilizar en una situación de este tipo para reducir el tamaño del estado espacio. Posibles ampliaciones de la red cualitativa marco incluyen la adición de probabilidades, lo que resulta en los procesos de Markov, para que los métodos de verificación formal existen. Sin embargo, los datos necesarios para estos modelos a menudo no se dispone, y la verificación de los sistemas probabilísticos es computacionalmente difícil.

Nociones de concurrencia

Cualitativa redes, al igual que las redes booleanas, son sincrónicos. En cada paso del tiempo, el estado de todas las variables se actualiza de acuerdo con el estado anterior del sistema. En esta sección, se discute la aplicabilidad de otros conceptos de concurrencia en el contexto de las redes cualitativa. Las variables que utilizamos son representaciones cualitativo del nivel de proteína o actividad de expresión génica. Por lo tanto, estas variables representan una gran población de moléculas individuales. Las interacciones entre moléculas individuales son muy estocástico. Cuando se utiliza discretos niveles de proteína actividad o expresión de genes, consideramos que las reacciones bioquímicas tienen una demora. La estocasticidad de las reacciones individuales resultados en las pequeñas variaciones de este retraso. El nivel de todas las variables se actualiza de acuerdo con los valores anteriores. Un cambio, por lo tanto, toma un tiempo para propagar el paso de una variable a otro. El paso del tiempo por lo que puede considerarse como el retraso de las reacciones bioquímicas. En caso de que existan grandes diferencias entre los plazos de las diferentes reacciones, es posible utilizar las funciones objetivo en los anteriores estados de los sistemas en lugar de sobre el estado actual. El impacto de las pequeñas variaciones de la demora dependerá de la granularidad del modelo. La mínima diferencia entre dos valores posibles de una variable es inversamente proporcional a la granularidad de la variable. En un modelo con un pequeño granularidad, las variaciones de la demora daría lugar al mismo valor, debido al redondeo. En este caso, la ejecución sincronizada es suficiente para reproducir el comportamiento del modelo. A medida que el aumento de granularidad, redondeo de las cifras ya no es suficiente para el manejo de la variabilidad de los retrasos. Con el fin de modelar esta variabilidad, es necesario introducir la no-determinismo, al permitir la ejecución asíncrona del modelo. En un sistema asíncrono, un planificador podría elegir cualquier subconjunto del sistema que se actualizará, mientras que los otros permanecen constantes. Esto significa que el retraso de una interacción es totalmente independiente de la demora de otras interacciones del sistema, así como de los anteriores retrasos de la misma interacción. Esta independencia es, por tanto, un exceso de aproximación del comportamiento esperado del sistema, y por lo tanto es probable que produzca un poco las ejecuciones. Por lo tanto, mientras que una ejecución sincronizada es apropiado cuando la granularidad es baja, los modelos más precisos en términos de granularidad llamamiento en favor de un mejor manejo de la concurrencia.

El estado explosión problema

La exploración exhaustiva de todas las posibles ejecuciones de un sistema es exponencial en el número de variables del sistema. Este número se llama el estado explosión problema. Por ejemplo, en el caso de encontrar infinitamente visitó todos los estados, el número ilimitado de estadios iniciales de un sistema con k variables y granularidad N es N k. Enumerativa métodos son prácticamente insoluble incluso para los pequeños valores de k. Por otra parte, la complejidad de la Notch / Wnt modelo también causó la aplicación directa de los métodos simbólicos al fracaso de modelos de más de tres células. El número de variables de un sistema no sólo depende del tamaño de las vías estudiadas, sino también sobre el número de células representadas en el modelo. Por lo tanto, el número de estados iniciales es también exponencial en el número de células, lo que hace multicelulares modelos difíciles de analizar. Con el fin de poder analizar los modelos de mayor tamaño, por lo tanto, es necesario utilizar métodos más elaborados que tienen el potencial para eludir el estado explosión problema en casos específicos. Nosotros proporcionamos una ilustración de este enfoque en la simbólica algoritmo utilizado para el cálculo de lo infinitamente visitó los estados. Usamos tanto la modularidad y las características específicas de las transiciones de nuestro modelo con el fin de permitir entrelazados composición y cálculo de los estados visitados hasta el infinito. Las características de nuestro modelo también hacen muy adecuado para el uso de la partición de transición relaciones. Estamos en condiciones de calcular el conjunto de estados infinitamente visitado por un modelo de 12 celdas, que tiene 4 144 ≈ 10 86 estadios iniciales. Nuestro enfoque es, por tanto, muy adecuado para el análisis cualitativo de redes multicelulares. Este tipo de modelo es particularmente útil para estudiar las vías que involucran entre la comunicación celular.

Además de utilizar la especificidad del modelo para adaptar el algoritmo de verificación, los métodos utilizados en software y hardware modificación, tales como asumir la garantía de razonamiento [44], o contraejemplo guiada por el perfeccionamiento abstracción [45] también podría aplicarse a los modelos de biológicos sistemas. Si lo hace, tiene el potencial para hacer posible el análisis de modelos más grandes. En el contexto de la Notch / Wnt modelo, esto podría permitir el estudio de tejidos multidimensional con un mayor número de células, y por lo tanto, el análisis de los efectos locales, tales como agrupaciones de células.

Conclusión

En este trabajo nos proponemos una ampliación de las redes booleanas de variables que permite representar el nivel de proteína o actividad de expresión génica a lo largo de más amplio rango de dominios, junto con más flexibles opciones de actualización de estos valores. Se demuestra que las redes de un modelo cualitativo de un motivo frecuente de red ofrece una válida aproximación cualitativa de los observados experimentalmente el comportamiento de este motivo. Este marco puede ser utilizado para modelar las redes recurrentes. Además utilizamos métodos de verificación formal para analizar el estado de equilibrio comportamiento cualitativo de las redes. Razonamiento sobre conjuntos de estados en lugar de cada uno de los estados, y el uso de una partición reducción nos permite escala-hasta muy grandes modelos. En particular, las redes cualitativos pueden utilizarse para analizar varios modelos de celular, y por lo tanto, para estudiar las vías que involucran a las células de la comunicación celular. Similar a las redes booleanas, este enfoque podría ser útil para el análisis biológico de las vías, incluso cuando los datos cuantitativos que falta. Creemos que la capacidad de verificar formalmente un modelo biológico frente a las observaciones de laboratorio ofrece grandes ventajas en la mejora de hipótesis de trabajo y sugerir nuevas direcciones experimentales que puedan producir nuevos resultados.

Métodos

Usamos el Reactiva Módulos (RM) formalismo [46] ejecutable para aplicar modelos basados en redes cualitativa. En esta sección, primero introducir RM, a continuación, describir cómo hacer uso de su estructura modular de esta aplicación. Se describe cómo se obtienen las especificaciones de los datos experimentales, y cómo la aplicación del modelo se verifica en su contra. Por último, se describen los simbólica algoritmo usado para calcular el infinitamente visitó los estados de una red cualitativa.

La verificación de los sistemas reactivos
Modular la aplicación cualitativa de las redes

La aplicación cualitativa de las redes se extiende y se adapta la modularidad de los módulos de reacción a modelos biológicos. La lista de destinatarios se definen las funciones de relación entre los componentes mediante la especificación de una función objetivo por cada variable. Separamos este modelo en la construcción de bloques, donde cada elemento controla una variable. Cada elemento es un ejemplo de un elemento fundamental. Para cada tipo de función objetivo (como el objetivo mínimo o la función de activación / inhibición de la función objetivo), creamos un elemento fundamental. Tenga en cuenta que, desde Mocha no acepta parámetros, no podemos crear un único elemento básico para la activación / inhibición de la función objetivo, y tenemos que crear una para cada combinación de los parámetros α ij utilizados en el modelo. Los casos de los bloques de construcción básicos se combinan junto con arreglo a la lista de funciones objetivo de conectar la salida de las variables de un bloque de construcción para la variables de entrada de uno o varios otros bloques de construcción. Una célula está representado por el paralelo composición de varios casos de bloques de construcción que oculta los componentes internos (los hace variables privadas) y representa la interacción entre la célula y el medio ambiente como interfaz y las variables externas, permitiendo así la conexión con otras células. Esta arquitectura es una consecuencia del enfoque modular de RM, que utiliza un concepto de conexión similar a las conexiones entre componentes en un circuito eléctrico.

La aplicación de cada elemento básico constituye un módulo, con una o más variables externas (que corresponde a la entrada de la función objetivo) y una interfaz variable (el valor del componente controlado por la construcción de bloques). Una variable adicional se utiliza para controlar el comportamiento de la construcción de bloques. Esta variable es sólo esperada y, por tanto, no contribuye a la magnitud del espacio de estado. El bloque está compuesto de dos átomos. El primer átomo calcula el valor de la función objetivo de la construcción de bloques basado en los valores de las variables de entrada en el estado actual. Este átomo es específico para cada elemento. Se obtiene directamente de la definición de la correspondiente función objetivo, la cartografía de todas las posibles valoraciones de las aportaciones correspondientes al valor objetivo. El segundo átomo implementa Ecuación 2 para calcular el valor del valor de salida en el próximo estado del sistema basado en el destino, el valor actual del sistema y el control de valor. Este átomo es el mismo para todos los bloques de construcción. Se asegura de que la salida variable de aumentos y disminuciones en más de un nivel por paso en vez de saltar directamente de su estado actual a la meta. La variable de control permite especificar el valor inicial o para elegir a los no-deterministically comienzo de cada posible valor.

También introducen la posibilidad de que un elemento fundamental para determinar el valor inicial de salida de un edificio de bloque basado en el valor inicial de sus aportaciones en lugar de tener que configurar es arbitraria o no deterministically. Esto permite obtener un primer estado del sistema en el que sólo unas pocas variables y se establecen los otros son, lógicamente, se derivan de ellas. Por otra parte, la elección no determinista valores iniciales de algunas variables y, a continuación, se derivan las demás variables inicial da lugar a mucho menos posible estadios iniciales de elegir el valor inicial de cada variable no deterministically, si bien todavía a explorar el más plausible estadios iniciales. En caso de que hay dependencias mutuas entre las variables (es decir, un componente en última instancia afecta a sí mismo en un bucle), este enfoque sólo puede aplicarse a algunas de las sustancias. En tal caso, tratando de simplificar el estado inicial de todas las sustancias daría lugar a un bucle de dependencias que no pueden resolverse. Por lo tanto, es necesario elegir al menos una variable en cada bucle del modelo para que el valor inicial se establece o no-determinista.

La formulación de especificaciones

Especificaciones desempeñar un papel clave en nuestro planteamiento: son el vínculo entre los resultados experimentales y el modelo computacional. Un modelo putativo tiene que atenerse a las especificaciones con el fin de ser considerado como un potencialmente válidos de la representación sistema biológico. Si el modelo no se ajusta a un requisito del pliego de condiciones, entonces ya sabemos que el modelo no es capaz de explicar todos los resultados experimentales, y, por tanto, necesita ser mejorado.

En la definición de especificaciones, que comenzará a partir de la descripción de los experimentos y obtener los requisitos de seguridad. El resultado puede observarse a continuación, se formula como un predicado sobre los valores de los diferentes componentes del sistema. En el caso más simple, la especificación puede ser expresado como un predicado sobre el estado actual del sistema. Por lo tanto, podemos formular una invariante que debe celebrar en todos los estados del sistema. Sin embargo, es a menudo necesario considerar que el modelo comienza a partir de una arbitraria estado inicial y las necesidades de algunas iteraciones a estabilizarse. Por lo tanto, elegir un número arbitrario de pasos durante el cual el invariante no está activada. Esta configuración permite verificar si el el tipo salvaje (normal) modelo cumple determinadas especificaciones.

También estamos interesados en verificar los resultados de los experimentos que incluyen modificaciones del modelo biológico. En primer lugar, examinar en qué condiciones el experimento se ha llevado a cabo. Consideramos que las condiciones experimentales que participan dos tipos de manipulaciones: la sobre-expresión de un gen, en el que el nivel de este gen se mantiene en un nivel elevado y la eliminación de un gen, en el que un determinado gen se ha modificado de forma que no pueda ser transcrito en una proteína. En ambos casos, la influencia de las vías de aguas arriba hacia el modificado variable se ignora. Los experimentos podrían entrañar cada combinación de estas perturbaciones. Con el fin de poder modelo de estos experimentos, modificar el átomo de control de los elementos básicos de la adición de dos valores para la variable de control: gen gen knockout y de expresión. Cuando la variable de control toma uno de estos valores, la función objetivo es ignorado. En el caso del gen knockout, el blanco es la proteína no se traducen en absoluto, y no está presente en la célula. Estamos modelo de esta situación al mantener el valor de salida en el valor más bajo posible cuando la variable de control indica que se ha producido knockout. Más de expresión de genes se produce cuando el nivel de un determinado gen se mantiene elevado y constante, y modelo del mismo modo que el mantenimiento de valor de salida en el valor más alto posible. Nosotros usamos un monitor, que es un módulo adicional que dice el nivel de los componentes y controles de la variable de control de cada uno de los bloques de construcción. El primero permite controlar el modelo estabilizar lo largo de un cierto número de iteraciones, entonces cambia la conducta de algunos bloques de construcción de acuerdo con el experimento realizado, entonces permite que el modelo para estabilizar de nuevo más de un número arbitrario de iteraciones y, a continuación, comprueba si el cambio inducido a el experimento se corresponde con los resultados del experimento. El monitor controla un valor booleano, lo cual es cierto hasta que este control se lleva a cabo, y se ajustarán de conformidad con falsas si la ejecución no es reproducir el pliego de condiciones. Por lo tanto, podemos utilizar un invariante que corresponde al monitor ser cierto para todos los estados posibles del modelo.

El uso de monitores, por lo tanto, podemos comprobar que las especificaciones son más ricos que invariantes, sino un subconjunto de las propiedades generales de seguridad. El monitor permite que se ha descrito anteriormente para verificar si todas las ejecuciones del modelo cumplen un determinado pliego de condiciones. Cuando este no es el caso, estamos interesados en saber si algunos ejecución cumple el pliego de condiciones. Podemos hacer esto con los monitores, de verificar si existe una huella en que el doble de la especificación no está satisfecho en todos los estados en que la especificación esté marcada.

También estamos interesados en ampliar el concepto de retrasos para la estabilización del modelo, sólo por verificar en el pliego de condiciones infinitamente visitó los estados. Consideramos que una ejecución del modelo como un prefijo seguido de un bucle en el que el modelo se mantiene indefinidamente a menos que haya algún cambio en el modelo. El cambio provoca un comportamiento similar, con un segundo prefijo y un segundo bucle. Desde Mocha no proporciona una forma directa de la detección de bucles, usamos un exceso de aproximación de la longitud del prefijo y el bucle como demora para la estabilización. Cuando una contradicción se encuentra, verificamos que la traza contiene un bucle, lo que significa que la contradicción se produjo en el bucle y por lo tanto es válido lo contrario, sabemos que tenemos que aumentar nuestra aproximación. Esta solución no es utilizable cuando el número de ejecuciones diferentes es grande. En la siguiente sección, se propone un algoritmo simbólica que se encuentra infinitamente visitó todos los estados de la modelo, y verifica una propiedad única en estos estados. Este método no requiere el uso de monitores.

Simbólico cómputo de todos los estados visitados infinitamente

Proponemos un algoritmo simbólico para el cálculo de todos los estados visitados hasta el infinito de una red cualitativa. Infinitamente visitó los estados de la modelo representa la estabilidad de los estados sistema biológico, y corresponden a la noción de atractores en las redes de operadores booleanos. Nuestro algoritmo se basa en la modularidad cualitativa de las redes. Se interleaves el cómputo de infinitamente visitó los estados de partes del modelo con la composición de estas piezas. Este proceso se traduce en última instancia, un modelo completo y el conjunto de infinitamente visitó los estados de la modelo. En esta sección, primero introducir métodos simbólicos y la herramienta utilizada para la aplicación del algoritmo, y luego describir el algoritmo.

Configuración del análisis del rendimiento

Las pruebas de rendimiento se realizan en un 3 GHz Intel Xeon ordenador con sistema operativo Linux Fedora Core 3 (versión del núcleo 2.6.11). El CrocoPat herramienta pueden utilizar hasta 3 GB de memoria.

Autores de las contribuciones

MS lleva a cabo el trabajo de modelado, concibió la idea de la red marco cualitativo, y se lleva a cabo el análisis del modelo. JF concibe el estudio y participó en su diseño. TAH participado en el diseño de este estudio. Todos los autores colaboraron para la elaboración del manuscrito, leer y aprobado el manuscrito final.

Agradecimientos

Damos las gracias a Nir Piterman, Freddy Radtke y Grégory Théoduloz para un debate fructífero y Dirk Beyer de asistencia con la aplicación de los algoritmos simbólicos. Esta obra fue financiada en parte por SNSF subvención 205301-111840.