PLoS ONE, 2006; 1(1): (más artículos en esta revista)

Self-la corrección de mapas moleculares de las vías

Biblioteca Pública de la Ciencia
Andrey Rzhetsky [1], Zheng Tian [3], Chani Weinreb [1]
[1] Nueva York, Nueva York, Estados Unidos de América
[2] Nueva York, Nueva York, Estados Unidos de América
[3] Nueva York, Nueva York, Estados Unidos de América
Resumen

Fiable y completa de mapas moleculares de las vías son indispensables para orientar complejos experimentos biomédicos. Estos mapas suelen ser ensambladas a partir de miríadas de diferentes informes de investigación y se llena de incoherencias debido a las variaciones de las condiciones experimentales, y / o errores. A menudo es una tarea insoluble manualmente para verificar la coherencia interna más una gran colección de declaraciones experimental. Para automatizar en gran escala los esfuerzos de reconciliación, proponemos un control aleatorio de arcos y nodos de modelo en caso de que ambos nodos (tejido-específico los estados de moléculas biológicas) y arcos (las interacciones entre ellos) están representados con variables aleatorias. Mostramos la manera de obtener un no-contradictoria modelo molecular de una red informática de la distribución conjunta de nodo y arco variables, y luego aplicar nuestra metodología realista a una red, generando un conjunto de hipótesis comprobables experimentalmente. Esta red, derivados de un análisis automatizado de más de 3000 texto completo de artículos de investigación, incluye los genes que han sido hipotéticamente vinculadas a cuatro enfermedades neurológicas: enfermedad de Alzheimer, autismo, trastorno bipolar y la esquizofrenia. Se estimó que aproximadamente el 10% de las interacciones moleculares publicados son lógicamente incompatibles. Nuestro enfoque puede aplicarse directamente a una serie de diversos problemas entre ellos los encontrados en la biología molecular, ecología, economía, la política y la sociología.

Introducción

La innovación científica a menudo el producto a través de una minuciosa búsqueda de una lógica coherente modelo que mejor explica una gran colección de débilmente apoyado y hechos contradictorios. Podemos pensar en la generación de buenos modelos a partir de observaciones ruidosas como lo que John von Neumann llama una "síntesis de organismos fiables de componentes poco fiables" [1]. Aunque los científicos están excelentemente cualificados razonamiento a lo largo de numerosas declaraciones de diversos grado de certeza, este manual razonamiento raramente escalas hasta conjuntos de miles o millones de declaraciones. Esta limitación humana se ha hecho aún más evidente durante la última década, debido a la aparición de alto rendimiento técnicas que faciliten la generación de casi instantánea de enormes colecciones de datos biomédicas. El objetivo principal del presente estudio es la verificación automática de la coherencia de las declaraciones acerca de interacciones moleculares que han sido generados por un ejército de investigadores no coordinadas.

Para entender el problema en parte, imagino que tenemos que conciliar los datos que se han observado por tres laboratorios de investigación, cada una de las cuales no tiene conocimiento de la otra el progreso. 1 Laboratorio llevó a cabo una serie de experimentos que sugieren fuertemente que el producto del gen HBP1 es abundante en las neuronas en la amígdala (una región del cerebro humano). Laboratorio 2 demostrado que WNT1 gen se expresa también en las neuronas de la amígdala. Laboratorio 3 informó de evidencia experimental que HBP1, cuando expresó en una celda, completamente inhibe la actividad de WNT1.

Al publicarse en tres artículos separados y revistas, cada uno de estos tres estados parece razonable y estar bien fundamentadas, cuando se conjugan, sin embargo, podemos ver claramente que, o bien [1], uno de ellos debe ser erróneo (por ejemplo, la actividad de los genes cambios a lo largo del tiempo, por lo que WNT1 y HBP1 nunca se expresó simultáneamente en la misma celda), o [2] que no se dan cuenta de un hecho que puede resolver la paradoja (como la existencia de un regulador de la proteína de señalización que media entre HBP1 y WNT1).

Para hacer el ejemplo algo más complejo (e interesante), imagine que obtener datos de dos nuevos grupos de investigación. 4 Laboratorio de datos indican que la proteína EMX2 es casi seguro que se expresa en las neuronas de la amígdala humana; laboratorio experimental de 5 resultados muestran inequívocamente que el producto de EMX2 inhibe WNT1. De repente, podemos ver que los datos que indican que el gen WNT1 está activa en la amígdala humana están en contradicción con los datos de los otros cuatro laboratorios. Así, 2 de laboratorio los resultados son los primeros candidatos para nuevo examen.

Ahora vamos a modificar aún más el problema de alinear más estrechamente con la complejidad del mundo real. Imagínese que el experimental hechos son apoyados de manera desigual con algunas pruebas que muestran que es más fuerte que la de otros. Por otra parte, en lugar de tener un juguete conjunto de datos que contiene sólo tres moléculas y sólo dos interacciones, tenemos que hacer frente a los hechos acerca de la presencia o ausencia de cientos o miles de moléculas que pueden interactuar en cualquier número de maneras.

Resultados y Discusión
Random arcos y nodos modelo

A fin de abordar formalmente el problema al que nos acaba de exponer, le sugerimos al azar-y arcos-nodos modelo gráfico de una versión modificada de una red bayesiana.

La clásica red de formalismo Bayesiano se inventó para hacer frente a tareas que se asemejan a la de hacer un diagnóstico médico automatizado [2] - [7]. Una típica red bayesiana había una variable aleatoria asociada a cada nodo, mientras que las dirigidas arcos de la gráfica representa las dependencias entre los nodos. Para cada par de nodos conectados por un arco dirigido, el nodo con el arco saliente se llamaba un padre del nodo con el arco. El estado de cada nodo se supone que depende de la forma condicional los estados de que los padres de nodo, y condicionalmente independientes (habida cuenta de los estados de la patria potestad nodos) a partir del resto de nodos de la gráfica. Por su diseño, en estos modelos, aún no se la observó los estados de nodos (estado desconocido enfermedad que causa los síntomas observados) de los intereses predominantes. Los arcos de la probabilística las relaciones entre las variables nodo-se supone conocido e inmutable [8], [9].

Volviendo al problema que se señala en la introducción, podemos ver que, cuando se trata de una gran colección de declaraciones generado por un conjunto diverso de fuentes de la desigualdad en la calidad, los conflictos internos entre los estados de numerosos arcos y nodos son ineludibles. Por lo tanto, podría ser útil para permitir que los arcos a estar asociado con variables aleatorias, y para cuantificar y arco-nodo incertidumbre asociada al mismo tiempo. Estas nuevas relacionadas con el arco de variables aleatorias puede representar la fuerza del apoyo experimental de interacciones moleculares individuales. Podemos entonces actualización tanto de arco y nodo distribuciones, respetando los estándares de cálculo de probabilidad, para mejorar la coherencia global del modelo.

Aquí proponemos un modelo, una simple generalización de una red bayesiana, donde ambos arcos y los nodos representan variables aleatorias. Al igual que en la clásica red bayesiana aplicada a la biología molecular de datos, los valores permitidos para las variables de nodo se puede definir como activo / inactivo y presente / ausente-que describen los posibles estados de una molécula en una célula o un tejido. (Como alternativa, en lugar de tener sólo dos valores admisibles por cada nodo, se podría asumir tres valores: activo, inactivo, y ausentes. En aras de la simplicidad, hemos optado por tratar los estados inactivos y no como indistinguibles.) Desviarse de los clásicos Formalismo Bayesiano red, definimos arco variables, cada una con valores permitidos inhibir, activar, y no produjo efecto alguno. La intuición detrás de esta formulación es proporcionar un mecanismo para el arco de variables para cambiar sus valores en función de los estados de los ganglios que rodean, además de las tradicionales dependencias probabilísticas entre el padre y el niño-nodo variables. (Si asumimos que el arco variables son condicionalmente independientes entre sí y el nodo de variables, nuestro modelo vuelve a la clásica red modelo Bayesiano.) Nuestro objetivo aquí es estimar tanto la articulación y la conciliarse las distribuciones marginales más nodos y arcos, dado parcial antes de probabilidades marginales en los nodos y arcos y un conjunto parcial de probabilidades condicional. (Para satisfacer clásico cálculo de probabilidad, P (A U, V = -1) + P (A U, V = 0) + P (A U, V = 1) = 1, donde inhiben, no surte efectos, activar y se codifican con números enteros -1, 0 y 1, respectivamente, y P (V = 1) + P (V = 0) = 1, cuando escribimos V = 1 y V = 0 para activo / inactivo y presente / ausente valores de V, respectivamente.) podemos ver el marginal conciliarse las distribuciones de arcos y nodos en nuestro modelo como hipótesis comprobables experimentalmente.

Random variables asociadas con los arcos puede ser particularmente útil para expresar los conocimientos generales acerca de los eventos moleculares-cuando se sabe que la interacción entre dos sustancias es posible, pero no precisa la especificación de la condición se da. Nodo específico de variables aleatorias puede ser útil para expresar las condiciones experimentales para un celular, estado de células, tejido u órgano. La información inicial sobre los datos en nuestro modelo se expresa como marginales antes de probabilidades más de los nodos y arcos. También definir condicional probabilidades de nodos dado arcos, arcos y habida cuenta de nodos (véase el recuadro Matemáticas). Nosotros utilizamos un análogo de la estocástica de integración procedimiento para calcular la probabilidad conjunta sobre todas las variables aleatorias. Como es común en aplicaciones de redes bayesianas a datos reales, asumimos que nuestra interacción molecular-modelo no tiene ciclos dirigidos.

Como se convertirá en claro del análisis de ejemplos más adelante en el documento, las disparidades entre las probabilidades antes de reconciliarse y marginal probabilidades surgen cuando hay conflictos importantes entre las probabilidades antes de las variables.

General idea de computación

Para hacer nuestro modelo aplicable a los datos reales, necesitamos un mecanismo para estimar la distribución conjunta de todas las variables dadas previa parcial y condicional distribuciones. Una buena analogía espacial para nuestra propuesta de enfoque computacional es el problema de la inferencia de una forma tridimensional (lo que corresponde a la distribución conjunta de nodo y arco variables) de un objeto, a partir de sus proyecciones ortogonales (que corresponden a las distribuciones de condicional habida cuenta de arcos y nodos nodos dado arcos).

Sería computacionalmente intratable a enumerar explícitamente las probabilidades conjunta para todos los estados de todas las variables en un gran aleatorios arcos y nodos modelo debido al enorme tamaño del estado espacio. Sin embargo, podemos definir fácilmente las distribuciones condicionales P (arcos | nodos son fijos) y P (nodos | arcos son fijos) y las distribuciones previas para todas las variables. Podemos entonces calcular la distribución conjunta de los valores para ambos arcos y nodos mediante una cadena de Markov Monte Carlo técnica, que es un cómputo de alto rendimiento de una versión estocástica de integración [10], [11]. Más precisamente, le sugerimos utilizar un muestreador Gibbs versión de la cadena de Markov Monte Carlo, los valores de muestreo para arcos y nodos de la adecuada distribución condicional, tal como se describe en el recuadro y Matemáticas en la información de apoyo.

Toy y no tan ejemplos de juguete

Para apoyar nuestra afirmación de que la aplicación de nuestro modelo puede conducir a la intuitiva y potencialmente útil resultados, aclarar los conceptos pertinentes con tres ejemplos de juguete. A partir de estos ejemplos de juguete es fácil ver que las distribuciones de reconciliarse marginal corresponden a una coherencia interna vía gráficos. Por otra parte, un gran cambio en la entropía (pérdida o ganancia de información) entre el antes y reconciliarse marginal distribuciones de variables aleatorias se puede atribuir directamente a los conflictos y acuerdos entre estados en el modelo. Después de describir los ejemplos de juguete que a través de un paso más grandes, vía realista.

Para nuestro ejemplo de juguete que hemos elegido una X en forma de gráfico dirigido se muestra en la Figura 1. Esperamos en tres diferentes distribuciones de variable antes de la topología del mismo. Figura 1 (A) ha lógicamente coherente antes de las distribuciones más variables. La razón más probable de los estados de nodos de G, B, C y se activa / actual; en consonancia con eso, G y B, ambos, muy probablemente, activar C. Del mismo modo, nodo C (muy probablemente) nodo E inhibe y activa nodo D, una situación en consonancia con el probable estado de los ganglios D y E, respectivamente. El conciliarse las distribuciones marginales de las mismas variables (Figura 1 (A), los marginales) tienen un aspecto similar a la correspondiente antes de las distribuciones. Sin embargo, la distribución marginal conciliarse, por término medio, se convirtió en más informativo: la entropía global del conciliarse las distribuciones marginales gotas de 0,45 bits para el nodo de variables y 2,14 bits para el arco variables, en comparación con la distribución previa. (La entropía de Shannon una variable aleatoria con sólo dos estados, 0 y 1, se define como - p 0 log 2 p 0 - p 1 log 2 p 1, donde p 0 y p 1 son las probabilidades de que encontraremos la variable en estado 0 o 1, respectivamente. Una expresión similar con tres términos en la suma define la entropía de un período de tres estado variable aleatoria. La información de Shannon se define como una diferencia entre dos valores de entropía para el mismo sistema de información se gana cuando entropía disminuye y se pierde cuando crece la entropía.) En otras palabras, si comenzamos con un conjunto coherente de antes, lógicamente, las distribuciones más variables en un gráfico, podemos obtener información de la informática la distribución conjunta sobre todas las variables, porque en consonancia partes del azar gráfico se refuerzan mutuamente y hacer conciliar la distribución marginal mayor (más información).

Las distribuciones incompatibles con anterioridad para las mismas variables (Figura 1 (B) y (C)) dar lugar a muy diferentes propiedades de las distribuciones de reconciliarse. En el gráfico se muestra en la Figura 1 (B), nodo B se activa y se cree que inhiben el nodo C, C todavía se considera activo. Además, nodo C se cree para activar nodo D, D nodo aún más probable es inhibida / ausente. Las correspondientes distribuciones marginales reconciliado para arcos y nodos ya no son incompatibles: se convierte en nodo D activada, mientras que ABC arco cambia su valor más probable de inhibir a activar. Sin embargo, esta mejora en la coherencia se logra a un precio: la pérdida de certeza en las distribuciones marginales reconciliado. Es decir, la entropía de la distribución de conciliar el aumento de 1,41 bits de nodos y de 0,32 bits para arcos. El ejemplo en la Figura 1 (C) tiene un aparente conflicto entre los estados de arcos A y A GC BC (ambos arcos son, muy probablemente, en el estado inhiben) y la activa / presente los estados de nodos de G, B y C. En Además, el nodo E se cree que originalmente se activará por nodo C, pero su estado más probable es que está inactivo. Al igual que ocurre con los ejemplos anteriores, las distribuciones marginales conciliarse son libres de las incoherencias observadas en la distribución previa, pero a expensas de un aumento de la entropía (pérdida de información, de 0,125 bits para nodos y 0,53 bits de arcos). A mayores, realista itinerario gráfico pueden tener coherentes y contradictorios partes.

Para obtener una gran experimentalmente tierra conjunto de datos, hemos utilizado los datos de un gran texto-proyecto minero [12] [13], siempre que el acceso a los resultados experimentales descritos en cientos de miles de artículos de investigación publicados. Estos datos estrechamente relacionadas con el imaginario situación descrita anteriormente, donde los investigadores en numerosos laboratorios de experimentos corrió desconocen los demás resultados [14]. Hemos decidido compilar y analizar una serie de interacciones moleculares humanos entre los genes que se sospecha que albergan los polimorfismos genéticos que predisponen a una de las cuatro principales trastornos neurológicos: el autismo, la enfermedad de Alzheimer, trastorno bipolar y la esquizofrenia. Presentamos aquí el análisis de 3, 161 artículos de texto completo (hemos utilizado 6, 724 únicas frases de estos artículos para extraer interacciones moleculares) de 64 importantes revistas científicas (ver información de apoyo para obtener información detallada sobre las fuentes de datos). La red molecular que analizamos con nuestro método se dirige carece de los ciclos para generar un gráfico loopless, dirigidos en cada ciclo de la literatura original derivado del modelo de red, eliminado los más débiles (menos apoyado) arco, tratando de minimizar el número total suprimido de arcos. Para recopilar información sobre el cerebro de expresión específica de genes en nuestra red molecular, se examinaron 910, 221 resúmenes de revistas que se refiere específicamente a los tejidos del cerebro, 14, 780 resúmenes de estos genes se menciona que hemos elegido para nuestro ejemplo (ver información de apoyo para saber más detalle). El resultado de este análisis molecular es una red que comprende 288 nodos y 353 arcos; cada arco estuvo representada por múltiples declaraciones y los tipos de interacciones de la literatura. (Podríamos haber analizado una red mucho más amplia, pero los resultados no habrían sido susceptibles de una representación compacta de fácil acceso a un lector, sin embargo, nuestro actual modelo de itinerario, que se presentan en las figuras 2 y 3, es mucho más grande que un típico itinerario descrito en una revisión completa del artículo.)

En esta gran red molecular, que define la distribución previa para el nodo variables usando publicado declaraciones sobre el tejido-específica expresión de genes individuales. Hemos calculado la distribución previa para la utilización de los arcos relaciones individuales entre las moléculas extraídos de la literatura junto con la estimación de la confianza en la calidad de la extracción de las relaciones individuales (véase el recuadro Matemáticas e información de apoyo para más detalles).

Hemos visualizado previo y conciliar las distribuciones marginales de lado a lado en la figura 2 para facilitar su comparación, y puso de manifiesto la diferencia absoluta entre ellos en la Figura 3 (A). Además, se calculó el cambio de entropía entre el antes y conciliar las distribuciones de cada variable aleatoria (Figura 3 (B)). La diferencia en la entropía pone de manifiesto la coherente e incoherente partes del gráfico: el azul del espectro-nodos y arcos aumentado su entropía (pérdida de información), mientras que el rojo del espectro de variables perdido la entropía (información obtenida). El azul del espectro variables son los mejores candidatos para una mayor corroboración experimental o refutación.

Comenzamos el análisis realista de nuestro itinerario por ejemplo la observación de que el ejemplo hipotético que se postula en la introducción existe en el ejemplo de la vida real. De acuerdo con declaraciones publicadas, WNT1 gen se inhibe por tanto HBP1 y EMX2 [15], [16]. Por lo tanto, la vía, representada por el conjunto de las distribuciones más antes de los valores de las variables, es incoherente.

Uno de los arcos que disminuyó su activar (asociada reconciliarse probabilidad marginal) es la conexión de un marco de resultados estratégicos para SP1 (ver figuras 2 y 3]. También muestra una pérdida de información (que tiene una conexión de la línea azul a 3 (B)). Si se traza el arco de apoyo a la fuente de los documentos, nos encontramos con que este arco está apoyado por una sola frase que formula una hipótesis: "La combinación de una mayor actividad de JNK y sobre regulación de c-JUN y las formas conexas de proteínas puede activar genes transcripción a través de la interacción entre c-Jun, SRF, y la trans-activación del dominio de SP1. "(ver [17]].

Algunos de nuestros arco reconciliarse marginal distribuciones parecen estar en conflicto con los datos publicados. Uno de los ejemplos de este tipo en nuestra cifra es la interacción entre TP53 (un notorio factor de transcripción que participan en una serie de casos de cáncer y la muerte celular relacionada con las vías) y PSEN1 (gen humano que se cree que albergan los polimorfismos de predisposición al titular La enfermedad de Alzheimer). Nuestra distribución previa de este arco se indica que TP53 inhibe PSEN1 (por ejemplo, ver [18] - [20]]. Sin embargo, nuestra previa para la distribución de los nodos TP53 y PSEN1 se vieron fuertemente sesgado hacia la activa / estado actual. Por otra parte, según nuestro gráfico recopilado, tanto TP53 y PSEN1 son activadas por una serie de otros genes (TP53 se activa por EGR1 y TRRAP, mientras que PSEN1 se activa a través de e-cadherina, y BCL-2), además que apoya la hipótesis de que ambos genes están activos. Como resultado, la distribución para conciliar el arco entre TP53 y PSEN1 tiene una mayor probabilidad de activar para que inhiben (ver Figura 2]. Esta aparente contradicción puede explicarse y resolverse de varias maneras. La interacción entre TP53 y PSEN1 puede ser en realidad mediada por un tercer gen que está inactivo en las neuronas. Una explicación alternativa es que los TP53 y PSEN1 son realmente activa en las mismas células neuronales, pero no al mismo tiempo. Esto puede comprobarse analizando experimental de series de tiempo que refleja los cambios en los estados de genes proteínas y otras moléculas en una célula.

Nuestro enfoque computacional identificado inconsistencias en los estados de aproximadamente el 10% de los arcos y el 8% de los nodos dentro de la vía realista gráfico (ver figuras 2 y 3]. Se postula que estas estimaciones reflejan el nivel general de incoherencia entre las declaraciones publicadas acerca de interacciones moleculares.

Figuras 2 y 3 puntos a decenas de hipótesis comprobables experimentalmente que, esperamos, el lector podría tener la tentación de examinar. Utilizando la metodología propuesta y en la actualidad accesibles los recursos computacionales, podemos escala hasta el cómputo será aplicable a miles o incluso millones de declaraciones, potencialmente, a todo el conjunto de interacciones moleculares humanos.

Relación con otros métodos computacionales

Recientes enfoques probabilístico, aplicado con éxito para el análisis molecular de las vías, se construyeron en el tratamiento, ya sea física interacciones moleculares (arcos) como discretos parámetros del modelo (por ejemplo, ver [21], [22]] o la descripción de los niveles de expresión de genes (nodos) variables aleatorias relacionadas entre sí de acuerdo con inmutable no contradictorias distribuciones condicionales [8], [23] aprendidas a partir de datos experimentales [3], [8], [23]. El modelo que es el más cercano a nuestro modelo [21] utiliza tanto para las variables discretas de nodos (los niveles de expresión génica de genes eliminatoria después de los experimentos) y los parámetros discretos de arcos para inferir las vías moleculares a partir de datos experimentales. El enfoque que proponemos aquí es diferente, tanto en el objetivo (mejorar la coherencia interna de grandes gráficos de refutar o el fortalecimiento de los distintos hechos) y en la metodología, que describe tanto los nodos (los estados de moléculas) y arcos (dependencias entre nodos) como variables aleatorias se define dentro de un único modelo probabilístico. Además, utilizamos una técnica estocástica de integración (a Gibbs sampler) para estimar la distribución conjunta de todas las variables de nuestro modelo. Nuestro modelo pertenece a una familia numerosa de factor de modelos gráfico [24] y, a lo mejor de nuestro conocimiento, no se ha sugerido antes de nuestro estudio actual.

Extensiones y conclusión

Un siguiente paso natural es utilizar nuestro modelo para integrar los resultados de gran escala húmedo-experimentos de laboratorio con la minería de texto analiza las declaraciones. Esperamos poder ampliar nuestra metodología mediante la incorporación de la capacidad de gestionar los ciclos dirigidos que son de importancia crítica en las vías biológicas. Nos puede mejorar de forma significativa (al mismo tiempo también más complicado) el modelo de asignación de las probabilidades antes de nodos y arcos. Por ejemplo, podemos utilizar un modo probabilístico de la publicación científica proceso [13] para tener en cuenta el tipo y la cantidad de apoyo experimental detrás de las declaraciones publicadas. A más largo plazo objetivo es reunir e intersectoriales validar una fiable y completa el mapa de interacciones humanas, que permitan el diagnóstico y el tratamiento de trastornos complejos humanos [25]. Dado que las redes moleculares de especies distintas interactúan unas con otras, como es evidente en el caso de los agentes patógenos y diversas alergias agentes en los seres humanos, no es inimaginable que un intento de conciliar la computación de la modelo en su conjunto integrado de los conocimientos actuales sobre las interacciones moleculares [14 ]. Por último, podemos imaginar un medio ambiente futurista donde las nuevas molecular de la interacción hipótesis son automáticamente la prueba de coherencia contra el conjunto de datos disponible actualmente.

Una vez que un adecuado mapeo de nodo y arco variables se define, nuestro modelo es inmediatamente aplicable a un conjunto diverso de problemas fuera de la biología molecular. Por ejemplo, la ecología en el nodo variables puede representar la presencia o ausencia de una especie en una ubicación geográfica, mientras que los arcos pueden representar predador-presa, parásito-hospedero, mutualismo, o la sinergia entre las especies de las relaciones [26]. En sociología los nodos pueden representar las personas presentes o ausentes en los diferentes grupos, mientras que los arcos pueden representar las dependencias o asociaciones entre las personas [27]. En las ciencias políticas los nodos pueden representar países y sus interacciones en el contexto de los conflictos locales y la competencia económica [28]. En economía, los nodos de mapa gráfico a las empresas que pueden ser activas o inactivas en los diversos mercados, y los arcos representan colaboración, la competencia, o la dependencia entre las distintas empresas. La característica común la unificación de todas estas dispares redes es que cada uno de ellos tiene que ser ensambladas a partir de un rápido crecimiento en conflicto avalancha de observación de la desigualdad de calidad que deben conciliarse en una gran escala.

Métodos
Matemáticas Box
Apoyo a la Información

Los autores agradecen a la Sra Lyn Dupré Oppenheim, Sra Yana Bromberg, y los Dres. T. Conrad Gilliam y Chen-Hsiang Yeang para comentarios sobre la versión anterior del manuscrito, al señor Raúl Rodríguez-Esteban para proporcionar estimaciones de confianza para la interacción molecular de los hechos, al señor Marc Hadfield para la programación, así como a los Dres. Alexander J. Hartemink, y Chen-Hsiang Yeang útil para los debates.