PLoS Computational Biology, 2006; 2(11): (más artículos en esta revista)

Identificación de la proliferación y diferenciación Switch en la red celular de los organismos multicelulares

Biblioteca Pública de la Ciencia
Kai Xia [1], Huiling Xue [1], Dong Dong [1], Shanshan Zhu [1], Jiamu Wang [1], Qingpeng Zhang [1], Lei Hou [1], Hua Chen [2], Ran Tao [2], Huang Zheng [1], Zheng Fu [1], Ye-Chen Guang [2], Jing-Dong Han J [1]
[1] La Academia China de Ciencias clave Laboratorio de Biología del Desarrollo, Centro de Biología Molecular Systems, Instituto de Genética y Biología del Desarrollo, Academia China de Ciencias, Beijing, República Popular de China
[2] El Estado clave Biomembrane Laboratorio de Biotecnología y de membrana, Departamento de Ciencias Biológicas y Biotecnología, Tsinghua University, Beijing, República Popular de China
Resumen

La proteína-proteína redes de interacción, o interactome redes, han demostrado poseer dinámica estructuras modulares, sin embargo, la conexión funcional entre los módulos no están tan bien entendido. Aquí, utilizando un nuevo gasoducto para integrar la interactome y la transcriptome, hemos identificado un par de transcriptionally anticorrelated módulos, cada uno compuesto de cientos de genes en organismos multicelulares interactome redes a través de los diferentes individuos y las poblaciones. Los dos módulos están asociados con la proliferación celular y la diferenciación, respectivamente. La proliferación módulo se conservan entre los organismos eucariotas, mientras que la diferenciación módulo es específico para los organismos multicelulares. Tras la diferenciación de diversos tejidos y líneas celulares de diferentes organismos, la expresión de la proliferación módulo es reprimida de manera más uniforme, mientras que el módulo es la diferenciación upregulated en un pañuelo de papel-y las especies de manera específica. Nuestros resultados indican que, incluso en los tejidos y los niveles de organismo, la proliferación y diferenciación de los módulos pueden corresponder a dos posibles estados de la red molecular y puede reflejar una relación simbiótica universal en un organismo multicelular. Nuestro análisis más predicen que las proteínas mediar las interacciones entre estos módulos pueden servir como moduladores de la proliferación y diferenciación de cambiar.

Introducción

¿Cómo coordinar la proliferación de células y la diferenciación ha sido una de las cuestiones más importantes en la biología del desarrollo, biología celular, biología y el cáncer. La idea de que el crecimiento y la proliferación están poco compatible con la diferenciación de moneda amplia y explícita la proliferación y diferenciación de los conmutadores se han demostrado durante muchos diferentes tipos de células [1 - 4], pero ningún mecanismo general ha sido evidente. Debido a la naturaleza multifactorial de este proceso de coordinación y los recientes avances en redes de genes, Waddington la teoría del desarrollo como una canalización de la epigenética paisaje conformado por las redes de genes [5], ha adquirido más popularidad. Como se predijo de esta teoría, un gran avance puede lograrse a través de un enfoque de sistemas. Recientes producción de diversos "-ómicas" datos probaron el gen redes de diversos aspectos. La integración de la estática interactome junto con la expresión fenotípica y perfiles durante un determinado proceso biológico con frecuencia puede revelar la dinámica de la red de genes [6, 7].

La proteína-proteína redes de interacción (PPI, o interactome redes) han demostrado poseer estructuras modulares dinámica [7, 8], sin embargo, la conexión funcional entre los módulos son menos bien entendidos. A través de examinar la dinámica de la interactome red, encontramos que dos grandes módulos de red, la "P" (para la proliferación) y "D" (para la diferenciación) son los módulos anticorrelated transcriptionally más de la edad adulta tanto en el cerebro humano y la mosca de la fruta. Estos módulos se enriquecen a la proliferación y diferenciación de los genes, respectivamente, y mostrar alternativamente inferiores y superiores expresiones en la proliferación celular y la diferenciación de cambiar. La mayoría de los genes P módulo se conservan entre los organismos superiores y organismos unicelulares como las levaduras, pero la mayoría de módulo D genes están ausentes de los organismos unicelulares. Por lo tanto, estos módulos pueden corresponder a distintos estados celular característica de organismos superiores.

Resultados
Transcriptionally Anti-correlacionadas módulos en la Red Interactome

Para investigar las características dinámicas del ser humano interactome red a través de cambios en la expresión génica, hemos utilizado como sustitutos los perfiles de expresión en 30 cerebros humanos postmortem de temas que van de 26 a 106 años de antigüedad. Este conjunto de datos fue generado originalmente para examinar la relacionada con la edad cambios en la expresión génica y las funciones biológicas relacionadas con el envejecimiento [9]. En este estudio, sólo se centran en los patrones de expresión génica a través de diferentes personas y tratar de diseccionar la estructura modular de la red de interactome similares o frente a los perfiles de expresión entre un par de genes.

Como ambos transcripcional correlación y anti-correlación entre un par de genes son biológicamente pertinentes con arreglo a las condiciones específicas [10, 11], nos centramos en la subred que consta sólo de las interacciones entre los pares de genes que están correlacionados transcriptionally y anti-correlación (abreviado como correlacionada y anti-correlación interacciones, respectivamente) para examinar la dinámica estructura modular de la interactome. Esas redes se denominará en lo sucesivo la red NP, donde el PN está a favor de negativos y positivos correlaciones. La expresión correlaciones y anti-correlaciones entre un par de genes se mide por un coeficiente de correlación. El coeficiente de correlación de Pearson (PCC) se sabe que centrarse en la "forma" de los cambios más bien a que la intensidad o amplitud de señales, y, por tanto, no tiene sesgo de señales fuertes y ha demostrado ser el más adecuado para oligo arrays [12 , 13]. Tiene un valor de 1 para la perfecta correlación o -1 para el perfecto anti-correlación.

Nuestro análisis gasoducto incluye los siguientes pasos (Figuras 1 y S1): (1) obtener todos los IBP entre los genes que tienen similares perfiles de expresión o perfiles de expresión frente a determinadas por PCCs como correlación o anti-correlación interacciones para llegar a la red NP; ( 2) identificar los módulos de red de modo que los perfiles de expresión de los genes dentro de un módulo son similares, están correlacionados al máximo las interacciones dentro de un módulo, y la lucha contra la correlación óptima interacciones son distribuidos entre los módulos. El segundo paso es la primera aproximación que lleva a cabo la aplicación de la agrupación jerárquica de los genes en la red NP, entonces manualmente disecar el mayor anti-correlación agrupaciones o escanear automáticamente desde la parte superior del árbol jerárquico de grupos que tienen menos de un 1% intracluster anti-correlación interacciones y encontrar el mayor anti-correlación agrupaciones con un promedio de expresión PCC <-0,7.

Extraído de IBP en la proteína humana base de datos de referencia (HPRD) [14], el NP a través de la red cerebro humano la corteza frontal perfiles de expresión [9] está compuesto por 1055 correlacionados y 395 anti-correlación entre 1260 interacciones genes / proteínas. Se utilizó PCC valores de 0,4 y -0,4 puntos de corte como para positivas y negativas de correlaciones, respectivamente. Estos puntos de corte se han establecido en estudios previos. Sin embargo, como se describe más adelante, las identidades de los grupos no son dependientes de la PCC Los puntos de corte.

Utilizando el algoritmo de agrupamiento jerárquico ejecutado por Cluster [15, 16] y visualizar los grupos con vista en árbol [15, 17], encontramos que la mayoría de los anti-correlación interacciones en la red NP puente entre dos anti-correlación de expresión entre los grupos genes (nodos) dentro de la red de NP. Esto es evidente si las muestras se agrupan en la otra dimensión (Figura 2 A). Hemos nombrado los dos anti-correlación grupos "P" y "D" sobre la base de sus asociaciones con la proliferación y diferenciación de funciones, respectivamente (véase más adelante). Otro gran grupo que es en gran medida correlacionada con P, pero no evidentemente anti-correlación con D se denomina la "N" para el grupo "no determinada" función. El grupo más pequeño se llama la "S" para el grupo "pequeño" (Figura 2 A). Hay 457, 435, 260, y 108 nodos, y 220, 316, 111, y 27 de interacciones dentro de la categoría D, P, N, S y grupos, respectivamente (Figura 2 y B 2 C). Los genes en cada módulo se enumeran en el cuadro S1.

Para examinar las funciones biológicas de cada módulo, lo primero que buscaron excesivamente Gene Ontología (GO) categorías entre los genes dentro de un módulo. Para ilustrar plenamente la preferencia de determinados procesos biológicos en un módulo frente a otros, más agrupados los términos relacionados con el IR en unos grandes categorías, y se lleva a cabo de forma más amplia de palabras clave de búsqueda para genes potencialmente comparten el mismo proceso, pero no anotado por GO; estos son enumeran al final dentro de cada categoría en la Tabla 1. Los genes asociados con la excesivamente GO términos y por las que se encuentran la búsqueda de palabras clave también se enumeran. De conformidad con el Cuadro 1, el grupo D se ha enriquecido en circulación y la angiogénesis, apoptosis maquinaria, y de iones y canales de neurotransmisores, que son características de diferenciación neuronal, los reguladores del ciclo celular, los receptores de la superficie celular, y los receptores de esteroides. P El grupo se enriquece en la transcripción, la energía nuclear y el transporte intracelular, ciclo celular, motilidad celular y los genes. Estos enriquecido GO términos sugieren que el P y D módulos podrían estar asociadas con la proliferación celular y la diferenciación de procesos, respectivamente. El grupo N se ha enriquecido en los genes que participan en proteólisis, la actividad de traducción, transporte intracelular, la energía y el metabolismo. El grupo S se relaciona con la inmunidad (Tabla 1 y Figura 2 B). Un subconjunto de los genes D (253 genes de desarrollo y un gen de N), la "SD" cluster, también anti-se correlaciona con un subconjunto de los genes N (250 N de los genes y los genes de 40 D), la "SN "Cluster, a través de los diferentes subgrupos de sujetos humanos (Figura S2 A y S2 B).

El anti-correlación expresiones de la categoría D y P agrupaciones son aún más evidente cuando la media de los niveles de expresión génica de estos grupos en cada una de las muestras se comparan a través de los diferentes sujetos humanos, con el PCC llegar a -0,867, es decir, en casi todos los casos cuando la expresión de D es, que P es de abajo, y viceversa.

Desde los genes y las relaciones funcionales entre los genes en un grupo coexpressed con frecuencia se llama una coexpressed módulo en una red [18], nos referiremos a estas agrupaciones como módulos en el contexto de una red. El módulo D se pueden dividir en cuatro submódulos más pequeños, DS1 a DS4, sólo reordenación de la categoría D de modo que los genes no anti-correlación interacciones están dentro de cualquier submódulos (Figura 2 B). Estos submódulos, sin embargo, están conectados por una correlación más que anti-correlación interacciones (Figura S2 C).

El P y D módulos de reflejar la dinámica de la red celular

Si el P-D partición es una función dinámica de la regulación transcripcional en el cerebro adulto, esperamos que la partición no debe depender de si o no el PPI red está integrada y también debería ser independiente del PCC Los puntos de corte utilizados para la extracción NP la red.

Para probar si el transcriptome fisiológico es necesaria para que el P-D partición, o si topología de la red por sí solo puede dar lugar a esas particiones, permutada la expresión los valores de cada gen entre las distintas muestras en la red HPRD, calculó el PCC de cada interacción HPRD , E identificó coexpressed módulos usando el tratamiento automatizado de gasoducto (Figura 1]. Entre 100 de esas permutaciones, ninguno de ellos da lugar a un par de anti-correlación módulos de más de 100 nodos por módulo (empírica p <0,01; Control 1 en el cuadro 2]. Permuting intensidad de la expresión génica en cada una de las muestras (Control 2 en el cuadro 2], o PCC permuting valores entre los diferentes IBP (Control 3 del cuadro 2] también hace que la lucha contra la correlación módulos indetectable o apenas detectables (p <0,01 yp = 0,08, respectivamente). Estos controles de la aleatorización verificar que el P-D partición es una verdadera naturaleza de los patrones de expresión, y no pueden ser derivados de los patrones de expresión al azar o pairwise relación de perfiles de expresión. Como las redes de estos controles tienen exactamente la misma topología de la red como HPRD la red, también demuestran que HPRD topología por sí sola no es suficiente para dar lugar a la P-D partición. En otras palabras, el P-D partición no es un artefacto de topología de la red. De hecho, no depende de ninguna red en absoluto.

Hemos creado una base de datos PPI nonoverlapping a la primera versión original de HPRD interacciones que consiste en la interacción cada vez más actualizado a HPRD desde la versión anterior (las interacciones añadido a HPRD entre el 22 de noviembre de 2004, y 13 de septiembre de 2005) y dos recientemente generado levadura Dos híbridos (Y2H) de datos [19, 20]. Con este conjunto de datos diferentes IBP, similar P, D, N y los módulos se pueden extraer de la red de NP (Experimento 2 en el cuadro 2 y gráfico S3] que indican la presencia de P, D, N y módulos no es un sesgo introducido por la original colección de HPRD interacciones. Vagamente agregados coexpression las agrupaciones de empresas pueden ser también derivados de todos los genes en los microarrays de manera significativa superposición con P (783 nodos) y D (1276 nodos) módulos (Experimento 3 en el cuadro 2]. La P-D particiones se puede en realidad ser detectada en casi cualquier red de la misma cantidad de nodos (Experimento 4 en el cuadro 2] o el mismo número de aristas (Experimento 5 en el cuadro 2] como HPRD la red muestreado al azar, sino de un largo PPI red. La ampliación de la red PPI contiene la versión actualizada de HPRD más dos levaduras de dos híbridos interactome mapas [19, 20] y se refiere a las proteínas 7568, 3973 de los cuales tienen perfiles de expresión en la serie U95 Affymetrix.

La P-D partición también no depende de ningún PCC de corte utilizados para extraer el NP red. En el ampliado interactome, utilizando el módulo automatizado de disección de tuberías en diversos puntos de corte PCC o incluso sin un corte PCC (| PCC |> 0), podríamos identificar grandes grupos de genes que comparten importantes coincidencias con la P, D, N y módulos . A pesar de que corresponden a pequeños y pequeñas fracciones del total de genes disponibles en el microarray cuando el | PCC | corte aumenta, la fracción de los genes correspondientes a la categoría P y D en torno a módulos maximiza | PCC | Los puntos de corte de 0,45 y 0,5 (Texto S1 y S4 Figura ). Por otra parte, las relaciones entre la P, D, N y agrupaciones no ha cambiado, sólo el número de genes y variadas interacciones, en cierta medida, sin alterar la mayoría de las funciones enriquecido en cada uno de los grupos (datos no publicados). Por lo tanto, si bien P y D módulos son identificados como los módulos predominan en la red de NP | PCC |> 0,4, los dos módulos reflejan la dinámica de toda la red celular, que no se limita a los cubiertos por la red de NP.

Estable Módulo de Detección de Integración de la Interactome con la Transcriptome

Como ya se ha demostrado, la presencia de P, D, N módulos y no dependen de una red PPI siendo examinada o un particular corte PCC. ¿Por qué entonces tenemos que integrar la red PPI y el extracto NP red? La respuesta radica en la diferencia en la estabilidad de la detección de estos módulos de red.

A diferencia de los grupos de genes en la red NP, donde el 71% de los genes se dividen en P y grupos D, cuando todos los genes en el pleno HPRD red se agrupan, un par de agregación vagamente anti-gen correlaciona agrupaciones cubre sólo el 24% de la HPRD genes (Experimento 3 en el cuadro 2, Texto S1, y la figura S4]. Del mismo modo, los anti-correlación entre la SD y SN no es visualmente claro cuando todos los genes en la red NP se agruparon (Figura 2 A). Sólo después se analizó la distribución de los anti-correlación interacciones, de los cuales un gran número entre la D y la N módulos son evidentes (véase más adelante), decidió seguir el grupo sólo los genes en la categoría D y N agrupaciones. A continuación, un evidente anti-correlación entre la SD y SN agrupaciones se convirtió en visible (comparar Figura 2 A y S2 Figura A). Estos sugieren que al concentrarse en sólo la correlación y anti-correlación interacciones, enriquecido por los genes de la P, D, N y agrupaciones.

Para más rigurosa prueba de la estabilidad de la búsqueda de la P-D partición, se compararon las posibilidades de encontrar anti-correlación módulos de red con 100 o más nodos de cada módulo y su superposición con el P y D módulos con o sin extracción de NP redes antes de la agrupación de genes en la red. La posibilidad de detección de anti-correlación módulos es de 99%, o 98% cuando un NP con una red | PCC |> 0,4 fue extraída de un escogido de forma aleatoria parcial PPI red con el mismo número de nodos o aristas como la primera versión de la HPRD (experimentos 4 y 5 en el cuadro 2]. Al omitir el paso de extraer el NP red, las posibilidades se reducen al 66% y 62%, respectivamente. Además, la fracción de P y el módulo D genes entre todos los genes de entrada también reduce de una media del 29% del total de genes de entrada al 12% (comparar experimentos 4 y 5 con los controles 4 y 5, respectivamente, en el cuadro 2].

La elección de un corte diferente PCC también reduce la posibilidad de un 75% (Experimento 6 en el cuadro 2, Texto S1, y la figura S4], con la fracción de los genes identificados como P y el módulo D genes llegar a los niveles máximos | PCC |> 0,45 o | PCC |> 0,5 (Texto S1 y la figura S4]. Si la red PPI se sustituye por una red generado al azar con el mismo grado de distribución como HPRD incluidos en la muestra o una red PPI, usando | PCC |> 0,4 como punto de corte para extraer el NP red, aunque la posibilidad de identificar anti-correlación módulos son aún elevados, estos anti-correlación módulos son de menor tamaño medio y mostrar la superposición de baja (18% -19%) con P y D módulos (6-8 Controles comparar con los experimentos 1, 4 y 5, respectivamente, en el cuadro 2 ). Estas reducciones en la probabilidad de encontrar anti-correlación módulos y nuevas reducciones en la identificación de P y D módulos de entrada entre los genes (o todos los módulos) apuntan a una función de la utilización de la PCC de corte adecuado y la integración de cierto IPP en la estabilidad de P y D módulo de identificación. Sin embargo, la contribución de la integración de la PPI red no se limita al módulo de identificación, pero lo más importante está relacionada con la identificación de los grandes PPI interfaz entre el P y D módulos que puedan coordinar la proliferación celular y la diferenciación de procesos (véase más adelante).

Estos controles demuestran que la integración de la interactome, la extracción de la red NP, y la aplicación de una adecuada PCC corte garantiza una alta probabilidad de detectar el estable y P D módulos y la mejora de su homogeneidad, probablemente filtrando las más pares de genes que funcionan en irrelevantes las células o tejidos tipos o bajo condiciones fisiológicas irrelevante.

Conservación de la P-D Anti-Correlación en otras especies

La P-D particiones y su transcripción anti-correlación también puede verse en la mosca de la fruta. Se utilizó el conjunto de adultos de mosca-los perfiles de expresión a la sonda dinámica de genes relaciones en la red. En la publicación original [21], los perfiles de expresión se utiliza para estudiar el efecto de la dieta de restricción sobre el envejecimiento, y consistió en dos tipos de perfiles: uno para las moscas alimentadas con una gran cantidad de alimentos, y otro para los alimentados con una pequeña cantidad de alimentos, llamados "alimentos de alta" y "bajo la alimentación", respectivamente. En este sentido, utiliza estos perfiles para extraer los módulos de red basado en anti-correlación y correlación interacciones a través de diferentes poblaciones de moscas mediante el análisis automatizado de tuberías se describe en la Figura 1. Los módulos derivadas de conformidad con los alimentos de alto y bajo condiciones de alimentación son más del 50% idénticas. Si bien la composición del módulo P es muy conservada entre el cerebro humano y la mosca, que de la categoría D del módulo es muy diferente entre las dos especies. En particular, las vías de la apoptosis sólo se enriqueció en el cerebro humano módulo D. Los marcadores de diferenciación enriquecido en los módulos D también son diferentes; en el cerebro humano, están los marcadores neuronales; en la marcha, hay genes implicados en el desarrollo del ojo (datos no publicados), lo cual es coherente con sus tejidos de organismo y las necesidades específicas de para la diferenciación.

Hemos examinado los porcentajes de orthologs gen humano que se puede encontrar en la levadura, gusanos, moscas, y el ratón. Se encontró que el 60% de los genes D son específicas de ratón y humanos y sólo el 8% tienen las levaduras, mientras que el 35% de P genes homólogos han levadura, y menos del 30% son específicos de mamíferos (Figura 2 D). Similares patrones de evolución se puede ver para volar P y D módulos (Figura 2 D).

Las observaciones anteriores indican que el módulo P es más conservadas de los celulares de un solo organismo para la levadura organismos multicelulares C. elegans, Drosophila, el ratón y humano, mientras que el D es multicelulares específicos y se somete a cada especie, y probablemente también en tejidos específicos de las modificaciones.

La conservación de la P-D partición, su relación, y la similitud entre los perfiles evolutivos de moscas y humanos indican también que estas observaciones no puede ser debido a las variaciones introducidas muestra muestra de los preparativos técnicos u otros factores, pero en lugar de reflejar cierto características biológicas de los genes redes de diferentes organismos multicelulares.

La P / D temporal Switch Corresponde a la proliferación y diferenciación Switches

Un cambio entre la diferenciación y la proliferación se ha demostrado en myoblast células C2C12 [1]. La inhibición de la P-D interfaz proteína HDAC4 se ha demostrado que promover la diferenciación e inhibir la proliferación, mientras que la inhibición de otro interfaz de proteínas, SRF, no a la inversa [1]. Tanto la HDAC4 marco de resultados estratégicos y las proteínas son downregulated a la diferenciación con un incremento concurrente en la diferenciación de sus marcadores y antagonizar microRNAs [1]. Los niveles de 5 α β 1 integrina obligado a fibronectina también han demostrado que el control de conmutación entre la proliferación y diferenciación de las células C2C12 [4]. La proliferación y diferenciación interruptor también se ha observado en las células progenitoras neurales, y de PI3K, AMP cíclico, Raf, y las vías de MAPK, que están presentes en todos los P-D interfaz de interacción de proteínas, han sido implicados en la regulación de la transición [2, 3]. Estas conclusiones y otras muchas colectiva apuntan a la existencia de cambiar entre la proliferación y diferenciación a nivel celular.

Si el P y D son realmente módulos asociados a la proliferación y diferenciación de los procesos a lo sugerido por el enriquecido GO anotaciones, esperamos que podrían corresponder a la proliferación celular y diferenciación en el interruptor de tejidos y hemos examinado organismo. De hecho, hemos encontrado una disminución de P expresión y un aumento de expresión cuando D mosca, rata, ratón, o las células humanas de diversos tipos de células son de conmutación de la proliferación de la diferenciación estado a la inducción por diversos estímulos externos. En este análisis, hemos utilizado los datos publicados anteriormente en humanos del estroma endometrial la diferenciación celular inducidos por AMP cíclico, un ratón C2C12 myoblast diferenciación a pasar a la diferenciación medio, el músculo liso del ratón la diferenciación celular inducidos por el ácido retinoico, la inhibición de la proliferación y la inducción de diferenciación de los FGF rata de condrocitos, y la mosca de la fruta neural diferenciación de células progenitoras (muestra información detallada está disponible en el cuadro S2]. De acuerdo con la prudencia del módulo P, P es reprimida de manera más uniforme el momento de la diferenciación de diferentes tejidos en diferentes organismos. Por ejemplo, la expresión de genes de la mosca P, especialmente de los derivados en virtud de las restricciones en la dieta de bajo condiciones de alimentación, queda suprimida en todos los tipos de células (Figura 3 A, y medio e inferior filas en la Figura 3 B). En contraste, la expresión del cerebro humano D está fuertemente inducidos durante humanos del estroma endometrial la diferenciación celular y en menor medida durante el ratón y la mosca diferenciación celular, la expresión de genes de la mosca D es sólo más fuertemente inducidos en las células volar, pero no tanto en las células de otros organismos (Figura 3]. Por otra parte, los cursos de tiempo detallado de la proliferación y diferenciación cambiar reveló que la relación P / D transición se produce sólo en el corto exacta de la ventana de cambiar y no se observó antes o después del interruptor (humanos de células del estroma endometrial en la Figura 3 B), que representa para algunas señales débiles cuando los niveles de expresión de todos los timepoints antes o después de que el interruptor se promedian (Figura 3 A). Además de la asociación a la proliferación y diferenciación de los procesos sugeridos por el excesivamente funcional anotaciones en el P y D y los módulos anti-transcripcional correlaciones entre los dos módulos, la correspondencia a nivel celular proliferación y diferenciación cambiar más apoya de forma inequívoca la relación P / D temporal interruptor como el cambio entre la proliferación y diferenciación.

Sin embargo, salvo en el desarrollo de compuestos de moscas de ojos [22], no se sabe si proliferación celular y la diferenciación de los interruptores se coordinan en los tejidos o los niveles individual, especialmente en los tejidos o postmitotic entre el desarrollo posterior a los animales adultos. Una manera los sistemas de controles de nivel se obtienen podría ser a través de las hormonas circulantes y los factores de crecimiento, ya que muchos de ellos y su reglamento abajo moléculas están presentes en la categoría P-D interfaz.

Anti-correlación interacciones salvar la categoría P-D módulos

Además de facilitar el módulo de detección, la integración de la interactome y la transcriptome también reveló un gran número de IPP entre un número limitado de proteínas que forman una interfaz entre el PPI y P D módulos. El alto grado de interacción en la categoría P-D interfaz no puede obtenerse de forma aleatoria genera redes PPI del mismo grado de distribución como HPRD (comparar Control 6 al Experimento 1 'en el cuadro 2; empírica p <0,01, una cola de la distribución normal p = 1,17 × 10 -8). Los grados de la categoría P-D interfaz de proteínas en la muestra PPI redes son también significativamente más altos que los de las creadas artificialmente las redes de control combinado de las distribuciones de grado (compare los controles 7 y 8 de Experimentos con 4 y 5 en el cuadro 2, un cola-t de Student - test, p = 1,66 × 10 -41 y 1,93 × 10 -63, respectivamente).

Como era de esperar, anti-correlación interacciones preferentemente puente entre la transcriptionally anti-correlación P y D módulos. Más de la mitad (58%) la correlación de las interacciones están dentro de la coexpressed módulos, y el 22% están entre los P y N módulos, mientras que el 57% de los anti-correlación interacciones puente entre el P y módulos D, y el 22% de puente entre y la D N módulos (Figura 2 C). La probabilidad de que el anti-correlación interacciones salvar la P y D en comparación con los módulos de salvar cualquier módulo es 1,8 veces mayor que la de las interacciones uncorrelated (PCC entre -0,4 y 0,4), lo cual es una diferencia muy significativa (prueba exacta de Fisher p = 2,399 × 10 -20).

En principio, los anti-correlación pueden producirse interacciones entre los diferentes temas o en diferentes fases de desarrollo y, en consecuencia, puente coexpressed diversos módulos tan pequeños como de uno o dos módulos de genes, por lo que es sorprendente ver que dos grandes coexpressed integrado por módulos el 71% de los genes en la red, anti-correlación entre sí a través de 77% de las muestras, y estaban conectadas por la mayoría de los anti-correlación interacciones en la red.

Papel regulador de la P-D Interface

Desde el GO términos excesivamente en las interfaces, la interfaz P es enriquecido para factores de transcripción y la interfaz D se enriquece en la celda del ciclo de control, la reparación del ADN y los genes del receptor de señalización (Tabla 3]. Todos estos procesos son importantes mecanismos de regulación en la proliferación y diferenciación de cambiar. En particular, la interfaz D proteínas incluyen a muchos de los bien conocidos los genes supresores de tumor, como BRCA-1 y p53, y muchos receptores y reguladores de la transcripción que se sabe que son necesarios para la diferenciación de las neuronas, como myc, TOP2B, la integrina, el estrógeno, FGF, PDGF, y los receptores de TSH, y muchos-quinasa A las proteínas de anclaje (AKAPs), etc P La interfaz contiene genes promover la proliferación celular, tales como K-RAS, HDACs, SRF, CREB, CREBBP, IL4R, y INSR (el gen del receptor de insulina). Asimismo, contiene los genes que inhiben la p53 y BRCA-1 funciones como PARC y LMO4 (Tabla 3 y Figura S5]. Asimismo, evaluaron el potencial papel regulador de la P-D por tres interfaz bien conocida red y propiedades biológicas de genes reguladores: (1) los genes desempeñan funciones cruciales de reglamentación son a menudo centros de conexiones en la red, y viceversa; (2) si la interfaz fundamental desempeña funciones de regulación en la proliferación y diferenciación interruptor, mal funcionamiento de estos genes puede conducir al cáncer, y por lo tanto, estos genes son en promedio más probabilidades de ser oncogenes o genes supresores de tumor, y (3) función de genes reguladores en vías de reglamentación, donde retroalimentación de control es una característica dominante de la red. Por lo tanto, se compararon los grados de interacción de proteínas, el porcentaje de oncogenes y genes supresores de tumor, y el porcentaje de genes en los ciclos de retroalimentación entre el interfaz y la falta de interfaz, o los genes básicos. Los resultados de los tres ensayos son compatibles con un papel regulador fundamental en la relación P / D: en comparación con el núcleo del P y módulos D, la P y D interfaces tienen un promedio mucho más alto grado de interacción (Figura 4 A; p = 2,27 × 10 -12), porcentaje de oncogenes conocidos y genes supresores de tumor (Figura 4 B, p = 3,28 × 10 -2 y 2,08 × 10 -4 para P y D interfaces, respectivamente), y el porcentaje de proteínas y genes ubicados en ciclos de retroalimentación (Figura 4 C, p = 1,07 × 10 -2 y 3,45 × 10 -4 para P y D interfaces, respectivamente). A pesar de todos los bucles son todavía de una cobertura muy limitada, ya es evidente que la mayoría de estos controles son comentarios entre el P y D módulos y mediada por anti-correlación interacciones (Figura 4 D). Casi todas las proteínas implicadas en estos bucles son los reguladores de transcripción, y muchos de los bucles formados por dos PPI y reglamentos transcripcional (Figura 4 D). Estas características especiales de la categoría P-D interfaz de proteínas que sean posibles los reguladores clave para la proliferación y diferenciación de cambiar.

Alternando expresión de los genes pueden ser llevados por el "alternar cambiar" red de circuito, que es un circuito de retroalimentación que consta de dos mutuamente las interacciones inhibitorias entre los nodos [23]. Si tratamos a la P y D módulos como nodos solo en un módulo de red, el P y D patrón de expresión se puede también lograrse a través de un simple cambio de diseño alternar entre ellos (Xia et al., Datos no publicados). Sin embargo, en un sistema complejo que participan en la diferenciación y la proliferación de control, mucho más redundancia y de ajuste de un control de retroalimentación podría llevarse a la práctica. Como ejemplos de posibles controles comentarios de la diferenciación y la proliferación en el cerebro humano adulto, podemos lista de al menos diez interesantes vías de señalización de tres o más nodos que atraviesan la P-D interfaz (Figura 4 E). Poniendo de relieve una ventaja única de este tipo de integración de análisis de sistemas, estas vías no son sólo una colección de conocer las vías preexistentes en la literatura. A pesar de todas las interacciones se derivan de la literatura, y la mayoría de los genes en estas vías se ha demostrado que afectan a la diferenciación, proliferación o crecimiento, las vías sí mismos no han sido reportados previamente y no se conocen como los circuitos de control para la coordinación de la diferenciación y la proliferación de procesos.

En total, el P y D módulos no sólo son transcriptionally anti-correlación entre los distintos individuos, también están asociados funcionalmente con base proliferación celular y la diferenciación de funciones, evolutivamente representan células autónomas-y multicelulares de módulos específicos, y son, respectivamente, reprimida y inducidas en los proliferación celular y la diferenciación de cambiar en diversas células de diversos organismos multicelulares. La interdependencia funcional, antiphase compartimentación temporal, y los diferentes orígenes evolutivos de los dos módulos sugieren que el P y D módulos son dos contrapartes en una relación simbiótica que deben ser estrictamente controlados y coordinados en los celulares, tejidos, organismos y niveles de conmutación temporal entre las dos fases de proliferación y diferenciación.

Discusión

En este estudio, se describe un nuevo análisis de la integración de la interactome y la transcriptome, que, aunque más bien sencillo, es muy eficaz en la eliminación de los análisis de ruido de una agrupación de genes convencionales proceso y nos permitió encontrar la fuerza P y D módulos y transcripcional su anti-correlación. Por otra parte, la contribución más importante de PPI integración es la de revelar la P-D interfaz, que tiene un potencial papel regulador en la coordinación de la proliferación y diferenciación de procesos.

Se encontró que el anti-correlación va más allá de los pares de genes individuales, sino entre las poblaciones de genes de un par de transcriptionally anti-correlación grupos de genes. El P y D módulos parecen estar asociados con la proliferación celular y la diferenciación, son suprimidos y la inducida a proliferación celular y la diferenciación de cambiar, respectivamente, por lo tanto corresponde a otros estados de la red celular. Esto indica que las relaciones lógico también existen en el modular de nivel en las redes celulares. Un posible escenario para la lucha contra la correlación en el nivel modular es que esto podría reflejar una separación temporal de las funciones biológicas en la red celular [24]. El ciclo metabólico se ha sugerido para cumplir esa función de compartimentación temporal de oxidativa y metabolismo reductivo en eucariotas [24]. La compartimentación antiphase temporal de la proliferación y la diferenciación se ha demostrado una y otra vez de moléculas individuales a cambio de la proliferación de la diferenciación a nivel celular [1 - 4], pero es sorprendente que esas relaciones también existen en el tejido u organismo nivel durante la edad adulta o podrían ser llevados por transcriptionally anti-correlación módulos a través de complejos mecanismos de retroalimentación entre los dos módulos. Nuestro resultado es, pues, coincidente con la Waddington [5] Habida cuenta de la evolución, en la que la diferenciación y la proliferación corresponde a dos estados de la red cuando un equilibrio entre ellas se logra en una escala de los sistemas. Más importante aún, el tejido a nivel de organismo y la coordinación a nivel nacional durante la edad adulta y el nivel evolutivo de conservación de la P y D módulos implica el equilibrio no se limita a la de un solo nivel de células durante las primeras etapas del desarrollo, sino que existe durante toda la vida de un organismo.

Aunque este tipo de patrón de expresión puede lograrse mediante un simple interruptor alternar entre ellos (Xia et al., Datos no publicados), en un sistema complejo, la redundancia es a menudo aplicado para garantizar la robustez, por lo que alternar múltiples conmutadores puedan existir entre los dos módulos, y los interruptores deben estar conectados entre sí para transferir información. El lugar exacto de los mecanismos moleculares que dan lugar a la correlación transcripcional y anti-correlación en los módulos de sistemas de nivel durante la edad adulta, no se habían determinado, esperamos que muchas vías de señalización implicadas en la formación de cáncer y el envejecimiento será parte de los mecanismos de control. Pero debido a limitaciones de la metodología en el pasado, la mayoría de estas vías sólo se han estudiado individualmente, una general y amplio mecanismo es todavía insuficiente. Nuestra determinación de la categoría P y D en los módulos de sistemas de nivel ha proporcionado un punto de partida para llegar a este mecanismo de forma general. Es posible que los genes en cada módulo compartir algunas inmediato aguas arriba reguladores de la transcripción. Por ejemplo, hemos encontrado que el 5 'no traducidas regiones de la mosca P módulo genes son claramente Dref enriquecido para la fijación de metas de sitios entre algunos otros menos bien caracterizado secuencia de motivos (Xue et al., Datos no publicados). Sobreexpresión ectópica de Dref se ha demostrado de bloquear la proliferación y diferenciación en cambiar la mosca de la fruta ojo disco imaginal [22].

Como la P módulo se concentra en la transcripción a nivel de actividades y la N módulo se concentra en las proteínas de actividades a nivel, un retraso temporal entre transcripción y traducción podría explicar la falta de sincronización completa entre los dos grupos. Aun cuando las muestras son en su mayoría de los sujetos de diferentes edades, refleja el calendario de estas muestras no podrán limitarse a las diferencias de edad, con una demora entre la traducción y transcripción puede ser reflejada como las diferencias individuales.

Aunque la cobertura actual de la interactome que comprende tanto la literatura y en gran escala de levadura de dos híbridos interacciones aún es limitada [25], la conservación de la P-D patrón en el cerebro humano y la mosca de la fruta a través de los diferentes conjuntos de datos indica que la cobertura es suficiente en el nivel actual para detectar, describir y analizar el P y D módulos. En la red NP, que sólo se centra en la fuerte correlación y firmemente anti-correlación interacciones, pero los genes excluidos de esta manera también pueden desempeñar importantes funciones para la regulación de la compartimentación temporal entre P y D módulos o en la proliferación y diferenciación de control. Sin embargo, nuestra determinación de la gran interconexión P-D módulos por primera vez reveló una proliferación y diferenciación interruptor y su interrelación en una escala de los sistemas. Se abre una nueva vía para examinar la diferenciación y la proliferación en los sistemas y niveles de red, y proporciona un canal para conectar los eventos a nivel fisiológico, como la secreción de hormonas, a los celulares y moleculares cambios. Esto ayudará a esclarecer los numerosos y complejos procesos biológicos.

Materiales y Métodos
Conjuntos de datos.

El HPRD de datos [14], fue descargado de www.hprd.org el 22 de noviembre de 2004; una versión posterior de la HPRD de datos se obtuvo el 13 de septiembre de 2005, dos humanos Y2H de datos se incluyeron en la ampliación del PPI red [19, 20]. Dos pantallas Y2H se combinaron como la mosca de datos de interacción de proteínas [26, 27].

Microarrays de expresión perfiles fueron obtenidos de estudios publicados anteriormente en cerebros humanos postmortem de sujetos entre 26 y 106 años de edad [9] y en adultos Drosophila melanogaster de diversas edades [21].

GO anotaciones fueron descargados de ftp://ftp.ncbi.nlm.nih.gov/gene/DATA el 10 de marzo de 2005.

Listas de proto-oncogenes y supresores de tumor se obtuvieron a http://ca.expasy.org/cgi-bin/get-entries?KW=Anti-oncogene y http://ca.expasy.org/cgi-bin/get-entries?KW=proto-oncogene el 4 de julio de 2005.

Orthologs.

Orthologs Humanos en ratones, moscas, gusanos y levaduras fueron identificadas como el mejor BlastP visitas recíprocas con un e-valor de corte de 10 -6 basado en secuencias de proteínas RefSeq descargado el 9 de diciembre de 2004, de http://www.ncbi.nlm.nih.gov/RefSeq .

Filtrado GO.

Para filtrar los términos GO [28] que son, a grandes rasgos asociados con muchas proteínas, se calculó el número de proteínas cada GO plazo asociados a utilizarse y sólo el GO términos que tienen una probabilidad de detección (p-valor) al azar entre los pares de genes menos de la importancia valor de 0,05 después de la corrección de Bonferroni para múltiples pruebas de hipótesis sobre el número total de IR en los términos de cada especie. El valor de p para un plazo IR se define como p = (n / t) 2, donde n es el número de genes asociados con la IR y t es el número total de genes en la especie, un GO término se utiliza sólo si p <(0,05 / g), donde g es el número total de GO términos asociados con todos los genes de una especie.

GO plazo de enriquecimiento se determinó mediante la prueba exacta de Fisher seguido por Benjamini-Hochberg corrección [29] para múltiples pruebas de hipótesis en todos los términos IR a prueba en cada conjunto de genes.

Ciclos de retroalimentación.

El NP Se realizaron búsquedas en la red con la amplitud de primer algoritmo de búsqueda de vías que tienen el mismo comienzo y fin nodos con longitudes entre dos (como mínimo, una proteína reguladora y un borde entre dos nodos) y diez sobre la base de todas las proteínas y dirige las interacciones de reglamentación se anotaron o extraídos. Interacción de proteínas anotación se basa en PubMed los resúmenes de las referencias enumeradas por HPRD. De regulación de las relaciones entre los socios de IPA dentro de la red de NP fueron extraídos de PubMed de la Pathway Ayudar a la minería de texto-función (Ariadne Genomics, http://www.ariadnegenomics.com/products/pscentral ). Otras relaciones de reglamentación se predijo desde el factor de transcripción anotada motivos de la base de datos TRANSFAC o p53 de la cromatina immunoprecipitation experimento [30], filtrar a continuación con expresión pairwise | PCC |> 0,4.

Expresión de agrupaciones y visualización.

Agglomerative sin supervisión jerárquica agrupación de los genes se realizó en la Categoría 3,0 [15, 16]. La expresión los valores fueron ajustados por las siguientes operaciones: diario de transformar, mediana centro de genes, los genes normalizar, mediana centro de arrays, arrays y normalizar. A continuación, uncentered correlación jerárquica y la vinculación centroide se utiliza para agrupar en dos dimensiones. La agrupación resultados se visualizaron en JavaTreeView 1.0.12 [15, 17].

La presentación de los reorganizado NP red para visualizar las interacciones intercluster se creó con una nueva herramienta de visualización que hemos desarrollado en Java (Hou et al., Datos no publicados) e importados en Cytoscape 2,1 [31]. Todas las demás redes de visualización se logró directamente con Cytoscape 2,1.

Redes de distribución predefinida grado fueron generados por un algoritmo utilizado por Milo et al. [32].

Apoyo a la Información
Un análisis más detallado del texto de flujo de la tubería para que revelen el anti-correlación módulos
(240 KB PDF)
La SD y módulos de SN y la interacción de distribución en el SD-DS1 y SN-4 módulos de Coexpressed
(A) SD y SN agrupaciones. El gen expresiones de estos dos grupos son también anti-correlación entre dos grupos a través de la muestra el 63% de las muestras. Los dos grupos de muestra son diferentes de los que dan lugar a D y P expresiones diferencial de genes. El promedio de las intensidades de expresión de los genes en la SD y SN módulos son también anti-correlación entre los distintos individuos con un PCC de -0,744.
Se solapa de HPRD módulos a los que se derivan de la extensión menos HPRD PPI red
Aunque no hay un solo borde o interacción en común entre esta red y la red HPRD, tres módulos que derivan de él compartir solapamientos significativos para P, D, N y módulos, respectivamente.
La P-D partición no depende de un IBP Red o PCC Los puntos de corte, pero el Derecho | PCC | Límite puede facilitar su identificación
(A) la agrupación jerárquica seguida de una exhaustiva búsqueda automatizada (por agrupaciones que contienen menos del 1% de las interacciones del PCC <0) identificó anti-correlación módulos de tamaños que van desde 100 a 1200 genes que se solapan significativamente el original y P D módulos cuando una más amplia red PPI PCC y diversos puntos de corte (incluidos los de corte no PCC) se utilizaron para extraer NP red. Incluso sin la integración de una red PPI, una cuidadosa búsqueda manual puede identificar en términos agregados la expresión génica grupos de 783 y 1276 genes que se solapan significativamente con el P y D módulos. Cuando el PCC de corte es> 0,7, no el grupo de genes que tiene más de 100 genes pueden ser identificados como significativa la coincidencia con el módulo D. Entrada de conjuntos de genes junto con el número de genes en cada juego (entre paréntesis) se cotizan como los encabezados de filas de la izquierda. Los tamaños de los grupos identificados en diferentes puntos de corte PCC o sin una red de PPI figuran como los encabezados de filas de la derecha, y los de la original P, D, N, S y módulos se enumeran en los encabezados de las columnas en la parte superior. El número de genes superposición entre el original y este último examinó las agrupaciones se indica en cada celda de la matriz, la intensidad del color de fondo de una celda refleja la importancia que se superponen-log (
p -
valor) de la prueba exacta de Fisher normalizado por la desviación estándar entre todas las agrupaciones se superpone examinados, que es igual a 44. (B) Las fracciones de P-D genes dentro de la red de NP en diversos | PCC | Los puntos de corte utilizados para extraer el NP red ampliada de la red PPI. Una fracción máxima se logra a | PCC | Los puntos de corte de 0,45 y 0,5 (barras amarillas). Debido a que algunos genes N módulo se fusionan en los módulos a P | PCC | Los puntos de corte de 0,45 y 0,5, las fracciones del módulo genes que se solapan con la red original NP y P D módulos también se trazan para excluir el posible sesgo introducido por la inclusión N de algunos genes. La fracción de P y el módulo D genes superpuestos con el original y P D módulos (barras azules) muestran una tendencia similar a la fracción del total de genes en cada módulo (barras amarillas).
La P-D interfaz de interacción de proteínas
Los núcleos de los módulos están representados como grandes cuadrados a ambos lados de las interfaces.
Gene lista de cada módulo
(161 KB XLS)
Muestra información de la diferenciación celular experimentos de inducción
(137 KB PDF)
La P-D partición es una característica de la expresión de patrones en la red celular
(11 KB PDF)

Agradecemos a los Dres. Nicholas Baker, Jiandie Lin, Siming Li, Li Cai, Xu Zhang, Liu Yong y útil para los debates y la lectura crítica del manuscrito.