En silico vía reconstrucción: de hierro-azufre en la biogénesis grupo Saccharomyces cerevisiae
Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.
Las actuales avances en genómica, proteómica y otras áreas de la biología molecular hacer la identificación y la reconstrucción de nuevas vías de una nueva esfera de gran interés. Una de esas vías de la clase está implicada en la biogénesis del Hierro-Las agrupaciones de azufre (ISC).
Nuestro objetivo es el desarrollo de un nuevo enfoque basado en la utilización y combinación de matemática, teórica y métodos computacionales para identificar la topología de red de un objetivo. En este enfoque, los modelos matemáticos desempeñar un papel central para la evaluación de las estructuras de red alternativas que surgen de la literatura data-mining, filogenética de perfiles, métodos estructurales, humanos y curación. Como un caso de prueba, se reconstruye la topología de la reacción y la red de reglamentación para la biogénesis mitocondrial ISC vía en S. cerevisiae. Las predicciones acerca de cómo actuar en proteínas ISC biogénesis son validadas por comparación con los resultados experimentales publicados. Por ejemplo, predijo el papel de Arh1 y Yah1 y algunas de las interacciones que predicen para los dos partidos Grx5 evidencia experimental. Un supuesto papel de la frataxina directamente en la regulación mitocondrial de hierro se descarta la importación de nuestro análisis, de acuerdo con que también publicó los resultados experimentales. Además, proponemos una serie de experimentos para probar otras predicciones y mejorar aún más la identificación de la estructura de la red.
Proponemos y aplicar un iterativo in silico procedimiento de predicción para la reconstrucción de la topología de la red de vías metabólicas. El procedimiento combina herramientas de bioinformática estructural y técnicas de modelado matemático que permiten la reconstrucción de las redes de bioquímica. Usando el grupo de hierro de azufre en la biogénesis S. cerevisiae como un caso de prueba que indican cómo este procedimiento puede utilizarse para analizar y validar el modelo de red en contra de los resultados experimentales. Evaluación crítica de los resultados obtenidos a través de este procedimiento permite la elaboración de nuevos experimentos de laboratorio húmedo para confirmar sus predicciones o proporcionar explicaciones alternativas para seguir mejorando los modelos.
El aumento de cantidades de datos que pueden ser extraídos para obtener información acerca de cómo las proteínas en las células reunirse como vías metabólicas, vías de transducción de señales, y los circuitos de genes, se generan cada día. Conjuntos de datos disponibles para esas tareas incluyen la literatura primaria, a gran escala micro serie de experimentos, todo el genoma de dos híbridos de cribado, las secuencias del genoma completo, y las pautas de conserva o no conserva homólogos y orthologues en ellos. Teórica y métodos computacionales se han desarrollado y utilizado para analizar los diferentes tipos de datos y redes de inferir las proteínas o los genes que están involucrados en el mismo proceso celular (es) (por ejemplo, [1 - 10]].
En general, las redes de deriva de los análisis computacional de estos datos no son estáticos, en el sentido de que proporcionan poca información, en su caso, sobre el flujo de causalidad y eventos en el proceso y no hay información sobre la dinámica de los procesos y su regulación (sin embargo, ver [11]]. Por ejemplo, la participación de las proteínas X, Y y Z en un proceso no dilucidar si X cataliza una reacción que produce un sustrato para otra reacción catalizada por la Z, o de Y, o si modula X Y Z o actividad. Esto puede ser un problema importante, mientras que el montaje de la estructura de la red de vías, ya sea novela (por ejemplo, hierro-azufre Cluster biogénesis) o complejas vías con un claro reacción y la regulación de red (por ejemplo, del ciclo celular). Por lo tanto, es un reto para transformar la red de interacciones deducirse del análisis de los datos en una red causal que permite la creación de modelos matemáticos cuyo comportamiento dinámico puede ser analizado y probado en contra de observaciones experimentales.
Para lograr este objetivo, las estrategias que combinen los diferentes teóricos y métodos computacionales para identificar las proteínas y generar un conjunto de alternativas posibles topologías de red para el proceso de interés sean necesarias. Estas redes pueden ser traducidos en modelos matemáticos cuyo comportamiento dinámico puede ser analizado y comparado con el de el sistema real, por lo tanto discriminar a algunas de las topologías propuestas cuando no reproducir el comportamiento esperado. Este proceso analítico integra ómicas de datos y proporciona predicciones comprobables e información sobre el comportamiento sistémico.
La más que probable falta de conocer el mecanismo y cinética de datos para cada una de las proteínas en un nuevo itinerario obstaculiza el proceso de traducción de topología de la red en un modelo matemático. Una forma de evitar el problema es mediante el uso de la teoría de aproximación [12]. Esta bien establecida la metodología se aproxima a la continua las funciones que típicamente describir la cinética de los procesos de proteínas utilizando, por ejemplo, truncada de Taylor, ya sea en lineales o no lineales espacios (véase, por ejemplo, [13 - 19]]. Entre los no-lineal aproximaciones, la facultad de derecho ofrece un formalismo útil la representación que viene asociado con el potente y ecléctico métodos analíticos (véase, por ejemplo, [20 - 24]].
En este trabajo, se centrará en la definición y la aplicación de una estrategia global que combina herramientas de bioinformática y modelado matemático para reconstruir la estructura de la red de itinerarios. Herramientas computacionales se utilizará para a) obtener información pertinente sobre los genes y las proteínas que se identifican como jugar un papel en el objetivo vía, b) el control putativo interacciones entre proteínas, c) pruebas de la co-evolución de las diferentes proteínas, y d) para la creación de redes alternativas que acomodar toda esta información. A continuación, los conocimientos de expertos se utiliza para la cura conjunto de estructuras de red alternativa. Por último, los modelos matemáticos se utilizan para estudiar el comportamiento sistémico de cada red alternativa y comparándolo con los datos experimentales.
Como un punto de referencia problema que se centrará en el hierro-azufre Cluster (ISC) vía la biogénesis. ISC son cofactores generalizada de las proteínas que funcionan como catalizadores de mediadores, como los mediadores de transporte de electrones y, como sensores para el estado de oxidación de las células y de su medio ambiente [25 - 32]. A pesar de ISC se han conocido a ensamblar las proteínas en forma autónoma, en los últimos años, conservada evolutivamente una serie de proteínas que controla esta asamblea Se ha detectado [29, 33, 34]. En eucariotas, ISC inicial es la biogénesis mitocondrial [35]. La desregulación de la biogénesis de ISC en los seres humanos pueden crear diferentes efectos patológicos, dando lugar a enfermedades como la ataxia de Friedreich, ligada al X sideroblastic anemia, o anemia hipocrómica. En la levadura, la supresión de un gen ISC biogénesis crea células que se acumulan hierro y tienen una disminución / desregulación de la actividad de las proteínas que dependen de ISC. La medida del fenotipo oscila entre leve (por ejemplo, Δ GRX5 cepas [36]] para letal (por ejemplo, Δ ARH1 cepas [37]], en función de la proteína que está mutada. Ataxia de Friedreich está ligada a mutaciones en uno de la biogénesis de proteínas ISC (frataxina), que tiene como homólogo a la proteína de levadura la proteinYfh1 (levadura frataxina Homologue 1). Además, la acumulación de hierro puede dar lugar a envejecimiento celular y sus enfermedades asociadas.
Aunque el montaje espontáneo de ISC se ha conocido que se produzcan tanto in vivo como in vitro, se ha observado que mutaciones en un conjunto de proteínas que son conservadas evolutivamente causar defectos en la biogénesis de ISC. Estas proteínas son evolutivamente conservados y formar una supuesta vía de la biogénesis de ISC. Los detalles y la topología de esta ruta todavía no se comprenden totalmente. En S. cerevisiae, el organismo eucariota en el que la biogénesis ISC ha sido más estudiado de forma exhaustiva, las siguientes son las proteínas que participan: Arh1, Yah1, Yfh1, Isu1, Isu2, Isa1, Isa2, Nfu1, Nfs1, Isd11, Mge1, Ssq1, Jac1, ATM-1 y Grx5 (Tabla 1]. El actual dogma en el ámbito del supuesto de que Isu1, Isu2, Isa1, Isa2 y Nfu1 son de alguna manera los andamios donde el ISC reúne inicialmente antes de ser trasladados a los dependientes ISC apo-proteínas. Sin embargo, los últimos resultados puede ser que emitan alguna duda en esto, como parece que hay algunas participación de Isa1/Isa2 Fe en la oferta para los grupos específicos de ISC dependientes apo-proteínas. Por otra parte, el papel de Nfu1 no está claro. ATM-1 es probable que sea el transportista involucrado en la exportación de ISC para el citoplasma. Arh1 y Yah1 son un feredoxin-reductasa feredoxin par que probablemente regula la transferencia de electrones en la primera asamblea de la agrupación. Nfs1 es una cisteína desulfurase que proporciona el azufre para las agrupaciones y Isd11 es fundamental para Nfs1 a cumplir con su función. No está claro cómo Isd11 facilita las funciones de Nfs1. En las bacterias, algunos cisteína desulfurases también tienen un asistente proteína que facilita la transferencia de azufre a la formación de clusters a través de bonos y SS. Sin embargo, Isd11 no tiene residuos de cisteína, que se opone a tal mecanismo para su acción. Ssq1 (HSP 70 como la proteína), Jac1 (HSP 40 como la proteína) y Mge1 (factor de cambio de nucleótidos) son proteínas chaperones que se dedican a ayudar a la vía, aunque su función exacta no está clara. Se ha demostrado que Isu1 activa la actividad ATPasa de la Hsp70 tipo Ssq1 chaperón. ATM-1 aparece a participar en la exportación de la ISC agrupaciones de la matriz mitocondrial al citoplasma. Una vez más, exactamente el sustrato de ATM-1 es desconocida. Grx5 es un monothyolic glutaredoxin cuya función en la biogénesis ISC no está claro. En este prokaryotes biogénesis es citoplasmáticos. En algunos casos más de un sistema está implicado en la biogénesis de ISC. Por ejemplo, en E. coli, el sistema ISC (homólogo al de S. cerevisiae) [38 - 42] y el sistema de Suf [43] son sistemas paralelos que están involucrados en la biosíntesis de ISC. Si bien el sistema de ISC es el responsable de regular el montaje de ISC, Suf el sistema se vuelve importante cuando las bacterias se encuentran bajo estrés oxidativo.
Como se ha mencionado en el párrafo anterior, hay información suficiente para atribuir una función a algunas de las proteínas implicadas en la biogénesis de ISC en S. cerevisiae. Este es el caso por ejemplo de Nfs1, Isu1, Isu2, o ATM-1. Sin embargo, la función de otras proteínas aún no está claro. Por ejemplo, ¿qué Isa1, Isa2 o Nfu1 hacer en el proceso? ¿Cuál es el papel de los chaperones Ssq1-Jac1-Mge1 o de Grx5 en la biogénesis de ISC? De este modo la biogénesis de ISC es un buen punto de referencia problema para la aplicación de la metodología que describimos, ya que brindará la oportunidad de validar algunas de las predicciones con los resultados experimentales publicados. Al mismo tiempo, la metodología va a generar conocimiento biológico con respecto a algunas de las proteínas con un claro papel, creando así un valor añadido a partir de la metodología y de los punto de vista biológico. En documentos anteriores [34, 44, 45], combinada con la bioinformática estructural y los experimentos cinéticos de modelado para investigar el posible papel de las proteínas Arh1, Yah1 y Grx5 ISC en la biogénesis mitocondrial. En este trabajo presentamos un enfoque estructurado computacional que se utiliza para inferir y analizar posibles topologías de la red mundial de la biogénesis mitocondrial ISC. Analizamos siete de las proteínas implicadas en el proceso (Arh1, Yah1, Yfh1, Grx5, Nfs1, Ssq1 y Jac1), proponiendo probable sistémica papeles para su acción en la biogénesis de ISC.
Las proteínas que se sabe que participan en la biogénesis mitocondrial ISC a S. cerevisiae se muestran en la Tabla 1. En primer lugar, describir cómo los diferentes conjuntos de datos a gran escala son analizados y combinados, utilizando diferentes herramientas computacionales con el fin de inferir inicial de alternativas para la red de montaje de la vía. Luego, usamos estrategias de modelado matemático para analizar además las diferentes alternativas y determinar la más confiable red de estructura, sobre la base de comparar el comportamiento dinámico de los modelos a observaciones experimentales.
Automatizado bibliomic análisis de los resúmenes publicados y documentos pueden ser utilizados para identificar las diferentes proteínas o genes implicados en un determinado proceso [46]. Hemos utilizado los genes que se sabe están involucrados en la biogénesis mitocondrial ISC a S. cerevisiae para poner a prueba esta hipótesis. IHOP [47 - 49] es una herramienta basada en la Web que permite a un análisis bastante automatizado de los resúmenes en búsqueda de nombres de genes, generando una red de genes que están co-presentes en los documentos. Esta red, se espera, se traduce en un grupo de genes implicados en el mismo proceso como nuestra original de genes de interés. Cuando se aplica el ISC a la biogénesis, IHOP identificado todos los genes correspondientes a las proteínas que se cree que participan en el proceso, así como algunas adicionales que son marginalmente importante. La identificación de los genes implicados en la red se hizo a partir de una nueva búsqueda para cada uno de los nombres de genes de la Tabla 1. Como un nuevo gen fue encontrado durante la búsqueda analizamos el contenido del resumen. Si el resumen se refiere a la biogénesis de ISC o el metabolismo de Fe y el gen era nativa de S. cerevisiae, el gen se añadió al modelo de red; de lo contrario no lo era. Si el nuevo gen se añadió, entonces se adjunta su nombre a la lista original de los genes y lo utilizaron como una primera semilla en una de las búsquedas. Hemos seguido este proceso manualmente hasta que los resultados no convergentes y nuevo gen nombre fue añadido a la red. Para cada búsqueda, todos los genes que se sabe están involucrados en ISC se encontraron de IHOP. Esto sugiere que los semi-automatizado métodos de análisis de la literatura son realmente eficaces en la identificación de los componentes conocidos de los procesos celulares de interés y en el suministro de una red inicial de proteínas para el estudio. La Figura 1 muestra la red de interacciones de las proteínas implicadas en la biogénesis mitocondrial ISC a S. cerevisiae, tal como se deriva de la literatura de análisis automatizado. No hemos incluido Isd11, como funciona este gen complementariedad con Nfs1 [50, 51].
No es posible inferir probable estructura de la red (s) para la biogénesis ISC sólo vía de la co-ocurrencia de los genes en los papeles. Datos adicionales es necesario, a fin de traducir el grupo de proteínas que se identifican a participar en el proceso biológico de interés en una red estructurada de causalidad y las relaciones de reglamentación. Filogenético de perfiles [52, 53] de los genes ayuda a añadir cierta estructura a la red. En este tipo de análisis, una búsqueda de patrones de co-ocurrencia de juegos de orthologues lo largo de un gran número de genomas secuenciados completamente. El supuesto detrás de la utilización de este enfoque es que, si el patrón de presencia y en ausencia de dos o más proteínas en un número de genomas es muy estrecha, esta es una indicación de co-evolución entre las proteínas. Tal co-evolución puede tomarse como una indicación de que es probable que participen en el mismo proceso celular (es).
Resultados filogenético de co-evolución análisis de los diferentes genes implicados en la biogénesis de ISC se resumen en la figura 1. Esta nueva información ya ayuda a inferir algún tipo de causalidad a la estructura de la red de la vía. Por ejemplo, Grx5 homólogos coinciden con Isa1 y Isa2 homólogos en genomas más que con cualquier otra de las proteínas identificadas. Esto sugiere que Grx5 es más probable que actúan directamente sobre estas proteínas que con otras proteínas que también están involucrados en la biogénesis de ISC. Como puede verse en el Cuadro 1, Grx5 es un glutaredoxin que es probable que regular (de) glutathionylation de proteínas residuos de cisteína. El análisis filogenético indica que el andamio proteínas son probablemente los objetivos de dicho Reglamento. Del mismo modo, ATM-1 homólogos coinciden con Isu1 y Isu2 homólogos en genomas más que con homólogos de otras proteínas de la biogénesis de ISC. Porque ATM-1 es un transportador de membrana, este resultado sugiere que el Isu1 y Isu2 tienen más probabilidades de estar involucrados en la transferencia de ISC para el citoplasma que otras proteínas de andamiaje. Sqq1, Jac1 y Mge1 son un chaperón, un co-chaperón, y un factor de cambio de nucleótidos, respectivamente. Homólogos de las tres proteínas están presentes en muchos genomas. Por último, Yah1 y Yfh1 homólogos coinciden en un gran número de genomas, lo que sugiere un papel para estas dos proteínas.
Alternativas para una estructura de red parcial de la vía de la biogénesis de ISC han surgido de los análisis filogenético en la sección anterior. Información adicional con respecto a esta estructura se pueden obtener a través de la utilización de métodos de acoplamiento de proteínas [54 - 60].
El uso de proteínas de acoplamiento para determinar cómo ensamblar las proteínas en un camino no es un procedimiento normal y pueden presentar diversos tipos de problemas. En primer lugar, las proteínas en la misma vía no es necesario que interactúan físicamente. Productos de un primer paso puede ser puesto en libertad en solución y utilizada por una proteína implicada en un paso posterior del proceso. Sin embargo, este problema no es pertinente en el caso actual. ISC porque son lábiles, una interacción física directa entre las proteínas que se requiere para la síntesis y la transferencia de los grupos. En segundo lugar, modelado de proteínas y / o acoplamiento es muy costoso computacionalmente. Sin embargo, en este caso un número limitado de las proteínas participan en la meta vía. Por lo tanto, este problema se reduce a niveles manejables. En tercer lugar, de acoplamiento de dos proteínas siempre den un resultado. Por ejemplo, considere la posibilidad de proteínas A y B que co-ocurren en el mismo compartimento celular y están implicados en el mismo proceso, mientras que la proteína C se encuentra en otro compartimento celular y no tiene ningún papel en el proceso de interés. Si muelle de proteína a proteína A B y, a continuación, un dique a la proteína C, proteína, la puntuación de la última de acoplamiento puede ser mucho mayor que el de la primera. La elección de A y C como el preferido de acoplamiento socios sería un resultado erróneo porque A y C nunca se reúnen en vivo. Este problema se evita en el presente caso porque las proteínas que son de acoplamiento coexistir en el mismo compartimento celular y están implicados en la misma vía. En cuarto lugar, un gran acoplamiento agregado de las proteínas que trabajan juntos para formar un itinerario está todavía fuera del alcance de la proteína de acoplamiento. Este es un problema importante, pero hemos hecho el supuesto de que, debido a la interacción física entre las proteínas que catalizar un paso es necesario, los resultados individuales de acoplamiento sería indicativo de interacciones físicas reales.
En silico proteína de acoplamiento métodos requieren estructuras de proteínas. De las proteínas implicadas en la biogénesis de ISC en S. cerevisiae Yfh1 sólo ha tenido su estructura determinado experimentalmente [61]. Construimos modelos para las estructuras de las proteínas restantes. Estos modelos fueron obtenidos por homología de modelado como se describe en la sección de métodos.
La extensión de nuestro trabajo previo con este sistema [34, 44, 45], usamos Gramm [54 - 60] y Hex [62] para llevar a cabo todas contra todas las proteínas in silico de acoplamiento estudios. El Gramm metodología es especialmente adecuado para modelos de muelle de proteínas debido a que los promedios más de posibles errores en la conformación que son, sin duda, más grande que en el caso de estructuras cristalográfica [55, 63, 64]. La figura 1 muestra las cuatro puntuaciones más altas de la interacción de cada uno de los genes. Varias posibilidades para la estructura de la red puede inferirse de estos resultados. Por un lado, tanto Nfs1 y Yfh1 muestran las puntuaciones más fuerte acoplamiento con los cuatro proteínas de andamiaje. Esto sugiere que ambas proteínas actúan en los procesos que montamos el grupo en los andamios. Arh1 y Yah1 es probable que sean una pareja que actúa en conjunto, habida cuenta de que su puntuación de acoplamiento mutuo es elevado. Grx5 acoplamiento resultados son más altos para Nfs1 y Arh1, lo que sugiere que las proteínas son más tarde los objetivos para la regulación de cisteína (de) glutathionylation de Grx5.
Hemos complementado la red de interacciones deducirse de los experimentos de acoplamiento con las interacciones en dos híbridos proyecciones de proteínas de levadura de la literatura publicada [34, 65 - 69]. Dentro de estos conjuntos de datos, sólo hemos encontrado pruebas de interacción entre Nfs1 y Isu1, Nfs1 y Isu2, Isa1 y Isa2, y entre Isa1 y Grx5. El andamiaje Nfs1-se predice interacciones de las proteínas de acoplamiento, lo que sugiere que el uso de métodos de acoplamiento vía para resolver la estructura podría ser un método adecuado, en circunstancias similares. El Grx5-Isa1 interacción es coherente con el análisis filogenético se informa en una sección anterior.
El anterior análisis sugiere una estructura esquelética para la biogénesis ISC vía. Sin embargo, esta estructura tiene que ser perfeccionado antes de que pueda ser analizados mediante el modelado matemático. Un análisis más detallado topología requiere un análisis más profundo de los datos disponibles en la literatura. Además, no genética influye de reglamentación a la vía son difíciles de identificar automáticamente, y uno debe incluir dicha información a través de conocimiento experto. En esta etapa, humanos curación es necesaria para convertir el análisis automatizado de los puntos anteriores en una red de reacciones y para añadir más detalles a la topología de reacción y regulación. Esta curación se describe en detalle en el anexo complementario [véase el archivo adicional 1].
La complejidad intrínseca de los regímenes alternativos de reacción en la Figura 2 requieren el uso de modelos matemáticos con el fin de comparar sus in silico comportamiento dinámico contra el fenotipo en la literatura para diferentes genéticamente manipulado las líneas celulares. Sin embargo, el mecanismo detallado de los procesos y reacciones en los distintos modelos son en su mayoría desconocidos y apropiada los valores de los parámetros son difíciles de estimar. Por lo tanto, para obtener un modelo matemático útil para cada una red alternativa a las necesidades de uso aproximado cinética funciones con parámetros cuyos valores pueden ser obligados en cierta medida. La facultad de Derecho formalismo, que se basa en una aproximación de Taylor en un espacio truncado logarítmica en el plazo de primer orden, proporciona una representación cinética que a) se normalizaron con facilidad y b) los valores de los parámetros límites que pueden ser aproximadamente estimado. Este formalismo y un escaneo procedimiento similar al utilizado aquí han sido previamente utilizado para identificar probables interacciones desconocidas de reglamentación que fueron validados este último, en un modelo detallado de los glóbulos rojos metabolismo [70]. Por otra parte, este formalismo no conserva algunos de carácter lineal de la dinámica del proceso de estudio [16 - 18, 71].
Usamos el poder de la ley en su formalismo Generalizado de masas (GMA) el formulario de Acción para la construcción de un modelo matemático que puede tener en cuenta las diferentes alternativas en la Figura 2. Los detalles sobre la cinética de ecuaciones para nuestros modelos, que se generan de forma automática de la red de reacciones, se dan en el apéndice complementario. La facultad de Derecho descripción en el formulario de Evaluación de la red de la figura 2 se presenta en formato SBML como material complementario (véase el apéndice para la lista completa de las reacciones y detalles técnicos de la aproximación y el parámetro de modo de barrido).
El análisis de la bioinformática sección nos lleva a considerar que Arh1-Yah1 puede actuar en la regulación S (ynthesis), T (ransfer) o R (epair) de los grupos (Cuadro 2], o en cualquier combinación de las tres funciones. Al comparar las simulaciones para los roles alternativos de Arh1-Yah1 a los resultados experimentales, vemos que sólo cuando las curvas Arh1-Yah1 participar en S ST o reproducir los resultados experimentales. Sólo para esos roles que la actividad de las proteínas que dependen de ISC disminuye Fe y se acumula en respuesta a un agotamiento en Arh1-Yah1 niveles (Figura 3A y 3B]. Estos resultados perfeccionar las predicciones anteriores [44] y están de acuerdo con lo anterior los resultados experimentales que se han interpretado como una indicación de que Arh1-Yah1 no regulan ISC reparación in situ [73, 74].
Es interesante observar que los resultados de estudios Arh1 agotamiento [74] muestran un ligero aumento en la actividad de ISC que dependen de las proteínas sobre el agotamiento inicial de Arh1, seguido por una disminución en el ISC que dependen de la actividad de proteínas a mayor agotamiento de Arh1. Este comportamiento no se reproduce en Yah1 agotamiento estudios [73]. Dentro de la gama de nuestros parámetros de la digitalización, sólo las redes cuando Arh1-Yah1 actúa en la síntesis de ISC muestra el mismo comportamiento para el ISC que dependen de las proteínas como la observada en Li et al. [74]. En nuestros modelos este efecto puede explicarse de la siguiente manera. Las simulaciones de inicio con una sobreexpresión de Arh1-Yah1. A altas concentraciones, gran parte de la biosíntesis de ISC se lleva a cabo para mantener Arh1-Yah1 activa, como esta proteína requiere ISC para la actividad. Cuando los niveles de Arh1-Yah1 gota abajo los niveles de saturación de la biogénesis ISC maquinaria puede cargar más de ISC en el ISC otros que dependen de las proteínas, con lo que aumenta su actividad. Como Arh1-Yah1 siguen caída no hay suficiente Arh1-Yah1 en torno a mantener la plena fracción del ISC otros que dependen de las proteínas en forma activa.
También existe la posibilidad de que Arh1 y Yah1 actuar en ISC en la biogénesis de un desconocido de manera que no está representado en la red. Para buscar pruebas adicionales en apoyo de esta hipótesis, reanalyzed el perfil filogenético de ambas proteínas. Este análisis revela que Arh1 y Yah1 tienen una fuerte co-evolución con las proteínas Sco1/Sco2 y Hol1, que están involucrados en el transporte de cationes. Hay otras conexiones entre ISC y la biosíntesis de iones divalentes transporte mitocondrial, lo que sugiere que la conexión entre Arh1/Yah1 y Sco1/Sco2 puede merecer la pena investigar en el futuro. Co-experimentos de purificación de afinidad que aportar pruebas de esta interacción. Además, la medición de la acumulación de hierro y una alteración en las proteínas que dependen de ISC actividad en mutantes en los que Sco1, Sco2 o Hol1 se han eliminado proporcionaría pruebas de la participación de estas proteínas en la biogénesis de ISC.
También hemos investigado el problema no resuelto de la mutua relación funcional entre Arh1 y Yah1. Homología con otros ferredoxin / ferredoxin reductasa pares Arh1 sugiere que es la reductasa para Yah1. Sin embargo, dos experimentos híbridos no han podido recuperar una interacción entre las dos proteínas [75], (Herrero, E. & Vilella, F. resultados no publicados). Este resultado negativo podría explicarse por el hecho de que el híbrido de dos intentos de ensayo para recuperar la interacción en un entorno nuclear, mientras que las interacciones, si las hubiere, se producen en la matriz mitocondrial.
Nuestro modelado estructural de proteínas y de acoplamiento experimentos sugieren que las dos proteínas interactúan de una manera que es similar a sus homólogos bovina. Hemos repetido todos los análisis pertinentes se informó anteriormente [44] para los nuevos modelos estructurales derivados de la estructura de información actualizada. Hemos encontrado que, a pesar de cambiar los números detallados, fotografías en general sigue siendo el mismo. Hemos identificado tres residuos de arginina (Arg268, Arg272 y Arg273) en Arh1 que, tras la mutación es probable que perturben Arh1-Yah1 interacción y, por tanto, reproducir tanto Δ Δ arh1 y yah1 fenotipos mutantes [44]. Esto sugiere una forma de ensayo experimental de las predicciones. Si estas proteínas actúan juntos, lo que altera este acoplamiento afectaría a su papel en la biogénesis de ISC. Esto puede ser probado experimentalmente mediante la creación de mutantes punto de las dos proteínas, los cambios específicos y Arginina aspartato residuos en alanina. Entonces, se podría crear cepas mutantes con diferentes combinaciones de estas dos proteínas. Si las cepas mutantes acumulan Fe y muestran una alteración en las proteínas que dependen de ISC actividad, esto sería una prueba indirecta de que los mutantes residuos son importantes para la función. Cepas con Arh1 etiquetados y marcados con Yah1 podría utilizarse para más de expresar y purificar las proteínas de etiqueta de depuración de afinidad (TAP). TAP análisis y co-purificación de los experimentos con los diferentes punto de mutantes Arh1 y Yah1 debería ayudar a aclarar si Arh1 y Yah1 actuar en tándem durante la biogénesis de ISC.
El análisis de la bioinformática sección nos lleva a considerar que Yfh1 puede actuar en la regulación de Fe I (mport) e ISC S (ynthesis), T (ransfer) o R (epair) de los grupos (Cuadro 2], o en cualquier combinación de los cuatro funciones. Sólo las curvas de las simulaciones, donde participa en Yfh1 S, T ST o reproducir los resultados experimentales (Figura 3C y 3D]. La actividad de las proteínas que dependen de ISC disminuye Fe y se acumula en respuesta al agotamiento de Yfh1, cuando Yfh1 actos en cualquiera de esas funciones. El filogenéticos y de acoplamiento de análisis que apoya los actos en Yfh1 S, T ST o porque el análisis que sugiere que Yfh1 funcionalmente coopera con Arh1-Yah1. Las recientes pruebas experimentales detectado física y funcional de las interacciones entre Yfh1, las proteínas de andamiaje y Nfs1 [76 - 79], que proporciona más apoyo para nuestra interpretación. Otros modos de acción también causa la acumulación de Fe y dependientes ISC agotamiento de la actividad de proteínas, sin embargo, ya sea la acumulación de Fe es pequeño (R) o el agotamiento de la actividad de proteínas es bifásica (RS, RT, RST). Por lo tanto, no consideramos estas posibilidades como alternativas.
Un modelo especulativo mecanicista de cómo Arh1, Yah1 y Yfh1 pueden colaborar en la biogénesis de ISC es el siguiente. Yfh1 puede regular el estado de oxidación de los iones de hierro, con independencia de la proteína de la oligomerización estado [61, 80, 81]. Por lo tanto, Yfh1 podría ser responsable por el suministro de hierro en el adecuado estado de oxidación de ISC para la biogénesis y la reparación. Esto ha sido sugerido anteriormente por Gakh et al. [80]. Arh1 y Yah1 pueden actuar como donantes de electrones alternativos / aceptores de Yfh1, Yfh1 garantizar la capacidad para proporcionar hierro en el adecuado estado de oxidación para la síntesis y reparación de ISC. El otro donante / aceptor podría ser una cadena respiratoria mitocondrial. Este modelo alternativo podría explicar por qué algunos experimentos detectar Yfh1 independencia de la función de la respiración mitocondrial [82], mientras que otros detectar la interacción funcional entre Yfh1 función y la respiración mitocondrial [83]. Una forma para probar este modelo sería el siguiente. En primer lugar, se podría inhibir la cadena respiratoria de transferencia de electrones (sin dejar de ofrecer ATP para la célula) y Arh1-Yah1 independiente, en las mismas condiciones experimentales. Yfh1 debe permanecer activo a un cierto nivel en uno y otro caso. Entonces, uno se inhibe ambas simultáneamente. Si el modelo es correcto entonces Yfh1 actividad debería ser seriamente obstaculizado en este doble mutante líneas celulares.
Evidencia experimental muestra que, in vitro, pueden formar Yfh1 gran homo-multimers y almacenar grandes cantidades de hierro que se pueden movilizar para su posterior uso [81, 84, 85]. Esto es imitado en nuestros modelos de la función de Yfh1 en la sección I de la Figura 2. El análisis de estos modelos matemáticos demuestra que, si había Yfh1 esa función, Δ yfh1 células que han mermado ISC dependientes de proteínas de actividad. Sin embargo, si la piscina es tan grande como los estudios in vitro sugieren que puede ser mitocondrial de hierro serían los niveles más bajos en las células Δ yfh1 que en las células de tipo salvaje. Por lo tanto, nuestra simulaciones, junto con los recientes trabajos experimentales [86], sugieren que el almacenamiento de hierro Yfh1 es prescindible para su función en vivo.
El análisis de la bioinformática sección nos lleva a considerar que Grx5 puede actuar en la regulación de la categoría D (ead final complejo de reciclaje), A (RH1-Yah1 deglutathionylation), I (SS) y N (fs1 deglutathionylation) bloques en la Figura 2 (Cuadro 2 ) O en cualquier combinación de las cuatro funciones. Sólo la simulación de curvas donde Grx5 participa en la regulación de, al menos, D, N o son capaces de reproducir los resultados experimentales publicados (Figura 3E y 3F]. Sólo la A modo de acción de Grx5 puede ser excluido de nuestro simulaciones.
En silico proteína de acoplamiento de Grx5 con cada una de las proteínas ISC Nfs1 indica que es la proteína que tiene una mejor superficie complementaria con Grx5. Por otra parte, el acoplamiento de Grx5 y Nfs1 sugiere que Grx5 podría estar regulando el glutathionylation estado de la Cys421 de residuos en Nfs1, que es el sitio activo putativo cisteína. Esta predicción puede ser probado por la purificación y aislamiento de las diferentes proteínas implicadas en la biogénesis de ISC, junto con las proteínas de control adecuados. Entonces uno se incuba cada proteína con glutatión reducido, para crear proteínas-GS aductos. En otro experimento, se podría poner las proteínas oxidantes fuertes bajo las condiciones que conducen a la formación de puentes disulfuro. Después de eso, uno se mezcla cada proteína que se ha sometido al estrés oxidativo con Grx5 y siga la reducción de las proteínas oxidadas. Los objetivos de Grx5 debe ser el que se convierten en proteínas reducido en forma más rápida. Este experimento debe aclarar el papel de Grx5 ISC en la biogénesis. De forma paralela se puede realizar también co-purificación de afinidad con los estudios Grx5 e identificar las proteínas que interactúan con Grx5.
Nfs1 cataliza la eliminación de azufre de la cisteína y dispone de azufre para la formación de ISC [29, 87, 88]. Sin embargo, no está claro cómo lo hace. Se ha demostrado que este Nfs1 transferencias de azufre a la ISS proteínas para el montaje de ISC [89, 90]. También se ha demostrado in vitro que puede Nfs1 directamente ISC reparación in situ al daño oxidativo, si el hierro está disponible en las proteínas que dependen de ISC [91 - 93]. Sin embargo, no está claro si más adelante este papel es importante en la generación de la fenotipo de ISC supresión mutantes. Por lo tanto consideramos que Nfs1 puede actuar en S (ynthesis) o R (epair) de la ISC (Figura 2, Cuadro 2], o en ambos. Las simulaciones muestran que los modelos pueden reproducir los resultados experimentales Nfs1 si no funciona en R (Cifras 3G y 3H]. La navaja de Occam sugiere que la participación de Nfs1 en S es suficiente para justificar el fenotipo. Sin embargo, la red que actúa en Nfs1 AR también puede reproducir el fenotipo observado experimental a Nfs1 agotamiento (Figura 3].
Consideramos que Ssq1-Jac1-Mge1 puede actuar en la regulación de F (olding de las proteínas), R (epair de las agrupaciones) y St (abilization de los grupos en los andamios) (Figura 2, Cuadro 2], o en cualquier combinación de las tres funciones. Al comparar las simulaciones para la alternativa funciones de los chaperones que publicó los resultados experimentales, sólo cuando las curvas Ssq1-Jac1-Mge1 participar en la regulación de R pueden quedar excluidos (Figura 3I y 3J]. Sin embargo, una vez más después de navaja de Occam, no hay necesidad de considerar ningún papel para la chaperones que no sea el plegamiento de las proteínas de ISC. Esto está de acuerdo con el trabajo recientemente publicado [94]. Una manera de probar si los chaperones están involucrados en la estabilización de las agrupaciones en las proteínas de andamiaje sería crear los siguientes dos sistemas in vitro. Un sistema de andamiaje contienen proteínas y Yah1. Entonces uno se crearía condiciones favorables para que los andamios se cargan con ISC y seguir la cinética de ambos ISC montaje en andamios y la transferencia de ISC a apo-Yah1. Este es un experimento que se ha repetido y publicado mediante homólogos de diferentes especies (véase, por ejemplo, referencia [95]]. Por último, sería repetir el experimento añadiendo chaperones para el medio. Más rápido cinética de ISC asamblea indican que la chaperones ayudar en la estabilización de los grupos en los andamios.
La identificación y la reconstrucción de vías novela es un área emergente de gran interés. La acumulación de datos procedentes de diferentes orígenes y el desarrollo de métodos y software para que los datos de minas crear una oportunidad para cerrar la brecha entre la opinión fragmentaria de los genes y las proteínas y el enfoque más integrado de la biología de sistemas. En este trabajo se utilizan una combinación de enseñanza teórica, matemática, computación y métodos para reconstruir la topología de la reacción y la red de reglamentación para la biogénesis mitocondrial ISC vía en S. cerevisiae. Los elementos de red (proteínas) son identificadas y una red de interacciones entre ellos se prevé el uso automatizado de la literatura minera, los datos genómicos, la bioinformática estructural de datos y análisis evolutivo. Aunque automático de herramientas proporcionan una primera aproximación de la estructura de red, análisis de restos humanos necesarios para la curaduría toda la información pertinente. De hecho, los humanos curación de la red es un paso crítico para la determinación de posibles alternativas de sistemas de reacción para la biogénesis de ISC. En este punto, los modelos matemáticos son necesarios para validar y predecir el comportamiento sistémico de cada alternativa de red comparándolo con los datos experimentales. El cuadro 3 muestra los posibles roles para las proteínas que han sido analizados. Esto elimina algunas de las estructuras de red alternativas y ayuda en el perfeccionamiento de los restantes, al sugerir que los experimentos pueden diferenciar más entre ellos. Estos experimentos se resumen en la Tabla 4. Al igual que en cualquier enfoque científico, el proceso debe continuar iterativamente.
Como se muestra es el presente documento, la bioinformática herramientas, conocimientos especializados y técnicas de modelado por lo tanto, puede utilizarse para ayudar en el análisis predictivo del sistema, y sugiere a prueba experimental de las predicciones. Otro aspecto útil de nuestro enfoque es que puede ser utilizado en reevaluar la interpretación de los datos experimentales. Por ejemplo, si Yfh1 tenía un importante papel en la acumulación de una piscina Fe mitocondrial, entonces nuestro modelo predice que Δ yfh1 mutantes que tienen menos hierro mitocondrial, lo cual es contrario a lo que se observa. Es nuestro objetivo a seguir perfeccionando nuestro modelo y aplicar este análisis a otros organismos, por lo tanto, ayudar en la comprensión de cómo la biogénesis ISC vías han evolucionado.
En principio, la combinación de enfoques que aquí se presenta puede ser utilizado de manera flexible para analizar problemas similares en otros sistemas biológicos moleculares. En resumen, todo el procedimiento sería el siguiente (Figura 4):
1) Elija el proceso biológico de interés (en nuestro ejemplo de referencia las proteínas que participan en el montaje de ISC en Saccharomyces cerevisiae)
2) Determinar las proteínas y metabolitos de interés que se consideran involucrados en el proceso (Bibliomic y análisis filogenético de perfiles). El uso de perfiles filogenéticos como un primer indicador de que las proteínas pueden actuar juntos en el proceso de interés.
3) interrogar bases de datos disponibles para la interacción física entre las proteínas de interés.
4) Si es posible, obtener estructuras de proteínas. Si no se dispone de estructura, obtener modelos estructurales de las proteínas homólogo (bioinformática estructural)
5) Utilizar todos contra todas las proteínas de acoplamiento para obtener el más probable es que las interacciones (bioinformática estructural). Analizar esas interacciones (proteína-proteína conjuntos de datos).
6) obtener un degenerado o incompleto conjunto de posibles estructuras de red basado en las interacciones obtenidos a partir de 4).
7) Eliminar de añadir al 5) las interacciones que se eliminan o sugerido de los datos conocidos (los conocimientos de expertos)
8) Identificar modelos alternativos correspondientes a diferentes hipótesis para los elementos y procesos.
9) Derivar modelos matemáticos para el seleccionado, utilizando el enfoque GMA (modelado matemático)
10) Normalizar los modelos y parámetros de exploración en grandes rangos permisibles para determinar que las redes alternativas son capaces de reproducir el comportamiento conocido experimental del sistema.
11) Si algunas de las alternativas conocidas reproducir los resultados experimentales, diseñar experimentos de pensamiento que también puede ser ejecutado y que experimentalmente puede diferenciar entre el comportamiento de las alternativas. Volver al paso 6).
12) Si ninguna de las redes alternativas es capaz de reproducir el comportamiento conocido el uso experimental de perfiles filogenéticos para determinar posibles nuevos componentes del sistema de interés. Volver al paso 3).
En algunos casos, algunas de las medidas aquí propuesto se puede evitar, ya que no añade información adicional. Es probable que, mediante la aplicación de este procedimiento para la reconstrucción de los diferentes procesos metabólicos, los distintos métodos contribuirá diferente para la reconstrucción. En algunos casos, habrá superposición de la red de interacciones que se predice de cada conjunto de datos, mientras que en otros el análisis de los diferentes conjuntos de datos proporcionará diferentes ya veces contradictorias de las redes de interacciones. Esto subraya la necesidad de expertos para la curación de las redes en esta fase de la metodología de desarrollo. Cualquier programa / servidor / paquete de software que permita la aplicación de ese procedimiento tendría que ser lo suficientemente flexible para que el uso de sólo ciertas partes del procedimiento sería posible para los usuarios no expertos. También es fundamental que dicha solicitud es lo suficientemente flexible como para permitir que el investigador de modificar el itinerario topología interactiva, utilizando los conocimientos de los expertos. Una vez que las vías alternativas se identifican, el uso de modelos GMA facilita enormemente el modelado matemático. Estos modelos pueden ser obtenidos automáticamente desde el sistema de reacción y dinámica simulaciones pueden realizarse mediante el escaneo de los parámetros de los modelos normalizados. Cuando se trata de mal definidas las vías con casi ningún parámetro de determinación de estudios disponibles, el escaneo es un procedimiento que limita el paso, ya que decenas de cientos a unos cuantos millones de simulación de las curvas pueden ser necesarios incluso en el caso de vías bastante pequeño. El escaneo del parámetro espacio puede ser limitada por la disponibilidad de buenas mediciones de al menos algunos de los valores de los parámetros. Este es por ejemplo lo que ocurre en la referencia [70].
El ISC vía de la biogénesis S. cerevisiae es parcialmente reconstruido utilizando un flexible in silico metodología que combina el análisis de secuencias, la literatura y el análisis de métodos de bioinformática estructural. El papel de los distintos S. cerevisiae las proteínas en el ISC se prevé la biogénesis. Algunas predicciones son validadas por los resultados experimentales publicados. Otras predicciones necesita más trabajo experimental para validar. La metodología propuesta es flexible y es aplicable a la reconstrucción de otros sistemas. Esta metodología podría ser un paso adelante en la integración de diferentes tipos de datos para a) obtener sistémica nuevos conocimientos sobre itinerarios, yb) aclarar cómo los modelos actuales de las vías que conoce el trabajo, la generación de hipótesis racional para la prueba.
Métodos bibliométricos consideran que la co-ocurrencia de los nombres de dos o más genes o proteínas en el mismo documento es una indicación de que ambas proteínas es probable que participen en los procesos celulares comunes. Bajo este supuesto se pueden identificar las proteínas que se sabe de participar en un determinado proceso celular. IHOP [49] es un recurso que permite este tipo de literatura meta-análisis. Hemos usado esta herramienta para identificar otras posibles genes implicados en la biogénesis mitocondrial ISC y como primer predictor de posibles interacciones entre estos diferentes proteínas de levadura.
Esta técnica propone que si los homólogos de dos proteínas son igualmente presentes o ausentes en un conjunto de genomas secuenciados completamente, entonces las dos proteínas es probable que participen en algunas funciones celulares [52, 53, 96]. La razón de esta suposición es que, habida cuenta de dos proteínas, que va a co-evolucionar si algunos requisitos funcionales del organismo depende de ambos en una manera similar. Para realizar filogenético de perfiles de las proteínas participan en la biogénesis mitocondrial ISC hemos descargado el proteoma de todos los organismos secuenciados completamente descrito en el KEGG base de datos (versión 36.0). Homología de búsquedas para cada uno de los S. cerevisiae las proteínas en cada una de las otras proteomas se hace ejecutando la versión 2.2.4 de PSI-BLAST [97] a nivel local, con e-valor ≤ 0.0001 y tres repeticiones. Un vector de presentes o ausentes homólogos en cada genoma fue construido para cada proteína de levadura. A continuación, tomando como referencia el vector de las proteínas, una co-ocurrencia índice (IC) se calcula para cada una de las otras proteínas en el genoma de levadura: IC = Σ δ ij-DPI / Número total de los genomas = 1-normalizados Hamming La distancia entre dos genes. En esta fórmula, δ ij-PR es la función delta de Kronecker, para ser 1 si la proteína de referencia PR j proteína y ambos tienen (o no tienen) homólogos en el proteoma del organismo i y 0 en caso contrario. La distancia de Hamming se ha utilizado antes y como punto de referencia tanto en S. cerevisiae y en otros organismos [98]. Calculamos el valor de p para cada una utilizando el coeficiente de distribución hipergeométrica, tal como se describe en [99]. Todos los valores de CI entre cualquier par de ISC proteínas tienen valores más pequeños pa than10 -7. Debido a esto, el p-valor proporciona ningún tipo de discriminación para la probabilidad de interacción entre cualquier par de la biogénesis de proteínas ISC. De este modo, se seleccionaron como un importante filogenética co-evolución ISC cualquier otra proteína con un CI más alto que el 95% de todas las proteínas en el genoma. Los resultados se muestran en la Figura 1.
Hemos analizado a gran escala de datos de interacción de proteínas descargado de BIND [100], DIP [101 - 103], GRID [104, 105], PathCalling [68, 106] y yrc [107] para determinar qué proteínas se han encontrado a interactuar físicamente dentro del conjunto de proteínas implicadas en la biogénesis mitocondrial ISC.
Debido a que la estructura de las proteínas implicadas en la biogénesis mitocondrial ISC a S. cerevisiae no se ha determinado hemos tenido que crear modelos estructurales para llevar a cabo bajo la resolución de acoplamiento. Estos modelos se han obtenido ya sea por homología de modelado, utilizando 3DJIGSAW [108 - 114] y SWISSMODEL [115 - 118] o ab initio de modelado utilizando ROSETTA [119 - 123]. Los modelos fueron optimizados a nivel local por algunos bucle reconstrucción utilizando DEEPVIEW [115 - 118]. Cuando más de un modelo se obtuvo por la misma proteína se utilizó un algoritmo genético para optimizar las estructuras [113], seguida por la reconstrucción de bucles. Modelo de optimización se terminó con un pleno de energía utilizando la reducción al mínimo de GROMACS97 campo de fuerza [124] tal como se aplica en DEEPVIEW. La proteína modelos se ofrecen como material complementario [Ver archivo adicional 2]
Dada la atómicas coordenadas de dos proteínas, métodos de acoplamiento búsqueda de los mejores complejos entre ellos en que la forma de las dos superficies encajar mejor [63, 64], mientras que también teniendo en cuenta las interacciones electrostáticas y bonos de hidrógeno. Proteínas de acoplamiento se realizaron experimentos utilizando Gramm [54, 55, 57 - 60] y Hex [62]. La capacidad de estos métodos para recuperar los complejos ha sido regida por diferentes autores [54, 62] y, en una escala limitada, por nosotros por la vía de la biogénesis de ISC.
Para calcular la puntuación de acoplamiento para un determinado par de proteínas, se utilizó la lista de los 20 puntajes más altos de acoplamiento de Gramm. Dentro de esa lista, nos separaron a los grupos de soluciones de acoplamiento. El grupo obtuvo una puntuación obtenida por la adición de la puntuación de cada solución dentro de ese grupo. Hex entonces fue utilizado para realizar el mismo experimento de acoplamiento. Si la solución de la agrupación con la puntuación más alta Gramm no estuvo presente en los veinte mejores soluciones de acoplamiento de la tuerca hexagonal, la Gramm resultado fue descartado y la puntuación de la siguiente mejor grupo que también fue encontrado por HEX se utilizó en lugar. Los resultados se muestran en la Figura 1. Los resultados son el producto de la mejor solución encajar dentro de una agrupación, predijo usando Gramm, por el tamaño del grupo dentro de las 20 predicciones puntuación más alta. En trabajos anteriores, hemos realizado varias pruebas con controles positivos y negativos para asegurarse de que esta utilización de los métodos podría proporcionar garantías razonables conjeturas. Para los controles negativos de la plataforma de conexión que elegimos Grx5. Se obtuvieron las estructuras de las proteínas Rex2, Cyt1, Lip2, Atp16 y Cox 11. Estas son todas las proteínas que o bien no se encuentran en la mitocondria o, si están situadas en las mitocondrias, no participan en la biogénesis de ISC. A continuación, hemos realizado de acoplamiento de Grx5 contra estas proteínas, así como contra la biogénesis de proteínas ISC. Los resultados Rango de los cinco controles negativos como los 5 más pequeño de acoplamiento resultados [34]. Como control positivo se realizó sabia par de acoplamiento de Arh1, Yah1 bovina y sus homólogos. Los resultados de las pruebas son más altos para la adecuada pares (Arh1-Yah1 y bovina Ferredoxin-reductasa Ferredoxin bovina; datos no presentados). Por otra parte, el mejor acoplamiento de las especies bovina tuvo un par de RMSD de menos de tres angstroms con respecto a la estructura cristalizada del complejo. Esto sugiere que el acoplamiento métodos utilizados aquí son útiles para el propósito de describir.
En este documento, la acción generalizada en masa (GMA) la representación canónica de la facultad de Derecho formalismo se utiliza para el conjunto de ecuaciones diferenciales ordinarias que describe el comportamiento dinámico de las redes metabólicas de interés. La derivación y la normalización de los modelos de uso de este formalismo se explica en detalle en el apéndice complementario. El modelo completo se ofrece como material complementario [véase el archivo adicional 3]. La GMA modelos se utilizan para predecir el comportamiento dinámico de las redes alternativas. Este comportamiento se compara con la observada en los experimentos publicados red alternativas y se validan o invalidada sobre la base de poder o no (respectivamente) para reproducir publicado los resultados experimentales.
Los datos experimentales en relación con los cambios en la concentración de este sistema son en su mayoría cualitativos o cuantitativos y semi incompleta. Por ejemplo, cuando hay mediciones en varios puntos de tiempo para la acumulación de hierro o de la disminución del ISC dependientes de proteínas de actividad, no hay mediciones en relación con la disminución de la concentración de la proteína que se inutiliza del genoma. Asimismo, en la mayoría de los casos, sólo hay dos mediciones de las concentraciones de Fe y ISC dependientes de proteínas de actividad. Una medición se realiza en las células de tipo salvaje y el otro en la medición de cepas mutantes en el momento oportuno. Esto se opone a utilizar cualquier instalación actual algoritmo con precisión para determinar la bondad del ajuste entre el comportamiento dinámico de una topología y los resultados experimentales. Si precisa datos cuantitativos con respecto a las concentraciones de las diferentes proteínas, la variación de la concentración de Fe y ISC dependientes de proteínas de actividad disponibles, que se aplicaría tal equipo algoritmo para encontrar el set (s) de valores de los parámetros que mejor se ajusten a esos datos. Para cada alternativa topología, los mínimos cuadrados desviación entre los datos observados y el mejor ajuste set (s) de valores de los parámetros podrían ser utilizados para determinar la topología que sería más probable para explicar los datos experimentales. Clasifican los modelos más probable en la falta de precisión de los datos experimentales, es menos directo. Si no topología puede reproducir los resultados experimentales en todo el rango de valores de los parámetros escaneado se puede calcular el porcentaje del parámetro espacio en el que el comportamiento experimental es cualitativamente reproducirse. Cuanto mayor sea ese porcentaje, mayor es la probabilidad de que una determinada topología es capaz de explicar los resultados experimentales. Sin embargo, si más de una topología reproduce la composición cualitativa observaciones experimentales sobre toda la gama de valores de los parámetros que se escanean, es difícil definir una medida de la bondad de ajuste de estas topologías a los datos experimentales.
RA diseñó el estudio, realizado el trabajo computacional, analizó los datos y escribió el documento. AS analizó los datos y escribió el documento. Ambos autores leído y aprobado el manuscrito final.
Este trabajo ha sido parcialmente apoyado por el subsidio BFU2005-0234BMC del Ministerio español de Educación y Ciencia. RA fue apoyada por un Ramón y Cajal de la adjudicación Ministerio español de Educación y Ciencia. Damos las gracias a los revisores anónimos de sugerencias que mejorado en gran medida el papel.