BMC Systems Biology, 2007; 1: 5-5 (más artículos en esta revista)

METANNOGEN: la compilación de las características de las reacciones bioquímicas necesarias para la reconstrucción de redes metabólicas

BioMed Central
Christoph Gille (christoph.gille @ charite.de) [1], Sabrina Hoffmann (sabrina.hoffmann @ charite.de) [1], Hermann-Georg Holzhütter (hergo@charite.de) [1]
[1] Instituto de Bioquímica Charité, Facultad de Medicina de la Universidad Humboldt, 10117 Berlin, Monbijoustraße 2, Alemania

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.

Resumen
Fondo

Un objetivo central de la biología de sistemas computacionales es el de modelos matemáticos complejos reacción metabólica redes. La primera y más tiempo de paso en el desarrollo de esos modelos consiste en la stoichiometric reconstrucción de la red, es decir, recopilación de todos los metabolitos, reacciones y procesos de transporte correspondiente a la red y considera su asignación a los distintos compartimentos celulares. Por lo tanto, un sistema de información es necesaria para recoger y gestionar los datos de diferentes bases de datos y de la literatura científica con el fin de generar una red metabólica de reacciones bioquímicas que pueden ser objeto de nuevos análisis computacional.

Resultados

El programa de ordenador METANNOGEN facilita la reconstrucción de las redes metabólicas. Utiliza la conocida base de datos de reacciones bioquímicas KEGG de reacciones bioquímicas como principal fuente de información de que las reacciones bioquímicas pertinentes para la red considera que ser seleccionado, editado y almacenados en una hoja separada, definida por el usuario de base de datos. Las reacciones no figura en el KEGG pueden introducirse manualmente en el sistema. Para ayudar a la decisión de aprobar o no una reacción de KEGG seleccionado pertenece a la red considera METANNOGEN contiene información de SWISSPROT y Ensembl y proporciona enlaces a una serie de importantes fuentes de información como METACYC, BRENDA, NIST, y REACTOME. Si una reacción se informó de que se produzca en más de un compartimento celular, un número correspondiente de reacciones se genera cada refiriéndose a un determinado compartimiento. Procesos de transporte de los metabolitos se inscriben como las reacciones químicas donde reactivos y productos tienen diferentes atributos del compartimiento. La lista de reacciones bioquímicas compartimentado y procesos de transporte de membrana compilado por medio de METANNOGEN se pueden exportar como un archivo de SBML para más análisis computacional. METANNOGEN es altamente personalizable con respecto al contenido del archivo de salida SBML, datos adicionales de los campos, la entrada de forma gráfica, haciendo hincapié en los proyectos específicos de los términos de búsqueda y generadas dinámicamente de enlaces Web.

Conclusión

METANNOGEN es una herramienta flexible para gestionar la información para el diseño de redes metabólicas. El programa requiere Java Runtime Environment 1,4 o superior y alrededor de 100 MB de RAM y unos 200 MB de espacio en disco. No requiere instalación y puede ser directamente en Java webstarted de http://3d-alignment.eu/metannogen/.

Fondo

Un objetivo importante de la biología de sistemas computacionales es el desarrollo de modelos matemáticos complejos para las redes de reacción metabólica. El tipo de esos modelos y su capacidad de predicción dependerá de la disponibilidad de conocimientos bioquímicos. En general, se pueden distinguir dos etapas principales en la red de modelos: (i) stoichiometric red de reconstrucción y (ii) análisis de redes (ver figura 1]. Condición necesaria para cualquier tipo de red modelo matemático es el conocimiento de la red estequiometría, es decir, las reacciones, los procesos de transporte de membrana y los metabolitos. Para células eucariotas, stoichiometric reconstrucción de la red incluye la cesión de las reacciones a los compartimentos celulares. Sobre la base de la stoichiometric matriz de la red puede llevar a cabo un análisis estructural como, por ejemplo, la identificación de los modos elementales de flujo [1], las posibles vías para una autoevaluación consistente expansión de la red a partir de algunos compuestos semilla inicial [2] o el cálculo del flujo estacionario distribuciones basadas en la optimización de limitación [3 - 5]. Una cuestión central en este tipo de análisis es posible definir la direccionalidad de una reacción celular. Para decidir sobre este uno tiene que saber la (Gibb), único gratuito de cambio de energía de la reacción y el rango dentro del cual el ligando las concentraciones pueden variar. En comparación con la creación de modelos estructurales, una visión más profunda de la regulación de las redes de reacción en respuesta a las variaciones externas que puede lograrse sobre la base de modelos cinéticos. Para el establecimiento de modelos cinéticos red tasa de ecuaciones para todas las reacciones y procesos de transporte tienen que ser creado. RK-Sabio y la cinética química de base de datos NIST recoger datos cinéticos de la literatura. Por otra parte, la aplicación de métodos de modelización estructural a las células eucariotas complejo requiere información sobre la localización de las reacciones en los diversos organelos intracelulares, así como el transporte de metabolitos entre los orgánulos. La bioquímica de la información necesaria para la reconstrucción stoichiometric red se propaga a través de varias fuentes de datos.

Completa de las colecciones de reacciones bioquímicas son KEGG [6], BIOCYC, [7], REACTOME [8] y UM-BBD [9]. Para obtener información sobre la compartimentación celular y la especificidad por el sustrato base de datos de la enzima BRENDA [10] es valiosa. A veces el compartimento celular de una enzima en las bases de datos o publicaciones podría no ser el sitio de su acción. Por ejemplo, una enzima mitocondrial podría ser firmemente fijada a la pared mitocondrial y cataliza la reacción bioquímica dentro pero no fuera de la matriz mitocondrial. Por lo tanto, búsqueda bibliográfica es necesaria para obtener un conocimiento detallado sobre las reacciones bioquímicas que se examina. Existen varios enfoques para combinar la información de diferentes fuentes. El sorprender LIGHTBENCH combina una variedad de información que se puede acceder con un navegador web [11]. Disponible modelización programas suelen permitir editar bioquímicos redes con un editor gráfico de la red. Este enfoque es suficiente para las redes pequeñas pero para las grandes redes que abarcan muchas reacciones metabólicas un sistema de almacenamiento de información es obligatorio. El recientemente desarrollado sistema de bases de datos-TODOS LOS META permite a los usuarios introducir datos en las reacciones bioquímicas en un local de funcionamiento ORACAL base de datos con la web de clientes [12]. El modelo resultante se puede exportar en formato SBML. El programa EPE es un editor visual de redes biológicas incluyendo las redes metabólicas y permite añadir anotaciones.

Para facilitar la explotación de diversas fuentes de información para la stoichiometric reconstrucción de las redes metabólicas, hemos desarrollado el programa informático interactivo METANNOGEN (Figura 1]. En contraste con otros programas para la construcción de reacción definida por el usuario utiliza la red METANNOGEN la base de datos KEGG de reacciones bioquímicas como principal fuente de información de que las reacciones bioquímicas pertinentes para la red considerada se puede seleccionar, editar y almacenar. Las ventajas de nuestro enfoque son que (I), sólo las ecuaciones de reacción no se almacenan en KEGG necesidad de ser introducida manualmente, (II) que la vía de la representación gráfica de KEGG se utilizan, que ver, porque conocen su diseño se asemeja a las cifras en los libros de texto en Bioquímica, (III) que el KEGG base de datos se pueden actualizar sin que ello afecte a los datos del usuario y (IV) que los identificadores son inmutables para siempre los compuestos y las reacciones de KEGG.

Aplicación

El programa viene en un solo ejecutable Jar-file y no requiere instalación. Cuando el archivo del tarro se inicia por primera vez la KEGG archivos de datos se descargan de la KEGG-servidor y se almacena en el disco duro. Para actualizar la base de datos KEGG el usuario sólo tiene que eliminar estos archivos. La próxima vez que el programa se inicia se descarga la versión actual. El KEGG datos está cargado en la memoria principal cada vez que el programa se inicia. Este proceso ha sido altamente optimizado con respecto a la velocidad y el uso de memoria para permitir la carga de la enorme base de datos KEGG dentro de unos cinco segundos en un PC i386 con un tacto de la CPU a 2 GHz. KEGG mantenimiento de la base de datos en la memoria principal del PC local asegura extremadamente corto tiempos de acceso y, por tanto, evita las demoras típicas de interfaces Web creado en la parte superior de un servidor de bases de datos remotas.

Datos del usuario y los datos de la KEGG base de datos se almacenan en las variables por separado, aunque podrían estar vinculados si comparten la misma reacción de identificación. Por lo tanto, el programa no se limita a las reacciones que figura en KEGG. Para facilitar la personalización de la forma de la entrada y la salida de SBML los usuarios pueden modificar el código fuente de Java es que al instante recopilados por el compilador embebido (Figura 2].

La técnica utilizada para cambiar y compilar código en tiempo de ejecución se ha descrito recientemente [13]. No hay otras herramientas de software son necesarios. METANNOGEN no requiere necesariamente una central de almacenamiento de datos ya que todos los conjuntos de datos creada por el investigador se almacenan localmente. Estos archivos pueden ser compartidos con los discos floppy-u otros medios de almacenamiento portátiles. Sin embargo, para facilitar la reconstrucción en red de un equipo de investigadores, un repositorio central puede ser aplicado usando un servidor Web situado en la red local. Con este fin, cada conjunto de datos contiene la identificación del autor que creó el conjunto de datos.

Limitaciones

• Para las reacciones no figura en el KEGG las necesidades de los usuarios a escribir la ecuación de reacción ..

• El METACYC base de datos no se utiliza como principal fuente de datos.

• Actualmente, METANNOGEN aún no se ha podido llevar a cabo las comprobaciones de coherencia en la red, como la identificación de metabolitos desequilibrada.

• bugs conocidos: El gráfico de árbol de vez en cuando se derrumba. Puede ser rescatados con la [redibujar]-botón.

Resultados y discusión

La más completa base de datos de reacciones metabólicas es KEGG [14, 15], que es la razón por la KEGG se utilizó como un esqueleto. Como consecuencia de las reacciones de otras fuentes como por ejemplo METACYC [16] tienen que ser introducidos manualmente. El KEGG datos se representa como un árbol expandible porque se trata de una forma eficiente para mostrar las complejas relaciones entre las vías, las reacciones, enzimas y compuestos. Las reacciones son los niños los nodos de las enzimas y viceversa porque, en última instancia, una reacción puede ser catalizado por varias enzimas y, a la inversa, una enzima Mayo catalizar reacciones diferentes.

Reacciones tomado de la KEGG en la base de datos definido por el usuario, llevar la red KEGG reacción identificador de modo que cualquier modificación de las reacciones en el KEGG base de datos puede ser fácilmente detectado y posiblemente trasladados a las correspondientes reacciones en los definidos por el usuario de datos. Para las reacciones no se almacenan en KEGG el usuario define un identificador alfanumérico. Procesos de transporte no están contenidas en el KEGG base de datos. Tienen que ser introducida manualmente utilizando la misma notación que para las reacciones químicas con la diferencia de que los sustratos y tienen diferentes productos del compartimiento de atributos. El usuario puede introducir compuestos en el texto de campo de la bioquímica ecuación utilizando las denominaciones comunes como "L-citrulina", "citrulina" o "Citrullin" y pueden insertar los compuestos encontrados en una amplia lista de compuestos. Nombres compuestos pueden convertirse en los respectivos KEGG ID como por ejemplo "C00327" de L-citrulina si el compuesto es que figura en KEGG. Todos los procesos de transporte y las reacciones que no tienen una entrada correspondiente en KEGG son agrupados bajo la rama del árbol "huérfanos" o reacciones "transportistas", respectivamente. METANNOGEN permite especificar más de una sub-celulares compartimiento para una sola reacción bioquímica que se traduce en la generación de un conjunto de datos para cada compartimento. Etiquetado de todos los datos con el nombre de usuario y la protección contra la modificación no deseados permite METANNOGEN a ser utilizado por un equipo de investigadores.

Trabajo con METANNOGEN - un estudio de caso

En lo sucesivo, el uso de METANNOGEN se explica utilizando como ejemplo la síntesis de carbamoylphosphate. El gráfico 3 muestra el árbol expandible con el nodo del árbol de síntesis Carbamoylphosphate I (CPS I) y los datos de CPS Iy II CPS, así como la citrulina transportista. La síntesis de carbamoylphosphate es el primer paso en la biosíntesis de pirimidina, la biosíntesis de arginina, y el ciclo de la urea. Formación de carbamoylphosphate mitocondrial utilizado en el ciclo de la urea es catalizada por la enzima carbamoylphosphate sintetasa I (CPS I). La notación de la reacción en KEGG dice

2 ATP + NH 3 + CO 2 + H 2 O ⇄ 2 ADP + + ortofosfato Carbamoylphosphate (1)

Para añadir esta reacción al modelo de los respectivos nodo del árbol con la reacción identificador R00149 CE y el número 6.3.4.16 debe ser marcado en METANNOGEN. Selección de "nuevos datos" del menú de datos crea un nuevo conjunto de datos para la reacción carbamoylphosphate sintetasa en el definido por el usuario de base de datos (Figura 3]. La máscara de entrada para el conjunto de datos aparece en la parte derecha de la pantalla. Un botón de conmutación con el semáforo símbolos permite excluir a los conjuntos de datos de la matriz stoichiometric sin borrar los datos. Esta es una opción útil en caso de una reacción y su catalizar las enzimas no se informa de existir en la especie que ha sido considerada por el usuario (por ejemplo hepatocitos humanos), mientras que para una especie (por ejemplo hepatocitos de rata), tales evidencias están disponibles.

Comprobación de la coherencia de la stoichiometric generado con matrices activas o inactivas botón de conmutación de tal "probable" reacciones pueden proporcionar un valioso heurística para profundizar el trabajo experimental. Para el modelo del metabolismo hepático de la reacción carbamoylphosphate sintetasa se activa desde la reacción se lleva a cabo en el hígado humano, sin duda. Las dos primeras reacciones del ciclo de la urea, la formación de carbamoylphosphate y la ligadura con ornitina, tendrá lugar en la matriz mitocondrial. Este conocimiento se obtiene normalmente a partir de bases de datos como Brenda [10], UM-BBD [9], Sabio-RK o de artículos científicos. Para mayor conveniencia, algunas bases de datos están vinculadas y las respectivas páginas se abren en el navegador Web cuando los vínculos se hace clic.

Este conjunto de bases de datos es personalizable. Por considerarse la reacción de la sintetasa mitocondrial carbamoylphosphate el compartimiento "MitoMx" (matriz mitocondrial) es seleccionado por el usuario en la caja de selección de sub-compartimentos celulares. La recién creada base de datos puede almacenar cualquier tipo de información adicional sobre la reacción y el catalizador enzimático. Para mantenerse al tanto de la fuente de conocimiento, notas y comentarios tomados de la literatura se puede introducir como texto libre. Pubmed resúmenes pueden ser referido simplemente por su ID. Los resúmenes se descargan automáticamente y se muestra con palabras clave de relieve importante. Si, por ejemplo, la referencia PMID: 7915141 para un artículo sobre carbamoylphosphate sintetasa figura en el texto de campo y el ratón se mueve sobre ella, el resumen es mostrado automáticamente e importantes los términos de búsqueda como "humanos" o "hígado" se destacan. En general, un enlace a una base de datos está formada por una base de datos de identificación seguido por dos puntos, en este caso PMID:, y una entrada de identificación, en este caso 7915141. Una alternativa con la sintaxis de llaves permite a los términos de referencias que contienen caracteres distintos de números y letras como por ejemplo BRENDAec (o) 6.3.4.16 GOOGLE () carbamoylphosphate mitocondrial (Figura 3]. La URL de bases de datos puede ser editado en personalizar el menú. KEGG En la mayoría de las reacciones se muestran en forma gráfica (las llamadas KEGG-maps). METANNOGEN puede mostrar información dentro de estos puntos de vista gráfico vía. Para localizar rápidamente la reacción de la CPS I en el itinerario de vista gráfico "del ciclo de la urea" 'puede ser marcado en el objeto de árboles y se destaca por un marco rojo en el itinerario. Esto permite localizar rápidamente una reacción, como el CPS I en el contexto de una determinada vía. La elección de "todo" en el compartimiento del selector KEGG de ruta de un camino, aquí el ciclo de la urea, todas las reacciones de los definidos por el usuario la red se destacan por rectángulos llenos de color, independientemente de sus compartimentos. Dependiendo de la situación de la exclusión alternar mencionado antes, una caja llena verde indica que está incluido en el modelo en contraste con un recuadro rojo que indique que es actualmente excluidos. Si un compartimento específico es seleccionado para el mapa KEGG-un cuadro de color amarillo señala que esta reacción no existe en esta sino en otro compartimiento. Para nuestro ejemplo este punto de vista pone de manifiesto que los compuestos citrulline_mitoMx y citrulline_cyto no puede ser equilibrado porque ambos reactivos se producen en una sola reacción (ornitina transcarbamylase en la matriz mitocondrial y argininosuccinate sintetasa en el citosol). En estos casos el usuario necesita para buscar un mayor intercambio posible de los procesos correspondientes metabolito a través de la membrana que separa los dos compartimientos. Por citrulina, un transporte a través de la membrana interna mitocondrial está bien descrita en la literatura.

La notación correspondiente a METANNOGEN dice

citrulline_cytocitrulline_mitoMx (2)

Para averiguar si los genes, las proteínas y las transcripciones se han definido para una determinada actividad enzimática en los hombres y las Ensembl SWISSPROT ramas del árbol son útiles. Pueden ser ampliado de la reacción nodos. CPS 1 tiene la SWISSPROT entrada CPSM_HUMAN y la entrada de genes Ensembl ENSG00000021826. A diferentes Carbamoylphosphate CPS II sintetasa cataliza el primer paso de la síntesis de purinas. El mecanismo de reacción es diferente a la de CPS I en que el nitrógeno no se origina a partir de amoníaco, sino de glutamina. En consecuencia, la reacción de identificación y la enzima código son diferentes. Debido a que el CPS II es una enzima citosólica "citosol" debe ser seleccionado. El SBML de salida para las dos reacciones se muestra en la figura 4.

Personalización de METANNOGEN para proyectos específicos

Dependiendo del tipo de modelo matemático que tiene que ser desarrollado por una red metabólica diferentes tipos de información sobre la termodinámica y la cinética de reacciones y procesos de transporte son necesarios. En principio, el texto de área para las notas pueden ser utilizados para este tipo de información. Sin embargo, para almacenar toda la información de manera unificada y estructurada los usuarios avanzados también pueden crear GUI elementos específicos tales como menús desplegables alternar botones, campos de texto y casillas en el código fuente de Java. Con este fin, personalizar el menú ofrece la posibilidad de generar una copia de la GUI de Java que el archivo que reemplaza el valor por defecto GUI clase Java en las aplicaciones en curso. El usuario puede editar este ejemplar. La fuente de texto contiene código de ejemplo para otros tres elementos-GUI que pueden activarse mediante la eliminación de los "/ *" y "* /" etiquetas. Esto hace que las líneas cerradas en "/ * ... * / "activa tan pronto como el código fuente modificado se guarda y los elementos adicionales GUI aparecerá inmediatamente. En este ejemplo el GUI elementos adicionales corresponden a los campos de datos denominada "Campo1", "campo2" y "FIELD3». Significativos nombres se pueden dar lugar. Por defecto, los campos de datos adicionales que no se exporten como SBML. Sin embargo, la SBML producción puede adaptarse mediante el mecanismo mencionado anteriormente [13].

Una vez más se trata de manipular directamente el código fuente instantánea y las pruebas de la modificación de SBML escritor en tiempo de ejecución. Esto no es crítico porque una copia del fichero original es modificado por el usuario. Eliminación de este archivo inmediatamente el programa vuelve al estado original. En el código de Java el texto contenido de un campo puede ser solicitada por la invocación de la instancia método de objetos de datos String metannogenDataset # getField (String data_field_name).

Las búsquedas con Google y Pubmed

Uno de los principales obstáculos de la búsqueda de información relevante utilizando los motores de búsqueda es que las enzimas bioquímicas puede ser nombrado de muchas maneras diferentes. METANNOGEN se reúne esta dificultad mediante la combinación de nombres sinónimos para las enzimas de interés por lógica "o" para formar un sensible consulta de búsqueda de Google o Pubmed. Las búsquedas suelen dar lugar a un mayor número de votos. Por Pubmed resúmenes ayudas adicionales están disponibles. Mover el puntero del ratón durante un ID Pubmed el resumen se descarga en la caché local y se muestran. Todas las palabras clave definidas por el usuario se destacan en el resumen rápidamente para evaluar la pertinencia de la publicación. Para un gran número de publicaciones de este enfoque es mucho más eficiente que la apertura de los resúmenes en el navegador de Web. Consultas de búsqueda se puede introducir como un hiper-referencias en la observación de campo usando la sintaxis PUBMED (carbamoylphosphate [TI] y el hígado y humano).

Conclusión

METANNOGEN flujo de las líneas de diseño de las grandes redes metabólicas. La red metabólica se pueden exportar como SBML para su posterior análisis.

Disponibilidad y requisitos

METANNOGEN es gratuita y puede cargarse http://3d-alignment.eu/metannogen/. El software se distribuye bajo la licencia GNU GPL. Carga archivos de base de datos de la KEGG-servidor. Por lo tanto, los usuarios deben comprobar también la licencia de la KEGG-base de datos. El programa requiere Java Runtime Environment 1,4 o superior de Sun o IBM y alrededor de 100 MB de RAM y unos 200 MB de espacio en disco. Es la prueba en MS-Windows y Linux y también debería funcionar en cualquier otra plataforma. No necesita ninguna infraestructura avanzada como servidor de bases de datos o servidor Web para funcionar.

Autores de las contribuciones

• CG ha desarrollado el programa

• SH ha hecho contribuciones sustanciales a la concepción y diseño, pruebas y programa.

• HH ha supervisado el proyecto y mejoró el diseño y prueba el programa.

Agradecimientos

Este proyecto fue financiado por la iniciativa de investigación BMBF "biología de sistemas".