Immunome Research, 2005; 1: 2-2 (más artículos en esta revista)

Una ontología para inmune epítopos: aplicación para el diseño de una base de datos de amplio alcance inmune reactividades

BioMed Central
Muthuraman Sathiamurthy (muthu@liai.org) [1], Bjoern Peters (bjoern_peters@gmx.net) [1], Huynh-Hoa Bui (hbui@liai.org) [1], John Sidney (jsidney@liai.org) [1], John Mokili (jmokili@liai.org) [1], Stephen Wilson S (swilson@liai.org) [1], Ward Fleri (wfleri@liai.org) [1], Deborah L McGuinness (dlm @ Ksl.stanford.edu) [2], Philip E Bourne (bourne@sdsc.edu) [3], Alessandro Sette (alex@liai.org) [1]
[1] La Jolla Instituto de Alergia e Inmunología, 3030 Bunker Hill Street, Suite 326, San Diego, California, 92109, EE.UU.
[2] Knowledge Systems, Artificial Intelligence Laboratory, Stanford University and McGuinness Associates, Stanford, CA 94305, USA
[3] San Diego Supercomputer Center, PO Box 85608, San Diego, California 92186-5608, EE.UU.

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

Epítopos puede definirse como las estructuras moleculares obligado por receptores específicos, que son reconocidos durante la respuesta inmune. El Inmune Epitope base de datos y análisis de recursos (IEDB) proyecto de catálogo y organizar la información relativa a los anticuerpos y de células T epítopes de los agentes patógenos infecciosos, antígenos experimental y de la libre antígenos, con una prioridad en NIAID Categoría AC patógenos (http://www2.niaid. Nih.gov / Biodefense / bandc_priority.htm] y emergentes / re-emergentes enfermedades infecciosas. Ambos intrínsecas características estructurales y filogenéticos, así como la información relativa a las interacciones de los epítopes con el sistema inmunológico del anfitrión será catalogado.

Descripción

Para representar y comunicar la información relacionada con epítopos inmune, una ontología formal se desarrolló. La semántica de la epítopo dominio y conceptos relacionados fueron capturados como una jerarquía de clases, que representan a los generales y especializados de las relaciones entre los diversos conceptos. Una lista completa de las clases y sus propiedades se puede encontrar en la http://www.immuneepitope.org/ontology/index.html.

Conclusión

El IEDB la ontología es la primera ontología específicamente diseñado para captar tanto intrínseco químicas y bioquímicas información relativa a la inmunidad epítopos con información relativa a la interacción de estos con las estructuras de las moléculas derivadas de la acogida del sistema inmunológico. Prevemos que el desarrollo de este tipo de ontología y de las bases de datos facilitará la descripción rigurosa de los datos relacionados con epítopos inmune, y en última instancia podría conducir a métodos completamente nuevos para la descripción y el modelado de la respuesta inmune.

Antecedentes

Un epítopo se puede definir como la estructura molecular reconocido por los productos de la respuesta inmune. Según esta definición, son los epítopos específicos entidades moleculares que participan en la unión de anticuerpos a moléculas o receptores de las células T específicas. Una ampliación de la definición también incluye las moléculas obligatorio en el péptido MHC sitios de unión de los receptores. Hemos descrito anteriormente [1], el diseño general de la Inmunodeficiencia Epitope Base de datos y análisis de recursos (IEDB), un amplio programa puesto en marcha recientemente por el Instituto Nacional de Alergias y Enfermedades Infecciosas (NIAID). El objetivo general de la IEDB es catalogar y organizar una gran masa de información con respecto a los anticuerpos y de células T epítopos infecciosas de los patógenos y otras fuentes [2]. Se dará prioridad a NIAID Categoría AC patógenos (http://www2.niaid.nih.gov/Biodefense/bandc_priority.htm] y emergentes / re-emergentes enfermedades infecciosas. Epítopos de humanos y primates no humanos, roedores, y otras especies para las que se dispone de información detallada se incluirá. Se prevé que este nuevo esfuerzo catalizar el desarrollo de nuevos métodos y modelos para predecir la respuesta inmune, se ayuda en el descubrimiento y desarrollo de nuevas vacunas y diagnósticos, y ayudará en las investigaciones de base inmunológica.

El catálogo se IEDB estructurales y filogenética información acerca de epítopes, la información acerca de su capacidad para unirse a receptores específicos (es decir, MHC, TCR, BCR, anticuerpos), así como el tipo de respuesta inmune observada después de la participación de los receptores (RFP-NIH - NIAID-DAIT-03/31: http://www.niaid.nih.gov/contract/archive/rfp0331.pdf].

En términos generales, la base de datos contendrá dos categorías generales de los datos y la información asociada a epitopos inmune - intrínsecos y extrínsecos (dependientes de contexto de datos). Características intrínsecas de un epitopo son las características que pueden ser definidas de manera inequívoca y que se especifican en el epítopo secuencia / estructura propia. Ejemplos de las características intrínsecas son epítopo la secuencia, características estructurales, vinculantes y las interacciones con otras moléculas del sistema inmune. Describir una respuesta inmune asociada a un determinado epítopo, contexto la información también debe ser tenido en cuenta. Contenidos de información incluye, por ejemplo, la especie de anfitrión, la ruta y la dosis de la inmunización, la salud y la condición genética de la acogida, y la presencia de los adyuvantes. En este sentido, la IEDB proyecto trasciende los estrictos límites de la creación de bases de datos y llega a una solicitud de la biología de sistemas, tratando por primera vez para integrar la información estructural sobre epítopos con amplios detalles la descripción de su compleja interacción con el sistema inmunológico del huésped, ya sea Infectadas, o una vacuna contra el organismo receptor [1 - 3].

Por estas razones, es evidente desde el principio del proyecto, que es fundamental para desarrollar un riguroso marco conceptual para representar los conocimientos relacionados con los epítopos. Dicho marco fue clave para el intercambio de información e ideas entre los desarrolladores, científicos y usuarios potenciales, y para permitir el diseño de una estructura lógica y eficaz de la propia base de datos. En consecuencia, decidimos desarrollar una ontología formal. A través de los años, el término "ontología" se ha definido y utilizado en muchos sentidos por la comunidad de ingeniería del conocimiento [4]. Vamos a adoptar la definición de "ontología" como "la explícita formal especificaciones de los términos de un dominio y las relaciones entre ellos" [5]. Según Noy y McGuinness [6], "ontología define un vocabulario común para los investigadores que necesiten compartir información de un dominio y ayuda a separar los conocimientos de dominio de conocimientos sobre las operaciones". Así, la disponibilidad de una ontología formal es relevante en el diseño de una base de datos, en la catalogación de la información, en la comunicación de la estructura de base de datos a los investigadores, desarrolladores y usuarios, y en la integración de múltiples diseños de esquema de base de datos y aplicaciones.

Varios catálogo de las bases de datos existentes epítopo datos relacionados. Agradecemos que se haya podido utilizar estas experiencias anteriores en el diseño y aplicación de la IEDB. MHCPEP [7], SYFPEITHI [8], [9] FIMM, ligando base de datos de HLA [10], el VIH Inmunología Base de datos [11], JenPep [12], AntiJen [13], y MHCBN [14] están todos a disposición del público relacionadas con el epítopo Bases de datos. En general, estas bases de datos que proporcione información relacionada con epítopes, pero no en el catálogo general a la información relativa a sus interacciones con el sistema inmunológico del anfitrión. Asimismo, cabe señalar que ninguna de estas bases de datos ha publicado una ontología formal, pero todos ellos se basan en informal o implícita de ontologías. Hemos tenido en cuenta la medida de lo posible estas ontologías, inferir su estructura de comunicaciones oficiosas con los desarrolladores de base de datos o bases de datos de lectura de los sitios web.

La ontología desarrollada para IEDB y descritos en el presente documento complementa dos ontologías explícitas de que se dispone actualmente son: la IMGT-Ontología y la Ontología de Genes (GO). El IMGT-Ontología [15] fue creado para la base de datos internacional ImMunoGeneTics (IMGT), que es una base de datos integrada, especializada en los receptores de antígeno (inmunoglobulina y los receptores de células T) y las moléculas MHC de todas las especies de vertebrados. Este es, a nuestro mejor saber, la primera ontología en el ámbito de la inmunogenética y inmunoinformática. El proyecto GO [16] proporciona estructurado, vocabularios controlados que abarcan varios ámbitos de la biología molecular y celular. GO ofrece un marco excelente para los genes, productos de genes, y sus secuencias, pero no atender a las especiales epítopo subestructura de los productos genéticos. El IMGT proporciona un excelente marco para la ontológica inmune, pero carece de los receptores de la información relativa a los epítopos propios. Por lo tanto es necesario ampliar la disponibilidad y ontologías para crear una ontología específicamente diseñado para representar la información de la interacción con los receptores inmunes inmune epítopos. Siempre que sea posible, la ontología IEDB norma se ajusta a los vocabularios para la captura de los valores de determinados campos. Para capturar nombres de las enfermedades, IEDB utiliza la Clasificación Internacional de Enfermedades (CIE-10) [17]. La base de datos NCBI Taxonomía nomenclatura [18, 19] se utiliza para la captura de especies y cepa nombres, y los nombres de Allele HLA son compatibles con el HLA nomenclatura de los informes [20].

Construcción y Contenido

El IEDB está siendo desarrollado como una red accesible base de datos utilizando Oracle 10g Enterprise y Java (J2EE). Estándar de la industria de diseño de software que se ha seguido y se espera que IEDB estará disponible para los usuarios públicos a finales de 2005.

Protégé http://protege.stanford.edu se utilizó para el diseño y el documento IEDB ontología. Protégé es un país libre, de código abierto y la ontología editor de base de conocimientos marco, escrito en Java. Proporciona un entorno para la creación de ontologías y los términos utilizados en los ontologías. Protégé apoya la clase, la ranura, y ejemplo de creación, lo que permite a los usuarios especificar las relaciones entre las entidades apropiadas. Dos características que IEDB ontología esfuerzo Protégé se utiliza ampliamente el apoyo de la creación de la ontología y de los términos para ver el término jerarquías y las definiciones. El apoyo a una central de información sobre ontologías, junto con el apoyo a la navegación, es clave en la revisión y reutilización de ontologías.

Si bien existen varias herramientas de código abierto disponible [21] para el desarrollo de ontologías, se seleccionaron Protégé por su extensibilidad a una variedad de plug-ins que se pueden conseguir fácilmente de la integración. También tiene la capacidad de exportar a diferentes formatos, como la Ontología Web Language (OWL) (http://www.w3.org/TR/owl-features/], que permite la interoperabilidad con otras ontologías.

Hemos descrito anteriormente algunos de los conceptos generales relacionados con el diseño IEDB [1, 2]. Más información sobre diversos aspectos del proyecto se puede acceder a http://www.immuneepitope.org/. Presentamos una descripción detallada de los aspectos más novedosos de la IEDB ontología. En el diseño de la arquitectura de nuestra aplicación, hemos seguido el régimen común de la práctica de la ingeniería de primera determinar el alcance y la naturaleza de los datos en cuestión. Un primer paso fundamental es entender la semántica del dominio y que el conocimiento de capturar en un formato acordado. Organizar los conceptos en el dominio de una taxonomía es uno de los primeros pasos en la organización de la ontología proceso de diseño. La jerarquía representa a la clase a la generalización y la especialización relaciones entre las diferentes clases de objetos en un dominio [6]. En pocas palabras, las clases describen los conceptos en el dominio. Subclases representan conceptos (clases) que son más específicos que la superclase y subclases estos pueden tener sus propias propiedades únicas. Ranuras representar propiedades de las clases. Por ejemplo, en la Figura 1, vemos que hay una clase llamada de referencia más específicos y tres subclases de Referencia: Diario artículo, la solicitud de patente, y la presentación directa. La Figura 1 muestra también que la clase Epitope tiene una serie de propiedades (slots) asociados a ella, como "ha Epitope Estructura" y "ha Epitope Origen".

La Ontología IEDB: Referencia, Epitope Estructura, Epitope Fuente, y el ensayo de Información clases

Nuestro enfoque para la creación de la clase era una jerarquía de arriba abajo proceso de desarrollo en el que cada clase definida en un dominio y, a continuación, identificaron sus propiedades antes de la construcción de la jerarquía. Las principales clases de IEDB identificado son de referencia, Epitope Estructura, Epitope Fuente, MHC de encuadernación, transformados ligando Naturalmente, la respuesta de células T, y la respuesta de células B (Figura 1]. Epitope La clase es la clase principal que abarca todos los conceptos individuales que se identificaron. El individuo conceptos están relacionados con otras clases. El principal uso de las relaciones de la sub-clase de relación o el uso de una propiedad (que se muestra en las cifras de los arcos etiquetados "ha"), que cuenta con una restricción en el tipo de valor que pueden llenar ese slot.

"Referencia" es la clase que abarque la información relativa a la fuente de datos desde la cual un epítopo y su información se extraen en la IEDB. Hemos identificado tres grandes subclases de las referencias que describen epítopo donde se obtendrá información. Son Diario artículo, la solicitud de patente, y la presentación directa. La lista completa de las franjas horarias (campos) que abarca el Diario artículo, la solicitud de patente, y de envío de las clases se ofrecen en la figura 2. Diario El artículo se refiere a la clase manuscritos publicados en revistas revisadas por pares. La solicitud de patente clase captura todos los campos de referencia para una solicitud de patente que contienen información epítopo. La captura de envío de información acerca de la clase de fuentes de datos que contribuyen directamente a la IEDB. Los datos depositados por la gran escala de anticuerpos y de células T Epitope Discovery contratos [3] y los transferidos de otros sitios web caen en esta clase.

El Epitope Estructura y Epitope Fuente clases capturar características intrínsecas de un epitopo. El Epitope clase captura la estructura física y las características químicas de un epitopo. Prácticamente toda la estructura molecular puede provocar una respuesta inmune, tales como proteínas, carbohidratos, ADN y lípidos. En la clase de estructura Epitope, estructurales información relativa a las secuencias lineales y 2-D de las estructuras epítopo, si están disponibles, son catalogados. El Epitope Origen clase captura la filogenética fuente de un epitopo, incluyendo las especies de origen, el nombre de genes, proteínas nombre, y enlaces a otras bases de datos para obtener más información detallada acerca de las proteínas y genes. Figuras 3A y 3B mostrar los listados de propiedades (slots o los campos), que abarca el Epitope Estructura y Epitope Fuente clases.

Los datos experimentales y la información específica acerca de los experimentos y la metodología utilizados se recogen en el ensayo de Información de clase. El nombre del ensayo utilizado, el tipo de respuesta medida en el ensayo, y la lectura del ensayo son ejemplos de la información captada en el ensayo de Información de clase. Este importante clase se utiliza como una superclase de otras clases (y, por tanto, sus propiedades son heredadas por las clases). Una lista completa de las propiedades (las franjas horarias o los campos) en el ensayo de Información de clase se muestra en la Figura 3C.

Inmunización, antígeno, y la presentación de antígeno de células de clases

Al igual que con la información de ensayo, las clases de Inmunización, antígeno, y la presentación de antígeno de células se utilizan en múltiples otras descripciones de los cursos. Características relativas a la inducción de la respuesta inmune son capturados en la clase de Inmunización (Figura 4A]. Tiene relaciones con otras clases de especies como inmunizados, Immunogen, in vivo Inmunización, in vitro y la Inmunización. Especies inmunizados contiene información relativa a la acogida que se está inmunizado. El Immunogen describe la clase de moléculas que inducen la respuesta inmune y una molécula asociada transportista, si está presente. Características relativas a la forma en que el inmunógeno fue presentado a la inmunizados especies son capturadas en el marco del in vivo e in vitro de Inmunización clases.

Del mismo modo, los antígenos se definen como el conjunto de moléculas que reaccionan con los productos de una respuesta inmune (a diferencia de los epítopos que son las estructuras específicas, que figuran en el antígeno que se dedica inmunológico del receptor). Información relativa al antígeno asociado y cualquier molécula portadora es capturado en el antígeno de clase (Figura 4B]. Durante la respuesta inmune, células presentadoras de antígeno proceso de antígenos y epítopes presentes péptido complejos con moléculas MHC. Esta información se captura en el antígeno Células Presentadoras de clase, que tiene una relación con el moléculas MHC y la Fuente de Especies clases (Figura 4C]. El Origen de especies se describe la clase de información sobre especies a partir de la cual las células que presentan el antígeno se derivan.

Museal vinculante, ligando procesado naturalmente, la respuesta de células T, y la respuesta de las clases de células B

El MHC clase de encuadernación capta los detalles relativos a la interacción de la epítopo específico con moléculas MHC y la información relativa a la molécula MHC junto con cualquier disposición Epitope-MHC compleja estructura detalles. Esta clase también cuenta con una ranura que se limita a ser una instancia de la clase de información de ensayo (Figura 5A].

Características extrínsecas de un epitopo son capturados por supuesto transformados ligando, de células T de respuesta, y la respuesta de las clases B Cell. Características extrínsecas son dependientes de contexto atributos, que se concreta depende de las condiciones experimentales. El supuesto transformados ligando clase captura de datos relacionados con epítopos que son naturalmente procesados y presentados en la superficie celular. Esta clase tiene propiedades que son instancias de clases incluyendo Antigen Presenting Cell, Antigen, de ensayo y de la Información (Figura 5B].

El supuesto transformados ligando clase difiere de la de MHC clase de encuadernación en que la información relacionada con el antígeno que se procesan los tipos de células y en el que se produjo la transformación está representada. Encuadernación MHC clase de datos relativos a las capturas in vitro MHC pruebas aglutinantes, que evaluará la capacidad vinculante del epítopo a la molécula MHC. De ahí la MHC clase no vinculante ni exige la clase no el antígeno Antígeno Células Presentadoras de clase. En general, naturalmente procesados ligandos se evalúan en la ausencia de una respuesta de células T, por ejemplo, determinadas por elución directa de las moléculas MHC extraído de las células infectadas o células presentadoras de antígenos. Por lo tanto, la inmunización de clase no se utiliza como un valor de restricción por el supuesto transformados ligando clase.

La respuesta de células T captura toda clase de la inmunidad mediada por células T relacionados con la información (Figura 6A]. Tiene propiedades que son de tipo: Inmunización, Effector Células, Antigen Presenting Cell, Antigen, de ensayo de Información, y Epitope-MHC-TCR Complejo. El Effector Cell describe la clase de células que se suscitó a la inmunización y mensurables que adquirir funciones como resultado. La respuesta de la clase B Cell describe respuestas de anticuerpos que están relacionadas con el epítopo (Figura 6B]. Esta clase tiene propiedades que son de tipo: Inmunización, Antibody molécula, Antigen, de ensayo de Información, y Antigen-Antibody Complex. Porque las respuestas de células B no requieren de MHC vinculante y células presentadoras de antígenos, las respectivas clases relacionadas a la molécula MHC y el antígeno Células Presentadoras no se utilicen como restricciones de propiedades de la clase B de células de Respuesta.

Clases de la captura de estructuras 3D

Hay tres clases que captura la información sobre la estructura 3D de complejos: Epitope-Complejo MHC, Epitope-Complejo MHC-TCR, y complejos antígeno-anticuerpo. El Epitope-Complejo MHC, Epitope-Complejo MHC-TCR, y complejos antígeno-anticuerpo clases se utilizan como restricciones de propiedades de la Encuadernación de MHC, de células T de respuesta, y la respuesta de las clases de células B, respectivamente (Figuras 5A, 6A y 6B]. Estas clases Complejo capturar el Banco de Datos de Proteínas (AP) Identifier, que proporciona información detallada sobre las estructuras 3D. El Protein Data Bank [22, 23] contiene aproximadamente 1600 3D de las estructuras que son de interés inmunológico. Otra información que no está disponible en AP, como el átomo de pares que intervienen en las interacciones entre las moléculas, los residuos específicos, el área de contacto de las moléculas, y allosteric efecto, aquí también es capturado.

IEDB jerarquía de las clases y el diccionario de datos

Cada clase tiene numerosas ranuras que captura información detallada asociada a epítopes. Como se ha mencionado anteriormente, una lista completa de todas las clases, sus propiedades, y la relación, se puede encontrar en la http://www.immuneepitope.org/ontology/index.html. Uno de los archivos proporcionados como material suplementario contiene dos ejemplos de cómo dos referencias de la literatura [24, 25] que contiene información epítopo se extraen en la IEDB ontología (ficheros adicionales 1]. Junto con la clase de jerarquía, la IEDB del diccionario de datos (ficheros adicionales 2] proporciona información más detallada acerca de los campos que se definen para la IEDB. El diccionario de datos contiene una descripción textual visión general y una lista de campos que se requieren para ser completada para IEDB entradas. El diccionario de datos también permite a los usuarios de bases de datos para ofrecer comentarios y sugerencias al equipo de IEDB para mejorar la ontología formal.

Utilidad y Discusión

El IEDB será una fuente completa de información relativas a epítopos del sistema inmunológico. Ampliamente tanto por la curaduría intrínseca y extrínseca características asociadas con epítopes, la IEDB se espera que proporcione sustancialmente mayor detalle acerca de los epítopos que cualquier otra base de datos disponible actualmente. El IEDB se completan con los datos provenientes de tres fuentes principales, a saber, el objeto de revisión inter pares, las solicitudes de patentes, y la presentación directa. Epítopo datos publicados en la literatura y las solicitudes de patentes se comisariada IEDB manualmente por el equipo de la curación. Los datos de las bases de datos ya existentes epítopo, cuyos autores se han puesto de acuerdo para compartir sus datos, también será importado en la IEDB. Aparte de estas, la principal fuente de datos será la presentación directa de los datos de la gran escala de anticuerpos y de células T Epitope Discovery programas [3] que son financiados por el NIAID. Actualmente, catorce contratos se han adjudicado en el marco de este programa, y todos ellos presentarán sus datos a la IEDB. Directo de anticuerpos y de células T epítopo presentaciones también se solicitará a la más amplia comunidad de investigación, con énfasis en los anticuerpos a epítopes NIAID Categoría AC patógenos. Debido a la gran escala de la IEDB proyecto, una ontología formal es fundamental para garantizar la coherencia en la representación de los datos.

La comunicación entre los desarrolladores de base de datos, los investigadores, la herramienta de análisis de los desarrolladores, y los miembros del equipo es fundamental, y se puede realizar sólo en la armonía de un lenguaje común cuando se establezca. Una ontología, que es una especificación formal explícita de los términos en el dominio y las relaciones entre ellos, es una forma eficaz de compartir el conocimiento que figura en el dominio. En consecuencia, dado que el dominio de IEDB es epítopo relacionados con los datos, hemos creado una ontología que captura detallados relacionados con la estructura conceptual de estos datos.

El desarrollo de esta ontología tiene relevancia para la ampliación y modificación de la base de conocimientos epítopo. Nuestro diseño ontología define los conceptos individuales como clases separadas y, a continuación, se definen las relaciones entre esas clases y otros objetos en el dominio. Estas clases sirven para restringir los valores que se describen las propiedades de los objetos en la base de datos. Por ejemplo, la especie es un concepto definido en el de su propia clase. Según el contexto, puede referirse a una especie o vacunados de las especies de células presentadoras de antígenos que se derivan. Las moléculas MHC mismo modo se define como una clase separada, y se utiliza como un valor de las restricciones a través de conceptos como el de encuadernación y MHC Antigen Células Presentadoras. La definición de conceptos como clases separadas y utilizarlas para restringir los valores de las propiedades en otras clases facilita la expansión y la modificación de nuestra ontología. Añadiendo propiedades (slots) a los conceptos es una tarea fácil de lograr cuando hay bien definidos descripciones de los cursos que pueden servir como valor de las restricciones sobre las propiedades, y siempre que estas descripciones de los cursos son lo suficientemente generales como para aplicarse en todos los casos. Nos han asegurado que en nuestro diseño cada concepto es atómica y que se puede volver a utilizarse de diversas clases.

El desarrollo de una ontología formal es de valor para la base de datos de los usuarios y en particular a los científicos que contribuyen a los datos, y descargar los datos del, la IEDB. Prevemos que la disponibilidad de una ontología formal se asegurará de que una lengua común y compartida de los conceptos inspire este tipo de comunicación, de manera que se logre la máxima eficacia y precisión. La ontología formal desarrollado más probable es que se requieren refinamiento y ajustes para proporcionar sugerencias cuando los usuarios y las nuevas tecnologías para realizar experimentos se descubren. El IEDB sitio web se ofrece a los usuarios los mecanismos para presentar propuestas y participar en el mejoramiento de la ontología. El IEDB Diccionario de datos tiene una columna separada para los usuarios a proporcionar comentarios sobre los campos de datos. IEDB El sitio web también será anfitrión formularios web que servirá de guía a los usuarios conforme a la ontología definiciones momento de la presentación de los datos. Aparte de los formularios web, una definición de esquema XML (XSD) estará disponible en la web para los usuarios de inspeccionar y usar sus datos en la presentación. Los usuarios también podrán descargar epítopo registros de la página web.

En el proceso de desarrollo de nuevas ontologías, es una buena práctica de aprovechar las normas de la comunidad. En nuestro análisis inicial, que confirmó que no había explícita ontologías que eficientemente capturados epítopo detalles como por el alcance de la IEDB programa. Como se mencionó anteriormente, que hemos utilizado, en lo posible, ontologías inferirse de las bases de datos existentes epítopo. Entre las ontologías que hemos analizado, IMGT-Ontología Ontología Genética y fueron los únicos dos ontologías formales que se relacionan con el epítopo de dominio. El IMGT-Ontología fue diseñado para la ImMunoGeneTics base de datos. IMGT es una base de datos integrada, especializada en los receptores de antígeno (inmunoglobulinas y los receptores de células T) y el complejo principal de histocompatibilidad de todas las especies de vertebrados. La ontología desarrollada para esta base de datos ha inmunológicos específicos contenidos, la descripción de la clasificación y especificación de los términos necesarios para la inmunogenética. El IEDB no se ajustan a las normas del IMGT sobre los receptores y las cadenas de la molécula MHC, en el sentido de que todos los nombres de la cadena de seguir IMGT del vocabulario controlado.

GO ofrece estructurado vocabularios controlados a los genes, productos de genes, y secuencias anotado para muchos organismos. El IEDB GO complementa en términos de epítopes de interés desde inmunológicos GO es incompleta en este ámbito. Antígenos, que son fuentes primarias de epítopes, son anotados en GO. Así pues, en esencia, la IEDB podrían utilizarse para proporcionar una extensión de GO para antígenos que contienen información relacionada con el epitopo.

Conclusión

Tal vez el elemento más importante en el desarrollo de la ontología IEDB es que, a lo mejor de nuestro conocimiento, se trata de la primera ontología inmunológico específicamente diseñado para captar tanto intrínseca y extrínseca bioquímica de la información dependientes del contexto. En este sentido, es similar en su espíritu, pero diferentes en el enfoque, el conocimiento de otros recursos relacionados con la biología de sistemas. Prevemos que el desarrollo de este tipo de ontología y de las bases de datos podría llevar a completamente nuevos métodos para la descripción y el modelado de la respuesta inmune. En consecuencia, este nuevo programa podría representar una nueva herramienta para ayudar en el diseño, las pruebas y el desarrollo de nuevas formas de luchar contra las enfermedades infecciosas y otras patologías relacionadas inmune, como el cáncer y las enfermedades autoinmunes.

Disponibilidad

Una lista completa de la clase de IEDB jerarquía y sus propiedades está disponible en http://www.immuneepitope.org/ontology/index.html

Lista de abreviaturas utilizadas

IEDB - inmune epítopo base de datos y el análisis de recursos

MHC - Complejo Mayor de Histocompatibilidad

TCR - receptor de células T

BCR - receptor de células B

IMGT - inmunogenética base de datos

GO - gen ontología

J2EE - Java 2 Enterprise Edition

Búho - ontología Idioma de la web

AP - banco de datos de proteínas

NIAID - Instituto Nacional de Alergias y Enfermedades Infecciosas

XML - lenguaje extensible de marcado

XSD - definición de esquema XML

Contribuciones de los autores

MS generado la ontología formal utilizando Protégé. MS, BP, HB, JS, y la AS diseñado inicial ontología. SW, JM, WF, DM, PB siempre crítico en el aumento de la inicial de diseño y creación de la ontología formal. Todos los autores participaron en la preparación del manuscrito.

Material suplementario
Archivo Adicional 1
Muestra Curation. Este archivo contiene una tabla que muestra cómo epítopo y su información se extrae de una literatura de referencia asignada en la IEDB ontología.
Archivo Adicional 2
IEDB Diccionario de datos v12-5. El diccionario de datos contiene la descripción textual visión general y una lista de campos que se capturan para IEDB.
Agradecimientos

Esta labor fue apoyada por los Institutos Nacionales de Salud de contrato HHSN26620040006C. Los autores agradecer a Bette Korber, Marie-Paule LeFranc, William Hildebrand, Vladimir Brusic, Anne De Groot, Darren Flor, Pam Surko, Scott Stewart, Scott Way y útil para el debate. Los autores también dar las gracias a Alison Deckhut de revisión crítica del manuscrito.