Immunome Research, 2005; 1: 3-3 (más artículos en esta revista)

IMGT, el sistema de información internacional ImMunoGeneTics ®: un enfoque normalizado para la inmunogenética y inmunoinformática

BioMed Central
Marie-Paule Lefranc (lefranc@ligm.igh.cnrs.fr) [1]
[1], la Universidad de Montpellier II, Instituto Universitario de Francia, Laboratoire d'ImmunoGénétique Moléculaire LIGM, UPR CNRS 1142, Institut de Génétique Humaine IGH, 141 rue de la Cardonille, 34396 Montpellier Cedex 5, Francia

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen

IMGT, el sistema de información internacional ImMunoGeneTics ® Http://imgt.cines.fr, fue creado en 1989 por la Laboratoire d'ImmunoGénétique Moléculaire (LIGM) (Universidad de Montpellier II y CNRS) de Montpellier, Francia. IMGT es un conocimiento de alta calidad integrado de recursos especializados en las inmunoglobulinas (IG), receptores de las células T (TR), el complejo principal de histocompatibilidad (MHC) de los humanos y otros vertebrados, y de las proteínas relacionadas con el sistema inmune (RPI), de cualquier especie a la que pertenecen La superfamilia de inmunoglobulinas (IgSF) y a la superfamilia de MHC (MhcSF). IMGT consta de cinco bases de datos, diez de herramientas en línea y más de 8000 páginas HTML de la Web. IMGT establece un régimen común de acceso a la normalización de los datos de genoma, genética, proteoma y tridimensional de las estructuras. La precisión y la coherencia de IMGT datos se basan en IMGT-ONTOLOGY, una especificación semántica de los términos que se utilizarán en inmunogenética y inmunoinformática. IMGT-ONTOLOGY comprende seis grandes conceptos: IDENTIFICACIÓN , CLASIFICACIÓN , DESCRIPCIÓN , NUMEROTATION , ORIENTACIÓN Y OBTENCIÓN . Sobre la base de estos conceptos, el vocabulario controlado y la anotación normas necesarias para la inmunogenética de datos de identificación, clasificación, descripción y numeración y de la gestión de los conocimientos IMGT se definen en la IMGT Ciencia gráfico . IMGT es la referencia internacional en inmunogenética y inmunoinformática para la investigación médica (repertorio análisis de la IG sitios de anticuerpos y de la TR sitios en el reconocimiento autoinmunes y las enfermedades infecciosas, el SIDA, las leucemias, los linfomas, myelomas), de investigación veterinaria (TR IG y repertorios en la granja Y especies de la vida silvestre), el genoma de la diversidad y la evolución del genoma estudios de la respuesta inmune adaptativa, la biotecnología relacionada con la ingeniería de anticuerpos (Fragmento variable sola cadena (scFv), fago muestra, combinatoria bibliotecas, quimérico, humanizada y de los anticuerpos humanos), el diagnóstico (detección y Seguimiento de los residuos de enfermedades) y los enfoques terapéuticos (injertos, la inmunoterapia, vacunas). IMGT está disponible gratuitamente en http://imgt.cines.fr.

Introducción

IMGT, el sistema de información internacional ImMunoGeneTics ® Http://imgt.cines.fr [1 2 1989, por Marie-Paule Lefranc , En la Laboratoire d'ImmunoGénétique Moléculaire (LIGM) (Universidad de Montpellier II y CNRS) de Montpellier, Francia, con el fin de uniformar y manejar la complejidad de la inmunogenética de datos. Quince años más tarde, IMGT es la referencia internacional en inmunogenética y inmunoinformática, y proporciona un conocimiento de alta calidad integrado de recursos, especializado en la Inmunoglobulinas (IG) Y Receptores de las células T (TR) , El complejo principal de histocompatibilidad ( MHC ), De humanos y otros vertebrados, y de las proteínas relacionadas con el sistema inmunológico ( RPI ), De cualquier especie a la que pertenecen Inmunoglobulina superfamilia (IgSF) Y a la MHC superfamilia (MhcSF) [3 - 13]. El número de posibles formas de la proteína de los receptores de antígeno, IG Y TR , Es casi ilimitada. El repertorio de posibilidades de cada individuo se calcula que alrededor del 10 12 diferentes IG (o anticuerpos) y TR, y el único factor limitante es el número de células T y B, que es un organismo genéticamente programadas para producir. Esta enorme diversidad es inherente a la compleja y singular Síntesis molecular De la genética y el antígeno del receptor de las cadenas. Esto incluye mecanismos biológicos tales como reordenamientos moleculares de ADN en múltiples loci (tres y cuatro para el IG de TR en los seres humanos) que se encuentran en diferentes cromosomas (cuatro en humanos), las inserciones y deleciones de nucleótidos en la reordenación cruces (o N-diversidad), y somáticos Hypermutations en los loci IG (véase FactsBooks [3, 4] para su revisión). Aunque IMGT fue aplicado inicialmente para el IG, TR y MHC de humanos y otros vertebrados [6], los datos y la normalización de la gestión de los conocimientos, basada en la numeración única IMGT [14 - 19], se ha ampliado ahora a la IgSF [15 - 17 , 20 - 22] y MhcSF [18, 23, 24], de cualquier especie. Por lo tanto, la normalización de datos IMGT contribuido a la mejora del sistema y los nuevos conceptos de datos expertos se incorporan fácilmente.

IMGT, el sistema de información internacional ImMunoGeneTics ® Consta de cinco bases de datos, diez en línea, herramientas y recursos de la web [1, 2]. Las bases de datos incluyen las bases de datos de secuencias (IMGT / LIGM-DB, IMGT / PRIMER-PP y IMGT / MHC-PP), una base de datos del genoma (IMGT / GENE-PP) y uno en tres dimensiones (3D), estructura de base de datos (IMGT/3Dstructure-DB ) [1, 2] (Figura 1]. Se proporcionan herramientas interactivas para análisis de secuencias (IMGT / V-QUEST, IMGT / JunctionAnalysis, IMGT / Allele-Alinear, IMGT / PhyloGene), el análisis del genoma (IMGT / LocusView, IMGT / GeneView, IMGT / GeneSearch, IMGT / CloneSearch y IMGT / GeneInfo) 3D y análisis de la estructura de (IMGT / StructuralQuery) [1, 2] (Figura 1]. Recursos Web ( "IMGT Marie-Paule página"), integrada por más de 8000 páginas HTML de síntesis [IMGT Repertorio (por IG y TR, MHC, RPI)], el conocimiento [IMGT gráfico de la Ciencia, la Educación IMGT (IMGT Lexique, Aide-memoire Cursos de aprendizaje, preguntas y respuestas), IMGT Medical página, IMGT Veterinaria de la página, la página IMGT Biotecnología, IMGT Index], y los enlaces externos [IMGT Immunoinformatics página, IMGT Bloc-notes (Enlaces de interés, etc) y otros accesos IMGT (SRS, BLAST, etc)] [2]. A pesar de la heterogeneidad de los diferentes componentes, todos los datos en el sistema de información son IMGT experta anotada. La precisión, la coherencia y la integración de la IMGT de datos, así como la coherencia entre los diferentes componentes IMGT (bases de datos, herramientas y recursos de la web) se basan en IMGT-ONTOLOGY [5], que ofrece una especificación semántica de los términos que se utilizarán en inmunogenética y inmunoinformática. IMGT-ONTOLOGY, la primera en la ontología de dominio, ha permitido que la gestión de los conocimientos en inmunogenética [2, 25] y facilitó la normalización de los datos de inmunogenética genoma, la genética, proteoma y 3D de las estructuras [3 - 13]. IMGT-ONTOLOGY conceptos están disponibles, para los biólogos y IMGT usuarios, en el IMGT Ciencia gráfico [2], y los científicos de la computación, en IMGT-ML Que utiliza XML (eXtensible Markup Language) Schema [26].

IMGT-ONTOLOGY conceptos y normas IMGT Ciencia gráfico

El IMGT Ciencia gráfico [2] comprende el vocabulario controlado y la anotación normas necesarias para la inmunogenética de datos de identificación, descripción, clasificación y numeración y para la gestión del conocimiento en el sistema de información IMGT. Normalización de las palabras clave, etiquetas y normas de anotación, y la normalización de IG TR nomenclatura genética, la única IMGT numeración, y la normalización de origen / metodología se definieron, respectivamente, sobre la base de los seis principales conceptos de IMGT-ONTOLOGY: IDENTIFICACIÓN , CLASIFICACIÓN , DESCRIPCIÓN , NUMEROTATION , ORIENTACIÓN Y OBTENCIÓN [2, 5] (Tabla 1]. El IMGT Ciencia gráfico está disponible como una sección de la web de los recursos IMGT ( IMGT Marie-Paule página ). Ejemplos de expertos IMGT datos conceptos derivados de las normas IMGT Ciencia gráfico se muestran en la Tabla 1.

El gráfico de la Ciencia IMGT normas, sobre la base de la IMGT-ONTOLOGY conceptos [5], se utilizan en las tres principales enfoques IMGT biológicas, genómica, la genética y los enfoques estructurales [2], y los datos correspondientes (genes, secuencias, estructuras 3D) están disponibles En el IMGT componentes (bases de datos, herramientas y recursos de la web) [1, 7 - 13].

IMGT secuencia de las bases de datos, herramientas y recursos de la web

IMGT secuencia de las bases de datos, herramientas y recursos de la web corresponden a la genética IMGT enfoque que se refiere al estudio de los genes en relación con sus polimorfismos, mutaciones, de expresión, la especificidad y la evolución (Tabla 2]. La secuencia IMGT gestión de los conocimientos y la genética IMGT enfoque fuertemente confiar en la DESCRIPCIÓN concepto (y, en particular, en la V Región-, D-REGION, J-REGION y C-REGION conceptos básicos de la IG y TR), sobre el concepto CLASIFICACIÓN ( Gen y alelo conceptos), y sobre el concepto NUMEROTATION (IMGT única numeración [14 - 18]].

IMGT gen bases de datos, herramientas y recursos de la web

IMGT gen bases de datos, herramientas y recursos de la web corresponden a la genómica IMGT enfoque que se refiere a los estudios de los genes dentro de sus lugares y de sus cromosomas [2] (Tabla 3].

IMGT estructura de la base de datos, herramientas y recursos de la web

El IMGT enfoque estructural se refiere al estudio de las estructuras 2D y 3D de la IG, TR, MHC y RPI, y para el antígeno o ligando características vinculantes en relación con las funciones de la proteína, los polimorfismos y la evolución (Tabla 4]. El enfoque estructural se basa en el concepto CLASIFICACIÓN (IMGT gen y alelo nombres), DESCRIPCIÓN concepto (y del receptor de la cadena de descripción, delimitación de dominio), y NUMEROTATION concepto (aminoácidos posiciones de acuerdo con la numeración única IMGT [14 - 18]].

Dominios estructurales y funcionales de la IG y TR cadenas comprenden la variable de dominio o V-DOMINIO (capítulo 9-beta-sandwich), que se corresponde con el ejército yugoslavo o VDJ-REGION-REGION y está codificado por los genes de dos o tres [3, 4] , La constante de dominio o C-DOMINIO (capítulo 7-beta-sandwich), y, por el MHC cadenas, el alojamiento de dominio o G-DOMINIO (4 beta-capítulo y una alfa-hélice). Un sistema de numeración uniforme para IG y TR V-DOMAINs de todas las especies de vertebrados ha sido establecido para facilitar la comparación de secuencias y referencias cruzadas entre los distintos experimentos de los laboratorios de cualquiera que sea el receptor de antígeno (IG o TR), el tipo de cadena, o de la especie [14 -- 16]. En el IMGT numeración única, conservada aminoácidos de los marcos siempre tienen el mismo número independientemente de la variable TR IG o secuencia, y sea cual sea la especie del que procede. Como ejemplos: Cisteína 23 (en IMGT-FR1), Triptófano 41 (en FR2-IMGT), hidrofóbicas de aminoácidos 89 y Cisteína 104 (en FR3-IMGT) (Figura 2]. Esta numeración se ha aplicado con éxito a todas las secuencias pertenecientes a la V-conjunto de la IgSF [20], incluidos los que no-en la reordenación de las secuencias de vertebrados (CD4 humanos, Xenopus CTXg1, etc) y en invertebrados (drosófila amalgama, drosófila fasciclin II, etc) [15, 16, 21]. El IMGT numeración única, inicialmente definidas para la V-DOMAINs IG y de la TR y de la V-LIKE-DOMAINs de IgSF proteínas distintas de IG y TR, se ha extendido a la C-DOMAINs IG y de la TR (Figura 2B ), Y en la C-LIKE-DOMAINs de IgSF proteínas distintas de IG y TR [17]. IMGT una numeración única también se ha aplicado para el alojamiento de dominio (G-DOMINIO) de las MHC de clase I y II cadenas (Figura 3], y para el G-LIKE-DOMAINs de MhcSF distintos de las proteínas MHC [18].

Conclusión

Con el fin de permitir que cualquier componente IMGT automáticamente a ser consultados y para lograr un mayor nivel de interoperabilidad en el interior de la IMGT sistema de información y con otros sistemas de información, nuestros actuales objetivos incluyen la elaboración de modelos de las tres principales enfoques IMGT biológicas, genómica, la genética y los enfoques estructurales , El análisis de los componentes IMGT (bases de datos, herramientas y recursos de la web), en relación con los conceptos, y el desarrollo de servicios Web http://www.w3.org/2002/ws/ [2]. Son los primeros pasos hacia la aplicación de IMGT-Coreografía [2], que corresponde a la inmunogenética complejo proceso de conocimiento [25] y para la conexión de los tratamientos realizados por la IMGT componente de los servicios web. IMGT-Coreografía tiene para el objetivo de combinar IMGT y sumarse a la búsqueda en bases de datos y herramientas de análisis. Con el fin de mantener sólo los enfoques importantes, un análisis riguroso de las normas científicas [3, 4], el biólogo de las solicitudes y necesidades del médico, [39 - 42] se ha realizado en los tres principales enfoques biológicos: la genómica, la genética y estructural Enfoques. El diseño de IMGT-Coreografía y la creación dinámica de las interacciones entre la IMGT bases de datos y herramientas, utilizando los servicios Web y IMGT-ML, y la novela representan a los principales acontecimientos de IMGT, la referencia internacional en inmunogenética y inmunoinformática. IMGT-Coreografía aumenta la interacción dinámica entre los componentes IMGT respuesta a complejos biológicos y clínicos de las solicitudes.

Desde julio de 1995, IMGT ha estado disponible en la Web en http://imgt.cines.fr. IMGT tiene una respuesta excepcional, con más de 140000 solicitudes al mes. La información es de gran valor para los médicos y biólogos en general. IMGT bases de datos, herramientas y recursos de la web son ampliamente consultados y utilizados por los científicos de ambos laboratorios universitarios e industriales, desde muy diversos campos de investigación: (i) la investigación médica fundamental y (repertorio análisis de la IG sitios de anticuerpos y de la TR reconocimiento en los sitios normales Y situaciones patológicas, como enfermedades autoinmunes, enfermedades infecciosas, el SIDA, las leucemias, los linfomas, myelomas), (ii) la investigación veterinaria (TR IG y repertorios en la granja de vida silvestre y especies), (iii) la diversidad del genoma y evolución del genoma de los estudios de adaptación La respuesta inmune, (iv) la evolución estructural de la IgSF y MhcSF proteínas, (v) la biotecnología relacionada con la ingeniería de anticuerpos (Fragmento variable sola cadena (scFv), fago muestra, combinatoria bibliotecas, quimérico, humanizada y de los anticuerpos humanos), (vi) los diagnósticos (Clonalities, detección y seguimiento de enfermedades residual) y (vii) los enfoques terapéuticos (injertos, la inmunoterapia, vacunas).

Citando IMGT

Si utiliza IMGT bases de datos, herramientas y / o recursos de la web, por favor, citar [1], y este documento como referencia, y citar al IMGT dirección URL de la página de Inicio, http://imgt.cines.fr.

Agradecimientos

Estoy muy agradecido a Véronique Giudicelli, Chantal Ginestoux, Joumana Jabado-Michaloud, Géraldine Folch, Elodie Duprat, Denys Chaume, Quentin Kaas, y Gérard Lefranc por su experiencia, la motivación y la constante discusión útil. Estoy agradecido a Wafae El Alaoui, Aurélie Frigoul, Lamia Zaghloul, François Ehrenmann, Arnaud Henry, Emmanuel Jean-Servier, nuestra "2005" los estudiantes, por su entusiasmo, y muchos IMGT a los usuarios que han expresado su apoyo y aliento. IMGT es una marca registrada de Centre National de la Recherche Scientifique (CNRS). IMGT ha obtenido la Plataforma Nacional de Bioinformática RIO etiqueta desde 2001 (CNRS, INSERM, CEA, INRA). IMGT fue financiado en parte por el BIOMED1 (BIOCT930038), Biotecnología BIOTECH2 (BIO4CT960037) y 5 º PCRDT Calidad de vida y gestión de los recursos vivos (QLG2-2000-01287) programas de la Unión Europea y ha recibido subvenciones de la Asociación pour la Recherche sur le Cáncer (CRA) y de la Génopole-Montpellier-Languedoc-Roussillon. IMGT es actualmente apoyada por el CNRS, el Ministère de l'Education Nationale, de l'Enseñanza Supérieur et de la Recherche MENESR (Réseau National des Génopoles, Université de Montpellier II Plan Pluri-Formación, Instituto Universitario de Francia, ACI-IMPBIO IMP82 - 2004 y BIOSTIC-LR2004 Région Languedoc-Roussillon) y los SIG AGENAE (contrat AD2351 2005-2007).