Immunome Research, 2005; 1: 4-4 (más artículos en esta revista)

AntiJen: una base de datos cuantitativa inmunología integración funcional, termodinámica, cinética, biofísicos, y los datos celulares

BioMed Central
Christopher P Toseland (darren.flower @ jenner.ac.uk) [1], Debra J Clayton (debra.clayton @ bbsrc.ac.uk) [1], Helen McSparron (helen.mcsparron @ jenner.ac.uk) [ 1], Shelley L Hemsley (darren.flower @ jenner.ac.uk) [1], Martin J Blythe (martin.blythe @ jenner.ac.uk) [1], Kelly Paine (darren.flower @ jenner.ac. Uk) [1], Irini A Doytchinova (irini.doytchinova @ jenner.ac.uk) [1], Pingping Guan (darren.flower @ jenner.ac.uk) [1], Channa K Hattotuwagama (channa.Hattotuwagama @ jenner . Ac.uk) [1], Darren R Flores (darren.flower @ jenner.ac.uk) [1]
[1] Edward Jenner Instituto para la Investigación de Vacunas, High Street, Compton, Berkshire, RG20 7NN, UK

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen

AntiJen es un sistema de base de datos se centró en la integración de la cinética, termodinámica, funcionales, celulares y de datos en el contexto de la inmunología y vacunas. En comparación con su progenitor JenPep, la interfaz ha sido completamente renovado y rediseñado y ahora ofrece una variedad más amplia de métodos de búsqueda, incluido un nucleótido y un péptido BLAST búsqueda. En términos de los datos archivados, AntiJen tiene una rica y más completa amplitud, profundidad y alcance, y esto se ha visto aumento de la base de datos de más de 31000 entradas. AntiJen ofrece la más completa y actualizada base de datos de su clase. Aunque AntiJen v2.0 mantiene un enfoque en dos células T y células B epítopos, su mayor novedad es el archivo de la continuidad de los datos cuantitativos sobre una variedad de interacciones moleculares inmunológicas. Esto incluye la termodinámica y la cinética del péptido medidas vinculantes a TAP y el Complejo Mayor de Histocompatibilidad (CMH), péptido-MHC complejos de unión a receptores de las células T, la unión a proteínas anticuerpos y antígenos general inmunológicos interacciones proteína-proteína. La base de datos también contiene datos cuantitativos especificidad de la posición específica de las bibliotecas y los péptido de datos biofísicos, en la forma de difusión y co-efficients superficie celular número de copias, en MHCs inmunológicos y otras moléculas. Los usos de AntiJen incluyen el diseño de vacunas y diagnósticos, como tetramers, y otros reactivos de laboratorio, así como ayudar a la bioinformática o parameterize in silico de modelado matemático del sistema inmunológico. La base de datos es accesible desde la dirección URL: http://www.jenner.ac.uk/antijen.

Introducción

Hay una inmensa, y cada vez en aumento, el volumen de información importante que se ha acumulado de décadas de análisis experimental de la inmunología. Esto sólo será complicado como técnicas de alto rendimiento empiezan a afectar a las biociencias inmunológicos. La única manera eficaz de esta información se utilizan adecuadamente requiere el desarrollo de las bases de datos que almacenan y sistemas que se utilizan. Aunque el tipo de datos archivados pueden alterar de un caso a otro, no obstante, la creación, el uso y la manipulación de bases de datos con información biológicamente importante es la característica más importante de la bioinformática en curso, tanto como apoya la genómica y post-genómica y revoluciones como Disciplina por derecho propio. No hay nada nuevo en el desarrollo de bases de datos centrados en la inmunología: muchos destacando la profundidad en el análisis de la secuencia de cada uno de los immunomacromolecules han existido durante algún tiempo [1]. Funcional o epítopo orientado a bases de datos son un desarrollo más reciente. Los ejemplos incluyen la desaparecida base de datos MHCPEP http://wehih.wehi.edu.au/mhcpep/ [2], [3] FIMM http://sdmc.krdl.org.sg:8080/fimm, SYFPEITHI [4] http : / / Www.syfpeithi.de, la base de datos de secuencias del VIH [5] http://hiv-web.lanl.gov/, ligando la base de datos de HLA [6] http://hlaligand.ouhsc.edu, EPIMHC la base de datos [ 7] http://bio.dfci.harvard.edu/epimhc/, y la base de datos MHCBN http://www.imtech.res.in/raghava/mhcbn/ [8].

Un epítopo es cualquier estructura molecular que puede ser reconocido por el inmunológico, biológicos o de otro tipo, sistema. Epítopes, o el antígeno del que se derivan, puede estar compuesta de proteínas, hidratos de carbono, lípidos, nucleótidos, o una combinación de éstos. Es a través del reconocimiento de los extranjeros, o no libre, epítopes que el sistema inmune puede identificar y, cabe esperar, destruir los agentes patógenos. Hasta ahora, péptido epítopos han sido el mejor estudiado, y que, tradicionalmente, se han clasificado ya sea como células T o de células B epítopos. Epítopes de células T son péptidos presentados a la rama celular del sistema inmune a través de la MHC-péptido-TCR complejo. Epítopos de células B representan regiones de la superficie de un antígeno que están obligados por soluble o de membrana anticuerpos. Si esta región de una proteína se compone de antígenos de los residuos separados distalmente dentro de la estructura primaria, y la puesta en local de proximidad por el plegado de proteínas, entonces se le denomina discontinuos o conformacionales de células B epítopo. Lineal o continua de células B epítopo residuos son secuenciales en la enseñanza primaria y por lo tanto la estructura como una región de las proteínas' superficie. Tal epítopos son predominantemente identificados por antígeno-específica de anticuerpos de reactividad cruzada con péptidos.

Existe la necesidad de crear un banco de datos de las más amplias disciplinas de la inmuno-vaccinologists, que puede actuar como una central de información y de recursos. Nuestro objetivo es complementar otros bancos de datos [2 - 8] y, por lo tanto, hemos desarrollado AntiJen, un cálculo de recursos de información para la inmunología y vacunas que integra cuantitativos cinética, termodinámica y biofísicos de datos, con la información funcional y celular. AntiJen v2.0, un desarrollo de nuestro anterior sistema de base de datos JenPep [9, 10], contiene datos funcionales sobre las células T y células B epítopos. Además, el archivo de células B está dividida en sub-lineal y epítopes conformacionales. Estos epítopos forman la base de la respuesta inmune humoral y, a diferencia de epítopes de células T, los métodos de predicción son a menudo inexactos [11]. Una más en profundidad de células B epítopo archivo de ayuda debería el desarrollo de estrategias de predicción. Reconocimiento de antígenos por el Complejo Mayor de Histocompatibilidad (CMH) es vital para la activación de células T, por lo tanto, la inclusión de datos sobre la termodinámica de la unión de los péptidos a las moléculas MHC y el receptor de células T (TCR) vinculante para péptido-MHC (pMHC) complejos. Esta información se complementa con datos basados en la cinética de las mismas interacciones moleculares. Los datos sobre el procesamiento y presentación de antígenos se incluye también en AntiJen. Encuadernación los datos derivados de la interacción con el péptido asociado con Transporter Procesamiento de antígeno (TAP transportador) se incluyen en el archivo. Además, la especificidad de datos cuantitativos de la posición específica de las bibliotecas péptido está incluido. AntiJen termodinámico también incorpora datos sobre las interacciones proteína-proteína, dentro de un contexto inmunológicos, tales como la co-receptor superantigen y vinculante, además de las interacciones con el MHC. Todas estas interacciones son, potencialmente, los factores clave para el éxito en el diseño computacional de las vacunas.

AntiJen también contiene datos biofísicos, incluida la difusión de los coeficientes de superficie celular y número de copias, en una variedad de moléculas inmunológicas. Estos datos dan una idea precisa de la cantidad de receptores meta, que es un elemento importante, si en virtud de explorar, componente de carácter vinculante entre las células. De hecho, el número de moléculas expresadas en la membrana pueden modificar dependiendo de la enfermedad. La última adición a la base de datos se centra en el antígeno de los anticuerpos vinculante. Una clave de la innovación es un gran aumento compendio de las condiciones experimentales, que, en conjunción con una gran capacidad de búsqueda mejorada, consolida nuestras bases de datos como un único, de valor añadido fuente de datos, el fomento de la evolución de ambos en silico inmunología y la comunidad en general de immunovaccinology. La base de datos está disponible en el URL: http://www.jenner.ac.uk/antijen.

Desarrollo de bases de datos

En relación con el sistema de base de datos utilizada para JenPep [9, 10], la interfaz a AntiJen es totalmente nuevo, después de haber sido reescrito. AntiJen ha sido diseñado y ejecutado usando postgreSQL, un sistema compuesto por una base de datos relacional y el servidor de base de datos, y por lo tanto, ha establecido el aumento de la base de datos robustez, la creación de una mejor infraestructura para los previsibles problemas de almacenamiento de datos y los datos de crecimiento. Los datos dentro de AntiJen está estructurado en veinte y cuatro cuadros normalizado. Cada categoría es específica y tiene cualquiera de los datos estadísticos o experimentales. Cuadros adicionales acomodar la palabra clave de datos - que nuestros poderes proteína orientada a la búsqueda de antígenos y permite la integración de la búsqueda BLAST - y también hay una tabla de datos estructurales para dar cabida a enlaces a bases de datos externas estructurales. La interfaz de usuario consiste en una serie de formularios HTML. Las solicitudes de búsqueda de estas formas objetivo PERL scripts SQL integrado con el que, a su vez, consulta la base de datos.

Base de datos de contenido

En comparación con su progenitor JenPep [9, 10], los datos archivados en AntiJen v2.0 ha crecido considerablemente en profundidad (tipos de datos adicionales, como condiciones experimentales), la amplitud (adición de nuevos datos a las bases de datos existentes), y el alcance (además de Extra sub-bases de datos con nuevos tipos de información). Adiciones al AntiJen se han derivado de la búsqueda exhaustiva de la literatura primaria, para dar un conjunto de datos de> 31000 entradas. AntiJen v2 v2.0 ahora consta de 11 sub-bases de datos, detalles de las diferentes bases de datos se presentan en la Tabla 1. Los tamaños relativos de las bases de datos y el crecimiento de JenPep se resumen en la Tabla 2.

AntiJen contiene datos genéricos y específicos de los datos. Por cada entrada, registramos la secuencia peptídica (por ejemplo, YTSDYFISY) de la epítopo de usar el código de una letra, su longitud (9 en este caso), y, por vincular a la secuencia de bases de datos Swiss-Prot http://us .expasy.org / Sprot / o http://www.ncbi.nih.gov/entrez NCBI, el antígeno al que el péptido secuencia más se parezca (en el caso de YTSDYFISY: C-ests-1 (p54), SUIZA - PROT código P41156 ). La descripción del antígeno es, en lo posible, obtenida directamente de la literatura. AntiJen también está vinculada a PUBMED. Esto nos permite registrar las citas originales asociados a los datos. Por ejemplo, para YTSDYFISY, citamos: Diario Immunol 1994 el volumen de 152 páginas 3913-3924, PUBMED ID 8144960. Para el epitopo de células T, MHC ligando, y TCR-pMHC complejo de las categorías, también récord, para cada péptido, la restricción de MHC en términos de las especies huésped, la clase (clase I vs clase II), y, en el que los datos se Disponible, el serotipo y alelo. Por YTSDYFISY, estos datos serían humanos, de clase I, HLA-A1, A * y 0101.

Las entradas dentro de AntiJen son, a su vez, vinculados a bases de datos externas, que permite más a fondo de referencias cruzadas. Como hemos dicho, los identificadores de secuencia de proteínas, que pueden ser la fuente de un péptido antigénico o inmunológicos co-receptor, enlazar directamente con detalles en la base de datos Swiss-Prot [12] o la proteína de la base de datos NCBI. Diario referencias se pueden ver a través de un enlace a la base de datos PUBMED http://www.ncbi.nlm.nih.gov/pubmed, y por lo tanto la literatura referencias a pleno, cuando estén disponibles. AntiJen también enlaces a datos estructurales, que en la actualidad derivados de la MPID base de datos http://surya.bic.nus.edu.sg/mpid/ [13] y el Banco de Datos de Proteínas http://www.rcsb.org/pdb/ [ 14]. La base de datos tiene como objetivo facilitar el acceso a los datos cuando se disponga de antecedentes.

Alelo identificadores servir como un enlace a la IMGT / HLA http://www.ebi.ac.uk/imgt base de datos en el Instituto Europeo de Bioinformática [15]. Variabilidad inherente en la forma en que se denominan alelos MHC dentro de la principal literatura nos impide claramente la normalización de la nomenclatura dentro de AntiJen. HLA nomenclatura sigue la del Grupo de Informática HLA http://www.anthonynolan.org.uk/HIG/. Un alelo se llama utilizando un patrón definido. Por ejemplo, para HLA-A * 0101: el HLA-A se refiere al locus HLA; los primeros 01 a la serológicamente reconocido antígeno A1 y el último 01 a la persona alelo HLA secuencia de la proteína. AntiJen almacena el antígeno de la clasificación (es decir, HLA-A1) y, cuando sea posible, del alelo específico. A menudo hemos encontrado con problemas con el alelo no estándar de presentación de informes. A 4 dígitos HLA implica necesariamente el nombre de dos dígitos serológica de antígenos, una clasificación de dos dígitos claramente no implica un alelo específico.

Durante la compilación de bases de datos, una secuencia de búsqueda que nos permite identificar el contenido en proteínas de las que una secuencia origina epítopo. Sin embargo, debido a epítopos son generalmente breves, sus secuencias pueden estar presentes en varios posibles antígenos: en orthologues, paralogues, o en un género totalmente secuencias. Como se procesan epítopos de las proteínas en su conjunto a través de un complejo proteolítico vía, se puede utilizar la secuencia de contexto para inferir preferido proteasomal endoplasmático la proteasa o los patrones de división, pero no si su marco se define incorrectamente. Además, en el supuesto de que AntiJen posteriormente se utiliza para asignar el estado de las proteínas antigénicas, erróneamente particular, la identificación de las proteínas como antígenos puede conducir a la filtración a la anotación de errores [16, 17].

AntiJen es, en lo posible, un archivo de base de datos cuantitativa continua de medidas vinculantes. Esta es una característica fundamental de varias sub bases de datos, como el MHC ligando pMHC-TCR y bases de datos. La unión de una macromolécula inmunológica a un péptido o de otros biomacromolecule se cuantifica como son otras receptor-ligando:

R L + R + L + R LRL

Aquí R es el receptor (TCR o MHC), el ligando L (péptido o pMHC), y RL, el complejo receptor-ligando (pMHC o complejo TCR-pMHC). La tasa a plazo de la reacción es proporcional a [L] [R]. La tasa de la reacción inversa es proporcional a [RL] como otras especies no están involucrados en la disociación. En equilibrio, el avance y retroceso tasas son iguales, y que utilizaban en k la k fuera como las respectivas constantes:

En k [R] [L] = k off [RL]

Reordenar:

Aquí D K es la constante de equilibrio de disociación, que representa la concentración de ligando que ocupa el 50% de la población de receptores de equilibrio, y K es el equivalente de una asociación constante.

Experimentalmente, la medición de las constantes de disociación de equilibrio suele ser dirigido a través de radio-ligando pruebas aglutinantes. Saturación de radio-ligando pruebas aglutinantes medida vinculante de equilibrio, en un rango de concentraciones de péptido, establecer afinidad (K) y el número de receptores (B max). Unión competitiva experimentos determinar vinculante en un solo ligando concentración en la etiqueta la presencia de un rango de concentraciones de ligando no etiquetados. AntiJen registros de una jerarquía de diferentes medidas vinculantes, en sus diferentes sub-bases de datos. Constantes de equilibrio son los más fiables y sentarse encima de esta jerarquía. Luego vienen IC 50 valores, que puede ser obtenido de un concurso de radio-ligando o fluorescencia ensayo. Estos son los comúnmente Fmost informó de las medidas obligatorias.

Los valores obtenidos de la radio-ligando fluorescencia o métodos que pueden ser muy diferentes. IC 50 valores para un péptido puede variar entre los experimentos en función de la afinidad y la concentración intrínseca de la norma de referencia radiomarcado péptido, así como la afinidad intrínseca de la prueba péptido. IC 50 valores varían con la constante de equilibrio de disociación, por lo menos dentro de un mismo experimento. En la práctica, la variación de la CI 50 es a menudo lo suficientemente pequeños valores que se pueden comparar entre experimentos. Para el péptido se ha dicho, YTSDYFISY, el radiomarcado CI 50 en AntiJen valor registrado es de 5,3 nM. BL 50 valores también son obtenidos a partir de un péptido vinculante de ensayo y se informó. Ellos son los máximos vinculantes media calculada a partir de los niveles de intensidad de fluorescencia media de péptidos vinculante a MHCs obligado en la superficie de RMA-S T2 o células. Células, pre-incubadas con péptidos, son calificados con un fluorescente de anticuerpos monoclonales. Una visión general de la termodinámica y la cinética de los datos dentro de AntiJen vinculante figura en el cuadro 3.

AntiJen también contiene en la actualidad condiciones experimentales, como la temperatura y pH. Un resumen de estos datos se da en la Tabla 4. La precisión de los datos depende en gran medida experimental, el método utilizado. La agrupación de datos con respecto a las técnicas experimentales específicas permite una evaluación más completa de capacitación conjuntos. La figura 1 muestra la distribución de los datos para cada tipo de análisis con respecto a cada base de datos. El PAT MHC Cinética y bases de datos de relieve los problemas expuestos anteriormente. La cinética de la base de datos contiene los datos de más de 14 determinado métodos mientras que el PAT se deriva de la base de datos de 4 métodos, radiomarcado con ensayos representan el 80% de los datos.

El proceso de compilación ha puesto de manifiesto la considerable falta de coherencia dentro de la literatura relacionada con el inmunológicos registro de tales datos fundamentales. AntiJen contiene, sin embargo, una relación directa, la transcripción literal de los datos de la literatura primaria. Como tal, no intento, como cuestión de política, y la retrospectiva completa de la corrección de posibles errores. Para la realización de esas correcciones sólo complejo de los errores, que presenta el tipo de inconsistencias se filtre tanto una característica de otros sistemas de bases de datos [16, 17]. Más imprecisiones pueden ser el resultado de nuestra incapacidad de logística para verificar los datos de forma independiente, por lo tanto tenemos que confiar en los valores reportados en la literatura.

Subsidiario en las bases de datos AntiJen

AntiJen La base de datos contiene un número de sub-bases de datos. Cada una de estas contiene datos sobre diferentes aspectos de la función biológica y / o propiedades biofísicas de las diferentes clases de immunomacromolecule. Se describe la naturaleza y el contenido de cada sub-base de datos a continuación.

Epítopos de células B

Epítopos son las principales fracciones químicas reconocidas por el sistema inmune. Aunque la importancia de la no péptido epítopos, como los hidratos de carbono y lípidos, es ahora cada vez más conocidas, peptídicos de células B, células T epítopos y siguen siendo los principales instrumentos por los que la complejidad de la respuesta inmune puede ser explorado. Epítopos de células B son las regiones de la superficie de una proteína, o de otros biomacromolecule, reconocido por soluble o membrana moléculas de anticuerpos. En el desarrollo de AntiJen, hemos descartado el contenido de nuestros anteriores de células B y construyó un archivo de novo. Contiene un nuevo conjunto de datos con una estructura de datos diferentes. Hay dos formas de epítopos: lineal y discontinuo. Un epítopo lineal de células B se compone de un único tramo de residuos secuencial. Un epítopo discontinuo de células B se compone de separar los residuos de forma secuencial puesto en la proximidad de un acuerdo conformationally dependen de los productos básicos. El archivo de datos de los que se centra fundamentalmente a los epítopos lineales. Esto se debe a la mayor cantidad de datos experimentales disponibles para epítopos lineales, que refleja tanto la relativamente fácil experimentos necesarios para la identificación de ellos y una creencia implícita en su utilidad como posibles epítopos vacuna. Por el contrario, epítopes discontinuos se cree que son más frecuentes dentro de plegado de proteínas, pero son mucho más difíciles de determinar experimentalmente. El archivo de catálogos de la secuencia de péptidos vinculante, y también da la longitud y la fuente: TTGDVIASS, un aminoácido péptido 9 de Escherichia coli no fimbrial adhesión. Los residuos identificados como importantes en la unión a los anticuerpos son registrados. Esto puede corresponder a todo un péptido o una posterior, TTGDVI como en el ejemplo anterior. Los péptidos son también categorizados en términos de su relativa observada immunodominance. Los anticuerpos isotipo organismo de origen y se registran. El actual células B epítopo archivo contiene epítopos 3541.

Epítopes de células T

Epítopes de células T son péptidos cortos obligado por los principales complejos de histocompatibilidad (MHC), y posteriormente reconocido por las células T. Epítopos reconocidos por tanto CD4 + y células T CD8 + se incluyen en la base de datos. Tal epítopos se pueden identificar en muchas formas diferentes. Sin embargo, esta diversidad de medida impone una cierta necesidad de la coherencia, que exige el requisito de registro de una gama de diferentes métodos experimentales. El archivo se ha ampliado para incluir 4158 entradas. Las entradas contienen los epítopos, que varían en longitud de 4 a 38 aminoácidos, péptido información, que detalla la fuente, con enlaces a Swiss-Prot y la correspondiente restricción de MHC de datos tales como el serotipo, y de la clase Allele. Además, los péptidos se clasifican en grupos, como a los alérgenos, bacterianas, cáncer, Humanos, y Libre de Virus de péptidos.

MHC - Péptido vinculante

AntiJen sigue archivo de datos cuantitativos sobre la termodinámica de las interacciones péptido [18, 19], y se ha ampliado en número y contenido, con adiciones como condiciones experimentales, además de la norma específica y Competidor péptido concentraciones utilizadas en los análisis. El actual archivo contiene 15.454 entradas. La secuencia del péptido vinculante, junto a la fuente, además de los datos de restricción de MHC es registrada. La restricción alelos actualmente incluyen los de los humanos, de ratón, rata, el mono Rhesus, Cotton-top Tamarin, y los chimpancés. AntiJen contiene valores de CI 50, afinidad mediciones de los ensayos de unión competitiva, para que el nivel y la competencia péptidos y las concentraciones se registran, además de los valores BL 50, calculada a partir de la estabilización de los ensayos de péptidos. Siempre que sea posible, y las concentraciones de los anticuerpos utilizados para calcular BL 50 valores se archivan. Por otra parte, pero en una escala algo menor, el equilibrio de asociación (K A) y disociación (K D) se registran constantes de la interacción péptido-MHC. Temperaturas de fusión (T m) y la señal de longitud de onda también se registran, que es la temperatura y la longitud de onda en la que el 50% de la proteína es desnaturalizada MHC medido por dicroísmo circular. AntiJen también registros de los llamados débiles / no aglutinantes. Esto indica que el péptido ha sido probado en un ensayo de restricción MHC y se ha considerado que muestran una afinidad, es decir, un valor CI 50> 10000 nM para una emisora de radio-ligando de ensayo, tan bajo que se pueden categorizar como inactivos.

PMHC T-Cell Receptor interacción

El TCR sub-base de datos contiene 782 entradas, que registra termodinámicos y cinéticos de datos vinculantes para la interacción de péptido-MHC (pMHC) complejos con TCRs. Diferentes MHCs exhiben una clara selectividad para determinadas secuencias de péptidos. Receptores de las células T, a su vez, también presentan diferentes afinidades para péptido-MHC complejos. Las entradas contienen epítopo, péptido MHC fuente y restricción de datos, como se describe más arriba, más TCR estructura de la información, situado en la base de datos http://www.ncbi.nlm.nih.gov/Structure/index.shtml la MMBD. Además, se observó ningún mutaciones y un nombre designado para el TCR es archivado. Además, los péptidos se registran como cualquiera de los agonistas o antagonistas. La unión de datos se da como constantes de equilibrio (K D), la CE 50 valores, la tasa de asociación (K), tasa de disociación (K off), de asociación constante (K A) y la vida media (t 1 / 2) De la interacción TCR-péptido.

TAP Encuadernación

Este conjunto de datos contiene datos vinculantes para las interacciones entre los péptidos y el PAT transportista, uno de los principales pasos en la presentación antigénica. Al igual que con el péptido-MHC base de datos, los datos se estableció la competencia de los experimentos vinculante, sobre la base de ensayos de la etiqueta. Por lo tanto, estándar competidor y secuencias de péptidos y sus concentraciones se registran. La unión de datos se da como IC 50 y K D valores. La base de datos contiene actualmente 1106 entradas, con péptidos de Humanos, Rata y Ratón fuentes. Sobre la base de valores de CI 50> 10000 nM, los péptidos se clasifican como débil y no aglutinantes. Las entradas tienen aumento en el número de encontrarse en el nivel JenPep, aunque se eliminaron varias entradas en un esfuerzo por aumentar la precisión y la coherencia del archivo (Cuadro 2].

Péptido-MHC cinética

AntiJen cinética de la sub-base de datos, que contiene 1150 registros, la mayoría se refiere a la clase I MHC datos. Registra mediciones para adelante y atrás complejación constantes de velocidad de los acontecimientos. Esto complementa las mediciones de la termodinámica péptido-MHC vinculante se ha descrito anteriormente. Los datos que actualmente se centra en la vida de medio vinculante de las interacciones, así como de asociación y disociación tasa valores constantes (K y K en off) de la registrada epítopos. Además, la concentración de la péptido, MHC y TAP se archivan. La vida media de radioisótopos etiquetados β 2-microglobulina disociación de un complejo MHC de clase I, medido a 37 ° C, también es archivado. Se trata de una cinética de medición en lugar de un termodinámico, aunque a menudo se supone que cuanto mayor es la vida media de los más fuertes de la péptido-MHC complejo. La vida media (t 1 / 2) es igual a:

En este sentido, el t 1 / 2 corresponde a la disociación de la MHC-β 2 microglobulina complejo en lugar de la cinética de la interacción proteína-ligando, pero aún péptido dependientes, así como la cinética en la naturaleza.

Inmunológicos interacciones proteína-proteína

El sistema inmunológico se construye en torno a la interacción de proteínas, por lo tanto, hemos desarrollado una nueva sub-base de datos que se ocupa de inmunológicas Interacciones Proteína-Proteína (IPPI). Este archivo contiene 2675 entradas sobre la base de una serie de datos obligatorios, como el K sobre las tasas de despegue y K, para una serie de macromoléculas implicadas en las interacciones fisiológicas o patológicas, así como K, D, K, A, y valores de CI 50. Las moléculas de incluir como receptores CD4 o CD8 moléculas, superantígenos y otros factores de virulencia microbiana, los receptores de citoquinas y las moléculas de adhesión celular. Las entradas detalle tanto de proteínas que participan en la interacción vinculante, con enlaces que se proporcionan a la base de datos NCBI Entrez-. Datos adicionales para los receptores de MHC es archivada, en la que la reacción se registra epítopo y los co-receptores se clasifican en virales, bacterianas y de la libre péptidos. MHC datos esbozados en la anterior base de datos se da, en su caso incluidas las mutaciones de la CMH.

Antibody - unión a proteínas

AntiJen también contiene una nueva sub-base de datos, que incluye datos relativos a la termodinámica anticuerpo-antígeno vinculante. El conjunto de datos contiene 395 entradas para el antígeno de proteínas y anticuerpos, en su mayoría derivados de virus y fuentes de mamíferos. Informó de los valores fueron obtenidos en ensayos y radiomarcado BIAcore análisis. Este archivo debe de ayuda en la selección de péptidos y anticuerpos de los estudios in vitro. La lista de entradas de los anticuerpos y de la encuadernación / cinética datos, que consiste en K K A D y valores y, en menor medida, sobre K, K despegue y valores de CI 50.

Péptido Bibliotecas

Esto complementa nuestro archivo de más de MHC vinculante de las bases de datos que indican la contribución relativa de los residuos dentro de las bibliotecas de péptidos MHC vinculante. 897 entradas contienen datos cuantitativos especificidad deriva de la posición específica péptido bibliotecas [20]. Este catálogos sobre el efecto relativo de afinidad, en forma de CI 50, relativo SD log 50 y log SI valores, de todas las sustituciones, en todos los péptidos posiciones, en contra de una secuencia aleatoria de telón de fondo. Todas las bibliotecas, relativa a un conocido péptido aglutinante se designan un nombre dentro de AntiJen, este por lo general consiste en que el autor y el año de publicación. Este archivo contiene el péptido básico, junto con la mutación y la posición sustituido aminoácidos. Los datos correspondientes MHC se da como se mencionó anteriormente.

Difusión Co-efficients

Para aumentar aún más la gama de los datos archivados, AntiJen también contiene 759 registros de los celulares de datos biofísicos, en la forma de difusión de co-efficients, registrada cm 2 s -1, para una diversidad de las moléculas de la superficie celular, incluyendo MHCs (Mouse y Humanas ), Péptidos virales y de otros receptores [21]. Las moléculas son químicamente o fluorescently etiquetados y, a continuación, medidos utilizando uno de dos métodos: Individual Seguimiento de Partículas (SPT) o de fluorescencia Photobleaching Recuperación (IFE). SPT vigila el movimiento lateral de una molécula mientras etiquetados IFE medidas de la tasa de infiltración posterior de un photobleached sección de la membrana. Fricción co-eficiente de los datos es también, que las medidas de la velocidad y la fuerza aplicada a un anticuerpo revestida de talón. Los registros contienen la celda o el tipo de células donde se produce la difusión, el nombre de la difusión de la proteína junto con la forma de etiquetado aplicadas. Por otra parte, los datos experimentales específicos se da como anticuerpos talón tamaño. En este caso, la difusión de los granos se supervisa. Cada vez más, los datos relativos a photobleaching se incluye, como el haz de energía, la decoloración de duración, antes y después de la lejía tiempo, etc ..

Copiar números

El último sub-base de datos contiene 414 medidas de la superficie celular poblaciones de las diferentes moléculas, llamadas células de superficie copiar los números de aquí en adelante. Esta base de datos se centra en una variedad de moléculas, incluyendo MHCs clase I (22) y TCRs [23]. Las entradas se ofrecen como número y tipo de moléculas MHC, el número de complejos MHC-péptido o abundancia de péptidos asociados a cada serotipo MHC, en general definido por espectroscopia de masas. Las entradas de la lista tipo de células, los anticuerpos vinculada a la de MHC y, en su caso, el carácter vinculante epítopo. Esto sólo se aplica a la cantidad de MHC-péptido complejos y la abundancia de péptidos asociados con cada MHC.

Buscando en la base de datos

Buscar mecanismos dentro de AntiJen se mejoró significativamente y permitir ya sea un detallado o una amplia búsqueda de una sencilla interfaz de usuario. Desde nuestra experiencia con JenPep, reconocemos que el acceso a los datos en una forma fácil de usar es un requisito fundamental, y han mejorado nuestras actuales mecanismos de búsqueda y desarrollado nuevas interfaces de búsqueda. Dos diferentes mecanismos de búsqueda disponibles. Una se basa en BLAST [24] y el otro es un sistema de medida, lo que permite varias alternativas búsquedas. Dentro de la típica búsqueda, el usuario a entrar en los criterios de búsqueda están a cargo de un formulario HTML a una categoría específica PERL / script SQL, que realiza la búsqueda en bases de datos.

La búsqueda BLAST permite consultar de un péptido o secuencia de nucleótidos en contra de las proteínas contenidas en AntiJen; todas las entradas que contengan datos dentro AntiJen que son pertinentes a una secuencia de proteínas están vinculadas a través de la salida de BLAST. Un local de la base de datos de secuencias de proteínas se busca con o BLASTP BLASTX [24] utilizando la matriz BLOSUM64. Todos BLAST variables de control son fijos. Un HTML Front-End (Figura 2], donde una secuencia se puede introducir o cargado, se conecta a un servidor web basado en Perl / CGI scripts, que interactúa con BLAST. Una versión anotada por defecto de la salida de BLAST se produce y enlaces a las entradas a través de AntiJen SWISS-PROT [12] adhesión códigos, que actúan como una consulta dentro de una búsqueda de palabras clave. Esto permite AntiJen entradas para ser visto directamente de la salida de BLAST.

En la actualidad, la cadena peptídica, palabra clave, nombre de índice de proteínas y búsquedas están disponibles en el sistema de medida, que permite realizar consultas de las distintas secuencias de péptidos o en el nivel de toda la proteína de los antígenos. Una visión general de la AntiJen sistemas de búsqueda se da en la Figura 2 y 3. Epítopos, MHC, TCR, TAP péptido vinculante y cinética de todas las bases de datos pueden ser registrados utilizando secuencia de cadenas. El protocolo de búsqueda de primera devuelve una lista y un epitopo de contar epítopo partidos. Posteriormente, experimental criterios se puede acceder a cada seleccionado epítopo. Los péptidos se pueden buscar utilizando un aminoácido orientados a la consulta: un péptido escasa cuerda, similar en su forma a un péptido vinculante motivo [3] o un patrón PROSITE [25], se utiliza para identificar las secuencias de todas las palabras. Ver Figura 4. Por otro lado, una lista de antígenos de proteínas dentro de AntiJen se puede buscar mediante palabras clave, la termodinámica vinculante datos como MHC-péptido, TCR-pMHC y TAP, además de las células T y B archivos, en relación con los criterios de búsqueda pueden ser seleccionados de la Coincidencias sobre la base de la SWISS-PROT adhesión códigos [12], que muestra todas las entradas correspondientes en el database.The otro método de búsqueda, permite que el IPPI, la difusión de co-efficients, péptido bibliotecas, de anticuerpos de la proteína y número de copia sub-bases de datos que se buscaron Utilizando un índice método, en un fácil de usar HTML en el menú desplegable. Cada uno de estos métodos también pueden ser subsidiarios moderado utilizando filtros de búsqueda, el tamaño de los datos varía, y el resultado presentación de alternativas, como el péptido longitud o valores de CI 50. Valores mínimo y máximo se pueden utilizar para limitar los resultados, como se puede selección de los alelos de restricción MHC.

Discusión

El nombre dado a nuestra nueva base de datos, AntiJen, refleja el cambio de una estructura de base de datos orientada péptido, que es inherente a nuestro anterior JenPep base de datos, a uno que puede equilibrar adecuadamente su enfoque en ambos antígenos de proteínas y péptidos aislados. Como tal, representa un importante e integrado, los datos inmunológicos de recursos. AntiJen ahora ofrece una amplia visión de las dos células T y células B mediada por el reconocimiento antigénico. Además, a través de los auspicios de la IPPI sub-base de datos, la base de datos también arroja luz sobre la co-estimulación de los receptores y co-ofrece importantes conocimientos sobre la respuesta inmune innata. Nuestro enfoque de las interacciones proteína-proteína, centrado en medir afinidades, complementa otros métodos, como la levadura-2-Híbrido sistema, que, al tiempo que mayores volúmenes de datos, tiene problemas de precisión [26]. Esto, si bien no carece de artefacto experimental, ofrece una útil perspectiva diferente sobre la catalogación de las interacciones proteína-proteína. Además de los más débiles vinculante a la notación MHC-péptido y TAP ofrece un panorama más amplio de la naturaleza de epítopos antigénicos. Se trata de mejorar aún más con la adición de la base de datos de bibliotecas de péptidos, en el que los residuos clave péptido pueden resaltar. Nuevas bases de datos se han ampliado el ancho de AntiJen para incluir los datos biofísicos, como la difusión de co-efficients y celulares de datos, tales como la abundancia de moléculas. El anticuerpo-proteína antigénica sub-base de datos proporcionará también un recurso clave para in vivo e in vitro, estudios, ayudar en la selección de anticuerpos y péptido / proteína objetivos.

AntiJen distingue de las otras bases de datos específicas de carácter vinculante [2 - 8] de diversas maneras. En primer lugar, se registra un mayor número de datos; MHC-péptido nuestra base de datos contiene más de 2000 entradas de más que MHCPEP [2] y 10000 entradas más que EPIMHC [7]. Además, no hemos restringido sólo a nuestros archivos o carpetas de alta a una categoría específica, como se ha visto en EPIMHC y las bases de datos de secuencias del VIH [5]. Además, AntiJen es actualmente una base de datos curada, que está en constante expansión.

Evidentemente, AntiJen es útil en el diseño de vacunas de subunidades y epítopo. Además, AntiJen es útil en el diseño de diagnósticos clínicos y otros reactivos de laboratorio, tales como la selección de péptidos para tetramer diseño. AntiJen también es útil en la parametrización de los modelos matemáticos en inmunología teórica [27]. El redesarrollo de la base de datos se ha centrado no sólo en contenido, sino también en infraestructura. El sistema actual, basado en epítopo cadena, y el índice de búsquedas de palabras clave, junto con una búsqueda BLAST, además de la nueva interfaz HTML, conduce a una mayor accesibilidad y usabilidad. Por último, la base de datos actúa como un repositorio de cuantitativo, los datos continuos, para el desarrollo de los datos empleados en silico modelos de predicción, como la predicción de epítopos y MHC vinculante [18, 19, 28, 29] a través de modelación QSAR.

El trabajo futuro

Tareas futuras en el desarrollo de AntiJen, se dividen en dos categorías principales: la eliminación de las deficiencias, los errores y las incongruencias en la base de datos y, al mismo tiempo que se refuerzan mediante la expansión de su profundidad, amplitud y alcance. También tenemos que controlar las actualizaciones en bases de datos externas, de manera que cualquier modificación se reflejan en el archivo. Al igual que todos los otros repositorios, AntiJen es propenso a los errores sistemáticos y aleatorios en el proceso de acumulación de datos. La opinión de los usuarios y nuestras interacciones con los inmunólogos se espera abordar la persistencia de los errores. Deficiencias en nuestra base de datos incluyen nuestra actual incapacidad para codificar químicamente o post-translationally péptidos modificados, no natural MHC mutantes y no aminoácidos peptidomimetic MHC ligandos. Además, también sería interesante complementar los datos existentes en nuestro PAT vinculante con información sobre las vías de presentación de antígenos, como proteasomal y catepsina división patrones. Por otra parte, la recopilación de las células B de anticuerpos o epitopo de datos es un área madura para el desarrollo robusto. Lineal y epítopes conformacionales de células B son mucho más grandes en número que nuestros actuales compilación, dejándonos margen para aumentar en gran medida registrada epítopos.

Conclusión

El desarrollo de una base de datos siempre es un trabajo en progreso. No sólo porque la literatura es de fácil acceso en general siempre en aumento, sino también por el deseo de captar la mayor cantidad de las existentes, pero ocultas, la literatura, como sea posible. En la era post-genómica, la base de datos ha formado la base de la bioinformática y el idioma; las bases de datos son cada vez más próximos a apuntalar nuestra moderna comprensión de la biología como un todo. Tradicionalmente, las bases de datos han surgido como respuesta a la necesidad, en respuesta a la idiosincrasia individual y de las preguntas formuladas por los biólogos. Sin embargo, la historia de la bioinformática bases de datos ha puesto de manifiesto la extraordinaria diversidad de formas en que se archivan los datos se pueden utilizar.

En la creación de AntiJen, que en parte fueron motivados por nuestro deseo, y el deseo de los colaboradores, a utilizar los datos dentro de ella para construir modelos de predicción in silico [16, 17, 28, 29], y, en parte, por un deseo altruista más para generar un Útil, el sistema de base de datos integrado con enfoque cuantitativo. AntiJen tiene muchos usos potenciales en todo el inmunológicos disciplina, de immunoinformaticans experimental a inmunólogos y vaccinologists. Al aumentar el grado en que los datos son de lectura mecánica y web accesibles, abrir nuevas, y antes de impensado, avenidas bioinformáticas para la exploración de los datos inmunológicos.

AntiJen es uno de los principales datos de recursos, entre los más completos de su tipo, y sin embargo, al igual que SWISSPROT [12] o [30] GenBank décadas atrás, todavía es relativamente pequeño y ofrece mucho margen para mejorar la anotación. Consideramos que la base de datos como una base desde la que consolidar, a través del tiempo, logrando así una fuente completa de información de los datos inmunológicos.

Agradecimientos

Reconocemos la útil asistencia de la Sra Christianna Zygouri. También queremos agradecer a la Dra P Borrow y Prof V Brusic útil para los debates. Edward Jenner El Instituto para la Investigación de Vacunas desea agradecer a sus patrocinadores: GlaxoSmithKline, el Consejo de Investigación Médica, Biotecnología y el Consejo de Investigación de Ciencias Biológicas, y el Departamento de Salud del Reino Unido.