Proteome Science, 2006; 4: 1-1 (más artículos en esta revista)

Estimar las probabilidades de péptido a la base de datos de las identificaciones de LC-MS-FTICR observaciones

BioMed Central
Kevin Anderson K (kevin.anderson @ pnl.gov) [1], Mateo E Monroe (matthew.monroe @ pnl.gov) [2], Don S Daly (ds.daly @ pnl.gov) [1]
[1] Ciencias de la Computación y Matemáticas de la División de Laboratorio Nacional del Pacífico Noroeste, Battelle Boulevard, Richland WA, EE.UU.
[2] División de Ciencias Biológicas, Pacific Northwest National Laboratory, Battelle Boulevard, Richland WA, EE.UU.

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

El campo de la proteómica consiste en la caracterización de los péptidos y proteínas expresadas en una celda en condiciones específicas. Proteómica ha hecho rápidos avances en los últimos años a raíz de la secuenciación de los genomas de un número creciente de organismos. Una destacada tecnología de alto rendimiento para el análisis de la proteómica es el uso de la cromatografía líquida acoplada a la transformada de Fourier de iones de resonancia ciclotrón espectrometría de masas (LC-MS-FTICR). Biológicas significativas conclusiones pueden ser mejores cuando el péptido identidades devuelto por esta técnica van acompañadas de medidas de precisión y confianza.

Métodos

Después de una proteína digerida tryptically mezcla es analizado por LC-MS-FTICR, la observó masas y normalizado elución de las veces se detectan características estadísticamente corresponde a la teórica masas y tiempos de elución de los péptidos conocidos que figuran en una gran base de datos. La probabilidad de que se pongan en venta se estima para cada péptido en la base de datos de referencia utilizando métodos de clasificación estadística gaussiana bivariante suponiendo distribuciones de probabilidad sobre las incertidumbres de las masas y la elución normalizado veces.

Resultados

Una base de datos de 69220 características del 32-LC-MS FTICR análisis de un tryptically digerido la albúmina sérica bovina (BSA) muestra fue acompañada con una base de datos de población con un 97% de falsos positivos péptidos. El porcentaje de alta confianza identificaciones resultó ser compatible con otros procedimientos de la base de datos de búsqueda. BSA péptidos base de datos se identificaron con confianza alta, en promedio, en 14,1 de los 32 análisis. Los falsos positivos se identificaron, en promedio, en apenas 2,7 análisis.

Conclusión

El uso de las probabilidades a priori de que el contrario espera de péptidos y proteínas inesperado era la que mejores resultados en la identificación de péptidos objetivo de utilizar igualmente probable a priori probabilidades. Esto se debe a que un gran porcentaje de la meta péptidos son similares a inesperados péptidos que se incluyeron a ser falsos positivos. El uso de análisis por triplicado con un "2 de 3" de presentación de informes norma era la que han excelente rechazo de los falsos positivos.

Antecedentes

El alto rendimiento determinación de la identidad y la abundancia de péptidos y proteínas en una muestra biológica es importante para la biología de sistemas de investigación. Aunque muchos diferentes metodologías de la proteómica están en uso hoy en día, Pacific Northwest National Laboratory (PNNL) ha puesto en marcha un proceso de alto rendimiento basadas en múltiples tecnologías de la espectrometría de masas, incluida la cromatografía líquida acoplada a la transformada de Fourier de iones de resonancia ciclotrón espectrometría de masas (LC-MS-FTICR) [1 - 4]. Este proceso de alto rendimiento es diagramed en la Figura 1.

El PNNL proteómicos proceso de análisis consta de dos pasos principales: 1) la generación de un potencial de masa y de tiempo (PMT) etiqueta base de datos, creada a partir de los datos experimentales, que contiene todas las detecciones del péptido para el organismo que se estudian y 2) de alto rendimiento LC - FTICR-MS experimentos para identificar los péptidos y proteínas expresadas bajo distintas condiciones biológicas, utilizando la base de datos PMT etiqueta de identificación. La base de datos se genera a través de una serie de la espectrometría de masas en tándem (LC-MS/MS) experimentos, usando los datos obtenidos para crear un amplio conjunto de péptidos probable que se expresó por el organismo en el crecimiento y diversas condiciones de estrés. Dentro de la PMT etiqueta base de datos, cada péptido tiene una masa exacta (calculado a partir de su secuencia de aminoácidos), una vez observados normalizado elución (NET), y diversos indicadores de confianza asociados con ella, todos los que se desprende del análisis de la MS / MS espectros de fragmentación .

La masa de alta precisión de la LC-MS-FTICR péptido permite la identificación que se hizo mediante la búsqueda en la base de datos PMT etiqueta con las masas deisotoped observó en un espectro de masa. El ámbito de búsqueda se pueden reducir aún más el uso normalizado en el momento de la elución dado espectro [1]. Automatizado de búsquedas en bases de datos son necesarios para alto rendimiento proteómicos análisis de las muestras. Por LC-MS/MS análisis, de búsqueda de software que hace uso de los resultados a fin de reflejar el grado de adecuación entre el MS y los péptidos de datos en la base de datos ha sido desarrollado (por ejemplo [5]]. En el caso de LC-MS-FTICR análisis, se puede estimar las probabilidades de los partidos, proporcionando una medida directa de la confianza de péptido identificaciones. Se presenta una metodología estadística y los supuestos utilizados para estimar las probabilidades de los partidos de la LC-MS-FTICR características de péptidos conocidos en una base de datos. Norbeck et. Al. Han utilizado este método para estudiar la especificidad de los teóricos tríptico resúmenes de proteomes complejo [6]. Nuestra metodología de búsqueda se comparan las masas y observó la elución normalizado de las veces detectado características a la teórica masas y normalizado los tiempos de elución de la conocida péptidos en la base de datos. Demostramos nuestra metodología utilizando 32 LC-MS-FTICR análisis de un tryptically digerido la albúmina sérica bovina (BSA) y muestra una base de datos que consta de 72962 péptidos.

Nuestro trabajo se registró por primera vez en METMBS'04 [7], donde se centró en la obtención de estadísticas y el igualmente probable antes probabilidad caso ilustra con un ejemplo sencillo. Desde entonces, hemos ampliado nuestro campo de acción: perfeccionar nuestra motivación, la mejora de los algoritmos estadísticos, y la aplicación de estos en un ejemplo más complejo usando las probabilidades de rechazo antes de falsos positivos. Presentamos nuestro trabajo más reciente en este documento.

Métodos

El problema de la estimación de la probabilidad de que un péptido en un adecuado PMT etiqueta de la base de datos coincide con las mediciones de una característica de un LC-MS-FTICR análisis estadístico es un problema de clasificación. Es decir, las mediciones de que pertenezcan a uno de un número de poblaciones conocidas de estadística, pero de la que hizo que se presenten? Suponemos que la PMT etiqueta de la base de datos se establece la totalidad de la población posible. Aunque una clasificación estadística problema es oficialmente una decisión estadística bayesiana problema de las pérdidas, los costes de clasificación errónea, y a priori (antes) probabilidades, vamos a preocuparnos por el cálculo de probabilidades condicional procedentes de cada una de las posibles poblaciones, en vista de la medición [8 ]. Estas probabilidades condicional reflejará nuestra confianza en que los péptidos en la muestra analizada por LC-MS-FTICR. Un péptido que se considera identificado si la probabilidad condicionada es lo suficientemente grande; aquí, 0,95 se considera alta confianza.

Para empezar nuestro desarrollo de la probabilidad condicional, supongamos M i es el vector de medir la masa y la elución tiempo normalizado de la i-ésima función de la LC-MS-FTICR análisis, H i = (m i, t i). Vamos μ j = mj, μ decir) ser el vector de masa teórica y tiempo de elución de la j-ésimo registro (péptido) de la base de datos PMT etiqueta. Los subíndices m y t denotar la masa y la elución normalizado tiempo, respectivamente.

Si asumimos que si el i-ésimo elemento es el mismo que el j-ésimo registro, entonces M i es estadísticamente distribuido como una distribución gaussiana bivariante con media μ j vectores y matrices de covarianza Σ j. Como aproximación de primer orden, supongamos que la masa y la elución normalizado tiempo son independientes, de manera que Σ j es una matriz diagonal con elementos diagonales Y , En donde estas diferencias reflejan las incertidumbres medido en LC-MS-FTICR masas y normalizado elución veces.

A distancia normalizada de la medición M i es a μ j

Bajo el supuesto de independencia entre las mediciones de la masa y la elución normalizado tiempo. Si lo sabíamos antes de la probabilidad π j mediciones que provienen de la distribución asociada a la j-ésimo registro, entonces la probabilidad condicionada de que M i proviene de la j-ésimo registro, en vista de la medición M i, es

Donde N es el número de péptidos en el PMT etiqueta de la base de datos y determinante | Σ j | = . En este documento se comparan los resultados antes de utilizar los resultados con probabilidades de asumir igualmente probable antes de probabilidades (es decir, π = π j k para todos los j y k), que el rendimiento de probabilidades condicional

Las probabilidades anteriores en la ecuación (2) se pretende reflejar las de los analistas espera de la observación de la particular entre los péptidos de la muestra observada LC-MS-FTICR características. La probabilidad previa puede tener en cuenta la probabilidad de que las proteínas están presentes en la muestra y, a un nivel más detallado, la detectabilities péptidos de la proteína de cada uno (que varían a causa de la masa / cargo efectos).

Si dejamos caer la hipótesis de que el PMT etiqueta de la base de datos se establece la totalidad de los posibles péptidos en la muestra analizada, podemos admitir la posibilidad de que un LC-MS-FTICR característica es otra cosa cuando el d ij valores son grandes para todos los registros en la PMT Etiqueta de la base de datos. Ecuación (3) siempre asignar probabilidades, pero si d ij es mayor de 10,6 (aproximadamente el 99.5th percentil de la distribución chi-cuadrado con 2 grados de libertad), vamos a considerar el i-ésimo como característica inigualable.

Resultados

Nos corresponde 32 LC-MS-FTICR análisis de un tryptically digerido la albúmina sérica bovina (BSA) muestra a un PMT etiqueta de la base de datos que consta de 72962 etiquetas PMT (péptidos). El PMT etiqueta de la base de datos fue construida por analizar un tryptically digerido muestra de una mezcla de proteínas y péptidos estándar de 318 veces en un período de diez meses utilizando LC-MS/MS. Esta mezcla, que contiene BSA, el 11 de otras proteínas, péptidos y 23, ha sido recientemente propuesto como un estándar de evaluación de la calidad para su uso en estudios de proteómica [9]. Con el fin de poblar la base de datos con resultados positivos falsos, la LC-MS/MS datos fue registrada utilizando un organismo archivo de base de datos que combina ambas secuencias de la proteína conocida y secuencias de S. Oneidensis (Shewanella). La etiqueta resultante PMT lista contiene los tres tipos de péptidos: 1) péptidos bovina (incluidas las BSA), 2) de las conocidas, péptidos, proteínas estándar, y 3) péptidos Shewanella falsos positivos (97,1% de la PMT etiqueta de la lista). Así, la capacidad de la metodología de rechazar falsas coincidencias pueden ser probados.

El paquete de software SEQUEST [10] fue utilizado para identificar candidatos péptidos de la fragmentación de los espectros. El organismo archivo de base de datos proporcionada a SEQUEST figuran las secuencias de BSA, así como los otros 11 proteínas y 23 péptidos de la proteína mezcla estándar, 4 variantes de la queratina (proteína contaminante común de la preparación de la muestra), y 14 de otras proteínas estándar elegido Ya que son de uso común en otras mezclas de proteínas estándar. Además, el organismo archivo de base de datos figuran las secuencias para el 4897 Shewanella proteínas obtenidas de la secuencia repositorio en TIGR (21 de marzo de 2000). Esto dio la siguiente distribución de aminoácidos: el 0,27% de péptidos bovina, 0,54% de proteínas y el nivel de contaminantes conocidos, y el 99,2% de Shewanella proteínas y otros inesperados.

SEQUEST La búsqueda se realizó con la enzima normas apagada, lo que permite en parte y no tríptico péptidos a ser identificado, aunque nontryptic péptidos fueron excluidos de la base de datos PMT etiqueta. El PMT etiqueta de la base de datos se rellenan con las secuencias de haber correlación cruzada (XCorr) valores> 1,9 y delta correlación (DelCn) valores <0,10. Debido a la inherente tasa de falsos positivos en las secuencias determinadas por SEQUEST, los péptidos que se observaron en un solo MS / MS fragmentación del espectro están obligados a tener una mayor XCorr valores:> 1,9 para 1 + cargo especies,> 2,2 para 2 + Especies, y> 3,5 para 3 + especies (tenga en cuenta que 164461 MS / MS espectros que figura al menos una válida péptido vs total de 715724 MS / MS espectros). El péptido monoisotopic masas μ mj PMT en la etiqueta base de datos fueron calculados teóricamente. La elución normalizado veces (NET) μ decir empíricamente se determinaron a partir de la observada LC-MS/MS elución veces (usando discriminante resultados como los pesos [11]].

Los péptidos en la base de datos de etiqueta PMT fueron examinados para la identificación ambigüedades: se encuentran en múltiples péptidos o proteínas con etiquetas similares PMT. Sólo tres péptido secuencias resultaron ser comunes a dos diferentes fuentes de proteínas cada uno (un conejo y dos caballos péptidos también se Shewanella péptidos). Un tercio de la BSA péptidos (60 de 179) se estrecha en la normalización de la distancia métrica a otro péptido en el PMT etiqueta base de datos, 57 eran de cerca de un péptido Shewanella, uno fue cerca de un péptido de otra proteína bovina, y Un par de BSA péptidos fue muy cerca unos de otros. Alta confianza en la identificación de estos péptidos 60 BSA es poco probable.

La LC-MS-FTICR análisis fueron procesados con el sistema de análisis de datos PRISM, una serie de herramientas de software desarrollado in-house. El primer paso que participan deisotoping datos de la MS, de dar la monoisotopic masa, la carga, y la intensidad de los principales picos en cada espectro de masa. A raíz de esto, los datos fueron examinados en una moda en dos dimensiones para determinar los conjuntos de masa espectral de los picos que conforman cada péptido cargo del Estado-perfil. Cada función (conjunto de picos) representa a un solo componente de elución de la columna de LC y detectado por el espectrómetro de masas. La característica inherente de las propiedades son la mediana de la masa, tiempo central normalizado elución (NET), y una estimación de abundancia determinado utilizando la zona de la MS picos pertenecientes a la más abundante cargo en la función de estado. Características NET con valores ≥ 0,9 se omitieron en el análisis como tales características es más probable que los compuestos de masa de calibración están imbuidos en la realización de cada análisis.

La identidad de cada una de las características 69220, en los 32-LC-MS FTICR análisis de la BSA muestra se determinó mediante la comparación de la masa y NET de cada característica con la masa y de la NET 72962 PMT etiquetas en la base de datos. La normalización de las distancias de la Ecuación (1) se han calculado suponiendo 3 partes por millón de incertidumbre en la masa, es decir, σ mj = 0,000003 μ μ mj 0,000003, y la fijación de σ es decir igual a 0,025 añadido en la cuadratura al error estándar de la empíricamente determinado μ TJ. Por lo tanto, σ es decir refleja la incertidumbre de μ decir PMT en la etiqueta de la base de datos y LC-MS-NET FTICR error de medición. Tres casos fueron considerados en el cálculo de probabilidades condicionales, el primero de los cuales es nuestra propuesta de procedimiento y otros dos para la comparación.

Caso 1: condicional probabilidades se calcularon utilizando la ecuación (2) con probabilidades antes de fijar en función de si o no la PMT se espera de una fuente de proteína con una relación de 50:1, respectivamente. Las fuentes previstas de los 32 análisis de la BSA muestra se BSA, otras proteínas de la especie bovina, la tripsina, marcadores, y el común de la humanidad contaminantes (queratina variantes).

Caso 2: condicional probabilidades se calcularon utilizando la ecuación (3) con igual probabilidad antes de probabilidades.

Caso 3: al igual que el caso 1, pero con la Shewanella péptidos PMT eliminado de la base de datos de la etiqueta (con eficacia su configuración antes de probabilidades a cero, y no el cálculo de sus Ecuación (1) d ij valor).

A primera vista, parecería que el asunto 3 sería el más relevante en el análisis de muestras de BSA: eliminar de la base de datos PMT etiqueta de los péptidos completamente inesperado fuentes. Sin embargo, casi la misma "downweighting" que se puede lograr usando las probabilidades antes de Caso 1, sin quitar por completo la oportunidad de encontrar los péptidos si están realmente presentes. Hay razones de control de calidad para querer PMT grandes bases de datos de la etiqueta (para detectar la contaminación cruzada de las muestras, por ejemplo). Además, si el análisis de muestras desconocidas, PMT etiqueta extremadamente grandes bases de datos son igualmente necesarios y probablemente antes de probabilidades se utilizan para representar a la falta de información sobre la muestra.

Caso 1 resultados

Un gran porcentaje de las características de la LC-32-EM FTICR análisis de la BSA muestra fue inigualable en el análisis Caso 1. De las características 69220, 12287 (17,8%) aprobó la d ij <10,6 umbral para el apareamiento. 12287 Estas características fueron agrupados con uno o más de 9290 de los 72962 PMT etiquetas con probabilidad condicionada de concordancia mayor que 1 / 1000. 7083 características (10,2%) fueron identificados con alta confianza (es decir, con una probabilidad condicionada mayor de 0,95) y se resumen en la Tabla 1, dejando a 5204 coincide con características como ambigua. De las 179 etiquetas de BSA PMT, 47 fueron identificados en al menos 1 de los 32 análisis. Si bien una gran parte de la función fueron las identificaciones con los falsos positivos Shewanella péptidos, el 79,7%, los resultados fueron en general no reproducible como los péptidos se identificaron, en promedio, en sólo 2,7 de los 32 análisis. Que contraste con la BSA identificaciones que se identificaron en promedio en 14,1 de los 32 análisis. PNNL suele ejecutar las muestras por triplicado y se aplica un "2 de cada 3" norma para la presentación de informes péptido identificaciones. Sobre la base de esta norma de presentación de informes, el 13 de falsos positivos Shewanella péptidos se espera que esté informado (es decir, con probabilidades de ser ≥ 0,87 identificado en al menos 2 de cada 3 análisis), contrasta con el 16 BSA espera péptidos. Además de estos péptidos, de todos los otros péptidos en el PMT etiqueta base de datos, sólo el 2 péptidos de los contaminantes común de la humanidad y 1 marcador péptido se prevé que se informará. Mientras espera el número de falsos positivos es grande en comparación con el número esperado de la meta de BSA péptidos, el falso positivo es excelente teniendo en cuenta el rechazo del 97,1% de la PMT etiquetas eran falsos positivos y el 0,2% eran los objetivos.

Caso 1 resultados en comparación con los casos 2 y 3

Síntesis de la alta confianza de BSA péptido identificaciones de las Caso 2 y Caso 3 análisis se presentan en las tablas 2 y 3. Caso 2: El análisis de los mismos las características incomparables como Caso 1 (82,2%) debido a que el d ij valores de la ecuación 1 no dependen de las probabilidades antes de utilizarse en el posterior cálculo de la probabilidad condicionada. Caso 2: El análisis identifica 27,7% menos péptidos a través de la BSA 32 análisis que el Caso 1 análisis debido a la gran cantidad de péptidos de BSA que son ambiguas con otros péptidos (en su mayoría Shewanella péptidos como se mencionó anteriormente). Caso 3: El análisis deja un mayor porcentaje, 97,1%, de las características sin igual, debido a la significativamente menor PMT etiqueta de la base de datos. Sin embargo, casi todos (99,2%) de los partidos son de alta confianza y el 14,9% más de BSA péptidos son identificados a través de análisis de los 32 debido a la ambigua Shewanella péptidos es retirado de la consideración. Cuando BSA característica coincidencias con probabilidades condicional ≥ 0,6 se consideran, existe un 98,5% de acuerdo entre el Caso 1 y Caso 3 análisis (685 características de cada 696 y 695 elementos, respectivamente).

El número medio de los análisis en el que se identificaron las etiquetas PMT fue similar en todos los análisis de los casos. Teniendo en cuenta el "2 de 3" de información general, el Caso 2 para el análisis, 10 de BSA, el 13 de Shewanella, 2 queratina humanos, y 1 marcador péptidos se prevé que se informará. Caso 3 para el análisis, 17 de BSA, el 1 de las especies bovina, 1 E. Coli, 2 de queratina humanos, y el 1 de péptido marcador se prevé que se informará.

Conclusión

Validación de la estimación de las probabilidades condicionales es difícil debido a la falta de terreno verdad: proteína de las muestras que se consideran a menudo pura contiene 10% de impurezas y contaminantes mientras péptido digestión puede ser incompleta resulta en perdida fisuras.

El uso previo de las probabilidades para establecer el contraste de espera péptidos / proteínas inesperado era la que mejores resultados en la identificación de péptidos objetivo de utilizar igualmente probable antes de probabilidades. Esto se debe a que un gran porcentaje de la meta péptidos (BSA) fueron similares en el espacio a la PMT etiqueta inesperada péptidos (Shewanella), que se eligieron para ser falsos positivos en el PMT etiqueta de la base de datos. Igualmente probable antes probabilidades desempeñaría bien cuando hay poca o ninguna superposición. Cuando se utiliza el contraste antes de probabilidades, un gran porcentaje, el 81,9%, de nuestra confianza alta característica de las identificaciones se péptidos de fuentes inesperadas (falsos positivos). Utilizando igualmente probable probabilidades antes era sólo un poco peor con el 86,1% inesperada identificaciones. Sin embargo, en ambos casos, estas identificaciones no fueron inesperadas reproducible, que aparecen en menos del 3 de los 32 análisis en promedio.

El PMT integridad de la base de datos de etiqueta también es un problema, puesto que el 82,3% de las funciones eran incomparables, es decir, no se cierre a ninguna de las etiquetas en la PMT monoisotopic masa / normalizado elución espacio de tiempo. Sin embargo, esta concordancia es similar a la de otros PMT etiqueta procedimientos de la base de datos de búsqueda.

Examen de las proteínas a la que pertenece el conjunto combinado de péptidos podría ser de utilidad para mejorar la probabilidad condicionada calculado. Por ejemplo, la probabilidad de los péptidos derivados de proteínas con múltiples coincidencias péptido debe ser más elevado que el de los péptidos derivados de las proteínas o con solo unos péptido partidos. Si bien tuvo en cuenta la incertidumbre de los tiempos de elución determinada empíricamente, que se podría incorporar también en la adecuación del procedimiento SEQUEST XCorr o cualquier otra identificación de la puntuación de calidad de los péptidos en la base de datos PMT etiqueta. Por último, la comparación de lo observado con el NET NET previsto para el péptido [12] podría llevar a una nueva mejora en la utilidad de la probabilidad condicional.

Contribuciones de los autores

DSD, KKA MEM y detallada el problema físico de asignar etiquetas a péptido LC-FTICR observaciones. KKA DSD y la descripción física traducido en un problema de estadística, resueltas todas las cuestiones estadísticas y traducido en resultados estadísticos física declaraciones. KKA sugirió la clasificación estadística enfoque particular, el derivado algoritmos apropiados, desarrollado prototipos de código, llevado a cabo el análisis de datos, y destacó el producido resultados estadísticos. MEM extrajeron, filtrado, envasado y luego entregó la proteómica conjuntos de datos. DSD, y KKA MEM determina una adecuada interpretación biológica. DSD concebido y gestionado el estudio, reunidos en el proyecto inicial, y se desempeñó como el principal editor. KKA fue el principal autor del manuscrito. Todos los autores presentaron observaciones sobre los proyectos, entonces leído y aprobado el manuscrito final.

Declaración de intereses

Los autores declaran que no tienen intereses en conflicto.

Agradecimientos

Queremos dar las gracias al doctor Richard D. Smith y los investigadores del Servicio de Proteómica en el Pacific Northwest National Laboratory (PNNL) para colaborar en los debates sobre perspicaz péptido etiquetado y las cifras de confianza, y para la generación y el suministro de los datos discutidos aquí. Esta investigación fue financiada por el PNNL de biomoléculas y de la Iniciativa de Sistemas del Departamento de Energía de Genomas del Programa para la Vida. Procesamiento de la muestra y la proteómica, la gestión de los datos se realizó en el William R. Wiley Environmental Molecular Sciences Laboratory en el Pacific Northwest National Laboratory. El EMSL es financiado por la Oficina de Investigación Biológica y Ambiental de los EE.UU. del Departamento de Energía. PNNLis un multiprogram laboratorio nacional operado por Battelle Memorial Institutefor los EE.UU. Departamento de Energía en virtud del contrato DE-AC05-76RL01830.