Proteome Science, 2006; 4: 8-8 (más artículos en esta revista)

La publicación de datos proteómicos

BioMed Central
Martin Latterich (martin.latterich @ mcgill.ca) [1]
[1] Departamento de Anatomía y Biología Celular, Universidad de McGill, Montreal, Quebec, H3A 2B2, Canadá

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.

Resumen

Las publicaciones científicas deberían proporcionar suficiente detalle en términos de metodología y presentó datos que permitan a la comunidad para reproducir la metodología para generar datos similares y llegar a la misma conclusión, si la misma muestra se presenta para su análisis. El advenimiento de alto rendimiento en los métodos de experimentación biológica imponer algunos desafíos únicos, tanto en la presentación de los datos en formato de impresión clásica, así como en la descripción de la metodología de análisis de datos y con el suficiente detalle como para que se ajusten a las buenas prácticas de publicación. Para facilitar este proceso, proteoma La ciencia es la adopción de un conjunto de la metodología y la presentación de los datos directrices para permitir a las dos revisores, así como la comunidad científica, para evaluar mejor de alto rendimiento estudios proteómicos.

Editorial

Históricamente, la mayoría de las publicaciones científicas incluye una detallada sección de metodología que se facilitaba información detallada sobre la fuente de reactivos, la información, tales como lote o los números de lote, y una descripción de la metodología que permita a otro grupo de investigación a seguir los mismos procedimientos. Teniendo en cuenta el mismo material de partida, esta práctica permitiría llegar a idénticos o muy similares datos. Por lo menos, las secciones metodología debe hacer referencia a publicaciones anteriores que proporciona suficiente detalle experimental para permitir la reproducción de experimentos científicos. La mayoría de las publicaciones a continuación la pantalla "típica" de resultados, tales como fotografías o micrográficas de los sujetos experimentales, las imágenes de moléculas detectadas, o mínimamente procesados los datos, tales como evaluar estadísticamente los gráficos o cuadros. Estos resultados fueron exhibidas junto con el negativo y, a menudo, los controles positivos que validar el experimento y los reactivos. La prensa escrita era en su mayoría suficiente para publicar estos estudios, porque la mayoría de los estudios investigó los fenómenos individuales o moléculas.

El advenimiento de alto rendimiento en métodos biológicos de experimentación han impuesto algunos retos únicos tanto en la presentación de los datos en formato de impresión clásica, así como en la descripción de la metodología de análisis de datos y flujo de trabajo con el suficiente detalle como para que se ajusten a las buenas prácticas de publicación. Esto es especialmente un problema con los análisis proteómicos llevada a cabo por espectrometría de masas [1, 2]. Los medios electrónicos públicos y repositorios están abordando la necesidad de que la publicación de conjuntos de datos uninterpreted [3 - 5], tales como el crudo o mínimamente procesados espectrómetro de masas de datos, así como listas de péptidos identificados. El resto del desafío está en la generación de ontologías comunes experimentales y descripciones que captar la riqueza de información que ha ido tanto en el diseño y el análisis de experimentos proteómicos. Esta última instancia se necesita cuando se comparan directamente multi-centro de estudios.

Se ha avanzado mucho por la comunidad para proponer las normas de formato de datos que son compatibles con la mayoría si no todas las plataformas de análisis [5, 6]. Sin embargo, parece haber menos conformidad a la comunidad la hora de decidir cuáles son mínimas normas de publicación de tales datos proteómicos [3]. El procedimiento de revisión inter pares es normalmente lo suficientemente rigurosos para eliminar las presentaciones que se consideran de mala calidad debido al diseño del estudio, la elección de métodos, o en general la calidad de los datos. Por desgracia, depende de la pericia de los pares revisor, metodológicos detalle a veces no es considerado tanto como debería. Mientras que en el corto plazo, estos estudios tendrán su lugar en la comunidad, a largo plazo que no podrá ser considerado válido porque carece de detalles descriptivos.

Para garantizar que los estudios de esta naturaleza resistir la prueba del tiempo, proteoma Ciencia ha adoptado un conjunto de la metodología y la presentación de los datos directrices para permitir a las dos revisores, así como la comunidad científica, para evaluar mejor de alto rendimiento proteómicos estudios necesarios para péptidos y identificación de proteínas. Estas directrices son de medio-no de arriba hacia abajo directrices para restringir la publicación; lugar, se pretende reflejar la comunidad de las normas aceptadas en el campo. Como siempre con normas de la comunidad, la publicación de orientaciones propuestas por la HUPO Proteómica Iniciativa de normalización [7] se espera que contribuyan a que nuestros autores para resistir la crítica de la proteómica comunidad lo largo del tiempo. Ellos no son en modo alguno la intención de imponer un método estandarizado para realizar experimentos, lo cual sería contraproducente para esta todavía incipiente y apasionante campo. Esperamos que nuestros autores a que se adhieran a la buena práctica científica, tales como los materiales, métodos de preparación de muestras, las condiciones precisas para que las muestras fueron expuestas con anterioridad a la toma de muestras, y el número de veces que un experimento se ha llevado a cabo. Además, si los autores utilizan la espectrometría de masas para identificar las proteínas en sus muestras, se recomienda la adhesión a las siguientes directrices que permitan re-interpretación de los datos experimentales y comparación con otros estudios.

El siguiente a la publicación de directrices para la presentación de informes y la documentación de espectrómetro de masas basado en péptidos y proteínas identificaciones, en parte, han sido propuestos por la HUPO Proteómica Iniciativa de normalización [7, 8]. Ellos fueron muy consultados durante la elaboración de recomendaciones para la publicación proteoma Ciencia:

(a) Información que debe incluirse en manuscrito presentado:

1. Marca, modelo y número de versión de espectrómetro de masas, versión de software de funcionamiento, adquisición parámetros detallados, especificaciones y el rendimiento, tales como la resolución, la sensibilidad y el rango dinámico. Si LC-MS/MS se realizó, marca, modelo y versión del sistema de HPLC, que operan en las especificaciones de flujo, gradientes y columnas utilizadas. Los detalles sobre la fuente de ionización y condiciones. Número de veces que experimento se ha realizado, y la concordancia entre los experimentos.

2. El método (s), software (incluyendo número de versión) utilizado para crear la cima de la lista de crudo espectros, y los pertinentes parámetros utilizados en la creación de la lista pico. Si la costumbre o algoritmos de software fueron utilizados para elaborar la lista, estas deben ser enumerados en el detalle. Los ejemplos incluyen parámetros, tales como suavizado, relación señal-ruido, ya sea cargo se calcularon los estados o de picos-isotoped. En los casos en que el procesamiento adicional personalizada de listas de punta se han realizado, como la agrupación o filtración, o el algoritmo de software (incluyendo versión) deben ser referenciados o descritos.

3. La solicitud y número de versión utilizado para búsqueda en bases de datos, así como los parámetros de búsqueda. Algunos ejemplos son los precursores de masas de iones de litio tolerancia, fragmento de masas de iones de litio tolerancia, fijos y variables para permitir modificaciones, el número de divisiones perdido, proteína división agentes, isotópicos o isobárica marcado química, y así sucesivamente.

4. El nombre y la versión de la secuencia de bases de datos y la secuencia espacio de búsqueda, incluidos los detalles sobre la taxonomía de búsqueda y otras restricciones. Si la base de datos fue compilada costumbre, una descripción completa de la secuencia fuente es necesario, y si no son fácilmente reproducibles, una disposición para hacer la base de datos a disposición del público es necesaria. El número de entradas en realidad búsquedas de cada base de datos debe incluirse. Los autores deben justificar el uso de bases de datos muy pequeñas, ya que esto puede generar confusión cesiones. Común contaminantes (keratins, tripsina) debe incluirse en la base de datos.

5. Los métodos utilizados para interpretar MS / MS datos, y los valores umbrales específicos para juzgar la probabilidad de identificación, los métodos estadísticos utilizados, descripción y análisis de cómo ha sido validada, necesidad de ser descrito.

6. Para los grandes proyectos (por ejemplo, la cartografía o la comparación entre fracciones complejas), más los correspondientes datos estadísticos deben ser enumerados, ya que son pertinentes para la identificación certeza, determinación de falsos positivos, al azar de validación de datos, u otros métodos computacionales.

(b) Cuando la recopilación de información para la identificación de proteínas, la siguiente información debe incluirse:

1. Número de Acceso y una base de datos fuente.

2. Resultado (s) y cualquier información estadística de las búsquedas realizadas.

3. Secuencia de cobertura, expresada como el número de aminoácidos abarcó el asignado por péptidos de la proteína intacta de longitud.

4. El número total de péptidos asignado a la proteína. Para calcular este número, las distintas formas del mismo péptido se hará como un péptido.

(c) Al presentar relativa y absoluta cuantificación de datos, la siguiente información debería figurar además de la información en la sección (b):

1. La cuantificación métodos utilizados y las condiciones de etiquetado, si los hubiere.

2. Patrones de calibración utilizados, si los hay.

3. Algoritmos, software, método y los detalles sobre cómo cuantitativos se obtuvieron los datos.

4. Concordancia y de la varianza para los diferentes péptidos de la proteína misma, y método utilizado para el individuo promedio péptidos para una determinada proteína.

5. Información estadística adicional, como p-valores cuantificados de proteínas, y la varianza común entre experimental repite.

Conflicto de intereses

El autor (s) declara que no tienen intereses en competencia.

Autores de las contribuciones

ML contribuido al 100% para el Comentario Editorial.

Agradecimientos

ML desea dar las gracias a Ralph Bradshaw para compartir generosamente los ISP normas de la comunidad. ML también desea reconocer el apoyo de los CIHR, TPI, Genoma Canadá y Genoma Quebec para financiar la investigación en su laboratorio. ML titular de un primer nivel de investigación de Canadá Presidencia.