Journal of Biomedical Discovery and Collaboration, 2007; 2: 1-1 (más artículos en esta revista)

Especialistas en información biológica para la informática biológica

BioMed Central
P Bryan Heidorn (pheidorn@uiuc.edu) [1], Carole L Palmer (clpalmer@uiuc.edu) [1], Dan Wright (dtwright@uiuc.edu) [1]
[1] Escuela de Estudios Superiores de la Biblioteca y Ciencias de la Información, Universidad de Illinois en Urbana-Champaign, EE.UU.

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.

Resumen

Gestión de datos y la integración son complicadas y los problemas que requerirán el compromiso de recursos y conocimientos de las diversas comunidades de ciencias biológicas. Componentes primarios de éxito cruz escala de integración son buen manejo de la información y la migración de un contexto a otro. Hacemos un llamamiento para una ampliación de la definición de la bioinformática y la bioinformática para la formación abarcan las disciplinas biológicas y biológicas escalas. Los programas de capacitación que se necesitan educar a una nueva clase profesional de la informática, los especialistas de Información Biológica, para trabajar en colaboración con diversas disciplinas de investigación específicos. Especialistas de la Información Biológica son una extensión de la Información que se inició el movimiento dentro de la biblioteca y las ciencias de la información (LIS) hace más de 30 años como profesional posición para llenar un vacío en la medicina clínica. Estos profesionales ayudarán a avanzar la ciencia mediante la mejora del acceso a la información científica y de liberar a los científicos que no están interesados en la gestión de datos para concentrarse en su ciencia.

Fondo

Existe una creciente conciencia de la necesidad de trabajar hacia la integración de datos biológicos a través de escalas, desde la biomoleculares a los ecosistemas. En particular, los recientes informes sobre ciberinfraestructura y e-ciencia iniciativas reconocen la escasez de profesionales cualificados para gestionar el aumento de almacenes de datos científicos [1]. Gestión de datos y la integración son complicadas y los problemas que requerirán el compromiso de recursos y conocimientos de las diversas comunidades de ciencias biológicas. Datos cuestiones incluyen, por ejemplo, las normas formales basados en la representación de condiciones experimentales, procedimientos y datos generados para permitir la federación de datos y único fin de que las solicitudes no necesitan ser construidas para cada conjunto de datos. Y, mientras que los datos son cuestiones centrales para el futuro de la empresa científica, que no existen de manera aislada. Son parte de una gran familia de actividades de información y comunicación que han surgido de la rápida evolución de muchas de las nuevas tecnologías esenciales y los biológicos a través de dominios. Grandes cambios y avances en el uso de información están influyendo en todos los modos de la investigación científica, desde la administración de las grandes ciencias de la conducta del banco de trabajo diario, en todos los ámbitos de la investigación biológica.

Como parte de esta tendencia, la bioinformática se está desarrollando programas en todo el país. Se centran de manera eficaz en cuestiones como la modelización molecular de genes y ontologías, sin embargo, con la excepción de algunos programas de informática médica, que no cubren de manera global la amplia gama de información biológica se refiere incluyendo normas para el intercambio de datos, la preservación digital, y la publicación electrónica . Bioinformática programas en las universidades tienden a centrarse en la biología molecular computacional [2], aunque la bioinformática ha sido ampliamente interpretado en sectores de la comunidad científica que se aplica a todas las escalas de datos biológicos, como pone de manifiesto en el NIH Biomédicas Ciencias de la Información y la Iniciativa Tecnológica (BISTI) documentación: "Investigación, desarrollo, o la aplicación de herramientas computacionales y enfoques para ampliar el uso de agentes biológicos, médicos, de comportamiento o datos sanitarios, incluidos los destinados a adquirir, almacenar, organizar, archivar, analizar o visualizar esos datos" [3] .

Los actuales programas educativos han tendido a concentrarse en el análisis, cálculo y visualización de datos moleculares o información de salud. En la informática biomédica, hay una serie de programas de informática en sentido amplio [[4], p. xv]. Estos programas tienden a definir como informaticists que operan en la relación clínica. Por ejemplo, la Asociación de Bibliotecas Médicas a raíz de un informe de Annals of Internal Medicine editorial [5] "Un informaticist ..., posee un profundo conocimiento tanto en la medicina clínica y la búsqueda de información y evaluación y que el conocimiento emplea como parte de un equipo clínico" [6]. En el presente trabajo se defienden teniendo la experiencia adquirida y las preguntas planteadas en clínica informaticist programas de formación y la práctica y su aplicación a la definición más amplia de la informática biológica. Hay una necesidad de educar a una nueva generación de especialistas en información que estén capacitados para muchos aspectos de la gestión de la información y la integración a través de escala ya través de campos de la biología. Esto debe hacerse por una buena razón - los científicos necesitan para concentrar sus esfuerzos en la realización de la ciencia, no la administración de la información o que luchan para desarrollar, utilizar y mantener sus sistemas de información.

Integración de datos y resultados a través de las escalas sólo será alcanzable si la gama de las ciencias biológicas es orquestada en este esfuerzo. Al mismo tiempo, los sistemas de información para los científicos deben basarse en una comprensión profunda de distintos intereses de investigación y las actividades de diferentes ámbitos biológico [7, 8]. En reconocimiento de los objetivos a largo plazo de amplia escala transnacional integración de la ciencia [9], de concebir las ciencias de la información esta iniciativa basada en la bioinformática como "la informática biológica." En respuesta directa a los cambios cualitativos en la investigación biológica y lagunas específicas de trabajo, estamos desarrollando una la informática biológica maestría programa para capacitar a una nueva generación de profesionales de ciencias de la información. Estos especialistas de la información biológica va a estar capacitados para apoyar la investigación y la comunicación local en la investigación científica, mientras que también los entornos de trabajo más global para desarrollar enfoques compartidos de larga vida y la integración de datos de información y herramientas a través de la biología.

Informática Biológica

La relación entre "bioinformática" y "la informática biológica" no es tan sutil como parece. En los últimos diez años en los EE.UU., el término "bioinformática" en general ha sido utilizado en el sentido de "información sobre la biología molecular", en particular de genes y secuencias de proteínas. Este uso del término en la prensa popular, en relación con los grandes avances y el éxito en ese campo, ha servido para consolidar esta definición en la psiques de la población en general y los científicos por igual - por lo tanto, la necesidad de un nuevo plazo (la informática biológica) a cubrir la ciencia de la información acerca de todos los niveles de análisis biológico. Salud informática, informática médica, neuroinformática, así como de información sobre biodiversidad biomolecular y la informática, todos los comprendidos en este concepto más amplio [10, 11]. Si bien utilizamos el término "la informática biológica" aquí para aclarar la amplitud del concepto, hay buenas razones para argumentar a favor de recuperar el nombre de "bioinformática" para cubrir toda la información acerca de la biología. Por ejemplo, la biodiversidad ecológica y la informática, los campos a menudo pasado por alto en los debates de la bioinformática, son un componente esencial de nuestra concepción de la informática biológica. Para más información sobre esta cuestión, véanse los comentarios de Hersh y nuestra respuesta a él, que puede encontrarse en los Comentarios de los lectores la sección que acompaña a este artículo.

De información sobre biodiversidad es el estudio de problemas donde los datos de adquisición de información, análisis, el intercambio y la colaboración son necesarios para responder a preguntas sobre una amplia diversidad biológica. La diversidad biológica se entiende "la variabilidad entre organismos vivos de cualquier fuente, incluidos, entre otros, los ecosistemas terrestres, marinos y otros ecosistemas acuáticos y los complejos ecológicos de que forman parte; esto incluye la diversidad dentro de especies, entre especies y de ecosistemas" [12] . Informática es tan vital para la biodiversidad biólogos como lo es para los biólogos moleculares. Como EO Wilson estados, los biólogos están recurriendo a las tecnologías de la información para producir eficiencias críticamente necesario en su trabajo, pero mucho más esfuerzo que se necesita: "Nueva tecnología electrónica, el aumento exponencial en el poder, es el recorte de costes y el tiempo necesarios para la descripción taxonómica y datos análisis. Se compromete a la velocidad tradicional sistemática de 2 órdenes de magnitud. Lo que falta y necesita ahora es un esfuerzo concertado, comparable con el Proyecto del Genoma Humano (PGH), para completar una encuesta mundial de la diversidad biológica - polo a polo, las ballenas a las bacterias, y en un plazo razonablemente breve de tiempo "[13]. Los cambios en la tecnología de la información han afectado a la cara de la diversidad biológica en el plano local para los científicos, pero sobre el terreno ha sido objeto de un revolucionario globalización y cambio de escala que ha introducido nuevos desafíos para la informática biológica.

De información sobre biodiversidad se superpone con otras ramas de la biología como la informática médica y la salud pública la informática en áreas tales como los relacionados con los vectores de enfermedades (es decir, el Virus del Nilo Occidental mosquitos vectores) de historia natural y el clima impulsado cambios en la distribución de especies, sin embargo, hay pocas personas capacitadas para cruzar los límites entre campos como la entomología, la botánica o la zoología. Esta superposición produce una demanda para compartir datos electrónicos. Es bien sabido que a larga distancia colaboración e intercambio de datos es "bueno" para la ciencia, y una serie de proyectos existentes que demuestren el carácter común de problemas y objetivos en este ámbito, a través de una variedad de disciplinas biológicas.

Un importante común entre los grandes proyectos de la informática biológica es la necesidad de que el almacenamiento eficiente de grandes volúmenes de datos y para la normalización de formatos que faciliten el acceso de la comunidad científica en general. El Protein Data Bank (PDB), el Global Biodiversity Information Facility (GBIF), y la Informática Biomédica Research Network (BIRN) han reconocido este problema y se van a reunir en varias maneras diferentes. La calidad de los datos y la deposición de las normas se abordan en cada uno de los proyectos de solución concreta a los problemas de almacenamiento de datos y el acceso. Otro desafío en el uso y administración de recursos de datos es la coordinación entre los investigadores, revistas, y el propio repositorio para asegurar el oportuno y útil la disponibilidad de los datos. Una vez más, es instructivo que se enfrentan a este problema cada uno de los proyectos antes mencionados ha tomado una diferente, pero relacionadas con el enfoque derivadas de las necesidades específicas de cada especialidad de datos.

La necesidad de integración a través de los campos y los elementos comunes subyacentes a los problemas enfrentados por los diferentes proyectos de la informática biológica, a nuestro juicio, las convocatorias de formación informática en general profesionales con una sólida base de conocimientos biológicos. Estos especialistas en información biológica (BISS) trabajará en colaboración con diversas disciplina específica de personal investigador en las ciencias biológicas para resolver los problemas relacionados con el diluvio de información general en las ciencias biológicas.

Especialistas de la Información Biológica

Nuestra concepción de la BPI es una extensión de la Información que se inició el movimiento dentro de la biblioteca y las ciencias de la información (LIS) hace más de 30 años. Comenzando con un énfasis en la clínica médica bibliotecología, informationists ya han avanzado más allá del ámbito clínico también a trabajar como miembros de grupos de investigación científica hacia objetivos similares de mejorar el uso de información y la comunicación entre los equipos. Es evidente que algunos de los mismos tecnológico y las fuerzas sociales que han moldeado la Información médica movimiento son ahora de todos los que impactan las ciencias biológicas.

A pesar de la muy real contribuciones informationists han hecho para practicar la medicina clínica, sigue siendo una desconexión entre la investigación biomédica, la práctica clínica, y la prestación de asistencia sanitaria. Por otra parte, las nuevas complejidades que se han introducido con la tecnología de la información y la generalización de conceptos como la medicina basada en evidencias, que reclaman explícitamente la integración de la investigación pruebas con el cuidado del paciente, aún a sabiendas de que reside en médicos y de salud relacionados con revistas, bases de datos y otros recursos no utilizados a menudo va. El médico informaticists y el bibliotecario clínico tienden a estar estrechamente vinculados entre sí y con el acceso a la literatura biomédica [14, 5]. Lo mismo puede decirse de no médicos informaticists y la biología para los bibliotecarios. Sin embargo, la naturaleza de la publicación de los descubrimientos científicos y están cambiando. Cada vez más, los datos primarios y secundarios se están convirtiendo en piezas auxiliares de la publicación o publicaciones en su propio derecho. Por lo tanto, BISS tendrá que ser competente con la literatura organización y búsqueda, sino también con la gestión directa de los datos primarios que se generan por los científicos cada vez más compartida y distribuida entre grupos de científicos. El BIS ciencias de la información facilitará las aptitudes tanto el consumo y la producción de información sobre investigación.

Informationists, trabajando en colaboración con equipos de médicos científicos para facilitar su interacción con y la utilización de los recursos de información, puede provenir de cualquiera de la información o la salud relacionados con los orígenes [15]. Y, como ha sido la experiencia clínica en la informática, en algunos casos los individuos entran en el BPI programa tendrá una formación previa, ya sea en biología o ciencias de la información en el pregrado, maestría, doctorado o el nivel. Pero en general, como Florance et al. [16] explican, la preparación de especialistas en información para trabajar en "ricos en información y medios para participar como iguales en la solución de problemas" exige la formación transversal en la biblioteca y las ciencias de la información y los conocimientos disciplinarios en los campos científicos. Por otra parte, su formación debe incluir una pasantía en una práctica. En la investigación biológica contemporánea BISS medio ambiente se necesita un equilibrio de las competencias que se extiende por todo el dominio de la investigación científica y las ciencias de la información, así como una comprensión práctica del proceso de investigación biológica. Nuestra experiencia hasta la fecha indica también que algunos candidatos título en las ciencias biológicas podría llegar a nuestro programa para aumentar su educación con la formación informática para ganar ventaja en el altamente competitivo ramas de la biología.

En la actualidad, hay más recursos de información disponibles para los investigadores biológicos, de systematists a los médicos, que nunca antes, y el número de los que están en desarrollo. Van desde bibliográficos y la información textual a los datos primarios, e incluyen los sitios Web de Internet, software de análisis de datos, herramientas de visualización, y las bases de datos de las publicaciones, los de ADN y secuencias de proteínas, y diversos tipos de datos de imagen. LIS es un contribuyente vital para la gestión, integración y utilización de recursos de información, porque es el único campo que tiene que ver con el paisaje completo de la información científica y las interacciones en él, y con la prestación de servicios a explotar esa base de conocimientos [17, 18]. Biss tendrá una formación adecuada para ordenar que el conocimiento de información para resolver problemas en forma concertada con los científicos, mientras que complementar, no duplicar, la pericia de los científicos computacionales. Computacional científicos seguirá siendo esencial para hacer avanzar el estado de la técnica en biología computacional. Biss será fundamental en el desarrollo de la ciberinfraestructura y los servicios de información necesarios para facilitar interdisciplinario y multi-escala la ciencia - los aspectos del trabajo científico que la NSF y NIH han identificado como clave para el futuro desarrollo de la investigación.

El BIS conjunto de habilidades se centrará específicamente en las siguientes áreas:

1) Evaluación y aplicación de sistemas de información: el usuario basada en la evaluación y la continua mejora de la calidad para el desarrollo de herramientas de trabajo y que se utilizan.

2) Obtención de información, gestión y difusión: el desarrollo de las bibliotecas digitales, archivos de datos, los repositorios institucionales, y herramientas relacionadas (por ejemplo, los datos de curación).

3) Información sobre la organización y la integración: la ontología de desarrollo, la estructuración de la información para la óptima utilización y uso compartido, y las normas de desarrollo.

Dentro del plan de estudios, estas habilidades serán asignadas a cursos, pasantías, tesis y trabajos (véase el grado a las necesidades [18]]. Las necesidades incluyen cursos en cuatro áreas principales: biología, bioinformática, ciencias de la computación y las ciencias de la información.

Parte de nuestro programa es realizar un seguimiento de las tendencias del empleo y las oportunidades de Biss y utilizar esa información para informar a nuestro continuo desarrollo curricular. Esperamos que también habrá una necesidad de crear conciencia entre los científicos, los grandes laboratorios de investigación, y organismos de financiación sobre el valor de BISS para aumentar la producción científica. Y, si bien algunos laboratorios son demasiado pequeños para poder permitirse profesionales dedicados, servicios de apoyo BPI puede ser centralizada para difundir costos a lo largo de muchos proyectos y unidades en una institución, como es el modelo actual con bibliotecas de investigación. El BIS formación será aplicable a la gama de ambientes de investigación científica.

Contribución a la Ciencia

BPI graduados contribuirán a la ciencia de hacer la información más útil a más científicos. Asimismo, los científicos libres que no están principalmente interesados en la gestión de datos para concentrarse en la investigación. Los problemas de gestión de la información científica y la integración son agudos y están aumentando cada día. Nacional y los organismos de financiación internacional cada vez más el apoyo a proyectos de investigación no sólo a las inversiones en la publicación de los resultados de las investigaciones en artículos de revistas, porque esas publicaciones ya no se consideran como el único producto final de la empresa científica. Las agencias reconocen ahora que también están invirtiendo en la creación de repositorios de datos que puedan servir como materia prima para la futura ciencia. Los científicos tendrán que comenzar a tratar los datos en formas que son fundamentalmente diferentes de las prácticas del pasado. Recogida y almacenamiento de datos será necesario estudiar el futuro de la interoperabilidad y la utilidad en otros de gran alcance contextos, no sólo las aplicaciones de un único experimento o un laboratorio. Esto necesariamente implica la gestión de la información muchas técnicas y prácticas que están fuera del alcance de lo que los científicos biológicos están acostumbrados a, y que sería oneroso en la parte superior de los rigores de la conducta cotidiana de la ciencia. Sin embargo, para los científicos que están interesados o deben interactuar personalmente con la tecnología de la información compleja la SIB puede desempeñar un papel de instrucción, así como la de intermediario.

El BIS programa tiene como objetivo formar a profesionales para prestar apoyo a lo largo de las ciencias biológicas. Esta cruzada enfoque tiene una serie de ventajas, principalmente que las soluciones encontradas por BISS de trabajo con los científicos en una disciplina particular puede ser aplicado a los datos problemas en otras disciplinas. Ejemplos de problemas que son universales a través de disciplinas incluyen: datos de la federación, la API de desarrollo, los formatos de almacenamiento de datos, y el archivo. Sin embargo, a diferencia de muchos puestos de trabajo de tecnología de la información, BPI trabajo exigirá importantes conocimientos biológicos de los dominios servido. Los estudiantes no sólo tener una amplia comprensión de la comunicación científica y la organización de la información, la recuperación y la gestión, que también serán necesarios para desarrollar una sólida comprensión de cómo encaja dentro de la informática, las ciencias biológicas.

Para ello, es esencial que la práctica de la investigación los científicos guía la forma en que estos profesionales serán capacitados. Hemos recibido financiación de la NSF de asociarse con científicos de varias disciplinas de la biología de varias instituciones, y la intención de ampliar la participación en los próximos años. Nuestros socios actuales incluyen a representantes de la Smithsonian Institution, Jardín Botánico de Missouri, el Departamento de Psiquiatría de la Universidad de Illinois en Chicago, y la Informática Biomédica Research Network (BIRN). Ellos están participando como parte de nuestro consejo consultivo científico, como los supervisores de prácticas, y de visitar los profesores. Estamos trabajando activamente para contratar más asesores y colaboradores para ayudar a definir las mejores prácticas y los principios generales en la informática biológica. A través de estas colaboraciones también esperamos para comenzar nuevos y útiles proyectos de investigación, que sería difícil sin la interacción relacionados con la enseñanza y pasantías, y continuar nuestro trabajo hacia la ampliación de nuestra comprensión del papel de la informática en el progreso científico (véase, por ejemplo, [ 10, 11, 19]].

Conclusión

Los principales investigadores en biología han reconocido la complejidad emergente y transversal escala fenómeno a ser fuerzas que impulsan el futuro de las ciencias biológicas [20]. Además, la National Science Foundation ha identificado a través de escala de integración como uno de los retos fundamentales que enfrenta la ciencia en el siglo 21. Un componente principal del éxito de cruz escala de integración se realice sin complicaciones de gestión de la información y la migración de un contexto a otro. Cuando se integra en laboratorios científicos, BISS permitirá el éxito de este tipo de ciencia. Mediante la formación de expertos para manejar la gestión de la información y tareas de integración, esperamos biológica para permitir a los científicos concentrarse en hacer ciencia y mejorar la calidad y la portabilidad de la información científica. En última instancia BISS será capaz de llenar, sino un nuevo papel esencial en la investigación en ciencias biológicas configuración, lo que resulta en una mejor ciencias biológicas y ciencias de la información mejor.

Agradecimientos

Este material se basa en trabajo apoyado por la National Science Foundation Grant No bajo IIS-0534567.