BMC Systems Biology, 2007; 1: 12-12 (más artículos en esta revista)

Bioinformática lipidomics estrategias para el análisis: la caracterización de la obesidad relacionados con la esteatosis hepática

BioMed Central
Laxman Yetukuri (ext-laxman.yetukuri @ vtt.fi) [1], Mikko Katajamaa (mikko.katajamaa @ btk.utu.fi) [2], Gema Medina-Gómez (mgm28@cam.ac.uk) [3] , Tuulikki-Laakso Seppänen (tuulikki.seppanen-Laakso @ vtt.fi) [1], Antonio Vidal-Puig (ajv22@medschl.cam.ac.uk) [3], Matej Orešič (matej.oresic @ vtt.fi) [1]
[1] VTT Centro de Investigaciones Técnicas de Finlandia, Tietotie 2, FIN-02044, Espoo, Finlandia
[2] Turku Centro de Biotecnología, Tykistökatu 6, FIN-20521, Turku, Finlandia
[3] Universidad de Cambridge Departamento de Bioquímica Clínica, Addenbrooke's Hospital, Hills Road, CB2 2QR, Cambridge, UK

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.

Resumen
Fondo

Los lípidos son una parte importante y muy diversa clase de moléculas que tengan estructurales, de almacenamiento de energía y funciones de señalización. Analíticas modernas tecnologías de detección de permitirse muchas especies moleculares de lípidos en paralelo. Uno de los mayores retos de lipidomics es importante esclarecimiento de pathobiological fenómenos de la integración de grandes cantidades de nuevos datos disponibles.

Resultados

Presentamos computacional e informática enfoques para el estudio molecular perfiles de lípidos en el contexto de las rutas metabólicas conocidas y establecidas fisiopatológicos respuestas, utilizando la información obtenida de analíticas modernas tecnologías. Con el fin de facilitar la identificación de los lípidos, calcular el andamiaje de lípidos teóricamente posible sobre la base de lípidos conocidos bloques de construcción, tales como grupos de cabeza polares y ácidos grasos. Cada complejo de entrada está relacionada con la información disponible sobre las vías de lípidos y contiene la información que puede ser utilizado para su identificación automatizada de alto rendimiento UPLC / MS basados en lipidomics experimentos. La utilidad de nuestro enfoque queda demostrado por su aplicación a la caracterización de lipidomic el hígado graso de los obesos genéticamente resistentes a la insulina ob / ob modelo murino. Investigamos los cambios de correlación de la estructura lipidome utilizando análisis multivariante, así como reconstruir las vías moleculares específicos para especies de interés utilizando lipidomic disponible y los datos de expresión génica.

Conclusión

La metodología se presenta en este documento facilita la identificación e interpretación de alto rendimiento lipidomics datos. En el contexto de los ob / ob mouse hígado de perfiles, hemos identificado el paralelo entre las asociaciones de triglicéridos elevados niveles de las ceramidas y, así como la supuesta activado Ceramide síntesis de las vías.

Fondo

Los lípidos son una diversa clase de moléculas biológicas que desempeñan un papel central como componentes estructurales de membranas biológicas, las reservas de energía, y las moléculas de señalización [1]. Ellos son ampliamente definidas como hidrofóbicas o amphipathic pequeñas moléculas que pueden proceder en su totalidad o parte de la base Carbanión condensación de thioesters, y / o de carbocation basado condensación de unidades de isopreno [2]. Los lípidos contribuyen también a los estados fisiopatológicos comunes como la esteatosis hepática y lipotoxic inducida por la resistencia a la insulina, la enfermedad de Alzheimer, aterosclerosis, y las manifestaciones tóxicas de las enfermedades infecciosas [3, 4]. Por lo tanto la identificación y caracterización de estas redes metabólicas ofrece una oportunidad única para diseñar estrategias terapéuticas para prevenir o revertir estos estados patológicos.

Si bien los lípidos, y metabolome la investigación en general, a lo largo de los últimos decenios se vio ensombrecida por los avances de la genómica, la reciente y revivió el interés creciente en los lípidos que provocó varios nuevos esfuerzos en la investigación de lípidos ilustra su importancia biológica crítica. Lipidomics como un campo destinado a la caracterización molecular de especies de lípidos y sus funciones biológicas con respecto a la expresión de proteínas implicadas en el metabolismo lipídico y la función incluida la regulación de genes [5, 6].

Varios útiles los recursos públicos existentes que representan a diversos aspectos de información sobre los lípidos, como LIPID MAPAS [7, 8], Banco de lípidos [9], CyberLipids [10], y LIPIDAT [11]. El LIPID MAPAS consorcio presentó una nomenclatura que permite representar un compuesto de lípidos de un único de 12 dígitos de identificación [2]. LIPID MAPAS también incluye la espectrometría de masas en tándem (MS / MS) fragmento de información para varias especies moleculares de lípidos.

Con las capacidades mejoradas de los instrumentos modernos de la EM y las interfaces, se ha producido un aumento en el desarrollo global de los métodos de análisis de lípidos, ya sea mediante cromatografía líquida de espectrometría de masas (LC / MS), con sede métodos sensibles se centró en el análisis de lípidos totales en los extractos o clases específicas de metabolitos [12 - 15], directa o MS n impulsada por la digitalización de los datos que dependen de adquisición [16 - 19], sin separación cromatográfica. Debido a las características estructurales de los lípidos su identificación de los fragmentos de espectros de masa en general es más fácil que para otros componentes moleculares y hoy en día mundial del típico análisis de perfiles de lípidos permite la identificación de varios cientos de especies moleculares de lípidos en paralelo. Informática estrategias ya se han desarrollado las cuales se hace uso de espectrometría de masa enfoques basados en combinación con búsquedas en bases de datos para identificar rápidamente a determinadas clases de lípidos, como los fosfolípidos [16] o AGPI-mediadores derivados de lípidos [20]. Aunque es mucho mayor progreso sigue siendo necesaria en el área de análisis de los lípidos, uno de los mayores desafíos es elucidación de los fenómenos biológicos detrás de las grandes cantidades de lipidomics datos actualmente disponibles.

Los avances en los métodos de análisis, junto con la mejora de procesamiento de datos de soluciones de software [21 - 25], la demanda global de desarrollo de las bibliotecas de lípidos a nivel de sistema permite la identificación, el descubrimiento y posterior estudio de los lípidos. Integrativa estudios que combina múltiples tejidos lipidomic perfiles con otros niveles de información biológica, como la expresión génica y proteómica han sido posibles debido a esa capacidad [26, 27]. Actualmente dispone de bancos de datos como LIPID MAPAS necesario ofrecer un punto de partida para las exploraciones de la lipidome y una referencia para la validación de los resultados. Sin embargo, en el contexto del alto rendimiento lipidomic de perfiles y estudios de biología de sistemas, actualmente los recursos disponibles en línea se enfrentan a un triple desafío:

1. Debido al gran volumen de información disponible de alto rendimiento lipidomics experimentos, el sistema de base de datos tiene que ser eficiente vinculada a la plataforma analítica generar el perfil lipídico de datos, así como a quimio y la bioinformática complejo sistema de identificación y la vinculación de la información a los demás niveles de organización biológica para permitir que los sistemas de enfoques.

2. Debido a la diversidad de los lípidos a través de diferentes organismos, tejidos y tipos celulares, es poco probable cualquier base de datos puede cubrir todas las posibles lípidos. Un mecanismo es necesario, por tanto, que facilita la identificación, así como el descubrimiento de nuevas especies de lípidos en los sistemas biológicos de los datos disponibles.

3. Actualmente está disponible vía de representación a nivel de lípidos en las bases de datos como KEGG [28] se limita a la vía de la representación genérica de las clases de lípidos, es decir, incluida sobre todo la información del grupo de cabeza, y sin incluir los ácidos grasos de cadena lateral información. Por lo tanto, estas bases de datos de lípidos falta el nivel de detalle que se está convirtiendo en modernas disponibles por LC / MS enfoques basados en.

Además, debido a las características estructurales de las diferentes clases de lípidos, a menudo regulado por las mismas enzimas en la clase de manera específica, hay un alto grado de co-regulación que se prevé en celulares, tejidos, o biofluid perfiles de lípidos. Con el fin de dilucidar los cambios del organismo lipidome como resultado de las intervenciones, el análisis de datos y la interpretación, por lo tanto, debe equilibrar el análisis global de cambios de patrón de lípidos con el análisis molecular de las especies que existen ramas específicas.

En este trabajo se presenta un bioinformática lipidomics estrategia para el análisis. Se utiliza el recientemente desarrollado nomenclatura de los lípidos [2] para generar un andamiaje de diversos compuestos lípidos representada por la simplificado Molecular de la línea de entrada Sistema de Ingreso (sonríe) la representación [29, 30]. Cada complejo de entrada está relacionada con la información disponible sobre las vías de lípidos y contiene la información que puede ser utilizado para la identificación automatizada de alto rendimiento LC / MS-basado lipidomics experimentos. Investigamos los cambios de correlación de la estructura lipidome utilizando análisis multivariante, así como reconstruir las vías moleculares específicas para los casos de interés utilizando lipidomic disponible y los datos de expresión génica.

Estamos validar nuestro enfoque de la investigación de los perfiles lipídicos asociados con esteatosis hepática observada en ob / ob de ratones. Nuestros resultados indican que la obesidad asociada esteatosis hepática del hígado implica una mayor deposición de triglicéridos de cadena corta especies asociadas con un aumento proporcional de los lípidos reactiva Ceramide especies. De interés, la contribución de triacilglicerol molecular de especies es heterogenesous según lo indicado por la presencia de un subconjunto de largo triacilglicerol especies que no contribuye al desarrollo de esteatosis. También presentó pruebas concretas de dysregulation Ceramide síntesis de las vías en esteatosis y la influencia del género en la composición de lípidos del hígado.

Resultados y discusión
Lipídico Informática

En este trabajo se centran principalmente en los estudios de glycerophospholipids, sphingolipids, glycerolipids, y ésteres de esterol. Las principales variantes estructurales entre estas clases son variaciones dentro de una o más cadenas de ácidos grasos y el jefe del grupo (ver un ejemplo en la Figura 1]. Con el fin de facilitar la identificación automática de los lípidos de lipidomics experimentos, hemos utilizado la normativa estructural de los lípidos especies moleculares computacionalmente para generar un conjunto diverso de los lípidos de "semilla" los ácidos grasos más probable que se produzca en los sistemas vivos (archivo adicional 1 se enumeran las semillas Los ácidos grasos utilizados en el presente documento). Nuestro actual elección de las semillas refleja el sesgo hacia las células de mamíferos, pero el enfoque es lo suficientemente generales como para permitir modificaciones adecuadas en función del área de interés.

Los ácidos grasos semillas se expresan en términos de simplificado Molecular de la línea de entrada Sistema de Ingreso (sonríe), que es un formato legible por el hombre lineal sistema de indexación de los átomos y bonos, dictada en virtud de las reglas sintácticas [29]. La naturaleza modular de la estructura de lípidos hace que las sonrisas representación muy adecuada para la tarea debido a la facilidad de manipulación algorítmica de los lípidos (sub) estructuras y sus modificaciones. Si bien en general SONRISAS múltiples representaciones pueden existir para un determinado compuesto, las versiones canónicas que permiten SONRISAS única representación están disponibles. Utilizamos la luz del día SONRISAS representación canónica (Luz del día, sistema de información química, Inc). Generamos un genérico SONRISAS plantilla de las distintas clases de lípidos y de aplicación de analizadores de ácidos grasos diferentes longitudes de cadena con el fin de crear todos los posibles compuestos de esta clase en la ventana de dar elegido de ácidos grasos de cadena. Sistemática el cumplimiento de los nombres de la nomenclatura de LIPID MAPAS se generaron algorithmically (archivo adicional 2 se enumeran las clases de lípidos generados y sus tamaños en la base de datos). Hora de SONRISAS Toolkit fue adaptada para obtener pesos moleculares y exacta de masas utilizando compuestos elemental masas cogidos de la literatura [31].

Nuestro enfoque se ilustra a continuación mediante una construcción sistemática de glycerophospholipids clases a modo de ejemplo:

1. Construir genérico SONRISAS plantilla para Fosfoglicérido clase. SONRISAS plantilla muestra de ácidos grasos de semillas variables en el sn-1 y sn-2 posiciones y jefe del grupo en sn-3 posición es la siguiente:

"C (sonríe de ácidos grasos de semillas variable (R1)) C (sonríe de ácidos grasos de semillas variable (R2)) COP (= O) ([O-]) OX)", donde X representa SONRISAS por parte pertinente del cabeza grupos como se muestra en la Figura 1.

2. El uso sistemático de los nombres correspondientes en contra de ácidos grasos de semillas SONRISAS para generar nombres usando el nombre común plantilla:

"1-nombre variable de semillas R1-2-nombre de semilla variable R2-sn-glycero-3-nombre que corresponde a X".

3. Convertir en canónico SONRISAS SONRISAS.

4. De sonrisas, obtener la fórmula molecular y el cálculo de peso molecular.

5. Obtener la distribución isotópica de que compuestos y adaptarla a la resolución del espectrómetro de masa.

Las diferencias en la duración y el grado de unsaturation grasos en acyl / alquilo cadenas de conducir a gran diversidad dentro de cada clase de lípidos. Cuando se pongan en venta esa base de datos con los resultados experimentales lipidomics, las búsquedas por lo tanto, inevitablemente, resultado en gran número de visitas, tanto debido a las numerosas coincidencias en masa, así como debido a las limitaciones del enfoque analítico. Con el fin de facilitar el cribado a través de múltiples éxitos, hemos creado un sistema de puntuación heurístico sobre la base de semillas de composición de ácidos grasos, tal como se describe en Métodos.

Lipidomics procesamiento de datos e identificación

Nuestra plataforma de perfiles de lípidos se basa en no específica en el análisis del total de lípidos usando extractos Ultra cromatografía de líquidos (UPLC), junto a cuadripolares tiempo de vuelo de espectrometría de masas. La plataforma características se describen en detalle en otra parte [32]. Con el fin de comprender mejor las actuales limitaciones de la estrategia analítica, así como porque nuestros enfoques computacionales son adaptables a otras plataformas, incluidos los que utilizan múltiples precursores y neutral pérdida de barrido [16, 18], el análisis y procesamiento de datos se describen aquí sólo brevemente .

Una visión general de la lipidomic flujo de datos se muestra en la Figura 2. Convertimos espectrómetro de masa cruda archivos a formato NetCDF para permitir el procesamiento de datos con MZmine caja de herramientas [21, 22]. Pico de detección y adaptación a parámetros MZmine se establecen basándose en la investigación preliminar de plataforma de características específicas, tales como pico de formas y tiempo de retención de variación. Tras el tratamiento, cada pico se caracteriza por la masa-carga (m / z) y tiempo de retención (RT) valores.

Con el fin de facilitar la identificación automática de los lípidos de las listas de pico, calcular el andamiaje teóricamente posible de los lípidos. LipidDB es una base de datos de los lípidos construido con sonrisas, tal y como se describe en la sección anterior. El interior de la biblioteca contiene la plataforma de información específica sobre las normas internas y los lípidos especies identificadas utilizando UPLC / MS / MS. Para facilitar la identificación de los lípidos basados en la espectrometría de masas de datos, calcular la distribución isotópica de cada especie molecular en las dos bases de datos. La distribución isotópica se basa en observar la abundancia natural de cada elemento en la fórmula química [31]. Masas isotópicas y dada la abundancia de composición química se prevé la utilización de Isótopos Plan Calculadora versión 1,4 [33]. Si bien el exacto patrones de isótopos se mantienen en la base de datos, los patrones se han corregido para la resolución del espectrómetro de masas cuando se pongan en venta con los datos del espectro.

La biblioteca interna de los lípidos se busca en primer lugar a garantizar la identificación de los patrones internos y que anteriormente se habían lípidos. Tiempos de retención de estos lípidos son utilizados como un obstáculo en la identificación de lípidos. El tiempo de retención de información por parte resuelve el problema de la identificación de fracciones de ácidos grasos. Las especies moleculares de la misma clase y composición de carbono, pero de diferente composición de ácidos grasos, tienden a eluir en diferentes momentos. La composición de ácidos grasos por lo tanto, puede determinarse en la muestra se ejecuta por separado utilizando la espectrometría de masas en tándem (UPLC / MS / MS) en negativo (fosfato o sphingolipids) o positivos (acylglycerols) el modo de iones. Con el fin de no comprometer las formas en punta de cromatografía de dirección, todas las referencias UPLC / MS / MS espectros se generan en distintas carreras, que se creó a fin de que los iones seleccionados para MS / MS análisis están bien separadas en el tiempo de elución. Hemos encontrado la variación de tiempos de retención para el método descrito a estar bajo el 1,25%, tal como se realizarán las pruebas de tejido o múltiples tipos de células durante un período prolongado de tiempo (más de 18 meses) para múltiples columnas UPLC C18 [32], por lo tanto, se confirma el tiempo de retención es un parámetro confiable con el propósito de identificación.

En la base de datos, la redundancia, debido a diversos composición de ácidos grasos por el mismo peso molecular pueden ser representados mediante la notación común que muestra el número total de carbón y de dobles enlaces. Por ejemplo, un diacylglycerophosphocholine especies GPCho (16:0 / 20:4 (5Z, 8Z, 11Z, 14Z)) (denominada como 1-hexadecanoyl-2-(5Z, 8Z, 11Z, 14Z-eicosatetraenoyl)-sn-glycero - 3-phosphocholine utilizando LIPID MAPAS nomenclatura) podrían estar representados también como GPCho (36:4). Sin embargo, GPCho (36:4) también podría representar a otras especies moleculares, por ejemplo GPCho (20:4 (5Z, 8Z, 11Z, 14Z) / 16:0) o GPCho (18:2 (9Z, 12Z) / 18: 2 (9Z, 12Z)).

Picos no identificado interior de la biblioteca se buscan en LipidDB. Lipídico identificaciones con LipidDB se pongan en venta la participación de m / z, comparando RT gama (sobre la base de conocimientos sobre los lípidos de biblioteca interna), comprobando heurísticas Resultado y / o MS / MS. Coincidencia de m / z valor es un requisito previo para su identificación. En algunos casos, isobárica especies se distinguen sobre la base de rangos de tiempo de retención y MS / MS. Protonadas phosphocholine especies son identificadas en incluso m / z y sphingomyelin especies son identificadas en impares m / z valores. Asimismo, comprobar si las identificaciones se originan a partir de la masas isotópicas, al mismo tiempo de retención. En última instancia, la identificación de especies isobárica, de no ser separados chromatographically, también depende de la masa de resolución y el tipo de espectrómetro de masas. En concreto, hemos observado co-fragmentación utilizando UPLC / MS / MS en phosphatidylcholines etanolamina y plasmalógenos en unos pocos casos. En tales casos, los instrumentos con EM n la capacidad y los detectores de alta resolución (es decir., Orbitrap o FTMS) puede ser necesario para la identificación exacta.

Reconstrucción de las vías moleculares de lípidos

Tras lipidomics procesamiento de datos e identificación, el análisis de datos por lo general incluye la exploración de datos, así como de su supuesto significado biológico. Además de los cambios en el nivel de determinados metabolitos, que pueden ser analizados mediante el estadístico univariado enfoques, co-regulación de los metabolitos es también de interés. La interdependencia de los metabolitos se ve impulsado por los mecanismos biofísicos como equilibrio químico, de conservación de la masa, o controlar la distribución asimétrica [34]. Desde los lípidos de la misma clase pueden ser, en parte, regulado por las mismas enzimas, alto grado de clase dentro de la corregulación se ha de esperar. Correlación análisis de redes ha demostrado ser una valiosa herramienta para explorar y visualizar co-reglamentación en la metabolómica datos [26, 35, 36]. Una matriz de coeficientes de correlación, una medida indirecta de la distancia entre los metabolitos [37], se calcula utilizando par-sabia correlación entre las concentraciones de lípidos en una muestra dada. La matriz se visualiza en forma de metabolito correlación red sobre la base de un cierto umbral de criterios sobre valores del coeficiente de correlación.

Con el fin de conocer los mecanismos moleculares que subyacen a la observada co-regulación (o similar para la desregulación en contexto específico), los lípidos agrupan necesidad de ser trazadas en el conocido vías. Kyoto Enciclopedia de genes y genomas (KEGG) [22], ha sido la principal fuente de información sobre las rutas metabólicas. Sin embargo, los lípidos KEGG vía de representación se limita generalmente a las clases genéricas de lípidos, es decir., Incluyendo principalmente el jefe de información del grupo, y sin incluir los ácidos grasos de cadena lateral información. A medida que el nivel de información de MS estudios es instancia específica de la subclase (por ej., 1-octadecanoyl-2-dodecanoyl-sn-glycero-3-phosphocholine) y no el común sub clase en sí (por ej., 1-acyl-2 - acyl-sn-glycero-3-phosphocholine), es un mecanismo necesario para convertir genéricos vía enzimática y de información KEGG base de datos a un caso concreto en estudio. Como hemos aplicado LIPID MAPAS nomenclatura, la conversión de nombres genéricos KEGG en LIPID MAPAS subclase nombres comunes y, a su vez nombres caso concreto de la cartografía permite identificado lípidos en las vías directamente desde MS-basado en estudios con otros niveles de información.

Estamos resolver la limitación genérica de los lípidos vías de instanciar KEGG (o relacionados) para vías concretas de lípidos especies moleculares de interés (Figura 3]. En la práctica, nuestra estrategia para representar KEGG vías implica los siguientes pasos:

1. Convertir nombres genéricos de los lípidos en la KEGG referencia de lípidos en vía sistemática subclase nombres comunes que permiten a convertir en nombre sistemático para determinados lípidos como por LIPID MAPAS consorcio.

2. Construir esquema XML para representar a los lípidos vía sistemática con los nombres de los lípidos y los números conocidos CE.

3. Generar el XML de un documento preguntó lípidos.

4. Use megNet vía herramienta de visualización [38] para mostrar la correlación red de lípidos vinculados a las vías y ontologías.

Este enfoque permite la visualización de las vías de interés en el contexto de observar los datos biológicos, incluidos los datos de otros niveles, tales como experimentos de microarrays. Actualmente no hemos añadido adicional a nivel de análisis cuantitativo sobre la base de información vía instancia, pero esta es una de las futuras consideraciones. Uno debe tener en cuenta la complejidad del problema, tales como los lípidos se regulan sistémico y sus niveles reflejan el equilibrio sistémico complejo, por lo tanto, sus vías en general, involucran a múltiples tejidos y compleja dinámica [39].

Perfil lipídico de tejido hepático en un modelo de ratón obeso

Nos ilustran la combinación de la informática y enfoque analítico en el hígado de ob / ob de ratones. El ob / ob es un obeso, resistentes a la insulina del ratón modelo resultante de la mutación espontánea de los ob gen que codifica la proteína leptina [40]. El ob / ob mouse es comúnmente estudiado como un modelo para la pronta aparición de la obesidad severa, resistencia a la insulina y el hígado graso. La figura 4 muestra típica de tejido hepático de imágenes ob / ob y de tipo salvaje (WT) ratón, respectivamente. La acumulación de gotas de lípidos se ve claramente en el modelo de obesos. La obesidad se asocia con depósito de triglicéridos (GTs) en el tejido hepático (hepatosteatosis). Hígado graso se desarrolla como consecuencia del aumento de ácidos grasos libres (FFA) disponibilidad en el contexto de la obesidad y resistencia a la insulina asociada a un aumento de la producción hepática de glucosa [1]. Hepáticas elevados niveles de FFA, más que conducir a un aumento de esterificación en GTs, pueden resultar del efecto combinado de una mayor afluencia de plasma FFAs, el aumento de novo FFAs, y la disminución de β-oxidación [41].

Los siguientes fueron los genotipos utilizados para el análisis: Wild Type (WT) y ob / ob. El estudio incluyó 12 ob / ob (6 hombres, 6 mujeres) y 10 WT (7 hombres, 3 mujeres) de ratones de 16 semanas de edad. Figura 5 se enumeran los resultados de ULPC / MS lipidomic de perfiles para determinadas especies moleculares, de un total de 192 especies moleculares identificados. Son notables los cambios en el upregulation ob / ob hígados de tri-y di-acylglycerol especies, diacylphosphoglycerols así como reactivos específicos Ceramide especies. Sphingomyelins, el sustrato para la síntesis Ceramide, downregulated apareció en el hígado de los ob / ob de ratones en comparación con su magra littermates. El aumento de acylglycerols Por consiguiente, debe considerarse la característica principal para el desarrollo de la esteatosis hepática observada en los ob / ob de ratones [42, 43].

Con el fin de incluir la estructura de las correlaciones de lipidomics datos en el análisis y, por tanto, explorar las posibles asociaciones entre las diferentes especies moleculares de lípidos, se les aplicó el parcial mínimos cuadrados análisis discriminante (PLS / DA) [44, 45] SIMPLS utilizando el algoritmo para calcular el modelo [46]. PLS / DA es un enfoque común para la metabolómica multivariado de análisis de datos [47, 48]. PLS análisis maximiza el producto de la matriz de varianza de variables medidas (por ejemplo, datos sobre el perfil lipídico) y correlación de datos medidos con propiedades de interés (por ejemplo, ob / ob y grupos WT). Persianas venecianas validación cruzada método [49] (con 4 divisiones) y Q 2 resultados fueron utilizados para optimizar el modelo. Dos variables latentes se incluyeron en el modelo con la Q 2 = 58%, lo que puede considerarse como un importante modelo. Figura 6A muestra la puntuación de la parcela PLS / DA modelo, como se esperaba con una clara separación entre los genotipos.

Las cargas en la Figura 6B indicó que observó la separación se debe en gran parte a la acumulación de acylglycerols a ob / ob mouse hígados. Interés de la mayoría de las ceramidas (incluso las más abundantes CER (D18: 1 / 18: 0) y CER (D18: 1 / 16: 0) especies) correlacionó con la triglicéridos de cadena corta, lo que sugiere la acumulación de especies reactivas Ceramide aumento de la hígado de los ob / ob de ratones proporcionalmente a la acumulación de niveles de triglicéridos. Curiosamente, similar correlación entre ceramidas y triacylglicerols se perdió cuando se considera el número de triglicéridos de cadena larga. Además, se observó la separación de los perfiles de lípidos basados en el género. La correlación entre triglicéridos y ceramidas es particularmente interesante ya que las especies reactivas Ceramide se cree que desempeñan un papel importante en el desarrollo de la obesidad asociada resistencia a la insulina [50]. Por lo tanto, nuestros resultados sugieren que la medición de triglicéridos en el hígado puede ser un buen indicador indirecto de otras especies reactivas de lípidos pathogenically pertinentes para el desarrollo de resistencia a la insulina.

También investigó las asociaciones lineales entre las especies de lípidos mediante la generación de una correlación de red. En la red, los bordes entre los nodos que representan a las especies de lípidos se extraen si la correlación de Pearson se reúne el criterio de corte (r> 0,75 y el valor de p <0,001). Los nodos son de color sobre la base de cambiar los valores veces comparando la media de los niveles de lípidos y obesidad WT ratones. Es interesante señalar que la red correspondiente a WT ratón hígado muestra contiene casi el doble el número de bordes (2073), en comparación con el número de bordes (1055) en la ob / ob mouse hígado muestra red. Selección de grupos de co-regulado lípidos correspondiente a su forma natural y ob / ob mouse muestras de hígado se muestran en la Figura 7. La disminución observada en el número de correlaciones entre las especies objeto de lípidos ob / ob condición, en comparación con WT sugiere disminución del nivel de la corregulación entre las especies de lípidos en la ob / ob mouse el tejido hepático, que puede atribuirse a ob / ob-órgano preferenciales específicos de enriquecimiento de subconjunto de los lípidos. Confirmando PLS / DA resultados, asociación de ceramidas y triglicéridos también se observó correlación mediante análisis de redes.

Se seleccionaron dos especies de lípidos, TG (54:3) y CER (D18: 1 / 18: 0) de la Figura 7B, y se asigna en la glycerolipid [51] y sphingolipid [52] referencia vías, respectivamente (Figura 8 ). Aunque la notación TG (54:3) es redundante ya que puede haber varias correspondiente especies moleculares de lípidos con el mismo grupo funcional, el número total de acyl carbones y dos dobles enlaces, hemos elegido un caso particular, TG (18:1 / 18:1 / 18:1), por vía de la representación. La Figura 8A muestra cómo esta particular especie de lípidos se encuentra en el sistema enzimático de la vía glycerolipid. La otra vía, sphingolipid vía, es la instancia de co-regulado a la red con el Ceramide lípidos especies CER (D18: 1 / 18: 0). Se utiliza para ilustrar la única disposición del público hígado ob / ob mouse datos de expresión génica de ChipperDB [53], obtenidos a partir de 2 meses de edad ratones machos.

Desde el itinerario sphingolipid mapa (Figura 8B] dos enzimas vinculadas a la Ceramide a través de reacciones metabólicas, es un SGPP1 (Sphingosine-1-fosfato fosfatasa 1, UniprotID Q9JI99), el otro GALC (galactosylceramidase, UniprotID P54818) se upregulated en ob / ob . SGPP1 participa en novo Ceramide síntesis, mientras que GALC participa en la liberación de Ceramide de glycosphingolipids. Curiosamente, sphingomyelin SM (D18: 1 / 18: 0) conocido como el precursor de Ceramide sphingomyelinase a través de la acción enzimática es downregulated, sphingomyelinase mientras que el nivel se mantiene. Por lo tanto, estos resultados indican que ambos glicolípidos y los ácidos grasos libres puede contribuir como una fuente de la elevada ceramidas observado en el ob / ob hígado graso. El elevado flujo de ácidos grasos en los tejidos periféricos es un conocido factor que conduce a un mayor Ceramide síntesis [50]. En contraste, la movilización de glycosphingolipids para la síntesis de Ceramide aún no se ha caracterizado en el contexto de la obesidad o resistencia a la insulina, aunque la importancia de glycosphingolipids en la regulación de la sensibilidad a la insulina ha sido reconocida [54]. Esto es claramente un área a ser investigados más a fondo.

Conclusión

Nuestra estrategia informática de lípidos facilitado en gran medida la interpretación de ob / ob mouse hígado lipidomic perfiles que se han traducido en la identificación de varias especies moleculares de lípidos. Cambios notables en los niveles de lípidos significa comparar obesos y su normal littermates identificados entre los lípidos incluyen upregulation de tri-y di-acylglycerol especies, diacylphosphoglycerols y específicos Ceramide especies, y downregulation de sphingomyelins a ob / ob de ratones. Red de correspondencias análisis reveló disminución del nivel de la corregulación entre las especies de lípidos en la ob / ob que refleja la condición específica de enriquecimiento de subconjunto de los lípidos. Hemos observado las asociaciones de corto y triglicéridos de cadena media y ceramidas, tanto en ob / ob y ratones WT, aunque estas especies fueron significativamente upregulated a ob / ob de ratones. El itinerario específico instantiation de especies moleculares de lípidos en combinación con la disponibilidad de datos de expresión génica revelaron que ambos glicolípidos y los ácidos grasos libres son las fuentes de elevación de ceramidas en ob / ob hígado graso.

Métodos
Base de datos de aplicación

Los lípidos de datos se almacena en una base de datos nativa XML aplicado a Tamino XML Server (Software AG). Cada complejo de entrada en la base de datos se describe por un identificador interno, anotando la información, clase, canónica SONRISAS, fórmula molecular, peso molecular y distribución isotópica. Perl scripts fueron desarrollados para convertir los datos en documentos XML. Documentos XML resultantes se cargan en masa usando la herramienta de carga de la base de datos Tamino.

En la ejecución de los pasos anteriores hemos hecho uso de software XMLSPY (Altova, Inc) y Tamino Schema Editor Software (Software AG) para la construcción y validación de lógica y física esquemas, respectivamente.

Heurística de lípidos base de datos de puntuación

Con el fin de facilitar búsquedas en bases de datos, asigna un valor de puntuación para cada compuesto en la base de datos se calcula la puntuación de los valores de las semillas de ácidos grasos que las cadenas de compuestos que se forma. Factores considerados comunes, mientras que la asignación de la puntuación a las semillas de ácidos grasos son cadenas naturales de la abundancia de ácidos grasos impares y / número par de átomos de carbono presentes en un ácido graso de cadena. Además, otro tipo de unión (por ejemplo, conectados por medio de éter de bonos) de los ácidos grasos de glicerol atrás hueso de carbono recibe diferentes Resultado. El menor la puntuación más probable es el compuesto se encuentra en la naturaleza. La puntuación total de lípidos es un producto de todos los ácidos grasos resultados. Resultado Random S, de cualquier compuesto de lípidos con una o más cadenas de ácidos grasos cuya puntuación de las variables V i (en posición Sn1), j V (a Sn2 posición) y V k (en posición Sn3) se obtiene de la siguiente manera

S = ( V i o V j Para los compuestos con un solo cadenas de ácidos grasos (en sn1 o sn2) V i × V j Para los compuestos con dos cadenas de ácidos grasos (en sn1 y sn2) V i × V j × V k Para los compuestos con tres cadenas de ácidos grasos (en sn1, sn2 y sn3) MathType MTEF @ @ @ 5 + 5 = @ feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqqGtbWucqGH9aqpdaGabeqaauaabaqadiaaaeaacqqGwbGvdaWgaaWcbaGaeeyAaKgabeaakiabbccaGiabb + gaVjabbkhaYjabbccaGiabbAfawnaaBaaaleaacqqGQbGAaeqaaaGcbaGaeeOrayKaee + gaVjabbkhaYjabbccaGiabbogaJjabb + gaVjabb2gaTjabbchaWjabb + gaVjabbwha1jabb6gaUjabbsgaKjabbohaZjabbccaGiabbEha3jabbMgaPjabbsha0jabbIgaOjabbccaGiabbsha0jabbEha3jabb + gaVjabbccaGiabbAgaMjabbggaHjabbsha0jabbsha0jabbMha5jabbccaGiabbggaHjabbogaJjabbMgaPjabbsgaKjabbccaGiabbogaJjabbIgaOjabbggaHjabbMgaPjabb6gaUjabbohaZjabbccaGiabbIcaOiabbggaHjabbsha0jabbccaGiabbohaZjabb6gaUjabbgdaXiabbccaGiabbggaHjabb6gaUjabbsgaKjabbccaGiabbohaZjabb6gaUjabbkdaYiabbMcaPaqaaiabbAfawnaaBaaaleaacqqGPbqAaeqaaOGaey41aqRaeeOvay1aaSbaaSqaaiabbQgaQbqabaGccqGHxdaTcqqGwbGvdaWgaaWcbaGaee4AaSgabeaaaOqaaiabbAeagjabb + gaVjabbkhaYjabbccaGiabbogaJjabb + gaVjabb2gaTjabbchaWjabb + gaVjabbwha1jabb6gaUjabbsgaKjabbohaZjabbccaGiabbEha3jabbMgaPjabbsha0jabbIgaOjabbccaGiabbsha0jabbIgaOjabbkhaYjabbwgaLjabbwgaLjabbccaGiabbAgaMjabbggaHjabbsha0jabbsha0jabbMha5jabbccaGiabbggaHjabbogaJjabbMgaPjabbsgaKjabbccaGiabbogaJjabbIgaOjabbggaHjabbMgaPjabb6gaUjabbohaZjabbccaGiabbIcaOiabbggaHjabbsha0jabbccaGiabbohaZjabb6gaUjabbgdaXiabbYcaSiabbccaGiabbohaZjabb6gaUjabbkdaYiabbccaGiabbggaHjabb6gaUjabbsgaKjabbccaGiabbohaZjabb6gaUjabbodaZiabbMcaPaaaaiaawUhaaaaa @ @ 2AE7

Modelo animal información de antecedentes

Los animales fueron alojados en una densidad de cuatro animales por jaula a una temperatura controlada por habitación (20-22 f C) con 12 h de luz / oscuridad ciclos. Los alimentos y el agua se dispone de ad libitum. Todos los protocolos de animales utilizados en este estudio fueron aprobados por el Ministerio del Interior del Reino Unido y la Universidad de Cambridge.

Los siguientes fueron los genotipos utilizados para el análisis: WT (Lep + / + Lep) y ob / ob (Lep ob / ob Lep). El estudio incluyó 12 ob / ob (6 hombres, 6 mujeres) y 10 WT (7 hombres, 3 mujeres) de ratones de 16 semanas de edad. Genotipos para el punto de mutación en el gen ob se realizó por PCR utilizando protocolos estándar.

Para el análisis de microscopía de luz, los tejidos del hígado fueron cuidadosamente disecados y fijados en formol al 10%. Tejido embebido en parafina y seccionadas mediante un micrótomo estándar (RM2125RT Leica, Leica, Reino Unido). Las secciones fueron teñidas con hematoxilina y eosina (H & E), utilizando protocolos estándar.

Lipidomic análisis

Una alícuota de 20 μ l de una mezcla patrón interno, 50 μ l de 0,15 M de cloruro de sodio y de cloroformo: metanol (2:1) (200 μ l) se añadió al pesarse (20-30 mg) muestra de tejido. La norma contiene la mezcla de lípidos siguientes: GPCho (17:0 / 17:0) (10 μ g / ml), GPEtn (17:0 / 17:0) (90 μ / ml), GPCho (17:0 / 0: 0) (320 μ g / ml), CER (D18: 1 / 17: 0) (90 μ g / ml) y TG (17:0 / 17:0 / 17:0) (100 μ g / ml).

La muestra fue homogeneizada y vortexed (2 min para el hígado o 15 segundos para islotes)) y después de 1 hora para el hígado o 20 minutos de islotes de pie centrifugada a 10000 rpm durante 3 min. Desde la fase inferior separadas, una alícuota se mezcla con 10 μ l de una mezcla estándar de marcado (10 μ g / ml GPCho (16:0 / 0:0-D3), GPCho (16:0 / 16:0-D6) y TG (16:0 / 16:0 / 16:0 - 13 C3) y 0.5-1.0 μ l de inyección se utiliza para LC / MS análisis.

Total de lípidos extractos fueron analizados en una Waters Q-TOF Premier espectrómetro de masa en combinación con una Acquity Ultra Performance LC ™ (UPLC). La columna, que se mantuvo a 50 ° C, es un Acquity UPLC ™ BEH C18 10 × 50 mm con 1,7 μ m de partículas. El sistema binario disolvente (caudal de 0,200 ml / min) A. incluido el agua (1% 1 M NH4Ac, HCOOH 0,1%) y B. LC / MS grado (Rathburn) acetonitrilo / isopropanol (5:2, 1% 1 M NH4Ac , 0,1% HCOOH). El gradiente de comenzado el 65% A/35% B, alcanzó el 100% B en 6 min y se mantuvo allí durante los próximos 7 min. El total de tiempo de ejecución por muestra incluido un 5 min re-equilibrio paso fue de 18 min. La temperatura del organizador de la muestra se fijó en 10 ° C.

Espectrometría de masas se llevó a cabo en Q-TOF Premier (Waters, Inc) ejecuta en el modo de ESI +. Los datos se recogieron más de la masa de m / z 300-1200 con una duración de exploración de 0,2 seg. La fuente se fijó la temperatura a 120 ° C y el nitrógeno se utilizó como desolvation gas (800 L / h) a 250 ° C. Las tensiones de la toma de muestras de cono y se capilar V 39 kV y 3,2, respectivamente. Reserpina (50 μ g / L) fue utilizado como el bloqueo de aerosol compuesto de referencia (5 μ l / min, 10 seg frecuencia de barrido).

Lipídico identificación se realizó mediante espectrometría de masas en tándem en negativo y el modo de iones positivos, como describió recientemente [32].

Autores de las contribuciones

LY desarrollado la metodología de lípidos informática, realiza los análisis de datos, y redactó el manuscrito. MK método desarrollado para el tratamiento de UPLC / MS lipidomics datos. GMG realizado experimentos con el ob / ob y WT animales. TSL lipidomics realizado el análisis. Coordinó la AVP los estudios in vivo, y redactó el manuscrito. MO initated el estudio, realizado los análisis de datos y redactó el manuscrito. Todos los autores leído y aprobado el manuscrito final.

Material complementario
Archivo Adicional 1
Tabla de semillas de ácidos grasos. La tabla muestra los ácidos grasos utilizados para la generación de lípidos andamio.
2 ficheros adicionales
Base de datos de lípidos (LipidDB) contenidos. La tabla muestra los diferentes tipos de lípidos que figura en la base de datos utilizada en el papel y su tamaño en la base de datos.
Agradecimientos

Esta labor fue apoyada por la Academia de Finlandia (n º 111338 Subvenciones y 207492), Marie Curie Internacional de reinserción de la Comunidad Europea, el Wellcome Trust Fisiología Integrativa programa, y de la UE FP 6 Hepadip programa integrado LSHM-CT-2005-018734. Damos las gracias a C. Ronald Kahn permiso para usar la expresión de genes de datos.