Proteome Science, 2006; 4: 2-2 (más artículos en esta revista)

Proteína división estrategias para un mejor análisis de la membrana proteoma

BioMed Central
Frank Fischer (frank.fischer-4 @ rub.de) [1], Ansgar Poetsch (ansgar.poetsch @ rub.de) [1]
[1] Bioquímica Vegetal, la Universidad Ruhr de Bochum, Universitaetsstrasse 150, Bochum, Alemania

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

Proteínas de membrana sigue siendo difícil en los estudios proteómicos. Esto se debe en parte a la distribución de los aminoácidos lisina y arginina, que son menos frecuentes en las proteínas integrales de membrana y casi ausente en hélices transmembrana. Como estos aminoácidos son los objetivos para la división de uso común proteasa tripsina, alternativa división condiciones, que debería mejorar el análisis de proteínas de membrana, se probaron in silico de la digestión de los tres organismos Saccharomyces cerevisiae, Halobacterium sp. NRC-1, y Corynebacterium glutamicum como punzones para eucariotas, archea y eubacterias.

Resultados

Para la membrana proteomes de los tres organismos analizados, identificamos división condiciones que lograr una mejor secuencia y proteoma cobertura que tripsina. La mayor mejora se obtuvo que para los de las bacterias levaduras, que se atribuyó a diferencias en el tamaño y la proteína GRAVY. Se demostró que bacteriorhodopsin para la predicción in silico de acuerdo con la observaciones experimentales.

Conclusión

Para examinar los tres organismos, se encontró que una combinación de toxina y quimotripsina peptidase he dado mucho mejores resultados que la tripsina. Como algunos de la división mejora de las condiciones no están más elaboradas que la tripsina y la digestión se han demostrado útiles en la práctica, suponemos que la división en dos hidrofílicas e hidrofóbicas aminoácidos debería facilitar, en general, el análisis de proteínas de membrana para todos los organismos.

Antecedentes

Los principales logros han sido los logros en el campo de la espectrometría de masas, a saber, las técnicas de ionización suave de MALDI [1] y ESI [2], que se han honrado en 2002 por el Premio Nobel de química [3]. Estos avances han planteado el análisis de proteínas a un nivel, donde en un experimento el estudio de la serie completa celulares de todas las proteínas, el proteoma, se ha convertido en posible. Para la tarea de identificación de proteínas, en la actualidad MALDI y ESI de ionización de las fuentes que se emplean comúnmente son junto a quadrupols, TOFs o trampas de iones para la separación de iones. Las proteínas son los productos químicos o cleaved con proteasas para obtener fragmentos más pequeños péptidos. En el habitual alto rendimiento MALDI experimentos, péptidos se miden en el rango de 600-4000 Da. Para ESI, ya sea un cuadripolares con una masa común de rango de 0 a ~ 4000 Da o una trampa de iones con una masa común gama de 600 a ~ ~ 4000 Da molécula se utiliza para la separación y análisis. El diseño de instrumentos de ESI es muy adecuado para la fragmentación de la molécula por la colisión con un gas inerte, que puede ser usado para determinar la secuencia de aminoácidos del péptido de las diferencias de masa de los fragmentos. No obstante, la tecnología para el estudio del proteoma, la proteómica, está lejos de ser maduro. Ciertas clases de proteínas, especialmente las proteínas integrales de membrana, sigue siendo difícil de alcanzar. Diferentes, existen métodos complementarios de separación de proteínas de membrana integral. Una posibilidad es separar solubilizados, proteínas de membrana intacta, que se puede llevar a cabo la electroforesis nativa con azul, SDS-PAGE, cromatografía, y combinaciones de las técnicas [4]. Por otra parte, la fracción de membrana se trata con proteasas para obtener péptido fragmentos que están separados por cromatografía multidimensional, por ejemplo, MudPIT [5] y sus secuencias automática, por ejemplo con el algoritmo SEQUEST [6]. Son varios los factores que pueden dificultar la detección de las proteínas integrales de membrana, como los problemas de solubilización, y la baja abundancia de proteínas. Otro problema es la imposibilidad de obtener péptidos de la proteína de división, que son adecuadas para la identificación de proteínas. Los aminoácidos lisina y arginina son menos frecuentes en comparación con proteínas de membrana de proteínas citosólicas [7]. Además, estos aminoácidos de carga positiva no están distribuidos de manera uniforme a lo largo de la secuencia de la proteína, pero principalmente están presentes en los dominios hidrofílicos y casi ausente en hélices transmembrana. De ahí que el uso común de proteasa tripsina es desfavorable para la hidrólisis de las proteínas integrales de membrana. Alternativas división condiciones, tales como el uso consecutivo de bromuro de cianógeno y tripsina [8], así como de otras proteasas como proteinasa K se han descrito [9] y superior a la tripsina demostrado en la práctica. Sin embargo, este último únicamente si MS / MS tecnologías pueden ser empleados para la identificación de proteínas y péptidos complejos generalmente produce mezclas. Además, no transmembrana (TM) fueron detectados por los dominios de proteinasa K tratamiento debido a las limitaciones experimentales. Como un eficiente solubilización de proteínas de membrana es un requisito necesario para su identificación por espectrometría de masas y la detección de los dominios TM, nuevos detergentes [10] o solubilización condiciones que emplean disolventes orgánicos [11] fueron desarrollados. Sin embargo, mucho más posible que se den condiciones de división a prueba experimentalmente para proteínas de membrana, pero con frecuencia no es posible poner a prueba a todos ellos en la práctica. Una alternativa más rápida para la detección de la nueva, las condiciones de división superior es llevar a cabo la digestión in silico (es decir, la simulación computacional), de toda la membrana proteomes. Silico En la digestión se ha llevado a cabo antes de la determinación de la idoneidad de los reactivos única división [12], y, a Realizar el análisis estadístico de proteomes [13]. Sin embargo, no se ha realizado en todo el proteoma escala para descubrir mejor división integral de las condiciones de proteínas de membrana, ni tienen la membrana proteomes de eucariotas, archae, y procariotas sido comparado.

Tomando la masa gama de instrumentos comunes, y de la MS / MS capacidad de ESI en cuenta, en silico proteoma análisis se llevó a cabo para determinar el mejor procedimiento experimental para la identificación de proteínas de membrana integral de Saccharomyces cerevisiae, Halobacterium sp. NRC-1, y Corynebacterium glutamicum. Nos muestran que la propiedades fisicoquímicas de las proteínas de membrana difieren significativamente entre los tres tipos de organismos con consecuencias para la identificación de proteínas por espectrometría de masas. Por último, la aplicación práctica de nuevas y potencialmente superior división condiciones se realizarán las pruebas de bacteriorhodopsin como modelo de membrana de proteínas.

Resultados
Características fisicoquímicas de la membrana proteomes

El GRAVY (Grand Grand Promedio Promedio de HydropathY HydropathY HydropathY), el peso molecular y pI se calcularon para S. Cerevisiae, Halobacterium sp., Y C. Glutamicum y se representan en la Fig. 1. Según el algoritmo TMHMM, los organismos que poseen el siguiente número de proteínas de membrana integral: 1264 (27% de todas las proteínas) para S. Cerevisiae, 508 (21% del total) para Halobacterium sp., Y 639 (21% del total) para C. Glutamicum. Es evidente para los tres organismos que las proteínas pequeñas (por debajo de 20 kDa) son más hidrofóbicas. La tendencia hacia una menor GRAVY-score con el aumento de tamaño de la proteína se observó para todos los organismos: las proteínas de membrana tienen un promedio GRAVY-Resultado de 0,32 (<20 kDa) y -0,15 (> 70 kDa), en S. Cerevisiae, GRAVY un promedio de puntaje de 0,70 (<20 kDa) y 0,17 (> 70 kDa) en Halobacterium sp., Y un promedio GRAVY-Resultado de 0,53 (<20 kDa) y de 0,15 (> 70 kDa) En C. Glutamicum. En comparación con S. Cerevisiae, la GRAVY-Resultado de distribución se desplaza a valores más altos para la prokaryote C. Glutamicum y la archae Halobacterium sp., Con lo que la membrana de las proteínas de los dos últimos son en promedio más hidrofóbico que en la levadura. Esto se refleja también en la media GRAVY-score, que es de 0,06 para el S. Cerevisiae, 0,43 para C. Glutamicum, y 0,54 para Halobacterium sp. El pI distribución de las proteínas en levadura es trimodal, si bien es bimodal de los otros dos organismos. En C. Glutamicum mayoría de las proteínas de membrana ácidas son más hidrofílicos, mientras que las básicas son más hidrofóbicas. En Halobacterium sp. Alrededor de la mitad de la acidez son proteínas de membrana hidrofílicos, mientras que la mayoría de las proteínas de membrana básica son hidrofóbicas. En la levadura, también hay una tendencia de hidrofílico a hidrofóbico con el aumento de pI, pero es menos clara que en los otros dos organismos. La media de la membrana pI proteoma de la levadura es de 7,8, 7,3 para C. Glutamicum, y 6,5 para el halobacterium. La media del tamaño de las proteínas de membrana integral aumentos de entre el 31 kDa Halobacterium sp., 36 kDa de C. Glutamicum a 49 kDa de la levadura. En resumen, estos datos sugieren que la proteómica membrana será más difícil para procariotas y archea de levaduras, ya que la membrana de las proteínas de los dos primeros grupos son, en promedio, más pequeños y más hidrofóbico.

Secuencia de la proteína péptido cobertura de los fragmentos

Alto secuencia de la cobertura es conveniente para el análisis de modificaciones postraduccionales de proteínas (por ejemplo, la fosforilación, glicosilación). Además, puede ser una indicación de cómo una digestión muy adecuado es condición para la identificación de proteínas por MALDI-TOF PMF (péptido masiva de huellas dactilares). Para estos últimos, el número total de péptidos en la masa ventana que aprovechar al máximo, que a menudo se correlaciona con la más alta cobertura de secuencia. Secuencia de la proteína coberturas se calcularon sobre la base de sus correspondientes péptidos para diferentes condiciones de digestión in silico. Durante tres seleccionados división condiciones, es decir, la tripsina (KR), la tripsina + bromuro de cianógeno (KRM), tripsina y quimotripsina + (FYWKR) la frecuencia de péptidos con diferentes masas se trazan en la Fig. 2A. División sitios se ofrecen en una carta de aminoácidos en el código de cifras; las diferentes condiciones de la digestión son solo simulaciones de las proteasas y los productos químicos, o combinaciones de ellos (véase Tab. 1]. Para los tres organismos, el número de péptidos obtenidos disminuye exponencialmente con péptido masa. Además, la división en más aminoácidos da lugar a un mayor número de péptidos, principalmente por debajo de una masa de 2000 Da. Aunque el número de péptidos Da encima de 2000 es más bien pequeña, su contribución a la cobertura total del proteoma no debe ser descuidado. Por lo tanto, el proteoma de cobertura en relación con el número de péptidos con una cierta masa fue calculada para los tres organismos (Figura 2B]. Se puede observar de S. Cerevisaeand cerevisaeand tripsina división que péptidos con 750 ~ Da 3% en masa contribuir a la cobertura total de la membrana proteoma y mucho menor número de péptidos con ~ 4000 todavía Da contribuir al 1%. División en la mayor cantidad de residuos amplía la diferencia de cobertura entre grandes y pequeños péptidos. El uso de bromuro de cianógeno y tripsina resultados en la membrana proteoma cobertura del 3,8% con péptidos ~ 750 Da en masa y la cobertura de 0,7% con péptidos ~ 4000 Da en masa. División con la combinación de tripsina y quimotripsina cobertura de los rendimientos del 6,7% con 750 ~ Da péptidos y 0,01% con 4000 ~ Da péptidos. En el diagrama de C. Glutamicum, se puede observar que los péptidos con 750 ~ masa Da contribuir el 1,6% de la cobertura total de la membrana proteoma y péptidos con ~ 4000 Da contribuir casi un 1% después de la digestión con tripsina. El uso de bromuro de cianógeno y tripsina resultados en la membrana proteoma cobertura del 2,5% con péptidos ~ 750 Da en masa y la cobertura de 0,9% con péptidos ~ 4000 Da en masa. División con la combinación de tripsina y quimotripsina cobertura de los rendimientos del 4,6% con 750 ~ Da péptidos y 0,017% con péptidos Da ~ 4000. Por Halobacterium sp. Tripsina y la división de la membrana cobertura es casi igual para grandes y pequeños péptidos: 1,9% para 750 ~ Da péptidos y el 1,1% para 4000 ~ Da péptidos. Un poco más grande diferencia en la cobertura de membrana proteoma se puede observar si la tripsina y el bromuro de cianógeno se utilizan para la división: 2,5% para 750 ~ Da péptidos y el 1,1% para 4000 ~ Da péptidos. Una división combinada con tripsina y quimotripsina resultados en la membrana proteoma cobertura del 5,3% con péptidos ~ 750 Da en masa y la cobertura de 0,03% con péptidos ~ 4000 Da en masa.

En un análisis más amplio una variedad de condiciones de división se puso a prueba y el porcentaje de péptidos en la ventana de detección de masa de 600-4000 Da se calculó. Esta es la típica ventana de masa común para MALDI-TOF y ESI instrumentos trampas de iones, aunque para algunos péptidos y los instrumentos de la ventana puede ser mayor o menor en la realidad.

En el primer paso, el análisis completo de la C. Glutamicum proteoma (integrante y otras proteínas de membrana) se llevó a cabo, lo que demuestra que la tripsina (KR) es el mejor sola "cutter" con una cobertura de 69,9% - ligeramente mejor que la quimotripsina (FYW) con 67,5% (datos no presentados). Combinaciones división de los reactivos puede mejorar aún más la cobertura de secuencia: FYWE y KRMW son las mejores combinaciones de los sitios de esta división en masa ventana y dar lugar a la cobertura de 78,7% y 77,8%, respectivamente. Es posible obtener una mejor secuencia de cobertura utilizando todos los cortadores, si la ventana se extiende la masa hasta 5000 Da. En este caso, la división sitios FYWK dar el mejor resultado con una cobertura de 82,5%. Si sólo se consideran las proteínas que no se predice que sea integrante de membrana (por ejemplo citosólica), el mejor solo cortador de proteínas es la tripsina (KR), con una secuencia de la cobertura de 74,5% en el 600-4000 Da ventana. Sólo un menor aumento de la secuencia de la cobertura (78,5%) no es posible que las proteínas de membrana integral si la mejor combinación de agentes de división (FYWE) se utiliza.

Se sabe que los aminoácidos son diferentes frecuencias en proteínas de membrana integral y no proteínas de membrana. Desde estas diferencias y otras propiedades de la proteína debería tener un efecto sobre la digestión óptima condiciones, la membrana de las proteínas se analizaron por separado por tres organismos que representan arqueas, procariotas y eucariotas. (Fig. 3]. Por C. Glutamicum la secuencia de la cobertura de la tripsina es relativamente pobres con un 55,4% en la masa 600-4000 Da ventana. Quimotripsina (FYW) supera claramente el rendimiento de la tripsina y la cobertura de 70,9%. Para los sitios de corte en el presente análisis, la introducción de nuevos sitios división sólo es beneficiosa si la división se produce en hidrofílicas e hidrofóbicas aminoácidos. Los otros dos casos FYWL KRE y llevar a una disminución de la cobertura en relación a KR y FYW. La mejor condición es una división con quimotripsina y toxina peptidase I (FYWE), que se traduce en una cobertura de 79,5%.

El Halobacterium sp. Proteoma está cubierta de membrana mal en la masa 600-4000 Da gama tripsina si se utiliza como la proteasa (52,0% de cobertura de secuencia), mientras que mucho mejores resultados se obtienen de fisuras en FYW (71,3%) con quimotripsina. Sin embargo, si se produce en perfecta división FYWL, la secuencia de la cobertura desciende de nuevo a un valor de 60,1%. La razón es que más divisiones en leucina produce péptidos demasiado pequeños para ser detectados - el mismo efecto se observa para C. Glutamicum y S. Cerevisiae. Superior secuencia de la cobertura se obtuvo con combinaciones de "cortadores"; fisuras en KRE, KRDE, KRM y ya superan a la tripsina, pero no quimotripsina, mientras KRMW, FYWE, y FYWK permiso aún mayor secuencia de cobertura que quimotripsina. La división y las condiciones KRE KRDE alcanzar casi la misma cobertura, sin embargo, la mayoría de las pérdidas se encuentran en la masa de alta gama para KRE, mientras que los de la gama baja en masa para KRDE división con más sitios. La mejor combinación es una combinación de toxina y quimotripsina peptidase I (FYWE) con 78,7% de cobertura. En cuanto a C. Glutamicum, los mejores resultados se obtienen si la división en hidrofílicas e hidrofóbicas residuos produce.

El S. Cerevisiae membrana proteoma está cubierta sólo si así tryspin se utiliza, es decir, el 69,7% de cobertura se obtiene. Fisuras en FYW marginalmente permitir una mejor cobertura de 72,7%. Combinación división de los reactivos que se han encontrado rendimientos más altos de cobertura de la tripsina o quimotripsina solo, pero el aumento en la cobertura no es tan elevada como para C. Glutamicum y Halobacterium. La mejor división en el 600-4000 Da masa ventana sería con quimotripsina y toxina peptidase I en FYWE (78,7% de cobertura). KRM es también una buena alternativa para MALDI usando levaduras, ya que la cobertura del 76,0% no es mucho menor.

En la práctica, uno preferiría que las condiciones que requieren menos esfuerzo y experimentales son más reproducibles. Esta podría ser la combinación de tripsina y quimotripsina (FYWKR) ya que la digestión se puede llevar a cabo simultáneamente con ambas proteasas y una buena cobertura de 75,7% se puede alcanzar.

A partir de los resultados de todos los organismos que un hipotético significa membrana proteoma se calculó a examinar si existe una división, condición que es mucho más apropiada para proteínas de membrana de la tripsina. De hecho, en divisiones KRMW, FYWK y FYWE rendimiento significativamente mejor cobertura. Además se puede afirmar para los tres organismos que, si el número de aminoácidos cleavable con las mismas propiedades fisicoquímicas (hidrofílico o hidrofóbicas) se incrementa, la cobertura no aumenta de manera significativa y, de hecho, a veces disminuye. Esta observación se basa en el hecho de que las secuencias de aminoácidos de las proteínas no son aleatorias, sino que reflejan evolutivo procesos que llevan a una mejor adaptación de la función y la estabilidad. Si fuera aleatoria, la cobertura de secuencia de proteínas de membrana de C. Glutamicum debería ser casi el mismo para las combinaciones KRM y KRE, puesto que en virtud de este supuesto, el promedio de duración péptido sería 9,8 aminoácidos para KRM y 8,8 aminoácidos para KRE.

Única fracción de péptidos en la masa ventana

En clásica MALDI-TOF, el PMF técnica se utiliza para la identificación de proteínas, mientras que ESI ofrece además la posibilidad de obtener con relativa facilidad la secuencia peptídica y, por tanto, para identificar una proteína exclusivamente sobre la base de un péptido fragmento. Un requisito previo para que este enfoque es una única secuencia de la lluvia de fragmentos, es decir, debe estar ausente en otras proteínas del mismo organismo. El objetivo del presente estudio fue verificar la frecuencia de identificación de proteínas es posible, si uno péptido puede ser secuenciado, y si existen diferencias entre las distintas condiciones de división. La misma división de las condiciones para la cobertura de secuencia de estudios se eligieron para facilitar la comparación. En la práctica, es casi imposible obtener una fracción de membrana que no es citosólica contaminados con proteínas de membrana y periféricas. Con el fin de reflejar mejor esta situación, el único número de péptidos se calculó para todo el proteoma (en lugar de sólo las proteínas de membrana), de S. Cerevisiae, Halobacterium sp., Y C. Glutamicum y se muestra en la Fig. 4.

Por C. Glutamicum, la variación en el número total de péptidos y singular de péptidos en el supuesto de 600-4000 Da ventana de masa no es muy alta. En este sentido, el rango de la serie de péptidos total es de 42919 / 41955 única división para FYW en total a 63563 / 61677 singular de división en FYWKR. La proporción de singular / total de péptidos es casi idéntica para todas las condiciones de prueba división. El número más bajo se calculó para KRDE (96,3% singular) y el más alto para FYW (97,8% singular). En resumen, el número total de péptidos varía alrededor de 50% entre las condiciones ensayadas, y cerca del 97% de todos los péptidos en la ventana de masa son únicos, por lo tanto, un péptido es casi siempre suficiente para identificar a la proteína correspondiente. Debido a esto, la división condiciones que se pueden utilizar lograr la mejor secuencia de la cobertura.

Por Halobacterium sp., El número de péptidos varía más división entre las diferentes condiciones de lo que es el caso de C. Glutamicum. El rango total es de 29230 / 28532 única división para FYW en total a 45109 / 43684 singular de división en FYWL. La única fracción de péptidos es casi similar para todas las condiciones de división, y oscila entre el 96,1% para KRDE a 97,6% para FYW. Estos cálculos muestran que las condiciones para la división más alta cobertura de secuencia (FYWE, FYWKR) también son adecuadas en lo que respecta al número y el carácter singular de los péptidos.

El S. Cerevisiae proteoma consta de más proteínas superior a la C. Glutamicum y Halobacterium sp. Mientras que el número de proteínas de la levadura proteoma es de aproximadamente 50% mayor que en C. Glutamicum, el número de péptidos en la ventana de masa ESI es más del doble de la división a prueba condiciones. La gama se extiende desde total 145900 / 131707 única división para FYW en total a 194537 / 170538 singular de división en FYWK. Entre los tres organismos, el porcentaje único de péptidos es más bajo para la levadura y pasa de 86,2% para 90,3% a KRDE para FYW. En el caso de la levadura, en la división KR con tripsina ya fue adecuada para obtener la secuencia de alta cobertura, y sólo una ligera mejora se obtuvo con otras condiciones, por ejemplo, KRM. Ambas divisiones de rendimiento sobre el mismo porcentaje único de péptidos, que es de 89,7% y 89,1% KR de KRM.

La dependencia de la cantidad de proteína péptido tamaño y condición división

Para la identificación de proteínas por MALDI-TOF PMF, que se utiliza a menudo de alto rendimiento para la proteómica, alrededor del 4 por péptidos de proteína son suficientes [12]. Incluso en condiciones ideales una proteína que tiene que ser alrededor del 4 kDa de tamaño. En la práctica, las proteínas menores de 20 kDa son a menudo imposibles de identificar por MALDI-TOF PMF con suficiente confianza. Un número teórico de 8 de péptidos por proteínas deben ser considerados como el límite inferior, ya que en la práctica no todos los péptidos son ionizados por la MALDI proceso - de nuestra experiencia sólo la mitad de los posibles péptidos pueden ser detectados en el espectro de masa. El número medio de los péptidos resultantes de la división diferentes condiciones se ha calculado para las proteínas de membrana de C. Glutamicum, S. cerevisiae, y Halobacterium sp. En la ventana adecuada para la masa MALDI-TOF (Fig. 5]. Es evidente para C. Glutamicum que la proteasa tripsina (KR) es muy problemático para la identificación de pequeñas proteínas de membrana. Un número de 11 proteínas de membrana no poseen tripsina división cualquier sitio y, por tanto, no se prestan para la identificación por MALDI-TOF PMF. El corte de sitios KRM y FYW superar KR. Fisuras en FYWKR MST rendimiento y el mayor número de péptidos, pero incluso en estas condiciones, la identificación de las proteínas es un pequeño problema. Una serie de 8 de péptidos derivados de la división KR a 25 kDa, mientras que las divisiones en FYWKR y MST ya este resultado en el rendimiento de ~ 12 kDa. Esto reduce claramente la barrera de detección de MALDI-TOF PMF. Para la aplicación práctica, es interesante ver que por división química consecutivos con CNBr seguido de S-ethyltrifluorothioacetate de vapor (por ejemplo, MST) [14], división aceptable de proteínas de membrana también se produce. Esta división condición puede ser un método alternativo para aquellas proteínas de membrana que aún residen en el bilayer lípidos o son difíciles de desarrollarse y, por lo tanto, no puede ser completamente accesible para las proteasas como la tripsina o quimotripsina.

Por Halobacterium sp., En la división KR es más desfavorable entre los tres organismos. En promedio, el 8 de péptidos son obtenidos de proteínas de membrana de más de ~ 27 kDa. La relativa a prueba la idoneidad de todas las condiciones división es similar a C. Glutamicum. MST y FYWKR son las mejores condiciones de división y producir, en promedio, 8 péptidos de las proteínas por encima de ~ 13 kDa. En estas condiciones, el doble que son péptidos obtenidos en la masa MALDI-TOF gama (600-4000 Da), en comparación con tripsina, que debería aumentar en gran medida la posibilidad de que la identificación de proteínas de membrana integral de este organismo por el PMF técnica.

Por C. Cerevisiae, el número de péptidos producidos no varía mucho entre las diferentes condiciones de división, en contraste con los otros dos organismos. Proteólisis en KR con tripsina ya produce 8 por péptidos de proteínas en ~ 17 kDa. Una vez más, MST y FYWKR son más adecuadas para aumentar el número péptido; tanto la producción como en péptidos 8 ~ 14 kDa. Curiosamente, en las divisiones MST y FYWKR dar casi los mismos resultados en los tres organismos. Además, en lo que respecta a KR, KRM y FYW rendimiento más péptidos por la proteína de levadura en comparación con Halobacterium sp. Y C. Glutamcium. FYW es un gran complemento a la condición de división KR, que se encontró por el cálculo de la proteína de membrana para cada uno el número de péptidos obtenidos en la gama de MALDI (datos no presentados). El número más grande de péptidos difieren entre estas dos condiciones - hasta 19 más péptidos podría ser generado por algunas proteínas por debajo de los 40 kDa FYW división y, sin embargo, hasta diez menos péptidos se observaron, también.

Bacteriorhodopsin - un enfoque práctico

Para probar si en silico análisis de las diferentes condiciones de la digestión es útil para la práctica de identificación de una proteína de membrana, bacteriorhodopsin (b R) se utilizó como modelo. Cuatro diferentes condiciones de la digestión se probaron: tripsina (KR), quimotripsina (FYWL), tripsina y quimotripsina (FYWLKR) y tripsina / CNBr (KRM). En silico, el número de proteolytically péptidos derivados de la masa rango de 800 a 4000 m / Z fueron los siguientes: tripsina (6 péptidos); tripsina y quimotripsina (9 péptidos); quimotripsina (11 péptidos) y tripsina / CNBr (13 péptidos). Por este motivo se podría esperar que la digestión con tripsina / CNBr debe ser óptima. El MALDI-TOF-MS espectros de bacteriorhodopsin para los cuatro diferentes condiciones de la digestión se muestra en la Fig. 6. En todos los casos sólo estos picos que podrían ser asignados a bacteriorhodopsin péptidos fueron etiquetados. En el tríptico resumen claro sólo cuatro picos fueron visibles, mientras que tres podrían estar relacionados con péptidos de R b, que es un pico coincide con la tasa del 75% (Tab. 2].

Los otros espectros mostraron un número mucho mayor de los picos, sobre todo el uso de quimotripsina conduce a mucho más "ruido" en el espectro resultante. En estos casos coinciden con el pico de la tasa disminuye a un 35% (6 de 17 picos) para el único quimotripsina digerir e incluso al 26% (4 de 19 picos) de la tripsina y quimotripsina digerir (Tab. 2]. 50% (7 de 14 picos), de todos los picos podría estar relacionada con bacteriorhodopsin péptidos en la tripsina / CNBr digerido muestra. La tripsina digerido mostró la más clara muestra de MALDI-TOF espectro con un total de proteínas de cobertura del 8%. Sin embargo, esta cobertura es bastante baja si se compara con la tripsina y quimotripsina digerir (20%) o de la tripsina y quimotripsina / CNBr digerir (27%). Todos los datos descritos tenido una influencia sobre la probabilidad sistema de puntuación basado MOWSE es decir, el sistema de puntuación de Pappin, 1993 # 14]. Hemos tomado nota de que al buscar la base de datos de arqueas, Mascotas puntuaciones por encima de 61 fueron importantes para identificar una proteína. Sólo división con quimotripsina (Mascotas puntuación de 70) o de la tripsina / CNBr (Mascotas puntuación de 92) se tradujo en una importante Mascotas Resultado de bacteriorhodopsin (véase Tab. 2].

Discusión
Predicciones y limitaciones del modelo de digerir

En este estudio in silico digestión se utilizó para encontrar división condiciones para un mejor análisis de las proteínas de membrana integral de los tres organismos modelo S. Cerevisiae, Halobacterium sp. NRC-1, y Corynebacterium glutamicum. El TMHMM algoritmo [15] se utiliza para identificar proteínas de membrana integral de estos organismos, ya que ningún conjunto de datos completa determinado experimentalmente existe. Aunque uno tiene que ser consciente de que ciertas proteínas integrales de membrana (por ejemplo, las proteínas transmembrana y único integrante porins) se perdió en la predicción de la bioinformática, y otros de este estado de la técnica general de los algoritmos son muy específicas y sensibles [16]. Para comprobar si esta en silico enfoque es pragmático, que verificó experimentalmente nuestras predicciones utilizando el modelo de membrana de proteínas bacteriorhodopsin. Se consideraron esta verificación experimental es necesario, debido a que la in silico modelo contiene varias limitaciones. Por ejemplo, el modelo utilizado división supone que, con excepción del bloqueo, no se produzcan fisuras perdido. Esto no es realista, ya que con frecuencia en el análisis de MALDI, incluso con un péptido que ocurre en alta frecuencia, un sitio perdido división se observa. Esta es causada principalmente por la inaccesibilidad del sitio de la división de la proteasa, debido a la incompleta evolución. En la práctica se está desarrollando por la mejora de la utilización de urea como chaotropes [17], [11] el metanol, o un ácido-lábil surfactante [18]. Además, KK y RR a menudo no son digeridos por completo, ya que es un endoprotease tripsina y ha exoprotease débil actividad. Otros se han dirigido a estos problemas mediante el cálculo mejor de los casos (no se perdió división) y peor de los escenarios (una o dos pierde) para la comparación [19, 13]. Diferentes valores existen en la literatura para el número mínimo de péptidos que son necesarias para identificar una proteína con MALDI-TOF PMF. Éstos van desde el 2,2 y 2,3 [12] y 5 [20]. Además, este número depende de la masa péptido, ya que coincide con un menor número de proteínas a gran péptidos [19]. Como a menudo pequeñas proteínas de membrana no producen suficiente péptidos para la identificación, en nuestro estudio recomienda silico procedimientos alternativos de división, por ejemplo, una combinación de tripsina y quimotripsina para los tres organismos, S. Cerevisiae, Halobacterium sp., Y C. Glutamicum. Para la identificación de proteínas de membrana de más de 20 kDa por MALDI-TOF PMF tripsina parece suficiente por sí sola.

Cuando el número medio de péptidos por proteínas de membrana generados por diferentes agentes cleaving se calculó, la tripsina fue claramente inferior a la combinación de tripsina / CNBr, o quimotripsina. Una inspección de las secuencias de péptidos de la proteína de membrana Da divisiones por encima de 4000 reveló que, efectivamente, un gran número de estos son o bien uncleaved segmentos transmembrana, en caso de la tripsina (KR) se utiliza como una proteasa, o largo hidrofílicos tramos de dominios de la proteína soluble, si quimotripsina ( FYW) se utiliza. Por lo tanto, los tres organismos presentan la característica común de que la mejor combinación de "cortadores" para proteínas de membrana integral es una división tanto en hidrofílicas e hidrofóbicas aminoácidos. Entre estas combinaciones, uno fue superior a la tripsina de los tres organismos, la combinación de toxina y quimotripsina peptidase I (FYWE). En Shotgun proteómica, la masa y la secuencia de péptido es en general la única información que permita identificar la proteína original. El análisis de la C. Glutamicum proteoma mostró que en la masa 600-4000 Da gama de más de 96% de los péptidos que contienen secuencias únicas y, por tanto, casi siempre conducen a la identificación de proteínas. Esto de acuerdo con un análisis in silico de E. Coli, S. Pombe y S. Cerevisiae proteoma - alrededor del 1%, 1,5% y el 2% de los respectivos conjunto de péptidos con residuos de al menos siete (es decir, ~ 800 Da), fueron redundante [13]. Sin embargo, se puede observar del análisis de C. Glutamicum, que también en el rango de masas por debajo de los 600 Da, al menos, más del 60% de los péptidos son únicos para la división de tripsina, que sale de este rango todavía atractivo para el análisis con instrumentos que permiten la detección de baja masa (por ejemplo, Q-TOF).

Las mejoras en el análisis de proteínas de membrana - la teoría y la práctica

Creemos que el mejor criterio para evaluar la adecuación de las predicciones sería la de realizar una prueba práctica utilizando un instrumento MALDI-TOF. Con este fin bacteriorhodopsin fue digerida con tripsina (KR), quimotripsina (FYWL), tripsina y quimotripsina (FYWLKR) y tripsina / CNBr (KRM). A partir de este experimento, se puede concluir que las previsiones de acuerdo con los resultados prácticos. Como se predijo, la más alta cobertura de secuencia se obtuvo para la digestión con tripsina o quimotripsina / CNBr (27%). Additionally, the trypsin / CNBr digest yielded the most theoretical peptides and also for this sample, the highest number of peptides could be matched. It was observed that fewer peaks could be matched in the chymotryptic digests than in the tryptic digests. This is a consequence of the lower specificity of chymotrypsin and a higher autoproteolysis rate in comparison to trypsin. Thus the predictive power of the in silico digests is better for enzymes that are highly specific. Nonetheless, the predictions for chymotrypsin were good enough to point out the applicability of this protease for membrane protein identification. Comparison between the bacteriorhodopsin sequence coverage of chymotrypsin and trypsin /CNBr further revealed that although under both conditions equal values are obtained, the matched sequence parts are largely different. Two different digestions, one with chymotrypsin and one with trypsin / CNBr appear attractive if high sequence coverage is desired.

So far no in silico study has been published that analyses cytosolic and membrane proteins separately on the complete proteome level. It became evident that it is necessary to use different cleavage conditions for membrane and soluble proteins if high sequence coverage is desired. To better simulate the experimental conditions, it was chosen to limit the considered peptides for the in silico analyses to mass windows that are typical for the used mass spectrometry technology. Nevertheless, in practice the window can be even smaller. For instance, peptide analysis by MALDI-TOF is often unsuccessful for masses less than 780 Da, since the matrix produces a high number of peaks in this range, too.

We set the mass range to 600–4000 Da for the analysis of membrane proteome coverage and the number of unique peptides. This in our opinion, a reasonable range for MALDI and ESI, but we are aware that in reality the size of the useful mass window can vary. To allow for this variability, the membrane proteome coverage in relation to the peptide mass was depicted. It can be said in general that optimal cleavage conditions minimize the number of peptides and proteome coverage outside the accessible mass range. For the 600–4000 Da window, cleavage conditions superior to trypsin reduced the coverage of the membrane proteome beyond 4000 Da peptide size, while not too many small peptides were generated which either escape detection or are not informative for protein identification. It has been observed in practice that the peptide sequence affects its ionisation in MALDI and ESI. Although it was not considered in our study, trypsin usually delivers peptides that tend to ionise well, and this can be used to calculate the confidence for an identified peptide [ 21 ]. While for the in silico analysis, a mass range of 600–4000 Da was assumed, doubly charged peptides with less than 800 Da are rarely used for database searching in ESI-MS/MS, since the two terminal amino acids fragment together, leaving only a very short stretch of peptide for sequence deduction. For the small proteome of C. glutamicum a sequence fragment of 4 amino acids is often sufficient to identify a protein, but this is not the case for organisms with a higher number of proteins.

The reason for the high number of unique peptides for the three organisms in the 600–4000 Da mass range is their relatively small number of coding genes. In reality, the number of peptides will be larger, due to effects like protein splicing, posttranslational modifications, missed cleavages, etc. For eukaryotic organisms it can indeed be important to verify if protein identification by a peptide eliminates the possibility of existing splice variants as demonstrated by Kuster et al. [ 22 ]. In addition, it is estimated that by using MudPIT, about 23000 peptides can be separated in one experiment [ 5 ]; this number is smaller than the number of predicted peptides from in silico digestion that fall into the defined mass range. These observations raise the question, whether the proposed strategy from in silico , ie multiple cleavage combinations, is applicable in reality. Our own findings for the membrane fraction of C. glutamicum [ 23 ] proof that the combination of trypsin and chymotrypsin or trypsin and cyanogen bromide [ 24 ] can be superior to trypsin alone. Others have found even for higher eukaryotes (brain homogenisate) that cleavage with unspecific proteinase K was extremely useful for membrane protein identification. However, it must be stressed that with current instrument limitations, prefractionation steps for membrane enrichment are mandatory.

Conclusión

By carrying out in silico proteome analysis, integral membrane protein cleavage conditions were identified that are superior to trypsin for all three examined organisms, Halobacterium sp. NRC-1, Saccharomyces cerevisiae , and Corynebacterium glutamicum . While the best result was obtained with a combination of chymotrypsin and staphylococcal peptidase I, in general all superior conditions are combined cleavages at hydrophobic and hydrophilic amino acids. The combined cleavages improved the sequence coverage for ESI-MS/MS and the identification of small integral membrane proteins by MALDI-TOF PMF. The practicability of cleavage conditions was assessed by digestion of bacteriorhodopsin and MALDI-TOF PMF. It can be concluded that the in silico predictions agree well with the practical results, particularly if highly specific proteases are used. Since some of the improved cleavage conditions (eg chymytropsin + trypsin) are not more elaborate than the classical trypsin digestion, they should useful alternatives to trypsin for a better analysis of integral membrane proteins.

Methods
Datasets and bioinformatics

A file containing the translated predicted ORFs for Halobacterium sp. NRC-1 (NC_002607) was downloaded from the NCBI FTP website. Predicted protein sequences for Saccharomyces cerevisae were obtained from the European Bioinformatics Institute (EBI) website [ 25 ]. The translated predicted ORFs for Corynebacterium glutamicum were supplied by J. Kalinowski (Bielefeld University) and are part of the publicly available dataset at EBI. The in silico digestion software was written in PERL and is taking advantage of BioPerl 1.4 modules. Cleavage rules (simple model for trypsin and chymotrypsin) for the in silico digestions were employed according to the Expasy PeptideCutter website [ 26 ], aside from these rules perfect cleavage was assumed. Membrane proteins were predicted for all three organisms using the software TMHMM 2.0 [ 15 ].

Experimental validation of cleavage conditions
Conflicto de intereses

Los autores declaran que no tienen intereses en conflicto.

Contribuciones de los autores

FF has carried out the bacteriorhodopsin digestion, MS analysis, and interpretation of the results. AP has performed the in silico proteome analysis.

Agradecimientos

Purple membranes were a generous gift from Norbert Dencher (Physical Biochemistry, TU Darmstadt). This work was supported by grants from the Bundesministerium für Bildung und Forschung (BMBF 0312843E), and by the Fonds der Chemischen Industrie.