Virology Journal, 2006; 3: 24-24 (más artículos en esta revista)

Predicción de la localización subcelular de las proteínas virales dentro de una célula huésped de mamífero

BioMed Central
MS Scott (michelle.scott @ mail.mcgill.ca) [1], R Oomen (ray.oomen @ sanofipasteur.com) [2], Thomas DY (david.thomas @ mcgill.ca) [3], MT Hallett ( Hallett@mcb.mcgill.ca) [1]
[1] McGill Center for Bioinformatics, McGill University, 3775 University Street, Montreal, Quebec, Canada
[2] Integrated Genomics, Sanofi Pasteur, 1755 Steeles Avenue West, Toronto, Ontario, Canada
[3] Biochemistry Department, McGill University, McIntyre Medical Sciences Building, 3655 Promenade Sir William Osler, Montreal, Quebec, Canada

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

La predicción bioinformáticas localización subcelular de la proteína se ha estudiado de forma exhaustiva para procariótico y de los organismos eucarióticos. Sin embargo, este no es el caso de los virus cuyas proteínas suelen participar en amplias interacciones en diversas localizaciones subcelulares con proteínas de acogida.

Resultados

En este sentido, investigar el grado de utilización de los mecanismos de localización celular por las proteínas virales y nos demuestran que proceda eucarióticas localización subcelular predictores pueden ser utilizados para predecir la localización de proteína viral en la célula huésped.

Conclusión

Esas predicciones proporcionan un método rápido para anotar viral proteomes con información de localización subcelular. Es probable que las aplicaciones se han extendido tanto en el estudio de las funciones de las proteínas virales en la célula huésped y en el diseño de medicamentos antivirales.

Antecedentes

Los virus utilizan la maquinaria de síntesis de acogida para replicar. Ellos han desarrollado mecanismos para la explotación de los receptores de ácidos nucleicos y proteínas de replicación aparato de traducción y también se han desarrollado estrategias para evadir la vigilancia inmune humoral. Proteínas virales requieren orientación a los compartimentos subcelulares de la célula huésped para el desempeño de sus funciones. Las proteínas virales se ha demostrado experimentalmente que se localizan en diferentes compartimentos celulares incluyendo el núcleo (por ejemplo la proteína quinasa codificada por el virus de Epstein-Barr [1]], el nucleolo (como el rev y tat proteínas de virus de la inmunodeficiencia humana tipo 1 [2]], el citosol (por ejemplo, la superóxido dismutasa-como la proteína de la vaccinia virus [3]], el ER / aparato de Golgi (por ejemplo, la US2 y US11 citomegalovirus proteínas [4, 5]], la membrana plasmática y Superficie celular (citomegalovirus glicoproteína gp34 [6]], y la mitocondria (M11L proteínas de las mixoma virus y varios otros, revisado en [7, 8]]. La orientación al espacio extracelular se observa también (por ejemplo, la viruela de las vacas, el factor de crecimiento [9] y el mixoma M-T7 proteína [10]].

Proteína localización subcelular de predicción ha sido ampliamente estudiada (revisado en [11, 12]]. Disponible predictores difieren en muchos aspectos incluyendo el método de cálculo utilizado, el tipo y la diversidad de las proteínas características consideradas para la predicción, la cobertura de localización, el organismo objetivo (s) y la fiabilidad. Predictores pueden agruparse en cuatro clases generales basada en la proteína características que se consideran: composición de aminoácidos y el orden basado predictores [13 - 15], de la clasificación de señales predictores [16, 17], basado en predictores de homología [18, 19] y métodos híbridos Que se integran varias fuentes de información para predecir la localización [20 - 23].

Aunque numerosas proteínas localización predicciones existen para toda la procariótico y eucariotas proteomes, ninguna de estas predicciones están disponibles para muchas proteínas virales, que suelen participar en una amplia interacción con las proteínas de acogida en diversas localizaciones subcelulares en la célula huésped. Esto es sorprendente como tales predicciones sería de gran utilidad en el estudio de las enfermedades infecciosas, a fin de aumentar nuestra comprensión de la función de estas proteínas en la célula huésped y también podría ser útil para el diseño de la mejora de las intervenciones terapéuticas.

En este sentido, investigar la localización intracelular de las predicciones de las proteínas virales en las células humanas. Nos centramos en dos virus, el virus vaccinia y citomegalovirus humano, ya que infectan las células humanas y tienen relativamente grande, pero bien caracterizado genomas. Mostramos que estas viral proteomes puerto conocido muchos eucariotas señales de orientación y dominios que probablemente les permitan aprovechar los mecanismos de localización celular. También utilizamos la localización predictor PSLT humanos [22] para demostrar que una adecuada elegido predictor puede predecir con precisión la localización intracelular de proteínas virales en las células humanas. Nuestro viral localización subcelular predicciones están disponibles como archivos adicionales.

Resultados
Eucariotas y las señales de orientación en los ámbitos funcionales específicos viral proteomes

Con el fin de investigar la medida de la orientación eucarióticas uso de la señal de las proteínas virales considerado, el escaneado humanos, el citomegalovirus y el virus de vaccinia proteomes utilizando diversos predictores bioinformática que identificar estas señales. Para evitar la redundancia en las bases de datos, hemos considerado todas las proteínas disponibles en UniProt [24] de un representante de cada cepa de virus (que elegimos la cepa AD169 para el citomegalovirus y el de Copenhague para la cepa del virus de vaccinia). Como se muestra en el Cuadro 1, a pesar de las diferencias en el tamaño del genoma de varios órdenes de magnitud, varias señales de orientación se encuentran a una medida similar en ambos viral y humanos proteomes. En particular, un gran número de estas proteínas virales contienen N-terminal de péptidos señal y anclas, en consonancia con el conocimiento de que muchas glicoproteínas codificadas en estos virus requieren gran entrada en la vía secretora y han evolucionado para modular ER mecanismos de control de calidad para garantizar que grandes cantidades De las proteínas virales pueden ser correctamente producido y ensamblado en las partículas infecciosas [25]. De manera similar, una alta proporción de proteínas virales se predice que contienen al menos un dominio de transmembrana. Esto refleja el alto grado de interacción de estos virus envuelto con funciones de las membranas celulares, que incluyen el montaje de partículas virales en ciernes y de los virus [26], y, por tanto, la necesidad de que la inserción de una gran proporción de proteínas en sus membranas, a participar en Y regular estos procesos. El virus vaccinia y citomegalovirus proteomes también contienen proteínas que se predice que la orientación puerto mitocondrial péptidos. Tanto el citomegalovirus y el virus de vaccinia se sabe que codifican al menos una proteína que se localiza a las mitocondrias, donde juegan un papel en la inhibición de la apoptosis [7]. GPI anclas, que permiten la fijación de las proteínas extracelulares al prospecto de la membrana plasmática, son también predijo que se utilizará por estas proteínas virales, a igual medida que por proteínas humanas. Esto podría constituir un importante mecanismo de localización viral. En contraste con la proporción relativamente grande de las proteínas virales albergar un C-terminal GPI-región embargo, muy pocas de estas proteínas virales se prevé están prenylated, lo que podría reflejar una mayor necesidad de extracelular en lugar de anclaje intracelular de estas proteínas virales en la Membrana plasmática.

Señales de localización nuclear (NLSs) también pueden ser detectados en el proteomes viral. Una mayor proporción de proteínas citomegalovirus se predice que contienen NLSs que las codificadas por el genoma del virus vaccinia. Esto es coherente con el hecho de que la replicación del genoma citomegalovirus, así como su cápside viral básicos y de montaje se producen en el núcleo mientras que el virus vaccinia coordina estos procesos en el citoplasma.

También se detectó la presencia de señales de orientación a corto en estos proteomes. La N-terminal-KDEL como retículo endoplasmático (ER), la recuperación motivo que está presente en aproximadamente el 20% de las proteínas humanas lumenal ER [27] no parece ser utilizados por estas proteínas virales, pero la muy peroxisomal no específicos-es la señal de orientación Presente en la misma medida en estos viral y proteínas humanas.

Las más frecuentes eucarióticas dominios funcionales presentes en estas proteínas víricas son también muestra en el Cuadro 1, como se predijo por InterPro [28]. La inmunoglobulina-como de dominio es el más utilizado tanto en eucariotas dominio citomegalovirus y el virus de vaccinia, que son bien conocidos ampliamente a modular la respuesta inmune del huésped (revisado en [29, 30]]. La galactosa oxidasa y inhibidor de proteinasa I4 dominios están excesivamente representados en el virus vaccinia citomegalovirus, pero ausente en lo que sugiere que estos dominios no se utilizan como parte de una estrategia viral común a estos dos virus, pero no son específicos para el virus vaccinia. Del mismo modo, la rhodopsin superfamilia de GPCR, como es frecuente en el citomegalovirus, pero ausente de las proteínas del virus de vaccinia. Citomegalovirus se sabe que codifican, al menos, cuatro del Grupo de los receptores acoplados a proteínas, que podría permitir que se modulan y antagonizar receptores vías de señalización [31].

Curiosamente, la interacción proteína-proteína dominios tales como SH2, SH3, WW y t-insidia dominios se ausente de estos proteomes viral (datos no presentados), lo que indica que la imitación y la modulación de este tipo de mecanismo de comunicación celular podría no ser parte de la Estrategia de supervivencia de estos virus.

La proporción muy alta de proteínas víricas que contenga uno o varios motivos de orientación eucariotas y funcional muestra la amplia utilización de los mecanismos de localización celular y maquinaria por estos virus. Esto es un buen indicio de que las proteínas eucarióticas localización subcelular predictores podría tener un buen desempeño en estos virus.

Predicción de la localización subcelular de proteínas virales en las células huésped

Se utilizó la PSLT humanos localización subcelular predictor [22] para predecir la localización de citomegalovirus y el virus vaccinia y proteínas para investigar si los principios de proteínas eucarióticas localización predicción se puede aplicar a las proteínas virales. PSLT es una herramienta de tipo bayesiano red, formados en las secuencias de humano, que predice la localización subcelular de las proteínas sobre la base de la co-ocurrencia de dominios de la proteína, los motivos y las señales de orientación. El cuadro 2 muestra las predicciones del virus vaccinia proteínas celulares cuya localización ya se ha estudiado experimentalmente, y está disponible en la literatura (la predicción de datos completa se encuentra disponible como material suplementario, por favor vea el archivo Adicional 1]. Como se muestra en el Cuadro 2, la localización de la mayoría de las proteínas del virus de vaccinia es bien predijo. La precisión de PSLT sobre este conjunto de datos puede ser estimada en el 78% (proteínas localizadas a más de un compartimiento se consideran predecir con precisión si por lo menos uno predijo compartimento de acuerdo con la literatura anterior anotación). Una gran proporción (36%) de estas proteínas se prevé están secretada o expresado en la superficie de células como las proteínas integrales de membrana o membrana de proteínas ancladas. En su mayor parte, esta predicción se confirma en la literatura, sino que debe considerarse una estimación conservadora, ya que los estudios experimentales no siempre muestra la cinética de la síntesis de proteínas virales y el tráfico de todos los sistemas en todas las condiciones. Esta estimación de la superficie celular y extracelular de proteínas víricas es mayor que nuestra estimación de 22% de las proteínas celulares humanos [22], y probablemente refleja virales importantes funciones que requieren el uso de la vía secretora de acogida. De hecho, varias de estas proteínas se sabe que están implicados en la modulación de la respuesta inmune del huésped incluyendo que unen a las proteínas secretadas por las quimiocinas, los interferones y la interleucina miembros de la familia [30, 32]. Otros esas proteínas se incorporan en la cubierta del virus. Pocas o ninguna vaccinia proteínas se predice para localizar a la peroxisome, lisosomas, ER o aparato de Golgi.

El cuadro 3 muestra la PSLT predicciones para citomegalovirus proteínas celulares cuya localización ya se ha estudiado experimentalmente, y está disponible en la literatura (la predicción de datos completa se encuentra disponible como material suplementario, por favor vea el archivo adicional 2]. La exactitud de la predicción PSLT sobre este conjunto de datos se estima en el 60% de acuerdo a la literatura. Casi todas las proteínas erróneamente clasificados como predijo acuerdo a la bibliografía anotada como son localizados en la sala de emergencia o aparato de Golgi, pero predijo por PSLT como en la superficie de la célula. Varias de estas proteínas características de la superficie celular o proteínas secretadas como la capacidad de obligar a MHC de clase Iy clase II antígenos. Sin embargo, en lugar de ser secretada, estas proteínas citomegalovirus localizar a la sala de emergencia, donde se unen los antígenos MHC, de manera efectiva la orientación de ellos conducen a la degradación y la protección de las células infectadas por citomegalovirus de CD8 + y CD4 + linfocitos T [33]. Muchos otros citomegalovirus proteínas están bien predijo incluidos los receptores de la superficie celular, varios de los cuales imitan los receptores de acogida [34], así como las proteínas secretadas como viral de quimioquinas y la IL-10 homólogos [35, 36].

Hemos investigado si la exactitud de la predicción PSLT se correlaciona con el grado de similitud entre las proteínas virales y su homólogo humano más cercano. Las dos columnas de la derecha de los cuadros 2 y 3 muestran el más cercano humanos homólogo de la NCBI RefSeq [37] base de datos para cada proteína viral, según lo determinado por BLAST [38]. En general, las proteínas virales que tienen una estrecha homólogos humanos (BLAST e-valor <= 1e-10) son predecir con precisión por PSLT. La exactitud de la predicción de estas proteínas es de 100% para el citomegalovirus y el 91% para el virus vaccinia. Algunas proteínas virales que no tienen estrecha homólogos humanos (e-BLAST valor> 1e-10) son bien predicho, pero la exactitud de la predicción general para PSLT estas proteínas es menor (43% de proteínas de citomegalovirus y el 67% de las proteínas del virus de vaccinia ). Esto es coherente con anteriores análisis que nos ha permitido demostrar que la exactitud de la predicción PSLT es mayor cuando la predicción de proteínas de los organismos que son evolutivamente cercano a los que se utilizan para capacitar a los predictor [22].

Discusión

El proteomes de citomegalovirus y el virus de vaccinia mostrar numerosos ejemplos de las señales de orientación y eucariotas dominios funcionales, en consonancia con su origen evolutivo y su extenso uso de muchos elementos de la maquinaria celular de acogida. Mostramos aquí que, en consecuencia, la localización subcelular de estas proteínas virales se puede predecir con precisión la localización de la proteína humana predictores. Se utilizó la PSLT predictor considera que la combinatoria presencia de los dominios y las señales de orientación en proteínas humanas para predecir la localización. Esto podría ser mejor predictor adecuado para esta tarea que otros tipos de localización predictores. De hecho, PSLT se centra específicamente en la localización de las proteínas humanas y se ha demostrado que predecir con precisión la localización de las proteínas de mamíferos en general y, por tanto, es probable elegir la opción más adecuada para la predicción de la localización de las proteínas virales dentro de las células humanas. Otra de las ventajas de PSLT es que se considera dominios y motivos en lugar de la composición de aminoácidos. Muchos de estos dominios y motivos es probable que participan en la interacción con las proteínas de acogida y, por lo tanto se asemejan más humanos secuencias que otras regiones de las proteínas. De hecho, varios de estos ámbitos se cree que han sido robados por estas grandes virus de la célula huésped [39]. Específicas de las proteínas virales podrían haber evolucionado para parecerse a los motivos de proteínas de acogida, con el fin de utilizar los mecanismos disponibles en la célula huésped. No es de sorprender que las proteínas virales que tienen un alto grado de similitud a proteínas humanas son en general mejores que los que predijeron que no tienen una estrecha homólogo humano. Más amplia investigación viral en la localización subcelular de predicción pueden conducir a una mayor precisión de la predicción y la cobertura específica como la no eucarióticas características de las proteínas virales también pueden ser explotados para determinar su localización celular. Esto probablemente será especialmente importante para predecir la localización de las proteínas virales que tienen poca similitud con proteínas de mamíferos.

Conclusión

Este estudio demuestra que la proteína eucariota localización subcelular predictores se puede utilizar para describir rápidamente específicas proteomes viral y con una primera estimación razonablemente exacta de la localización intracelular. Predicción de la localización subcelular de las proteínas virales en las células humanas deben ser de gran utilidad para la comunidad biológica de aumentar nuestra comprensión de la función de estas proteínas, de su papel en la célula y de las consecuencias de la interacción huésped-patógeno. También podrían servir para elaborar métodos más eficaces de tratamiento por la rápida identificación de los objetivos.

Métodos

28908 proteína humana secuencias fueron recuperados de la base de datos de Hera [27]. Estas proteínas representan todos NCBI RefSeq [37] entradas actualmente en Hera. Citomegalovirus y las secuencias de proteína del virus de vaccinia se descargan de UniProt [24]. Todas las secuencias fueron digitalizadas con los diferentes predictores mencionados en el cuadro 1, utilizando los parámetros por defecto.

La localización de las proteínas virales se predijo usando PSLT a lo descrito previamente [22]. PSLT es una red de tipo bayesiano herramienta que predice la localización subcelular de las proteínas sobre la base de la co-ocurrencia de dominios de la proteína, los motivos y las señales de orientación. PSLT fue entrenado en proteínas humanas, tal como se describe en [22]. En el caso de la multi-compartimental proteínas (proteínas que se predice con alta probabilidad de estar presente en más de un compartimento), más probable es que los dos compartimentos se conservaron. El más cercano homólogo de todas las proteínas virales en los cuadros 2 y 3 se determinó utilizando BLASTP versión 2.2.12 [38] en contra de la base de datos NCBI RefSeq humanos (versión 15) [37]. Los parámetros por defecto de BLASTP se utilizaron.

Material suplementario
Archivo Adicional 1
Localización de la proteína que contiene las predicciones de varias cepas diferentes del virus vaccinia.
Archivo Adicional 2
Localización de la proteína que contiene las predicciones de varias cepas diferentes del citomegalovirus humano
Agradecimientos

Queremos dar las gracias a François Pepin para el apoyo logístico. Este trabajo recibió el apoyo de subvenciones a DYT y MH de Genoma Quebec / Genoma Canadá, así como a DYT de los Institutos Canadienses de Investigación en Salud (CIHR). MSS es un destinatario de Canadá de Becas de Posgrado (CGS) Premio de Doctorado de CIHR.