Virology Journal, 2005; 2: 30-30 (más artículos en esta revista)

Anfitrión derivados de las islas de patogenicidad poxviruses

BioMed Central
Melissa Da Silva (mdasilva@uvic.ca) [1], Chris Upton (cupton@uvic.ca) [1]
[1] Departamento de Bioquímica y Microbiología de la Universidad de Victoria, Victoria, Canadá

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

Poxviruses son importantes, tanto como los agentes patógenos y vectores de vacuna. Poxvirus genomas (150-350 kb) constará de una sola molécula lineal dsADN; polinucleótido los dos capítulos están unidos por lazos de horquilla corta. Los genomas codifican proteínas muy conservadas necesarias para la replicación del ADN y ARNm de transcripción, así como un conjunto variable de factores de virulencia; transcripción tiene lugar en el citoplasma de la célula huésped. Estamos interesados en la evolución de los genomas poxvirus y, sobre todo, cómo adquirir estos virus de acogida derivados de los genes que se cree que funcionan como factores de virulencia.

Resultados

Usando una variedad de herramientas de la bioinformática, hemos identificado las regiones de genomas que han poxvirus inusual composición de nucleótidos (superior o inferior a la media de contenido de A + T), en comparación con el genoma en su conjunto; estas regiones puede ser de varios kilobases de longitud y contienen un número De los genes. Regiones con inusual composición de nucleótidos pueden representar los genes que se han adquirido recientemente desde el equipo genoma. El estudio de estas regiones genómicas con inusual contenido de nucleótidos ayudará a dilucidar los procesos evolutivos en poxviruses.

Conclusión

Hemos encontrado que dotplots poxvirus completa de los genomas puede ser utilizado para ubicar las regiones en el genoma que difiere significativamente en el contenido de A + T para el genoma en su conjunto. Los genes en estas regiones se hayan adquirido hace relativamente poco tiempo desde el equipo genoma o de otro AT-ricos poxvirus.

Antecedentes

Poxviruses comprenden una familia de gran dsADN virus que replican en el citoplasma de células eucariotas, que gozan de una amplia gama de huéspedes que incluye a los insectos, reptiles, aves y mamíferos [1]. El poxviruses son relativamente autosuficientes y codifican las proteínas responsables de la estructura virión, la replicación del ADN, ARNm de transcripción, así como un número de factores de virulencia [1]. La mayoría son moderadamente poxviruses AT-rica (55-75%), pero hay varias excepciones. El conocido poxviruses insectos son extremadamente ricos en AT (82% de A + T), mientras que el molusco contagioso virus (MOCV-1) y el conocido parapoxviruses AT-son pobres (36-37% de A + T) [1].

Cuando se hacen comparaciones de las grandes genomas virales como poxviruses hay varios enfoques según el nivel de resolución que se requiere. Aunque dotplots se puede utilizar para cualquier longitud de la secuencia de ADN y también para las secuencias de la proteína, que son especialmente útiles cuando se trata de obtener una visión global de la relación entre las grandes secuencias de ADN. Ya que generar una secuencia gráfica de la vista de la similitud, algunas relaciones entre las secuencias puede ser aparente que, de otro modo puede perderse en texto con formato alineaciones [2]. En la forma más sencilla de un dotplot, una secuencia se coloca a lo largo del eje "x" y el otro a lo largo de la secuencia de eje "y" para crear una matriz (Figura 1]. Siempre que sea una de una secuencia de nucleótidos es idéntica a una de nucleótidos de la otra secuencia, la correspondiente celda de la matriz se llena. Dotplot mayoría de los programas, sin embargo, utilizar una ventana deslizante de tamaño definido por el usuario, y una medición de la similitud entre las dos ventanas en lugar de comparar cada una de nucleótidos a lo largo de los genomas. Cuando el trazado de los datos, una escala de grises se pueden utilizar para grabar diferentes grados de similitud. Si las dos secuencias son idénticas, una línea diagonal totalmente negro se observa en el dotplot compuesta por muchos puntos, cada uno de ellos para sacar una ventana que se ajuste a la misma ventana en la segunda secuencia. Los antecedentes de la dotplot es consecuencia, la composición de los puntos de escala de grises que representan a partidos de diversa azar similitud entre las ventanas utilizado para escanear las dos secuencias. La figura 1 muestra un ejemplo simplificado de una típica dotplot. Para cada región de la secuencia trazarán en el eje "x" que es idéntica a la secuencia en el eje, una línea diagonal que se traza y, en aras de este ejemplo, un color de la sombra para mostrar que cada región es idéntica. Dotter [2] java y nuestra versión de este programa (JDotter) [3] son especialmente útiles debido a la implementación el tamaño de la ventana y el grado de similitud utilizados para el dotplot de visualización pueden ser manipulados de forma instantánea, sin cálculo de toda la parcela que es Intensivo de la CPU. El cambio de estos parámetros puede ayudar a visualizar las regiones relativamente bajo de similitud o aumentar o disminuir la coincidencias de fondo en la trama.

Al ver muchos de los dotplots comparación de los genomas diferentes poxvirus trazan unos contra otros y de ellos mismos, se observó inesperados patrones de rayas en el fondo de la dotplots (Figura 2]. Estas inusuales no aleatoria patrones de bandas sugiere que la composición de los discretos regiones de los genomas difieren significativamente de la composición general de los genomas poxvirus.

Resultados y discusión

Un libre dotplot de MOCV-1, en que el genoma viral se trazarán en el x-e y-ejes, se muestra en la Figura 2. Desde que se utiliza la comparación del genoma idéntico en cada uno de los ejes, hay una ininterrumpida línea diagonal que va desde la esquina superior izquierda a la esquina inferior derecha de la dotplot. Una serie de rayas horizontales y verticales se pueden ver dispersos por la parcela; esas pautas se observan en la mayoría de poxvirus genoma libre parcelas, aunque la intensidad varía considerablemente entre bandas en una sola parcela y son generalmente más intenso en los genomas con la más extrema de nucleótidos Composición, T o A + G + C ricos genomas. Dos de las regiones más sorprendentes para MOCV-1 están marcados en la figura 2. Regiones 1 y 2 se encuentran en 71550 - 74790 bp y 151470 - 157950 pb en el genoma MOCV-1, respectivamente; cada región abarca 5 genes. Es evidente por sí mismo que el dotplot pequeños conjuntos de ADN se repite, que aparecen como breves líneas paralelas, no son responsables de la generación de estos inusuales rayas en el fondo de la parcela. Por lo tanto, la hipótesis de que las variaciones en la composición de nucleótidos fueron responsables de los patrones fue probado. El Gráfico 3 muestra que estas dos regiones marcadas en la Figura 2 en efecto, tienen una composición de G + C significativamente más baja que la media del genoma. Regiones 1 y 2 G + C promedios de 52,58% y 50,38%, respectivamente, mientras que el G + C composición de MOCV-1 es 63,36% (también se muestra como una línea horizontal en las figuras 3A y 3B].

Los genes presentes en las regiones 1 y 2 se enumeran en el cuadro 1, junto con el contenido de A + T, G + C putativo contenido y función. Región 1 contiene 5 genes (MOCV-1-051L, MOCV-1-052R, MOCV-1-053L, MOCV-1-054L, MOCV-1-055R), dos de los cuales tienen función desconocida (MOCV-1-052R y MOCV-1-055R). Curiosamente, tres de los cinco genes en la región 1 muestran similitud significativa entre sí. El producto génico de MOCV-1-054L es una glicoproteína secretada que une a la interleuquina-18 [4], y muestra algunas similitudes con la secuencia humana y el ratón IL-18 con tres proteínas que unen residuos conservados de cisteína compartida entre los humanos y MOCV IL-1 - 18 proteínas vinculante [5], si bien no ha sido la función prevista para el hipotético productos de los genes relacionados con el MOCV-1-051L y MOCV-1-053L, que se prevé están secretadas de las células infectadas. Desde el otro poxviruses que codifican un ortholog de MOCV la interleucina-1-18 proteína de unión no contienen orthologs de MOCV-1-051L y MOCV-1-053L, parece que estos genes pueden haber surgido de la duplicación de MOCV-1 - 054L después de la divergencia de MOCV de los otros poxvirus familias.

Región 2 también está compuesto de 5 genes (MOCV-1-130L, MOCV-1-131L, MOCV-1-132L, MOCV-1-133L, y MOCV-1-134L). Tres de los cinco genes (MOCV-1-130L, MOCV-1-131L y MOCV-1-133L) se han reducido, pero importante, la similitud entre sí y también a la inclusión de tipo A (ATI) de las proteínas y orthologs El virus vaccinia P4c gen (A26L; cepa de Copenhague). En algunas cepas de virus de viruela de las vacas, la ATI funciones de la proteína que rodea el virus maduro intracelular (IMV) las partículas en el citoplasma de la célula huésped con la P4c proteína desempeña un papel en la dirección de la IMV partículas a la A-tipo inclusiones [6, 7] . Algunos orthopoxviruses como vaccinia y codificar un presunto variólico no funcionales, ATI proteína truncada que es incapaz de formar oclusión ATIs lo que sugiere que la formación de ATI no es esencial para la supervivencia del virus en la célula huésped [8]. Poco se sabe sobre el papel de la ATI MOCV proteínas en el ciclo de replicación-1, sin embargo, dado que estas proteínas son truncados en comparación con sus orthologs viruela de las vacas, es probable que los que tienen un algo diferente, en su caso, en función MOCV-1 . Hay otros dos genes en la región 2; MOCV-1-132L es que no encontrará en otros poxvirus y su función es desconocida, y MOCV-1-134L se conserva en todos los poxviruses y muestra significativa similitud de secuencias (50% de identidad de aminoácidos) A la A28L gen de la cepa del virus de vaccinia Copenhague, y es un tipo virus maduro intracelular de la membrana de proteína que se asocia con el virus de la entrada en la célula huésped, [9, 10].

Hay varias posibles explicaciones de las diferencias observadas en el contenido de G + C de los genes en las regiones 1 y 2 en comparación con el resto del genoma. El MOCV-1-054L gen en la región 1, por ejemplo, era más probable recientemente adquirida a través de un AT-ricos de acogida o de un AT-ricos virus, con la consiguiente duplicación de esfuerzos y las divergencias resultantes en el MOCV-1-051L y MOCV-1 - 053L genes. Desde estos genes representan una parte relativamente rica AT-en la región MOCV-1 genoma, pueden haber servido como un sitio de destino para la adquisición, presumiblemente a través de la no-recombinación homóloga, de los genes MOCV-1-052R y MOCV-1-055R Ninguno de los cuales se les ha asignado una función. Habida cuenta de que la ATI genes que se encuentran en la región 2 AT-son relativamente ricos en comparación con el genoma MOCV-1, estos genes pueden también haber sido adquirido hace relativamente poco tiempo desde otro AT-ricos poxvirus. Similares a los genes en la región 1, una primera adquisición caso que se llegue a una región rica AT-pueden tener a su vez a la adquisición de los acontecimientos y la creación de la región 2. Aunque el MOCV-1-134L gen parece haber sido adquirida a través de un AT-ricos poxvirus, la situación no es sencilla debido a que el gen ha resultado ser esencial para el virus vaccinia entrada en la célula huésped [9, 10]. Una explicación es que un elemento esencial MOCV-1 ortholog fue reemplazado por un funcionamiento similar gen de un AT-ricos poxvirus, lo que explica la razón por la que se diferencia en el contenido de G + C, a pesar de ser un elemento esencial de genes.

Es interesante observar que hay una breve secuencia en la rica región AT-1, que tiene un valor significativamente mayor de G + C composición que el resto de la región (Figura 3A]. Esta área se puede ver en el dotplot como una fina, banda oscura situada en el centro de la banda de la región 1 (Figura 2]. Esta breve repunte de G + C ricos ADN se encuentra en el extremo 3 'de la MOCV-1-054L gen en una región que no se alinean con ninguna de las dos relacionadas con el MOCV-1 genes (MOCV-1-051L y MOCV - 1-053L) lo que indica que esta región también pueden haber sido adquirido hace relativamente poco tiempo, lo que resulta en una región en el marco de inserción en el predicho MOCV-1-054L polipéptido.

Para confirmar que la inusual rayas visto en el fondo de la MOCV-1 dotplot podría ser debido a una más baja que la media G + C, el contenido de estas regiones del genoma, un dotplot fue creada con el MOCV-1 trazarán en el genoma x - Contra un eje 250 kb secuencia de ADN que consta de cinco 50 kb al azar de ADN con segmentos específicos de G + C contenido en el eje "y" (Figura 4]. Regiones 1 y 2 están marcados en la figura y la persona 50 kb segmentos son claramente visibles en el dotplot. Como el contenido de G + C aumenta a lo largo de los 250 kb secuencia en el eje Y, las rayas visto para las regiones 1 y 2, que cambian de un color oscuro a la luz, lo que refleja una reducción de las coincidencias al azar entre las dos secuencias. En el 60% de G + C, el contenido, las bandas de ambas regiones 1 y 2 son similares a los observados en el MOCV-1 libre dotplot (Figura 2]. Cuando el azar secuencia tiene un contenido de G + C de 50%, las rayas para las regiones 1 y 2 aparecen a desaparecer, como se funden con el fondo, lo que indica que el contenido de G + C de estas regiones es de aproximadamente el 50%. Como el contenido de G + C más disminuye a menos del 40%, las bandas visto para las regiones 1 y 2 son de nuevo visibles pero que son la imagen negativa de las observadas en la Figura 2, las bandas son más oscuro que el fondo, porque estas regiones tienen un G + C contenido que se asemeja más a la secuencia al azar que en el resto del genoma MOCV-1. Del mismo modo, cada uno de los 50 kb segmentos de la secuencia aleatoria Figura 4 utilizado para producir un nivel diferente de coincidencias de fondo en el dotplot y aparece como una amplia franja horizontal.

Acceso a las diferentes regiones de G + C de contenido utilizando dotplots puede ser una tarea difícil en vista de que la intensidad de los patrones de bandas suelen ser disminuida en poxvirus genomas que no son extremadamente AT-GC-o ricos. Sin embargo, hemos observado que estos patrones de bandas fueron más clara al comparar el genoma MOCV-1 a una secuencia aleatoria con el aumento de contenido de A + T (Figura 4]. Por ejemplo, en las zonas MOCV-1 con el genoma superior a la media de contenido G + C, que antes no cuando se observaba una parcela libre de la MOCV-1 del genoma puede ser visualizado en el dotplot de la MOCV genoma-1 frente a una secuencia aleatoria Con la disminución de contenido de A + T (comparar las Figuras 2 y 4]. Así, este tipo de comparación se puede utilizar para aumentar el reconocimiento de las regiones de la composición de nucleótidos poco habitual.

Con el fin de ilustrar las diferencias entre los genes de las regiones 1 y 2 en comparación con la totalidad de su genoma, el uso del codón 49 MOCV-1 genes que se conservan en todos los poxviruses se comparó con el codón de uso de los 10 genes de las regiones 1 y 2. El medio relativo del codón sinónimo de uso (RSCU) valores de los dos conjuntos de datos se compararon mediante un Estudiante de la T-test. Los codones que tenían estadísticamente diferentes codón de uso entre los dos conjuntos de datos se indican en el cuadro 2. Se encontró que el uso del codón 43 de los 62 codones (69%) fue estadísticamente diferente entre todos los genes de las regiones 1 y 2 y los 49 conserva MOCV-1 genes. Codón de uso se consideró estadísticamente diferentes cuando el valor de p fue inferior a 0,05. Los aminoácidos que tienen por lo menos 1 codón con estadísticamente iguales RSCU valores son la leucina, isoleucina, valina, serina, prolina, threonine, alanina, arginina, glicina y dos codones de parada (UAA y UAG).

Con el fin de determinar si los genes de las regiones 1 y 2 fueron recientemente adquiridos a partir de la acogida del genoma, el codón uso de los genes en las regiones 1 y 2 se comparó con el codón de uso de 50 genes humanos (MOCV-1 naturales del anfitrión), usando El mismo método utilizado para la comparación de las regiones 1 y 2 con los 49 conserva MOCV-1 genes. El codón uso de los genes en las regiones 1 y 2, se encontró que era el 68% (48/62 codones) al igual que el codón de uso de los 50 genes humanos sometidos a la prueba (Tabla 3]. Como control, el codón uso de los mismos 50 genes humanos se comparó con el codón de uso de los 49 conserva MOCV-1 genes y se encontró que era estadísticamente diferentes en 56 de 62 codones (90%) (Cuadro 4].

Desde el codón uso de los genes en las regiones 1 y 2 se consideró estadísticamente diferentes a los de uso codón de 49 conservada MOCV-1 genes para el 69% de los codones prueba todavía se encontró que sólo el 34% diferente de la del codón de uso Los 50 genes humanos probado, es razonable asumir que estos genes pueden ser recientes adquisiciones del genoma de acogida o un poxvirus genoma con mayor A + T composición. Curiosamente, desde la presentación inicial de este manuscrito, un documento que se ha publicado que identifica al MOCV-1 interleuquina-18 proteína de unión (así como varios otros poxvirus proteínas) como posible de genes transferidos horizontalmente [11], que además apoya nuestra hipótesis Que los genes de las regiones 1 y 2 fueron probablemente adquiridos de fuentes externas.

Islas de patogenicidad (PAI) en los genomas de bacterias contienen varias características estructurales, que incluyen la presencia de genes de virulencia en el PAI, una composición de nucleótidos de la PAI que es diferente del resto del genoma, y la ocupación de las grandes regiones del cromosoma bacteriano [12]. Los genes de las regiones 1 y 2 también ocupan un lugar relativamente importante de la región MOCV-1 genoma, y algunos de los genes en estas regiones son conocidos factores de virulencia con la función de los genes restantes aún por determinar. Por lo tanto, sugerimos que estas regiones pueden ser parecidas a las islas de patogenicidad bacteriana. Esta idea es apoyada asimismo por las observaciones en este manuscrito, que mostraron diferencias en la composición de nucleótidos y codón uso de los genes de las regiones 1 y 2.

Conclusión

Los datos presentados en este trabajo sugieren que la inusual patrón de bandas de rayas visto en la dotplots de poxvirus genomas se debe a diferencias en el contenido de nucleótidos de los genes en estas regiones en comparación con el resto del genoma. La diferencia entre los genes en estas regiones y 49 MOCV-1 genes que se conservan en todos los poxviruses se muestra al comparar el uso del codón de 62 codones en cada uno de estos conjuntos de datos. El codón de uso se encontró que difieren significativamente en el 69% de los codones probado. El codón uso de los genes en las regiones 1 y 2 se consideró estadísticamente igual a 50 genes humanos en el 68% de los codones probado.

Llegamos a la conclusión de que los genes en las regiones 1 y 2 tienen un relativamente bajo contenido de G + C, y que se hayan adquirido, ya sea de un AT-ricos de acogida o el virus de hacer estas regiones posible patogenicidad novela islas en el genoma MOCV-1. Un futuro estudio de todos los demás poxviruses que se necesita con el fin de determinar el alcance de estas posibles adquisiciones de genes.

Métodos
Creación de dotplots

Dotplots para el molusco contagioso virus genoma se crearon utilizando JDotter y visualizan con un tamaño de la ventana por defecto de 26 nucleótidos en un mínimo punto de corte de 40 y un máximo punto de corte de 100 en la GreyMap herramienta con el fin de visualizar mejor la única Antecedentes patrones [3].

El dotplot muestra en la Figura 4 fue creado usando el programa con el Dotter completa del genoma del virus de molusco contagioso trazarán en el eje "x" y una secuencia aleatoria de 250 kb con el aumento de contenido de G + C trazarán en el eje "y" [2]. La secuencia de 250 kb DNACreator fue creado usando un programa que crea una secuencia aleatoria con un determinado contenido de G + C [13]. Segmentos de 50 kb y diverso contenido G + C se crearon y concatenados en una secuencia de 250 kb que contenía un aumento de G + C contenido.

G + C composición parcelas

El G + C composición de las regiones 1 y 2 se trazan a través del "contenido básico de nucleótidos" característica del programa Genoma Viral Organizador (VGO) [14]. Esta función calcula y dibuja el contenido de G + C de la totalidad del genoma usando un usuario determinado tamaño de la ventana.

Codón de uso
Conflicto de intereses

Los autores declaran que no tienen intereses en conflicto.

Contribuciones de los autores

CU iniciado el proyecto y editado el manuscrito; MDS realizado todo el trabajo y escribió el manuscrito.

Agradecimientos

Los autores agradecen a Angelika Ehlers, Julius Litorco Norman y Jordania para el desarrollo de software y el apoyo a David y Esteban de revisión crítica del manuscrito.