Genómica comparativa de Thermus thermophilus y Deinococcus radiodurans: rutas divergentes de la adaptación a la resistencia a la radiación y thermophily
Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.
Thermus thermophilus y Deinococcus radiodurans pertenecen a un clado bacterianas, pero tienen muy diferentes fenotipos. T. Thermophilus es un thermophile, que es relativamente sensible a las radiaciones ionizantes y de la desecación, mientras que D. Radiodurans es una mesophile, que es la radiación y altamente resistentes a la desecación. Aquí presentamos una profunda comparación de los genomas de estos dos, pero diferente adaptado bacterias.
Mediante la reconstrucción de la evolución de Thermus Deinococcus y después de la divergencia de su ancestro común, que demuestran un alto nivel de post-divergencia de flujo de genes en los dos linajes. Diversos aspectos de la adaptación a la alta temperatura en Thermus puede atribuirse a la transferencia horizontal de genes de bacterias termófilas y arqueas; muchos de los genes transferidos horizontalmente están situados en el único megaplasmid de Thermus. Además, el linaje Thermus ha perdido un conjunto de genes que todavía están presentes en muchos otros Deinococcus y mesófilos, pero no son comunes entre thermophiles. Por el contrario, Deinococcus parece haber adquirido numerosos genes relacionados con el estrés sistemas de respuesta de diversas bacterias. Una comparación de la distribución de genes ortólogos entre los cuatro particiones de la Deinococcus genoma y las dos particiones del genoma revela Thermus homología entre el Thermus megaplasmid (pTT27) y Deinococcus megaplasmid (DR177).
Después de la radiación de su ancestro común, la Thermus Deinococcus linajes y han tomado caminos divergentes hacia sus diferentes estilos de vida. Además de la amplia pérdida de genes, Thermus parece haber adquirido numerosos genes de thermophiles, que probablemente fue la contribución decisiva para su adaptación termófilas. Por el contrario, Deinococcus perdido algunos genes, pero parece haber adquirido muchos genes de bacterias que, al parecer, ha mejorado su capacidad para sobrevivir a los diferentes tipos de estrés ambiental. A pesar de la acumulación de genes transferidos horizontalmente, también ponen de manifiesto que la única megaplasmid de Thermus y el DR177 megaplasmid de Deinococcus son homólogos y, probablemente, fueron heredados del ancestro común de estas bacterias.
Deinococcus spp. Y Thermus spp. Se cree que pertenecen a una rama de la bacteria Deinococcus-Thermus grupo [1]. El origen común de estas bacterias es apoyado por el hecho de que constantemente forman un clado apoya firmemente en los árboles filogenéticos de ARN ribosomal y conserva varias proteínas ribosomales incluyendo proteínas, ARN polimerasa subunidades, RecA, y otros [1 - 7]. El Thermus género consta en la actualidad de 14 especies termófilas, mientras que el Deinococcus género incluye por lo menos once, la mayoría de las especies mesófilas conocidos por su extrema resistencia a la radiación γ-y otros agentes que causan daño en el DNA, en particular, la desecación [7, 8]. Curiosamente, dos nuevas especies, D. Frigens sp. Nov., D. saxicola, se han aislado recientemente de la Antártida muestras de suelo y roca [9]. D. Geothermalis y D. Murrayi, se consideran termófilas (t optar ~ 45-50 ° C) [10].
T. thermophilus (TT) (cepa HB27, ATCC BAA-163) y D. Radiodurans (DR) (cepa R1, ATCC BAA-816) es muy parecida en la fisiología general, siendo ambos catalasa-positivos, rojo-pigmentadas, no sporulating, aeróbica chemoorganoheterotrophs [11]. Sin embargo, los dos organismos son radicalmente diferentes en términos de resistencia a estrés: DR es uno de los más resistentes a la radiación y la desecación de los organismos y la caracteriza, en general, pueden sobrevivir a diversos tipos de estrés oxidativo, mientras que el TT es un thermophile que prospera bajo térmica Condiciones de estrés, pero es relativamente sensible a la radiación y otras formas de estrés oxidativo. Recientemente, el genoma de T. Thermophilus HB27 y HB8 [12, 13] se convirtió para fines de comparación con los previamente secuenciado del genoma de D. Raduodurans R1 [14].
A pesar de amplias investigaciones, tanto genéticos subyacentes a los sistemas de termófilo adaptaciones y resistencia a la radiación siguen siendo poco conocidos. Se ha tratado de detectar "termófilo determinantes" en el proteomes de thermophiles mediante un enfoque comparativo de los genomas. Esto dio lugar a la delimitación de un conjunto de proteínas que podrían estar asociadas con el fenotipo termófilo, aunque la mayoría de estos son considerablemente enriquecido en thermophiles pero no exclusivo de estos organismos [15 - 17]. Otras distinciones entre mesófilas y termófilas proteínas podría ser debido a diferencias en sus propiedades estructurales, tales como aminoácidos diferentes composiciones, las longitudes de bucle, el número de puentes de sal, la fuerza de interacción hidrofóbica, el número de disulfuro de bonos y otras características [18 - 25] .
Diversas hipótesis se han propuesto para explicar la resistencia a la radiación, algunos postular la existencia de sistemas genéticos especializados, en particular los de reparación del ADN y el estrés respuesta [7, 26]. Recientemente, no obstante, posibilidades alternativas se han avanzado. Por ejemplo, las posteriores a la irradiación de ajuste de metabolismo de la D. Radiodurans podrían impedir la producción de especies reactivas de oxígeno (ROS) por la disminución del número de reacciones de oxígeno [27, 28], y la alta concentración de manganeso intracelular Deinococcus spp. Podría ayudar scavenge ROS generados durante la irradiación y después de la irradiación de recuperación [28, 29]. Sin embargo, estas explicaciones de la resistencia a la radiación han recibido poco apoyo directo de los análisis genómico comparativo-[7, 27, 28].
Varios procesos evolutivos podrían contribuir a la diferenciación del genoma del TT y DR posteriores a la divergencia del ancestro común: (i) diferencial de la pérdida y la ganancia de genes, (ii) la adquisición de genes a través de la transferencia horizontal de genes (HGT), que puede ser seguido por Pérdida de los ancestrales genes ortólogos (xenologous gen desplazamiento (XGD)), (iii) el linaje específicos paralogous expansión de las familias por la duplicación de genes y / o adquisición de paralogs través HGT; (IV), la modificación de la composición de aminoácidos de proteínas que podrían afectar a la estabilidad . En este sentido, experimentalmente caracterizan a la radiación y la resistencia a la desecación de TT en comparación con DR, y, evaluar la contribución de los diferentes procesos evolutivos de diferentes adaptaciones de TT y DR, usando una variedad de enfoques genómicos comparativos-y el análisis filogenético. Identificamos la característica única de los genes de los repertorios DR TT y que podrían contribuir a estas diferencias fenotípicas, que podría ser objeto de más trabajo experimental. Además, se describen los resultados de un análisis detallado de las proteínas que se predijo que participan en la reparación del ADN y las funciones de respuesta a estrés, que son de especial interés para la evolución de adaptación de fenotipos de resistencia.
Si bien la radiación-resistentes a la desecación y fenotipos de DR y la térmica de ambos requisitos DR TT y se han estudiado ampliamente ([7, 12, 30] y las referencias en él), ignorando cualquier detallada caracterización de la respuesta del TT a Irradiación o la desecación. Por lo tanto, tratamos de investigar estas propiedades con el fin de obtener una imagen más completa de las diferencias en la respuesta al estrés y fenotipos de TT DR. No inesperadamente, encontramos que el TT era mucho más sensibles a la irradiación aguda que RD. La curva de supervivencia de TT es similar a la de Esherichia coli K12. Para DR, la dosis de radiación del 10% dando unidad formadoras de colonias (UFC) de supervivencia (D 10) es ~ 16 kGy, mientras que para el TT y E. Coli, la D 10 dosis es de 0,8 kGy y ~ ~ 0,7 kGy, respectivamente (Figura 1]. TT es también muy sensibles a la desecación. El 10% de supervivencia UFC desecación frecuencia de DR se mantiene después de 30 días, mientras que el TT alcanza el 10% en la supervivencia UFC desecación ~ 10 horas (0,4% de supervivencia al cabo de 24 horas) y, por el 5 º día, sufre esencialmente el 100% de letalidad. La baja resistencia a la desecación del TT se observó independientemente de la temperatura y la velocidad de secado (ver archivo adicional 1, "Desiccation de TT a 65 ° C"). La desecación de resistencia de E. Coli se encontró que era intermedio entre los de TT y DR (Figura 2].
Nos informó recientemente de una tendencia intracelular Mn / Fe coeficientes de concentración en la resistencia bacteriana IR, donde muy alta y muy baja Mn / Fe con coeficientes de correlación muy alta resistencia y muy bajo, respectivamente [29]. También hemos demostrado que cada vez D. Radiodurans en condiciones que limitan Mn (II) de acumulación, reducido de manera significativa las células' IR resistencia [29]. Estas observaciones llevaron a la hipótesis de que la proporción de Mn a la Fe en una celda podría determinar la abundancia relativa de los diferentes ROS inducida durante la exposición a la recuperación de la IR y [28, 29]. A altas concentraciones, Mn (II), puede actuar como catalizador de la verdadera dismutation de superóxido (O 2 • -), con Mn ciclismo entre los estados divalente y trivalente; Mn redox de la bicicleta scavenges tanto O 2 • - y peróxido de hidrógeno [31 ]. En este contexto, se determinó la intracelular Mn / Fe ratio de TT mediante un plasma de acoplamiento inductivo-método de la espectrometría de masas (ICP-MS), según lo descrito anteriormente [29]. TT células contenidas 0,211 (± 0,0254) Mn nmol / mg de proteína y 4,54 (± 0,778) Fe nmol / mg de proteína. La intracelular Mn / Fe ratio de TT (D 10, ~ 0,8 kGy) es 0,047, frente a 0,0072 para la E. Coli (D 10, ~ 0,7 kGy), de 0,24 D. Radiodurans (D 10, ~ 16 kGy), y <0,0001 para Pseudomonas putida (D 10, ~ 0,25 kGy) [29]. Así, el TT parece ser algo más sensibles a la desecación y aguda IR inferior a lo previsto por su Mn / Fe ratio, lo que sugiere la posibilidad de más complejas las relaciones entre estas dos variables. En particular, la basura de O 2 • - por Mn (II) depende en gran medida de la disponibilidad de H 2 O 2, que en el TT se espera que sea limitante durante la recuperación a los 65 ° C debido a la descomposición térmica [32]; ineficiente Mn Redox de la bicicleta puede llevar a Mn (III) de acumulación, que es citotóxico. Ambos DR TT y codifican un tipo ABC-Mn transportista y un regulador transcripcional, probablemente, que regula la homeostasis Mn. Además, tiene un DR NRAMP Mn transportador de la familia, por lo que no existe en ortholog TT.
La información sobre la presencia-ausencia de genes ortólogos en un conjunto de los genomas puede ser utilizada para producir un gen contenido de árbol [33, 34]. La topología de un gen-el contenido árbol puede reflejar no sólo las relaciones filogenéticas entre las especies, sino el estilo de vida en comparación similitudes y diferencias, y también [33, 35, 36]. Dadas las enormes diferencias en los estilos de vida y fenotipos de resistencia TT y DR, que se mostraron interesados para determinar si el gen contenido de la mayoría de TT fue similar a la de DR o de los de otras bacterias termófilas o, tal vez, incluso arqueas. Con este fin, asignará las proteínas codificadas en el genoma TT a la Racimos de Orthologous grupos de proteínas (COGs) [37] y, utilizando los modelos de representación de las especies en COGs para calcular las distancias entre las especies, reconstruido un gen contenido de árbol Como se describe anteriormente [35]. En el resultado de genes contenido de los árboles, que incluyó 62 secuenciado los genomas de procariotas y eucariotas unicelulares, TT y DR se recuperó con confianza como hermana especies, y el DR-TT linaje se coloca dentro de un árbol que también incluyó Actinobacteria y cianobacterias, varios de los cuales Son conocidos por su extrema desecación y la radiación resistencias [38 - 40] (Figura 3]. Por esta rama, la topología de la gen-imita el contenido árbol topologías de árboles construidos con otros enfoques basados en el genoma de datos a escala [34, 35], lo que indica que el gen repertorios de estas bacterias, y la TT y DR en particular, han Sido divergentes, aproximadamente, en un reloj-como la moda. Para determinar que era probable que los genes se han perdido y ganado en cada linaje, reconstruido una parsimoniosa escenario de la evolución desde el último antepasado común bacteriana (LBCA) a TT y RD, a través de su último ancestro común. La reconstrucción se realizó sobre la base de la cesión del TT y las proteínas a COGs DR, junto con COG phyletic basada en patrones de 62 otros secuenciado los genomas de bacterias y archaeal [37], utilizando un ponderado previamente desarrollados parsimonia método [41] (véase Métodos Disposición adicional y 2]. Este enfoque asigna 1310 genes (COGs) a la DR-TT ancestro común (Figura 4]. De ellos, 1081 (~ 80%) se mantienen en ambos TT y DR y pertenecen a su núcleo de genes compartidos. Desde TT (2210 genes) ha pronosticado muchos menos genes de codificación de proteínas más DR (3191 genes), parece probable que la divergencia de los dos implicados en la reducción sustancial del genoma TT y / o ampliación en el genoma DR. Sin embargo, los resultados sugieren que la reconstrucción no ha experimentado TT masiva del genoma total, aunque la reducción del flujo de genes (es decir, la suma total de los genes inferirse que se ha perdido y ganado) durante la evolución de este linaje fue considerable, con la participación de ~ 25% de la Gene complemento. En contraste, DR 272 COGs adquirida, y sólo 59 perdidos, lo que indica el crecimiento sustancial del genoma después de la divergencia DR-TT (Figura 4].
Estábamos más interesados en determinar si existen similitudes entre los genes de los repertorios TT y dos profundamente ramificadas bacteriana hyperthermophiles, Aquifex aeolicus (AA) y Thermotoga maritima (TM). Encontramos que los genes que están presentes en la RD TT, pero no son significativamente más probable que se presente en AA y TM de los genes presentes en DR, pero no TT (Tabla 1]. Por el contrario, entre los 170 genes TT inferirse que se han perdido, sólo 20 estuvieron presentes en las dos AA y TM. Así, el repertorio de genes ha TT significativamente mayor similitud con las bacterias hipertermófilas que el gen repertorio de DR, tal vez como consecuencia de HGT directa o paralelas (véase también a continuación).
La mayoría de los genes compartidos por DR TT y codificar las proteínas de mantenimiento de la casa y se han generalizado en las bacterias. Entre estos, 14 COGs son inusuales en el sentido de que no se encuentran en ningún otro lugar, pero las bacterias son compartidas por el TT y DR con arqueas o eucariotas. Este conjunto incluye 8 subunidades de la Arqueales / vacuolar de tipo H +-ATPasa y otros seis COGs que constará de carácter archaeal genes (phosphoglycerate mutasa, COG3635; 2-phosphoglycerate quinasa, COG2074; SAR1-como GTPasa, COG1100; GTP: adenosylcobinamide-fosfato Guanylyltransferase, COG2266; prevista de proteínas de membrana, COG3374; methylase modificación prevista de ADN, COG1041).
Como se observó anteriormente, algunos DR genes que pertenecen a familias bien representadas en las dos bacterias y arqueas archaeal mostró clara afinidad [42]. Para evaluar el número de genes de la aparente "termófilo" linaje (ya sea archaeal o bacteriana) tal vez ya han estado presentes ya en el DR-TT común antepasado, se realizó un análisis filogenético de los genes que fueron asignados a la DR-TT antepasado y había 3 De las 5 mejores canciones de los genes de thermophiles (ambos archaeal y bacterianas; ver archivo adicional 1: "Análisis filogenético de los genes de la reconstruido DR-TT ancestro común"). Hemos encontrado que al menos 122 genes (~ 10% de la predicción de genes repertorio de la DR-TT ancestro común) de los inicialmente seleccionados 205 genes mostraron una afinidad de las especies termófilas, es decir, ya sea una sucursal de dos genes ortólogos de RD y TT , O una TT o DR genes (en los casos en que las respectivas ortholog aparentemente se perdió en el otro linaje) agrupadas con thermophiles (ver archivo adicional 1, el cuadro 1S; archivo adicional y 6]. Debido al hecho de que muchos árboles topologías son muy perturbada por múltiples eventos HGT y pueden ser inexactas debido a las diferencias en las tasas entre linajes evolutivos, esto es sólo una estimación aproximada del número de "termófilo" genes en el DR-TT antepasado. En particular, no se puede descartar que algunos de los ancestrales "termófilo" genes, que se encuentran actualmente presentes en el TT, pero no DR (10 dichos genes a prueba de los 122 genes), se han adquirido por vía XGD TT (véase el archivo adicional 1, el cuadro 1S). En conjunto, estas observaciones sugieren la posibilidad de contactos entre el ecológicos DR-TT antepasado y arqueas hipertermófilas y / o bacterias, que hace que la adquisición de "termófilo" genes a través de HGT.
Nuestra reconstrucción de los eventos evolutivos que se produjeron después de la divergencia de la TT y DR linajes de la trazada, el ancestro común de los conjuntos de genes que probablemente se han ganado y perdido por cada linaje (Figura 4]. En primer lugar, examinar con mayor detalle el plan de la pérdida y la ganancia de genes en TT. La ausencia de ciertos genes metabólicos en el TT crea lagunas en sus vías metabólicas, algunas de las cuales son esenciales. Sin embargo, el TT es capaz de sintetizar todos los aminoácidos, nucleótidos y de la mayoría de cofactores, lo que sugiere que los espacios son ocupados por analogía o por lo menos no ortólogos enzimas. Varios de esos casos se han descrito. Por ejemplo, TT DR codificar y sin relación thymidylate synthases, DR2630 (COG0207) y TTC0731 (COG1351). El clásico, dependientes del folato thymidylate sintasa (COG0207) presente en RD es probablemente ancestral en bacterias y, aparentemente, fue desplazado a través de Thermus HGT en el linaje de los que dependen de la flavina thymidylate sintasa, típico de bacterias y arqueas thermophiles. En otros casos, las enzimas o análogo sustituir las vías siguen siendo no. Por ejemplo, el desplazamiento de los dependientes del folato thymidylate sintasa con la flavina-dependiente tipo TT en el linaje y en otras bacterias y de arqueas se correlaciona con la aparente pérdida de dihydrofolate reductasa (folA, COG0262), que cataliza el último paso de la tetrahydrofolate Biosíntesis vía. Desde tetrahydrofolate es un cofactor esencial, un desplazamiento parece más probable. Recientemente, se ha demostrado que la halobacterial FolP-FolC una proteína de fusión complementada Haloferax volcanii folA mutante [43]. Por lo tanto, parece probable que FolC y FolP en TT y otros organismos de complementar la actividad de FolA pesar de la existencia de un sin relación, aún no dihydrofolate reductasa no se puede descartar.
Además, el TT no codifican dos enzimas de la biosíntesis pyridoxal fosfato (pdxK, COG0259 y pdxH, COG2240), mientras que RD tiene un conjunto completo de las enzimas de esta vía. Nuestro reconstrucciones sugieren que es probable pdxK perdido en el TT linaje, mientras que DR probablemente adquirido pdxH independiente. Sin embargo, el camino es probable que sea funcional en ambos organismos. Desde similares deficiencias en la biosíntesis pyridoxal fosfato son vistos en una gran variedad de organismos procarióticos [44], parece que, al menos para algunas etapas de este camino, existe un conjunto de distintas enzimas, que siguen siendo no identificadas.
Algunos sistemas aparentemente estaban completamente perdidos en el TT linaje. Estos incluyen el complejo de ureasa, el metabolismo vía ramnose, acyl CoA: acetate/3-ketoacid CoA transferasa, el transporte y la utilización de fructosa, glicerol y el metabolismo. En particular, la mayoría de estos sistemas son también ausente en bacterias termófilas y muchas arqueas termófilas.
En contraste con RD, los genes que parecen haber sido adquiridos por TT muestran una clara conexión con el estilo de vida termófilas. En particular, TT parece haber adquirido 23 familias de genes del conjunto de factores determinantes putativo termófilo [17], mientras que el DR-TT común antepasado había genes 5 de la lista, y RD parece haber adquirido sólo uno (ver archivo adicional 3] . La mayoría de estas proteínas (17 de 31) se codifican en el TT megaplasmid y 11 pertenecen a la prevista móviles de reparación del ADN característicos del sistema thermophiles [16, 45] (Figura 7A; ver detalles a continuación). Además, el TT ha adquirido 4 "archaeal" genes que no están codificados en cualquiera de los genomas de bacterias mesófilas asignado a COGs (péptido de la cadena de liberación factor 1, COG1503; ADN modificación methylase, COG1041, y dos proteínas de membrana, COG3462 y COG4645 ).
El Sox-como la oxidación de azufre del sistema se encuentra entre el grupo de genes que al parecer fueron adquiridos en el TT linaje. El TT Sox operón es en parte similar a la identificada en AA (ver archivo adicional 1, figura 2S), y podría haber sido transferido horizontalmente entre la AA y TT linajes locales, con la consiguiente reorganización. La presencia de los Sox en operón TT sugiere que esta bacteria puede utilizar la reducción de los compuestos de azufre como fuente de energía y azufre. Otro sistema probablemente adquirida por la utilización del TT es la lactosa (por lo menos tres proteínas: LacZ, COG3250; GalK, COG0153; GalT COG1085; GalA, COG3345). Este sistema también está presente en TM, lo que indica que los azúcares pueden ser utilizados como fuentes de carbono por bacterias termófilas.
El DR linaje aparentemente ha adquirido muchos más genes de lo que ha perdido (Figura 4]. La mayoría de los genes que codifican DR perdido por las enzimas del metabolismo de la energía y la biosíntesis de cofactores. Un ejemplo de ello es la pérdida de las tres subunidades de piruvato: ferredoxin oxidoreductase, que es uno de los varios conocidos para los sistemas de oxidación de piruvato, un elemento clave de la reacción del metabolismo central. Otro ejemplo de la pérdida de genes en RD involucra a los tres subunidades de NAD y NADP transhydrogenase, que se encarga de la energía dependen de la reducción de NADP + [46]. Además, el DR linaje perdido cuatro enzimas de la biosíntesis de NAD y seis cobalamine enzimas de la biosíntesis, y consecuentemente, DR depende de una fuente exógena de NAD para el crecimiento [28, 47].
Un notable número de genes aparentemente adquiridos por el DR linaje codifican proteínas de la degradación de los sistemas y catabolismo de aminoácidos (por ejemplo,., La ureasa, DRA0311-DRA0319, y un transportador de la urea predijo, DRA0320-DRA0324; histidina degradación del sistema, DRA0147-DRA0150; monoamino oxidasa , DRA0274; lisina 2,3-aminomutase, DRA0027; kynureninase y triptófano-2 ,3-dioxygenase, DRA0338-DRA0339; peptidase E, DR1070, y carboxypeptidase C, DR0964, y D-aminopeptidasa, DR1843 (ver archivo adicional 4]. Una tendencia similar se observó para la ampliación de varias familias de proteínas en RD, como secretada subtilisina-como las proteasas (ver más abajo). Además, DR adquirió dos de tres subunidades de los complejos de tipo aeróbico-el monóxido de carbono deshidrogenasa (DRA0231-DRA0233 y DRA0235 - DRA0237); oxidación de CO por esta enzima puede ser usada como fuente de energía, como se muestra para algunas bacterias [48]. Adquisición y ampliación de estos sistemas metabólicos, junto con la pérdida de ciertas capacidades de biosíntesis, apoya la posibilidad de que la reestructuración podría tener efectos metabólicos Estrés oxidativo resistencia en RD por la disminución de la necesidad de alta energía que dependen de las actividades celulares. La producción de energía a través de la cadena respiratoria es una importante fuente de radicales libres en las células [49].
RD tiene muchos más genes de las proteínas implicadas en el transporte de iones inorgánicos y el metabolismo de TT. En particular, ha adquirido el DR multisubunit Na + / H + antiporter (7 genes), el transporte de K +-ATPasa (3 genes), y la FeoA / FeoB Fe sistema de transporte. Esta abundancia de los sistemas de transporte de iones podría ser indirectamente vinculados a la resistencia a estrés oxidativo a través de la regulación de los gradientes iónicos de membrana y Mn / Fe homeostasis (véase más arriba).
RD es más dependiente que el TT péptido derivado de los sustratos de crecimiento [47] y tiene una respuesta más compleja circuitería de estrés. En consonancia con ello, los sistemas de transducción de señales de DR, predicho por el análisis del genoma, son mucho más elaboradas que las de TT. En particular, DR tiene por lo menos 33 COGs (15 probablemente adquirida después de las diferencias en relación con el ancestro común con TT) en relación con la señal de transducción de las funciones que no están representados en el TT, en comparación con 12 (5 adquirida) tales COGs en TT. Además, aunque la mayoría de la señal de transducción de dominios son compartidas por DR y TT, el dominio de las respectivas arquitecturas multidominio proteínas son completamente diferentes ([7] y KSM, observaciones no publicadas).
Entre los genes aparentemente adquirido por DR, dos multidominio codifican proteínas que contienen distintas periplasmic ligando vinculante sensor de dominios (DRA0202, COG5278 y DR1174, COG3614). Otra proteína, DRA0204, contiene la CHASE3 de dominio [50] y está situado en un operón predijo con superóxido dismutasa (DRA0202), lo que indica una función de la respuesta de estrés oxidativo. La proteína contiene la DR0724 SARP dominio que está involucrada en la apoptosis relacionados con vías de señalización en eucariotas [51], pero su función es desconocida en bacterias. Las funciones de las otras proteínas de transducción de señales de DR son aún menos clara, con la notable excepción de un phytochrome-como la proteína (DRA0050) que, al parecer, fue adquirido por DR de una fuente de bacterias y se ha implicado en la resistencia a la radiación ultravioleta [52].
Además, el RD tiene muchos genes (25 COGs) para la codificación de los sistemas de defensa microbiana; TT tiene sólo 14 COGs en esta categoría, de los cuales 13 son compartidas con el DR. Al menos 7 genes de restricción-modificación del sistema subunidades fueron adquiridos específicamente por el DR linaje, junto con varios de resistencia a los antibióticos enzimas. Esta diferencia podría estar vinculada a la reducción de capacidades metabólicas de DR, que depende de las condiciones de ricos en nutrientes para el crecimiento y, tal vez, el encuentro más que las especies de microbios TT.
El anterior análisis de la RD del genoma reveló 15 genes que parecen haber sido transferidos de forma horizontal fuentes inesperadas, como eucariotas y virus [7]; sólo dos de estos 15 genes están presentes en el TT, la desecación de las proteínas relacionadas con la familia de ferritina Uma2 y la familia-al igual que las proteínas (véase el análisis de estas proteínas más abajo). Dos desecación relacionados con las proteínas han demostrado ser involucrados en la desecación, pero no la resistencia a la radiación [53]; Ro ribonucleoprotein es aparentemente involucrados en la resistencia a los rayos UV [54], y la topoisomerasa IB, en tanto que activa, no tiene ningún papel en la conocida DR [55]. Hasta el momento, ninguno de estos genes se ha relacionado con radioresistance experimentalmente en RD.
Está bien establecido que HGT ha hecho importantes contribuciones a los repertorios de la mayoría de los genes de bacterias termófilas como el apoyo de la presencia de numerosos genes con alta similitud a la inesperada y / o afinidad filogenética con los genes típicos de arqueas hipertermófilas [56 - 60]. Estos casos incluyen incluso las proteínas que tienen en orthologs mesófilos, pero, como lo demuestra el análisis filogenético, tiene clara afinidad a arqueas o bacterias termófilas del lejano bacteriana linajes, que es indicativo de XGD [57]. Para investigar los efectos de HGT de thermophiles a XGD líder en la evolución de los genes repertorio de TT, se determinó la filiación taxonómica de las proteínas del núcleo de genes comunes y TT DR. Se utilizó la taxonomía de distribución de las mejores éxitos en la búsqueda de BLAST identificación preliminar de los candidatos HGT, seguido de un detallado análisis filogenético de los genes seleccionados.
Como era de esperar, en comparación con RD, TT tiene un notable exceso de la fracción de los mejores hits de bacterias y arqueas termófilas para ambos básicos y no básicos proteínas (Figura 5A, y ver el archivo adicional 5]. Sin embargo, se ha informado de que la mejor BLAST hit no siempre reflejan con exactitud filogenia [61]. En particular, los artefactos de las mejores hit análisis puede ser causada por sesgos similares en la composición de aminoácidos de las proteínas en thermophiles TT y otras, como se ha demostrado anteriormente [62, 63]. Evaluar sistemáticamente estos efectos, se realizó un análisis filogenético de 112 TT proteínas y 21 DR proteínas del núcleo común que tenían sus respectivos mejores éxitos en thermophiles (ver archivo adicional 7]. A pesar de que todos estos árboles fueron construidas para las familias en las que las proteínas DR TT y no se mutuo mejores éxitos en la no redundancia de base de datos de secuencias de proteínas (Centro Nacional de Información sobre Biotecnología, NIH, Bethesda), más de la mitad de los árboles (69 Árboles, el 52%) recuperado un DR-TT clado, 39 de estos agrupación con este clado mesófilos y 30 con thermophiles (Figura 5B]. Sin embargo, la diferencia de evolución de las pautas de DR TT y se encontró con claridad en este análisis: una fiable afinidad con thermophiles se detectó durante 18 TT proteínas y sólo una proteína DR. El ex casos es probable que representan HGT TT en el linaje de otros thermophiles, mientras que el único "termófilo" gen de DR puede implicar la dirección de HGT, de la RD linaje a Thermoanaerobacter tencongiensis (datos no presentados).
Composición de aminoácidos es conocido sesgo a afectar no sólo a la búsqueda de similitud de secuencias, pero la filogenia y la reconstrucción [64]. Hemos probado este efecto en nuestro conjunto de datos mediante la comparación de la secuencia de base máxima verosimilitud a los árboles vecinos a participar en los árboles reconstruido a partir de las frecuencias de aminoácidos de las proteínas correspondientes (véase el archivo adicional 1, "Influencia de la composición de aminoácidos en la reconstrucción filogenética") . Se encontró que, en la mayoría de los casos (> 80%), la topología de la secuencia de la base del árbol no es congruente con el de la composición de aminoácidos de árboles, por lo que el efecto de la composición de aminoácidos de la muestra en el desglose Figura 5B es poco probable que sea sustancial. En conjunto, estos resultados sugieren que la participación de XGD genes de thermophiles mensurables hizo una contribución a la evolución del conjunto de genes fundamentales TT después de las diferencias en relación con el DR-TT común antepasado; dicha contribución no fue detectada en el caso de DR. Si bien esta interpretación parece más plausible dada la proximidad de TT ecológicos y otros thermophiles, no se puede descartar que los patrones (Figura 5B] se explica, en parte, por XGD con genes de bacterias mesófilas en la RD linaje. Más en general, estos resultados hacen hincapié en que la distribución taxonómica de las mejores bases de datos de visitas puede tomarse sólo como un indicador preliminar y aproximada de HGT.
Entre los casos de posibles XGD apoyada por el análisis filogenético, hay dos proteínas ribosomal, L30 y L15, que son codificadas por los genes adyacentes dentro de un operón ribosomal conservadas. Las proteínas codificadas por estos genes en torno a operones mostró clara afinidad a la correspondiente DR orthologs (datos no presentados). En los árboles filogenéticos de la L30 y L15, el TT proteínas fiable agrupado con orthologs de hyperthermophiles bacteriana, y no con las correspondientes DR orthologs (Figura 6A y 6B]. Los patrones evolutivos visto congruentes con estos dos ribosomal proteínas codificadas por los genes adyacentes sugieren que este gen ha sido reemplazado par a través de XGD in situ, sin alterar la operón organización [65]. Nuevos casos de aparente XGD, donde DR confianza particiones en el mesófilas clade, que pertenece a la TT termófilo clado, se muestran en la Figura 6C, D (en cada uno de estos casos, los termófilos clado tiene una mezcla de especies mesófilas mientras que el mesófilas clado No incluye thermophiles).
La aparente linaje específicos HGT TT en RD y no se limitaba a XGD o a la adquisición de genes de thermophiles. Otros ejemplos de los distintos tipos de HGT apoyada por el análisis filogenético se presentan en la Tabla 2.
La mayoría de los linajes de bacterias contienen un conjunto único de la familia ampliada paralogous genes [66]. Esta idea fue corroborada por el presente análisis comparativo de los genomas de RD y TT. Ninguna de las familias ampliadas que se han detectado durante el anterior análisis detallado de la RD del genoma [7] se amplió en el TT, y muchos habían desaparecido por completo. Esto indica claramente que la duplicación de genes extensa y la adquisición de nuevas pseudoparalogs través HGT, que condujo a la expansión de estas familias en RD, se produjo después de las diferencias en relación con el ancestro común con TT, y podría contribuir a las adaptaciones específicas de DR (Tabla 3] . Ampliación de varias otras familias en RD se reveló en el curso de la presente comparación con TT. Un ejemplo notable es el de la familia predijo proteínas asociadas a la membrana (DR2080, DR1043, DR1952, DR1953, DR1738), que se codifican junto a los reguladores transcripcionales de la familia-como PadR (COG1695 9; paralogs en DR, en ninguno) (TT Cuadro 3]. PadR-al igual que los reguladores están involucrados en la regulación de la respuesta celular a agentes químicos estrés, derivados de ácidos fenólicos [67]. Otro previamente inadvertido paralogous familia que se amplía en RD incluye las proteínas que contiene el MOSC (MOCO sulfurase C-terminal) de dominio (COG2258, cuatro paralogs en RD y uno en el TT). Estas proteínas se han previsto para funcionar como portadores de azufre-azufre que entregar para la formación de grupos de metal-azufre asociados con enzimas diferentes [68]. Uno de estos genes (DR0273) forma un operón predijo con genes de una hidrolasa Nudix y una monooxigenasa, lo que sugiere que estas proteínas podría comprender una clara respuesta de estrés / casa de limpieza de complejo.
Varias familias están específicamente paralogous ampliado en TT (Cuadro 4]. La mayor de estas (15 paralogs en comparación con tres en RD) es el Uma2 familia que está muy extendido en las cianobacterias, pero visto de otro modo, en sólo unos pocos tipos de bacterias. La (s) función de estas proteínas es desconocida, la presencia de residuos de ácido conservados sugiere que podría tratarse de ADN no vinculante proteínas [69]. La expansión de los transportistas de azúcar previsto en el TT y la escasez de proteasas extracelulares (incluyendo subtilases) es inesperado porque se ha demostrado que es predominantemente un TT proteolíticas saccharolytic en lugar de un organismo [70]. Sin embargo, cabe señalar que el TT, a diferencia de RD, no se ha observado que secretan proteasas (datos no presentados).
En particular, varias familias de proteínas que se amplió en el TT, pero están ausentes en RD pertenecen a la serie de posibles factores determinantes termófilas (HEPN nucleótidos vinculante de dominio; predijo phosphoesterases relacionados con la proteína Icc) [17] o se amplían en thermophylic arqueas (PIN - Nucleasa como dominio, mínima nucleotidyl transferasas, UspA-como dominio de nucleótidos vinculante) [71], Cuadro 4]. En particular, el TT tiene tres paralogs de las arqueas específicos de tungsteno que contienen aldehído ferredoxin oxidoreductase (TTC0012, TTC1834, TTP0122, TTP0212), que es el primer occurrenceof esta enzima en bacterias termófilas. Sin embargo, estas enzimas están presentes en varios mesófilos, y tienen varias características específicas sustrato, y que podrían estar implicados en el sector del azúcar, los aminoácidos o el metabolismo de azufre [72, 73].
Análisis comparativo de los bien caracterizados sistemas genéticos de replicación, reparación y recombinación, y en las funciones relacionadas con la TT y DR muestra que las fracciones de estos genes en los respectivos genomas son muy similares (Tabla 5; ver archivo adicional 1, el cuadro 2S, 3S) . Las mayores diferencias se observaron entre las proteínas asociadas a los daños directos inversión (11 frente a 26 en TT en RD), que se debe a la extraordinaria expansión de la NUDIX (MutT similares) en la familia de hidrolasas DR [7]. Cabe señalar que la mayoría de estas proteínas tienen otros sustratos de 7,8-dihidro-8-oxoguanine-trifosfato (o difosfato), que es cleaved por MutT. Constantemente, la mayoría de la NUDIX proteínas parecen ser "casa de la limpieza" en lugar de las enzimas de buena fe los componentes de los sistemas de reparación [74]. Otras diferencias notables incluyen la aparente pérdida de la respuesta SOS-represor transcripcional LexA [12] y otro de SOS-respuesta de la proteína, endonucleasa VII (XseAB) en el TT linaje; estas proteínas parece que se han perdido también por otra bacteria termófilas, AA. En cambio, tiene dos DR LexA paralogs (DRA0344 y DRA0074), pero sus funciones siguen siendo poco claras. Un trastorno genético de DRA0344, paralog la que muestra una mayor similitud con la proteína LexA canónica bacteriana, no resulta en la sensibilidad a los daños del ADN o menoscabo de RecA expresión [75]. Photolyase (PhrB) y endonucleasa IV (nfo) se encuentran entre las pocas proteínas de reparación del ADN que, probablemente, fueron adquiridas por el TT después de las diferencias en relación con el ancestro común con el DR. Además, la subunidad catalítica de la DNA polimerasa III de TT (DnaE, TTC1806) tiene dos inserta inteins, mientras que el DR0507 ortólogos tiene ninguno. En general, parece que los convencionales sistemas de reparación de ADN de TT y DR están estrechamente relacionados entre sí y con los respectivos sistemas de otras bacterias de vida libre. Así, el único, que comparten las características de estos sistemas no explican la gran diferencia observada en la resistencia entre el TT y especies DR.
Sin embargo, una conclusión de que no hay diferencias importantes entre los sistemas de reparación de TT y DR podría ser prematura. Recientemente, varias proteínas adicionales de RD han estado implicados en la reparación del ADN o ARN, ya sea en directo o los experimentos sobre la base de la regulación después de la irradiación, complementado con el análisis de secuencia de proteínas. Estos putativo de las enzimas de reparación incluyen DRB0094, un RNA ligase [76] que está firmemente hasta reguladas en respuesta a la radiación [27], y que podrían estar involucrados en un proceso de reparación no ARN; pronostique una doble vertiente romper complejo de reparación específica para la recuperación después de la irradiación , Que consta de DRB0100, ligase de la DNA, DRB0098, una proteína que contiene un HD de la familia y de la fosfatasa polinucleótido quinasa dominios [7]; DRB0099, predijo la fosfatasa de la superfamilia H2Macro ([27] y KSM, observaciones no publicadas), un doble Stranded DNA-proteína de unión PprA (DRA0346), que estimula la unión de ADN de fin de reacción in vitro [77], un predijo un solo filamento de ADN recocido proteína DdrA (DR0423) [78]; un regulador de la radiación respuesta IrrE (DR0167); Un metal fundido que dependen de la proteasa a una hélice-giro-hélice de dominio [79, 80], y la proteína no DR0070 que ha demostrado ser esencial para la plena resistencia a la irradiación aguda [27]. Entre estos mal caracterizado (prevista) de proteínas de reparación DR, DdrA sólo tiene un ortholog TT en el genoma. En general, estos putativo de los genes de reparación están muy poco representadas en las bacterias, y parece muy poco probable que se presente en el ancestro común de TT y de DR; más probable, estos genes fueron adquiridos por la RD a través de linaje HGT después de la divergencia de la común Ancestro con TT, y podrían haber contribuido a la evolución del fenotipo de resistencia. Sin embargo, la relevancia funcional de estos genes de resistencia a la radiación sigue pendiente de confirmación debido a que la mayoría de los correspondientes mutantes knockout sólo mostró relativamente pequeña a moderada disminución de la resistencia a la radiación [27, 78].
Entre los singulares (prevista) de las enzimas de reparación TT, la más notable son los componentes de la putativo thermophile específicas de la reparación del sistema, que son en su mayoría codificada en el TT megaplasmid (Figura 7A]. Las características funcionales de las proteínas codificadas en este sistema (COG1203, un ADN helicasa, a menudo fundido a una superfamilia previsto HD-hidrolasa; COG1468, un RecB-exonuclease familia; COG1353, predijo la polimerasa) sugieren que los que están involucrados en un todavía no Vía de reparación del ADN. Se ha planteado la hipótesis de que esta novela podría ser complejo de genes funcionalmente análogos a los de bacterias-eucarióticas sistema de translesion, mutágenas cuya reparación son componentes centrales de ADN polimerasas de la UmuC-DinB-Rad30-Rev1 superfamilia, que generalmente faltan en thermophiles [16] .
Comparación de las proteínas de diferentes sistemas (prevista) que participan en el estrés de respuesta revela un mayor número y diversidad de tales proteínas en RD, que tiene 26 COGs con las funciones que no están representados en comparación con el 3 TT tales COGs en TT (véase el archivo adicional 1 , Mesa 4S). En total, hay 147 proteínas en RD en esta categoría y 86 en TT, lo que sugiere que algunos de ellos son, además, ampliado en DR (véase la sección sobre "Ampliación de la familia").
Enzimática de los sistemas de defensa contra el estrés oxidativo previsto en el TT y RD también muestran diferencias importantes. TT cuenta con uno dependiente de Mn superóxido dismutasa (SodA) [81] y uno de Mn-dependiente de catalasa (sin ortholog en RD), mientras que DR codifica tres dismutases superóxido (una de las cuales es la ortholog de la SodA gen de TT) y tres Predijo catalases sin TT orthologs [7]. Además, tiene un DR citocromo C peroxidasa (DRA0301) y un hierro predijo que dependen de peroxidasa (DRA0145), enzimas que pueden ofrecer protección frente a peróxidos tóxicos [49]. Orthologs de estas enzimas son raros entre las bacterias, lo que sugiere que el linaje Deinococcus adquiridos a través HGT después de la divergencia de TT y el doble a partir de ancestro común. Reducción de los residuos oxidados metionina en las proteínas es fundamental para la supervivencia de las células bajo estrés oxidativo [82, 83]. En consonancia con esta idea, dos péptidos metionina sulfóxido reductases (PMSRs), MsrA (DR1849) y MsrB (DR1378), se codifican en el genoma DR [84, 85], mientras que no están presentes en el TT. Curiosamente, ambos PMSRs también están desaparecidas en Aquifex, Thermotoga más termófilas y arqueas, lo que sugiere por lo menos dos posibilidades: o bien este tipo de daño oxidativo es raro a altas temperaturas o el conocido PMSRs se sustituirán por no análogo enzimas debido a la ineficiencia de la antigua A altas temperaturas.
El estrés oxidativo mecanismos de defensa también podría incluir el control de Mn y Fe particionado en la celda [29]. Proteínas de la Dps / ferritina familia son necesarios para el almacenamiento de hierro en un estado no reactivo, que impide que el hierro-catalizó la formación de radicales hidroxilo, por lo tanto, la protección de la célula de la toxicidad de hierro (tipo Fenton-química) [86]. Dos Dps relacionados con las proteínas están codificados en el genoma DR (DR2263, DRB0092, COG1528), y se ha demostrado que uno de ellos (DR2263) protege el ADN de ambos el radical hidroxilo y división de DNasa I-mediada división [87]. Algunas proteínas homólogas a DPS no puede obligar específicamente ADN y, por tanto, se consideran como protectores de ADN específicos [88]. Como la mayoría de thermophiles, TT no tiene proteínas de esta familia, pero codifica una ferritina de otra familia (TTC1122).
Dado que la desecación también provoca el estrés oxidativo, las proteínas implicadas en la resistencia a la desecación pertenecen a la categoría general de defensa celular [89]. Desecación de las proteínas relacionadas con por lo menos dos familias se han detectado en RD [7]. Estas familias de proteínas resistencia a la desecación (76 Lea familia, DR0105 y DR1172, y Lea14 familia, DR1372) no están representados en el TT. Sin embargo, tres TT proteínas (TTP0170, TTP0166, TTP0169) son homólogos de la resistencia a la desecación otra proteína que se caracteriza inicialmente en una planta, Craterostigma plantagineum [90]; DR también tiene dos proteínas de esta familia, DRB0118 y DRA0258. Estas proteínas son alejadas a COG1633 y ferritina pertenecen a la familia de proteínas de almacenamiento de hierro (KSM, inédito). Altamente conservadas homólogos de estas proteínas también están presentes en bacterias y arqueas termófilas. Dos proteínas relacionadas con la desecación (DR1172 y DRB0118) parecen ser esenciales para la resistencia a la desecación, pero no para la resistencia a la radiación en DR [53].
Ambos TT y DR han multipartitos genomas. Para estudiar las posibles relaciones evolutivas entre el genoma de las particiones y TT DR, analizamos la distribución simétrica de los mejores hits (putativo orthologs) en el único elemento extra-cromosómicos de TT, el pTT27 megaplasmid, y las tres particiones más pequeñas del genoma de DR (pequeños Cromosoma, DR412; megaplasmid, DR177 y plásmido, CP1; Cuadro 6]. Los resultados de este análisis demuestran que tiene una pTT27 altamente significativo exceso de orthologs sobre DR177, lo que sugiere que estos dos son megaplasmids homóloga, es decir,., Probablemente evolucionó desde una partición del genoma común DR-TT antepasado. Aparentemente, sin embargo, los genomas de la megaplasmids han sufrido modificaciones desde la amplia divergencia desde el ancestro común porque no conservación de la orden de genes podría ser identificados (datos no presentados).
Cabe destacar que, entre los factores determinantes de la putativo termófilo TT, ~ 50% se codifican en el megaplasmid (18 de 36). De estos, 11 pertenecen a la putativo móvil thermophile específicos de sistema de reparación del ADN [16, 45] (Figura 7A]. Además, el megaplasmid lleva por lo menos cuatro otros genes asociados a este sistema, que aún no han sido asignados a COGs (Figura 7A]. Además, el TT megaplasmid también lleva un pseudogen para invertir-girasa, la más conspicua de la firma de proteínas hyperthermophiles [15, 17].
Recientemente, el genoma de otra cepa de TT (HB8), ha sido completamente secuenciados y disponibles en bases de datos públicas [13]. Una comparación preliminar de las dos cepas TT (HB27 y HB8) puesto de manifiesto importantes diferencias en el gen órdenes y el contenido de la megaplasmids (ver archivo adicional 1, figura 3S). Curiosamente, estas diferencias en el contenido de genes se derivan principalmente de los genes que parecen estar asociados con el estilo de vida thermophylic. En particular, la cepa HB8 codifica intacta inversa-girasa. Por lo tanto, parece más probable que el gen para invertir-girasa fue adquirida de una fuente hipertermófilas por el TT linaje y estuvo presente en el ancestro común de HB27 y HB8 pero degradado en la primera. Por el contrario, HB27 codifica una única, de tres dominio proteína de fusión (DnaQ endonucleasa, DinG helicasa y RecQ helicasa), mientras que HB8 carece de la DinG y RecQ orthologs (Figura 7B]. Además, hay diferencias inesperadas en la organización de predecir thermophile específicos de los sistemas de reparación entre las dos cepas de TT. En concreto, contiene una HB27 "gram-positivos versión" (TTP0132-TTP0136), mientras que HB8 tiene un "proteobacterial versión" de estos genes (TTHB186-TTHB194) (Figura 7A].
Además, casi por completo el proyecto de secuencia del genoma de Deinococcus geothermalis (DG) recientemente ha pasado a disposición del público [91]. Desde la DG está estrechamente relacionado con RD, pero es moderadamente termófilas, que busca "termófilo" en la DG de los genes del genoma. Uso de la "termófilo" secuencias de la proteína ([17] y ver más arriba) de TT y RD como consultas, identificamos orthologs de 5 de las 6 DR proteínas de este juego (cuatro de ellos también están presentes en las dos cepas TT) y orthologs , De 7 de las 23 restantes "termófilo" proteínas del TT (todos los componentes de la predicho termófilo sistema de reparación del ADN). Estas proteínas tienen el 7 respectivos TT proteínas como los mejores hits, y su monofilia fue apoyada por el análisis filogenético (datos no presentados), lo que sugiere que estos genes estaban ya presentes en el genoma de la DR-TT ancestro común.
Estas observaciones dan lugar a dos hipótesis: (i) el TT megaplasmid es esencial para la supervivencia del organismo a altas temperaturas. En consonancia con esta idea, hemos detectado una ampliación de una de dos componentes toxina-antitoxina sistema, que consta de un PIN-como nucleasa (toxina) y un regulador transcripcional MazE familia (antitoxina) [69]. Este sistema es conocido como responsable de la segregational estabilidad de los plásmidos de resistencia a antibióticos y otros plásmidos a través de la eliminación selectiva de las células que no han logrado adquirir una copia plásmido [92], y / o exclusión de los plásmidos en competencia [93], y (ii ) TT megaplasmid la dinámica del genoma es un compartimiento y un verdadero sumidero de los genes transferidos horizontalmente, algunos de los cuales podrían afectar el fenotipo termófilas de esta bacteria. Esto es compatible con las considerables diferencias en el contenido de genes entre los dos cepas TT.
Funciones específicas del cargo-plásmido los genes de ADN en la recuperación de los daños que se han propuesto anteriormente, como la clase Ib ribonucleótido reductasa, periplasmic fosfatasa alcalina, y extracelular nucleasa, y análisis posteriores revelaron al menos cinco otros genes implicados en este proceso (dos operones, DRB0098 - DRB0100, DRB0094-DRB0084, véase más arriba en "Comparación de la reparación del ADN y sistemas de respuesta de estrés") [27, 76]. También hay un sistema toxina-antitoxina operón en el DR177 megaplasmid (DRB0012a y otro gen ubicado inmediatamente aguas arriba de DRB0012a y en la actualidad ausente de la anotación del genoma). Además, hay otros cinco toxina-antitoxina sistemas codificados en DR412, el más pequeño de los cromosomas DR, que podría estar relacionado con el mantenimiento de DR177 megaplasmid en RD. El DR412 cromosoma parece tener algunas características especiales también. Numerosos genes que, al parecer, han sido adquiridos por vía DR HGT después de la divergencia del ancestro común con TT y están implicados en diversos procesos de aminoácidos y nucleótidos degradación, el mapa del genoma de esta partición. Así, el megaplasmids de TT y DR (y el más pequeño de los cromosomas DR, DR412) parecen haber participado en una amplia HGT, que podría haber sido importante para la evolución de thermophily y radioresistance, aunque el repertorio de los respectivos adquirido genes son completamente diferentes .
DR TT y compartir una gran núcleo de los genes y forman un clado en el gen de contenido árbol, que apoya la idea de que estas bacterias forman un clado, como se indicó anteriormente por el análisis filogenético del rRNA y diversas proteínas, y que la evolución de sus Se complementa de genes, aproximadamente, como el reloj-. Sin embargo, las principales diferencias entre el gen repertorios de TT y RD se observaron, lo que indica que ambos genomas perdido numerosos genes ancestrales y adquirió varias series de nuevos genes principalmente a través de HGT. Además, numerosos linajes específicos de las expansiones de las familias paralogous genes fueron identificados, en particular, en DR.
Algunas de las diferencias en el gen de repertorios y TT DR puede vincularse a los distintivos estrategias de adaptación de estas bacterias. Por ejemplo, el TT parece haber adquirido muchos genes de (hiper) termófilas bacterias y arqueas, mientras que DR aparentemente adquirido diversos genes implicados en el estrés oxidativo y la respuesta de otros "limpieza en casa" funciones de diversas fuentes de bacterias.
El gen contenido de la TT megaplasmid (pTT27) y el DR megaplasmid (DR177) son suficientemente similares para concluir que han evolucionado desde un antepasado común. A nuestro entender, esta es la primera prueba de la persistencia de una megaplasmid más allá del nivel de género. Sin embargo, el TT megaplasmid también lleva muchos genes cuyas funciones están implicados en el fenotipo thermophylic; en particular, los componentes de la predicho thermophile específicas de reparación del sistema. Estos megaplasmids es probable que sean esenciales para la supervivencia de ambos TT y DR, con su mantenimiento controladas por la toxina-antitoxina sistemas. Por otra parte, las importantes diferencias entre los genes de los repertorios de megaplasmids TT cepas HB27 y HB8 indican que el genoma de esta partición ha sido muy dinámico, con altas tasas de pérdida de genes y HGT que ocurren durante la evolución.
La evolución de reconstrucción basado en el principio de parsimonia en general es compatible con la idea de que el ancestro común de TT y RD era un mesófilas bacteria, mientras que el fenotipo de thermophylic TT HGT evolucionado gradualmente a través de genes de thermophiles. Por el contrario, la radiación-fenotipo de resistencia a la desecación DR podría haber evolucionado poco a poco a través de HGT de genes de otras mesófilos, en particular, con muy desarrollados sistemas de respuesta al estrés oxidativo. Sin embargo, cabe señalar que la TT-DR común básico incluye docenas de genes de los genes de origen archaeal aparente o, al menos, los genes con termófilo afiliación. Por otra parte, la Dirección General de genoma codifica algunas "termófilo determinantes" que están desaparecidos en RD, pero es poco probable que han sido transferidos de una fuente independiente de termófilo TT, como lo demuestra-genómica comparativa y análisis filogenéticos se describe aquí. Así, la adquisición de un número considerable de archaeal genes podría haber ocurrido a lo largo de la rama evolutiva que conduzca a la ancestro común de TT y DR. En consecuencia, en esta etapa, no podemos descartar la posibilidad de que este ancestro era un thermophile moderada en lugar de una mesophile. Además de la secuenciación de los genomas de bacterias Thermus-Deinococcus clado debe permitir más definitiva-genómica comparativa análisis para dilucidar la naturaleza del ancestro común de estas bacterias.
Irradiations. Tres TT-colonia cepas fueron inoculadas por separado en líquido TGY (10 g / L Bactotryptone, 1 g / L de glucosa, 5 g / L de extracto de levadura) y se incuba a 70 ° C. Las células fueron cosechadas en OD 600 ~ 0,9, que corresponde a 10 7 - 10 8 unidades formadoras de colonias (UFC) / ml 1; TT células / UFC. TT células cultivadas en TGY fueron examinados por el total de su contenido Mn y Fe por ICP-MS (véase el texto principal). Para los ensayos de resistencia a la radiación, las células fueron irradiados sin cambio de caldo sobre hielo con 60 Co en 6,8 kGy / hora (60 Co Gammacell irradiación unidad [JL Shepard y Asociados, Modelo 109]). En la dosis indicada, las culturas (3 biológica repeticiones) fueron adecuadamente diluido y chapada en medio sólido (8 g / L Bactotryptone, 4 g / L de extracto de levadura, 3 g / L de NaCl, pH 7,3, 2,8% Bactoagar), y cuenta UFC Se determinaron después de 2 días de incubación a 65 ° C.
Desecación. Cinco colonia aparte de la validez de los aislados fueron cultivados en TGY como para los ensayos de irradiación. Muestras de células de 10 6 -10 7 células (25 μ l) se transfirieron a placas microtiter, que se transfirieron a la desecación cámaras que contienen sulfato de calcio anhidro (drierite) e incubados a temperatura ambiente o 65 ° C. A veces se indica, las células fueron re-suspendido en TGY, y UFC-supervivencia frecuencias se determinó por el método de dilución de galvanoplastia en medio sólido (65 ° C).
Los conjuntos de proteínas del TT predijo DR y se hicieron búsquedas en unos contra otros para simétrica y no simétrica usando hits PSI-BLAST con la expectativa (E), el valor umbral de 10 -5. Taxonómica afiliación fue determinado por mejores canciones en la base de datos no redundante de las secuencias de proteínas en el Centro Nacional de Información Biotecnológica (NIH, Bethesda) mediante BLASTP programa [94] con la expectativa de valor por defecto (0,01). Cesiones a los COGs se realizaron mediante el programa COGNITOR [95] y el CDD-COG contra de búsqueda basados en los perfiles [96]. Contradictorias cesiones se resolvieron manualmente. Lineage específicos de las expansiones (LSE) se identificaron como se describe anteriormente [66, 97]. El núcleo común de genómica se determinará de la siguiente manera: entre los genes que no han sido asignadas a ningún COG, orthology relaciones entre TT y RD se determinaron a través de las mejores hits simétrica. Los genes pertenecientes a COGs, compartida entre el TT y RD y tiene un solo ortholog de cada uno de los dos genomas son directamente asignados a la central. Por múltiples paralog COGs, simétrica mejores éxitos entre los miembros GOG se utilizaron para refinar las relaciones entre TT y proteínas DR. Los miembros del linaje específicos correspondientes ampliaciones se han añadido a SymBeT pares para formar muchos-a-muchos conjuntos básicos. LBCA gen conjunto se determinó mediante un procedimiento empírico basado en parsimonia COG phyletic patrones (Ver archivo adicional 1: "Reconstrucción del gen conjunto de la Última bacteriana antepasado común"), que asigna un COG a LBCA si se presente en varios diversos bacteriana Clados. COGs Todos los que estaban presentes en LBCA y en el TT y / o DR fueron asignados a la DR-TT antepasado.
Múltiples alineaciones para el análisis filogenético se construyeron utilizando el programa MÚSCULO [98]; columnas que contienen lagunas en> 30% de las secuencias se descartaron. Máxima verosimilitud árboles fueron construidos utilizando el programa de ProtML el MOLPHY paquete a la optimización de los menos árboles cuadrados con reordenamientos locales [99]. Los árboles basados en el contenido de aminoácidos se construyeron a partir de la matriz de distancias entre la frecuencia de Euclides vectores usando el programa VECINO del paquete PHYLIP [100]. El apoyo a los arreglos particulares de las especies (las relaciones entre RD, TT, thermophiles y mesófilos) se calculó utilizando la bipartición análisis de las muestras de arranque original de las secuencias (véase el archivo adicional 1, "Influencia de la composición de aminoácidos en la reconstrucción filogenética"). El gen-árbol de contenido basado en patrones COG fue construido utilizando el programa VECINO del paquete PHYLIP [100]; el número de COGs compartida entre dos genomas se normalizó por el menor tamaño del genoma [33].
LMR realiza la mayoría de las comparaciones de los genomas, el análisis filogenético y ayudó a redactar el manuscrito. YIW KSM y realizó algunas comparaciones genómica y el análisis estadístico de los datos. EKG, VYM, AV MZ y los experimentos realizados en la comparación de la Thermus y Deinococcus respuesta a la irradiación y la desecación y el análisis de Mn / Fe ratio de Thermus. MJD, EVK, KSM y participó en el diseño de los experimentos y la coordinación de proyectos, y ha contribuido a la redacción del manuscrito. Todos los autores leído y aprobado el manuscrito final.
Esta investigación fue parcialmente apoyado por la Oficina de Ciencia (Investigación Biológica y Ambiental), EE.UU. Departamento de Energía (DOE) de subvención número DE-FG02-04ER63918 otorgado a MJD. Agradecemos a James K. Fredrickson y Heather M. Kostandarithes en el Pacific Northwest National Laboratory de Fe y Mn ICP-MS análisis de T. Thermophilus.