Biology Direct, 2006; 1: 7-7 (más artículos en esta revista)

Una supuesta interferencia del RNA-basado en el sistema inmunológico prokaryotes: análisis computacional de la maquinaria enzimática predijo, funcional analogías con eucariotas RNAi, hipotética y mecanismos de acción

BioMed Central
Kira S Makarova (makarova@ncbi.nlm.nih.gov) [1], Nick V Grishin (grishin@chop.swmed.edu) [2], Svetlana A Shabalina (shabalin@ncbi.nlm.nih.gov) [1 ], Yuri I Wolf (wolf@ncbi.nlm.nih.gov) [1], Eugene Koonin V (koonin@ncbi.nlm.nih.gov) [1]
[1] National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bethesda, MD 20894, EE.UU.
[2] Departamento de Bioquímica, Universidad de Texas Southwestern Medical Center, 5323 Harry Hines Blvd, Dallas, TX 75390-9050, EE.UU.

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.

Resumen
Fondo

Todos los Arqueales y muchas bacterias contienen los genomas agrupadas regularmente Interspaced corto Palindrome Repite (CRISPR) y variables de las matrices asociadas a CRISPR (CAS) los genes que han sido previamente implicadas en una nueva forma de reparación del ADN sobre la base de un análisis comparativo de su producto proteico secuencias. Sin embargo, la proximidad de CRISPR cas genes y sugiere fuertemente que han funciones relacionadas con lo cual es difícil de conciliar con la hipótesis de reparación.

Resultados

Las secuencias de proteínas de los numerosos casos de genes productos se clasifican en 25 ~ distintas familias de proteínas; varios nuevos funcionales y estructurales se describen las predicciones. - Genómica comparativa análisis de casos y CRISPR genes conduce a la hipótesis de que la CRISPR Cas-sistema (CASS) es un mecanismo de defensa contra la invasión de fagos y plásmidos que las funciones de forma análoga a la interferencia por ARN eucariota (RNAi). Funcionales específicas analogías son entre varios componentes de la CASS y de las proteínas participan en eucariotas RNAi, incluidos los de doble hundidos RNA helicasa específicos de nucleasa (dicer), la endonucleasa cleaving objetivo mRNAs (Slicer), y el RNA-dependiente del RNA polimerasa. Sin embargo, ninguno de los componentes CASS es orthologous a su aparente eucariotas homólogo funcional. Se propone que el único inserciones de CRISPR, algunos de los cuales son homólogas a fragmentos de bacteriófago y el plásmido los genes, como función procariótico siRNAs (psiRNA), de base-apareamiento con el objetivo de mRNAs y la promoción de su degradación o la traducción de apagado. Hipotético regímenes específicos se desarrollan para el funcionamiento del predijo procariótico siRNA sistema y para la formación de nuevas unidades CRISPR con inserciones de codificación única psiRNA que confiere inmunidad a las respectivas recientemente encontradas fagos o plásmidos. El único insertos en CRISPR prácticamente no muestran similitud incluso entre estrechamente relacionados con cepas bacterianas que sugiere su rápida rotación, en la escala evolutiva. Corolarios de este hallazgo es que, aunque estrechamente relacionadas entre prokaryotes, la más común fagos y plásmidos son diferentes y / o que la dominante fagos y plásmidos girar más rápidamente.

Conclusión

Hemos propuesto anteriormente Cas proteínas que comprenden un nuevo sistema de reparación del ADN. La asociación de los genes con cas CRISPR y, sobre todo, la presencia, en CRISPR unidades, de singular inserciones homólogas a fagos y plásmido los genes nos hacen abandonar esta hipótesis. Parece más probable que CASS procariótico es un sistema de defensa contra fagos y plásmidos que funciona a través del mecanismo de RNAi. El funcionamiento de este sistema parece implicar la integración de fragmentos de genes extraños en Arqueales cromosomas bacterianos y hereditarios dando inmunidad a los respectivos agentes. Sin embargo, parece que esta herencia es extremadamente inestable en la escala evolutiva de tal modo que los repertorios de singular psiRNAs se sustituirá por completo, incluso en prokaryotes estrechamente relacionados, presumiblemente, en respuesta a la rápida evolución de los repertorios dominante de fagos y plásmidos.

Este artículo fue revisado por: Eric Bapteste, Patrick Forterre, y Martijn Huynen.

Abierto de revisión inter pares

Revisado por Eric Bapteste, Patrick Forterre, y Martijn Huynen.

La lista completa comentarios, por favor vaya a los revisores' sección de comentarios.

Fondo

El descubrimiento de la versátil y elaborar sistemas de silenciamiento del ARN en eucariotas es uno de los principales avances en la biología de la última década [1 - 6]. Hay dos grandes, distintas formas de reglamentación de los pequeños ARN's que participan en un silenciamiento de los genes eucariotas: los pequeños interferir (SI) y micro RNAs (MI) RNAs. siRNAs son producidos a partir de doble hundidos RNAs de los virus y los elementos de transposición, que son procesados por la nucleasa dicer, uno de los componentes esenciales de la RNA-Induced silencios en los complejos (RISCs) [7 - 9]. Dicer cleaves largo moléculas de dsRNA en breve, 21-22 dúplex de nucleótidos que son posteriormente desenrollada por el rendimiento RISC a madurar siRNAs. El RISC-siRNA complejo entonces se une a la meta del mRNA que es exfoliados de la nucleasa Slicer, otro componente esencial de RISC, para liberar el siRNA en RISC que actúa como un catalizador reciclables [9, 10]. Además de silenciamiento de genes exógenos agentes, una clase distinta de largo, 28 nt siRNAs, los llamados reiterados asociada a siRNAs (rasiRNAs), el silencio de expresión cromosómicas copias de transposones y transposón-como se repite [11 - 13].

A diferencia de los siRNAs, 21-25 nt lo largo de miRNAs están codificados en genomas eucariotas y están perfectamente bien (en plantas) o imperfecta (en animales) a las secuencias complementarias en la 3'-regiones no traducidas de mRNAs específicos endógenos [6, 13]. Base-apareamiento de miRNAs con el objetivo de mRNAs, que está mediada por una forma de RISC, los resultados ya sea en RNA o división en baja regulación de la traducción [8]. La evidencia está acumulando rápidamente que muchos, probablemente, miles de miRNAs en los animales y las plantas son los principales actores en el desarrollo y la regulación remodelación de la cromatina [6].

Prokaryotes han aparente funcionales homólogos a los genes miARN sistema, es decir, la regulación de la expresión génica bacteriana de los pequeños RNAs antisentido. La mejor caracterizada de estas vías emplear el RNA-proteína de unión Hfq para los pequeños ARN presentación y RNasa E para la meta degradación [14 - 17]. Escherichia coli tiene ~ 60 Micro RNA genes, comparables y números de expresadas, pequeños RNAs antisentido se han detectado en las arqueas Archaeoglobus fulgidus [18] y Sulfolobus solfataricus [19], lo que sugiere un papel importante de este mecanismo de regulación en la fisiología procariótico. Además, los pequeños RNAs antisentido se ha demostrado que regular la replicación del plásmido y el asesinato de un plásmido libre de células bacterianas por silenciar genes específicos plásmido [20 - 22]. En cambio, para los homólogos eucariotas siRNA mecanismo hasta el momento no se han descrito en el prokaryotes. En este sentido, aplicarán la genómica comparativa y en profundidad, análisis computacional de proteínas y ARN secuencias y estructuras para predecir un procariótico siRNA-como sistema y el correspondiente aparato enzimático.

En un anterior genómica comparativa-estudio, que ha sido originalmente concebido como un caso de prueba para los métodos de genes conservados barrio análisis que hemos desarrollado, hemos caracterizado un amplio conjunto de genes que incluyó varias proteínas relacionadas con el ADN o ARN y el metabolismo fue, en su mayoría, específicas para thermophiles [23]. Estos genes comprenden una compleja gama de superposición de los barrios que están parcialmente conservadas, pero muy diversificada, tanto en términos de composición de genes de genes y el orden, y están representadas en todos los Arqueales y muchos genomas bacterianos [23, 24]. En el momento de su descubrimiento, la hipótesis de que estos genes codifican una uncharacterized, versátil sistema de reparación, en gran parte, en relación con los termófilo estilo de vida [23].

Independientemente y casi al mismo tiempo, Jansen y compañeros de trabajo encontraron [25] que al menos varios genes de genes de este barrio se asocia estrechamente con la llamada agrupadas regularmente Interspaced corto Palindrome Repite (CRISPR); las siglas CAS (para CRISPR asociados) fue genes por lo tanto, acuñó. El CRISPR son una clase de elementos repetitivos que están presentes en numerosos procariótico genomas. A CRISPR elemento consiste en una repetición directa de ~ 28-40 pares de bases (pb), con los ejemplares separados por una única secuencia de ~ 25-40 pb. Normalmente, CRISPR forma tándem arrays que contienen de 4 a> 100 elementos. La mayoría de los genomas contienen un único conjunto de CRISPR en el que las secuencias de las repeticiones son (casi) idénticas, y algunos, sin embargo, poseen múltiples CRISPR casetes que puedan tener sustancialmente diferentes secuencias [24, 25]. La repite en CRISPR de diferentes genomas muestran sólo limitada similitud, sino que a menudo conservan distintos, conserva aún los motivos compartidos por las especies incluidas lejano arqueas y bacterias [18, 26]. Parece haber un vínculo estricto entre CRISPR cas y los genes, sugerente de un (casi) mutualistas relación: la gran mayoría de los genomas que contienen CRISPR también tienen al menos un conjunto mínimo de genes cas, y viceversa.

Recientemente, Mojica y compañeros de trabajo informó de que la única insertos en algunos de los CRISPR son homólogas a fragmentos de bacteriófago y el plásmido los genes [27]. Esto condujo a la hipótesis de que la CRISPR podría tener una función en la defensa de prokaryotes contra invasores extranjeros replicons y que no puede ser funcional analogías entre este supuesto sistema de defensa y eucariotas interferencia por ARN. Similares resultados se han informado de forma independiente por dos otros grupos [28, 29].

El reciente rápido crecimiento del número y la diversidad de los genomas secuenciados procariótico ha dado lugar a un drástico aumento en la complejidad de los genes identificados cas arrays [24]. Aquí se describen los resultados de un exhaustivo análisis de secuencias de la proteína Cas secuencias que arrojó una clasificación de estas proteínas, varias predicciones nueva estructura funcional, y una reconstrucción de la relación evolutiva entre estos genes. Proponemos que el cas genes codifican proteínas de la maquinaria de un procariótico siRNA-como sistema que lleva a cabo, principalmente, pero tal vez, no exclusivamente, las funciones de defensa y es por lo general similares, en algunos aspectos, a eucarióticas siRNA, y en otros aspectos, a la vertebrados sistema inmunológico. La maquinaria enzimática previsto de este sistema parece ser funcionalmente análogos, pero no homóloga, a los aparatos de proteínas que participan en los eucariotas RNA mediada por silenciamiento génico. Por último, esbozar las posibles mecanismos moleculares de las previsiones sistema procariótico siRNA. La hipótesis sobre la participación de Cas proteínas RNAi en un mecanismo de tipo suplanta la anterior propuesta de que estas proteínas podrían incluir un nuevo sistema de reparación del ADN [23], que es difícilmente compatible con la estricta asociación de estas proteínas con CRISPR y la existencia de un único CRISPR inserciones homólogas a fagos y las secuencias de plásmido.

Resultados y discusión
Identificación, clasificación y análisis evolutivo de los genes cas

En el estudio original de la cas de genes barrios, que se realizó con ~ 40 genomas, hemos identificado la proteína ~ 20 familias que fueron herméticamente o más vagamente relacionados con el sistema que hoy llamamos CASS. Una reciente actualización de Haft y compañeros de trabajo con> 200 genomas dado una diversa "gremio" de Cas ~ 45 familias de proteínas [24]. Muchas de las proteínas Cas muestran muy baja secuencia de conservación hace que la identificación de homólogos relación entre ellos no tarea trivial. Hemos empleado un enfoque iterativo para el análisis exhaustivo de las secuencias de proteínas Cas. Las secuencias de proteínas de Cas cada familia se compararon con las secuencias de proteínas de todos los genomas procariótico utilizando PSI-BLAST [30, 31], las proteínas codificadas en los barrios de todos los candidatos identificados fueron utilizados como consultas de búsquedas más, y el proceso fue itera hasta la convergencia. Las secuencias de proteínas Cas fueron, además, en comparación con atención el uno al otro, en un intento de identificar las posibles huellas de origen común de algunos de estos genes que hasta ahora han eludido la detección [para obtener una lista completa de Identificación Genética (GI) de números el Cas proteínas detectadas, consulte el archivo adicional 1].

Hipótesis: CASS procariótico es un sistema de defensa que funciona en el RNAi principio

Basado en las propiedades de Cas CRISPR y proteínas, que especulan que este es un sistema funcional de la analógica eucariotas siRNA sistemas y proponer posibles mecanismos de la putativo procariótico pequeños ARN de interferencia. La observación crucial informó de forma independiente por Mojica et al [27], Pourcel et al [29], y Bolotin et al [28] es que una cierta fracción (~ 10% de acuerdo a [27]], de la única insertos en las unidades son CRISPR homóloga de fragmentos de virus (bacteriófago) o plásmido genomas. Sólo una minúscula fracción de los existentes fagos y las secuencias de plásmido se encuentra actualmente disponible, mientras que el total de la diversidad de elementos móviles procariótico es humungous y al parecer es superior a la diversidad de prokaryotes al menos por un orden de magnitud [41, 42]. Por lo tanto, no es muy descabellado proponer que la mayoría, si no todos, CRISPR inserciones se derivan de móviles replicons [29].

En caso de que sea el caso, parece más o menos obvio que CASS procariótico es un sistema de defensa contra los extranjeros que replicons funciones en el principio de ARN antisentido. Más específicamente, parece probable que las inserciones se transcribe el silencio y afines fago o plásmido los genes a través de la formación de un duplex entre los pequeños interferir procariótico (psiRNA) y el ARNm de división seguido de la traducción duplex o la represión. De hecho, Mojica et al [27] menciona la analogía entre la CRISPR eucariotas y los sistemas de interferencia por ARN, pero no proponer mecanismos concretos para la acción de los sistemas de defensa putativo y, sobre todo, no explorar la relación entre la psiRNA putativo y las previsiones de actividades Cas proteínas. Importante pruebas en su apoyo ha sido independiente obtenidos mediante el análisis de los pequeños no expresión de ARN mensajero en la euryarchaeon Archaeoglobus fulgidus que puso de manifiesto que se transcribe CRISPR (de un líder-secuencia promotora), al parecer, en forma de un precursor multiunit que posteriormente se exfoliados en CRISPR monómeros y oligómeros [18]; muy similar observaciones han sido posteriormente informó de la crenarchaeon Sulfolobus solfataricus [19]. Por otra parte, como se muestra por Pourcel y compañeros de trabajo [29], uno de los únicos CRISPR insertos en el migas cepa de la bacteria Streptococcus pyogenes es homóloga a una prophage presentes en otras cepas de la misma bacteria que, por el contrario, no llevar el CRISPR. Esto es compatible con la posibilidad de que la inserción hace que la bacteria inmune a la habida cuenta de fagos.

En este sentido, perseguir estas líneas en un intento de presentar un coherente, aunque especulativa, la descripción de la supuesta sistema procariótico siRNA. Circunstanciales, sino crucial en la prueba de la hipótesis psiRNA proviene de analogías entre las previsiones CASS funciones de las proteínas y los componentes de las proteínas eucariotas los sistemas de interferencia por ARN, en particular, los RISCs [7 - 9] (Tabla 2]. Las principales partes de RISCs son una helicasa fusionado con dos dominios RNasa III, dicer, y la exonuclease de la familia Argonaute, Slicer [9, 10, 43]. Ambos dicer SLICER y están representados por la variable número de paralogs en eucariotas, y diferentes paralogs se incluyen en RISCs con funciones distintas [9, 10]. Varios RISCs también contienen más de ARN y proteínas de unión nucleasas [9, 44]. Putativo funcional de todos los análogos de estas proteínas puede ser obtenida entre la CASS proteínas. El dicer analógico es inmediatamente aparente: la helicasa COG1203 que sea fundido o codificado junto a unas previsiones de nucleasa de la familia HD (Fig. 2a); designar provisionalmente que esta proteína p-dicer (procariótico dicer). Identificación de la contraparte SLICER (p-Slicer) es menos evidente debido a la diversidad de nucleasas previsto dentro de la CASS. Un candidato es el previsto RecB-familia nucleasa (COG1468). Alternativamente o adicionalmente, la SLICER función podría ser realizada por una novela, aún no identificado nucleasa, como COG1857. De hecho, la posibilidad no puede descartarse que los diferentes o incluso la misma versión de emplear múltiples CASS p-cortadoras, en un paralelismo con las múltiples, paralogous eucariotas cortadoras de la familia Argonaute. Además, proponen que las proteínas RAMP, con mucho, los más diversos componentes de la CASS, desempeñan un papel importante en el mecanismo procariótico siRNA como ARN-proteínas de unión que muestran un grado de especificidad para el psiRNAs, muy probablemente, por psiRNAs específicamente vinculante de las diferentes tamaños. Las rampas, diversos representantes de la misma superfamilia de proteínas, pueden ser funcionales análogos de los más diversos estructuralmente ARN-proteínas de unión de eucariotas RISCs (Cuadro 2]. La presencia de dos veces ferredoxin dominios en rampas (Fig. 3B] es compatible con la presente propuesta teniendo en cuenta que este pliegue que se traduce en una amplia variedad de ARN-proteínas de unión, como el S6 ribosomal y proteínas S10, spliceosomal varias subunidades, y otros. A pesar de que la similitud estructural entre los dos dominios de rampa y ferredoxin-al igual que los dominios no son especialmente fuertes, podría ser significativo el hecho de que la parte superior estructurales vecinos para cada una de la vía de acceso a dominios son diferentes ARN vinculante dominios (véase más arriba).

Figura 5a presenta nuestra hipótesis actual sobre el mecanismo básico del funcionamiento del sistema procariótico RNAi. Tenemos que especular CRISPR regiones están transcritas de un promotor ubicado en el AT-ricos CRISPR líder. Transcripción podría ser regulado con la participación de uno de los Cas proteínas y, concebiblemente, sería estimulado por el estrés, tales como la infección por fagos, aunque los resultados de análisis de expresión en A. fulgidus sugieren un cierto nivel de transcripción constitutivos [18]. La labor de Tang y compañeros de trabajo se indica además que la principal transcripción es probable que abarcan la totalidad de CRISPR repetir región. Esta transcripción se exfoliados en 70-100 nt pre-psiRNA, concebible, por la supuesta p-dicer, COG1203 la proteína (Fig. 5]. Además, postulan que p-dicer cataliza la segunda, tal vez, más lento (a juzgar por los resultados de Tang et al) paso del proceso que libera madura psiRNA especies (Fig. 5a]. El psiRNA moléculas se unen las rampas en un tamaño de manera específica y Anneal a la meta del mRNA. El complejo resultante contratar p-Slicer, formando la mínima expresión de la procariótico analógica de RISC (pRISC) cleave que el ARNm y podría ser reciclado para atacar el próximo objetivo molécula, por lo tanto, silenciar a los respectivos genes (Fig. 5a].

Figura 5b muestra una versión de este itinerario que implica la actividad de la polimerasa CASS, por analogía con los eucariotas RDRP, que participa en algunas vías de RNAi en la mayoría de eucariotas, pero parece que se ha perdido en los artrópodos y chordates [45 - 47]. Los primeros pasos en este sistema son los mismos que en la base de un (Fig. 5a] - transcripción de la CRISPR, el procesamiento de los precursores psiRNA, y recocido de psiRNA a la meta ARNm mediada por la pRISC - pero, en el próximo paso , PsiRNA se postula para servir como el primer alargamiento de la CASS de la polimerasa, produciendo un largo doble hundidos forma de la meta (Fig. 5b]. Este formulario se exfoliados de p-dicer forma análoga a la división de virus y transposón dsRNAs de los eucariotas dicers. El p-dicer podrían funcionar como un complejo con los respectivos RAMP para formar una versión distinta de pRISC. Este podría ser el punto final de la vía, o de lo contrario, el dsRNA productos de degradación pueden ser utilizados como nuevo psiRNAs, lo que resulta en la amplificación del efecto silenciar (Fig. 5b]. La CASS polimerasa es más común en thermophiles, y es tentador especular que la prevalencia de esta forma de psiRNA la vía tiene que ver con la inestabilidad de la meta psiRNA-duplex en virtud de la alta temperatura ambiente de estos organismos.

El más complejo e incierto aspecto de la putativo procariótico RNAi sistema debatido aquí es la formación de nuevas unidades que contienen CRISPR único psiRNA genes específicos para los nuevos objetivos encontrados por el organismo (Fig. 5c]. El camino hacia la creación de nuevas psiRNAs se iniciarán al igual que la respuesta vía, es decir, con la transcripción del locus CRISPR y el primer paso del proceso dando los 70-100 nt psiRNA precursores (compare Fig. 5c con la Fig. 5 bis]. En el siguiente paso, sin embargo, debe haber un mecanismo para reemplazar el único insertar dentro de la pre-psiRNA con un nuevo fragmento de extranjeros (por ejemplo, fagos) RNA. La naturaleza de este mecanismo sigue siendo incierto. En principio, dos posibilidades pueden contemplarse: i) la transcripción reversa con copia elección según el cual un transcriptasa inversa, muy probablemente, la CASS predijo la polimerasa (COG1353) cambia el uso de la pre-psiRNA como una plantilla para usar un fago mRNA y, a continuación, volver , Y ii) la participación directa, no-ARN recombinación homóloga entre un pre-psiRNA y un mRNA extranjeros, seguida por la transcripción reversa del RNA recombinante resultante (Fig. 5c]. Ambos mecanismos no son triviales en su coreografía molecular y es poco probable que se produzca con alta eficiencia. Sin embargo, hay precedentes de tanto en la biología molecular de los retrovirus y otros virus RNA. En particular, los interruptores de la transcriptasa inversa en las plantillas de cada ciclo de retrovirus primer capítulo de síntesis de cDNA a pesar de que, en este caso, copia de elección se ve facilitada por la yuxtaposición espacial de las dos plantillas dentro de la partícula del virus; un mecanismo similar es el responsable de la recombinación de los retrovirus [48]. Además, y probablemente, más pertinente para la psiRNA caso, la transcripción reversa con copia de elección se cree que está involucrado en la incorporación de copias de genes celulares, como los oncogenes, en genomas retrovirales [49, 50]. La alternativa, es decir, directa recombinación entre moléculas de ARN podría parecer muy descabellada, pero ese proceso se ha demostrado, por varios grupos independientes, que se produzca en los virus de ARN, al parecer, a través de una proteína-mecanismo independiente [51, 52]. Durante la formación de nuevas especies psiRNA, estas de baja frecuencia los procesos podría ser facilitado por la alta abundancia de los fagos mRNAs implicados. De hecho, se ha demostrado que la única CRISPR insertos en la mayoría de los casos corresponden a fragmentos de esencial, muy conservadas fago genes que normalmente están expresadas en un alto nivel de bacterias infectadas [27]. Una vez que la molécula de dsDNA que consiste en una unidad CRISPR con el nuevo, único insertar se produce, por uno de los mecanismos descritos aquí o, quizás, a través de otra vía, deberá insertar en el array CRISPR a través de recombinación homóloga (Fig. 5c]. Sospechamos que este proceso está mediado por la proteína COG1518, el marcador universal de la CASS que contengan motivos conservados parecidas a las de diferentes nucleasas [23]. Parece probable que esta proteína funciona como la integrasa CRISPR / recombinado, tal vez, en cooperación con la COG1343 proteínas, otro componente universal de la CASS.

Líneas adicionales de las pruebas pertinentes para predecir la función de RNAi CASS
Putativo psiRNAs: las relaciones con los fagos y plásmido los genes y estructura secundaria

Hemos tratado de reevaluar la relación entre la única CRISPR inserciones y bacteriófago y el plásmido los genes con los actualmente disponibles, una mayor recaudación de procariótico y genomas de fagos. Usando un poco más estrictas que los criterios adoptados por Mojica et al. [27], encontramos que sólo una pequeña fracción de la única CRISPR inserciones mostraron un importante similitud con cualquier secuencias en las actuales bases de datos. En total, hemos identificado 83 inserciones con aparente homólogos, o ~ 2% de todos los disponibles CRISPR secuencias. Es importante destacar que la gran mayoría de estas inserciones en efecto, se homólogas a fragmentos de fago o plásmido los genes en lugar de secuencias de bacterias o Arqueales cromosomas (Cuadro 5]. En vez inesperadamente, resultó que las inserciones CRISPR homólogas a fagos plásmido los genes y llegó a tanto el sentido y la orientación antisentido (Cuadro 5]. Aunque la determinación de la dirección de transcripción de cintas de CRISPR es ambigua debido a que la secuencia de pensamiento líder para incluir la CRISPR promotor es difícil de identificar, es cierto que algunos de los CRISPR casetes contienen las inserciones de ambas orientaciones (Tabla 5]. Este hallazgo presenta una complicación para los esquemas de funcionamiento CRISPR presentados en la Fig. 5 sentido porque fragmentos de genes, evidentemente, no puede silenciar los respectivos objetivos directamente. Al parecer hay tres posibles soluciones a este problema, todos basados en el supuesto de que el proceso de recombinación en el sistema se muestra en la Fig. 5c es aleatoria con respecto a la dirección. La primera posibilidad es que el sentido se inserta no funcionales de los productos de recombinación indiscriminada. Por otra parte, es concebible que tanto sentido y antisentido inserciones se convierten en duplex, probablemente, la CASS de la polimerasa, después de que el sentido capítulo se destruye mientras que el antisentido capítulo pasa a formar parte de la pRISC. Un mecanismo muy similar la participación de la ARN-polimerasa RNA dependiente ha sido descrito por una de las vías de siRNA endógeno en las plantas [53]. La tercera, más exótico posibilidad es que realmente psiRNA función de silenciamiento no mRNAs, sino mediante la promoción de la degradación del ADN diana, en cuyo caso tanto sentido y antisentido psiRNAs podría ser activa. Esta opción es más discutido en la sección Conclusiones.

Es importante destacar que la CRISPR insertar secuencias de incluso estrechamente relacionados cepas bacterianas no están relacionados entre sí, con muy pocas excepciones entre las cepas enterobacterial (datos no presentados). Esto sugiere que las inserciones se sustituyen rápidamente en la escala evolutiva, tal vez, a través del mecanismo descrito en la Fig. 5c. Una implicación más amplia que es la dominante fagos y plásmidos incluso encontradas por bacterias estrechamente relacionadas son diferentes que conduzcan a la rápida generación de distintos repertorios de psiRNAs.

En lo que respecta a su función en última instancia, el putativo psiRNAs parecen ser conceptualmente más parecida a eucarióticas siRNAs en el sentido de que son homólogas a extranjeros, en lugar de endógenos, los genes y se pronostica que funcionan como parte de un sistema de defensa. Sin embargo, la psiRNAs también comparten una característica importante con el miRNAs en el sentido de que están incrustadas en y, probablemente, exfoliados de una molécula precursora, en lugar de desde una perspectiva a largo dsRNA como la siRNAs (Fig. 5]. En un intento por esclarecer los rasgos comunes de la psiRNA precursores, que predijo la estructura secundaria de todas las unidades disponibles CRISPR. Los resultados fueron un tanto ambigua, como se muestra en la Fig. 7. El plegado libre de energías GC-ricos CRISPR unidades eran sustancialmente inferiores a las de la baraja CRISPR unidades; en particular, las energías CRISPR plegable se distribuyeron de manera similar a las de los genes miARN precursores (Fig. 7], con numerosas unidades CRISPR capaz de plegar en muy estable estructuras secundarias. Estas observaciones sugieren la posibilidad de que los precursores psiRNA poseen una estructura secundaria que podría ser importante para el reconocimiento de p-dicer, rampas u otras proteínas. Sin embargo, el plegamiento de distribución de energía para AT-ricos CRISPR muestra sólo un ligero cambio en comparación con la distribución de secuencias y se baraja es completamente diferente de la distribución de los genes miARN precursores de la misma base de la composición (Fig. 7b]. De este modo, AT-ricos psiRNA precursores, que comprenden aproximadamente la mitad de la CRISPR, por término medio, no parecen ser capaces de plegar en las estructuras estables secundaria. De este modo, la existencia de un consenso funcionalmente relevante estructura de psiRNA precursores sigue siendo incierto.

La figura 8 muestra dos estructuras secundarias predijo putativo de psiRNA precursores en la que están insertos homólogas a fago o plásmido los genes. La GC-relativamente rica secuencia de Xanthomonas axonopodis forma una estructura secundaria estable, mientras que los AT-rica secuencia de Streptococcus thermophilus pueden veces sólo en un tallo débil estructura de bucle. Curiosamente, en ambos casos, la única insertar contribuye de manera significativa a la formación de tallo. Es evidente que un análisis más detallado de las estructuras del putativo psiRNA precursores de cómputo y medios de experimentación es necesaria para la identificación de sus características funcionales importantes.

Conclusión

Obviamente, todo el concepto de la defensa procariótico CASS funcionamiento del sistema en el RNAi principio la actualidad sigue siendo una hipótesis. Sin embargo, creemos que tres líneas de evidencia que tal mecanismo, en sus grandes líneas, casi una consecuencia lógica inevitable: i) el indiscutible origen de al menos algunos de los singulares CRISPR inserciones de fagos y plásmido los genes, ii) la demostración de la transcripción y el tratamiento de los loci en CRISPR A. fulgidus y S. solfataricus, y iii) la abundancia de CASS componentes que están claramente implicados en la degradación de ácidos nucleicos, el tratamiento y, posiblemente, la recombinación. La única variación sustancial en el tema de RNAi podría ser un mecanismo antisentido que actúan sobre el ADN. Ese mecanismo es, evidentemente, es mucho menos común que el post-transcripcional silenciamiento génico por los pequeños ARN's, pero no es sin precedente. De hecho hay fuertes indicios de que la eliminación de intergénicas secuencias de ADN en el macronucleus de la ciliate Tetrahymena se produce a través de un siRNA mediada por mecanismo, con la participación de un determinado dicer SLICER-pair [54, 55]. En principio, este mecanismo es compatible con el hallazgo de ambos sentido y antisentido CRISPR entre secuencias homólogas a las inserciones de fagos y plásmido los genes (Cuadro 5]. No obstante, dada la prevalencia mucho mayor de silenciar las vías y, en particular, los casos de demostrado RNA antisentido regulación en bacterias, parece más probable que CASS actos de silenciamiento de genes invadir replicons. Dicho esto, cabe destacar que los mecanismos representado en la Figura 5 son sólo aproximadas líneas generales de algunas de las formas en que este sistema podría funcionar. No cabe duda de que los estudios experimentales se ponen de manifiesto diferentes mecanismos de estos, al menos, en detalle. Sin embargo, independientemente de los mecanismos específicos e incluso si los sistemas de psiRNA previsto en los actos o ARN en ADN, se desprende la certeza de que su principal función es RNAi mediada por la defensa contra el invasor extranjero replicons arqueas y bacterias.

El sistema prevé psiRNA se asemeja a los eucariotas homólogos, no sólo en su principio funcional, sino también en las características generales de las proteínas implicadas. Lo más sorprendente es comparable la complejidad, diversidad y la plasticidad de la proteína los mecanismos implicados. Ambos sistemas consisten de uno o más helicases, un amplio espectro de nucleasas, una polimerasa, y una variedad de ARN-proteínas de unión. Tanto en CASS y en RISCs, sólo dos o tres subunidades de proteínas parecen ser verdaderamente indispensable, y el resto van y vienen, lo que resulta en una variedad de RISCs con sus distintas funciones, muchos de ellos aún poco conocidos [7 - 9], y, presumiblemente, en una diversidad comparable de CASS. Sorprendentemente, sin embargo, ni una sola proteína perteneciente a la bona fide CASS tiene un ortholog en eucariotas, que participan en RNAi o de otro tipo. El único vínculo directo podría ser el Argonaut proteína que es la fracción activa central de eucariotas RISCs (Slicer) y podría haber algunos funcional respecto a CASS en arqueas, provisionalmente, como sugerido por el M. kandleri CASS operón estructura; es cierto, sin embargo, las indicaciones de la posible participación de Argonaut a la CASS funcionamiento actualmente son muy débiles.

Los eucariotas RNAi sistemas vienen en dos variedades básicas: i) siRNAs que se producen a partir de dsRNAs de virus y transposones y proteger la acogida de los respectivos agentes a través de perfecta base-apareamiento con el objetivo de mRNAs respectivos, y ii) que regulan los genes miARN traducción de endógeno ya sea a través de genes perfectos (plantas) o imperfecta (animales) base-apareamiento [6]. CASS parece ser el homólogo funcional del mecanismo de siRNA en la medida en que parece estar implicado en la defensa contra agentes de infectar, el psiRNAs parece que se derivarán de los invasores del genoma y se prevé que funcione a través de perfecta base-apareamiento con el objetivo. Desde otro punto de vista, sin embargo, este sistema es similar a los genes miARN en que el activo fracciones pequeñas de ARN se codifican en el genoma procariótico en lugar de producirse a partir de los extranjeros dsRNA. El más cercano eucariotas análogos de la CASS sistema podría ser el rasiRNAs que, al igual que el putativo psiRNAs, se codifican en el genoma, son generados por el procesamiento de doble hundidos formado por moléculas simétricas transcripciones de transposones (o repite cree que el origen del transposón) el silencio y la última, lo que contribuye a la formación de heterocromatina [11 - 13, 56]. En contraste, las bacterias pequeñas de ARN antisentido vías de reglamentación que emplean Hfq y RNasa E que se dirigen a regular, cromosómicas de genes de bacterias, en lugar de las de agentes infecciosos o transposones [14 - 16], parece ser el homólogo funcional de los genes miARN sistemas eucarióticos. Por lo tanto, prokaryotes parecen haber al menos dos sistemas de RNAi ninguno de los cuales es operado por homólogos de los eucarióticos RNAi componentes de la maquinaria de proteínas. Por otra parte, a diferencia del caso de los eucariotas donde siRNA, rasiRNA, y los genes miARN funcionamiento de los sistemas de forma sustancial por la superposición de conjuntos de proteínas [8], los sistemas procariótico parecen ser completamente independientes el uno del otro.

Es evidente que nuestra interpretación de las posibles funciones de CASS se basa, en gran parte, por la analogía con el sistema de siRNA eucariotas. Puede haber peligro en gran medida apoyándose en analogía como un método de predicción, porque si la premisa básica es falsa, todo el sistema de desmoronarse. Sin embargo, en el caso de CASS y eucariotas siRNA, la analogía se debe a dos, a priori, independiente de las líneas de evidencia, a saber, el descubrimiento de CRISPR inserciones homólogas a fagos y plásmido los genes y la similitud funcional entre Cas proteínas y componentes de sistemas eucarióticos RNAi, por ejemplo, dicer. En caso de que no se bona fide funcional analogía entre CASS y RNAi, no habría base para esta congruencia. Por el contrario, la homología de CRISPR la guinda a fagos y plásmido los genes y, más en general, la asociación de genes cas con CRISPR no tienen explicación en el contexto de nuestra anterior hipótesis de que la CASS es un sistema de reparación [23] que nos obliga a abandonar este interpretación de la función CASS.

Todo a pesar de las analogías, las previsiones psiRNA sistema muestra al menos una diferencia fundamental de los eucariotas contrapartida: la codificación de segmentos de la putativo psiRNAs se derivan de los genes de invadir y agentes incorporados al genoma de acogida para conferir inmunidad hereditarios a las respectivas agente. Como un mecanismo de la inmunidad adquirida, CASS se asemeja más el sistema inmune de vertebrados que los eucariotas RNAi vías pero, de nuevo, con la diferencia fundamental de que el animal la inmunidad no es heredable. Por otra parte, la amplia difusión de la CASS que abarca una gran variedad de linajes procariótico contrasta el estrecho presencia clásica de la inmunidad que parece ser un mecanismo específico para jawed vertebrados; el reciente descubrimiento de una radicalmente diferente sistema de inmunidad en los vertebrados jawless [57] hace hincapié en la estado del sistema inmunológico como un linaje evolutivo específicos de la novedad. Más en general, parece que CASS es una de las más antiguas, si no, de hecho, el punto primordial del sistema de defensa biológica que probablemente surgió en una etapa temprana de procariótico evolución, teniendo en cuenta que diversos virus, con toda probabilidad, han acompañado la vida celular de su propia principio. Dada la omnipresencia de CASS en arqueas y sus menos prominente presencia en las bacterias, es un escenario que CASS surgido en un antiguo ancestro de arqueas y difundir horizontalmente a las bacterias.

Es interesante, como un mecanismo de la herencia de rasgos adquiridos, CASS parece venir más cercano a una verdadera Lamarckian modo de evolución entre todos los sistemas conocidos de la herencia. Sorprendentemente, sin embargo, este supuesto sistema de Lamarckian herencia parece ser muy inestable en la escala evolutiva, tal como se indica por la falta de conservación de las secuencias psiRNA incluso entre cepas estrechamente relacionadas. Una implicación general de este aspecto de la CASS evolución es que la diversidad de móviles replicons (fagos, plásmidos, transposones, etc) en la naturaleza podrían ser aún más enorme de lo que se estima actualmente [58, 59] tal que incluso las bacterias estrechamente relacionadas con nichos de ocupación similar son predominantemente invadido por diferentes agentes. Además, o alternativamente, es concebible que, en muchos nichos, la dominante fagos y plásmidos girar más rápidamente con el tiempo, haciendo existentes CRISPR casetes obsoletos como medio de defensa y su disparo de cambio.

Por último, un punto de vista práctico nota. Parece ser que, una vez que el psiRNA mecanismo descrito aquí se investiga experimentalmente, podría ser explotado para silenciar cualquier gen en los organismos que codifican CASS. El diseño simple de este tipo experimental silenciamiento génico en prokaryotes implicará transfección con un plásmido que contiene el psiRNA insertarse entre CRISPR para facilitar la recombinación homóloga.

Métodos
Secuencias del genoma, bases de datos y análisis de secuencias

El total de bacterias y Arqueales secuencias del genoma se recuperaron de Centro Nacional de Información sobre Biotecnología (NCBI, NIH, Bethesda) sitio FTP. La no-redundante de datos de secuencias de proteínas en el Centro Nacional de Información de Biotecnología (NIH, Bethesda) se iterativamente búsquedas utilizando el PSI-BLAST programa [31]. El punto de corte de E <0,01 fue habitualmente empleados para la inclusión de secuencias en la posición de peso específico matrices. Cada secuencia recuperada se utilizó como la consulta de búsquedas adicionales hasta que no haya nuevas secuencias pueden ser detectados. Para la detección de la secuencia sutil de conservación, el PSI-BLAST los resultados de la búsqueda se examinó visualmente y con más secuencias de E-valores, pero que contengan la firma motivos de una determinada familia de proteínas se incluyeron en los perfiles en cada caso [30, 60]. Múltiples alineamientos de secuencias de proteínas se construyeron utilizando el músculo programa [61] y corregido sobre la base de PSI-BLAST resultados. Proteína estructura secundaria se predijo mediante el programa JPRED [62]. Proteína estructura comparaciones se realizaron con la DALI [63] y gran [40] programas, y la cinta diagramas de estructuras de proteínas se generaron realizarán utilizando el programa BOBSCRIPT [64].

Análisis filogenético

Distancia árboles se construyeron a partir de múltiples alineamientos de secuencias de proteínas después de excluir mal alineados posiciones, utilizando el menor cuadrado como método aplicado en el programa de Fitch el paquete PHYLIP [65, 66]. Máxima verosimilitud árboles fueron construidos utilizando el programa de ProtML el MOLPHY paquete, con la JTT-F modelo de sustituciones de aminoácidos, mediante la optimización de los menos árboles cuadrados con reordenamientos locales [67, 68].

Identificación y análisis de CRISPR repite

Buscar repite se realizó de la siguiente manera: en primer lugar, todos se pongan en venta exactamente 20-mer sub-ancla se identificaron en la secuencia de nucleótidos de una enfermedad o Arqueales genoma. Alineaciones en torno a estos anclajes se ampliaron en ambas direcciones, a fin de incluir todas las posiciones adyacentes con el contenido de la información por encima o igual a 1,5 bits [69]. Todos identificados alta similitud fragmentos fueron utilizados como consultas en nucleótidos BLAST [70] búsqueda (tamaño de palabra 7; desajuste pena -1; ambos brecha de apertura y ampliación costes -1; E-valor umbral 0,001) para detectar más divergentes versiones de las repeticiones así como los casos de repetir en la vertiente opuesta. Para determinar la repetición de límites con mayor precisión, las secuencias de todos los loci a corto (20 nt) flancos añadido fueron recogidos y alineados usando el músculo programa [61]. Alineaciones fueron recortados de los 5 'y 3' termini hasta las columnas de información con contenido superior a 1,3 bits. Repetir las familias que comparten el arreglo espacial típica de CRISPR (mediana de duración de repetir 20-50 nt; spacer mediana longitud de 15-60 nt) fueron identificados como CRISPR candidatos y examinó más de cromosómicas cas proximidad a los genes. La costumbre PERL guiones utilizados para este análisis están disponibles bajo petición.

Secuencias de eucariotas miRNAs precursores, CRISPRs, mezcladas al azar y CRISPR secuencias fueron dobladas computacionalmente, y la energía libre de los más estable estructura secundaria se calculó utilizando aa algoritmo de programación dinámica que emplea más cercano vecino parámetros para evaluar la energía gratis [71]. La reducción al mínimo de energía se realizó por el método de programación dinámica que se encuentra la secundaria estructuras con el mínimo de energía libre de resumir las contribuciones de apilamiento, bucle de longitud, y otras características estructurales, mediante la mejora de los parámetros termodinámicos [72].

Similitud entre los espaciadores CRISPR a otras secuencias

Las secuencias de nucleótidos de entre CRISPR espaciadores se utilizaron como una consulta en Megablast [70] búsquedas (tamaño de palabra 11; e-valor umbral de 0,01) contra el GenBank; hits a virus o secuencias de plásmido y alejadas prokaryotes fueron contados por separado para cada organismo fuente .

Los encuestados los comentarios
El informe del Revisor 1

Eric Bapteste, Departamento de Bioquímica y Biología Molecular, Universidad de Dalhousie, Halifax, Nova Scotia, Canadá

Principales comentarios:

La calidad científica de este trabajo y su metodología es cierta. Ha habido un montón de buena e interesante trabajo realizado aquí. Como se ha indicado por su título, por lo tanto, proporciona la información y las múltiples hipótesis acerca de un ARN de interferencia en prokaryotes. Debido a este amplio alcance, el manuscrito es bastante grande. De hecho, varias de sus partes puede ser leído por su cuenta, dependiendo del lector de un interés específico, este es el caso, en particular para la parte que trata con la hipótesis de un RNAi procariótico sistema inmunológico. Quisiera por lo tanto, sugieren que una versión más corta del documento, centrado en torno a esta hipótesis muy interesante podría ser propuesto en línea (con la primera parte de inflexión en Supp. Mat.), Porque creo que esta parte va a recibir más atención de todos modos, y sería lamentable que algunos lectores no consideró este aspecto porque están asustados por el tamaño total del documento. Pero esto es simplemente una sugerencia, y los autores son más que bienvenidos haciendo caso omiso de mi opinión.

Autor respuesta: Si bien entendemos perfectamente el sentimiento y acepta que la hipótesis sobre procariótico RNAi es de mayor interés general que la presentación detallada de la secuencia de la proteína-análisis de la estructura, estamos firmemente convencidos de que esta última proporciona una muy necesaria base para la hipótesis y como importante información en su propio derecho. Por otra parte, tendemos a creer que el espíritu general de publicación en línea es presentar resultados completos de un estudio (por supuesto, hay excepciones). El lector puede fácilmente navegar entre las secciones, por lo que la longitud de un documento no representa un problema especialmente grave. Por otra parte, hemos hecho algunas modificaciones a la parte de análisis de proteínas en respuesta a similares pero más específicas comentarios de Martijn Huynen, en particular, presenta las subpartidas adicionales que, es de esperar, hace que esta parte del documento de más fácil lectura.

El seductor de una hipótesis basada en RNAi sistema inmune se presenta como una analogía con el sistema RNAi eucariotas. El uso de la analogía es potencialmente un desafío: por un lado, permite una potente y elegante presentación de numerosas y complejas genómica resultados, pero, por otra parte, es cuestionable, ya que la analogía puede imponer a priori un modelo para interpretar las características biológicas, y si este modelo es incorrecto, si la analogía no se sostiene, existe el riesgo de que la genómica de datos recibir una justa interpretación sesgada. En este sentido, sería interesante si los autores discuten sobre si una homóloga del sistema inmunológico podría haber sido posible en eucariotas y en prokaryotes, y la razón por la que no se encuentra. De hecho, tal homóloga sistema sería más natural de referencia para interpretar los datos de una analogía.

Autor respuesta: Entendemos la preocupación epistemológica en relación con el papel de la analogía en este estudio. Sin embargo, según lo indicado por el propio revisor, la analogía es fuerte. Por otra parte, esta analogía se manifiesta en dos niveles diferentes: i) la presencia de inserciones homólogas a fagos y plásmido los genes en CRISPR unidades y ii) presencia de predecir las actividades compatibles con un siRNA-como sistema de cas entre los productos genéticos, en particular, el dicer analógicas. ¿Ha sido la analogía falsa, no habría motivo para esta congruencia. Estamos un breve comentario a tal efecto en la revisión del manuscrito. La idea del sistema inmunológico homóloga en procariotas y eucariotas, parece un poco lejanos. Sin embargo, este comentario nos llevó a incorporar una breve comparación de la historia evolutiva de RNAi y clásico sistema inmunológico.

Dicho esto, no creo que el uso de la analogía es un problema aquí, ya que es convincente y sostuvo presentado por los autores. Podríamos eventualmente cuestión más si todos los llamados genes CASS son realmente involucrados en el procariótico inmune systemand merecen su etiqueta: puede que algunos sólo estar presentes en la proximidad de genómica CRISP, pero que no tiene nada que ver con la interferencia por ARN. Pueden ser simplemente móviles «de viaje» los genes. Un nuevo estudio de la genómica de distribución de los homólogos de la CASS genes en genomas de bacterias puede ayudar a aclarar que los genes están íntimamente y exclusivamente CRISP relacionados y cuáles se pueden encontrar también en lugares alternativos en los diferentes genomas. Entonces, tal vez la «sorprendente diversidad de aún mal caracterizado CASS componentes» se describe en la página 16 parece menos sorprendente si algunos CASS categorías no son simplemente pertinente definido, e incluyen las proteínas no vinculados, ya que tal vez, el uso de la analogía que ha dado lugar a demasiado relajado definiciones de CASS. En otra situación, por el contrario, el uso de la analogía podría tal vez ser demasiado estricto. En la página 18, los autores se preguntan cómo identificar «las SLICER homólogo (p-Slicer)» en prokaryotes. Explican que esta identificación es "menos evidente debido a la diversidad de nucleasas previsto en el CASS». Pero, después de todo, ¿por qué debe haber un solo p-Slicer, al igual que en eucariotas? Es posible que prokaryotes tienen múltiples «p-cortadoras».

Autor respuesta: Sí, estamos de acuerdo, la posibilidad de múltiples cortadoras existe, y que modificó el texto para acusar recibo de la presente. En cuanto al resto de este comentario, sin embargo, consideramos que la actual diversidad de los genomas procariótico es ya suficiente para hacer conclusiones sobre la fuerza de la asociación de genes individuales con CASS, y los genes se clasifican aquí en consecuencia, como verdaderos componentes CASS y menos estrechamente asociados "satélites". En cuanto a este último se refiere, inferencias sobre la participación con CASS funciones se realizan sólo para aquellos genes cuyas actividades parecen claramente pertinentes, como el IM o Argonaut.

Por último, la fuerte sospecha acerca de la intrincada y análogas funciones de COG1518 y COG1343 (cf. página 21) puede ser rebajado de manera similar. Tal vez estos genes desempeñan el papel esencial análogo de CRISPR integrasa / recombinado en consonancia con la analogía, pero tal vez cumplen con diversas tareas. Quizás a los autores les gustaría comentar más sobre algunos de estos puntos menores.

Autor respuesta: En realidad, esta predicción no está basada en analogía con los sistemas eucarióticos RNAi, sino más bien en los mutualistas asociación de estos genes para CRISPR y las características de las proteínas. Hemos disminuido el "fuerte" sospecha, pero, en general, creemos firmemente que esta es la mejor predicción posible. La referencia a la multitarea podría no ser particularmente productiva si no hay buenas ideas con respecto a lo que estas múltiples funciones podría ser (esto es diferente de la anterior posibilidad de que hay múltiples cortadoras que es, de hecho, compatible con los datos).

Por otra parte, para volver a la CASS evolución de genes, los autores mencionan, página 8, «la extraordinaria evolución de la movilidad CASS». No está claro para mí el que esta declaración ha sido probado, y cómo los autores han establecido que CASS genes son más móviles que cualquier medio de genes al azar recogido en la misma colección de genomas procariótico. Por esta razón, no estoy seguro de si, como afirman los autores, en la página 14 «la pol-cassette consta de una unidad evolutiva que a menudo se transferirán horizontalmente con independencia de la CASS-core». ¿La CASS-core realmente tienen un modo vertical de inheritanceor, como los autores ya se ha dicho, un «no uniforme» de distribución (véase la página 8)? Esto podría ser más defendido con firmeza.

Autor respuesta: Varias cuestiones distintas se tratan aquí. Con respecto a la "extraordinaria movilidad" de la CASS, esto queda demostrado por los árboles en la Fig. 2 (más árboles han sido publicados anteriormente en nuestro propio documento de 2002 y de Haft et al.), Pero aún más convincente, por la persistencia de patrón de presencia-ausencia de CASS en especies estrechamente emparentadas e incluso cepas de bacterias. Hemos consolidado el argumento de tal manera que este se convierte en claro la primera vez "extraordinaria" la movilidad viene. Es cierto que no hemos comparar la movilidad de la CASS componentes con la de jardín procariótico variedad de genes de forma rigurosa, de manera cuantitativa. Si bien esto es factible, en principio, todos los métodos somos conscientes de están abiertos a debate, y creemos que es el ejercicio más allá del alcance de este documento. Teniendo en cuenta el argumento anterior, creemos que, cualitativamente, es evidente que CASS es inusual en este sentido. Con respecto a la pol-casette, creemos que la discrepancia entre las topologías de los dos árboles en la Fig. 2 es más que suficiente para la declaración independiente sobre HGT. En cuanto a la "vertical modo de herencia" de la CASS, parece que hay una cuestión semántica. Nosotros realmente no reclamar la herencia vertical para CASS pero tampoco es un patrón necesarias para detectar la movilidad horizontal. Lo que se necesita es un patrón predominante de la herencia vertical entre otros genes que nos permite utilizar una especie de árboles para detectar HGT. Por supuesto, nos damos cuenta de que hay importantes argumentos para el abandono de "árbol de pensamiento" [73] en absoluto, sino, en general, seguimos creyendo que una especie de árboles conceptualizado como una tendencia central en la evolución de los conjuntos de genes [74] es decir, a por ello menos importante, una herramienta útil para el análisis de la evolución del genoma.

Estas pocas preguntas muestran una fuerza del presente trabajo interesante que abre perspectivas y sugiere que algunos análisis adicionales deberían llevarse a cabo ahora, porque el tema merece consideración. Tal vez los autores se sienten como abordar algunos de los puntos a continuación en una versión revisada del documento actual, o en los futuros análisis.

Autor respuesta: Estos son, sin duda, muy interesantes preguntas, les agradecemos. Algunos son para estudios futuros, pero podemos dar algunas respuestas ahora.

Un estudio más a fondo podría iclude el texto siguiente:

- ¿Otras regiones genómicas albergar concentraciones de nucleasescomparable a los alrededor de CRISP existen en otras partes de los genomas?

Autor respuesta: Apenas. Como se indica en el documento, el CRISPR barrio es la segunda más destacados (es decir, la que ocupa el segundo lugar en el número de genes) en el barrio procariótico después de los genomas ribosomal superoperons, por lo que es bastante excepcional. Sin embargo, hay otras, considerablemente pequeños constelaciones de nucleasas, como el clásico recBCD operón reparación de codificación de proteínas, algunas de restricción-modificación de sistemas y, tal vez, otras que son todavía poco conocidos y merecen investigación.

-- En caso afirmativo, ¿existe más de un procariótico sistema inmunológico definible en este terreno análogo? En particular, hizo las bacterias sin CRISPR evolucionar completamente diferente del sistema inmunológico?

Autor respuesta: No hay pruebas de ello. Por otra parte, como destacó en repetidas ocasiones en este documento, CASS muestra evolutiva extrema volatilidad, al parecer, está perdiendo bastante facilidad, en un breve espacio de tiempo, a escala evolutiva. Es difícilmente imaginable que estas bacterias evolucionado un sistema inmunológico en el corto tiempo transcurrido desde la pérdida de la CASS. Por supuesto, sólo hipotéticamente, se podría percibir la posibilidad de que otro sistema inmune se difunde horizontalmente, al igual que CASS, y prokaryotes tener ambas cosas, podría perder diferencialmente uno de ellos. Sin embargo, no son conscientes de cualquier tipo de apoyo para este escenario. Otro destacado procariótico mecanismo de defensa es la restricción de modificación; sería interesante examinar la relación entre los sistemas de RM y CASS, que podría ser un tema para un futuro estudio.

- ¿Cómo surgió la vía psiRNA surgir en thermophiles (cf. página 20)? ¿Es resultado de una transferencia? ¿Es ancestrales?

Autor respuesta: Muy interesante, cuestiones fundamentales, de hecho. En respuesta, hemos ampliado el debate de estos y otros aspectos de la evolución de la CASS. Las preponderancia de CASS en thermophiles, observado ya en el documento de 2002, cuando pensábamos que se trataba de un termófilo específicas de reparación del sistema, sigue siendo un misterio. Cualquiera que sea la naturaleza de esta asociación, parece probable que CASS es ancestral en thermophiles (al menos en hyperthermophiles).

-- ¿Podríamos imaginar que existen múltiples promotores, tanto sentido y antisentido, que activar la transcripción de CRISPR, generando aún más RNAi (cf.p 24)?

Autor respuesta: En principio, la existencia de múltiples promotores no se puede descartar. Sin embargo, el líder secuencia parece ser el único candidato natural para la función de promotor. El resto de la CRISPR cassette es homogénea (repetitivos), por lo que no está claro que una alternativa promotor estaría ubicada. Además, en los dos Arqueales sistemas que han sido estudiadas experimentalmente (Archaeoglobus y Sulfolobus) la transcripción de todos los loci CRISPR parece ser unidireccional.

- Por último, podría ser difícil, aunque interesante para poner a prueba in vitro en cultivos bacterianos si, tal como se propone por los autores, la presencia de CRISP y CASS, tiene realmente un impacto sobre la idoneidad de prokaryotes en presencia de virus.

Autor respuesta: Por cierto, esperamos que el análisis computacional y las predicciones se describe en este documento de estimular un montón de experimentos encaminados a la dilucidación de las funciones biológicas de CASS y funciones de sus componentes individuales.

Estamos muy agradecidos por estos perspicaces observaciones y estimulante.

Menores de observaciones o preguntas:

En la página 7: «funcionalmente análogos» es redundante.

Autor respuesta: Consideramos que el punto pero no realmente de acuerdo. La palabra "funcional" parece añadir claridad.

En la página 8: la frase «la distribución de COG1518 y, por implicación, CASS procariótico entre linajes ...» es demasiado «audaz» para mí: aunque la conclusión es correcta, no estoy seguro de que se puede generalizar como se sugiere desde aquí el caso de una proteína.

Autor respuesta: En efecto, podemos. Reformulado para aclarar y hacer hincapié en esto.

En la página 15: «varios otros genes CASS familias siguen siendo misteriosas» es una misteriosa frase. No estoy seguro de lo que esto significa realmente significa.

Autor respuesta: Que hay ninguna pista en cuanto a las posibles funciones de estas proteínas; modificado para aclarar.

En la página 21: se me olvida la idea de la oración que comienza por «Además, y probablemente, más pertinente, etc» a «los genomas retrovirales». ¿Podría reformular explícita a un poco más?

Autor respuesta: reformulado - esperemos que, para aclarar.

En la página 23: ¿cuál es el criterio mantenido por homología entre el plásmido los genes, fragmentos de fagos y la CRISPR secuencias?

Autor respuesta: La siguiente cita de los métodos aborda esta cuestión:

"secuencias de nucleótidos entre CRISPR espaciadores se utilizaron como una consulta en Megablast [70] búsquedas (tamaño de palabra 11; e-valor umbral de 0,01) contra el GenBank; hits a virus o secuencias de plásmido y alejadas prokaryotes fueron contados por separado para cada organismo fuente. "

En la página 48: Para mí, las múltiples correlaciones positivas evocan múltiples causalidades y la posibilidad de algunas correlaciones ocultas. ¿Diría que todas las combinaciones han sido considerados aquí?

No, no vamos a reclamar eso. Más complejo análisis de regresión múltiple sería necesario separar las correlaciones que reflejan cierto causalidad; a los efectos del presente trabajo, se consideró que era suficiente para tomar nota de la correlación más fuerte.

El informe del Revisor 2

Patrick Forterre, Biologie Moléculaire du Gène chez les Extrêmophiles (BMGE) Institut de Génétique et Microbiologie (IGM), Université Paris-Sud, Centre d'Orsay, 91405 Orsay Cedex, Francia, y Biologie Moléculaire du Gène chez les Extrêmophiles (BMGE), Département de Microbiologie Fondamentale et Médicale, Institut Pasteur, París, Francia

En este importante documento, Makarova compañeros de trabajo y proponer un mecanismo detallado para un putativo procaryotic antiviral sistema de inmunidad mediada por CRiSPS secuencias y sus proteínas asociadas Cas (el sistema CAS, CASS sentido los autores). Su modelo se basa en la hipótesis de que estos elementos representan una procariótico específicos antivirales mecanismo análogo al sistema RNAi eucariotas. En procaryotes (bacterias y Archaea) no hay homólogos de las proteínas participan en el sistema eucaryotic RNAi. Hasta hace poco, por lo tanto, es opinión generalizada que la restricción de los mecanismos de modificación fueron los únicos disponibles para la defensa procaryotes para luchar contra las infecciones virales. Sin embargo, se ha propuesto el año pasado por varios grupos que procaryotic CASS también podrían desempeñar un papel importante en la lucha contra la agresión viral en bacterias y arqueas (Mojica et al. 2005, Pourcel et al., 2005, Bolotin et al., 2005). CRISPR secuencias, que son transcritas pero no codificante, están formadas por la repetición en tándem de unidades que contienen un elemento conservadas (similar a lo largo de un determinado CRISPR) y un elemento variable, el espaciador, diferentes de una unidad a otra. El spacer secuencias sorprendentemente no han secuencia homóloga en bases de datos, salvo viral o las secuencias de plásmido. Tanto Mojica et al. (2005) y Bolotin et al., (2005) han sugerido que la transcripción de las secuencias de CRISPR producir sentido anti-ARN que puede inhibir la transcripción de las viral (plásmido) y secuencias de Mojica et al. (2005) menciona la analogía de un sistema de este tipo con eucariotas RNAi. Sin embargo, estos autores no profundizó en el mecanismo específico que participan y la forma en que el cas proteínas podrían estar involucrados en el procesamiento de ARN viral.

En este trabajo Makarova y compañeros de trabajo han realizado primero un análisis actualizado de las proteínas cas genómica utilizando el análisis del contexto y métodos sensibles (iteración enfoques) para la detección de bajo nivel de similitud y cas para clasificar las proteínas en las familias y superfamilies. Pudieron identificar a varios de los nuevos putativo cas y proteínas para definir 25 superfamilies cas de proteínas y 7 tipos diferentes de organización CASS (llamado CASS1 a 7). También han analizado todos los disponibles CRISPR secuencias repetidas putativo y sus estructuras secundarias. Más importante aún, tratar de predecir la función biológica de las proteínas cas y su mecanismo de acción en el marco de la hipótesis de RNAi. Anteriormente, se ha sugerido que se cas proteínas que participan en la formación y la difusión de la CRISPR. Por ejemplo, Bolotin et al. Tiene previsto cas proteínas que están actuando a nivel del ADN mediante la promoción de división, la recombinación y la ligadura. Makarova y al son los primeros en sugerir que varias proteínas cas debe interactuar al nivel de ARN, mediante la promoción de la degradación del ARN y ARN-RNA hibridación. Específicamente sugieren la existencia de procaryotic homólogos de eucaryotic dicer (helicasa-nucleasa) y splicer (nucleasa). También proponen que una sospecha previamente la polimerasa de ADN podría ser un RNA polimerasa RNA dependiente utiliza para estabilizar el ARN / RNA híbrido de la ampliación de IRNA hibridizada a su objetivo mRNA viral. También sugieren la participación de una transcriptasa inversa en la formación del enlazador de secuencias virales (plasmídica) mRNA. En mi opinión, todas estas propuestas son muy reasonnable y convaincing. Otra predicción es que las proteínas RAMP enlazador reconocer secuencias de diferentes tamaños. Esta conclusión se apoya en una correlación entre el número de secuencias de enlazador y el número de rampas de codificación de los genes (Fig. 6]. En ese caso, no es claro para mí por qué esto no puede ser debido a la obligatoriedad de rampas a las reiteradas unidades, ya que estas unidades presentan secuencias conservadas y su número (idéntico al número de enlaces) debe ser también una correlación con el número de Rampas.

Autor respuesta: Que rampas discriminar, de una manera u otra, entre CRISPR insertos, es fuertemente sugerida por la extrema divergencia de secuencia de rampas que es difícilmente compatible con el reconocimiento de idéntica se repite. Para ser explícitos al respecto, hemos añadido una aclaración al final de esta sección.

La búsqueda de la estructura secundaria específicos asociados a las reiteradas unidades no dan resultados convincentes y sugieren que para mí la simetría dyad observado en repetir muchas unidades podría ser debido a la unión de proteínas con nueva estructura (posiblemente el duplicado ferredoxin-como a veces presente Rampas) y no la formación de estructuras secundarias en el transcrito repite.

Autor respuesta: Es difícil ver cómo se excluye a los demás: es lógico que CRISPR forman distintas estructuras secundarias que se unen a las proteínas simétrica.

El modelo propuesto (incluidas las posibles variaciones), lo que implica muchas predicciones de que podría ser probado experimentalmente. Sorprendentemente, que yo sepa, sólo un cas de proteína se ha estudiado en el banquillo hasta ahora (ref 70 en el manuscrito). Esta proteína se convierte en DNasa tiene actividad in vitro, pero tengo la sospecha de que los autores no han probado una posible actividad RNasa. Esto es sorprendente porque la importancia de estas proteínas ya señalada en 2002 por dos en los documentos de silico que en un caso, sugirió su participación a un "misterioso sistema de reparación del ADN y en los demás descrito su asociación con CRISPR secuencias. En el presente documento, con mucho más specfic predicciones, todo funciona muy estimular bioquímicos y biólogos moleculares para saltar hacia esta historia realmente emocionante. Como notado por los autores en su conclusión, si su hipótesis resultó ser correcta, este sistema procariótico RNAi podría ser explotado para silenciar cualquier gen en los organismos que codifican CASS. Por otra parte, el estudio experimental de este sistema debería ayudarnos a obtener nuevos conocimientos críticos sobre la dinámica de las relaciones entre los virus y Arqueales / poblaciones bacterianas en la naturaleza.

Por último, me gustaría saber si los autores tienen una idea sobre el origen de este sistema CAS. ¿Por qué es presente en todos los Arqueales genomas secuenciados hasta el momento? ¿Es posible que este sistema se originó en Archaea y más tarde fue introducido en las bacterias de LGT?

Autor respuesta: Teniendo en cuenta la movilidad horizontal de la CASS, sólo podemos especular sobre el punto de su origen. Estamos ampliando tal especulación en la versión revisada conclusión incluida la posibilidad de Arqueales origen.

-- En algunos casos, los autores deberían ser más cautelosos en su declaración. Por ejemplo, cuando hablan sobre la pol-cassette, tal vez llevado a algunos lectores a creer que la polimerasa actvity de la proteína COG1353 ha sido validada experimentalmente, que no es el caso.

Autor respuesta: Hemos añadido unas cuantas más "previsto". Sin embargo, no quiso abandonar el término «pol-cassette", como es descriptivo y sucinta.

El informe del Revisor 3

Martijn Huynen, Nijmegen Center for Molecular Life Sciences University Medical Center St Radboud p / a Centro de Molecular y Biomolecular Informática, Nijmegen, Países Bajos

Este documento proporciona una muy interesante y bien documentado sobre la hipótesis de un grupo de genes que E. Koonin y compañeros de trabajo han descubierto hace algún tiempo. Al combinar el conocimiento biológico con los métodos de bioinformática y el pensamiento creativo los autores proponen que Archaea y un poco menor medida, las bacterias poseen un ARN de interferencia basada en la participación del sistema inmune y CRISPR cas genes, que es análoga la interferencia por ARN eucariota. Aunque los aspectos de esta hipótesis han sido publicados antes, concretamente con respecto a CRISPR, este documento es, por lo que puedo decir, la primera que hace la analogía entre los casos los genes y el sistema de interferencia por ARN. La idea de que procariótico genomas que internalizar los pedazos de ADN extraño, a fin de ser capaces de defenderse en contra de ella, así que tengan un sistema inmunológico con una memoria, sería un ejemplo interesante de Lamarckian evolución.

Tengo algunas preguntas y comentarios editoriales que creo que deben abordarse.

1) ¿los autores tiene alguna idea de por qué este sistema tiene la distribución filogenética que lo hace, está presente en este pequeño genoma como el nanoarchaeon, pero no en, por ejemplo, la mayoría de Firmicutes

Autor respuesta: No idea mecanicista, lamentable, ya que esto podría ser. Hemos añadido algunas debate final de la CASS de origen (véase la respuesta a Patrick Forterre).

2) Con respecto a la feasibilty del sistema propuesto por los autores: ¿Hay algo que sabe acerca de cuántos fiendly AND prokaryote un encuentro en la vida cotidiana, y que ¿cómo comparar el número de diferentes elementos en un CRISPR?

Autor respuesta: No hay suficientes para esta comparación. Sin embargo, es bien sabido que fagos son muy abundantes, mucho más que las bacterias o arqueas, y en la revisión del manuscrito, nos referimos a este, más concretamente, con las referencias correspondientes.

3) En lo que respecta al régimen de Lamarckian: Que el único elemento de la CRISPR corresponden a muy conservadas, elementos esenciales de fagos genes sugiere que la selección sobre la variación genética también juega papel aquí. Por lo tanto, el sistema sería parte Lamarckian.

Autor respuesta: Probablemente, por lo que. La manera en que el estado en que el texto "CASS parece venir más cercano a una verdadera Lamarckian modo de evolución entre todos los sistemas conocidos de la herencia" es compatible con este punto de vista.

4) No estoy tan convencido por el argumento en la página 3 que los resultados implican que, incluso entre estrechamente relacionados prokaryotes los más comúnmente encontrados fagos son diferentes. En primer lugar, es más un corolario de la hipótesis, pero en segundo lugar, también podría reflejar el alto volumen de negocios de fagos lo largo del tiempo, en lugar de nicho.

Autor respuesta: Esta es una muy buena idea, ahora mencionar esta posibilidad tanto en el Resumen y en el debate.

5) Estoy perplejo por la participación de más o menos piezas seleccionadas al azar de ADN de extranjeros ADN / ARN en exactamente la misma ubicación en la estructura secundaria de la psiRNA (la parte superior de la horquilla). ¿Este patrón se producen con mayor frecuencia?

Autor respuesta: La situación cuando la inserte forma un tallo de la estabilidad con diferentes partes del repite es común pero no universal. Las posiciones de las inserciones no son exactamente iguales a pesar de que son, de hecho, muy similares, los tallos y en las inserciones que están involucrados son imperfectos. Por supuesto, la emocionante posibilidad de que exista la CRISPR inserciones están específicamente seleccionados por su capacidad a base de par con la repite, sin embargo, no tenemos suficientes datos para hacer esa afirmación.

Autores de las contribuciones

KSM realizó el análisis de secuencias de proteínas, NVG realizado comparaciones estructura de proteínas y modelado, SAS realizó RNA estructura secundaria predicciones, YIW realizado análisis de secuencias de nucleótidos, EVK desarrollado la interpretación biológica de los resultados y escribió el manuscrito que fue editado y aprobado por todos los autores.

Material complementario
1 de ficheros adicionales
GI número para todas las familias de proteínas Cas.
2 ficheros adicionales
múltiples secuencias de proteínas para la adaptación COG1343.
3 ficheros adicionales
múltiples secuencias de proteínas para la adaptación COG1857.
Agradecimientos

Damos las gracias a M. Huynen y J. Van der Oost útil para los debates, y los tres revisores por su perspicaz, detallada y minuciosa revisión que, según creemos, ha permitido mejorar sustancialmente el artículo. Esta obra fue financiada en parte por el Programa de Investigación Intramural de la Biblioteca Nacional de Medicina de los Institutos Nacionales de Salud / DHHS.