Philosophical Transactions of the Royal Society B: Biological Sciences, 2006; 361(1475): 2045-2053 (más artículos en esta revista)

Desfase inducido por Salmonella especiación: modelo y los datos

La Real Sociedad
Daniel Falush [1], Mia Torpdahl [2], Xavier DIDELOT [1], Donald F Conrad [3], Daniel J Wilson [1], Mark Achtman [4]
[1] Oxford OX1 3SY, Reino Unido
[2] Bülowsvej 27, 1790 Copenhagen V, Dinamarca
[3] 920 Este Calle 58a, CLSC 507, Chicago, IL 60637, EE.UU.
[4] 10117 Berlin, Alemania

Se trata de un libre acceso artículo distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original esté debidamente citados.

Resumen

En las bacterias, los desajustes secuencia de ADN, actúan como una barrera a la distancia de recombinación entre los organismos relacionados y pueden promover la cohesión de las especies. Hemos realizado simulaciones por ordenador que demuestran que la homología de la dependencia de la recombinación puede causar la especiación de novo en un neutral evolución de la población una vez al crítico el tamaño de la población se ha visto desbordada. Nuestro modelo puede explicar los patrones de divergencia y el intercambio genético observado en el género Salmonella, sin invocar la selección natural, ya sea geográfica o subdivisión de la población. Si este modelo se validó, sobre la base de una amplia secuencia de datos, ello implicaría que la subespecie el nombre de Salmonella enterica corresponden a las buenas especies biológicas, haciendo fronteras especies objetivo. Sin embargo, la secuencia de multilocus a escribir los datos, analizaron utilizando varias herramientas convencionales, proporcionan una impresión errónea de las relaciones dentro de S. enterica subespecie enterica y no proporcionan la resolución para establecer si las nuevas especies se están formando actualmente.

1. Introducción

Neutral modelos son muy apreciados en la genética de poblaciones, incluso de aquellos que no suscribirse a ellos (Kreitman 1996]. Proporcionan una hipótesis nula a ser falsificado y, al hacerlo, la mayoría de marco evolutivo análisis de secuencia de ADN de datos. Poblaciones bacterianas son grandes, lo que hace la selección natural una fuerza potente, por ejemplo, para moldear el codón sesgo ( Hartl et al. 1994 ) Y otras funciones seleccionadas débilmente de la composición del genoma. Por esta razón, ha sido la hipótesis de que las fronteras entre diferentes fenotípicas, genotípicas o incluso, los grupos de bacterias son principalmente moldeado por selección ( Palys et al. 1997 ). Sin embargo, la agrupación sustancial tanto en el genotipo y fenotipo espacios se espera incluso bajo el más simple neutral modelos (Felsenstein 1985], por lo que es difícil demostrar que la selección ha actuado realmente y en qué sentido.

En este trabajo se tratará de ampliar las características de la estructura de la población bacteriana que puede ser explicada por modelos puramente neutral. De esta manera, reducir el riesgo de que la selección natural se dedujo incorrectamente. También ayuda el selectionist de hacer los conceptos más claros. En particular, vamos a tratar de demostrar que de más alto nivel las divisiones, con la participación de barreras genéticas para el intercambio genético, podría ser mejor idea de como se derivan principalmente debido a los procesos de neutral. Dentro de estas categorías superiores agrupaciones, sin embargo, puede ser importante la organización de la selección natural, por ejemplo, en "ecotipos" que mejor se define por el nicho que ocupan.

El resto de este documento está organizado en cuatro partes. En el apartado 2, se presenta un modelo neutral de especiación. Este modelo se basa en la observación de laboratorio en varios géneros bacterianos que el ritmo al que incorporan bacterias homólogas de ADN en su genoma es muy reducido por falta de adaptación entre las bacterias de la propia secuencia de ADN y la secuencia de las posibilidades de importación (Shen & Huang 1986; Zawadzki et al. 1995 ; Zahrt & Maloy 1997; Majewski et al. 2000 ). Se demuestra que este mecanismo tiene el potencial para crear las especies biológicas (Cohan 1995; Lawrence 2002)-se define por el intercambio genético frecuente dentro de cada especie pero sustancial las barreras al intercambio genético entre ellas (Dykhuizen & Green 1991; Vázquez et al. 1993 )-Incluso en ausencia de factores selectivos. Hacemos un intento de describir las condiciones en las que, y las etapas por las que, especiación puede ocurrir en un modelo completamente neutral.

Sección 3 se presenta un intento de encajar las predicciones de este modelo a multilocus secuencia de mecanografía (MLST) de datos provenientes de distintas subespecies reconocidas y las especies dentro del género Salmonella. Se presenta una plausible, aunque no probada, hipótesis que podría explicar el patrón observado de las distancias genéticas entre las especies. En el apartado 4, se describe un intento fallido de utilizar el modelo con el fin de determinar la especiación incipiente dentro de las especies para las cuales tenemos el mayor de datos, a saber Salmonella enterica subespecie enterica. Finalmente, se discuten las implicaciones más amplias de nuestras dificultades en la colocación modelo y los datos en términos de lo que puede y no se puede lograr la clasificación de especies en las fronteras y los mecanismos mediante los datos MLST.

2. Modelo de simulación

Hemos simulado un neutral de la evolución de la población bacteriana circular genomas de tamaño 10 kb. Las bacterias recombinar por una homología que dependen de proceso, de tal modo que frecuentemente se hacen intentos de importar tramos de secuencia de otros genomas escogido de forma aleatoria en la población, pero las importaciones son rechazadas con una probabilidad que depende del número de secuencia de ADN con la inadecuación de la actual secuencia .

Nuestro modelo se basa en la Wright-Fisher modelo (Fisher 1930; Wright 1931], lo que supone una constante N tamaño de la población y no la superposición de generaciones. Cada generación está formada por la elección de los genomas N, con la sustitución, a partir de la generación anterior. Para cada genoma, una distribución de Poisson número de mutaciones puntuales (con media de 0,1, correspondiente a una tasa de mutación de 10 -5) se añaden al azar a lo largo de cada genoma en cada generación. Además, una distribución de Poisson número de intentos (con media de 5) se hacen para copiar un escogido de forma aleatoria tramo de la secuencia, geométricamente distribuidos de longitud con el tamaño medio de 1000 nucleótidos, a partir de una secuencia homóloga tomada de un escogido de forma aleatoria del genoma de la población. Se han utilizado dos normas diferentes para la homología que dependen de la recombinación. En la primera regla, log-lineales (Roberts & Cohan 1993], la probabilidad de éxito p importación disminuye exponencialmente con la proporción de secuencia de diferencias de conformidad con la fórmula log (p) =- 300 π, donde π es la proporción de nucleótidos que difieren entre la importación y la secuencia original. En la segunda norma, el procesamiento eficaz mínima segmento (diputados; Shen & Huang 1986], las importaciones son aceptados sólo si 150 nucleótidos en los extremos de la secuencia son idénticos.

Con el fin de determinar si la población es segregada en distintas unidades aisladas genéticamente, se ha calculado la "conectividad-r ', r. Se define β como la media de probabilidad de aceptación de los intercambios entre cualquier par de genomas. Entonces podemos resumen la población como un conjunto de nodos conectados por pairwise valores de β. R es el valor más alto de forma que en el transcurso de dos genomas de la población, existe una vía de conexión, en el que todos los valores de β son mayores que o igual a r. r es una medida de la conectividad de la red, que desciende drásticamente como se produce la especiación.

El comportamiento cualitativo del modelo depende del tamaño de la población N. Cuando N = 500, la población persiste indefinidamente como una sola especie biológica (electrónica, material suplementario, película S1), con r siempre superior a 0,1. Cuando el tamaño de la población se incrementa a N = 1000, la especiación se produce a través de un complejo y altamente variable de proceso estocástico (electrónica, material suplementario, película S2). Clados distintos emerge en varias ocasiones. La mayoría de clados extinguirse como consecuencia de la deriva génica antes de que un genoma a escala barrera para el intercambio genético pueden desarrollar. Sin embargo, de vez en cuando, un clado diverge del resto de la población en la medida en que la recombinación se convierte en muy raras (por ejemplo, la figura 1 a), reduciendo el valor de r para la población de 0.0001 o menos.

En nuestras simulaciones, con una población de tamaño N = 1000, nuevas especies desaparecieron con frecuencia debido a la deriva genética y la totalidad de la población nunca figuran más de tres grupos aislados genéticamente en un momento dado (figura 1 b). Sin embargo, con N = 2000, secuencial de los acontecimientos conducen a la ocurrencia simultánea de múltiples especies (figura 1 c; electrónico material complementario, película S3). Los dos tipos diferentes de homología norma que hemos probado (log-lineales y diputados) dio resultados cualitativamente similares para distintos parámetros, pero la evolución de una población en virtud de homología menos fuerte dependencia requiere tanto un mayor tamaño de la población o una mayor tasa de mutación para inducir a la especiación (datos no se muestra).

Insight en el efecto del tamaño de la población en la especiación es proporcionado por la relación entre el número de generaciones desde el ancestro común de un par de cepas y la distancia genética entre ellos (figura 2]. Por tanto N = 500 y 1000, la fase inicial de divergencia es rápido, con cepas recogiendo múltiples diferencias secuencia de recombinación no guardan relación con las cepas de la misma especie (esta fase se produce aproximadamente entre 0 y 100 generaciones en la figura 2]. A medida que la divergencia entre las cepas aumenta, el efecto neto de recombinación cambios, por lo que con el tiempo actúa a homogeneizar y no a la velocidad de diferenciación. Para N = 500, la divergencia inicial da lugar a una fase estacionaria, en el que la divergencia entre las cepas es de aproximadamente constante. En el caso de algunos pares de clados, hay una tendencia a que la distancia genética a aumentar lentamente con el tiempo, que es un sello distintivo de especiación incipiente, sin embargo, debido a que el tamaño de la población es pequeña, uno de los dos clados general derivas a la extinción antes de ser claramente identificable como una nueva especie.

Para N = 1000, el período inicial de rápida divergencia es seguido por un período en el que la secuencia de nucleótidos de las cepas difieren unos de otros en un lento pero alrededor de tipo uniforme, a pesar de un importante efecto homogeneizante de la recombinación. La diferencia de N = 500 se produce, porque hay una mayor diversidad en la población total, lo que conduce a la disminución de las tasas de recombinación. Esta etapa dura aproximadamente entre 100 y 1000 las generaciones de todos los pares de clados. Si tanto los clados persistir durante el tiempo suficiente a la población, esta fase es inevitablemente seguido por la evolución de fuertes barreras para el intercambio genético y la especiación. Sin embargo, el momento en que ocurra la especiación es muy variable, ocurre después de aproximadamente entre las generaciones 1000-2000 se muestra en la figura 2. Una vez que se ha producido la especiación, la divergencia tiende a una tasa constante, igual al doble de la tasa de mutación, hasta que uno u otro de los clados desaparece de la población debido a la deriva génica.

El tamaño de la población que hemos simulado son más pequeños que la realidad, incluso teniendo en cuenta el tamaño efectivo de la población en lugar de censo, para prácticamente cualquier población bacteriana. El uso de este tipo de simulación con interés explícito de cada uno de nucleótidos de cada individuo en la población y las estadísticas pairwise como r, simplemente no es posible simular realista tamaños de población. Los resultados que hemos obtenido podrían ser comparado directamente a las poblaciones reales, si otros parámetros son exactos y si ambos se adaptan en términos de parámetros θ coalescent (la tasa de mutación a escala en términos de tamaño efectivo de la población) y ρ (la tasa de recombinación escala de acuerdo con el tamaño efectivo de la población). Por ejemplo, si la mutación y recombinación tasas se dividen por 10 000, y el tamaño de la población se multiplica por 10 000, entonces podemos esperar a obtener resultados muy similares, con valores de los parámetros que entonces sería mucho más cerca de aquellos a los que cabría esperar para géneros bacterianos, como Salmonella. Sin embargo, cabe señalar que no se ha demostrado formalmente que esta ampliación coalescent trabaja para una homología que dependen de proceso de recombinación y hacer sólo un mínimo intento para adaptarse a los parámetros del modelo para la Salmonella en los datos § 3. Un enfoque alternativo es hacer aproximaciones sobre la base de la teoría coalescent (Cohan 1995], pero esto tiene el inconveniente de no revelar las propiedades de la población a nivel individual. Simulación de muestras de una gran población que utiliza la recombinación ancestrales gráfico (Wiuf y Hein 2000], considera que la genealogía de cada sitio en una muestra, hacia atrás en el tiempo, es probable que requieren una gran cantidad de cálculo si las tasas de recombinación son altos y deben ser modificados para permitir la homología de la dependencia. No intento aquí.

Estas simulaciones muestran que con frecuencia dependen de homología recombinación conduce a determinados patrones de variación entre los organismos. En primer lugar, relacionados con los genotipos se organizan en un número relativamente pequeño de especies discretas. Dentro de cada especie, la recombinación destruye clonal marcos, dando lugar a gran mosaico de patrones de ascendencia (figura 1 a, b). En segundo lugar, la diversidad es esencial para la especiación, ya que es un tamaño de la población que es lo suficientemente grande como para generar esa diversidad. En tercer lugar, las especies son monofilético en el nivel de nucleótidos y compartir algunos polimorfismos. Como resultado, las especies divergen de unos a otros por mutaciones puntuales, que pueden obedecer a un reloj molecular. Por último, hay una zona gris, donde las barreras genéticas para el intercambio genético se están desarrollando, pero no están plenamente formados. Dentro de esta zona, el término «fuzzy especie" (Hey 2001; Hanage et al. 2005 ) Podría ser apposite.

3. Aplicación a los datos de Salmonella subespecie

El género Salmonella se ha dividido en siete grupos sobre la base de ADN / experimentos de hibridación de ADN en combinación con biotyping ( Le Minor et al. 1982 b ). Un grupo, Salmonella bongori, se cree que representan una especie distinta, mientras que los otros seis grupos (enterica, arizonae, diarizonae, houtenae, indica y salamae) han sido designados como subespecie de S. enterica ( Le Minor et al. De 1982 a ; Reeves et al. 1989 ; Tindall et al. 2005 ). Para simplificar, nos referimos a cada una de estas subespecies designado por un nombre unadorned subespecies, por ejemplo enterica.

Los detalles de la cepa de Salmonella colección se describen en otros lugares ( Torpdahl et al. 2005 ). Siete fragmentos de genes del hogar, lo que representa un total de 3336 nucleótidos, como se describe por etapas ( Kidgell et al. 2002 ) Y están disponibles en http://web.mpiib-berlin.mpg.de/mlst . Hemos secuenciado 207 enterica, de los diversos serotipos, junto con 20 cepas de otras subespecies y S. bongori dando un total de 108 distintos tipos de secuencias (STB). De ellos, 95 son de enterica, con uno a cuatro STS de cada una de las otras subespecies y S. bongori. Los más diversos de la subespecie es enterica (cuadro 1] y contiene la mayoría de los serotipos reconocidos 2500 (POPOFF 2001]. Vecino a participar en los árboles sobre la base de secuencias concatenados confirmó la monofilia de cada uno de los siete grupos (figura 3 a; Selander et al. 1996 ) Con un 100% de apoyo bootstrap (ten en cuenta que typhi es parte de enterica, véase § 4].

Salmonella ha sido tradicionalmente considerados como clonal en gran medida, sobre la base de su análisis de la estructura de la población de electroforesis multilocus de enzimas (MLEE; Beltrán et al. 1988 ; Maynard Smith et al. 1993 ) Y comparación de secuencias de nucleótidos ( Selander et al. 1996 ). Sin embargo, este paradigma clonal ha sido recientemente cuestionado ( Kotetishvili et al. 2002 ; Brown et al. 2003 ) Porque los árboles filogenéticos de varios genes en enterica son incongruentes, lo que indica que la recombinación se ha producido en múltiples ocasiones. Nuestros datos también proporcionan pruebas sustanciales de recombinación dentro de enterica, como lo demuestra un patrón de mosaico de ascendencia (figura 3 b), con importantes alelo entre clados.

En contraste con el patrón observado en enterica, la recombinación entre enterica y la otra subespecie es muy raro. Se utilizó el modelo de vinculación Estructura ( Pritchard et al. 2000 ; Falush et al. 2003 ) Para tratar de identificar incluso a muy corto las importaciones procedentes de las otras subespecies. Estructura asume que cada cepa en la muestra señala a su ascendencia de una de las poblaciones de K, donde K es un entero especificado por el usuario que se puede variar de correr a correr. Se utilizó el modelo de vinculación, lo que significa que los nucleótidos se supone que son heredadas en trozos de cada población ancestral. Estructura asume que dentro de cada una de las poblaciones ancestrales K ha habido recombinación frecuente, por lo que no hay ningún desequilibrio en el ligamiento genético entre los nucleótidos se encuentran en trozos heredado de la misma población. Estructura puede usarse para realizar ingenuo agrupación, de tal manera que la composición de las poblaciones ancestrales se estima al mismo tiempo que la ascendencia de cada aislamiento (véase infra). Alternativamente, es posible asignar los individuos a las poblaciones desde el principio utilizando la Usepopinfo opción y para estimar la ascendencia de los restantes aislamientos condicionada a la cesión fijo. Hemos utilizado esta opción para tratar de identificar las importaciones procedentes de las otras subespecies en enterica (nos TÍFICA aislados por separado para errónea razones, véase § 4]. Cada cepa enterica también se inicializa a su propia población (utilizando el Startatpopinfo opción), pero posteriormente fue permitido tener ascendencia mixta durante la carrera. Tramos de la secuencia que fueron asignados a enterica typhi más con menos del 50% de probabilidad putativo representan las importaciones y se revisaron manualmente. Todo Estructura corre para la Salmonella datos se realizaron con una quemadura en de-10 000 iteraciones y 100 000 posteriores iteraciones.

Hemos sido capaces de detectar sólo dos putativo secuencia de las importaciones procedentes de otras subespecies enterica en 91 genotipos en nuestra muestra. En primer lugar, seis enterica STS (20, 65, 79, 80, 91 y 94) son similares a las secuencias de aroC arizonae, presumiblemente refleja una reciente importación. En segundo lugar, tres STS (65, 81 y 102) contienen un nucleótido en una hisD 330 y hisD 333, mientras que todos los demás poseen enterica STS T y G, respectivamente, en los dos sitios. Interpretamos esta observación ya que la mayoría probablemente, en representación de antiguos polimorfismo, porque la A de nucleótidos es uniforme en todas las otras subespecies y 50 pb de acompañamiento estos nucleótidos en las tres STS eran característicos de enterica. Debido al bajo número de cepas en nuestra muestra de otras subespecies, pero no hemos podido utilizar las mismas herramientas, pero, no obstante, la inspección de los vecinos a participar en los árboles de los siete fragmentos de genes que implica la exportación de enterica a las otras subespecies aparentemente ha ocurrido en una algo mayor frecuencia: dos genotipos de arizonae (STS 55 y 56) y un genotipo de houtenae (ST 57) han enterica alelos-como a la pura y Suca loci, respectivamente.

Sobre la base de las similitudes entre los patrones del modelo (figura 1] y dentro de la secuencia de multilocus datos (figura 3], cada una de las subespecies de Salmonella parece corresponder a un aislado genéticamente las especies biológicas. Podemos construir una secuencia de eventos de especiación, de conformidad con las normas observadas durante nuestras simulaciones, que explica los patrones de diversidad entre los diferentes taxa dentro del género. En esta secuencia, el umbral de la diversidad dentro de una especie que se requiere para precipitar la especiación es de aproximadamente el 2%. En primer lugar, en una fisión binaria caso análogo al observado en la figura 1 a, S. bongori de dividir el ancestro común de cada una de las subespecies. Las distancias genéticas entre S. bongori y cada una de las subespecies son muy similares (tabla 1], en consonancia con reloj-al igual que la divergencia posterior a la especiación. Posteriormente, arizonae división del resto de subespecies en un evento similar.

Las distancias genéticas entre las restantes cinco subespecies (cuadro 1] no son compatibles con un modelo secuencial en ciernes de especiación. Las distancias se inscriben dentro de un rango estrecho (2.9-4.4%), que no permite una ventana de tiempo suficiente para la primera especie que se han convertido en reproductivamente aislados antes de la última especie se inicia a las yemas. Por otra parte, salamae es el vecino más cercano de cada una de las otras subespecies, en consonancia con la evolución observada en una simulación durante un período de tres manera especiación caso (figura 1 b). Por el contrario, secuencial en ciernes debería conducir a los más estrechamente relacionados con el par de subespecies similares niveles de divergencia con todos los demás. Así, las cinco subespecies parece que se han ido distanciando el uno del otro en un múltiplo de especiación. Sin embargo, este análisis está sujeto a la incertidumbre sustancial en efectivo a escala del genoma de las tasas de divergencia sobre la base de datos MLST (véase § 5 para una discusión mas detallada).

El patrón general (figura 3 a) es similar a una instantánea de la diversidad en un solo punto de tomarse el tiempo de nuestra simulaciones con un gran tamaño de la población (por ejemplo, la figura 1 c). Los datos obedecen a las predicciones de un amplio intercambio genético dentro de las especies y el intercambio limitado entre las especies. Además, según nuestra reconstrucción, todos los eventos de especiación implica el ancestro de enterica, en consonancia con la predicción de que diversas especies sólo puede speciate. De este modo, un modelo simple de divergencia neutral con homología dependientes de la recombinación puede explicar las características principales de la variación observada en todo el género.

En nuestras simulaciones, elegimos los parámetros de tal forma que la especiación se produciría en aproximadamente un 2% secuencia de divergencia, aproximadamente a coincidir con el Salmonell una base de datos. De hecho, mediciones de laboratorio muestran aún más fuerte la dependencia de homología. Para los de tipo salvaje cepas, la barrera entre typhi y otra cepa de enterica es demasiado fuerte para permitir la recombinación significativa (Zahrt & Maloy 1997]. Cuando el gen mutS se inutiliza, la recombinación es el aumento de 100 veces, lo cual es comparable a la que se supone en nuestro simulaciones para las cepas con que grado de divergencia (cuadro 1]. De este modo, la mayor parte de la Salmonella en la recombinación puede ocurrir cuando el sistema de reparación desfase se ve perjudicada por genética o de otro tipo ( Matic et al. 2000 ) Factores.

4. ¿Especiación se produzcan dentro de enterica? Una historia ilustrativa

Desde enterica es la más diversa de la subespecie, podríamos preguntar si es la propia speciating y, en caso afirmativo linajes que constituyen la incipiente especies. Los primeros análisis de los datos utilizando un vecino a participar en los árboles de secuencias concatenados y el programa Estructura , Utilizando la agrupación ingenuo, sugirió tres diferentes poblaciones, supuestamente correspondientes a parcialmente aislada reproductivamente los bancos de genes. El primero de ellos consta de un solo linaje, que contiene el patógeno humano typhi, cuyas cepas todos comparten un ancestro común reciente ( Kidgell et al. 2002 ). Typhi es claramente separados del resto de las cepas en el país vecino a participar en árbol, con una distancia genética pairwise del 2%. De acuerdo con la Estructura análisis, es en gran medida typhi reproductivamente aislados de los otros dos. Todos los nucleótidos en typhi se derivan de una única reserva genética (azul en la figura 3 b), que aporta sólo el 7% por término medio a la ascendencia de los restantes enterica. Por otra parte, y también en consonancia con este análisis, las cuotas no typhi alelos idénticos en cualquiera de los siete loci MLST con el resto de las cepas enterica, y es el único linaje con esta propiedad, lo que implica una ausencia de intercambio genético reciente.

La frecuencia de ascendencia de los otros dos putativo los bancos de genes se correlaciona con la tensión si se encuentra en "clade A 'o' clade B 'en la figura 3 ter. Estas reservas genéticas son menos diferentes entre sí que van a typhi de acuerdo con las distancias genéticas observadas y, de hecho, la Estructura análisis sustancial implica el intercambio genético entre ellas. Estos linajes son al parecer en las primeras etapas de especiación.

Si bien este análisis es interesante y sugerente, es completamente incorrecto, al menos en lo que respecta a typhi. La gran distancia genética entre typhi y la otra subespecie se debe enteramente a uno de los siete fragmentos de genes, puro, que es claramente una importación en typhi de otra especie, con la secuencia más estrechamente relacionada con la que se encuentra en indicadores (figura 3 c) . Cuando este gen se elimina fragmento, la distancias genéticas entre typhi y otras cepas son enterica unexceptional. Por otra parte, el análisis genómico de las relaciones genéticas de typhi con otras cepas revela importantes similitudes con paratyphi A, de acuerdo con ambos genes contenido ( McClelland et al. 2004 ) Y la secuencia de datos ( DIDELOT et al. en prensa ). Typhi, sin duda, representa un ecotipo con algunas peculiares e interesantes propiedades, pero no es speciating en este sentido biológico y, en consonancia con la visión tradicional basada en MLEE, es miembro de enterica.

Estos análisis son engañosos, debido a diversas peculiaridades del conjunto de datos. El país vecino a participar en árbol es engañosa, porque da mucho peso a un solo «atípicas» de fragmentos de genes, lo que proporciona poca información sobre la composición genómica de typhi. Un fragmento por fragmento bootstrapping procedimiento han puesto de manifiesto que la larga rama typhi separar del resto de enterica no estaba bien apoyado. El patrón de intercambio alelo sólo proporciona información sobre los últimos (en la escala de tiempo de la tasa de mutación) las relaciones y / o el intercambio genético. La ausencia de alelos compartidos typhi implica que no tiene vecinos inmediatos en el conjunto de datos y no se ha recombinado recientemente en cualquiera de los siete fragmentos de genes, pero dado que esto representa una pequeña muestra en comparación con el genoma y la profundidad del tiempo de evolución dentro de enterica, esta observación es de limitado informativeness typhi acerca de cómo pueden ser diferentes de otros linajes. Estructura asume que cada uno de los aislados no guarda relación en el sentido de que han adquirido sus genomas independientemente de una serie de distintas fuentes ancestrales. De hecho, los cuatro typhi STS en la muestra están estrechamente relacionados entre sí por los recientes ascendencia común. Esta relación clonal, además de la secuencia atípicas, que incluye muchas diferencias entre fijos typhi y las demás cepas, las causas Estructura inferir que typhi representa una clara, recombinación población, cuando en realidad es sólo un clon.

Teniendo en cuenta que cada uno de estos métodos de análisis nos ha llevado a resultados engañosos sobre typhi, se deduce que tenemos que ser muy cuidadosos para llegar a conclusiones sobre la situación de la subdivisión entre clados A y B. Hay una serie de posibilidades. Clade B podría representar una expansión desproporcionada de muestreo o clon, que representa una gran proporción de la STS en la base de datos, pero no es particularmente antiguo, y, por tanto, los clados no han acumulado suficiente mutaciones específicas con el fin de haber adquirido una barrera genética para el intercambio genético . Clade B podría representar un conjunto de cepas que comparten un mismo atípicas de secuencias de genes en uno de los siete fragmentos de genes, pero son de otra manera no especialmente relacionados. Por último, clade B podría representar un viejo y verdaderamente distinto linaje de un entérica que se encuentra en las etapas iniciales de especiación.

Inspección de los vecinos a participar en los árboles (figura 3 c), muestra que no solo gen es responsable de la agrupación así como de las cepas en clade B. Por el contrario, las secuencias típicamente grupo en uno o dos grupos de alelos estrechamente relacionados, que son a menudo también muy estrechamente relacionados con las secuencias en clade A. Ninguna de las secuencias es una de las demás. Por lo tanto, clade B no es, evidentemente, un clon surgido recientemente, ni es una evidente artefacto. Por lo tanto, puede representar el más profundo linaje existentes dentro de S. enterica y también el linaje que es más cercano a speciating, aunque mucho más datos sería necesario para confirmar esta hipótesis.

5. Discusión

Este documento muestra que las especies podrían fronteras, y, sin duda, debe ser definido sobre la base de aislamiento reproductivo en algunos géneros bacterianos. Sección 2 describe un modelo de simulación simple de corto genomas bacterianos, que evolucionan con homología neutral dependiente de recombinación. Habida cuenta de valores apropiados para la tasa de mutación, recombinación, los efectivos de la dependencia y la homología de tamaño efectivo de la población, el modelo conduce a la creación y mantenimiento de distintos, especies reproductivamente aisladas. Dentro de este modelo, existe un considerable fuzzy zona donde las especies fronteras están desarrollando pero no totalmente establecidas, pero por lo demás especies límites pueden ser definidas objetivamente.

Las secciones 3 y 4 de describir un intento de mostrar que el modelo podría explicar el patrón de divergencia y el intercambio en el género Salmonella, como ensayadas por MLST. En muchos aspectos, este intento tiene éxito. Subdivisiones se encontró que son totalmente coherentes con el original de especies y subespecies, tal como se definen límites de MLEE. El patrón de divergencia entre las subespecies es coherente con las más numerosas y, por ende, diversas subespecies, a saber, el antepasado de enterica, speciating en repetidas ocasiones, como predicho por el modelo. Por otra parte, en la subespecie de que tenemos la mayoría de los datos (enterica), hay pruebas sustanciales de las especies dentro de la recombinación. Si esta interpretación de los datos MLST es correcta, ello implicaría que las subespecies son las especies biológicas y por lo tanto, merecen condición de especie propiamente dicha.

Para decidir si esta interpretación es correcta tendrá datos suficientes que un enfoque sistemático fiable tanto se obtiene un resultado coherente en términos de donde la especie se dibujan las fronteras y demuestra que la tendencia histórica de la divergencia y aislamiento reproductivo se inscribe en el cualitativo predicciones del modelo. Estos criterios no se cumplen en el presente estudio. El uso de un ingenuo enfoque basado en MLST y no depender de las especies anteriores definiciones, diferentes métodos de análisis implicaría que typhi es una especie distinta, un resultado que se muestra totalmente espurios y debido principalmente a una sola importación de ADN de otra subespecie que lleva a una atípicamente alto nivel de nucleótidos diferencias con otros enterica en uno de los siete fragmentos MLST. Tampoco está claro, sobre la base de MLST, si una subdivisión adicional en enterica en clados A y B del genoma representa un modelo a escala y si cualquier grado de aislamiento reproductivo se ha desarrollado entre los miembros de los dos clados. Por tanto, no es claro si estos son difusos clados de especies en su camino a speciating, reflejan la presencia de un auténtico pero sin complicaciones dentro de linaje clonal enterica, o son simplemente el resultado de difuminado en los datos debido a la limitada cantidad de ADN investigadas. Las pruebas también se carece en cuanto a si la tasa de recombinación es suficiente para mantener la cohesión de las otras subespecies menos diversos.

En resumen, los datos son coherentes con la existencia de una diversidad umbral para la especiación de Salmonella, con la subespecie en representación de las especies biológicas, pero las pruebas no son concluyentes actualmente. Aunque MLST datos han confirmado y ampliado las observaciones formuladas por MLEE, una vista genómico de relación entre las cepas será necesaria para aplicar plenamente biológicas o otro modelo basado en conceptos de especies de bacterias.

Esta labor fue apoyada por subvenciones de la Wellcome Trust y el Ministerio danés de Alimentación, Agricultura y Pesca y el BBSRC. La presentación de estos resultados se ha visto influida, en particular, por medio de la discusión con Fred Cohan y Brian Spratt, así como el anonimato de los encuestados de una versión anterior del manuscrito. Noel McCarthy y Gil McVean siempre incisivas observaciones sobre la versión actual.