Philosophical Transactions of the Royal Society B: Biological Sciences, 2006; 361(1475): 2039-2044 (más artículos en esta revista)

Modelización bacteriana especiación

La Real Sociedad
William P Hanage, G Brian Spratt, Katherine Turner, ME, Christophe Fraser [*]

Se trata de un libre acceso artículo distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original esté debidamente citados.

Resumen

Un problema central en la comprensión de especiación bacteriana es la forma en racimos de las cepas estrechamente relacionadas con el surgir y persistir en la cara de la recombinación. Usamos una posición neutral Fisher-Wright modelo en el que los genotipos definidos por medio de los alelos en el 140 de casa loci de mantenimiento, el cambio en cada generación por mutación o recombinación, y examinar las condiciones en las que una población uniforme inicialmente da lugar a resolver las agrupaciones. En caso de que la recombinación tiene lugar en frecuencia entre la igualdad de todos los miembros de la población, se observa una transición entre la estructura clonal y sexual como estructura de la tasa de recombinación aumenta. En la situación clonal, claramente resueltas las agrupaciones son regularmente constituido, fragmentación o extinguirse. En la situación sexual, la formación de distintas agrupaciones se vea impedida por la fuerza cohesiva de la recombinación. En caso de que la tasa de recombinación es una disminución de log-lineales función de la distancia genética entre el donante y el receptor cepa, surgen distintas agrupaciones, incluso con altas tasas de recombinación. Estas agrupaciones surgen en la ausencia de la selección, y tienen muchas de las propiedades de las especies, con alta tasas de recombinación sexual y, por tanto, la cohesión dentro de las agrupaciones y las bajas tasas entre las agrupaciones. Distancia escala recombinación puede conducir a una división de la población en distintos grupos genotípica, un proceso que imita simpátricas especiación. Sin embargo, estimaciones empíricas de la relación entre la secuencia de la divergencia y la tasa de recombinación indican que la disminución de la recombinación es un poco empinada función de la distancia genética para generar especies de carácter neutral en virtud de la deriva y, por tanto, que otros mecanismos deben invocarse para explicar la especiación en la presencia de recombinación.

1. Introducción

A pesar de la bien documentada alcance de la transferencia lateral de genes entre los prokaryotes ( Gogarten et al. 2002 ), Lo que ha llevado a algunos investigadores a dudar de si el término "especie" tiene algún significado para estos organismos (Lawrence 2002; Gevers et al. 2005 ), Podemos definir grupos de similar fenotipo o genotipo que a menudo corresponden a las denominadas especies. Sin embargo, estas agrupaciones muestran una variedad de formas, niveles de grupo dentro de la diversidad y el grado de resolución de los grupos vecinos. Esto no debería ser sorprendente, puesto que las bacterias pueden tener muy diferentes estilos de vida y las tasas de recombinación ( Hanage et al. 2006, un ). Sorprendentemente, pocos estudios han abordado las condiciones necesarias para la formación de agrupaciones genotípica, su dinámica o propiedades, lo que podría arrojar luz sobre las razones por las que, incluso en la cara promiscua de la recombinación, podemos definir entidades entre las bacterias que reconocemos como especie ( Hanage et al. 2005, un , b ).

En los últimos años, la capacidad de las secuencias de múltiples casa de mantenimiento de genes para identificar distintos grupos genotípicas entre las poblaciones de especies estrechamente emparentadas se ha explorado. Este enfoque (revisado en otra parte de este volumen; Hanage et al. 2006 b) se basa en el éxito de la secuencia de multilocus escribiendo (MLST), tanto para la caracterización de la cepa exacta en el contexto de la epidemiología ( Hanage et al. 2004 ) Y la aplicación a las especies definición denominado «análisis de secuencias multilocus» (MTAS; Gevers et al. 2005 ). En MLSA, las secuencias de varios (por lo general alrededor de siete) de mantenimiento de la casa están determinados genes, y la concatenates de estos se utilizan para determinar la presencia (o no) de grupos de genotipos relacionados con la secuencia en el espacio, que puede estar relacionado con las especies existentes o usado para informar el proceso de asignación de las especies. Este enfoque ha demostrado que al menos algunas de las especies actualmente reconocidas por microbiólogos son concordantes con las agrupaciones genotípica, incluso cuando un gran número de cepas de recombinación con frecuencia son consideradas especies ( Hanage et al. 2005, un , b ).

Un enfoque complementario consiste en identificar de simulación de las condiciones en las que un principio uniforme población bacteriana diverge y resuelve en distintas agrupaciones genotípica. Si bien gran parte del trabajo previo en este campo se ha concentrado en el papel de periódico barridos en las poblaciones ecológicamente estructurado en la formación de distintos grupos genotípica (ecotipos; Majewski y 1999, un Cohan ; Cohan 2002], que deliberadamente estudiar el comportamiento de los sistemas de deriva neutral. La neutralidad proporciona un modelo de utilidad nula y se determinan las condiciones bajo las cuales los genotipos hacer, o no, forma grupos de resolver en ausencia de selección o subdivisión de la población ( Fraser et al. 2005 ). Además, la neutralidad no es necesariamente una declaración de falta de selección o estructura, sino más bien una descripción eficaz de las situaciones en las que el paisaje evolutivo es muy compleja, y por lo tanto genotipos específicos rara vez son ventajosas durante prolongados períodos de tiempo o espacio. El efecto más persistente de selección o de población que afectan a la subestructura en base neutral especiación modelos pueden ser exploradas.

2. La simulación utilizando las poblaciones de alta resolución multilocus secuencia de mecanografía

En MLST, fragmentos de interior (aproximadamente 500 bp) de siete de mantenimiento de la casa son los genes secuenciados de cada cepa ( Maiden et al. 1998 ). Las diferentes secuencias en cada lugar se les asignan números diferentes alelos y cada cepa se define por una cadena de siete enteros (el perfil alélica), correspondientes a los alelos en siete loci. MLST grandes conjuntos de datos están disponibles para varias especies bacterianas, y hemos descrito una población genética modelo que puede aplicarse a esta rica fuente de datos ( Fraser et al. 2005 ; Hanage et al. 2006 a).

Este Fisher-Wright neutral modelo de evolución bacteriana define los genotipos de las cepas de la misma manera que MLST, de los alelos presentes en la casa siete loci. Multilocus genotipos en la generación n +1 del modelo neutral se tomaron muestras al azar de la generación n, con los distintos lugares especificados en el cambio de punto las tasas de mutación o recombinación. La solución analítica para la distribución de espera alélica desajustes de genotipos multilocus en equilibrio para cualquier mutación y recombinación tipo de modelo permite que estos parámetros se calcula a partir de muestras reales de la población bacteriana se caracteriza por MLST ( Fraser et al. 2005 ). También podemos simular poblaciones bacterianas de los valores de la mutación y recombinación tasas. Para explorar la especiación, hemos aumentado el número de loci que definen cada cepa de 7 a 140, ya que esto constituye un gran aumento de la capacidad de discriminar entre las cepas. Nuestra opción para el número de loci, así como una estructura alélica en lugar de plena genotipo simulaciones fueron motivados por el objetivo de extender los modelos de forma sustancial en términos de tamaño de la población y la discriminación entre los genotipos, y fueron delimitadas por las limitaciones computacionales. La simulación de la evolución de las poblaciones con cepas definidas por grandes alélica perfiles en lugar de plena secuencias para un limitado número de alelos fue la hipótesis de limitar los efectos distorsionadores de la recombinación genética en la evaluación de la distancia entre las diferentes cepas.

Estamos simular poblaciones de tamaño constante (10 6), con cada cepa se define como una cadena de enteros correspondientes a los alelos en 140 loci (cada uno de 500 pb) distribuidos en todo el cromosoma. En cada generación del modelo, loci mutar con probabilidad m y recombinarse con probabilidad r, tal como está descrita anteriormente ( Fraser et al. 2005 ). Asumimos una infinita alelos modelo en el que cada mutación genera un alelo que no se registran en la población. En el caso límite de la plena panmixis, modelo que sustituye a la recombinación como el alelo en un solo lugar con otro al azar de la población. Consideramos que la recombinación a ser igualmente probables en cualquiera de los 140 loci. Por analogía con θ (la tasa de mutación población), definimos la tasa de recombinación población ρ = 2 RN.

Con el fin de simular el efecto de la secuencia de divergencia sobre la probabilidad de éxito de recombinación (a distancia a escala recombinación), usamos el alélica distancia entre la cepa que dona el alelo y la cepa receptora (la proporción de diferencias alélica en los 140 loci) un proxy para la secuencia de divergencia entre las cepas. La probabilidad de recombinación con éxito en la distancia de recombinación modelo a escala disminuye en un diario de forma lineal con el aumento de la divergencia entre donante y receptor cepas, tal como se ha constatado ser el caso de Bacillus subtilis ( Majewski & Cohan 1999 b ), Escherichia coli ( Vulic et al. 1997 ) Y Streptococcus pneumoniae ( Majewski et al. 2000 ). Si bien en estos casos el grado de divergencia local entre donante y receptor secuencias determina la probabilidad de recombinación con éxito, debido al alto nivel de discriminación que ofrece el gran número de loci estudiados sostenemos que nuestro modelo basado en la inadecuación de los perfiles en alélica capta esta relación en un sentido probabilístico.

A partir de un principio uniforme población de 10 6, que permite la simulación a correr. A intervalos, las muestras de 1000 cepas se extraen al azar y se utilizan para examinar las características genotípicas de la agrupación. Para mostrar el agrupamiento de genotipos en las muestras de las poblaciones simuladas (la cartografía genética), usamos un escalamiento multidimensional (MDS) algoritmo ejecutado en I (Venables y Ripley, 2002; Team 2005], lo que representa en dos dimensiones la distancia genética global entre cada cepa y todas las demás partes de la población.

3. Clonal poblaciones y la creciente influencia de la recombinación

Las contribuciones relativas de punto de mutación y recombinación a la divergencia de genotipos multilocus difieren mucho entre las poblaciones bacterianas (Feil y Spratt, 2001]. En algunas especies, como el Mycobacterium tuberculosis, pruebas convincentes de la recombinación y se carece de genotipos difieren exclusivamente (o casi) de mutación ( Smith et al. 2003 ). En el otro extremo, en algunas poblaciones, alelos en casa loci de mantenimiento de cambio con mucha más frecuencia de recombinación de mutación puntual ( Spratt et al. 2001 ; Hanage et al. 2006 a). Por lo tanto, estudiar los patrones de agrupamiento observado en la evolución de las poblaciones simuladas con una población fija tasa de mutación = 2) y una gama de la población las tasas de recombinación, de ρ = 0 (clonal) a 20. En las primeras simulaciones, la recombinación tiene lugar al mismo tipo definido entre cualquier par de cepas. A continuación, introducir la hipótesis más plausible de la distancia en escala de recombinación, incorporando el diario de reducción lineal en la tasa de recombinación con el aumento de la divergencia entre las cepas.

La Figura 1 muestra los grupos obtenidos mediante MDS para extraer muestras de población cada 2,5 × 10 5 generaciones de una población clonal con θ = 2. La diversificación de la población inicialmente uniforme en ausencia de recombinación lleva dentro de aproximadamente 250 000 generaciones distintas agrupaciones de cepas estrechamente relacionadas. El grupo inicial persiste, sino a través de deriva estocástico se ha extinguido por la generación de 800 000a. Si introducimos la recombinación al mismo ritmo que la mutación = 2, ρ = 2), entonces la diversificación de producto como en la simulación totalmente clonal, con múltiples distintas agrupaciones emergentes (figura 2]. Bajo condiciones de mucho mayor tasas de recombinación = 2, ρ = 20; figura 3], transitorios difusa grupos de cepas aún surgen, pero que no se hayan establecido como resolver distintas agrupaciones, que se está elaborando de nuevo en el principal grupo de recombinación con los demás cepas en la población. La dinámica clonal de la agrupación y la cohesión efectos de la recombinación se puede observar más claramente en las películas en la electrónica, material suplementario.

4. El efecto de la distancia en escala de recombinación

La figura 4 muestra el efecto de la introducción de un log-lineales disminución en la probabilidad de recombinación con el aumento general alélica distancia. Para todas las cepas θ = 2, y la probabilidad de recombinación que ocurre entre las cepas idénticas es muy alta 0 = 50). La probabilidad de recombinación que ocurre entre las cepas con alélica distancia D viene dada por ρ ρ = 0 exp [- α D] y la consiguiente relación entre ρ y alélica distancia se muestra en la figura 4 bis, correspondiente a α = 0,1. Como se muestra en la figura 4 b (y una película en la electrónica, material suplementario), el grupo inicialmente uniforme rápidamente formas distintas agrupaciones, que luego continúe a diversificar y formar nuevos grupos de un mismo proceso. Entre las cepas similares dentro de estos distintos grupos, la tasa de recombinación es alta (figura 4 a). Entre las cepas en las diferentes agrupaciones es baja, debido a la log-lineales de bajada de la recombinación genética con la distancia. La integridad de las agrupaciones Así pues, se mantiene frecuentes de recombinación. Los principales nuevos grupos rara vez se forman, como estocásticos deriva con poca frecuencia conduce a la creación de nuevas cepas que son lo suficientemente distante de la agrupación de progenitores que ya no puede ser reabsorbido por la recombinación. El número de estas agrupaciones, presumiblemente, los aumentos monotonically como una función de θ.

5. Dinámica de la formación de grandes conglomerados

Figura 5 muestra una forma alternativa de mostrar la formación y la dinámica de la aparición y persistencia en el tiempo genotípica de las agrupaciones en las hipótesis descritas anteriormente. En esta representación, el cambio a lo largo del tiempo la proporción de pares de cepas diferentes a n de 140 loci se muestra para toda la población de 10 6 (en contraposición a las muestras de 1000). Este análisis no es capaz de detectar el menor transitoria grupos visibles en el MDS diagramas, sino que se centra en los principales linajes de cepas similares. Figura 5 una muestra el desarrollo clonal de la población se muestra en la figura 1. El grupo inicial de los fragmentos y rápidamente se extingue antes del final de la simulación. Sin embargo, por entonces, la población se compone principalmente de un grupo hija, que es ligeramente menos diversa. Con altas tasas de recombinación = 2, ρ = 20), claro agrupaciones no a la forma, y la población resultante es lugar muy diversas y difusas (que se muestra por la banda ancha en la figura 5 b, lo que indica que la mayoría de las cepas cuota de sólo alrededor de la mitad sus alelos con la mayoría de los otros en la población). El efecto de la distancia en escala de recombinación (figura 5 c) es claramente visible en las múltiples agrupaciones que resolverse emerge.

6. Discusión

Si bien la satisfacción de cualquier definición de especies bacterianas sigue siendo difícil de alcanzar, el presente trabajo se demuestra que distintos grupos de genotipos similares pueden surgir en virtud de muchos valores de los parámetros para ambos mutación y recombinación tasas. Distintos grupos no surgen donde hay altos niveles de recombinación entre las cepas, sin disminución, o de un lento declive, en la probabilidad de recombinación genética con el aumento de distancia. En esta situación, subclusters parecen surgir, pero se señala de nuevo en la principal población, presumiblemente debido al efecto cohesivo de recombinación. En cambio, cuando disminuye drásticamente la recombinación con el aumento de distancia genética, surgen distintas agrupaciones y, a continuación, se mantienen a distancia de recombinación a escala de las altas tasas de recombinación dentro de cada grupo y las bajas tasas entre los diferentes grupos. En este escenario, las agrupaciones surgen aun cuando las tasas de recombinación entre cepas similares son sustancialmente más elevados que los que impiden que las agrupaciones de nuevas simulaciones en donde la tasa de recombinación no se adaptan a distancia genética. Estas distintas agrupaciones son efectivamente "especie", y la función cohesiva de recombinación dentro de un grupo, y las bajas tasas entre las agrupaciones, ofrece una atractiva forma paralela a la especie biológica concepto de Mayr (1942].

Estimaciones empíricas de la relación entre la distancia genética y la tasa de recombinación (r) se determinará en términos de secuencia de divergencia (x) y son de la forma log (r) r = 0 -18 x ( Majewski & Cohan 1999 b ; Majewski et al. 2000 ), Lo que indica una disminución relativamente lento como una función de distancia genética. Aún es necesario referirse a este alélica el modelo utilizado aquí, pero un simple argumento se puede utilizar para ver que la reducción de la tasa de recombinación con distancia genética (diferencia) hemos utilizado para generar las agrupaciones es mucho más nítida que esto empíricamente determinado. Linearizing de la probabilidad binomial para la secuencia de identidad sobre la base de polimorfismos repartidos al azar, permite inferir que DLx, donde L es la longitud total de comparación de secuencias. De este modo, el grado de divergencia secuencia debe ser muy baja, excepto cuando muy pocos alelos coinciden en absoluto, y el grado de recombinación debe ser casi igual al que entre las secuencias idénticas.

En virtud de la deriva neutral, por lo tanto, no predicen la especiación en poblaciones simpátricas con altas tasas de recombinación, a menos que la determinada empíricamente reducción en la tasa de recombinación con la secuencia de divergencia es mucho más pronunciado que el que ha sido reportado. Sobre la base de la supuesta relación ( Majewski & Cohan 1999 b ; Majewski et al. 2000 ), Esperamos que la distancia en escala de recombinación para reforzar y mantener las separaciones genéticos que son inicialmente creados por allopatry o nicho de diferenciación, pero no para generarlos.

A falta de recombinación, o cuando la recombinación es menos frecuente que la mutación, un umbral se cruza y la estructura de la población es eficaz en lugar clonal, con las agrupaciones emergentes como consecuencia de la divergencia sin obligarse (Cohan 2002] y estocástico pérdida de genotipos intermedios. Estos grupos no son producidos por el mismo mecanismo, y por lo tanto no corresponden a la definición misma especie como en el caso de la distancia en escala de recombinación.

Los tipos con los procesos que aquí se inspira en la naturaleza no están claras. En las simulaciones neutral, podemos observar la generación de veces en que parecen resueltas las agrupaciones, pero la generación de longitud es un concepto difícil de prokaryotes. No sólo las tasas de Mayo de la división celular varían mucho en función de acceso a los nutrientes, pero esto puede no ser el pertinente tiempo de generación. En algunas circunstancias, puede resultar conveniente considerar varias bacterias como una sola 'soma': por ejemplo, en el caso de una colonia de bacterias en la garganta de un host o una colonia de levadura en la corteza de un árbol ( Koufopanou et al. 2006 ). El tiempo de generación puede ser una mejor idea de como el tiempo transcurrido entre la colonización de nuevos huéspedes o sitios web.

Otra característica de los grupos que observamos es su carácter dinámico. En todas las simulaciones, las agrupaciones surgen y se extinguieron, pero hay considerable variación en el timespans implicados. En estas simulaciones, las agrupaciones compiten entre sí y dar lugar a extinciones estocásticos, mientras que en poblaciones reales distintivo ecológico que surjan entre las agrupaciones se espera que tenga un gran impacto en su capacidad relativa de las tasas de extinción. Un problema que surge de la dinámica observada es que cualquier estudio transversal de una población real es probable que identificar las agrupaciones. No hay manera fácil de distinguir si dos (o más) grupos observados dentro de una muestra natural de la población y definir las agrupaciones que están destinados a seguir siendo distintos y que deben, cada uno por designación determinada especie, o son transitorios y destinada a fusionar de nuevo en una sola grupo, o son la consecuencia de la falta de toma de muestras.

Recombinación se cree que a menudo implican la sustitución de las pequeñas regiones (unos kilobases) de un destinatario cromosoma con la correspondiente región de un donante cepa. Una advertencia importante de nuestras simulaciones es que los estudios de las poblaciones naturales, y las características generales de Reca mediada por recombinación, sugieren que la tasa de recombinación dependerá de la secuencia local similitudes entre el donante y el receptor cepas en las regiones que participan en la genética localizada Intercambio. En este trabajo, suponemos que la recombinación es una función de la cantidad total de distancia genética, medida como la proporción de los 140 alelos que difieren entre las cepas. Hemos elegido este como nuestro planteamiento inicial, como procesos informáticos que permite un examen de las grandes poblaciones se define a un gran número de alelos. Evolución reciente de nuestra simulaciones incorporando las medidas locales de distancia genética se describen en otros lugares. Nuestra observación de un umbral de la recombinación, situadas entre ρ / θ = 1 y ρ / θ = 10 para las situaciones en las que la recombinación no es distancia de dimensión, por encima del cual la población se mantiene la cohesión y por debajo de la cual emerge clonal agrupaciones, no depende de este supuesto. Curiosamente, Falush et al. (2006) presente una simulación utilizando las medidas locales de distancia genética, que muestra patrones similares de la agrupación y «especiación», aunque diría que (como en nuestro simulaciones) especiación en las tasas de recombinación de alta sólo es observada en sus simulaciones en condiciones en las que la tasa de recombinación reduce con la secuencia de divergencia mucho más pronunciada que se encuentran en estudios empíricos.

Las bacterias que existen diversas poblaciones que pueden resolverse en grupos que pueden ser asignados a varias divisiones de taxonomía (linajes, las especies, géneros, etc.) El estudio de estas poblaciones y su taxonomía se puede mejorar por la aplicación generalizada de métodos de secuenciación multilocus, con la perspectiva de las futuras tecnologías de secuenciación haciendo cada vez más factible secuencia de cientos de miles de genes de las cepas. Dentro de este contexto, es importante que tengamos algunos teóricos medios de describir lo que esperamos observar en la naturaleza, de interpretar lo que observamos, y la integración de estos hallazgos con la biología y ecología de los organismos en estudio. La labor futura debería abordar las repercusiones de la selección y la subdivisión de la población (o allopatry) sobre la naturaleza y la dinámica de genotípica agrupación, así como mejores modelos de distancia genética, y debe explícitamente intento de comparar los grupos derivados de la simulación con los observados entre los naturales poblaciones.

Esta labor fue apoyada por subvenciones de la Wellcome Trust (WPH, KMET, BGS) y una Real Sociedad de Investigación de la Universidad de Becas (CF).