Diferencial de selección y mutación entre dsADN y ssDNA fagos forma la evolución de su porcentaje en genómica
Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.
Genomas bacterianos difieren dramáticamente en AT%. Hemos desarrollado un modelo para mostrar que la genómica AT rápidamente% en la reproducción de especies bacterianas se puede utilizar como un índice de la disponibilidad de nucleótidos A, y T para la replicación del ADN celular en el medio. Este índice es usado para (1) estudiar la evolución y la adaptación de la genómica bacteriófago AT% en respuesta a la diferencial de nucleótidos de la disponibilidad de acogida y (2) la predicción de que los ensayos doble-stranded DNA (dsADN) fagos debe exponer mejor adaptación Que solo varados DNA (ssDNA) fago porque la tasa de deamination espontánea, que conduce a la C o C → T → U mutaciones en función de si C es metiladas o no, es alrededor de 100 veces mayor en ssDNA que en dsADN.
Recuperamos 79 dsADN fagos y 27 ssDNA fagos genomas de acogida junto con sus secuencias genómicas. El dsADN fagos tienen sus genomas AT% mejor adaptado a la acogida genómica AT% que ssDNA fagos. La adaptación de los más pobres ssDNA fagos pueden ser parcialmente explicadas por la C → T (U) mediada por mutaciones espontáneas deamination. Por ssDNA fagos, la genómica A% está más estrechamente relacionada con su anfitrión genómica AT% de la genómica T%.
Una fracción significativa de la variación genómica en el AT% en el dsADN fagos, y que en la genómica A% y T ssDNA% de los fagos, se explica por la diferencia en la selección y mutación entre ellos.
En primer lugar, presentar un modelo simple de la replicación del ADN para demostrar que la genómica AT% de la reproducción de especies bacterianas rápidamente es indicativo de la disponibilidad relativa de los nucleótidos A, y T en la célula bacteriana. Mediante el uso de la genómica AT% de las especies bacterianas como un índice de disponibilidad AT, de estudiar cómo se bacteriófago evolucione en consonancia con el diferencial en la disponibilidad de bacterias en diferentes hosts. Esperamos que la selección natural a favor de la evolución de los genomas de fagos AT% para aprovechar el diferencial en la disponibilidad en diferentes máquinas. En particular, dado que la tasa de deamination espontánea, lo que da lugar a la mutación T → C (C es cuando la metiladas o C → U mutaciones (cuando el C no metiladas), es de 100 veces más altos que en el único varados que en el ADN de doble - Stranded DNA [1], esperamos que la adaptación de los fagos genómica AT% a su anfitrión celular entorno para ser más perturbado por la C → T (U) mutaciones en un solo varados ADN (ssDNA) fagos que en el doble-stranded DNA ( DsADN) fagos.
Designar a la cantidad de dATP, dCTP, dGTP y dTTP disponible para la replicación del ADN como dA V, V dC, y V de V dT, respectivamente. Tenga en cuenta que estos son términos abstractos y que no corresponde a la concentración de dNTPs celular o rNTPs. Supongamos que un solo varados ADN del genoma de longitud L está compuesta por A, C, G, T y con frecuencias N A, C, N, N G T y N, respectivamente (N A + N + C + N G T N L = ). La reacción de polimerización se caracteriza por ser
Donde n • M está a favor de una elongating (o en la propagación de la terminología química) filamento de la DNA con n monómero residuos, M es el monómero, y k p es la constante de propagación. Según la ley de acción de masas, y suponiendo que k p es la misma para añadir cualquiera de los cuatro nucleótidos a la cadena de elongating, la tasa de elongación (r) durante la replicación del ADN puede ser el modelo como
Especies bacterianas a menudo necesitan, y normalmente son seleccionados, de replicar rápidamente. Por ejemplo, E. Coli ilimitada en condiciones de cultivo puede repetir una vez cada 20 minutos. Por lo tanto, es razonable suponer que la selección natural operan en el aumento de r para dichos organismos. Según la ecuación (2), si V dA es el más grande, entonces r se incrementa con el aumento y la disminución de N A N G, C y N N T, con la limitación de N A + N + C + N G T N L = . El máximo se alcanza cuando r N A L y N = C = N = N G T = 0. Esto significa que, a fin de maximizar r diferencial con la disponibilidad de nucleótidos, la genómica de nucleótido de uso debe evolucionar para adaptarse a la disponibilidad de nucleótidos por aumentar al máximo la disponibilidad de uso de los nucleótidos de la más alta disponibilidad. Similares conclusiones han sido también en otros lugares sobre la optimización de derivados a nivel molecular [2].
Uno debe tener en cuenta que el modelo anterior no considera el efecto del diferencial de agotamiento de los nucleótidos. Por ejemplo, considerar la posibilidad de que dA V es el más grande entre los cuatro al inicio de la replicación del ADN. Si una rápida replicación del genoma está hecha de A, entonces A será diferente agotado conduzcan a una reducción de dA V, que, en consecuencia puede llegar a ser más pequeño que V dC, y V de V dT. Esto significa que la replicación de los restantes A-parte rica del genoma sería lento, comprometiendo así la declaración anterior de que "La máxima se alcanza cuando r N A L y N = C = N = N G T = 0". Sin embargo, la conclusión cualitativa de que, si V es mayor que dA V dC, y V de V dT, entonces N debe ser mayor que N G, C y N N T sigue siendo correcta.
Cuando V = V dC de dA = V = V dT = V, entonces la ecuación (2) se convierte en:
De modo que r es independiente de N, N C, G, N, T y N. Esto podría interpretarse en el sentido de que, con la misma disponibilidad de los nucleótidos para la replicación del ADN, no hay ninguna selección en el uso de genómica y genómica de nucleótido de nucleótidos frecuencias pueden variar libremente. Sin embargo, la reproducción de una gran rapidez y elongating AT-ricos genoma Mayo diferencialmente reducir V dC, de V, V dA, y V dT. Por ejemplo, la rápida reproducción de un gran AT-ricos genoma reducirá V dA y V dT y aumentar el tiempo para añadir el resto de A y T a la cadena de elongación. Por lo tanto, incluso con V dC = V de V = dA = V dT = V al comienzo de la reproducción, aún esperamos que la genómica AT% a estar cerca de 50% en lugar de a la fluctuación de los valores extremos.
Para un doble varados genoma donde N = N = N T AT C y N = N = N G CG, la ecuación (2) se convierte en
Si dA V * dT V>> V dC * de V, entonces el aumento de N AT en el genoma aumentará r, con la máxima alcanza cuando r = L N AT y CG N = 0, es decir, el genoma debe evolucionar hacia AT-riqueza. Una vez más, este diferencial no asume el agotamiento de A y T, y debe interpretarse cualitativamente en el sentido de que, con dA V * dT V>> V dC * de V, que debería haber AT N> N CG.
Si dA V * dT = V * V dC de V, entonces se convierte en independiente de r N AT y GC N. Sin embargo, esta vez no significa necesariamente que no hay selección para limitar AT% genómica y genómica AT% que puede variar libremente en consecuencia. Como hemos argumentado anteriormente, una gran rapidez de replicación y AT-ricos genoma se diferencialmente reducir los nucleótidos A, y T y llevar a dA V * dT V <<V dC * V de la cual es desfavorable para la reproducción de un AT-ricos genoma . Así, con dA V dT = V * V * V dC de, esperamos que la genómica AT% a estar cerca de 50% en lugar de a la fluctuación de los valores extremos.
En resumen, esperamos un muy rico GC-genoma bacteriano para indicar alto V dC * de V, extremadamente ricos en AT genoma bacteriano para indicar alta dA V * dT V, y un genoma bacteriano con GC% = 50% para indicar ( DA V * dT V) ≈ (V de V dC *).
Con base en el razonamiento anterior, podemos inferir que las diferentes genómica% EN valores en diferentes especies bacterianas diferentes indican en la disponibilidad en las células de estas especies bacterianas. Mediante el uso de la genómica AT% de las especies bacterianas como un índice de disponibilidad AT, que ahora estudiar cómo bacteriófago genómica GC% evolucionar en respuesta a la disponibilidad de nucleótidos diferentes en diferentes máquinas.
Asumiendo que es beneficioso para los fagos para replicar su genoma rápidamente, podemos hacer dos predicciones comprobables. Primero, un genoma del fago debe evolucionar para convertirse en AT-ricos en una máquina con un alto genómica AT% (indicando V dA * dT V>> V * V dC en el de su celular), y la GC-ricos en una serie con Un bajo genómica AT% (indicando V dA * dT V <<V * V dC en el de su celular). Esto dará lugar a una correlación positiva entre el fago genómica AT% y el de acogida genómica AT%. Esta correlación, de hecho, ha sido conocida durante mucho tiempo [3]. En segundo lugar, porque la tasa de deamination espontánea, que conduce a la C o C → T → U mutaciones en función de si C es metiladas o no, es alrededor de 100 veces más altos que en el ssDNA que en dsADN [1], esperamos que tales mutaciones a Reducido la eficacia de la selección natural para optimizar la genómica AT% de los fagos ssDNA en respuesta a su anfitrión genómica AT%. En particular, con baja disponibilidad de acogida AT, la selección natural debería favorecer la reducción de los fagos genómica AT%, pero el C → T (U) mediada por la mutación espontánea deamination en el ssDNA fagos contrarrestará contra la selección natural y aumentar la genómica AT SsDNA% de los fagos. Además, porque genómica A% T% y puede evolucionar en forma independiente ssDNA fagos, específicamente podemos predecir un aumento de la genómica T% en ssDNA fagos sin un sistema de aumento de la genómica A%. Vamos a prueba estas predicciones.
La relación positiva entre la genómica fagos AT% y su anfitrión genómica AT% se muestra por separado para la dsADN y ssDNA fagos (Fig. 1]. Esta relación positiva en sí es trivial, porque la relación ha sido conocida por casi 40 años [3]. Sin embargo, la diferencia entre el dsADN y ssDNA fagos es científicamente significativo. La línea de regresión para el ssDNA fagos tiene una mayor interceptar y una menor pendiente más que en el dsADN fagos (Fig. 1].
Podemos emplear el modelo lineal general (GLM) para poner a prueba la diferencia estadística de las dos líneas de regresión:
Donde PhageAT y HostAT son AT% de los genomas de fagos y de acogida, respectivamente, y PhageType es de dos categorías (es decir, dsADN y ssDNA) con código binario de una variable ficticia con 0 para ssDNA y 1 para dsADN. Si B 2 y B 3 no son significativamente mayores que 0, entonces no hay diferencia significativa entre las dos líneas de regresión.
Los parámetros del modelo general en la ecuación (5) puede ser evaluado por el procedimiento GLM en SAS [4], que utiliza el método de los mínimos cuadrados para adaptarse a los modelos lineales generales. La resultante B 2 es -10,156 que es estadísticamente significativa (t = 2,83, p = 0,0028). Del mismo modo, B 3 = 0,135, t = 2,04, p = 0,0221. Los demás parámetros son B 0 = 18.503 (t = 6,08, p <0,0001), y B 1 = 0.734 (t = 12,93, p <0,0001)
En vista de los parámetros evaluados en la ecuación (5), las relaciones entre PhageAT y HostAT para dsADN y ssDNA fagos son
El aumento de interceptar y disminución de la pendiente en el ssDNA fagos relativo a la dsADN fagos es fácil de interpretar a la luz de la constatación de que la tasa de deamination espontáneo, que aumenta la C → T (U) tasa de mutación, es alrededor de 100 veces más altos que en SsDNA que en dsADN [1]. Esta espontánea deamination figura de manera prominente entre todos los otros factores que contribuyen a la degradación del ADN [5]. Cuando anfitrión genómica AT% es baja (la extrema izquierda de la Fig. 1], lo que indica una baja disponibilidad de nucleótidos y un celular T en el medio de acuerdo a las ecuaciones (2) y (4), la selección natural debería causar el genoma del fago para reducir sus AT%, pero el C → T (U) mutación mediada por la alta tasa de deamination espontánea en el ssDNA fagos va en contra de la selección natural y el aumento de fagos genómica AT%. En otras palabras, la C → T (U) mutaciones reducir el efecto de la selección natural para empujar el fago genómica AT% la baja. Esto elevaría la interceptar y reducir la pendiente de la regresión para el ssDNA fagos relativo a la línea de regresión para la dsADN fagos.
Tenga en cuenta que el C → T (U) mutaciones actuar en la misma dirección que la selección natural, cuando el anfitrión genómica AT% es alto, lo que indica una alta disponibilidad de nucleótidos y un celular T en el medio de acuerdo a las ecuaciones (2) y (4) . En este caso, la selección natural debería favorecer a los genomas de fagos se AT-ricos, y la C → T (U) mutación mediada por la alta tasa de deamination espontánea en el ssDNA fagos también aumenta fagos AT%, es decir, los dos en el acto Misma dirección. Esta interpretación es coherente con la parte derecha de la Fig. 1 en la que algunos puntos están por debajo de la línea de regresión y con poca dispersión por encima y por debajo de la línea de regresión, especialmente cuando el anfitrión genómica AT% es extremadamente alta.
Para fundamentar aún más esta interpretación, podemos probar si el aumento de interceptar y disminución de la pendiente de la línea de regresión de la ssDNA fagos en la Fig. 1 es realmente debido a un aumento de la genómica T%, en lugar de la genómica AT%. Esto se puede hacer porque un T y no necesitan ser iguales a los demás en número de ssDNA. Esperamos un aumento de genómica T%, pero no un genómica% en el ssDNA fagos. Tal inferencia es coherente con el trazado de la genómica A% T% y por separado para el ssDNA fagos contra el anfitrión AT% (Fig. 2].
Podemos probar la significación estadística de la diferencia entre las dos líneas de regresión en la Fig. 2 utilizando el modelo lineal general similar al enfoque de las ecuaciones (5) y (6). La línea de regresión de la genómica T% tiene un aumento de interceptar significativamente (P = 0,0068, prueba de una cola) y la disminución de la pendiente (P = 0,0323, prueba de una cola). También, la relación entre el fago A% genómica y genómica de acogida AT% es más fuerte que entre los fagos T% genómica y genómica de acogida AT%, con el coeficiente de correlación de Pearson para ser 0,87857 y 0,60249 la antigua para estos últimos.
Los resultados por encima de corroborar nuestra interpretación de que C → T (U) mutaciones contribuir de manera significativa a la relación en la distribución de frecuencias de nucleótidos entre el genoma del fago y el genoma anfitrión. En particular, el aumento de interceptar y disminución de la pendiente de ssDNA fagos en la Fig. 1 puede atribuirse en gran medida a la C → T (U) mediada por mutaciones espontáneas deamination.
El patrón en la Fig. 2, sin embargo, puede tener una explicación alternativa. En primer lugar, es importante señalar que la acogida genómica AT% sólo es indicativo de V dA * V dT. Si V dT es similar en todos los hosts, pero V dA difiere sustancialmente entre los hosts, entonces V dA * V dT también difieren sustancialmente y fagos genómica AT% consiguiente, se seleccionaron de adaptarse al medio ambiente de acogida de los diferentes dA V * V dT. Sin embargo, para ssDNA fagos en este escenario con los anfitriones diferentes tanto en V dA pero poco en V dT, sólo la genómica A%, pero no la genómica T%, de la ssDNA fagos muestra una buena correlación con la acogida genómica AT %. Esto también es coherente con el patrón en la Fig. 2.
La mutación y la selección son los dos escultores de la naturaleza, pero el efecto de la mutación sobre la evolución de los genomas y proteínas es muy poco apreciado [6 - 9], sobre todo después de la labor pionera de Sueoka [10]. El C → T (U) mediada por mutaciones espontáneas deamination [1, 5, 11, 12], en particular, se han invocado para explicar el capítulo de la asimetría en la distribución de frecuencias de nucleótidos en el genoma mitocondrial de vertebrados [13 - 15], en el Genomas bacterianos [16 - 18], y, en la codificación de secuencias [19 - 22]. En este trabajo, hemos mostrado cómo la C → T (U) mutaciones pueden funcionar junto con la selección a dar forma a la genómica AT% de dsADN fagos y de la genómica A% T% y en ssDNA fagos.
Estudios anteriores han demostrado que la mutación espontánea parece ser AT-sesgada en diferentes genomas y las bases genéticas [23 - 26], y la evidencia es convincente basado en la comparación entre genes funcionales y sus homólogos pseudogen [25, 26]. Sin embargo, la frecuencia de mutación por sí sola es insuficiente para explicar la variación genética observada.
Dos tipos diferentes de AT-riqueza se han documentado para genomas mitocondrial solos exigente dos explicaciones diferentes [2]. El primer tipo está representado por (1) el insecto genomas mitocondrial donde la mayoría de los codones finales y con una T, y (2) los mamíferos mitocondrial D-loop, que no es transcrito AT-y muy ricos. Tanto el D-loop y en la tercera posición del codón de codificación de la proteína de los genes evolucionan rápidamente. En el genoma mitocondrial de insectos, el número de A-codones que terminó aproximadamente igual al número de T-poner fin a los codones. En el D-loop, el número de T A, y se distribuyen más o menos por igual en las dos líneas. Este primer tipo de riqueza AT-AT fue atribuido al sesgo de mutación [2]. El segundo tipo de AT-riqueza está representada por la codificación de secuencias de los genomas de vertebrados mitocondrial, donde la mayoría de los codones en cuatro veces degeneran codón familias final, pero con un final con pocas T. Esto no puede explicarse por la mutación hipótesis invocando AT-sesgada mutación Porque tales mutaciones llevaría a aproximadamente el mismo número de A-y que termina T-codones que termina en cuatro veces degeneran codón familias.
El gran número de A-que terminó con pocos codones T-poner fin a los codones en el genoma mitocondrial de mamíferos llevado a la propuesta de la hipótesis de la transcripción de codón de uso [2], basada en la observación de que la concentración celular de ATP es mucho más alta que la de los otros tres RNTPs [2,1 en el cuadro [27 - 29], pp. 4-5]. Por ejemplo, en la exponencial proliferación de fibroblastos de embrión de pollo en la cultura, la concentración de rATP, rCTP, rGTP y rUTP, en unidades de (moles × 10 -12 por 10 6 células), es de 1890, 53, 190, y 130, respectivamente , En 2 horas de la cultura, y 2390, 73, 220, y 180, respectivamente, en 12 horas de la cultura. La hipótesis de la transcripción de codón de uso establece que, con la alta disponibilidad de rATP y relativamente baja disponibilidad de los otros tres rNTPs, la transcripción de eficiencia se puede aumentar por aumentar al máximo la utilización de un codón en la tercera posición de los genes codificantes de proteínas.
La variación de la genómica AT% en el dsADN fagos y de la genómica y la A% T% en el ssDNA fagos, en nuestro estudio, no se puede explicar por la C → T (U) mutaciones solo, y creemos que las correlaciones muestra en la Figs. 1, 2 son principalmente el trabajo de la selección natural favorecer a los ricos fagos AT-AT-ricos en hosts y AT-AT en fagos pobres de los pobres anfitriones. Los datos de ssDNA fagos nos ayudó a la conclusión de que es la C → T (U) mutaciones, en lugar de AT-mutaciones parciales, son los principales responsables por la diferencia entre el ssDNA y dsADN fagos se observa en la Figs. 1, 2. Los resultados de este trabajo corroboran nuestra anterior conclusión [15] que ha espontánea deamination profundo efecto en el capítulo sesgo de nucleótidos y codón distribución de frecuencias y en el codón-anticodon adaptación en otro tipo de intracelular de los genomas, es decir, los genomas de vertebrados mitocondrial.
Los fagos genómica AT% ha evolucionado en respuesta a la disponibilidad de A y T en su célula huésped. En particular, la diferencia en la relación entre el ssDNA fagos dsADN fagos y, en parte, puede explicarse por la diferencia de (1) la selección de funcionamiento a fin de maximizar la tasa de replicación del ADN y (2) la C → T (U) mediada por la mutación La alta tasa de mutaciones espontáneas en el ssDNA fagos.
Hemos descargado completo bacteriófago 79 dsADN genomas de fagos y 27 ssDNA fagos en formato de GenBank NCBI [30]. Frecuencias de nucleótidos y AT% por cada genoma viral se calcula a partir de la secuencia de los archivos de GenBank. El anfitrión de las especies de cada genoma viral se toma del "specific_host" CARACTERÍSTICAS entrada en el cuadro de la secuencia de archivo de fagos [ver archivo adicional 1], y la genómica AT% de la especies huésped se calcula de la siguiente manera.
Si el anfitrión bacteriana es una especie particular de una especie en particular, y si la secuencia genómica de la cepa particular, que está disponible, entonces la genómica AT% fue calculado a partir de la secuencia genómica. Si el "specific_host" no incluye una especificación de la cepa, y si varias cepas de la misma especie bacteriana tiene secuencias genómicas completas, la genómica AT% de las especies huésped es el promedio ponderado de estas secuencias genómicas. Este grupo consta de 82 casos de un total de 118 pares de acogida de fagos-.
Entre el total de 118 pares de fagos-host, 36 casos tienen la bacteria huésped sin un genoma secuenciado completamente. La genómica AT% de estas bacterias se estima alberga secuencias de GenBank recuperado de la siguiente manera. En primer lugar, realizar una búsqueda de la ENTREZ anfitrión nombre de la especie con el límite conjunto de secuencias a la "genómica de ADN / ARN", y con la exclusión de tecnologías ecológicamente racionales, STS, GSSs, y patentado secuencias. En segundo lugar, hemos eliminado todas las secuencias de plásmido en los archivos recuperados. Desde el resto de las secuencias, se puede entonces calcular AT% de las secuencias recuperadas como la media ponderada:
Donde n es el número de secuencias recuperadas para la acogida de especies, Ti A + N es el número de A y T ª de la secuencia i, y L i es la longitud de la secuencia i ª.
Un problema con este cálculo es que algunos genes de la misma bacteriana de acogida se han secuenciado, y depositó varias veces y de la consiguiente P A + T tendería a ser sobre-representados por los genes presentes en múltiples copias. Por ejemplo, entre las 292 secuencias de ADN depositados en GenBank para Acinetobacter sp., 152 son secuencias de rRNA (la mayoría de las secuencias de 16S rRNA), y todas las secuencias depositados en GenBank para Roseobacter sp. RRNA son secuencias. Por esta razón, hemos identificado por primera vez por estos genes BLASTing [31] las secuencias de unos contra otros con E-valor = 0,0001 y calculado por AT% en representación de cada conjunto de genes secuenciados multiplicar por la secuencia de consenso.
Tenga en cuenta que este tratamiento puede todavía sufren de prejuicios. Por ejemplo, las secuencias de ADN de la extrema GC% de los valores (por ejemplo, la GC-extremadamente pobres) pueden ser más difíciles de obtener que los de gama media-GC% de los valores y, por consiguiente, insuficientemente representadas en GenBank. Por este motivo, también hemos elegido la más larga secuencia de ADN de bacterias para cada huésped como genómica muestra. Los dos conjuntos de valores AT%, con un juego calculado como la media ponderada y el otro de la más larga secuencia de GenBank, están altamente correlacionadas (r = 0,975). Las conclusiones alcanzadas en este trabajo sigue siendo el mismo, independientemente de que el conjunto de receptores AT% valores que utilizamos. Presentamos aquí sólo resultados numéricos de representación de cada uno de estos 36 bacteriana anfitriones sin una secuencia genómica por su más larga secuencia de GenBank. También hemos realizado un análisis usando sólo los genomas secuenciados completamente. La secuencia de la recuperación y el análisis se llevaron a cabo mediante el uso de DAMBE [32, 33].
En un estudio comparativo, que no se debe tratar cada bacteriófago o bacteriana de acogida de ofrecer un punto de datos independiente a causa de la ascendencia compartida. Por ejemplo, considere un caso extremo con dos clados bacteriana de los ejércitos, con cada clado de especies que tienen una estrecha relación filogenética y cada infectado por un clado de especies estrechamente relacionadas fagos. Nos han esencialmente sólo dos puntos, cuando en el estudio de la relación entre el AT% bacteriófago y en el de acogida, independientemente del número de especies de bacterias o bacteriófagos alberga especies que tenemos en cada clado. Idealmente, se debería realizar una filogenia basada en la comparación que se hizo antes de que [por ejemplo, [34, 35]]. Lamentablemente, es difícil construir un árbol porque fagos, en tanto que un árbol puede ser reconstruido para la especie bacteriana mediante el uso de genes compartidos universalmente, como secuencias de rRNA, no existe tal secuencia compartida entre especies bacteriófago. Sin embargo, los fagos genómica AT% parece mostrar poca inercia filogenética. Por ejemplo, para los pares de especies bacteriófago (digamos A y B), en nuestro estudio, que comparten homología en la codificación de la proteína de los genes (que indica la afiliación filogenética), la similitud en AT% entre A y B es, en general, más pequeña que la similitud en AT% entre cada uno de ellos y sus respectivas máquinas (es decir, entre la una y la acogida de A y B, y entre la multitud de B). Por esta razón, hemos adoptado una técnica indeseable, pero aproximadamente cierto, asumido poco en la inercia filogenética bacteriófago AT%, con una advertencia para el lector que las probabilidades asociadas a las pruebas de significación puede no ser exacta. Esta hipótesis es un poco justificables sobre la base de la documentación reciente de la falta de inercia filogenética en GC% (o AT%), de los genomas bacterianos [6]. Si hay poca inercia filogenética en los genomas de bacterias, no debe ni mucho menos inercia filogenética en el genoma del fago porque este último evolucionan mucho más rápido que el anterior.
KYY y XX concibió el proyecto. XX obtenido financiación, llevó a cabo el proyecto y redactó el documento. KYY participó en la revisión de cuatro versiones anteriores del manuscrito.
Este estudio cuenta con el apoyo de donaciones de NSERC (Ciencias Naturales y el Consejo de Investigación de Ingeniería de Canadá) 's descubrimiento, el equipo y estratégico de subvenciones y de la Universidad de Ottawa a XX. Damos las gracias a Donal Hickey, Guy Drouin, Gareth Palidwor, y Jason Popescu para comentarios y discusión, y tres revisores anónimos para aclarar una serie de ambigüedades en una versión anterior del documento.