Genome Biology, 2005; 6(5): R41-R41 (más artículos en esta revista)

Genoma escala de pruebas el nematodo de artrópodos clado

BioMed Central
Hernán Dopazo (hdopazo@ochoa.fib.es) [1], Joaquín Dopazo (jdopazo@ochoa.fib.es) [2]
[1] Pharmacogenomics and Comparative Genomics Unit, Bioinformatics Department, Centro de Investigación Príncipe Felipe, Autopista del Saler 16, 46013 Valencia, Spain
[2] Functional Genomics Unit, Bioinformatics Department, Centro de Investigación Príncipe Felipe, Autopista del Saler 16, 46013 Valencia, Spain
[3] Functional Genomics Node, INB, Centro de Investigación Príncipe Felipe, Autopista del Saler 16, 46013 Valencia, Spain

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen

El análisis filogenético más amplia realizada hasta la fecha, incluidos 11 genomas completos, se muestra el apoyo a la Ecdysozoa hipótesis en el debate de composición abierta encargado de la Coelomata-Ecdysozoa problema evolutivo.

Antecedentes

La comprensión de la evolución de la gran diversidad de la vida es un objetivo de mayor importancia en la biología. A pesar de décadas de esfuerzos por systematists, relaciones evolutivas entre los grupos principales de animales aún siguen sin resolverse. La incapacidad de los taxones en el grupo monofilético grupos fue originalmente debido a la falta de synapomorphies morfológicas entre phyla. Una solución alternativa vinieron de la embriología, la sistemática y de los animales se basó en criterios basados en el aumento de la complejidad de cuerpo plan [1]. Así, la tradicional metazoos filogenia de los grupos de animales más simples basal con formas sueltas de tejidos organización (por ejemplo, esponjas) a los que tenga dos capas germinales (dipoblastic animales, por ejemplo cnidarians), y los que en desarrollo de las tres capas germinales (triploblastic animales, tales Como el Multimedia - de los animales con simetría bilateral). Bilaterales animales fueron ordenados en los que carecen de un coelom (la acoelomates, como platyhelminths), los que tienen una falsa coelom (la pseudocoelomates, como los nematodos), y, finalmente, los animales con un verdadero coelom (la Coelomata, como los artrópodos Y cordados). Esta comparativa de desarrollo de la teoría de la evolución animal animal dominado la sistemática durante más de 50 años [2].

Posteriormente, estudios de sistemática molecular basada en la subunidad pequeña del RNA ribosomal (18S rRNA) secuencias comenzaron a socavar este escenario [1]. Ponga brevemente, la nueva filogenia animal sugiere que clados como acoelomates y pseudocoelomates sistemática de los grupos son artificiales. Por otra parte, si bien la designación coelomate sigue siendo, este clado contiene ahora dos nuevos linajes: la lophotrochozoa y la Ecdysozoa [3]. El 'Ecdysozoa hipótesis' postula que todos los phyla compuesto de los animales que crecen por una muda cuticular exoskeleton (como artrópodos y nematodos) proceden de un antepasado común, formando de esta manera un clado. Así, bajo la hipótesis de Ecdysozoa artrópodos son genéticamente más estrechamente relacionados con los nematodos que a los cordados. En virtud de la 'Coelomata hipótesis' de la evolución animal, sin embargo, los artrópodos se parece mucho más a cordados que a los nematodos.

En el centro de este debate sistemático, un debate técnico surgido en torno a la larga rama efecto de atracción (LBAE), taxón de muestreo, y el número de caracteres utilizados. Posteriores estudios morfológicos y moleculares se han llevado a cabo, pero sigue sin resolverse la controversia y se presenta como un multifurcation [4]. Aunque el uso de diferentes secuencias de genes solo apoya la hipótesis de Ecdysozoa [5 - 11], el análisis de decenas a centenares de secuencias concatenadas apoya la Coelomata clado [12 - 15]. De hecho, con un elemento de cautela, a favor de la hipótesis de Coelomata en un anterior estudio de todo el genoma diseñado para determinar el número de caracteres necesarios para obtener una topología fiable [16]. El gen basados en el genoma Ecdysozoa versus escala Coelomata hipótesis alternativas fueron recientemente impugnados por dos phylogenomics estudios que en parte apoyó la Ecdysozoa clado [17] y un grupo paraphyletic Coelomata [18]. Aunque se acepta generalmente que el análisis filogenético de genomas su conjunto ha comenzado a complementar (y en algunos casos mejorar) los estudios filogenéticos que anteriormente llevaba a cabo con uno o unos pocos genes [19], todo el genoma a escala filogenética estudios no han podido apoyar la propuesta Nueva filogenia animal.

Aquí presentamos la primera phylogenomic pruebas de que apoya firmemente la hipótesis de Ecdysozoa y al mismo tiempo demuestra que el LBAE sesgos la posición de Caenorhabditis elegans en el árbol filogenético. Nos muestran que mediante el uso de un gran número de personajes y la elección de un esquema filogenético ponderada de grupos externos a la prueba de la constancia de las tasas de evolución, la nueva filogenia animal puede ser estadística. Además, nos muestran que tanto la Coelomata y la Ecdysozoa hipótesis pueden ser apoyados con la más alta confianza estadística de datos genómicos cuando están ordenados de acuerdo con un aumento gradual de ajuste a la igualdad entre las tasas de evolución C. Elegans y Drosophila melanogaster secuencias. En una situación intermedia, ni Ecdysozoa ni Coelomata eran suficientemente apoyado. A nuestro entender, este es el más extenso phylogenomic análisis realizado hasta la fecha en el número de caracteres y el número de especies eucariotas involucrados.

Resultados
Dataset propiedades

Secuencias homólogas a las secuencias de exón humanos se derivan de tblastn filtrado de los resultados de la búsqueda, el 11 de completar genomas eucarióticos. Debido a que la mayoría de críticas-en la solución de la cuestión Ecdysozoa-Coelomata problema parece ser el LBAE producida por el nematodo de las especies, se decidió reorganizar las secuencias homólogas en una serie de conjuntos de datos anidados que redujo gradualmente LBAE. Alineados secuencias homólogas se organizaron en ocho conjuntos de datos (D i) y concatenados en sus correspondientes matrices (M i) (ver Materiales y métodos), de modo que como sufijo i aumenta, y las matrices de datos integrada por un número menor de secuencias homólogas que muestra más similar relativa Rama longitudes (RBL) entre C. Elegans (Ce L) y D. Melanogaster (L Dm) (Figura 1]. RBL humanos las distancias son relativas.

Para cuantificar el efecto en el RBL de C. Elegans alternativa de concatenar secuencias homólogas, de máxima verosimilitud (ML) calcula la longitud de la rama se obtuvieron usando las estrellas-como unrooted árbol de la transformación para cada conjunto de datos (ver Materiales y métodos). Figura 2a muestra que el RBL de C. D. elegans más Melanogaster disminuyeron aproximadamente un 30% del conjunto de datos continuamente D 1 a D 8. Para probar si la disminución gradual en C. Elegans rama duración fue suficiente para producir estadísticas sobre la confianza de la igualdad de las tasas de evolución entre el nematodo y secuencias de los artrópodos, con pruebas, con ayuda de dos regímenes de afuera se analizaron las secuencias en concatenados (ver Materiales y métodos). Figura 2b muestra que la utilización de Saccharomyces cerevisiae como el único grupo afuera especies (OUG1), todas las pruebas individuales en las ocho matrices no detectar desviaciones estadísticas (en el 5% a nivel familiar modo) entre secuencias. Sólo cuando el régimen de filogenéticamente ponderado afuera de las especies (OUG2) no se utilizó la prueba de detección de la tasa relativa significativa desviación de la conducta de reloj de D 1 a D 5 conjuntos de datos. Estamos, por lo tanto, confía en que la artrópodos y nematodos concatenados secuencias de la M 6, M 7, y 8 M satisfacer las matrices deseado reloj condiciones similares a la prueba Coelomata y Ecdysozoa excluye ninguna hipótesis y artefactos derivados de una posible LBAE. Este resultado apoya el trabajo previo que sugiere que la distancia genética entre ingroup y afuera modifica el poder de la tasa relativa de ensayo [20].

Para probar si concatenados matrices de llevar suficiente señal filogenética, la ML cartografía se ha utilizado el método. El compuesto posterior punto de probabilidad (P) de todas las posibles cuartetos de cada matriz M i podría ser, casi con valores equivalentes (aproximadamente 33%), zonas en el interior de la esquina del triángulo equilátero probabilidad de superficie (véase el archivo de datos adicional 1]. Así, concatenados matrices de derivados de la selección de un número diferente de las secuencias homólogas contenía suficientes para representar a la señal filogenética topologías como estrictamente bifurcating árboles. Por último, utilizando el criterio de información de Akaike (AIC) [21], la prueba estadística de las más apropiado modelo de secuencia de evolución para cada conjunto de datos seleccionados a partir de seis diferentes alternativas (ver Materiales y métodos). Como todos los modelos están anidados y no comparten el mismo número de parámetros, el mejor fue que con la mayor probabilidad de acceder resultado. El WAG aminoácidos de sustitución de la matriz [22] para ajustar las frecuencias (H +), tasa de heterogeneidad (+ Γ) e invariable sitios (+ I) es el mejor modelo evolutivo elegido para todos los conjuntos de datos. Además, el modelo de ajuste de los valores de datos siguió el mismo independientemente de la desigualdad de datos (WAG [22]> VT [23]> BLOSUM62 [24]> JTT [25]> PAM [26]> mtREV24 [27 ]), Lo que sugiere que los mejores modelos son los que consideran más alejadas secuencias de aminoácidos.

El clado Coelomata desaparece bajo las condiciones de reloj

Distancia y ML filogenético métodos se utilizaron en todos los conjuntos de datos (ver Materiales y métodos). La Figura 3 muestra reconstrucciones filogenéticas y el apoyo estadístico de las dos condiciones extremas de los conjuntos de datos anidados. Considerando que la matriz M 1 apoya la Coelomata árbol con la más alta confianza estadística, M 8 mostraron el mismo resultado para el Ecdysozoa árbol. Por lo tanto, al disminuir la RBL de C. Elegans, el apoyo estadístico pasado de la Coelomata a la Ecdysozoa hipótesis. La figura 4 muestra que, el que se ha utilizado el método filogenético, C. Elegans arranque apoyo entre los conjuntos de datos y topologías cambiado de acuerdo con el decremento gradual RBL. En concreto, utilizando M 1 y M 8 (las matrices que muestra la tasa de evolución más extremas condiciones de C. elegans D. melanogaster y secuencias - de un reloj-ausente más ajustado a la conducta), el apoyo estadístico se trasladó de Coelomata a Ecdysozoa. Lo mismo ocurrió con H 2 y H 7. Como alternativa, utilizando M 3 M y 6, sólo uno de los dos métodos de la distancia y el ML (Figura 4 a, b] proporcionó apoyo suficiente (90% o más) a la hipótesis. Por último, utilizando M 4 yM 5, sólo un método a distancia apoyado Coelomata y Ecdysozoa con confianza. Dado que los datos difieren principalmente en el RBL de C. D. elegans más Melanogaster, el gradual cambio en la topología de firmeza favorece un LBAE entre C. Elegans y la especie más basal. Para probar si un par de sitios de prueba [28] apoya las conclusiones de arranque, Shimodaira-Hasegawa (SH) y espera de probabilidad peso (ELW) las pruebas que se evaluaron en las bases de datos (ver Materiales y métodos).

Figura 5 muestra la evaluación de dos a dos sitios de las pruebas de los dos árboles en todos los conjuntos de datos. Con dos sitios de pruebas con topologías (p> 0,05) casi cambiado gradualmente en bases de datos. Figura 5a y 5b muestran que la SH es prueba más conservadora que la ELW [29]. El uso de matrices de M 1 y M 2, ambas pruebas rechazado enérgicamente la hipótesis de Ecdysozoa, mientras que M 6, M 7, y 8 M rechazó la Coelomata árbol. Curiosamente, los conjuntos de datos entre ellos no rechazar cualquier topología con suficientes pruebas estadísticas. Podemos concluir que al disminuir la RBL de C. D. elegans más Melanogaster en torno al 13% (Figura 2a] el LBAE favoreciendo la hipótesis Coelomata desaparece y podemos confirmar que bajo condiciones estrictas de comportamiento como el reloj-, la hipótesis Coelomata fue firmemente rechazada por dos a dos sitios de las pruebas de arranque y apoyo.

Para probar si la brevedad de la distancia evolutiva entre C. Elegans y D. Melanogaster como consecuencia de lo anterior método de filtración sesgada topología más de la ascendencia común de los artrópodos y nemátodos, se realizaron búsquedas de chordate, artrópodos, nematodos y secuencias que muestran el comportamiento de reloj-como entre ellos. Para aumentar la probabilidad de encontrar secuencias que se adecue a los criterios, que se centró en las secuencias de los más estrechamente relacionados chordate muda a la especie, es decir, la ascidia Ciona intestinalis. Sólo el 14 secuencias de exón se reunió los criterios mencionados. Un familiar tipo test mostró que la probabilidad de un perfecto reloj-al igual que el comportamiento fue de p = 0,515 C. Elegans y D. Melanogaster, p = 0,308 para la C. Intestinalis y D. Melanogaster y p = 0,712 para la C. Intestinalis y C. Elegans. El método de asignación ML mostró que la concatenación de todos los 810 caracteres llevadas suficiente señal filogenética en la matriz para representar a un árbol estrictamente bifurcating (véase el archivo de datos adicionales 2). A pesar del reducido número de caracteres, el análisis filogenético mostró un apoyo importante para la hipótesis de Ecdysozoa. El uso de la distancia y ML métodos, los valores de arranque a que se había llegado al 97%. Además, la Ecdysozoa hipótesis fue aceptada con una probabilidad de p = 1,00 y p = 0,997 cuando SH y ELW dos a dos sitios de las pruebas, respectivamente, se realizaron. Por el contrario, la hipótesis fue rechazada Coelomata en p = 0,006 yp = 0,0023, respectivamente.

El clado Coelomata desaparece mediante la eliminación rápida evolución de las secuencias de C. Elegans

Con el fin de descartar un probable sesgo de selección de las secuencias del exón Ecdysozoa favor de la hipótesis, otros dos matrices fueron construidas por la eliminación del conjunto de datos original (D 1) los exones en la que la C. Elegans secuencias evolucionado a un ritmo más rápido. Figura 6 muestra que mediante la eliminación de los más rápidos del 15% del total de exón secuencias de la fiabilidad de las hipótesis Coelomata se redujo de 100% a 78%. Por otra parte, cuando el 30% más rápido de todos los exones se eliminaron, los cambios en la topología de Ecdysozoa con un 90% de nivel de confianza. El cambio de topología en paralelo con la reducción de la C. Elegans rama longitud apunta a la LBAE como el principal obstáculo para la obtención de la verdadera relación filogenética entre cordados, artrópodos y nematodos. Llegamos a la conclusión de que la hipótesis de Ecdysozoa no depende de la adaptación de un conjunto particular de las secuencias homólogas a exón reloj-como comportamiento.

Discusión

Hay muchas razones por las que el Coelomata-Ecdysozoa problema debe considerarse la más desconcertante problema de la sistemática de los animales y un importante tema de composición abierta en la biología evolutiva. La monofilia de los Ecdysozoa grupo, un gran impulso por la evo-devo comunidad [30], se deduce un principio, y continuamente se recuperó, a través del análisis de diferentes secuencias de un único gen [3, 5, 6, 8 - 11], a veces en Combinación con caracteres morfológicos [7]. Existe la necesidad de cautela, sin embargo, como los estudios anteriores habían demostrado que los genes no son suficientes para la correcta estimación del genoma filogenia [19, 31]. Además, la fiabilidad de algunos de los marcadores filogenéticos utilizada para obtener Ecdysozoa se ha cuestionado seriamente [32, 33]. Aquellos que consideran que la Ecdysozoa como hipótesis más plausible Coelomata insistir en que la topología es un artefacto de LBAE, derivado del hecho de que el nematodo de los genomas, en particular la de C. Elegans, evolucionar a tasas más altas [3], y, en consecuencia, son desplazados a una posición más basal.

Por otra parte, como la reconstrucción filogenética asume que los datos son la muestra representativa de todo el genoma de los que se señalan [34], cada vez hay más acuerdo para considerar la escala del genoma análisis más preciso que un solo gen análisis de la hora de decidir entre en conflicto topologías [ 19, 31]. Conflicto deriva del hecho de que todas las anteriores del genoma a escala filogenética intentos de probar la hipótesis no han podido confirmar la 'muda grupo' - la Ecdysozoa - como un clado. Phylogenomic Todos los análisis realizados hasta la fecha Coelomata favor de la hipótesis con mayor apoyo estadístico [12 - 16]. Además, el árbol Coelomata ha demostrado ser robusto a las críticas derivadas de la LBAE [12, 14 - 16] y de las especies de nematodos inclusión [14]. Aquellos que consideran que la hipótesis Coelomata a ser más apropiado insistir en que ya secuencias, en lugar de extensos taxón muestreo [35], de manera más eficaz a mejorar la precisión de la inferencia filogenética [14, 15, 36, 37], y hacer hincapié en que una inevitable el comercio Off existente entre el número de caracteres y el número de especies utilizadas en el estudio [15].

Mostramos aquí, que con la rápida evolución del nematodo C. Elegans la Ecdysozoa pueden ser recuperados utilizando el genoma escala análisis filogenético. Nuestro análisis se ha realizado sobre el mayor número de genomas eucariotas y por el mayor número de residuos de aminoácidos utilizado para poner a prueba la hipótesis. Las principales diferencias con respecto a anteriores enfoques genómicos son tres. En primer lugar, hemos utilizado un gran número de secuencias conservadas corto (alrededor de 50 aminoácidos de longitud) homóloga humana derivados de las secuencias del exón. Sólo el exón secuencias de los genes procedentes de ocho, de un total de alrededor de 100 analizados por Blair et al. [14], se han utilizado en nuestro análisis. El resto de los genes contenidos en los 18 cromosomas humanos no pasó la BLAST filtros aplicados en el análisis. En segundo lugar, el conjunto de datos organizados de tal manera que las secuencias, incluidos los que evoluciona más rápido o más lento, se incluyeron si cumplen la condición de igualdad de la tasa de cambio entre dos (C. elegans y D. melanogaster) o tres especies (C. intestinalis, D . Melanogaster y C. elegans). En tercer lugar, hemos utilizado un gran número de personajes (residuos de aminoácidos) y un ponderado distante afuera especies para aumentar el poder relativo de la tasa de ensayo [20].

Como se discutió en nuestro trabajo previo [16], mediante la inclusión o exclusión de determinados humanos exón secuencias homólogas, que redujo el problema de la LBAE y añadió un probable sesgo a favor de Coelomata. El presente trabajo confirma que existe este sesgo. La concatenación y el posterior análisis filogenético de las secuencias compartidas por los eucariotas utilizados en este análisis ofrecer una solución viable a las relaciones ancestro-descendientes de las especies animales, una vez que el LBAE se elimina.

Conclusiones

La aceptación de los nuevos animales y la filogenia Ecdysozoa hipótesis proporcionaría un nuevo esquema para entender la explosión del Cámbrico [38, 39] y el origen de los metazoos cuerpo planes [9, 30] y, en consecuencia, se estableció un nuevo marco para la filogenética genómica comparativa [40 ]. Hemos mostrado cómo la reconstrucción filogenética basada en las secuencias del genoma en su conjunto-tiene el potencial de resolver una de las hipótesis más controvertidas en la evolución animal: la fiabilidad de los Ecdysozoa clade.

Materiales y métodos
Recopilación de datos

Secuencia completa del genoma del Plasmodium falciparum [41], Arabidopsis thaliana [42], Oryza sativa [43], Saccharomyces cerevisiae [44], Caenorhabditis elegans [45], Anopheles gambiae [46], Drosophila melanogaster [47], Ciona intestinalis [48 ], Fugu rubripes [49], Mus musculus [50] y Homo sapiens [51] y se descargan en formato de ejecutar BLAST local [52]. Las secuencias de aminoácidos que corresponden a todos los exones del gen en una muestra de 18 cromosomas humanos incluidos 6-18, 20-22, XeY (aproximadamente 14000 genes y exones 140000), se obtuvieron de la base de datos Ensembl proyecto [53]. Paralogous Humanos exones se excluyeron ejecutando local blastp [52] sobre una base de datos construida exón humanos ad hoc. Sólo lo mejor de las secuencias de las que, con más de un solo hit con una fracción de alineado y conserva secuencia de aminoácidos ≥ 95% y ≥ 90%, respectivamente, fueron contratados para encontrar secuencias homólogas en el resto de las especies eucariotas (valores umbral sobre la base de un Paralogous estudio anterior humanos [54]]. Se utilizó tblastn [52] que busca una consulta secuencia de aminoácidos en los seis traducción fotogramas de la secuencia objeto de búsqueda de homología en la base de datos completa del genoma de las especies antes mencionadas. Exones menos de 22 aminoácidos se eliminaron del análisis. Cada una de las mejores hit tblastn fue filtrada a través de un e-valor umbral (-03 ≤ 1e 1e) y un umbral de la consulta sobre el tema secuencia de duración (≥ 75%). Sólo los exones que pasar a través de todas las especies filtro condiciones fueron seleccionados como el último conjunto de datos de secuencias homólogas exón humano. Todos los exón secuencias homólogas fueron alineados utilizando Clustal W [55] con los parámetros por defecto. El número total de secuencias homólogas, derivadas de los cromosomas humanos 18, 1192 corresponde a los exones seleccionados de 610 genes conocidos, sumando a más de 55500 caracteres aminoácidos.

Para arreglar las secuencias homólogas en las distintas bases de datos, pairwise distancias entre las secuencias fueron extraídas con la PROTDIST programa (Kimura opción) de la PHYLIP paquete [56]. Distancias entre C. Elegans, D. Melanogaster y H. Sapiens se transformaron en longitudes de rama en una estrella-como unrooted árbol (a = l (d ab + d ac - d bc) / 2, donde es l a la longitud de la rama y que conduzca a un ab d, d ac, d Bc son las distancias entre a y b, a y c, y b y c, respectivamente). Es importante destacar que no estamos teniendo en cuenta que las relaciones filogenéticas de C. Elegans, D. Melanogaster y H. Sapiens es una topología en estrella. Se utilizó esta ecuación exacta para la determinación de la rama de longitudes de las tres especies, ya que la única manera de organizar tres especies en un árbol filogenético es una topología en estrella. Consideramos C. Elegans, D. Melanogaster y H. Sapiens a ser miembros de la ingroup y P. Falciparum, A. Thaliana, O. Sativa y S. Cerevisiae como el grupo afuera especies en la actualidad a raíz del árbol filogenético. Exón secuencias homólogas se organizaron en ocho bases de datos de acuerdo a su pertinencia para más incluyente zonas aledañas a la línea recta que representa idénticos relativos rama longitudes (RBLs), de C. Elegans (L = l Ce Ce / l Hs) y D. Melanogaster (L = l Dm Dm / l Hs). El conjunto de datos D i todas las agrupaciones homólogas exón alineaciones donde L Dm - δ iLL Dm Ce δ + i, donde i es un entero que van del 2 al 7 y δ i = 5,0, 3.0,2.5,2.0,15, 1.0,0.5. El D 1 conjunto de datos contiene todas las secuencias homólogas exón sin las limitaciones de las tasas de evolución. Exones con negativo o indefinido normalizado distancias (l = 0 Hs) fueron excluidos del análisis. Todos los alineados secuencias homólogas exón D i de la base de datos se concatenan en la matriz M i. Otros tres fueron derivados de las matrices de D 1: dos por la eliminación de los exones contienen LCe Y LCe , Y el último por el ajuste de las secuencias de C. Intestinalis, D. Melanogaster y C. Elegans al reloj-como comportamiento.

Métodos filogenéticos

La tasa relativa de ensayo se realizó en el 5% a nivel estadístico por medio del programa RRTree [57] utilizando grupos externos con un (S. cerevisiae; OUG1) o más especies (S. cerevisiae, A. thaliana, O. sativa y P. Falciparum; OUG2). En este último caso, una explícita ponderación filogenético régimen fue elegido (1 / 2 S. cerevisiae, ((1 / 8 A. thaliana, 1 / 8 O. sativa), 1 / 4 P. falciparum)). Habida cuenta de que tres ingroups se establecieron para todos los análisis (los cordados H. sapiens, M. musculus, rubripes F., y C. intestinalis; los artrópodos Anopheles gambiae y Drosophila melanogaster, y el nematodo C. elegans), el umbral se corrigió Para múltiples ensayos a 5 / 3 = 1,7%. TREE-PUZZLE [58] se utilizó para evaluar seis modelos alternativos de evolución para ajustar las frecuencias (+ F), sitio tasa de variación (+ Γ con dos tipos de distribución) y una proporción invariable de los sitios (+ I), para estimar la cantidad de evolutivo Información de bases de datos por el método de cartografía de las zonas de riesgo [59], para obtener la máxima verosimilitud (ML) árboles utilizando el algoritmo de cuarteto-desconcertante, para establecer la secuencia ML pairwise distancias, y para poner a prueba alternativas topologías usando SH [60] y ELW [ 29] ensayos. El PROML (JTT + f) de la PHYLIP paquete [56] fue utilizado para estimar ML árboles derivados de la gradual Además algoritmo. Distancia métodos de la reconstrucción filogenética se realizaron con PROTDIST (JTT, Kimura opciones), VECINO (vecino a participar (NJ) [61]] y de los mínimos cuadrados (LS) [62] algoritmos, y CONSENSE (50% mayoría de consenso regla opción) Programas de arranque de 100 repeticiones usando PHYLIP.

Adicional de los archivos de datos

Además los siguientes archivos de datos están disponibles con la versión en línea de este documento. Adicional 1 archivo de datos contiene un gráfico que muestra la cartografía ML rompecabezas de la M i matrices. Datos adicionales 2 contiene un archivo gráfico que muestra la cartografía ML rompecabezas de la matriz derivados de chordate, artrópodos y nematodos secuencias que muestran reloj-como comportamiento. Datos adicionales 3 contiene el archivo de matrices.

Material suplementario
Archivo Adicional 1
ML rompecabezas de la cartografía de la M i matrices.
Máxima verosimilitud resultados de los mapas de cada uno de los
M
I
Concatenados matrices. Desde la primera fila y de izquierda a derecha, M1 a M2 hasta la cuarta fila, M7 a M8.
Archivo Adicional 2
ML rompecabezas de la cartografía de la matriz derivados de chordate, artrópodos y nematodos secuencias que muestran reloj-como comportamiento.
ML mapeo de la matriz concatenados derivados de la limitación de secuencias a 3-al igual que el comportamiento de los relojes.
Archivo Adicional 3
Matrices.
El conjunto de las matrices (phylip formato) utilizados en la filogenética analiza.
Agradecimientos

Damos las gracias especialmente Javier Santoyo y de los miembros del departamento de Bioinformática del Centro de Investigación Príncipe Felipe. Damos las gracias a J. Castresana, D. y R. Zardoya Posada de comentarios y sugerencias, y M. Robinson-Rechavi para actualizar el código del software RRTree. Un agradecimiento especial va a Amanda Wren por su revisión del Inglés. HD reconoce el apoyo de la Fundación Carolina y la Fundación la Caixa.