BMC Evolutionary Biology, 2006; 6: 87-87 (más artículos en esta revista)

Multi-locus filogenia de los delfines en la subfamilia Lissodelphininae: mejora la sinergia carácter filogenético de resolución

BioMed Central
Abril Harlin D-Cognato (cognatoa@msu.edu) [1], Rodney L Honeycutt (rodney.honeycutt @ pepperdine.edu) [2]
[1] Departamento de Zoología, 203 Edificio de Ciencias Naturales, Michigan State University, East Lansing, Michigan, 48823, EE.UU.
[2] Ciencias Naturales de la División de Pepperdine University, 24255 Pacific Coast Highway, Malibu, California, 90263, EE.UU.

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.

Resumen
Fondo

Delfines del género Lagenorhynchus son anti-tropicalmente distribuidos en templadas aguas que se enfríe. Análisis filogenético de las secuencias de citocromo b han sugerido que el género es polifilético, sin embargo, muchas relaciones fueron mal resueltas. En este estudio, se presenta un análisis combinado de hipótesis filogenéticas para Lagenorhynchus y los miembros de la subfamilia Lissodelphininae, que se deriva de dos nuclear y mitocondrial dos conjuntos de datos y la adición de 34 personas que representan a 9 especies. Además, nos caracterizan con parsimonia y el análisis Bayesiano filogenético de utilidad e interacción con los personajes de medidas estadísticas, incluida la utilidad de muy consistente (no homoplasious) caracteres, como medida conservadora de robustez filogenética. Nosotros también explorar los efectos de eliminar las fuentes de conflicto en carácter filogenético de resolución.

Resultados

En general, nuestro estudio proporciona un fuerte apoyo para la monofilia de la subfamilia Lissodelphininae y la polyphyly del género Lagenorhynchus. Además, el análisis simultáneo de parsimonia resueltas y / o la mejora de resolución por 12 nodos, incluyendo: (1) L. albirostris, L. acutus; (2) L. obscurus y L. obliquidens, y (3) L. y L. cruciger Australis. Además, el análisis Bayesiano apoya la monofilia de la Cephalorhynchus, y resolver las ambigüedades con respecto a la relación de L. Australis / L. cruciger a los demás miembros del género Lagenorhynchus. La frecuencia de personajes muy variados en consonancia entre las particiones de datos, pero el ritmo de evolución es compatible con particiones de datos. A pesar de que el control de la región es la mayor fuente de conflictos de carácter, la eliminación de estos datos filogenéticos impedido la partición de resolución.

Conclusión

El análisis simultáneo producido un enfoque más firme hipótesis filogenéticas para Lagenorhynchus que los anteriores estudios, por lo tanto, apoyar un enfoque filogenético que emplean múltiples particiones de datos que varían en la tasa global de la evolución. Incluso en los casos en que hubo conflicto aparente entre los personajes, nuestros datos sugieren una interacción sinérgica en el análisis simultáneo, y hablar en contra de una exclusión a priori de los datos a causa de posibles conflictos, sobre todo porque filogenética resultados pueden ser menos robusto. Por ejemplo, la eliminación de control de la región, la supuesta fuente de conflicto el carácter, produce resultados falsos con incoherencias entre y dentro de topologías de parsimonia y análisis Bayesiano.

Fondo

Delfines del género Lagenorhynchus se distribuyen en templado a fresco en las aguas del Pacífico Norte, Atlántico Norte, del Sur y los océanos [1 - 4] (Figura 1]. A corto tribuna, relativamente pequeños, robustos cuerpos, con los flancos y horizontal de diversas erupciones contraste caracterizar los patrones de todos los miembros del género. Dentro de este grupo existe una considerable variación en la estructura social y hábitat, desde las aguas costeras, aguas Peale del delfín (L. australis) que se produce en pequeños grupos en el Estrecho de Magallanes y cerca fijords, a la meso-pelágicas delfín oscuro (L. obscurus ) Que los agregados en grupos de a miles a lo largo de la plataforma continental de Nueva Zelandia, Sudáfrica y América del Sur.

Históricamente, los patrones de color, número de dientes, y la proporción de tribuna para el cerebro caso de longitud se utilizan como caracteres diagnósticos para definir los delfines géneros, incluido el género Lagenorhynchus [5 - 7]. Sin embargo, estos caracteres se sabe que varían con el sexo y la edad dentro de cada especie [5]. No es de extrañar, por tanto, que la clasificación de los grupos de delfines sobre la base de estos caracteres resultó especialmente problemático para principios de los taxonomistas. Por Lagenorhynchus, el ubicuo el uso de estos caracteres morfológicos como resultado en un momento u otro de especímenes están asignados (y re-asignados) a por lo menos 8 diferentes géneros (por ejemplo, Delphinus, [7]; Electra, [8]; Phocoena, [ 9]; Tursio, [10]; Leucopleurus, [8]; Clymenia, [10]; Sagmatius, [11]]. Recientemente, estudios de sistemática molecular de mitocondrial citocromo b (cyt b) y el control de la región (dloop) secuencias fueron empleados para hacer frente a las ambigüedades taxonómica dentro de la familia Delphinidae. Los resultados de estos estudios, sobre la base de un solo representante de cada especie, sugirió un polifilético Lagenorhynchus, dejando a muchas otras relaciones débilmente apoyada y, en general, la situación taxonómica del grupo sin resolver [12, 13]. Por ejemplo, el cyt b cladograma de Leduc et al. [13] indicó fuerte apoyo a una subfamilia Lissodelphininae monofilético que figura L. obliquidens, L. obscurus, L. australis, L. cruciger, y los géneros Cephalorhynchus y Lissodelphis pero excluidos del Atlántico Norte, L. albirostris y L. acutus. Un hecho más reciente análisis Bayesiano de cyt b secuencias de mayo-Collado y Agnarsson [14] apoya la Parafilético del género Lagenorhynchus a lo sugerido por Leduc et al. [13], pero el aumento de muestreo taxonómico (en particular de outgroups) proporcionó una mayor resolución filogenética en el Lissodelphininae. Sin embargo, al igual que con Leduc et al. [13], algunas de las relaciones entre las especies de Lagenorhynchus y Cephalorhynchus dentro de la Lissodelphininae sigue sin resolverse.

Debido a su rápida tasa de coalescencia y la falta de recombinación, del ADN mitocondrial ha sido la molécula de elección de los estudios detallados de intra-e inter-específicas evolución. Sin embargo, el genoma mitocondrial es una sola, la madre heredó lugar, y por lo tanto proporciona una perspectiva sobre la base de un solo gen árbol de mujeres linajes. Es posible que la falta de resolución en filogenético Leduc et al. "S [13] estudio fue causado por las limitaciones de un único locus mitocondrial y / o el resultado de la rápida divergencia entre los taxones. Sin embargo, distinguir entre las distintas hipótesis filogenéticas requiere la adición de más datos procedentes de múltiples loci y una evaluación detallada de la utilidad de diversas particiones de datos para resolver las relaciones dentro de este grupo. Hasta la fecha, no más sistemática molecular estudios han tratado de abordar estas cuestiones.

En este trabajo se usan cuatro marcadores moleculares (dos nucleares y dos mitocondriales) que varían en las tasas globales de la evolución para el diagnóstico de las relaciones entre las especies de delfines en el género Lagenorhynchus y entre los géneros dentro de la subfamilia Lissodelphininae [13]. Para aumentar la representación taxonómica, que incluyen 34 personas que representan a 9 especies de la Lissodelphininae y del Atlántico Norte Lagenorhynchus. Además, utilizar a posteriori medidas para cuantificar la interacción entre las particiones de datos en un análisis simultáneo, y para caracterizar los efectos de eliminar las fuentes de conflicto en filogenético resolución en relación con el criterio de optimalidad de parsimonia y con el método bayesiano. Varios estudios han presentado métodos para cuantificar la interacción de personajes en simultáneo análisis [15 - 17]. Estas medidas son: (1) los índices topológicos que medir el cambio en uno u otro árbol de longitud o estructura ( "topológica congruencia") [18, 19], y (2) medidas de cambio en la cantidad de apoyo en un nodo [ 15, 17, 20]. La fiabilidad de estas medidas y su fundamento filosófico ha sido cuestionado. En una reciente revisión, Grant y Kluge ([21], pg. 409) a favor de que los análisis a posteriori de carácter heurístico son las particiones sólo cuando "basado en los resultados del total de pruebas-análisis", y que hay " un gran potencial para el desarrollo de métodos heurísticos de análisis a posteriori de conjuntos de caracteres. "En este estudio, tratamos de examinar heuristically con análisis estadísticos de las contribuciones e interacciones de datos de las particiones en la resolución de las relaciones dentro de la familia Delphinidae. Nuestro estudio es el primero en utilizar tanto nuclear como mitocondrial loci para el diagnóstico de las relaciones dentro de la familia Delphinidae, y, por tanto, ofrece una oportunidad única para explorar la utilidad del proceso de múltiples particiones en el tratamiento de la historia evolutiva de este grupo.

Resultados
Análisis simultáneo y las relaciones dentro de los delfínidos

El análisis simultáneo de dos nucleares y dos genes mitocondriales (un total de 3053 caracteres) produjo cuatro igualmente parsimonious árboles que sólo difieren en su nivel de los intercambios intracomunitarios de resolución específica (Figura 2]. Catorce de las 15 especies a nivel de clados ha bootstrap valores> 99% y un alto índices de caries (5 a 44) (Figura 2]. Nuestros resultados proporcionan apoyo inequívoco para la monofilia de la subfamilia Lissodelphininae (iii nodo, Figura 2] y el polyphyly del género Lagenorhynchus (nodos x, xi, y vi, Figura 2], en primer lugar sugerido por Leduc et al. [13] y mayo-Callado y Agnarsson [14]. Varios relaciones ambiguas con anterioridad a Leduc et al. [13] fueron bien resueltas por el análisis simultáneo (Figura 2] e incluye a: (1) monofilia de L. albirostris, L. acutus y Stenella / Tursiops / Delphinus clados (nodos xv, XIV, y xiii, Figura 2), (2] un mayor apoyo a la hermana taxón relación de L. obscurus y L. obliquidens (nodo vi) y (3) la monofilia L. y L. cruciger australis (nodo ix). En general, los análisis de parsimonia simultánea, ya sea resuelto o mejorado la resolución de 12 nodos (Figura 2]. El análisis Bayesiano produjo una topología muy similar a la del análisis de parsimonia, pero con un mayor apoyo a los nodos que tenían bajos valores de arranque en el análisis de parsimonia simultánea (por ejemplo, los ganglios iv, v, xviii, Figura 2]. En particular, análisis Bayesiano apoya la monofilia de la Cephalorhynchus (nodo xviii, Figura 2], y resueltas las ambigüedades en los estudios anteriores [13, 14] con respecto a la relación de L. Australis / L. cruciger a los demás miembros del género Lagenorhynchus. Hubo algunas diferencias topológicas entre la parsimonia y Bayesiano árboles, pero éstos se limitaron a clados fuera de la Lissodelphininae donde taxonómica de muestreo fue relativamente pobres (Figura 2].

Separar el análisis de los datos producidos topologías particiones con una variación en el grado de resolución (resultados no se muestra). Por ejemplo, el cyt b partición elaborado un topología más similares a las del análisis simultáneo, con un 100% de consenso entre todos los inter-específicas clados. En general, las particiones mitocondrial había un mayor número de caracteres filogenéticamente informativos y producido parsimonious menos la mayoría de los árboles que los datos de ADN nuclear. Sin embargo, en todos los casos el análisis simultáneo cladograma siempre considerablemente mayor que cualquier resolución de los análisis independientes. En varios casos, clados apoyada por el análisis simultáneo también fueron recuperados en uno o varios de los análisis independientes, con la excepción de la región de control - muchas de las relaciones en este árbol no se recuperaron en otros análisis.

La dinámica de caracteres: utilidad filogenética

Cada una de las cuatro particiones proceso contribuido en cierta medida a la solución del análisis simultáneo de árboles (Tabla 2, Figura 3]. En un nodo por nodo, la cantidad de apoyo localizadas topológica de datos variados y entre las regiones del análisis simultáneo de árboles. Por ejemplo, la partición de Bremer para apoyar los valores cyt b fueron siempre positivas en todos los nodos, mientras que los valores para el control de la región fueron positivos en las puntas del árbol, pero negativos en la base (Tabla 2, Figura 3]. A más largo ramas presentaron más IC = 1 caracteres más corto que las ramas en el árbol (H = 7,63, df = 2, P = 0,02), y en todas las particiones de datos se produjo un importante y positiva relación entre la frecuencia de IC = 1 y personajes rama longitud (cyt b, F = 29,5, df = 1, 21, P <0,01; dloop F = 7,2, df = 1, 21, P <0,05; Actina, F = 16,1, df = 1, 21, P <0,01) (Figura 4]. La fuerza de esta relación varía entre las particiones de datos, con cyt b haber más empinada la relación positiva entre la sucursal y longitud IC = 1 caracteres (Figura 4]. Es interesante la dloop, aunque en general considera que evolucionan a un ritmo más rápido que cyt b, había un menor número de CI = 1 caracteres en general, y una pendiente más similar a la de actina (Figura 4]. Cyt b proporcionado la mayor proporción de IC = 1 caracteres en cada nodo (Tabla 2, Figura 4]. A pesar de la mayor frecuencia y una distribución más amplia de personajes muy coherente en cyt b, la proporción relativa de apoyo aportados por cada partición de datos no difieren estadísticamente entre las categorías de rama longitud (χ 2 = 10,42, df = 6, P = 0.12), aunque Actina tienden a contribuir más a la resolución ya lo largo de las ramas (Cuadro 2]. Dicho de otro modo, cada partición de datos contribuido constantemente la misma proporción del número total de IC = 1 rama caracteres de longitud entre las categorías, pero el número absoluto de estos caracteres difieren entre las particiones. Nuestros resultados sugieren además que las transiciones 3 ª posición se produjo con mayor frecuencia y siempre topológicas más apoyo que otras clases de sustitución (χ 2 = 12,4, df = 4, P = 0,02).

Carácter dinámica: la interacción de datos

De correlación de Spearman análisis reveló una relación positiva significativa entre la RAG2 y otros datos de las particiones (ρ 2 = 0,432, P = 0,003) pero no encontró pruebas para la interacción entre cyt b, Actina, y el control región particiones. Sin embargo, la distribución de los positivos y negativos particionado Bremer apoyo valores en el análisis simultáneo de topología sugirió caracteres localizados conflicto entre las particiones de datos (Figura 3]. La mayor cantidad de dispersión en la partición de Bremer apoyo entre la región de control y otros datos de las particiones en el más breve nodos en el análisis simultáneo de árboles (Cuadro 2], donde la partición de Bremer apoyo para el control de la región fueron siempre negativos (Figura 3]. Además, los valores ocultos sinapomorfía para el control de la región fueron significativamente negativo (señal de prueba, P = 0,007), con frecuentes desplazamientos de synapomorphies con la adición de datos en el análisis simultáneo (Tabla 2]. Las implicaciones de estos hallazgos son de dos clases: (1) el control de la región era responsable de la mayoría de los datos conflicto, y (2) el relativamente débil apoyo de algunos nodos fue el resultado de este conflicto. Por el contrario, cyt b no ha demostrado un importante patrón de pérdida o ganancia de synapomorphies (P = 0.13) debido a análisis simultáneo. De hecho, cyt b aportó otros sinapomorfía a 6 diferentes nodos siguientes análisis simultáneo (Tabla 2]. El número de synapomorphies aportados por el ADN nuclear particiones de datos no cambió entre independiente y simultánea análisis (datos no presentados), que indicaron que no eran una fuente de carácter conflicto.

Carácter conflicto exploración

Estamos estudiarse más a fondo los efectos de carácter conflictos en la topología de control con exclusión de la región y la realización de una parsimonia y análisis Bayesiano con los mismos parámetros, como el análisis simultáneo. Las topologías de la truncada parsimonia y análisis Bayesiano son marcadamente diferentes entre sí y de los análisis simultáneo cladograma, y no en ambos casos para recuperar la monofilia de los principales géneros de la Lissodelphininae (Figura 5]. En particular, ni análisis produjo un Cephalorhynchus monofilético, que ha sido muy bien apoyado por otros estudios filogenéticos [22]. Estos resultados indican que la región de control de datos contribuyeron a la resolución del análisis simultáneo de árboles, sobre todo en el Lissodelphininae, a pesar de las pruebas de carácter conflictos, y que esto era cierto o no los datos fueron analizados con parsimonia o Bayeisan métodos. Además, la supresión de los datos de control de la región no permitieron llegar a un monofilético Lagenorhynchus, lo que indica el carácter de conflictos por sí sola no era responsable de la polyphyly de este género.

Discusión y conclusiones
Lissodelphininae y Sistemática Lagenorhynchus

En general, nuestro estudio demuestra que el análisis simultáneo de la energía nuclear y mitocondrial proceso de particiones, junto con una mejor taxonomía de muestreo, a condición de mayor resolución filogenética que cyt b solas [13, 14]. La simultánea parsimonia y análisis Bayesiano aumento de medidas de apoyo para el 7 de nodos, y resueltas las relaciones entre 5 clados que antes eran ambiguas en el análisis de Leduc et al. [13] (Figura 2]. Por otra parte, nuestro estudio se recuperó un Cephalorhynchus monofilético, y posterior aumento de las probabilidades para 4 nodos (es decir, IV, VI, VIII, xvii y xviii Figura 2] en comparación con el árbol Bayesiano de mayo-Callado y Agnarsson [14]. Estos resultados son consistentes con otros estudios que sugieren análisis filogenético sobre la base de datos mitocondrial por sí sola puede inducir a error, y que solo gen árboles no siempre son exactas representaciones de especies de árboles. Incluso en los casos en que hubo conflicto aparente entre los personajes, nuestros datos sugieren una interacción sinérgica en el análisis simultáneo, y que una exclusión a priori de los datos debido a posibles conflictos puede inhibir la recuperación de sólidos hipótesis filogenéticas. Por ejemplo, la eliminación de control de la región, la supuesta fuente de conflicto el carácter, produce resultados falsos con incoherencias entre y dentro de topologías de parsimonia y análisis Bayesiano (Figuras 2 y 5], y esas incoherencias no son triviales. En tanto la parsimonia y análisis Bayesiano sin control de la región, bien apoyado monofilético grupos quedaron poli-o para-phyletic (por ejemplo, Cephalorhynchus), y más profunda a nivel de relaciones fueron ampliamente modificado (Figuras 2 y 5]. La fiabilidad de Bayesiano posterior probabilidades como una medida de nodo de apoyo ha sido recientemente puesto en tela de juicio. [23 - 26]. Por lo tanto, el aumento del apoyo nodales obtenidos de los análisis Bayesiano debe interpretarse a la luz de esta controversia, y aunque los valores de arranque y posterior probabilidades no son directamente comparables, un enfoque conservador podría ser la de considerarlos como límites inferior y superior de fiabilidad nodo [23]. Sin embargo, nuestros resultados apoyan los estudios anteriores sugieren que los conjuntos de datos analizados cuando interactúan al mismo tiempo [16, 17, 20, 27, 28], y que las propiedades de los datos que surgen no son detectables cuando las particiones se analizan por separado [15, 16, 20, 27 , 28].

La dinámica de caracteres

Varios métodos han sido propuestos para cuantificar la congruencia y el conflicto en simultáneo análisis [15, 17, 20, 29, 30]. A pesar de que estas medidas son útiles los descriptores de inconsistencia entre los análisis, muchos de ellos no proporcionan una medida cuantitativa con la que comparar los árboles derivados de las particiones de datos independientes. Se ha argumentado (véase el reciente examen de la subvención y Kluge [21] y las referencias en él) que un análisis a posteriori de carácter diversas particiones en contra de un análisis simultáneo de árboles es parte de un enfoque heurístico para evaluar la utilidad de las diferentes particiones para resolver las relaciones entre linajes que potencialmente se diferencian en las tasas evolutivas y / o nivel general de divergencia. En este estudio, hemos intentado a través de una serie de pruebas estadísticas (tabla 3] a cuantifican a posteriori el grado de interacción y filogenética utilidad de los datos en particiones análisis combinado. En muchas de estas pruebas se optó por utilizar un subconjunto de caracteres de parsimonia informativa que carecían de homoplasy (IC = 1) (Tabla 3]. La lógica detrás de este enfoque es que en cualquier topología de los personajes con un CI de 1 tienen menos probabilidades de ser desplazados de un nodo con la adición de datos en el futuro (es decir, tener filogenético "inercia") de menos coherente personajes, y, por tanto, representan un conservador de la clase de caracteres que para evaluar la utilidad de las particiones de datos. Reconocemos que, incluso manifiestamente errónea árboles puede contener algunos caracteres con un CI de 1, y todas las topologías de árboles están sujetos a cambios con la incorporación de datos - esto es cierto de ninguna hipótesis de trabajo. Sin embargo, sostienen que la evaluación a posteriori de la conducta de IC = 1 caracteres proporciona un medio para evaluar cuantitativamente la naturaleza de la interacción y datos de utilidad y, por tanto, identificar las posibles fuentes de incompatibilidad de caracteres.

Por ejemplo, nuestros resultados indican que hay una importante y positiva relación entre IC = 1 rama de caracteres y longitud de cyt b, dloop, y Actina (Figura 4], lo que no es inesperada, dado que ya son por lo general las ramas espera que tenga un mayor número de cambios de carácter más corto sucursales. También espera que la dloop, todas las cosas en igualdad de condiciones, habría un mayor número de CI = 1 caracteres que cyt b Actina o desde la dloop evoluciona más rápidamente que otros mitocondrial y ADN nuclear regiones en los cetáceos (mamíferos y en general). En contraste, se observa que tanto la frecuencia de IC = 1 personajes y la fuerza de la IC = 1 frecuencia / longitud rama relación es mayor en cyt b dloop que la Actina y particiones (Tabla 2, Figura 4]. Una interpretación de estos resultados es que la evolución de la dloop es tan rápido que la información filogenética se reduce de múltiples sustituciones. Sin embargo, si este fuera el caso, podríamos esperar el deterioro de la señal filogenética con el aumento de longitud rama - no observar este patrón. Por el contrario, sugieren una interpretación alternativa - que estos resultados indican algo acerca de la utilidad filogenética y / o el grado de conflicto de la dloop con otros caracteres en el análisis combinado. Por ejemplo, tenemos pruebas de que la dloop es una fuente de conflictos de carácter, y la desviación de los resultados esperados de los análisis de regresión lineal puede ser un indicador adicional de este conflicto. Sin embargo, a pesar de este conflicto, las relaciones positivas significativamente entre rama y longitudes IC = 1 caracteres sugieren que todas las particiones de datos (en distintos grados) contribuir a la resolución de árboles, incluso en presencia de un conflicto de caracteres. Por lo tanto, este método es un indicador general de la capacidad relativa de cada partición de datos para resolver las relaciones entre la UTO con diversos grados de divergencia evolutiva, y proporciona un ejemplo de las propiedades emergentes de caracteres en el análisis combinado.

Nuestras pruebas estadísticas sugieren que la frecuencia y distribución de IC = 1 caracteres no fue uniforme para cualquier partición de datos, lo que sugiere que el ritmo de evolución no es constante entre los linajes (Figura 4]. Esto no es sorprendente dado que heterotachy y covariación son fenómenos comunes en los datos moleculares. Sin embargo, nos interesa constatar que, aunque la frecuencia de IC = 1 caracteres variados a lo largo de linajes, la proporción relativa de los IC = 1 caracteres aportados por cada partición de datos no fue estadísticamente diferente (Figura 4]. Nuestra interpretación de este hallazgo es que las ramas cortas en la base de la Lissodelphininae fueron el resultado de una verdadera aceleración en la tasa de evolución a lo largo de estos linajes y no un artefacto de las características de la evolución de cualquier partición de datos. En este sentido, le sugerimos que esta, o similares, pruebas estadísticas podría ser útil en la identificación de regiones en un árbol que representa la rápida divergencia, que a menudo son difíciles de resolver con el análisis filogenético debido a la relativamente menor número de caracteres informativos a lo largo de muy corta ramas. Las implicaciones de estos resultados son de dos clases. En primer lugar, la consecuente falta de uniformidad entre los datos de las particiones en el número de personajes muy coherente proporciona fuerte evidencia de cambios en el ritmo de evolución de delphinid linajes, ya que comparten un ancestro común con los Phocoenidae aproximadamente 10 millones de años atrás. En segundo lugar, la rápida reducción del número de caracteres muy coherente en medio del análisis simultáneo de árboles, y la correspondiente rama corta duración y gran número de linajes indica que un cambio en la tasa de diversificación más reciente se produjo en la base de la subfamilia Lissodelphininae ( Figura 4]. Habida cuenta de que el 8 de las 10 especies de esta subfamilia monofilético sólo se encuentran en el hemisferio sur, esto puede representar un rápido anti-tropical divergencia de los linajes al sur del ecuador ecuatorial tras la transgresión del norte.

Taxonómica implicaciones

Nuestros resultados apoyan la monofilia de la Lissodelphininae (iii nodo, Figura 2], y, por tanto, de acuerdo con Le Duc et al. [13] y mayo-Callado y Agnarsson [14] que el género es Lagenorhynchus polifilético. Le Duc et al. [13] propone que el nombre genérico Lagenorhynchus permanecer con L. albirostris, el tipo de especímenes del género [7], y que el género Leucopleurus [10], debe ser resucitado para L. acutus taxonómica de acuerdo con precedencia. En contraste con Le Duc et al. [13], la parsimonia y análisis Bayesiano en este estudio se recuperó la monofilia de L. acutus y L. albirostris (Figura 2, nodo x), y apoya una estrecha relación de estas especies con el Delphinus y Stenella / Tursiops clade, aunque el Bayesiano y análisis de parsimonia no está de acuerdo en las relaciones entre estos clados (Figura 2]. Por lo tanto, proponemos que tanto L. acutus y L. albirostris conservar su actual designación genérica hasta nuevo análisis se realizan con una mejor taxonomía de muestreo fuera de la Lissodelphininae.

En segundo lugar, la adición de la energía nuclear y mitocondrial proceso particiones siempre firme apoyo a la Parafilético de Lagenorhynchus dentro de la subfamilia Lissodelphininae (Figura 2]. Además, tanto parsimonia y análisis Bayesiano apoyar la hermana de relación de grupo L. obliquidens y L. obscurus y la monofilia de la Cepharlorhynchus, que ha sido propuesto por otros estudios filogenéticos moleculares [12, 13, 22, 32]. Este estudio proporciona una mejor resolución filogenética para otros grupos, incluyendo la monofilia L. y L. cruciger australis, y la colocación de este clado dentro de la Lissodelphininae (Figura 2]. Nuestras pruebas de acuerdo con los resultados de Le Duc et al. [13] que L. cruciger / L. australis son monofilético y debe ser colocado en un género separado, Sagmatius, describió por primera vez de Sagmatius amblodon [11] y más tarde con sinónimas L. Australis [33]. El monofilético L. obliquidens y L. obscurus son más problemáticos y requerirá la designación de un nuevo género.

Los datos moleculares han contribuido a resolver algunos de los problemas relacionados con la taxonomía de delfines, pero es evidente que las cuestiones relativas a la variación en el ritmo de evolución dentro de la familia sigan dando muestras de la resolución de algunas relaciones problemáticas. El siguiente paso en este estudio sería la de combinar la morfología y la secuencia de ADN, los caracteres en un análisis simultáneo. Por ejemplo, Fraser y Purves [34] encontraron diferencias entre los distintos géneros de delfines sobre la base de un conjunto de caracteres en los senos relacionados con la estructura y la función auditiva. Una re-evaluación de estos personajes y molecular loci adicionales para todos los miembros de los delfínidos podría proporcionar resolución de relaciones evolutivas problemático para los taxones.

Métodos
Especímenes

Los tejidos fueron obtenidos a partir de biopsia de piel y punzones hisopos de animales vivos y post-mortem de muestras playa de fundición o red de individuos capturados (Tabla 1]. Cuidado de la Piel hisopos se recogieron los siguientes procedimiento no invasivo de Harlin et al. [35], ya sea conservado en el 90% ETOH o una solución de 20% dimethylsulfoxide (DMSO) saturado con agua salada, y se almacena a -20 ° C. Cuando sea posible, el ADN de los mismos individuos se utilizó para amplificar y secuenciar todos los genes. En algunos casos, pre-existentes de secuencias de GenBank se utilizaron para completar la matriz de datos (cuadro 1].

Cincuenta y dos personas de ocho géneros y 18 especies de la familia Delphinidae se examinaron, con énfasis en la representación del género Lagenorhynchus y otros miembros de la subfamilia Lissodelphininae (Tabla 1]. Todas las 12 especies de la subfamilia putativo y los miembros del género Lagenorhynchus (es decir, Lagenorhynchus sp., Cephalorhynchus sp., Y Lissodelphis sp.) Están representados (Cuadro 1]. Además, los miembros de la Tursiops / Delphinus / Stenella clade identificados por Leduc et al. [13], y la orca (Orcinus orca), un taxón cree que el linaje basal delphinid [36], se incluyeron. Australophocoena dioptrica y Phocoena phocoena de la familia Phocoenidae fueron seleccionados como los taxones afuera a causa de su hermana-taxón relación a los delfínidos [37, 38].

De aislamiento del ADN y amplificación

Total ADN genómico se aisló utilizando un estándar de fenol-cloroformo protocolo [39] o una Qiagen DNeasy kit (Qiagen, Valencia, California). La reacción en cadena de polimerasa (PCR) se utilizó para amplificar fragmentos de cuatro genes, incluyendo: (1) completar el mitocondrial citocromo b (cyt b) gen (1040 nucleótidos), (2) 474 pares de bases (pb) de la región de control mitocondrial, (3) 995 bp de ADN nuclear (nDNA) intrón I de la Actina músculo de genes, y (4) 474 bp de la región de codificación de la activación de nDNA recombinación de genes 2 (RAG2). Exteriores primer conjuntos incluyen: (1) cyt b - 766F (5'-gaaaaaccaycgttgtwattcaact-3 ') y 766R (5'-gtttaattagaatytyagctttggg-3'); (2) el control de la región - tRNA-Pro y Dlp5 de Baker et al. [40]; (3) Actina - Lagenorhynchus específicos LagAct1 (5'-gatttggtccctctatgtctct-3 'y LagAct2 - 5'-tacttttgaacttgccacctac-3'). Actina primers fueron diseñados a partir de secuencias de cetáceos publicado [41] y se utilizan para amplificar la mayoría de ingroup taxa. ACT1 [41] y Act1385H (5'-cttgtgaactgattacagtcc-3 ') (Palumbi, inédito) se utilizaron para amplificar fragmentos de afuera y otros taxa que no amplificar con el Lagenorhynchus-primers específicos. RAG2 primers eran los mismos que los reportados por Murphy et al. [42]. PCR son las condiciones en general a través de loci con ajustes realizados a temperaturas de recocido. Aproximadamente 1-2 μ l de ADN plantilla se incluyeron en 50 μ l de PCR reacciones que contenga las siguientes: 5 μ l de cada una de las 10 × AmpliTaq PCR buffer (Perkin Elmer, Boston, Massachusetts), MgCl (25 mM), y deoxynucleotide trifosfatos (dNTP's, 10 mM), y 1 μ l de cada una de albúmina sérica bovina (BSA, 10 mg / ml), cada primer (10 μ M), y 1 μ l AmpliTaq (Perkin Elmer, Boston, Massachusetts) la DNA polimerasa (5 U / μ l). Termociclador condiciones fueron de 94 ° C durante 2 min seguido de 35 ciclos a 92 ° C durante 30 s, 30 s recocido, y la extensión a 72 ° C durante 30 s. Publicado recocido temperaturas fueron utilizados con las siguientes excepciones: 765F/766R, 50 ° C; LagActin1 / 2, 58 ° C; Act1/1385H, 56 ° C. Amplicones fueron electrophoresed en el 1,5% de agarosa-TBE (tris, ácido bórico, EDTA) y visualizan a la luz ultravioleta, y antes de la secuencia, el exceso de oligonucleótidos y dNTP's fueron retirados, ya sea con Qiagen (Qiagen, Valencia, California) spin-columnas o un Exonuclease I-Camarón Phosphotase alcalinas (Exo-Sap) enzimática procedimiento. Aproximadamente el 2 ng de limpiar producto de PCR por cada 100 pb de longitud amplicón fue secuenciado usando ABI BigDye (Applied Biosystems, Foster City, California) ciclo de la secuencia química y un ABI 377 secuenciador automatizado. Todos los amplificados fueron secuenciados en ambas direcciones. Interna primer pares de cyt b (560, 5'-gcaaccctaacacgattcttcg-3 '; 610, 5'-ccagtttcgtgtaggaataatagg-3') y Actina (Act5-L, 5'-ccactactttaggcag-3 '; M13Act5R-H, 5'-tgtaaaacgacggccagtctgcctaaactagtgg -3 '(S. Palumbi, inédito) se utilizaron en la secuencia de reacciones para obtener coincidencia completa en ambas direcciones. Secuencias generadas en este estudio son accessioned en la base de datos GenBank NCBI: (1) Dloop: EF092925 -- EF092969 , (2) Cytb: EF093009 -- EF093055 ; (3) Actina: EF092970 -- EF093008 ; (4) RAG2: EF093056 -- EF093105 .

Secuencia de la alineación y la heterozigosidad

Secuenciado fragmentos fueron compilados y editados con el programa Sequencher v. 4.1 (gen codifica Corp, Ann Arbor, Michigan). Un consenso de sentido y anti-sentido capítulos de cada individuo y partición de datos se recopilaron y se exportan a MacClade vs 4,05 [43]. Secuencias de las cuatro particiones de datos se concatenan en una sola cadena de nucleótidos caracteres de la misma persona cuando es posible, o una combinación de fragmentos de los miembros de la misma especie. Cyt b RAG2 y no tiene duración variable regiones, por lo tanto, la alineación de estos fragmentos es trivial. Aminoácidos traducciones de los marcos de lectura abierta de RAG2 y cyt b fueron examinados para codones de parada para comprobar la secuencia orthology. Actina fragmentos que figuran menor género específico de las inserciones y deleciones que fueron revelados en la alineación de Clustal X [44] con los parámetros por defecto. El control había una región (CT) n longitud variable región de alrededor de 21 pb que fue eliminado de los análisis de homología primaria como no podía ser evaluada con fiabilidad. Hubo otros 29 sitios con indeles control en la región, de los cuales 20 estaban presentes sólo en el grupo afuera taxones (A. dioptrica, P. phocoena). Actina tenía 24 indel sitios en tres bloques (4, 8, y 12 sitios) que se apomorphic (taxón). Todas las especies están representadas por fragmentos de las cuatro particiones de datos con las excepciones: (1) C. eutropia, que carecen de actina y RAG2 fragmentos porque no hemos podido obtener muestras de tejidos para esta especie, y (2) L. y L. cruciger peronii que carecen de Actina fragmentos (Tabla 1].

Todos los nucleótidos ambigüedades en Actina y RAG2 que el resultado de dos diferentes, pero igualmente fuerte, en picos electropherograms se consideraron como prueba para los posibles sitios de heterocigotos. Todos esos puestos fueron asignados los códigos IUPAC ambigüedad, y considerado como ambiguo caracteres posteriores a los análisis filogenéticos. Todos los posibles sitios fueron heterocigotos cada especie, y sólo se produjeron en un solo individuo de cada especie. PCR reacciones constantemente producido un solo Actina o RAG2 amplicón, que fueron sometidos a un BLAST de búsqueda para verificar la identidad de secuencia. En todas las búsquedas BLAST, amplicones recuperar secuencias de cualquiera de delphinid o taxones de mamíferos como el partido más cercano, proporcionando una prueba más para el éxito de amplificación de la meta loci.

Análisis filogenéticos

Los cladogramas se generaron con el programa PAUP * v.4.0b10 [55] bajo el criterio de optimalidad de parsimonia, con todos los caracteres de igual ponderación. Los estudios anteriores sugieren que las deficiencias pueden ser filogenéticamente informativos en ambos codificantes y no codificantes regiones [45, 46], por lo tanto, todas las diferencias fueron consideradas como 5 estados en los análisis de parsimonia. El número de taxones y caracteres impedido el uso de opciones de búsqueda exhaustiva. Por lo tanto, hemos realizado una búsqueda heurística con 1000 adiciones al azar de los taxones, 100 árboles, celebrada en cada replicar, y de árboles bisección de reconexión (TBR), sucursal de intercambio. Además, los análisis filogenéticos se realizaron por separado para mitocondrial (cyt b y el control de la región) y nucleares (Actina y RAG2) los conjuntos de datos con los mismos parámetros de búsqueda heurística. Clado apoyo para el análisis simultáneo de árboles se evaluó con bootstrap [56] y los índices de caries [57]. El procedimiento de arranque se repitió 10000 veces, cada una en plena búsqueda heurística al azar con adición de secuencias y TBR rama intercambio con 100 árboles, celebrada en cada paso. Desintegración índices para el análisis simultáneo de árboles han sido obtenidos a partir de una búsqueda heurística de árboles limitación creado con el programa TreeRot v.2b [58]. Parámetros de búsqueda heurística son las mismas para el análisis simultáneo original.

No está bien documentado variación en el ritmo de evolución dentro de y entre la mitocondria y el genoma nuclear, por lo que un análisis Bayesiano se realizó con el programa Sr Bayes 3,0 v. [59], a fin de comparar las hipótesis filogenéticas derivados de la parsimonia y métodos Bayesianos . Cada partición de datos se le asignó un organismo independiente (disociados) general en tiempo de inversión (RTG) el modelo de sustitución con una proporción de sitios invariante y la variación en las tasas de sustitución entre los sitios. Dos carreras independientes de 2 millones de iteraciones se realizaron, cada uno con cuatro cadenas, tres calientes, uno frío, un árbol de toma de muestras en 10. La mezcla adecuada y la convergencia de las cadenas se examinó visualmente con el programa Tracer v.1.1.1 [60]; posterior probabilidades para cada clado se derivaron de los árboles muestreados después de la quemadura en el período.

El método bayesiano no tiene una opción para los problemas que tendrá el carácter 5 º carácter estados, y, por tanto, se les trata como datos que faltan en nuestro análisis Bayesiano. Algunos estudios han utilizado una matriz de brecha para incorporar en los indeles análisis Bayesiano (por ejemplo, [47]], y recientemente se han producido avances que permitan el tratamiento explícito de las lagunas en la obtención simultánea de la alineación de secuencias y la topología del árbol dentro de parsimonia, Bayesiano, y la probabilidad marcos analíticos [48 - 54]. Estos métodos son especialmente eficaces en el tratamiento de regiones difíciles de adaptar (por ejemplo, la duración variable de las regiones). Desde nuestro conjunto de datos contiene un número relativamente reducido de indeles, la mayoría de las cuales no son filogenéticamente informativos (véase más arriba), que optó por no seguir estudiando nuestros datos con estos métodos. Tales temas merecen tratamiento en profundidad más allá del alcance de este estudio.

La dinámica de caracteres: utilidad filogenética

El comportamiento de la combinación de caracteres de diferentes particiones proceso fue evaluada mediante el examen de la contribución relativa, o la utilidad, las particiones de datos para resolver las relaciones dentro del análisis simultáneo de árboles. Subdivisión de los índices de apoyo se particionado (es decir, "la partición de Bremer apoyo") con el método de Baker y DeSalle [16] para medir la contribución relativa de cada conjunto de datos al nodo de apoyo. Cuanto mayor sea el apoyo a la partición de Bremer es para una determinada partición en un nodo, mayor será la contribución relativa de esa partición para el apoyo de ese nodo [16]. Estamos también se han interesado por la relación filogenética de utilidad de la energía nuclear y mitocondrial por la secuencia de datos de nucleótidos. Por lo tanto, posteriormente la normalización de la partición de Bremer valores para cada uno de los nodos por el número de nucleótidos secuenciados.

Una serie de métodos se han propuesto para cuantificar a posteriori el aporte de un particular a la partición de datos topológicos apoyo en un análisis simultáneo [15]. Estos métodos suelen incluir una medida del número relativo de inequívoco carácter cambios se pueden atribuir a una determinada partición de datos [15, 30, 61, 62]. En este estudio, se optó por cuantificar en cada nodo del árbol de análisis simultáneo de un subconjunto de caracteres sin ambigüedades los cambios que tienen un índice de consistencia (IC) de 1, es decir, cambiar a uno de los cuatro estados posibles (A, G, C, T o) una sola vez en el árbol en un solo nodo. Debido a que estos personajes carecen de homoplasy en un árbol, le sugerimos que estos personajes tienen menos probabilidades de verse afectados por los datos de interacción caracteres que deben mostrarse homoplasy, y, por tanto, son un conservador filogenéticamente, y potencialmente útil, el conjunto de caracteres para la evaluación a posteriori de caracteres .

Usamos IC = 1 caracteres a examinar dos aspectos de la partición de datos de utilidad (Tabla 3]. En primer lugar, hemos querido determinar si la cantidad de señal filogenética en cada partición de datos se reduce con el tiempo (es decir, con el nivel de divergencia). La idea es que si el número de CI muy coherente = 1 caracteres que una partición de datos contribuye a un nodo es constante en el tiempo (es decir, no hay decadencia en señal filogenética con el aumento de la divergencia), cabe esperar una contribución positiva, relación lineal entre el número de CI = 1 rama de caracteres y longitud. Esto indicaría que una partición de datos es muy adecuado para hacer frente a las hipótesis de relaciones evolutivas en los niveles de divergencia presentes en este estudio. En segundo lugar, nos interesaba o no la contribución relativa de cada partición de datos de nodo de resolución es coherente entre las ramas de longitud variable (cuadro 3]. De conformidad patrones de evolución en el tiempo (es decir, la frecuencia relativa y la tasa de sustituciones en particular los nodos) entre múltiples loci puede proporcionar pruebas de que la variación en la rama longitudes entre las regiones de una topología representan la real historia evolutiva de un linaje. De esta manera sería posible determinar si corta ramas representan los períodos de rápida o simultánea divergencia taxonómica (es decir, son "duros" polytomies), o son consecuencia de algún aspecto de los datos, por ejemplo, incompatibilidad, o una tasa de evolución malos adecuado para resolver a corto sucursales.

Para probar estas hipótesis, lo primero que calcula el número de CI = 1 caracteres por rama de etiquetado de todos inequívoco carácter cambios en el análisis simultáneo y análisis independiente árboles con su índice de coherencia en MacClade v. 4,01 [43]. Subdivisión de longitudes (entre todos los nodos distancias) se estimaron en PAUP * v.4.0b10 [55] mediante la celebración de los análisis simultáneo de topología de árboles constante y la optimización de carácter estatal evolución a lo largo de las ramas a través de máxima verosimilitud con base empírica frecuencias, un general-el tiempo reversible (RTG) modelo, y una forma de rayos gamma parámetro estimado a partir de los datos (n = 8 categorías). Estas estimaciones de longitudes de rama y el número de CI = 1 caracteres por rama fueron utilizados en ensayos posteriores de hipótesis filogenéticas acerca de la utilidad. Para abordar la cuestión de señal filogenética con el tiempo, una regresión lineal se utilizó para examinar la relación entre la longitud sucursal y el número de CI = 1 personajes a lo largo de cada rama (Cuadro 3]. Para abordar la segunda pregunta de nodo de resolución, hemos realizado dos pruebas (Tabla 3]. En primer lugar, una prueba de ji al cuadrado para homogeneidad de proporciones se utilizó para determinar si IC = 1 personajes fueron distribuidas de manera uniforme en el análisis simultáneo de árboles con respecto a la rama de longitud. En segundo lugar, un Kruskal-walis no paramétrico de estadística para múltiples muestras se utilizó para comprobar si la proporción de IC = 1 caracteres aportados por cada partición de datos es uniforme a través de sucursales de diferentes longitudes. Se agruparon los datos en 4 categorías rama longitud (0-0.0019; 0.0020-0.0049; 0.0050-0.019; 0.0200-0.0500) para aumentar el tamaño de las muestras para realizar dichas pruebas

Además, la contribución relativa de cada partición a un nodo se examinó mediante el cálculo del índice de consistencia de inequívoco carácter cambios en primera, segunda y tercera posiciones en el codón el análisis simultáneo de árboles. A chi-cuadrado se utilizó la prueba la hipótesis nula de homogeneidad de personajes muy coherente entre el codón posiciones. Todas las pruebas estadísticas se realizaron con SPSS v. 11 paquete estadístico. Hipótesis nulas fueron rechazadas si P ≤ 0,05.

Carácter dinámica: la interacción de datos

Un rango de Spearman de correlación de particionado Bremer apoyo valores se utilizó para determinar la naturaleza y la importancia de la interacción entre las particiones de datos en el análisis simultáneo de topología. Bremer particionado valores para particiones de datos en un nodo puede ser utilizado como indicadores de conflicto entre las particiones de datos - los valores positivos indican el apoyo y los valores negativos indican conflicto. Un rango de Spearman de correlación de particionado Bremer apoyo valores de los análisis simultáneo de árboles [63] se realizó para medir el nivel y la magnitud de la interacción de caracteres en un nodo por nodo. Una significativa correlación positiva coeficiente es prueba de que las particiones diferentes nodos de apoyo en proporciones similares; una correlación negativa significativa indica conflicto entre las particiones de datos. A no significativa correlación sugiere que topológicas apoyo no está asociado con cualquier combinación de pares de datos de las particiones [17]. También se calculó el "sinapomorfía ocultos" [15] índice, que se define como la diferencia en el número de inequívoco carácter cambios en los nudos de conexión simultánea y en un análisis separado. El número de cambios inequívoco para cada nodo se determinó con MacClade v.4.01 [43]. Un negativo oculto sinapomorfía índice indica el desplazamiento, o la pérdida, de inequívoca synapomorphies de un nodo como resultado de la combinación de datos, mientras que los valores positivos sugirió la interacción sinérgica de datos. Cuanto mayor sea la magnitud del valor oculto sinapomorfía, mayor es la interacción entre los personajes en ese nodo. Una señal de prueba, un no-paramétricos analógica de la t-test, se utilizó para determinar si el análisis simultáneo tuvo un efecto significativo sobre la frecuencia de los desplazamientos sinapomorfía.

Autores de las contribuciones

ADHC diseñó el estudio, recogido muestras de tejidos, llevada a cabo el trabajo de laboratorio, realizadas todos los filogenética y análisis estadísticos, y redactó el manuscrito. RLH asistida con el diseño del estudio y múltiples borradores del manuscrito. Todos los autores han leído y aprobado el manuscrito final.

Agradecimientos

Este estudio fue financiado en parte con una tesis doctoral Improvement Grant (DDIG 0300480) de la National Science Foundation para ADHC y RLH. Las piezas fueron recogidas en parte con fondos del Centro de Vigilancia Mundial para la investigación de campo y la National Geographic Society Comité para la Investigación y Exploración. Muy especial agradecimiento a T. Markowitz a la ayuda con la recogida de muestras. Este documento ha sido mejorado en gran medida con las sugerencias de AI Cognato, A. Vogler, I. Agnarsson, H. López-Fernández, y 4 anónimos encuestados. Damos las gracias a M. Meyers y D. Koetze de Pesca del Mar Research Institute, Sudáfrica, S. Dans K. Crespo y del Laboratorio de Mamíferos Marinos Centro Nacional Patagónico, CONICET, Argentina, y J. Gibbons de la Universidad de Magallanes, Chile por su valioso apoyo en el campo. CS Baker acceso a las muestras de afuera taxones y sigue siendo una fuente de apoyo para este proyecto. F. Pichler acceso a los especímenes obtenidos de colaboradores N. Goodall, C. OLAVARRIA, y de Te Papa Tongarewa, Museo Nacional de Nueva Zelandia. Tejidos de vida libre delfines fueron recogidos con arreglo a los Mamíferos Marinos Ley de Protección de Nueva Zelandia con la autorización de la Nueva Zelandia Departamento de Conservación, y con la aprobación de la utilización de animales Protocolo comités de la Universidad de Auckland, Nueva Zelanda y Texas A & M University, EE.UU. Una parte de los especímenes utilizados en este estudio fueron proporcionados por la Dirección Nacional de Mamíferos Marinos Banco de Tejidos, que se mantiene en el Modelo Nacional de biomonitoreo Banco a NIST, y que es operado bajo la dirección de NMFS con la colaboración del USGS, USFWS, MMS , Y NIST a través de los Mamíferos Marinos de Salud y varado Programa de Respuesta. Reconocemos los EE.UU. Fish and Wildlife Service (USFWS), EE.UU. Geological Survey (USGS), National Marine Fisheries Service (NMFS), Instituto Nacional de Estándares y Tecnología (NIST), el Servicio de Gestión de Minerales (MMS), el Consejo Nacional de Mamíferos Marinos de tejidos Banco (NMMTB), y la muestra de colección para su uso en bancos de los tejidos.