Selección positiva, relajación, y la aceleración en la evolución del Genoma Humano y Chimp
Durante años, los biólogos evolucionistas se han interesado en la búsqueda de las bases genéticas subyacentes humanidad. Los recientes esfuerzos en una grande o una completa escala genómica se han llevado a cabo para buscar los genes seleccionados positivamente en humanos y en chimp. Sin embargo, recientemente desarrollado métodos que permiten una más delicada y controlada en la detección de positivos de selección pueden ser empleados. Aquí, utilizando 13198 genes, hemos deducido los conjuntos de genes implicados en la tasa de aceleración, selección positiva, y la relajación selectiva de las limitaciones en recursos humanos, en chimp, y en su linaje ancestral ya que la divergencia de murids. Importantes con respecto al estricto reloj molecular se han observado en humanos y 469 en 651 chimp genes. La rama más estricta de sitio de la prueba de selección positivo detectado 108 humanos y 577 chimp positivamente seleccionado genes. Una importante proporción de los genes seleccionados positivamente no muestran una significativa aceleración en las tasas, y del mismo modo, muchos de los genes acelerado no mostraron señales positivas de la selección. Diferenciación funcional de los genes en virtud de la tasa de aceleración, selección positiva, y la relajación no fue estadísticamente significativa entre los humanos y chimp con excepción de los términos relacionados con la proteína G unida y receptores de la percepción sensorial. Ambos estaban excesivamente representados en virtud de la relajación en humanos en relación con chimp. La comparación de diferencias entre linajes ancestrales y derivados, el cambio más notable en las tendencias parece haber sido favorecida por la selección positiva en el linaje humano. Como la mayoría de los genes son seleccionados positivamente diferentes, en las mismas categorías funcionales entre estas especies, que sugieren que la función de la alternativa seleccionada positivamente los genes pueden ser un factor importante en las diferencias biológicas entre estas especies.
Durante años, los biólogos evolucionistas se han interesado en saber en qué medida la selección natural y la deriva genética han dado forma a la variación genética de las poblaciones y las especies [1 - 5]. Neutralidad han proporcionado pruebas de las herramientas de gran alcance para el desarrollo de hipótesis en torno a esta cuestión. El primer objetivo de los estudios relacionados se había de hacer inferencias generales acerca de las causas de la evolución molecular, y se han realizado muchos esfuerzos para buscar desviaciones de la hipótesis de reloj molecular. Sin embargo, en los últimos diez años, el enfoque ha cambiado hacia la búsqueda de los eventos moleculares que muestra positiva de selección (PS) [6].
PS es el proceso que favorece la retención de una población de esas mutaciones que son beneficiosos para el éxito reproductivo de las personas. Contrariamente a este proceso, el reloj molecular hipótesis [7, 8] postula que la tasa de evolución molecular de las secuencias es más o menos constante en el tiempo. Esta observación se ha tomado como una fuerte evidencia de la mutación neutral hipótesis [3], que postula que la mayoría de los cambios moleculares en la evolución se debe a neutra o casi neutra mutaciones [2]. Con el creciente marco disponible para estudios de genómica comparada, ha sido posible poner a prueba contra de la neutralidad positiva (o negativa) a una selección a nivel genómico.
Los recientes esfuerzos en una gran escala genómica o se han llevado a cabo para dilucidar los misterios de la evolución humana a través de la comparación de la tasa diferencias y PS en contra de otras especies secuenciado en su totalidad. En un trabajo reciente, Dorus et al. [9] encontraron tasas considerablemente más elevadas de gen en la evolución del sistema nervioso de primates cuando se comparan contra la casa y entre los subconjuntos de cerebro de genes específicos. A partir de estos datos se propuso la selección natural como el mecanismo subyacente. Otros esfuerzos se han centrado en la búsqueda de pruebas directas molecular del PS. Clark et al. [10], con más de 7600 secuencias homólogas, que se encuentra 1547 y 1534 chimp humanos de los genes como posibles candidatos que se ha actuado respecto de PS. En un estudio posterior, Nielsen et al. [11], que utilizan más de 13000 ortólogos secuencias, encontró que 733 genes desviado de estricta neutralidad, que muestran evidencias de PS. En el último estudio publicado genómica en el momento de escribir esto, los chimpancés el Consorcio de Secuenciación y Análisis (CSAC) que se encuentran 585 de 13454-chimp ortólogos humanos como posibles genes candidatos que se ha actuado respecto de PS, que muestran un Ka / Ki> 1; [12].
En efecto, si bien estas tres publicaciones han sido características en la escala genómica búsqueda de eventos mostrando PS y han proporcionado mucho conocimiento de la materia, la combinación de métodos utilizados han producido ciertos desacuerdos y han dejado algunas consideraciones importantes en paradero desconocido. Como se señaló en el CSAC publicación, el conjunto de 585 genes observados sólo podrán ser enriquecido para los casos de PS dado que, por ejemplo, el Ka / Ki estadística que se usa puede ser> 1 por casualidad en casi la mitad de estos genes si es purificar selección No permite actuar de manera uniforme [12]. En Clark et al. [10], la sucursal y el sitio de ensayo utilizado para la PS permite distinguir linaje de los casos específicos de selección de las ramas de humanos y de chimp, que ha sido criticada por otros autores, dado que puede no haber sido la inclusión de falsos positivos originarios De la falta de poder de la prueba para distinguir los casos de verdadera PS de los casos de la relajación selectiva de las limitaciones (RSC) [12, 13]. El estudio realizado por Nielsen et al. [11], con la excepción de un pequeño subconjunto de los 50 analizados los genes, se basó en pareja comparaciones que hacen imposible saber en cuál de estos linajes de selección se ha producido. Además, en todos estos estudios, la diferenciación de los conjuntos de genes en virtud del PS establece que probablemente los casos de RSC no se ha hecho ni utilizado específicamente para el estudio.
Por último, es importante señalar que la tasa de probabilidad de las pruebas como las que se utilizan aquí, y en algunos estudios anteriores son sensibles a las hipótesis del modelo [13, 14]. Si bien las pruebas utilizadas en este estudio han demostrado tener un buen desempeño dentro de un conjunto de condiciones [14], preferimos abordar la definición de un conjunto de genes de los genomas en virtud del PS desde un punto de vista conservador. Así pues, si bien algunos de estos estudios han examinado múltiples pruebas de las correcciones sólo para casos específicos observaciones después de las comparaciones, hemos tomado el enfoque de emplear múltiples correcciones de las pruebas como la norma para todas las comparaciones, sin considerar el tiempo que establece para la confirmación de resultados específicos que Proceda.
Por lo tanto, muchas cuestiones importantes relativas a la identidad y el papel funcional de los genes que muestran aceleración, RSC, y PS, todavía siguen siendo: que son los genes que pueden ser asignados a estos grupos con un grado considerable de la sensibilidad y la confianza? Estos genes son significativamente diferentes entre las especies en términos funcionales? ¿Estos genes abarcar un grupo especial de las clases funcionales, o son la representación de un planteamiento imparcial el genoma? ¿Hasta qué punto el conjunto de genes seleccionados positivamente (PSG) difieren de la serie de genes acelerada? ¿Cuántos de los PSG se pueden distinguir de los casos de RSC? Además, podemos obtener cualquier otra visión, comparando el modelo de adaptación de los derivados de especies que, en contra de su linaje ancestral?
Todas estas preguntas sólo pueden ser respondidas por las pruebas de las desviaciones de la teoría neutral en humanos, en chimp, y, en su ancestro común, de manera independiente, sensible usando las pruebas de PS mientras que para la corrección de múltiples ensayos. En este estudio, hemos buscado el conjunto más completo de los genes humanos conocidos con el chimp, ratón, rata, perro y orthologs disponibles, a fin de responder a todas estas preguntas.
Los dos rama-sitio de máxima verosimilitud (ML) PS de las pruebas empleadas en el presente documento se benefician de un alto grado de sensibilidad en comparación con la rama de ensayos anteriores, y se pueden utilizar conjuntamente, como se ha demostrado recientemente [14], en un enfoque que Permite la detección de eventos específicos de linaje mientras que distinguir los casos de verdadera PS probable de los casos de RSC. Ambas pruebas se basan en la comparación de la probabilidad con la que dos modelos alternativos aptos secuencia de datos. Test me compara la casi nula modelo neutral (M1a) contra el modelo alternativo PS (A). M1a codón sitio asume dos clases de evolución en virtud de la purificación de selección y evolución neutral en todos los linajes de la filogenia. Un modelo considera dos clases adicionales sitio conservados o neutral sobre la evolución de todas las ramas (fondo linajes), excepto en una determinada sucursal donde se realizarán las pruebas de la PS (el primer plano linaje). Test II compara el modelo nulo (A1) en contra del modelo alternativo en el modelo A. Parámetros A1 son iguales a los del modelo A, con la excepción de que las dos clases adicionales sitio en el primer plano sólo pueden evolucionar neutral. Como fue demostrado por Zhang et al. [14], los ensayos no puedo distinguir adecuadamente los casos de RSC de la verdad de los acontecimientos PS, en tanto que los ensayos II es capaz de hacer esta distinción. Uno puede, por lo tanto, comparar entre los resultados de ambos ensayos con el fin de distinguir los casos de PS probable de los casos de RSC.
Este es el primer estudio de genómica comparativa que el linaje de los hechos concretos que participan en los procesos de PS y RSC se producen en el genoma humano, antes y después del evento de especiación que nos diferencian de nuestros más cercanos de las especies vivas se han deducido.
Se sostiene que los genes que muestran aceleración de la tasa de nonsynonymous es probable que se concentran los casos de PS. Sin embargo, la comparación de los cuadros 3 y 4 revela una notable diferencia entre la mayoría de las categorías en las GO representados ambos procesos. Si bien cuatro de los GO categorías, cada uno con más de 50 genes con una importante tasa de aceleración nonsynonymous (Cuadro 3], se encuentran dentro de los más representados en virtud de PS en ambas especies (Cuadro 4], el Grupo de los términos de receptores acoplados a proteínas y la vía de señalización Percepción sensorial estaban ausentes entre los que muestran una significativa aceleración en las tasas de nonsynonymous. Para entender estas y otras importantes discrepancias en el número de positivos observados en Ka tasa de los enfoques basados en los ensayos y II, la relación entre la diferencia de las tasas de nonsynonymous (dKa h = Ka-Ka ch), la media normalizada nonsynonymous diferencias en las tasas entre las especies (RKa = dKa / sd), y la tasa normalizada nonsynonymous (Ka / Ks), fueron estudiados.
La figura 1 muestra la distribución de rKa versus dKa valores de los genes con diferencias importantes y no significativa en Ka-Tribunal de Revisión ( "reloj molecular" en la Figura 1]. En virtud de esta distribución, cuatro grupos alternativos han sido etiquetados: las que se muestra 1), ambos PS y Ka / Ks> 1 (círculos rojos), 2) PS y Ka / Ks <1 (círculos azules), 3) Ka / Ks> 1; sin evidencia de PS (negro asteriscos), y 4) Ka / Ks <1 sin evidencia de PS (círculos grises).
El número total de genes con Ka / Ks> 1 considerarse en el análisis de la Figura 1 fue 336 en humanos (437 en chimp), de los cuales 22 (86) han mostrado pruebas de PS (círculos rojos en la Figura 1], y sólo Cinco (18) han mostrado importantes desviaciones del reloj molecular en la tasa Ka (círculos por encima de la línea). Alternativamente, 58 humanos (407 chimp) con genes Ka / Ks <1 fueron seleccionados positivamente (círculos azules). Esto muestra que el 72% de los genes humanos positivamente seleccionados no mostraron una Ka / Ks> 1 (82% en chimp). Del mismo modo, 314 (93%) humanos y 351 (80%) chimp genes que muestran Ka / Ks> 1 no han mostrado evidencias de PS (negro asteriscos). Aviso de que la mayoría de estos genes han evolucionado sin signos de nonsynonymous desviaciones de la conducta de reloj, lo que sugiere que estos valores de Ka / Ks> 1 corresponden a variaciones dependientes de un modelo de evolución neutral. El hecho de que muchos genes mostraron evidencia de PS en virtud de reloj-como comportamiento (círculos rojos y azules debajo de la línea) señala la elevada sensibilidad de la sucursal de la prueba empleada sitio donde algunos aminoácidos son probablemente los sitios que participan en eventos de PS, Sin cambios importantes en las tasas entre linajes evolutivos (dKa).
De la misma manera, al examinar las diferencias en la tasa en lugar de Ka Ka / Ks las razones de tasas, 386 genes humanos (552 en chimp) han experimentado una importante aceleración de la tasa de nonsynonymous, y sólo unos 32 de estos genes (120 en chimp) han demostrado Reciban una señal de PS. Sin embargo, al examinar los genes con una importante aceleración en la tasa de Ka y un dKa> 0,0006, la mayoría de ellos muestran evidencia de PS (81% en humanos y 94% en chimp). Aunque es importante recordar que son todavía una minoría de la totalidad de los genes con una desviación significativa en Ka-TSR.
En resumen, se observa que sólo los genes con una importante Ka-TSR y dKa> 0,0006 podrían ser considerados como candidatos para una enriquecido probabilidad de haber sido bien seleccionado. Estos resultados sirven para resaltar una de las caídas de la utilización de elevadas tasas de Ka normalizado como medio de la concentración de casos probables de PS en un a priori de moda.
Se sabe que la mayoría de las pruebas de PS no son capaces de distinguir de los hechos reales positivos darwiniano de selección de los casos de RSC [13]. Este es el caso de los ensayos que he usado en este estudio. Como se ha demostrado previamente por Zang et al. [14], los genes, observado exclusivamente en los ensayos I, pero no en los ensayos II corresponden a casos probables de RSC.
A Figura 2 muestra la distribución del total de genes comunes y observó en ambas pruebas para los tres linajes analizados. Como era de esperar, la gran mayoría de los H-PSG y Ch-PSG demostrado en los ensayos II, también se observaron en los ensayos para corregir I. Después de múltiples ensayos, 216, 793, y 941 genes fueron detectados en los ensayos I para humanos, para chimp, y Para el linaje ancestral, respectivamente. Sólo 122 humanos (1,26%), 245 chimp (2,53%), y 287 ancestrales (2,97%) los genes se encuentran exclusivamente en los ensayos I. Este exclusivo conjunto de genes fue utilizado para el estudio de las clases funcionales asociados a los probables casos de RSC.
B Figura 2 muestra los resultados de las comparaciones estadísticas realizadas (círculos llenos) entre las representaciones de los genes (en los números de sucursales) observadas con PS y RSC entre humanos, chimp, y el linaje ancestral de cuatro categorías funcionales GO. Estas categorías se encuentran entre los más representados en ambas pruebas, y servir al mismo tiempo como ejemplos de los diferentes patrones de diferenciación observados entre categorías comunes de los humanos y de chimp.
Un patrón común observado en todas las categorías funcionales representados en el conjunto de los genes en virtud de RSC es la ausencia de diferenciación funcional entre humanos y chimp (gris llena de círculos). Sin embargo, un aumento altamente significativo (llena de círculos rojos) se produjo en la representación de la expresión de proteínas G-receptores acoplados a proteínas en la vía de señalización derivado linajes en comparación con el linaje ancestral (Figura 2 B). Este importante sobre-representación de los genes en virtud de RSC fue mayor para los humanos (+32,68%, p <1e-05) que para chimp (+18,36%, p = 0,006). Teniendo en cuenta el tiempo transcurrido en cada una de las ramas (aproximadamente 75 Ma en el linaje ancestral contra 5 Ma en la evolución de los homínidos), esto sugiere que un mayor número de genes por unidad de tiempo han experimentado RSC después de la especiación en esta categoría y la de Percepción sensorial (Figura 2 B). Habida cuenta de que la relación de las representaciones PSG pertenecientes a la proteína G-receptor acoplado y el aumento de la percepción de los sentidos en los seres humanos en tanto que disminuye en chimp después de la especiación (Tabla 4, Figura 2 B), no es sorprendente que las diferencias fueron estadísticamente significativas sólo detectado en chimp (rojo Llena de círculos). Además, la proteína G unida receptor y la percepción de los sentidos fueron estadísticamente sobre-representados (p <1e-05) al comparar el conjunto de los genes en virtud de RSC en contra del resto de los genes disponibles en nuestra calidad de representantes de datos del genoma humano. En resumen, si bien ambas categorías han aumentado en la representación en humanos después de la especiación, un proceso más frecuente de la RSC se ha producido en virtud de estas dos, en ambas especies.
El patrón opuesto se observó para el metabolismo de las proteínas celulares categoría (Figura 2 B). En este caso, la representación de los genes en virtud de RSC disminuyó después de la especiación en ambas especies. Sin embargo, una mayor representación de la PSG en esta categoría se produce en chimp y es la consecuencia de un aumento marginal relativo a la condición ancestral. A más pronunciada reducción en el número de genes que se encuentran bajo RSC producido para la respuesta inmune categoría. En este caso, no se observaron genes a estar bajo RSC en humanos, y considerando la relativa representación en cada linaje, parece sugerir que mostró poca variación humano y chimp disminuyó en comparación con la proporción de ancestrales PSG, mientras que se redujo en virtud de ambas especies RSC.
La Figura 3 muestra los cambios evolutivos en las representaciones antes y después del proceso de especiación para el conjunto de las clases comunes GO deducir en virtud de ambas pruebas. La diferencia en la representación entre los humanos y el linaje ancestral para cada término funcional (H-AH) se enfrenta a la diferencia observada entre chimp y el linaje ancestral (CH-AH). Cada punto representa una categoría funcional, y en función de su ubicación en cada uno de los cuadrantes (Q) en virtud de los gráficos, los escenarios alternativos de evolución se puede deducir. La diagonal representa un aumento homogéneo (valores positivos) o la disminución (valores negativos) en relación a los valores observados para el linaje ancestral en la evolución de ambas especies.
GO de condiciones con las diferencias positivas en la representación en los dos ejes corresponden a los que cada vez más, en ambas especies, después de que el proceso de especiación (Q1). Teniendo en cuenta el proceso evolutivo de adaptación, un total de 26 categorías funcionales se ajusta a este patrón (PS gráfico). La mayoría de ellos (21) mostraron mayores diferencias en la representación en los humanos que en chimp (H-AH%, Ch-AH%), es decir, la transmisión sináptica (1,57, 0,68), la detección de estímulo abióticos (2,87, 0,21), proteína intracelular Transporte (5,73, 1,64), la energía derivada de la oxidación de los componentes orgánicos (3,13, 0,16), y los pequeños GTPasa de transducción de señales mediadas (2,87, 1,14), entre otros. Otro 20 GO términos mostró un aumento relativo de su relativa representación en humanos mientras que la disminución en chimp después de la especiación (Q4), es decir, la proteína G-receptor acoplado y la percepción de los sentidos (diferencias en la Tabla 4 y Figura 2 B), de transporte de electrones (1,3, -2,65), La generación de gametos masculinos (0,26, -1,57), los vasos sanguíneos morfogénesis (1,04, -0,77) y la cicatrización de la herida (1,56, -0,23), entre otros. El proceso contrario, lo que favorece el aumento relativo del PSG en chimp tiempo que se reduce en humanos, se detectó durante siete términos GO (Q3): apoptosis (-2,61, 0,07), transcripción (-4,42, 0,08), la regulación de la transcripción (-2,68, 0,45), las proteínas y el metabolismo celular (diferencias en la Tabla 4 y Figura 2 B), entre otros. Por último, una disminución relativa de la representación de las ancestrales PSG se observó en seis categorías GO para ambas especies (Q3): respuesta inflamatoria (-0,78, -2,61), la respuesta a las plagas, patógenos y parásitos (-1,82, -4,05), Y de la respuesta inmune (diferencias en la Tabla 4 y Figura 2 B), entre otros.
En resumen, aunque los ensayos II detectó un mayor número de PSG en chimp que en humanos, y GO plazo representaciones entre ellos no fueron significativas, la comparación entre ancestrales y derivados de adaptación tendencias muestran que de un total de 59 GO términos comunes a todos los linajes , 41 mostraron una mayor proporción de PS hechos ocurridos en el linaje humano. Sólo el 11 términos mostró una mayor proporción de PSG en chimp. Además, la diferencia en la distribución de los datos entre los conjuntos de RSC / señal débil de la PS y la de PS, sugeridos por la Figura 3, es persuasivo. Si bien las diferencias en el porcentaje de GO términos se distribuyen ampliamente entre las especies, las variaciones en GO representación de los genes en virtud de RSC están altamente correlacionadas entre las variables (p = 3.6e-15) y la caída principalmente a lo largo de la diagonal. El modelo describe un aumento y disminución de los genes RSC en el marco de cada categoría en GO proporcional y tasas similares, en ambas especies, después de que el proceso de especiación. Sólo dos de los términos GO desviado de este modelo general; proteína G junto receptor y la percepción de los sentidos son a la vez situado en el 1er trimestre por debajo de la diagonal, y sirven para poner de relieve la elevada proporción de los genes en virtud de estas categorías, es probable que los casos de RSC en ambas especies .
Vale la pena señalar que el hecho de que muchos de los genes que se encuentran exclusivamente en los ensayos he funcionalmente importantes productos, como homeobox-polimerasa y relacionados con las proteínas, entre otros, parece sugerir que es muy poco probable que todos ellos han sido sometidos a un proceso De la RSC. Probablemente muchos de ellos son genes con una débil señal de la verdad aún PS no son suficientes para ser detectadas por los ensayos II (R. Nielsen, comunicación personal). Es evidente que además de los métodos estadísticos son necesarios para diferenciar con precisión las señales débiles de PS de casos reales de RSC.
La tabla 5 muestra el gen nombre de algunos de los que pertenecen a un PSG seleccionar algunos de los más representativos GO categorías observado en el análisis. De acuerdo con las estimaciones basadas en una aceleración de tipos de enfoque [12], muchos de los eventos de selección asociados a la percepción sensorial en humanos y en chimp se detectaron en diferentes genes relacionados con la percepción auditiva. Por ejemplo, EDN3 fue seleccionado positivamente en humanos y está relacionada con la sordera neurosensorial y la hipopigmentación [20]. USH1 fue seleccionado positivamente en chimp, y la pérdida de su función produce la forma más grave del síndrome de Usher [21]. Sin embargo, PS en genes relacionados con la percepción del sonido se encuentra también en el linaje ancestral. Por ejemplo, el KPTN murino ortholog es un gen candidato para la Nijmegan waltzer ratón mutante, que tiene defectos vestibular y una variable pérdida auditiva neurosensorial [22]. Otros genes relacionados con la percepción de los sentidos también se encuentra bajo PS: la percepción del gusto se observó principalmente en el humano y el linaje ancestral, la percepción visual y olfativa del receptor de los genes se encuentran en todos los linajes. Sin embargo, como se sugirió anteriormente [12, 13], la mayoría de los eventos de RSC encontrado en la percepción sensorial categoría participan receptores olfativos. RSC en los receptores olfativos era abundante en los tres linajes. Una observación sorprendente es el gran número de genes relacionados con la percepción visual en virtud de RSC en el linaje de los homínidos ancestrales. Aunque la mayor investigación sobre este grupo de genes sería necesario, la observación probablemente tiene sentido teniendo en cuenta el cambio funcional producido por la pérdida de la forma de vida nocturna en los primates superiores [23].
Muchos otros genes con una fuerte señal de PS en humanos (H), en chimp (Ch), en humanos y chimp (H-Ch), y en el linaje de los homínidos ancestrales (AH) estuvieron relacionadas con: a) sistema nervioso, H: ARNT2 [24], H: GFRalpha -3 [25], Ch: DRP2 [26], [27] NES, b) la respuesta inmune, H: PTGER4 [28], CCL4 [29], Ch: AFP [30 ], HLA-G [31], H-Ch: IGHG3 [32], AH: HLA-DOB [33], c) del ciclo celular, H: VEGFC [34], Ch: CCNE2 [35], AH: EXT2 [ 36], SEPTIN8 [37], d) el metabolismo de xenobióticos, H: ARNT2 [38]; Ch: AKR1C1 [39], AH: ABCB4 [40], e) desarrollo de la epidermis, H: KRA58 [41], Ch: KRT10 [42], COL7A1 [43], AH: TGM5 [44], KTR2A [45], y f) la respuesta inflamatoria, H: ITGAL [46], CCL4 [29], Ch: IL1F10 [47], IL1R1 [48], AH: CCL3, CCL1, CCR2 [49]; g) la morfogénesis ósea, H-CH-AH: BMP2K [50], Ch: COL1A1 [51], [52] DCN, AH: BGLAP [53], AHSG [54] ; H) el aprendizaje y la memoria, Ch: FYN [55], GRIN2A [56], AH: APOE [57] i) la regulación de tiroides, Ch: SLC5A5 [58], JMJD1C [59]; AH: CGA [60], PTHR1 [61], y j) la reproducción, Ch: CGA [62].
Estas funciones son una pequeña muestra de los observados en este estudio y señalar la gran variedad de funciones modificados por selección natural durante homínido evolución.
Se presenta un completo análisis de la genómica evolutiva reloj molecular, RSC, y PS considerando la comparación con el linaje de los homínidos ancestrales, a fin de diferenciar las tendencias de la evolución de adaptación después de la especiación proceso de diferenciación humanos y chimpancés. Sobre la base de las pruebas desviaciones de la neutralidad en un gen por gen enfoque, encontramos un total de 1182 (9,0%) humanos y 1948 (14,8%) chimp genes con diferencias estadísticamente significativas observadas en al menos uno de los mencionados procesos. Sin embargo, después de la corrección de pruebas múltiples para que sólo se consideran 665 (5,0%) humanos y 1341 (10,2%) chimp genes como una mejor estimación de la mínima fija no neutral en virtud de la evolución de estas especies. Llegamos a la conclusión de que estos procesos evolutivos no muestran signos de ser frecuentes eventos que conforman el patrón de divergencia entre los genomas humano y chimp.
Las diferencias en las tasas de evolución existen entre las especies, si bien no hubo diferencias significativas en cifras netas. El número de genes que muestran una importante aceleración en sinónimo no exceda de las tasas de evolución de los sinónimos de cambios, y es mayor para chimp que para los seres humanos. Este exceso de nonsynonymous cambios favoreciendo chimp se correlaciona con el mayor número de PS acontecimientos observados en esta especie, y podría ser debido en parte a la comparativamente menor tamaño de la población que ha dado forma a la evolución humana [63].
Durante años, los biólogos evolucionistas han sabido que las desviaciones del reloj molecular, la tasa de aceleración o, en general, no es necesario, ni suficiente, para inferir procesos adaptativos que ocurren durante la evolución de las especies. Hemos observado que un examen de los genes con un Ka / Ks> 1 rendimiento de un conjunto que sólo el 7% -20% de los genes muestran evidencias de PS. Del mismo modo, utilizando un enfoque del Tribunal de Revisión en nonsynonymous mutaciones, que muestra diferencias importantes con los que se enriquecen de PS acontecimientos del 10% -30%. Con la adición de un valor no trivial divergencia (dKa> 0,0006), el número de genes se reduce considerablemente, pero los acontecimientos PS alcanzar una concentración de 80% -95%. Sin embargo, en todos estos casos, una gran proporción de PSG se descartan en comparación con el número de eventos PS localizarlo con la ML-rama sitio modelos II de los ensayos utilizados en este estudio.
Un estudio centrado en la genómica PS selección en humanos y en chimp ha encontrado que muchas categorías funcionales se sobre-y sub-representadas en ambas especies [10]. Esto fue en desacuerdo con los resultados obtenidos en un estudio posterior [12], donde sólo una categoría GO (reguladores de desarrollo) mostraron una posible sobre-representación en humanos en relación con chimp. En esta publicación, la posibilidad de que los resultados de Clark et al. [10] o bien que puedan contener falsos positivos que participan en RSC o RSC ha correlacionado y PS, se propuso. Nuestros resultados tienden a estar más de acuerdo con este último estudio, proporcionando evidencia de la falta de diferenciación en clases funcionales de PSG en humanos y en chimp. Nuestros resultados también apoyo la idea de que los resultados pueden Clark han incluido los casos de RSC, dado que el modelo 2 de prueba utilizado en este estudio es muy similar a los ensayos que he usado aquí, y que muchas de las clases se deduce aquí observados con una marcada presencia en virtud de RSC ( G-proteína unida receptor y la percepción de los sentidos). Sin embargo, una probable correlación entre el PS y la RSC no puede ser desechada ya que las clases funcionales altamente representados en virtud de uno de los procesos también están altamente representados en la otra.
Los conjuntos de genes, sin deducir la corrección en función de múltiples ensayos en el reloj molecular y análisis PS produjo resultados similares para la mayoría de la representación GO comparaciones observado después de la corrección. La única excepción fue la expresión de la proteína G unida vía de señalización del receptor de la proteína que se encuentra, además, sobre-representadas en humanos en relación con chimp bajo PS (Caso II, p = 0,005). Como se mencionó previamente, después de la corrección de múltiples pruebas no hemos encontrado GO términos sobre-o sub-representados entre ambas especies. Sin embargo, si las diferencias entre los humanos y chimp se consideran independientes de las tendencias de evolución de la condición ancestral, un cierto patrón parece evidente-aunque ancestrales y descendente diferencias no fueron estadísticamente significativas. Es decir, observamos que un aumento relativo del PSG se produjo en humanos de 41 de los 59 GO comunes a todas las categorías de los linajes, mientras que sólo el 11 mostró un aumento relativo de chimp aunque PSG en humanos son seis veces menos que los de Chimp. Aunque otros estudios sería necesario, esto podría sugerir que, al menos en común fuctional GO clases, humana ha crecido más allá de la chimp linaje ancestral que ha de adaptación a través de la evolución. Por último, dado que la mayoría de la PSG son diferentes entre estas especies, la función de la alternativa PSG encuentra asociada, en las mismas categorías funcionales pueden ser un factor importante en las diferencias biológicas entre el hombre y chimp.
Todo el genoma de los análisis de las propiedades de evolución se realizaron sin ningún tipo de hipótesis a priori acerca de los genes resultantes. En consecuencia, este tipo de análisis son exhaustivas y que, al mismo tiempo, los conservadores con respecto a los resultados. La necesidad de mantenimiento de la tasa de error de tipo I en un nivel aceptable conduce a un inevitable aumento en el rechazo de la verdadera resultados positivos [64]. Por lo tanto, los juegos completos de PSG acelerado y hemos encontrado sólo puede considerarse, respectivamente, de sus componentes más importantes. El resto de los genes pertenecientes a estas categorías se debe encontrar ya sea mediante el uso de hipótesis impulsada por enfoques, o por medio de métodos más sensibles. En este estudio, ya se ha expuesto ejemplos de PS, como FOXP2 y BRCA1, no mostró pruebas de PS. Esto indicaría que además de trabajo detallado sobre estos genes es obligatorio.
Durante años se ha considerado que la disponibilidad de la secuencia del genoma del chimpancé y su comparación con la de los humanos se ponen de manifiesto algunas de las bases moleculares subyacentes a las diferencias observables y posiblemente aportar pistas a la que nos hace humanos. Ahora es evidente que ni las metodologías existentes ni el detalle y la calidad de los disponibles en la anotación de genes han permitido una respuesta concluyente. En el futuro, nuevos métodos y más detalladas anotaciones funcional será necesario aclarar debidamente esta cuestión biológica pertinentes.
Ortholog anotaciones para el subconjunto de 20469 "conocido" Ensembl humanos de los genes codificantes de proteínas dentro de la serie completa (30709 genes) de la versión Ensembl 30.35h
ADN CDS fueron alineados usando ClustalW [67] y los parámetros por defecto con secuencias de la proteína traducida como plantillas. Codones se eliminaron las lagunas que contiene. Alineaciones 50 pb menor que se excluyeron del análisis. El límite superior de las tasas de Ka y Ks considerados fueron los de los humanos interferón γ (Ka = 3.06) y la proteína de relaxina (Ks = 6,39 sustituciones por sitio por 10 9 años), que muestra las tasas más altas en humanos [5]. Suponiendo que el hombre-ratón y humanos-chimp diferenciación veces a ser alrededor de 80 millones y 5 millones de años, respectivamente [68], todas las comparaciones orthologs mostrando Ks ≥ 1 y Ka ≥ 0,5 sustituciones / sitio de las estimaciones del Tribunal de Revisión, y los que muestran Ks ≥ ≥ 0,032 y 0,0152 Ka sustituciones / sitio de ML linaje estimaciones, se excluyeron del análisis. El Tribunal de Revisión se realizó a través del método de Li [69] tal como se aplican en el programa RRTree [70]. Las secuencias de humano y de chimp se realizarán las pruebas de la desviación de un reloj molecular a través del ratón, rata, y como el perro afuera. Pesos para cada especie en el grupo afuera se determinará de acuerdo con el esquema topológico ((ratón: 1 / 4, rata: 1 / 4), el perro: 1 / 2)), tal como se aplican en RRTree. Ka y Ks estimaciones se hicieron sobre la CDS alineaciones de las mayores transcripciones de genes que muestran diferencias en el contenido de GC, menos del 10%. Sólo tres de los genes mostró una diferencia GC contenido superior al 10% y se excluyeron del análisis. Las diferencias en los humanos y en las tasas de chimp se construye con las Kolmogorov-Smirnov de dos muestras de prueba [71]. ML estimaciones de la Ka y Ks se computa conjuntamente en una sucursal modelo para cada ortholog utilizando CodeML.
PS se evaluó usando dos diferentes sucursales de los ensayos con modelo de sitio (I y II) [14], aplicado en el programa de CodeML la PAML (3.15) paquete [16]. Sucursales en la filogenia se define a priori como de frente y fondo linajes. En virtud de estos modelos sólo el primer plano linaje puede contener eventos de PS. Humanos, chimp, y su linaje ancestral, derivado del ancestro común de ratón y rata, se pusieron a prueba los conocimientos adquiridos independientemente como linaje. Secuencias con menos de tres únicas diferencias en la base par codones entre humanos y chimp se eliminaron para el análisis de PS.
En contraste con el comportamiento estadístico de la anterior rama de ensayos in situ [13], los ensayos Iy II, desarrolladas y probadas por Zhang et al. [14] y empleado en una escala genómica en el presente estudio, son la mejora de los métodos de prueba in situ rama modelos ML utilizando un enfoque que ha demostrado ser más exitosa en cuanto a la diferenciación de RSC PS [14]. Test I se comparan contra M1a modelo A. M1a sitio asume dos clases, 0 <ω o <1 y ω 1 = 1, fijo en todos los linajes del árbol filogenético. Un modelo considera cuatro clases de sitios. Sitio clase 0 incluye los codones conservadas en todo el árbol con 0 <ω o <1. Sitio clase 1 incluye los codones evolución neutral en todo el árbol con ω 1 = 1. Sitio clases 2a y 2b incluyen codones conservados o neutral sobre la evolución de las ramas de antecedentes, pero que se hagan en virtud del PS en el primer plano con ramas ω 2> 1. La proporción p i el sitio de clases (p 0, p 1, p 2, p 3) y el valor medio de ω 2 se calcula a partir de los datos por métodos ML. Test II compara el modelo nulo contra el modelo A. A1 parámetros de la A1 son iguales a los de A, con la excepción de que las clases de sitio 2a y 2b se fijo en el primer plano con ω 2 = 1. Como se ha demostrado mediante simulaciones [14], los ensayos no puedo distinguir adecuadamente los casos de RSC de la verdad de los acontecimientos PS. Por otra parte, los ensayos II, al permitir selectivamente limitados sitios en el fondo para ser relajado en virtud de la proporción de clases sitio con ω 2 = 1 puesto en el primer plano de la A1, es capaz de hacer esta distinción, con una aceptable tasa de falsos descubrimiento . Uno puede, por lo tanto, comparar los resultados de ambas pruebas para distinguir los casos de PS de eventos de RSC. Dado que la comparación de modelos están anidados, el ratio de riesgo se realizaron pruebas y 2 Δ valores posteriormente se transformó en exacto de los valores de p pchisq utilizando la función de la R paquete estadístico [72]. La distribución chi-cuadrado con df = 2 y df = 1, que han demostrado ser conservador en condiciones de PS [14], se utilizaron para realizar los ensayos Iy II, respectivamente.
En todos los casos, a menos que se indique lo contrario, las estadísticas derivadas de los p reloj y PS análisis eran falsos ajustados en función de la tasa de descubrimiento de varias pruebas utilizando el método de Benjamini y Hochberg [73]. Caracterización funcional de la aceleración del PSG y se llevó a cabo por medio del programa de FatiGO funcional anotación utilizando GO [18, 19]. FatiGO implementa un análisis incluyente, en las que los niveles corresponden a los de la jerarquía gráficos dirigidos acíclicos definición de la relación entre GO términos [74], que es elegido para el análisis [18, 19]. El programa calcula un Fisher de dos test exacto de la cola con el fin de definir estadísticamente sobre-o sub-representados entre dos términos en una lista de los genes teniendo en cuenta los valores de p corregido para múltiples pruebas (falso descubrimiento independiente de la tasa de ajuste) [75].
Damos las gracias Rasmus Nielsen para proporcionar resultados no publicados sobre el comportamiento estadístico de los ensayos Iy II y valiosos comentarios sobre este documento.