Journal of Biomedicine and Biotechnology, 2006; 2006: (más artículos en esta revista)

La genómica distribución de L1 elementos: la función de inserción sesgo y la selección natural

Hindawi Publishing Corporation
Graham Todd [1], Stephane Boissinot [1, 2]

Este es un artículo de acceso abierto distribuido bajo la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original esté debidamente citados.

Resumen

LINE-1 (L1) retrotransposones constituyen la familia más exitosa de retroelements en los mamíferos y por cuenta tanto como el 20% del ADN de mamíferos. L1 elementos se pueden encontrar en todas las regiones genómicas, pero son mucho más abundantes en AT-ricos, pobres en genes y recombinación de bajos regiones del genoma. Además, los cromosomas sexuales y algunos genes parecen desproporcionadamente enriquecido en elementos L1. Inserción y sesgo selectivo ambos procesos puede explicar esta sesgada distribución de los elementos L1. L1 elementos no aparecen para insertar al azar en el genoma y la inserción de este sesgo puede al menos explicar parcialmente la genómica distribución de L1. La distribución de contrastada L1 y elementos Alu postinsertional sugiere que los procesos de desempeñar un papel importante en la configuración de distribución de L1. El mecanismo más probable es la pérdida del recientemente integrado L1 elementos que tienen efectos nocivos (selección negativa), ya sea a causa de la perturbación de la función de genes o su capacidad para mediar en la recombinación ectópica. En comparación, la retención de elementos L1 a causa de algunos efectos positivos se limita a una pequeña fracción del genoma. Comprender la importancia respectiva de inserción y el sesgo de selección será necesario un mejor conocimiento de los mecanismos de inserción y la dinámica de la L1 insertos en las poblaciones.

INTRODUCCIÓN

La secuenciación de varios genomas de mamíferos se ha puesto de manifiesto que todos están plagados de cientos de miles de copias LINE-1 (L1) retrotransposones que dan cuenta de ~ 20% de su masa (Lander et al [1], que cuenta et al [2]]. La abundancia de elementos L1 en los genomas de mamíferos es específico de esta clase de vertebrados y debe considerarse una función de diagnóstico de los mamíferos en la misma medida la posesión de los cabellos y la producción de leche de las hembras son. Como elementos L1 también son responsables de la amplificación de Sines (por ejemplo, Alu en los primates, B1 y B2 en ratón) y pseudogenes procesados (Esnault et al [3], Dewannieux y Heidmann [4], Dewannieux et al [5]], se cree que L1 actividad puede suponer hasta un 50% del ADN de mamíferos.

Aunque L1 elementos se pueden encontrar casi en cualquier parte del genoma, su abundancia varía considerablemente entre regiones genómicas. En general, L1 elementos son mucho más abundantes en AT-ricos y de bajo recombinación, los genes y las regiones pobres del genoma. Además de esta tendencia general, L1 elementos pueden ser localmente muy raras o muy abundante. Por ejemplo, L1 elementos constituyen el 89% de una región de 100 Kb en el cromosoma X mientras que están prácticamente ausentes de la homeobox gene clusters (Lander et al [1]]. Ellos parecen ser más abundantes en los cromosomas sexuales (Korenberg y Rykowski [6], Boyle etal [7], Bailey etal [8], Boissinot et al [9], Parish etal [10]], en los genes que se expresan en bajo nivel (Han et al [11]], y en monoallelically genes expresados (Allen et al [12]]. Existen diferencias en la distribución de elementos L1 con respecto a su edad y tamaño. L1 elementos más jóvenes se encuentran, por término medio, más cerca de los genes que los antiguos elementos (Medstrand et al [13]] y de larga duración son los elementos más abundantes en los cromosomas sexuales que en los autosomas (Boissinot et al [9]]. Aunque la mayor parte de los elementos L1 se encuentran en el humano y el ratón genomas se añadieron después de la división entre los primates y roedores, sus distribuciones son sorprendentemente similares (Lander et al [1], que cuenta et al [2]], lo que sugiere que algunos de los mecanismos L1 forma de distribución en primates y roedores. Aquí hacemos una revisión de los mecanismos moleculares y procesos evolutivos que podrían haber desempeñado un papel en la conformación de la genómica distribución de elementos L1 y evaluar su contribución relativa a la sesgada distribución de los elementos L1.

L1 elementos no se insertan al azar

La primera posible fuente de sesgo viene de la retrotransposition propio proceso. La reacción de retrotransposition requiere el sitio de destino para ser cortados por la L1-endonucleasa codificada. A medida que el consenso objetivo del sitio es L1 endonucleasa TT / AAAA (Jurka [14]], es plausible que L1 inserta preferentemente en AT-regiones ricas porque este motivo es excesivamente representados en estas regiones (Costo y Boeke [15]]. Se sugirió incluso que la preferencia de los elementos de L1 AT-regiones ricas podría ser una adaptación de L1 a su acogida, porque la inserción de genes L1 en las regiones pobres de los límites de la carga de la L1 retrotransposition (Lander et al [1], Coste y Boeke [15]]. Sin embargo, la mayoría de las inserciones L1 difieren de los sitios de inserción de secuencias consenso (Jurka [14], Coste y Boeke [15]], y es probable que no faltan los sitios de inserción en cualquier parte del genoma. Además, Alu son elementos más abundantes en la GC-ricas regiones del genoma, a pesar de que tienen el mismo objetivo consenso sitio-como elementos L1 (Jurka [14]]. Aunque es probable que la meta-sitio de preferencia L1 endonucleasa es, al menos en parte, responsable de la distribución de sesgo L1, esta hipótesis no ha sido probado rigurosamente.

Junto con la posible sesgo causado por la endonucleasa L1, el análisis de novo y las inserciones de elementos integrados recientemente reveló la presencia de focos de inserción en el genoma humano. De 14 de novo que causan enfermedades que figuran en las inserciones Ostertag y KAZAZIAN [16], tres se encontraban en el gen del factor VIII, cuatro en el gen de la distrofina, y dos en el gen CYBB. Otro conjunto de genes fue blanco de múltiples L1 y L1-mediado (Alu, SVA) inserciones: L1 y dos elementos Alu inserta en el gen del factor IX, y un Alu y un SVA inserta en el gen BTK. Una novela L1 inserción en el factor IX de perro ha sido recientemente descrita (Brooks et al [17]] y dos inserciones L1 producido recientemente y de forma independiente en humanos y gorilas en la misma región 1 Kb (DeBerardinis y KAZAZIAN [18]]. Además, un reciente análisis de la actualidad amplificar Ta-1 familia comprobó que cierto número de recién integrado Ta-1 elementos se agruparon en el genoma humano con más frecuencia de lo esperado por azar que sugiere la existencia de focos de inserción en varios autosomas (Boissinot et al [19]]. El conjunto de estas observaciones indican que algunas regiones genómicas tienen más probabilidades de ser objeto de L1 retrotransposition eventos que otros, y sugieren que la inserción estos puntos podrían ser conservadas entre las especies de mamíferos. No está claro por qué algunas regiones genómicas están inserción hotspots, pero es plausible que el estado transcripcional de sitio de destino región desempeña un papel. Si la estructura del ADN es modificado durante la transcripción de una manera que hace que sea más hospitalario para la L1 retrotransposition, transcriptionally regiones activas que se someten a un mayor número de eventos de transposición. Esta hipótesis requiere más investigaciones con respecto a algunos puntos calientes identificados (Boissinot et al [19]]. Si bien algunos de estos puntos calientes están en la vecindad de genes expresados en las gónadas y en los primeros meses de embriogénesis (Boissinot, Entezam, y Furano, la observación no publicados), un genoma en todo el análisis de los genes que son transcritos en los testículos no encontrar un importante exceso de L1 elementos en los genes (Graham y Boissinot, la observación no publicados). Un análisis reciente de L1 retrotransposition en células precursoras neuronales puso de manifiesto que una serie de novo L1 inserciones se expresó en neuronally genes de préstamo para apoyar alguna relación entre la actividad transcripcional de un gen y su novela hospitability a inserciones L1 (Muotri et al [20] ). Porque inserción hotspots no son particularmente enriquecido en los antiguos elementos L1, su contribución a la sesgada distribución de L1 sigue sin estar clara, pero podría muy bien explicar la abundancia de elementos en ciertos genes.

La abundancia de los últimos L1 inserciones varía significativamente entre los cromosomas, con cromosomas X 4 y aparentemente están propensos a la L1 inserciones. Un número significativamente mayor de Ta-1 inserciones se encontraron en el cromosoma 4 que en otros autosomas, no sólo porque el cromosoma 4 es relativamente gen de los pobres, sino también porque contiene varios puntos calientes detectables inserción (Boissinot et al [19]]. Once de los 14 que causan enfermedades inserción sitios antes mencionados se encuentran en el cromosoma X (Ostertag y KAZAZIAN [16]]. Aunque ligada al X mutaciones deletéreas son en general más probabilidades de ser aparente porque hemizygosity de los hombres, este sesgo no es lo suficientemente fuerte para tener en cuenta la alta frecuencia de las enfermedades que causan L1 inserciones en la X. Por lo tanto, parece que el cromosoma X es excepcionalmente propensos a la novela L1 inserciones, si bien un análisis de la Ta-1 familia no puso de manifiesto un exceso de los últimos L1 inserciones en las X (Boissinot et al [19]]. Cualquiera que sea la causa de la inserción parcialidad, es posible que el sesgo de inserción es, al menos en parte, responsable de la abundancia de elementos L1 en los cromosomas X y 4.

Selección negativa elimina elementos deletéreos L1

En general, las inserciones L1 (como la mayoría de los cambios genéticos) son mucho más propensos a ser neutral o perjudicial que favorable. L1-un alelo que contiene se considera perjudicial cuando se disminuye la aptitud de la persona que lo lleva, ya sea mediante la reducción de su supervivencia o su éxito reproductivo. Como la selección contra deletéreos alelo actuará tan pronto como la novela L1-que contiene alelo es producido por retrotransposition, es poco probable que tales alelos deletéreos llegar a frecuencias altas en las poblaciones. En la mayoría de los casos, se perdieron rápidamente de las poblaciones y nunca (o rara vez) se observa.

L1 elementos tienen el potencial de perturbar la función de los genes receptores de muchas maneras. En primer lugar, una novela L1 inserción en la secuencia de codificación de un gen más probable es que la inactivación de la proteína-función de codificación del gen, como, por ejemplo, las inserciones en los exones del gen del factor VIII y en el gen de la distrofina (KAZAZIAN et al [21], Narita et al [22]]. L1 elementos insertados en intronic secuencias también pueden tener un efecto perjudicial mediante la introducción de sitios de empalme (Schwahn etal [23], Meischl etal [24]] y polyadenylation señales (Perepelitsa-Belancio y Deininger [25]], o de que afecten negativamente la transcripción de genes ( Han et al [11]]. Si inserta antes del proceso de genes, elementos L1 también puede afectar a su regulación por perturbar las secuencias reguladoras o mediante la inserción de su propia secuencia de reglamentación, tales como su sentido o antisentido interior promotores. Por lo tanto, L1 elementos son mucho más abundantes aguas abajo de los genes que aguas arriba (Graham y Boissinot, la observación no publicados). Por último, recientemente se ha demostrado en una celda de la cultura de ensayo que L1 retrotransposition puede causar grandes (> 3 Kb) genómica supresiones (Gilbert et al [26], Symer et al [27]]. Este tipo de acontecimientos sin duda sería muy perjudicial si es que ocurrió en un gen-ricos región, pero genómica supresiones causados por L1 retrotransposition son, en general, los pequeños (<500 pb) y relativamente raras (Myers et al [28]], ya que cuenta para la pérdida total de sólo 18 Kb ya que el ser humano-chimpancé división (Han et al [29]]. Todos los posibles efectos L1 elementos pueden tener en función de genes probablemente causa su pérdida selectiva de genes y regiones ricas.

La abundancia de L1 a través de secuencias del genoma les da la posibilidad de ser eficiente mediador de embarazo ectópico (es decir, nonallelic) recombinación. Este tipo de acontecimientos llevar a reordenamientos cromosómicos que son, en general, muy deletéreos (Burwinkel y Kilimann [30], Segal et al [31]], aunque algunos han desempeñado un papel importante en la evolución del genoma (Fitch et al [32]]. Si suponemos que la frecuencia de intercambio ectópico se correlaciona con la tasa de recombinación, entonces esperamos L1 elementos para ser más perjudicial cuando residen en regiones altamente recombinación y, por tanto, eliminado por selección negativa. Porque ya L1 elementos son más propensos a mediar ectópico recombinación, este modelo de selección predice una correlación negativa entre la longitud de elementos L1 y la tasa de recombinación genómica de la región donde residen. De hecho, a largo elementos se acumulan en los bajos y no recombinación regiones del genoma (Boissinot et al [9]; Canción y Boissinot, datos no publicados) y se carece de recombinación de los hotspots (Myers et al [33]]. De este modo, el efecto negativo de recombinación ectópico puede causar la pérdida selectiva de L1 de elementos altamente recombinación regiones y, por tanto, su acumulación en las regiones de baja recombinación, que son típicamente AT-ricos y pobres-gen.

Selección positiva en favor de elementos L1

Desde L1 elementos se han descrito, los científicos se han preguntado que se benefician de su L1 de acogida podría tener. Hasta el momento, no hay absolutamente ninguna prueba de que L1 podría tener alguna función útil para sus receptores. Sin embargo, recientes evidencias sugieren que en algunos casos, L1 secuencias pueden haber sido cooptados por la acogida en su propio beneficio. Tenga en cuenta que la contratación ocasional de L1 secuencias no implica una función de L1. En algunos casos raros, listos para el uso de motivos contenida en la secuencia L1 parecen haber sido retenido por el centro de acogida (Makalowski [34], KAZAZIAN [35]]. Por ejemplo, el 5 'UTR de las modernas contienen elementos L1 sentido y antisentido promotores que en ocasiones han sido reclutados como reguladores de la transcripción de los genes del hospedador (Yang et al [36], Speek [37], Nigumann et al [38]], y fragmentos de secuencias L1 se han incorporado dentro de la codificación de la proteína-secuencias (Nekrutenko y Li [39]]. Sin embargo, el número de casos descritos de cooptación es muy pequeño y este mecanismo no tiene efecto significativo sobre la distribución general de L1. Además, uno siempre debe tener en cuenta que la retención de un elemento L1 que afectan a la expresión o la secuencia de un gen no implica que este elemento fue seleccionado positivamente (es decir, la mejora de la condición física de los anfitriones), así como podría haber sido neutral.

A pesar de selección positiva en favor de las inserciones en L1 es poco probable que han afectado a la distribución global del genoma de L1 (es decir, el sesgo hacia AT-regiones ricas), es posible que la contratación de L1 secuencias en algunas regiones podría dar lugar a un enriquecimiento de locales L1. Se ha propuesto que la L1 puede afectar el patrón de expresión de toda la genómica regiones o los cromosomas y que este efecto podría ser lo suficientemente fuerte como para influir positivamente en la abundancia de L1 en estas regiones. La idea es que los elementos L1 actuaría como "impulsores" que promueven la expansión de la heterocromatina y, en consecuencia, reprimir la transcripción de genes. Esta hipótesis se ha propuesto para explicar la propagación de X-inactivación a lo largo de todo el cromosoma X (es decir, la hipótesis de Lyon) (Lyon [40]]. La evidencia de esta función incluye la fuerte enriquecimiento de elementos L1 cerca de la inactivación X-centro en el cromosoma X (Bailey et al [8]] y la observación de X: Autosome translocaciones, lo que demuestra que el fracaso del X-inactivación de difundir la señal a menudo se correlaciona con la abundancia de elementos L1. Además, los genes que escapan a la inactivación-X se encuentran en regiones con una menor abundancia de L1 (Bailey et al [8]]. El Lyon hipótesis explicaría la abundancia de elementos L1 en los cromosomas X en varias especies de mamíferos, aunque hay importantes variaciones en la abundancia de elementos L1 cerca de la inactivación X-centro (Chureau et al [41]] lo que sugiere que la evolución de X - inactivación es anterior a la contratación de elementos como L1 Impulsores. La hipótesis de que los elementos L1 puede promover la inactivación de una copia de un gen es también apoyada por la evidencia de que monoallelically expresó genes se encuentran en las regiones del genoma que se enriquecen en elementos L1 (Allen et al [12]]. Otra forma L1 elementos pueden afectar la expresión de los genes proviene de la capacidad de L1 elementos para reducir la cantidad de transcripción produce cuando se inserta en un intrón (Han et al [11]]. Esta observación dio lugar a la sugerencia de que intronic L1 elementos contribuir al perfeccionamiento de la expresión génica (Rheostat la hipótesis) y puede dar cuenta de algunas de las diferencias en abundancia entre L1 genes (Han et al [11], Han y Boeke [42] ). Una correlación negativa entre la expresión de genes y la abundancia de su L1 en intrones Recientemente se ha informado (Han et al [11]]. Debido a que la misma observación podría también indicar que la baja de los genes expresados son mucho más permisiva a la presencia de su L1 en intrones altamente expresado que los genes, se necesitan más datos para validar la hipótesis rheostat.

L1 elementos también pueden ser retenidos en el genoma, ya que puede reducir la vinculación entre los genes y, por tanto, aumentar la eficiencia de la selección. En una región de baja recombinación, muchos débilmente seleccionado mutaciones pueden interferir unos con otros, por lo tanto limitar el efecto de selección debido a la estricta vinculación entre loci. La inserción de elementos L1 pueden mitigar esta interferencia, simplemente por el aumento de la distancia entre loci (Comeron [43]]. Aunque esta idea no ha sido probado hasta la fecha, se ha propuesto como un mecanismo general para explicar la duración de intrones y la cantidad de noncoding DNA en los genomas (Comeron [43]]. Una predicción de este modelo es que ya intrones y una mayor proporción de noncoding DNA (incluyendo L1) será favorecido en las regiones de baja recombinación.

CONCLUSIÓN

L1 distribución se ve afectada por una serie de factores que actúan en el momento de la inserción o después de que el elemento se inserta. La principal dificultad en determinar la importancia relativa de inserción y el sesgo de selección es doble. En primer lugar, los diferentes mecanismos (es decir, el sesgo de inserción y los diferentes tipos de selección) pueden tener el mismo efecto en la distribución L1, y la misma observación puede explicarse por mecanismos radicalmente diferente. Por ejemplo, la abundancia de elementos L1 en el cromosoma X puede explicarse por un sesgo de inserción, una menor eficiencia de selección negativa, o la contratación de elementos L1 como mediador de X-inactivación. En segundo lugar, genómica parámetros tales como la CG contenido, la riqueza de genes, y la tasa de recombinación no son independientes, y mediante correlaciones entre cualquiera de estos parámetros y la abundancia de L1 es poco probable que proporcione una explicación clara para la distribución de sesgo L1. De hecho, muchos de los mecanismos discutidos en esta revisión se deduce del análisis de la distribución L1, es decir, a partir de los datos que estaban tratando de explicar, y no han sido probados rigurosamente. Para comprender plenamente la genómica distribución de elementos L1, un mejor conocimiento del mecanismo molecular de la inserción y la dinámica de la L1 elementos en las poblaciones naturales será necesario.

Damos las gracias a Laurence Frabotta y dos revisores anónimos por sus útiles comentarios sobre el manuscrito.