Journal of Biomedicine and Biotechnology, 2006; 2006: (más artículos en esta revista)

El ORF1 proteínas codificadas por LINE-1: Estructura y Función Durante L1 Retrotransposition

Hindawi Publishing Corporation
Sandra L. Martin

Este es un artículo de acceso abierto distribuido bajo la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original esté debidamente citados.

Resumen

LINE-1, o L1 es un organismo autónomo no LTR retrotransposon en los mamíferos. Retrotransposition requiere la función de los dos, L1 codificada polipéptidos, ORF1p y ORF2p. El reconocimiento temprano de las regiones de homología entre el predicho secuencia de aminoácidos de ORF2 y conocido endonucleasa y las enzimas transcriptasa inversa dado lugar a hipótesis comprobables en relación con la función de ORF2p en retrotransposition. Como se predijo, ORF2p ha demostrado tener tanto endonucleasa y actividades de la transcriptasa inversa. Por el contrario, no homólogos de función conocida han contribuido a nuestra comprensión de la función de ORF1p durante retrotransposition. No obstante, se han logrado avances significativos de tal forma que ahora sabemos que es un ORF1p alta afinidad ARN proteína de unión que forma una ribonucleoprotein de partículas junto con L1 RNA. Por otra parte, ORF1p es un ácido nucleico chaperón y este ácido nucleico chaperón actividad es necesaria para L1 retrotransposition.

LINE-1 ANTECEDENTES

L1 es un intercaladas repetidas de ADN encontrado en los genomas de mamíferos que alcanzó su alto número de copias de retrotransposition. Pertenece a una gran familia de elementos móviles que replicar a través de la transcripción inversa del ARN de un intermedio. Estos elementos, no retrotransposones LTR, son distintos de los retrovirus y LTR-que contiene retrotransposones que también replicar a través de la transcripción inversa del ARN de un intermedio. No retrotransposones LTR se distribuyen ampliamente en toda eucariotas y probablemente todos compartimos el nuevo mecanismo de replicación conocido como meta-sitio-priming transcripción reversa, o TPRT, en virtud del cual la transcripción reversa del ARN L1 plantilla es una prueba de 3 'hidroxilo a la inserción genómica sitio (revisado en [1]].

Cerrar la inspección de las secuencias de> 500, 000 ejemplares de ratón, ya sea humano o L1 revela una multigene familia compuesta principalmente de truncado, mutado, o reorganizado copias de un pequeño número de funcionales, de larga duración elementos; sólo un subconjunto de la totalidad de longitud elementos es capaz de retrotransposition (ver [2, 3], por los últimos comentarios). Los retrotransposones son funcionales 6-7 kb de longitud y contienen dos largos marcos de lectura abierta (ORFs), ambos de los cuales codifican proteínas que se requieren para retrotransposition [3]. ORF2 codifica un polipéptido 146 kd que proporciona las dos conocidas actividades enzimáticas que se requieren para convertir el ARN intermedio en una nueva copia de ADN genómico de L1 durante TPRT: endonucleasa [4] y la transcriptasa inversa [5]. Estas dos actividades de ORF2p se predijo similitud de secuencia entre L1 y conocido apurinic / apyrimidinic endonucleasa [4] y la transcriptasa inversa [6, 7] proteínas, y luego verificada bioquímicamente [4, 8]. Por el contrario, el papel de ORF1p durante retrotransposition se ha mantenido mucho más difícil de alcanzar debido a que la secuencia de aminoácidos predicha por ORF1 carece de homología con cualquier proteína de función conocida (ver [9], y los resultados de octubre de 2005 NCBI proteínas y de nucleótidos búsquedas).

ORF1 y las formas conexas de secuencias

La primera secuencia de codificación intacta para una proteína ORF1 se encontró por análisis de secuencias de un ratón llamado L1 elemento L1Md-A2 [7]. La comparación de la traducción teórica de 41,2 kd esta proteína de L1Md-A2 a la de un consenso primates L1 secuencia reveló que el C - terminal de la mitad de ORF1 se desarrollaba bajo presión selectiva, mientras que el N - media terminal no lo era. Este primer análisis también tomó nota de que la proteína predice ORF1 es bastante básico, una característica común de los ácidos nucleicos-proteínas de unión [7]. Posteriormente, muchos ORF1-al igual que las secuencias se han determinado a partir de la L1 elementos de diferentes mamíferos, y de elementos relacionados con los peces se encuentran en [16]. El C - terminal, homóloga, base de dominio es una característica general de la ORF1 proteínas de todos estos elementos (el dominio conservado en la Figura 1].

Una segunda característica de predecir todos los ORF1 de estas secuencias de aminoácidos es la presencia de una larga espiral de la bobina de dominio aguas arriba del dominio conservado (Figura 1]. En humanos L1, esta espiral de la bobina de dominio abarca una cremallera leucina [18]. En conejo ORF1, esta espiral de bobina región parece similar a la queratina [15]. La explicación más probable para los pobres similitud de secuencia entre las diferentes secuencias de ORF1 en esta región entre sí y con otros en espiral de la bobina que contienen proteínas (por ejemplo, queratina) es que todos comparten un enrollado de la bobina de dominio con distintos orígenes evolutivos, probablemente traído en la proximidad con la conservadas, de base C - terminal de dominio a través de la recombinación. Recombinación para crear nuevas variantes de secuencias a menudo es evidente en L1 linajes [19 - 23]. Con este escenario, las limitaciones impuestas por el requisito de proteína-proteína interacción a través de un enrollado de la bobina de dominio en ORF1 proteína fuerzas un pequeño grado de similitud aparente en ausencia de homología entre estas diversas secuencias. Por el contrario, es posible que todas estas secuencias ORF1 evolucionado desde un ancestro común, pero extremadamente rápida divergencia de las secuencias hacia la N - terminal de la proteína se ha oscurecido las pruebas de esta homología. Es interesante señalar que la variación de secuencias en este N - terminal de ORF1p región es especialmente grande en los subtipos de humanos [24], rata (ver [2], y las referencias en él), y el ratón (ver [25, 26], y las referencias en él) L1. Positivo selección actuando en el marco de esta parte de la ORF1 proteína se asocia con el éxito evolutivo / extinción de los linajes L1, quizás reflejando la unidad de ORF1p ya sea para atraer o evitar un factor de interacción [24]. Secuencias adicionales de elementos L1 en otras especies pueden arrojar luz sobre si la secuencia de aminoácidos de la N - terminal región está sufriendo fuerte presión selectiva para la secuencia rápida divergencia de la acumulación de las sustituciones de reemplazo, o si las secuencias de novela suelen ser adquirido de fuentes nonhomologous.

Una inesperada característica de la L1 ORF1 secuencia se pone de manifiesto cuando su secuencia de aminoácidos se utiliza como la consulta en un BLASTP búsqueda. El programa informa de que ha detectado un dominio putativo conservadas. Este dominio se conserva toda la esencia de mamíferos ORF1 secuencia de la proteína y se ha anotado "transposase 22." Transposase Teniendo en cuenta que es la enzima responsable de la ruptura del ADN a participar en reacciones que ocurren durante la transposición de una amplia variedad de elementos de ADN [27], Parece probable que sea un nombre inapropiado para llamar a este dominio una transposase por varias razones. Es más importante, la reacción TPRT utilizados por L1 y el otro no-LTR retrotransposones no requieren una actividad enzimática transposase porque cDNA se sintetiza in situ utilizando primers cromosómicas [28]. Por lo tanto, L1 replicación carece de cualquier intermedios equivalente al doble capítulo de ADN sustrato de transposases y los relacionados con integrases [27]. Por otra parte, bioquímica y análisis mutacional demostrar que la actividad de endonucleasa L1 ORF2p es responsable de las divisiones de ADN que se producen durante TPRT [4, 29, 30]. Por último, se conserva el dominio en ORF1p conocida funcional de ratón y humanos L1 elementos carece de un motivo aparente DDE [31], que se conserva en los sitios activos de transposases y integrases. Debido a la gran secuencia de divergencia entre los miembros de la transposase / integrasa superfamilia de las proteínas, sus motivos son DDE mejor reconocidos en la estructura [32] en lugar de alineamientos de secuencias; absoluta, por lo tanto, la resolución de la cuestión de si L1 ORF1p debe ser anotado "transposase 22" espera atómica a nivel de resolución de su estructura.

ORF1p es necesaria para RETROTRANSPOSITION

Incluso la relativamente conservadas C - terminal de dominio de ORF1 es más divergentes que ORF2 cuando las secuencias de humano y del ratón se comparan L1s [7]. Por lo tanto, cuando finalmente fue posible medir L1 retrotransposition actividad autónoma mediante un ensayo retrotransposition [5, 33], se inesperado al enterarse de que las mutaciones en ORF1 fueron al menos tan grave, si no más, que los que abolir la transcriptasa inversa actividad . No retrotransposition eventos fueron detectados en humanos L1 mutantes en los que o bien la serina en la posición 119 del ORF1p se sustituyó con un codón de parada, o una muy conservadas diarginine a 261/262 fue sustituido por dialanine; en ambos casos, la frecuencia de retrotransposition era inferior al 0,06% de los de tipo silvestre parental elemento. En cambio, la mutación de una crítica activa in situ de residuos en el dominio de la transcriptasa inversa del ORF2 (D702Y), que suprime in vitro la actividad enzimática [8], golpeó retrotransposition hasta el 0,15% de tipo salvaje [5]. La otra conocida actividad enzimática de ORF2 en L1 es endonucleasa, que también es necesaria para TPRT [34]. Varias mutaciones que eliminar endonucleasa detectable en una actividad in vitro nicking ensayo retrotransposition golpee de nuevo a 0.2-1%, pero no eliminarla [34]. Observamos efectos similares de mutaciones en el dominio ORF1 conservadas en comparación con la endonucleasa y la transcriptasa inversa en los dominios del ratón L1. Así, hasta la fecha, con las más estrictas mutaciones de L1 son aquellos en ORF1. Como se ha señalado, cuando el leakiness de la ORF2 mutaciones fue inicialmente observado, es probable que ORF2p que es más fácil ofrecidos en transeuropeas (aunque con reducido sustancialmente la eficiencia, [5]], mientras que ORF1p parece ser cada vez más exigentes requeridos en cis con el ARN L1 . Estos resultados implican que ORF1 es fundamental para un primer paso en el ciclo que retrotransposition transcripción reversa sí, por ejemplo, la regulación de expresión de ORF2 [35] o la contratación de ORF2p en la L1 ribonucleoprotein complejo, y / o entrega de la L1 a la RNP cromosómicas ADN y facilitar los intercambios capítulo que se requieren durante TPRT [17, 36].

A la luz de las estrictas cis-requisito para ORF1p durante L1 retrotransposition, es interesante que ORF1p parece ser prescindible cuando la L1 mecanismos previstos por ORF2p es usurpado por los humanos SINE, Alu, por su amplificación de este sorprendente hallazgo puede explicarse si SRP9/14 la proteína puede reemplazar la función ORF1p [37]. Por el contrario, se requiere ORF1p junto con ORF2p para procesados pseudogene formación de L1 [38, 39].

Análisis funcional de ORF1p: proteína-proteína interacción

Leucina cremalleras y enrollado-bobina dominios son típicamente asociados con la proteína-proteína interacciones. En citoplásmica extractos de células humanas que expresan altos niveles de L1, NTera2D1, la ORF1p (también llamado p40) particiones en un x 160000 g de pellets. El tratamiento de este precipitado con el aumento de las concentraciones de glutaraldehído al vínculo entre la proteína turnos de cantidades cada vez mayores de los 40 kd ORF1 en los complejos de proteínas que funcionan a 78, 89, 100, y 200 kd en SDS-PAGE, lo que sugiere que la ORF1ps en estos citoplásmica son partículas que interactúan estrechamente entre sí, o con otras proteínas celulares. Este estudio examinó también de larga duración p40 y diversos truncations expresado en E coli de proteína-proteína interacciones, con lo que la cartografía multimerization dominio a la N - media terminal de la proteína, en la región del previsto en espiral-bobina [9].

Similares resultados se obtuvieron con el ratón L1 ORF1p algo diferente utilizando métodos experimentales. Proteína recombinante purificada de E coli coimmunoprecipitated 35 S marcado con la proteína sintetizada in vitro en lisado reticulocitos de conejo, lo que demuestra que el ratón es capaz ORF1p a la libre asociado [40]. Una combinación de levadura 2-híbridos y GST pull-down ensayos fueron posteriormente utilizados para el mapa la región en ratón ORF1p responsable de multimerization; previsto en espiral de la bobina de dominio es a la vez necesaria y suficiente para la proteína-proteína interacción [41]. Más recientemente, la sobreexpresión de ORF1p soluble en baculovirus permite el análisis de su estado multimerization de nalytical ultracentrifugación. Estos estudios revelaron que la de larga duración constituye una proteína muy estable homotrimer, mientras que un truncado ORF1p que contiene sólo la carboxi-terminal C -1 / 3 no libre asociado, incluso a relativamente altas concentraciones de proteínas [17]. Todas las conclusiones anteriores constante apoyo a la conclusión de que la espiral de la bobina de dominio es totalmente responsable de multimerization en ambos ratón y humanos L1 ORF1ps, con el trimer ser biológicamente relevante la forma de ratón ORF1p [17].

Análisis funcional de ORF1p: ácido nucleico vinculante

El sesgo hacia la gran aminoácidos básicos en ORF1p condujo a la hipótesis de que esta proteína interactúa con los ácidos nucleicos [7]. Los primeros indicios de esa interacción fue proporcionada por cosedimentation de ORF1p con L1 ARN en gradientes de sacarosa cargado con citoplásmica extractos preparados a partir de el ratón de carcinoma de células embrionales línea F9. La pesada complejos que se denomina formado ribonucleoprotein partículas L1, L1 o RNP. L1 RNPs no son sensibles a las perturbaciones de EDTA, pero son sensibles a la proteólisis [42]. La exposición de los RNPs a la luz ultravioleta rápidamente enlaces cruzados la ARN a las proteínas, lo que indica una estrecha asociación entre L1 ARN y proteínas [21]. La humanos ORF1p (p40) también se asocia con L1 ARN sobre la base de una serie de experimentos cosedimentation. p40 permanece en el sobrenadante a centrifugación a 800 y 12000 x g, pero en "pellets" x 160000 g. Tratamiento de la citoplásmica extracto (800 x g sobrenadante) con RNasa DNasa, pero no antes de centrifugación cambios de la p40 x 160000 g precipitado al sobrenadante, lo que indica que la proteína es granulación, ya que se encuentra en un gran complejo con ARN, o una RNP . La L1 RNPs humanos no dependen de cationes divalentes o perturbado por 10 mM EDTA, por lo tanto, parece que ORF1p humanos se ve obligada a ARN en una RNP que es muy similar al ratón L1 RNP. Otros experimentos indicaron que el ARN presente en estos RNP se L1 ARN y no G3PDH actina o ARN [9]. La presencia de RNP en ORF1p resultó ser sensible a las altas concentraciones de cationes monovalentes así como RNasa tratamiento [43, 44], dando lugar a un enriquecimiento procedimiento de ARN-ORF1p libre de células humanas [43], que luego fue utilizado para aportar pruebas de una o dos relativamente alta afinidad de unión de ORF1p en L1 RNA [35]. Es importante señalar que todos estos experimentos examinar la interacción de L1 con ORF1p ARN en extractos de células animales donde L1 y ARN ORF1p estuvieron presentes como componentes minoritarios de una mezcla compleja.

Una evaluación más directa de ácido nucleico vinculante propiedades de la proteína ORF1 es proporcionada por los estudios de proteína altamente purificada preparado después de sobreexpresión en cualquiera de E coli o baculovirus de las células infectadas de insectos. Al igual que ocurre con ORF1p de células de mamíferos, es fundamental tomar precauciones contra copurification de ARN con la proteína-proteína cuando se purifica en la norma, nondenaturing condiciones, sin altas concentraciones de cationes monovalentes, es coenriched RNA y la proteína está fuertemente contaminada con ácido nucleico. Esto es evidente en una longitud de onda de exploración, o mediante el examen de la proteína purificada de bromuro de etidio después de la tinción mediante electroforesis en geles de agarosa [41]. Nuestros primeros experimentos con la proteína expresada en E coli utilizado condiciones de desnaturalización (8 M urea) para purificar la proteína insoluble de la inclusión fracción cuerpo que al mismo tiempo vinculado eliminado el ácido nucleico. Esta proteína se utiliza para la UV enlaces cruzados y la movilidad electroforética de los ensayos de cambio (EMSAs), lo que demuestra que el ARN se une ORF1p y de un solo hundidos ADN [40]. Las afinidades observadas en los experimentos, sin embargo, fueron inferiores a los obtenidos con los experimentos posteriores que se realizaron utilizando la proteína purificada de la fracción soluble en lugar de la desnaturalización de proteínas refolded de cuerpos de inclusión, probablemente debido a que la mayoría de la proteína no es correctamente refolded a su nativa forma después de la desnaturalización. Curiosamente, el RNA-vinculante de la región de larga duración ORF1p fue asignada por el simple examen de diversos GST-ORF1p construye la fusión (con un contenido de larga duración y una variedad de regiones de truncado ORF1p) para detectar la presencia de ARN copurifying. Mientras que la E coli extractos y purificación de afinidad medidas se mantendrán en las concentraciones fisiológicas de cationes monovalentes, con ARN copurified si la proteína que contiene el ARN vinculante de dominio. Todas las supresiones que contiene la C -1 / 3 de base de dominio fueron contaminados con el ARN y los que carecían de ella eran libres de contaminación ARN. Esta misma región del ratón ORF1p se consideró necesario y suficiente por la unión de ácidos nucleicos basada en la transferencia de 32 P de ARN a la proteína de UV entrecruzamiento [41].

El ARN vinculante de las propiedades de larga duración ratón ORF1 proteína purificada de baculovirus se evaluó a través de más coimmunoprecipitation y filtro vinculante ensayos. Estos experimentos examinaron la afinidad de ORF1p para una variedad de transcripciones, y si una prueba específica cis-actuando en secuencia del ratón L1 ARN ORF1p reclutas. La presencia de una alta afinidad humana sitio en L1 ARN se propuso sobre la base de coimmunoprecipitation preferencial de un 41 nt T1 nucleasa-resistentes fragmento con ORF1 de anticuerpos [35]. El ratón L1 ARN coimmunoprecipitation experimentos revelaron que la eficacia de la recuperación 32 P RNA marcado con por lo menos 38 nt, sugiriendo un efecto de duración en lugar de una secuencia requisito. Todos los RNAs ya probado precipitó de manera eficiente, independiente de la secuencia. Una prueba más de que ORF1p es un nonsequence específicos de ARN-proteína de unión fue proporcionada por los resultados de nitrocelulosa filtro vinculante ensayos utilizando altamente purificada ratón ORF1p expresados en baculovirus. Las transcripciones que figura específicamente la secuencia de 38 nt, ya sea en el sentido de orientación antisentido o ambos vinculados con una alta afinidad. Aunque hay un ligero aumento en la aparente afinidad de ORF1p a ARN que contiene el sentido de secuencia de 38 nt en comparación con la misma secuencia en antisentido orientación, es sólo el 4 - a 7 veces y, por tanto, demasiado pequeños para ser considerados vinculantes específicos de sentido frente al ARN antisentido L1 [45].

Esta discrepancia entre los resultados con el ratón y el humano L1 ORF1ps sobre la existencia de una alta afinidad lugar de unión dentro de L1 ARN no ha sido resuelto. Posiblemente, es debido a las diferencias entre ratones y humanos L1, o, más probablemente, entre los reactivos utilizados para los ensayos. Por ejemplo, es posible que otra proteína que es crítica para el sitio de especificidad estaba presente en la preparación parcialmente purificada de células humanas, pero cuando faltan las proteínas purificadas de baculovirus de las células infectadas de insectos o E coli. La cuestión de si L1 ARN contiene un procedimiento específico, de alta afinidad para el sitio de unión ORF1p es importante para la biología L1, ya que ofrece una atractiva explicación para el cis-de preferencia ORF1p para L1 ARN es evidente que tanto desde el patrón evolutivo de L1 y como evidencia experimental de la autonomía retrotransposition ensayo (ver [38, 39], y las referencias en él).

Análisis funcional de ORF1p: ácido nucleico chaperón actividad

No retrotransposones LTR están presentes en todo Eukaryota, pero divergieron hace mucho tiempo en cinco grupos basados en las relaciones filogenéticas de su región de la transcriptasa inversa (la única secuencia característica se conserva entre todos los no-retrotransposones LTR) y el tipo y la organización de sus dominios de la proteína [1 ]. Tres de estos grupos, L1, I, y Jockey, cada llamado para el primer elemento de ese grupo se describe, tiene un ORF aguas arriba de su transcriptasa inversa-que contiene ORF. En dos de estos tres grupos, y Jockey, los ORFs aguas arriba (es decir, ORF1s), ambos contienen zinc-finger dominios, por lo que su ORF1 proteínas que recuerda de retrovirales gag proteínas. Una función importante asociado con el zinc-finger-que contiene, nucleocápsida dominio de mordaza es la de chaperona de ácidos nucleicos, lo cual es esencial para la replicación retroviral [46]. Chaperones de ácidos nucleicos son proteínas que facilitan reordenamientos de los ácidos nucleicos para su termodinámicamente más estable. Una combinación de al menos tres proteínas características contribuyen a ácido nucleico chaperón actividad: neutralización cargo debido a un exceso de aminoácidos básicos, una mayor afinidad por un solo varados a más de dos ácidos nucleicos hundidos, y la capacidad para reducir la cooperativity de la hélice: bobina de transición [47]. Estas propiedades deben ser exquisitamente equilibrado a fin de que los chaperones pueden promover tanto la fusión y recocido de los ácidos nucleicos. El ORF1 proteína de la no-LTR retrotransposon, factor I, comparte varias propiedades bioquímicas con retrovirales nucleocápsida proteínas, incluyendo la capacidad de acelerar de recocido complementarios de un solo capítulo de las secuencias de ADN, esas observaciones condujeron a la sugerencia de que el factor I ORF1 proteína funciona como un ácido nucleico chaperón durante la replicación [48].

Mouse ORF1 proteína L1 también acelera recocido complementarias de oligonucleótidos. Además, se disminuye el Tm de mispaired dúplex de ADN, un capítulo se acelera el desplazamiento de reacción si un imperfecto duplex se ve desafiada por la adición de el complemento perfecto, y altera la fuerza necesaria para la hélice: bobina de transición a una sola molécula de estudios que utilizaron pinzas ópticas [36, 49]. Es significativo que el ácido nucleico chaperón ORF1p de actividad es necesaria para retrotransposition. Un único punto de mutación que destruye la actividad efectiva chaperón (R297K) sin que ello afecte o ARN de un solo hundidos ADN afinidad también destruye retrotransposition actividad [49]. En consonancia con esta observación, la mutación análoga en humanos L1 también destruye retrotransposition, pero no RNP formación [44].

RESUMEN

L1 es posiblemente la más importante fuerza dinámica que actualmente operan en el genoma de mamíferos. Retrotransposition es sólo una de las muchas facetas de la contribución de la L1 a la plasticidad genética y la diversidad [50], a pesar de que se encuentra en la raíz de todos los demás. Retrotransposition requiere de las proteínas codificadas por tanto de los dos marcos de lectura abierta en L1. Las dos funciones conocidas de la proteína codificada por el ORF2, endonucleasa y la transcriptasa inversa, fácilmente se prevé sobre la base de homología de secuencia, mientras que la homología hasta ahora no ha proporciona pistas sobre la función de la proteína ORF1. A pesar de esta desventaja, sin embargo, varios se han logrado avances significativos en el establecimiento de la estructura y la función crítica de esta proteína retrotransposition aunque una serie de in vivo e in vitro experimentos. La proteína se une ambos ARN y ADN, con una mayor afinidad por un solo varados a más de dos hundidos los ácidos nucleicos. El ARN vinculante función conduce a la formación de RNP y entrega segura de la RNP para el ADN genómico a fin de que pueda someterse a TPRT. El ácido nucleico chaperón actividad de ORF1p probablemente contribuye más directamente a la transcripción reversa de TPRT, tal vez por la línea de facilitar los intercambios ese lugar el primer ADN en el ARN o ADNc plantilla, por fusión o estructura secundaria en el ARN, o ambas cosas.

Doy las gracias Branciforte D, E Epperson, Wl Li P, Rose C, y un andador útil para los comentarios sobre el manuscrito y GM40367 NIH en busca de apoyo.