PLoS Computational Biology, 2005; 1(1): (más artículos en esta revista)

Susceptibilidad a Superhelically impulsada ADN dúplex desestabilización: Un muy conservadas propiedad de los orígenes de replicación de levadura

Biblioteca Pública de la Ciencia
Sol Ak [*], Craig J Benham
Resumen

Strand separación es obligatoria para varias funciones del ADN, incluyendo la replicación. Sin embargo, las propiedades locales de ADN como A + T contenido o la estabilidad termodinámica por sí solas no determinan la susceptibilidad a esta transición en vivo. Más bien, subraya superhelical proporcionar a largo plazo la transición de acoplamiento entre los comportamientos de todos los pares de bases dentro de un dominio limitado topologically. Hemos desarrollado métodos para analizar superhelically desestabilización inducida duplex (SIDD) en el ADN genómico que tener en cuenta tanto en el presente de largo alcance inducidas por el estrés y la secuencia de acoplamiento locales que dependen de la estabilidad termodinámica. Aquí aplicamos este enfoque para examinar la SIDD propiedades de los 39 experimentalmente bien caracterizado autónoma reproducir secuencias de ADN (ARS elementos), que funcionan como los orígenes de replicación en la levadura Saccharomyces cerevisiae. Nos parece que estos elementos ARS tienen un sorprendente aumento de la susceptibilidad a SIDD en relación con su entorno secuencias. En promedio, estos elementos requieren ARS 4,78 kcal / mol menos energía libre que los que lo hacen para separar sus inmediaciones de las secuencias, lo que las hace más de 2000 veces más fácil de abrir. El análisis estadístico muestra que la probabilidad de que este fuerte una asociación entre SIDD sitios y ARS elementos que surgen por casualidad es de aproximadamente 4 × 10 -10. Este local de la mejora de la propensión a separar a los capítulos único superhelical bajo estrés tiene consecuencias obvias para su función de origen. SIDD propiedades también podrían utilizarse, en conjunto con otros atributos de origen conocido, de identificar los supuestos orígenes de replicación en levaduras, y posiblemente en otros genomas metazoos.

Introducción

En eucariotas, la replicación del ADN se inicia en múltiples orígenes. Posibles sitios en el genoma de la levadura Saccharomyces cerevisiae que puede servir esta función se conocen como la reproducción de secuencias de forma autónoma, o ARS elementos [1]. ARS son más los elementos de A + T-ricos que la media de los genomas, y contienen las regiones de baja estabilidad termodinámica locales que se consideran necesarios para la función [2, 3]. Sin embargo, la anulación dúplex necesarias para la replicación de iniciación se produce como un proceso isotérmico topologically limitada dentro de los dominios de ADN. En estas condiciones susceptibilidad a la línea de apertura no depende sólo de la estabilidad termodinámica local. En lugar de ello, insiste en pareja junto superhelical el capítulo de apertura de los comportamientos de todos los pares de base de la experiencia que ellos. Se postula que la superhelical que se producen in vivo desempeñar un papel en la regulación del capítulo de apertura necesaria para iniciar la replicación. Esto sugiere que los elementos ARS deben tener una mayor susceptibilidad a los locales superhelically desestabilización inducida duplex (SIDD). Aquí nos demuestran que prácticamente todos los elementos conocidos ARS en efecto, muestran un importante aumento de sus locales predijeron SIDD susceptibilidad. Los experimentos en cuatro ARS que contienen las regiones han demostrado que cada uno hace la experiencia local de desnaturalización cuando negativamente supercoiled [4].

Hemos calculado la SIDD propiedades de todo el genoma de la levadura previamente elaborado utilizando un método mecánico de estadística que incluye tanto la secuencia específica de estabilidad térmica y el acoplamiento global inducido por superhelical destaca dentro de los dominios topológicos. (Los algoritmos de la aplicación de este método se han presentado en otras partes [5].] Este método calcula la desestabilización de energía G (x) para cada par (a veces también llamada la energía SIDD) en el marco del especifican las condiciones ambientales y el nivel de superhelicity. Este es el aumento de energía libre que se necesita para garantizar la separación de la pareja x base en estas condiciones. Tomamos nota de que G (x) está directamente relacionada con la estabilidad, y no a la desestabilización de la más alto es el valor de G (x), el más energía que se necesita para que la base de la fuerza par abierto, y por lo tanto el más estable es. Los pares de haber G (x) cerca de 10 kcal / mol siendo esencialmente estable como bajo el nivel hipotético de superhelicity tal como se les de una forma relajada molécula. (La mayoría de los pares de bases actuar de esta manera; significativo superhelical desestabilización está limitada a una pequeña fracción del genoma, como se muestra a continuación.) Sitios con G (x) están muy cerca de cero desestabilizado, y se desnaturalizan con una elevada probabilidad, en esas condiciones , En tanto que en parte han desestabilizado sitios intermedios valores de G (x).

El SIDD energía G (x) es más informativo sobre el alcance de desestabilización que es la probabilidad p (x), de desnaturalización, ya que también considera las posiciones de desestabilización parcial. Estos pueden ser biológicamente importante porque desestabilización parcial, incluso por sólo unos pocos kilocalorías, pueden facilitar en gran medida por la apertura de otros procesos, tales como la interacción con moléculas reguladoras. Por ejemplo, superhelical desestabilización por sólo 3 kcal / mol (es decir, G (x), pasando de 10 kcal / mol de una forma relajada molécula a 7 kcal / mol bajo superhelicity), que es mucho menos que se necesita para abrir el dúplex, Todavía aumentar la facilidad de apertura de otros procesos en un factor de 130 (ver Materiales y Métodos.] De esta forma, los cambios en el nivel de impuesto superhelicity puede tener un gran efecto en las tasas de ocurrencia de eventos de reglamentación, sobre todo aquellos cuya tasa de limitación Medidas implican la apertura de filamento de la DNA.

A pesar de que estos cálculos no tienen libre parámetros, la comparación con los experimentos han demostrado que sus predicciones son cuantitativamente exacta. Ellos determinan la ubicación de la apertura y el grado de apertura, tanto como las funciones de superhelicity impuesto, en una precisión comparable a las mediciones experimentales en todas las secuencias en las que estos experimentos se han realizado [6, 7]. Muchos de los sitios que estos métodos se habían calculado previamente abierto bajo estrés Posteriormente se han demostrado experimentalmente para separar en estas condiciones, tanto in vitro como in vivo [8 - 11]. Esto da confianza en la exactitud de sus predicciones, cuando se aplica a otras secuencias en que los experimentos no se han realizado.

Nuestro enfoque para el análisis de desestabilización duplex difiere fundamentalmente de otros, como el THERMODYN y MELTMAP algoritmos [12 - 14], que sólo consideran la estabilidad termodinámica local o A + T contenido. SIDD no depende de tales propiedades locales por sí solas, sino más bien en las transiciones superhelical dominios son interactivos a nivel mundial. Debido a la separación capítulo se localizan algunos de los impuesto negativo superhelicity como untwisting en el sitio abierto, que provoca una relajación que se hace sentir en todo el dominio topológico. Así que en cualquier sitio de desnaturalización alterará la apertura de las probabilidades de cada otro sitio en el campo. Este acoplamiento mundial puede llevar a la compleja transición interactivo comportamientos que no se reflejan en la estabilidad termodinámica local [9]. Un ejemplo del largo alcance de acoplamiento inducido por superhelicity se muestra en la Figura 1.

Un genoma de una amplia vista de la desestabilización propiedades ofrece nuevas perspectivas sobre la organización cromosómica y, en concreto, sobre las propiedades estructurales de las regiones reguladoras de ADN. Para incluir estos levadura de regulación transcripcional sitios (datos no publicados), y los sitios que regulan la iniciación de la replicación, que aquí se consideran. SIDD ha sido implicado en el funcionamiento de la replicación origen en una variedad de organismos. El único origen de replicación en E. Coli, oriC, es superhelically desestabilizado, y esta desestabilización ha sido implicado en su función [15]. Otros trabajos han documentado patológica origen en la actividad SIDD sitios creados por la expansión de la pentameric repetir, causando la ataxia espinocerebelosa tipo 10 [7]. Una función se ha establecido para SIDD en la función de la Epstein-Barr oriP origen [16]. Aquí nos centramos en el desarrollo de una visión amplia del genoma de la levadura de los orígenes de replicación.

Resultados

SIDD análisis del genoma completo de levadura se haya realizado en las condiciones descritas en la sección Materiales y Métodos. La distribución acumulada de G (x) se muestra en la Figura 2. Uno ve que la mayor parte de este genoma no es muy desestabilizado; mitad de los pares de bases tienen G (x) superior a 9,13 kcal / mol. Sólo el 7,23% de los pares de bases tienen G (x) menos de 4 kcal / mol en estas condiciones, mientras que sólo 3,48% tiene G (x) menos de 2 kcal / mol, indicativo importante de desestabilización. Además, la significativa desestabilizado sitios se limitan en gran medida a las regiones reguladoras que rigen tanto la transcripción (datos no publicados) o replicación.

El SIDD propiedades de los elementos ARS

Una exhaustiva búsqueda bibliográfica encontrado 39 experimentalmente bien caracterizado ARS elementos. Estas son regiones relativamente corto que funcionan como orígenes de replicación en un plásmido de ensayo in vivo. El sitio dentro de cada uno de los elementos que los actos como el origen de replicación en estas circunstancias no suele ser identificado con mayor precisión.

Examen visual de la SIDD perfiles genómicos de los lugares que contienen estos elementos ARS demuestra que la ARS sitios concretos se producen en zonas con baja G (x) los valores, y por lo tanto, son altamente susceptibles a la desestabilización por superhelical estrés y, por tanto, excepcionalmente propensos a la línea de separación. Un ejemplo representativo se presenta en la figura 3. (Una lista completa de estos elementos y la SIDD perfiles de las regiones que contienen cada uno de los elementos se presentan en la Tabla S1 Protocolo y S1, respectivamente.)

Para cuantificar esta propensión, se determinó el valor mínimo de G min G (x) se producen dentro de cada elemento ARS. Por comparación, en cada elemento ARS se han hallado G min cerca en dos segmentos, cada uno de la misma longitud que el elemento ARS, y colocados simétricamente a cada lado de ella. Aquí hemos utilizado la comparación regiones separadas de la ARS elemento por 250 pb, pero se encontraron resultados equivalentes cuando la comparación se eligieron a las regiones directamente acerca de las ARS elementos (datos no presentados).

El valor medio de G min dentro de estos elementos se ARS 1,51 kcal / mol, mientras que G min regiones dentro de la comparación promedio de 6,29 kcal / mol. De ello se deduce que ARS elementos son mucho más susceptibles a SIDD que son regiones vecinas. El G min distribuciones de valores dentro de la ARS elementos y en su comparación regiones se muestran en la figura 4.

Seguidamente, en comparación de la distribución de G min valores dentro de la ARS a los elementos del genoma en todo el SIDD distribución se muestra en la Figura 2. Sólo el 2,79% de los pares de bases del genoma en el presente se desestabilizó en el nivel G (x) menos de 1,51 kcal / mol, el promedio para el G min ARS elementos. Esto demuestra claramente que los sitios que son superhelically desestabilizado en la medida de los elementos encontrados en la ARS no son comunes.

La significación estadística de esta Asociación

Se realizó un Wilcoxon-Mann-Whitney rango suma de prueba [17] evaluar con rigor la significación estadística de esta diferencia observada en la desestabilización entre ARS elementos y su comparación regiones. Los resultados muestran que la hipótesis nula (de que estas distribuciones son el mismo) debe ser rechazada con la confianza muy alta-el p-valor calculado por esta prueba fue p = 4,28 × 10 -10. Una prueba de Kolmogorov-Smirnov [18] de la misma distribución, realizadas con el mismo fin, dado p = 2,91 × 10 -10. Juntos, estos dos ensayos con técnicas muestran que la mayor desestabilización dentro de ARS elementos en relación con su acompañamiento regiones es estadísticamente muy significativas.

Discusión

Hemos demostrado que una fuerte sensibilidad a la desestabilización bajo el estrés es un atributo estadísticamente significativa de ARS elementos, como evaluados en sus contextos dentro de la genómica S. Cerevisiae genoma. El hecho de que el 38 de los 39 elementos analizados ARS son significativamente desestabilizado, y son en promedio mucho más que desestabilizó sus barrios, hace de esta una de las más altamente conservadas atributos sabe que se producen en los elementos ARS.

Aunque el SIDD resultados aquí presentados son consistentes con estudios anteriores que desenrolla elementos de duplex (DUEs) en ARS elementos [4], observamos tres importantes diferencias. En primer lugar, a diferencia de los atributos de estabilidad helicoidal utilizado para caracterizar DUEs, SIDD propiedades son muy dependientes no sólo de la secuencia ARS elemento en sí, sino también en su contexto más amplio. Así que cerca secuencias pueden alterar drásticamente el SIDD cambiar las propiedades de una región. Este efecto es consistente con la observación de que el origen actividad varía en función de la ubicación cromosómica, lo que sugiere la influencia de la estructura de la cromatina local [1]. En segundo lugar, además de encontrar anulación regiones, SIDD cálculos también identificar los lugares donde impuestas superhelicity disminuye la energía necesaria para separar el ADN en líneas individuales. Esto tiene un efecto exponencial sobre la facilidad con la que otras moléculas pueden inducir línea de separación (ver Materiales y Métodos]. En tercer lugar, a diferencia de DUEs, en la desestabilización ARS elemento lugares no se limita a discretos o posiciones específicas dentro del elemento.

La presencia de estrés en los lugares desestabilizados ARS elementos tiene claras implicaciones para los mecanismos de iniciación de la replicación del ADN. Bajo ciertas circunstancias, la presencia de una sola SIDD sitio se ha demostrado que confiere un cierto grado de actividad en un origen de otro modo inactivo región [7]. Otras funciones más complejas también son posibles. Observaciones de los SIDD cerca de los promotores han demostrado que la unión a proteínas pueden ejercer efectos reguladores por translocating desestabilización del sitio de unión a otros lugares [11]. Similares eventos que pueden ocurrir durante su función de origen. Los papeles de la doble B2 elementos dentro de la ARS elemento, ya sea como implicada en duplex anulación [4] o unión a proteínas [19], puede conciliarse si unión a proteínas B2 desestabilizado a un elemento se causa a la misma reglamentación translocación. Si la desestabilización fueron para pasar a la posición en la que es necesaria para la anulación de iniciación, este podría ser el mecanismo por el que se activa vinculante inicio.

Experimentalmente a investigar los detalles de la SIDD papel que pueden desempeñar en la regulación de determinados orígenes de replicación, la desestabilización de una región de propiedades pueden ser modificadas sin cambiar su base de la secuencia. Esto consiste en insertar en otro lugar una secuencia de ADN que también es susceptible a algún tipo de transición superhelical [9, 20]. Desde hace hincapié en la transición de pareja junto comportamientos de todos los pares de base de la experiencia que ellos, la introducción de una nueva región competitiva cambiará el SIDD propensión del sitio de interés. Esta estrategia ha sido utilizada previamente para demostrar que SIDD participa en la activación de la ilvP ilvP G promotor de la E. Coli [20].

La completa S. Cerevisiae genoma se ha estimado a contener entre 200 y 400 ARS elementos [1]. Las regiones de los cromosomas III, VI, XIV y que han sido sistemáticamente examinado por ARS elemento sitios conjunto, constituyen el 6% del genoma y contienen 31 ARS elementos [21]. Si esta densidad es representativa, daría una estimación ligeramente más alto de aproximadamente 500 elementos ARS en este genoma. Cualquiera que sea el número es utilizado, es evidente que sólo una pequeña parte de las ARS elementos en la levadura se han ubicado hasta la fecha.

La asociación altamente significativa estadísticamente SIDD de propiedades con elementos ARS informó aquí indica que estas propiedades puede ser útil para encontrar la ubicación exacta de ARS elementos dentro de las regiones del genoma de la levadura que se sospecha que tienen ellos. Dos estudios recientes identificado varias de estas regiones del genoma en una escala. El primer estudio identificó segmentos de ADN mostraron que la actividad vinculante para ORC MCM y proteínas [22], mientras que el segundo mide el tiempo a través de la replicación de los cromosomas completos utilizando microarrays densidad de la transferencia y la hibridación [23]. Las regiones identificadas por estos enfoques son aproximadamente 1 kb y 10-20 kb de tamaño, respectivamente-demasiado grande para localizar inequívocamente ARS elementos dentro de ellas. Desde SIDD propiedades puede calcularse con base solo par de la resolución, las predicciones de la susceptibilidad a superhelical desestabilización podría utilizarse en conjunción con estos resultados para determinar los posibles orígenes de replicación de todo el genoma de la levadura. Dos ejemplos ilustrativos son muestra en la Figura 5. Alternativamente, SIDD propiedades puede utilizarse en conjunción con otros métodos computacionales (por ejemplo, la secuencia de algoritmos basados en [24]], de origen predicción de los posibles orígenes de localizar con mayor confianza y precisión.

Hemos demostrado que una fuerte sensibilidad a la desestabilización bajo el estrés es un atributo muy conservadas de ARS elementos en S. Cerevisiae. Nuestra investigación en curso sugiere que un incremento de la propensión SIDD también puede correlacionar con la replicación lugares de origen en eucariotas superiores.

Materiales y Métodos

Se analizaron las propiedades de la SIDD completa del genoma de la cepa de S. S288C Cerevisiae [25]. Se utilizó el método descrito anteriormente según el cual la secuencia de ADN de cada cromosoma es la partición de la superposición de ventanas y en cada ventana se analiza por separado [5]. Cada ventana (excepto tal vez la última) tiene longitud N = 5000 bp, con sucesivas ventanas compensado por 500 pb por lo que cada par de base interna aparece en diez ventanas. El final de los valores de la probabilidad p (x) y la desestabilización de energía G (x) de la base de par en la posición x se calcula como el de los promedios ponderados de los valores en cada una de las ventanas que contengan la base de par. Una descripción detallada de este algoritmo se ha presentado en otras partes [5].

En todos estos cálculos conformacionales y de energía libre se dan los parámetros de sus valores medidos experimentalmente, de modo que no hay parámetros libre [8, 9]. Aquí usamos los valores apropiados para una temperatura de 37 ° C y una [Na +] de 0,01 M, las condiciones de la digestión nucleasa Kowalski procedimiento por el que la mayoría de superhelical desnaturalización es evaluado con exactitud [26]. Utilizamos superhelix densidad σ = -0,055, un moderado valor fisiológico [27]. Estos cálculos enérgicamente predecir los lugares donde se produce desestabilización, aunque los detalles de la transición perfiles varían en cierta medida con las condiciones asumidas. En particular, la elevada temperatura y el aumento de negativas superhelicity actúan de forma sinérgica; mayor estrés es necesario para lograr un determinado nivel de la desestabilización a temperaturas más bajas, otros factores restantes fijos.

Este análisis del genoma completo de levadura requiere aproximadamente 12 horas para ejecutar en un nodo de 28-X-Apple Sirva racimo, que contiene cada nodo G4 dual de 1 GHz procesadores. El perfil de la totalidad del genoma está disponible a petición.

Para comprender la importancia de la desestabilización de energía, considere la posibilidad de un sistema que puede asumir múltiples estados, cada uno con una energía G. Supongamos que dos estados, que llamamos 1 y 2, han energías G 1 y G 2, respectivamente. Equilibrio en la relación entre el número de moléculas en cada estado varía exponencialmente con la diferencia de acuerdo a sus energías f 1 / m 2 = exp [- (G 1 - G 2) / RT], donde RT = 0,616 kcal / mol T a una temperatura de 37 ° C. Se deduce de esta ecuación de la energía más bajos que los estados son exponencialmente más altamente pobladas de la energía son más altos en los estados de equilibrio.

Ahora, supongamos que este equilibrio implica la apertura de una región específica del ADN de una reacción reversible con otra molécula. Deje libre la energía necesaria para la apertura de esta región se G 1 en un supercoiled molécula, y G 2 molécula de una forma relajada, con la diferencia de la desestabilización provocada por la superhelicity. Si esta diferencia es 4,78 kcal / mol (que es la diferencia media entre el ARS elementos y su comparación regiones), esto favorecerá el estado abierta por f 1 / m 2 = 2334, por lo que en equilibrio, se producirá la apertura de más de 2000 veces A menudo, cuando esta región es superhelically desestabilizado, que cuando no lo es, otros factores restantes fijos. Tomamos nota de que esta cantidad supondría la desestabilización de nuestro G (x) de las 10 kcal / mol solamente a 5,2 kcal / mol, que es menos de lo que sería necesario abrir por completo la región. Si el capítulo de separación en este sitio es la tasa de limitación de paso en el inicio de un proceso, esta cantidad de desestabilización inducida por el estrés pueden tener un profundo efecto sobre la frecuencia de inicio.

Apoyo a la Información
Base de datos de sitios conocidos y ARS SIDD los perfiles de todas las ARS 39 Elementos
(2,3 MB PDF).
Tabla de experimentalmente bien caracterizado ARS elementos y energías Libre Asociado de desestabilización
(117 KB DOC).

El trabajo que aquí fue financiada en parte por donaciones GM68903 y R01-R01-HG01973 de los Institutos Nacionales de Salud, y DBI-0416764 subvención de la Fundación Nacional para la Ciencia. Damos las gracias a Oscar Aparicio, Stephen Bell, Carol Newlon, MK Raghuraman, Bruce Stillman, y James Theis útil para los debates, y Miraslava Kaloper de asistencia técnica.