PLoS Computational Biology, 2005; 1(1): (más artículos en esta revista)

El Plan de Genómica tDNA Operon Expresión en E. Coli

Biblioteca Pública de la Ciencia
David H Ardell [¤], Leif A Kirsebom
Resumen

En el rápido crecimiento de los microorganismos, una concentración de tRNA perfil enriquecido en los principales isoacceptors selecciona para el uso sesgado de los codones afines. Esto optimiza la traducción de la tasa de menos masa invertido en el aparato de traducción. Esa racionalización traslacional se piensa que es el crecimiento regulado, pero su base genética no es muy conocida. En primer lugar, encontramos en el reanálisis de E. Coli tRNA perfil que el grado en que se translationally simplificado es casi invariante con la tasa de crecimiento. Entonces, usando mínimos cuadrados de regresión múltiple, la partición de tRNA isoacceptor piscinas para predecir tDNA operones de la E. Coli K12 genoma. Co-expresión de operones tDNAs explica en el tRNA perfil significativamente mejor que la dosis de genes tDNA solo. Asimismo, operón expresión aumenta significativamente con la proximidad al origen de replicación, oriC, en todos los índices de crecimiento. Genoma ubicación explica aproximadamente el 15% de la variación en la expresión una forma, a una determinada tasa de crecimiento, que es coherente con la replicación de genes que dependen de la concentración de efectos. Sin embargo, el cambio en el perfil del tRNA con la tasa de crecimiento es inferior a la que cabría esperar de tales efectos. Hemos estimado por copia para todos los tipos de expresión tDNA operones que eran compatibles con estimaciones independientes para ADNr operones. Asimismo, se encontró que tDNA operón ubicación, la ubicación y la dependencia de expresión, fueron significativamente diferentes en la primera y menos capítulos. Operonic la organización genómica y la ubicación de tDNA operones son importantes factores que influyen en su expresión. No aleatoria de los patrones de localización y strandedness mostrado por tDNA operones en E. Coli indican que su estructura genómica puede ser en virtud de la selección fisiológica a satisfacer la demanda de tRNA expresión en altas tasas de crecimiento.

Introducción

Durante un crecimiento equilibrado en los medios de comunicación ricos, procariótico y eucariotas microorganismos seleccionados para crecer de manera eficiente se enriquecen en "grandes" isoacceptor tRNAs afines a la "preferida" codones en el transcriptome [1, 2]. Esto se explica como una estrategia de maximización de crecimiento: para lograr una alta tasa de crecimiento, ribosomas debe ser saturado de complejos ternarios (tRNA + + elongación factor Tu GTP) al mismo tiempo que el invertido en masa debe disminuir ternarios complejos [3]. Desde esta perspectiva, ribosomal sustratos especializados en los principales isoacceptors para optimizar una relación inversa entre la tasa y masa de los aparatos de traducción [3]. Llamamos a este fenómeno la racionalización de la traducción.

Hay una cuestión de si el perfil del tRNA se convierte cada vez más en los principales isoacceptors enriquecido a tasas de crecimiento más altas. Algunos de los estudios iniciales del Norte utilizando las concentraciones de tRNA blots encontró que éste sea el caso: isoacceptors importante aumento de más de 4 veces a altas tasas de crecimiento, mientras que la mayoría de menores isoacceptor bajó [4, 5]. Un posterior estudio muy meticuloso de la utilización directa cuantificación radiactivamente etiquetados tRNA proporciona presumiblemente la más precisa, exacta, completa y mediciones de las concentraciones de tRNA en cualquier organismo, hasta la fecha [2]. Los autores encuentran que las concentraciones de los principales isoacceptors aumento con una tasa de crecimiento, pero sólo alrededor de 2 veces, de 0,4 a μ = μ = 2,5 doublings / h, menos que se había encontrado en los estudios previos, mientras que las concentraciones menores isoacceptor sigue siendo aproximadamente el mismo. Llegan a la conclusión de que los datos son consistentes con la hipótesis de crecimiento que dependen de los tipos de enriquecimiento de los tRNA perfil, una hipótesis que llamamos crecimiento regulado traslacional racionalización.

Aunque codón sesgo en el uso cada vez más eficiente microorganismos como Escherichia coli ha sido considerado uno de los mejores ejemplos de selección a nivel molecular (véase por ejemplo, [6]], los factores que determinan las concentraciones celulares tRNA que co-varían con las codón Patrones de uso aún no se conocen. Los mecanismos subyacentes de crecimiento dependiente de la modulación de las concentraciones de tRNA han sido llamados un misterio, y especularon con que se elabore. Se trata de un estándar de facto en los estudios computacionales para el uso de genes tRNA (tDNA) la dosis (es decir, el número de copias en el genoma) como sustituto de la concentración de tRNA [7 - 9], sin embargo, en E. Coli, la dosis de genes sólo explica alrededor de la mitad de la variación en las concentraciones de tRNA [2] en cualquier tasa de crecimiento. Asimismo, la dosis de genes no pueden explicar cualquier eventual crecimiento dependen de los tipos de modulación en el tRNA perfil. TDNAs, al igual que otros genes, están organizados en operones en procariotas, y es natural preguntar si una perspectiva orientada al operón podría ofrecer una mejor comprensión de las fuerzas que determinan el perfil del tRNA.

Además, hemos querido investigar si la organización genómica de tDNA operones desempeña un papel en la determinación del perfil del tRNA. Algunos se encuentran en tDNAs común operones con ribosomal RNA genes (ADN ribosomal, o rDNAs), y tDNA y ADNr operones de regulación aguas arriba tienen muchas características en común [10]. Hay un claro efecto de la posición sobre el genoma relativa salidas de las siete E. Coli ADNr operones: las que más cerca del origen de replicación tienen relativamente mayor expresión [11]. Esto se debe a que en las bacterias tales como E. Coli, que puede dividir más rápido que el tiempo necesario para replicar su genoma completo, la superposición de rondas de replicación del genoma conducir a una mayor concentración relativa de los genes cerca del origen de la replicación [12]. La dosis de un gen es que se distingue de su concentración. Genética de la dosis es el número de copias de un gen en el genoma, y es estático con respecto al estado fisiológico de un organismo o replicativa el estado de su cromosoma. Gene (o Operón), la concentración es el número medio de células por volumen de una región cromosómica que contiene un gen o una copia operón en determinadas "equilibrado" (es decir, en estado exponencial) condiciones de crecimiento. Diferentes copias de los mismos genes dispersos en el genoma de todo, se hace en función de las concentraciones replicativa estado de los cromosomas. Además, las concentraciones de genes dependen de volumen celular. Existe la teoría de cálculo de las concentraciones relativas de genes en función de la ubicación del genoma, la tasa de crecimiento, y otros parámetros fisiológicos [13 - 15]. Esta teoría dicta que operón concentración aumenta exponencialmente con la proximidad al origen de la replicación (oriC) en una determinada tasa de crecimiento. Experimentalmente, la transposición de determinados genes reportero hacia el origen de replicación aumenta su expresión total en relación a una determinada tasa de crecimiento de una manera plenamente consistente con la teoría [14, 16].

A la luz de estos resultados, hemos querido preguntar si la replicación de los efectos dependientes del operón genómica ubicación en la concentración (efectos de posición) pueden explicar el perfil sesgado tRNA en E. Coli. Además, queríamos ver si es posible el crecimiento regulado traslacional racionalización también es mediado por la posición efectos, si los operones expresando isoacceptors importantes se observaron preferentemente a la mentira más cerca de oriC. Tomamos nota de paso que, al menos en E. Coli, las concentraciones de genes por sí solos no pueden explicar el aumento de la concentración de tRNAs en tasas de crecimiento más altas, ya que el volumen de células que también aumenta exponencialmente con la tasa de crecimiento de manera que la concentración de oriC se mantiene aproximadamente constante. Esto significa que la concentración de todos los genes y operones en todas partes en el genoma de hecho disminuye con la tasa de crecimiento [14, 15, 17]. Por lo tanto, el aumento de la concentración de tRNAs con una tasa de crecimiento [2] requiere un crecimiento regulado aumento de la producción de todos los operones tDNA. Esperábamos entonces para describir este crecimiento dependiente de aumento en la salida de tDNA operones y ver si es o no es uniforme.

Sin embargo, otros resultados hablan fuerte posición en contra de los efectos que explica tRNA perfil o su eventual modulación de la tasa de crecimiento. La mencionada conectado problema de la regulación de ARN ribosómico (rRNA) síntesis mismo ha sido objeto de controversia (revisado en [18 - 20]]. Como alternativa a la concentración de genes, ya sea la dosis o efectos que explican la variación, los reguladores endógenos probable inducir reacciones sobre la síntesis de RNA estables para mantener las concentraciones en el rRNA sistémicamente establecido niveles. Diferentes modelos han sido propuestos para explicar, por ejemplo, que las concentraciones de ribosomas son bastante estables experimental a la modificación de la dosis operón ADNr (revisado en [18]]. Un indicio más de que la concentración no es operón limitar al ribosome síntesis es que la tasa de síntesis es independiente de la edad celular [21]. El efecto de la concentración en la expresión de genes tasa fue específicamente demostrado ser amortiguadas en el caso de otro sistema de información regulada-es decir, el triptófano sintetasa [14]. En el caso de los tRNAs, un estudio reciente utilizando microarrays también mostró funciones claras para la transformación y la degradación de las concentraciones de tRNA [22], lo que sugiere que los efectos de la idiosincrasia individual tRNA estructuras y sus precursores pueden tener un gran papel que desempeñar en la que explica las concentraciones de tRNA. Por lo tanto, no está claro que la posición efectos pueden explicar el tRNA perfil, ya sea a través de operones dentro de una determinada tasa de crecimiento oa través de las tasas de crecimiento.

En el presente trabajo, nos propusimos volver a examinar Dong et al. "S datos sobre el E. Coli tRNA perfil de crecimiento y su tasa de variación en el contexto de la genómica tDNA operón organización. Nos sorprendimos al encontrar sólo la debilidad de las pruebas para la tasa de crecimiento-que dependen de la racionalización de los tRNA perfil, en cambio, todos los tRNAs aumento en proporciones muy similares y el tRNA perfil es casi igualmente importante hacia la racionalización de isoacceptors en todos los índices de crecimiento. Luego, el mapa verdadero éxito tDNA operones en el E. Coli genoma utilizando una simple, semi-automatizado sistema. Con estas en la mano, hemos utilizado los mínimos cuadrados de regresión múltiple y de los modelos existentes y de los datos de las propiedades físicas de la creciente E. Coli para estimar su total y per-copia expresión. Se demuestra que este "modelo operón" explica el tRNA perfil mucho mejor que la dosis de genes por sí solo. Mostramos que, si bien una gran proporción de la variación de tDNA operón expresión debe ser explicada por diferencias localizadas en elementos reguladores y precursores estructura, una parte importante de Variación en el E. Coli tRNA perfil se explica por la ubicación de genómica tDNA operones. Nuestras estimaciones por copia, promotor indicativo de la fuerza, son coherentes con los datos experimentales independientes y predecir, sorprendentemente, que los promotores en tDNA operones más lejos de oriC crecer relativamente más fuerte con la tasa de crecimiento. Esto puede compensar la disminución de las concentraciones de operón con una tasa de crecimiento para mantener el tRNA perfil constante. Finalmente, demuestran una significativa asimetría en los lugares, y el efecto de la ubicación de expresión, de tDNA operones en los principales ejes y menos. Porque co-expresión en operones explica la casi totalidad de la variación en las concentraciones de tRNA en cualquier tasa de crecimiento, y porque se conocen las concentraciones de tRNA que se co-adaptado con el codón de uso, estos resultados implican que la ubicación y strandedness de tDNA operones pueden ser influenciados en parte Por selección natural en el genoma de E. Coli.

Resultados y Discusión
El perfil de concentración tRNA en E. Coli es casi igual en todos los racionalizado las tasas de crecimiento

En un nuevo examen de los datos de Dong et al., Encontramos que la concentración de todos los tRNA isoacceptors aumenta con la tasa de crecimiento, y lo hace con sorprendente proporcionalidad. Figura 1 muestra que las regresiones lineales de tRNA isoacceptor concentraciones en μ = 0,4 μ y = 0,7 doublings / h explicar una fracción sorprendentemente alta, más del 96% de la variación en las concentraciones de tRNA en el 2,5 doublings / h. Ambos μ = 0,4 μ = 0,7 y se utilizan porque puede haber algunos aspectos de la idiosincrasia de datos en las tasas de crecimiento más bajas [23]. Por lo tanto, teniendo en cuenta que el error de medición en los datos de Dong et al. Es de 10%, el aumento proporcional de todos los isoacceptors con la tasa de crecimiento de los pantanos cualquier variación en el aumento de cada uno de los isoacceptors.

Prueba para el crecimiento regulado traslacional en la racionalización de la variación residual es débil. Estamos isoacceptors clasificados como "importantes", "menor" o "no" sobre la base de si son afines a los codones preferido, tal como se describe en la sección Materiales y Métodos, y la comparación de las distribuciones de aumento de la ratio de las concentraciones de estas clases en isoacceptors (Concentración de datos y clasificaciones se presentan en Dataset S1]. Figura 2 muestra que el menor aumento de isoacceptors hacer caer en la clase menor de edad (que contiene 18 isoacceptors), mientras que la mayor clase (con nueve) muestra un ligero aumento con una mayor tasa de crecimiento. Estadísticamente, por esta clasificación, la media del coeficiente de incremento de los principales isoacceptors no es significativamente mayor que la de menor isoacceptors. Se utilizó a una de las partes las pruebas, que son liberales para rechazar la hipótesis nula de igualdad de los coeficientes entre los grupos de mayores y menores. Por el aumento de 0,7 a 2,5 doublings / h (lo que demuestra la diferencia más fuerte), un test de Wilcoxon encuentra una diferencia entre el límite de distribución de mayor y menor isoacceptors (p = 0,06), un Welch prueba de la t de diferencia en la media de los coeficientes es También límite significativa (p = 0,08), pero la prueba de arranque en la diferencia en el promedio de los coeficientes no es significativa (p = 0,10). Ni es un análisis de covarianza para probar el efecto de isoacceptor tipo de concentración en μ = 2,5 para el control de la concentración en μ = 0,7 (p = 0,37). P-valores para el incremento del 0,4 al 2,5 doublings / h son todos mucho más alto, También que no rechazan la igualdad de medios. Así, la evidencia de enriquecimiento preferencial de los principales isoacceptors con la tasa de crecimiento no es fuerte.

Estos resultados deben tomarse con cautela debido a que dependerá de cómo se clasifican isoacceptors. Por ejemplo, si nos movemos Thr1 +3 y Pro1 +3 de las principales clases ni a la clase, los principales isoacceptors tienen una media significativamente mayor incremento con una tasa de crecimiento (Figura 2]. De igual modo, aumenta la importancia de que se use un recorte medio.

El Thr Pro tRNAs y pertenecen a las dos únicas familias que isoacceptor principales isoacceptors no identificarse exclusivamente en nuestro procedimiento de clasificación (véase Materiales y Métodos]. No es coincidencia que estos tRNAs se encuentran entre las menos abundantes en la célula. Este señala que es posible que no sea correcto a pesar isoacceptor todas las familias por igual en este análisis, como lo hemos hecho, ya que el uso de aminoácidos es parcial y esta tendencia aumenta con la tasa de crecimiento [24]. Además, la clasificación depende de las cesiones de corregir codón-anticodon lectura patrón de las normas y los codones preferido. Por último, un análisis más completo podría ser responsable de la incertidumbre en las mediciones de concentración. No obstante, es evidente que isoacceptor concentraciones aumentan con la tasa de crecimiento de una manera mucho más proporcional de lo que previamente se reconoció. Llegamos a la conclusión de que son escasos los indicios de crecimiento que dependen de isoacceptor racionalización de las concentraciones en favor de las grandes isoacceptors.

Aunque nuestro análisis no es compatible con un fuerte efecto de crecimiento regulado traslacional racionalización, que no es incompatible con la racionalización de la traducción en general. Isoacceptor concentraciones están sesgadas a favor de grandes isoacceptors ya en bajas tasas de crecimiento. Incluso la tasa de crecimiento más lenta examinado presenta una concentración significativamente más alta de las principales isoacceptors mediante el test de Wilcoxon (p <0,01). Esto puede ser compatible con la racionalización de la selección para la traducción en la tasa de crecimiento más alta determinar el tRNA perfil en todos los índices de crecimiento. En conclusión, el crecimiento de la regulación tRNA perfil puede ser inessential a la teoría de que E. Coli logra una ventaja de crecimiento a través de la racionalización de la traducción.

Operones explicar mejor que las concentraciones de tRNA genes por sí sola la dosis

Al igual que la codificación de la proteína de los genes, tDNAs se co-transcritos en operones. Seguidamente, se lanzó a preguntar si la organización operonic de tDNAs tRNA puede explicar mejor los niveles de expresión en E. Coli en cualquier tasa de crecimiento mejor que la dosis de genes por sí solo. Tenemos 87 tDNAs particionado en el E. Coli K12 genoma [25] obtenida con tRNAscan-SE [26] en 47 grupos. Un grupo de tDNA o tDNAs si se agrupan los pusieron dentro de 300 pares de bases (pb) o menos la una de la otra (la agrupación Radio) y cayó en el mismo capítulo. La agrupación de los 47 se mantuvo estable para la agrupación radios entre 200 y 1000 pb (Figura 3]. Aunque este procedimiento no dividir aparte ADNr tres operones-a saber, rrnC, rrnD, y rrnH conocida co-transcripción relaciones [10, 27 - 30] fueron correctamente identificados en el resto de los casos (incluido un operón anteriormente sin nombre que contiene un solo Thr-2 TDNA, que llamamos thrX; para más detalles, véase Materiales y Métodos y [31]]. Estamos manualmente se sumaron a los tres ADNr operones para producir un conjunto final de 44 operones (Tabla 1].

Se utilizó el ejemplo de las secuencias [2] mapa de la concentración de datos para 44 tRNA isoacceptors de cada una de las cinco tasas de crecimiento (Tabla 5 en [2]] a estas tDNA operones y, a continuación, estimadas por regresión lineal múltiple por mínimos cuadrados con un plazo interceptar , De acuerdo a la ecuación 2 (Materiales y Métodos], una "normalización de la concentración" para cada operón (diseño de la matriz y de la correspondiente parte derecha Conjuntos de datos se proporcionan en S2 y S3]. Llamamos a este modelo el operón (con interceptar) para explicar las concentraciones de tRNA. La solución del operón modelo requiere de la colocación de limitaciones adicionales en el sistema, como se muestra en el Cuadro 2 y se describe en Materiales y Métodos. Por comparación con el modelo de operón, que repitió la regresión lineal en [2] sobre la concentración de tRNA tDNA sola dosis ( "modelo de la dosis de genes", la ecuación 4 en Materiales y Métodos].

A pesar de la adición de 32 variables, el modelo operón explica tRNA concentraciones estadísticamente significativamente mejor que la dosis de genes modelo en todos los índices de crecimiento (p (F 32,10) <0,002 para todas las tasas de crecimiento, véase el cuadro 3]. Gene dosis explica sólo 55-60% de la variación, mientras que el modelo operón explica el 92-94%, incluso después de ajustar por las variables añadido (Tabla 3]. Este resultado sugiere que, después de la dosis génica para el control de las diferencias, las aportaciones de los diferentes operones a la misma isoacceptor piscina, y la tendencia de tDNAs repetir dentro de operones, tDNAs que son co-expresados en operones han expresión similar. Llegamos a la conclusión de que el modelo operón explica tRNA concentración de datos significativamente mejor que la dosis de genes por sí solo.

Para su posterior trabajo con el modelo de operón, concretamente en la predicción del operón expresión, la regresión redid abandonan la interceptar plazo, obligando a la regresión a través del origen. Esto se justifica debido a que ambos genes son los números y las concentraciones en relación escalas y concentraciones naturales tienen un cero si el número de su codificación de los genes son cero. Es decir, interceptar el término no tiene clara interpretación biológica. Por otra parte, para el modelo de regresión y comparaciones estadísticas sólo muestran, que intercepta mantenerse tanto para reproducir labor anterior y por ello se recomienda la práctica de estadística [32]. Intercept términos nunca fueron significativas en nuestras regresiones. A las bajas tasas de crecimiento (0,4, 0,7, y 1,07 doublings / h), lo que se acerca de interceptar el 70% de la media del coeficiente de magnitud de las estimaciones, y podría reducir a la mitad su valor. A las altas tasas de crecimiento, lo que se interceptar alrededor del 5% de la media del coeficiente de magnitud de las estimaciones y afectados por el coeficiente estimaciones sólo el 10%.

En el modelo de operón, no hay polaridad efectos, de manera que las contribuciones de copias de genes son independientes de la ubicación dentro de un operón. Se encontró que el mejoramiento de la modelo operón más de la dosis génica modelo (con o sin interceptar, datos no presentados) aumenta un poco si no manualmente participar en el proximal y distal tRNA genes de las tres anteriormente mencionadas ADNr operones: sin interceptar , La probabilidad de mejora encajan por casualidad disminuye en dos órdenes de magnitud (p (F 33,10) <10 -5), y la fracción de variación ajustada explicó es superior a un 98% en todas las tasas de crecimiento (diseño de la matriz y de derecho - En el lado de datos S4 y S5]. Este modelo no mejora de la adhesión a la tDNAs distal de los operones ribosomales puede ser debido a la degradación, la RNA polimerasa de bajada, o secundaria a través de la disociación de promotores, con un rendimiento de los más influencia en el ADNr operones porque son las más largas entre nuestros operón conjunto. De hecho, el análisis inicial de los promotores en nuestro tDNA operones indica que el distal Thr1-tDNA en el operón rrnD puede tener un promotor secundario mientras que la distal tDNAs en el rrnC y rrnH operones no [31]. Esto se ve confirmado por un examen de residuos de la modelo operón sin interceptar (Figura 4]. Sin embargo, los residuos no muestran una tendencia general en consonancia sobrestimado de expresión operón distal de la mano, lo que habría sido coherente con sistemática transcripcional de bajada (o de otros efectos de la polaridad operón) sobre las concentraciones de tRNA.

TRNA Operons ¿Más productivo más estrecha que la mentira a oriC

A continuación, volver a calcular operón normalización de las concentraciones (OSCs), repitiendo el modelo de regresión operón interceptar el lanzamiento plazo. OSCs (el Obtenidos por el modelo de ajuste en la ecuación 5] estimación, para cada operón y tasa de crecimiento, la concentración de que un tRNA isoacceptor que tendría en la tasa de crecimiento si su contenido en el gen se copia en el único, y sólo en, que operón. Alternativamente, la hipotética estimación OSCs concentraciones de los precursores de tRNA que se expresó de cada operón en ausencia de tRNA precursor de procesamiento, todos los demás factores iguales. Estimación de las OSCs y otros datos acerca de operones se proporcionan en Dataset S6.

En un crecimiento equilibrado, tRNA concentraciones, al igual que las concentraciones de todos los componentes celulares, son proporcionales a sus tasas de síntesis (véase por ejemplo, [18]]. Suponiendo que tRNA precursor de procesamiento es rápido y estable de la degradación de ARN es lento, esto significa que las concentraciones de tRNA en el crecimiento equilibrado son proporcionales a sus tasas de transcripción. Por lo tanto, en estos supuestos, nuestro estimado OSCs en una determinada tasa de crecimiento es proporcional a la "mayor parte" de la tasa de transcripción de cada operón en que la tasa de crecimiento, con diferentes constantes de proporcionalidad en diferentes tasas de crecimiento. En la sección de Materiales y Métodos, mostramos cómo calcular estas constantes de proporcionalidad. A continuación, presentamos algunos análisis estadísticos, en términos de las OSCs, pero equivalente referirse a ellos en términos de tasas de operón grueso expresión cuando, y sólo cuando, tales resultados son hasta un invariante multiplicativo constante que es equivalente en el análisis estadístico.

Hemos estudiado la variación espacial en la expresión del genoma de operón por conspirar contra la genómica OSCs ubicación de los operones y mediante el uso de regresiones circular [32], donde 0 ° se colocó en el origen de replicación oriC. Incluida una interceptar plazo en una circular de regresión de la OSC (o, de forma equivalente, la mayor parte de expresión) en el genoma ubicación (ver Ecuación 6], encontramos negativo importante dependencia de operón masiva expresión de la distancia de oriC en las cinco tasas de crecimiento, como se indica en la Coseno términos significativos en la Tabla 3. En cambio, sine términos de la circular regresiones no fueron significativamente diferentes de cero, lo que sugiere la simetría del patrón de expresión acerca de oriC. Figura 5 se indica que, a pesar de una considerable variación independiente de la ubicación, medio de expresión de los operones grueso (para μ = 2,5 doublings / h En unidades de iniciaciones por minuto por pg de cultivo celular) aumenta cuanto más cerca que se encuentra a operón oriC. Figura 5 también muestra una nueva estimación de regresión circular de incluir sólo el coseno y interceptar términos, que su utilización posterior para comparar los modelos en la Tabla 4.

La proximidad al origen de replicación explica el 11-17% de la variación en la estimación de tDNA operón expresión en E. Coli en una circular de regresión. Sin embargo, no está del todo claro si esto implica que la tasa de expresión es una causa o un efecto de la ubicación en el genoma, o ambos. Expresión tasa como un efecto de la ubicación podría derivar ya sea fisiológicamente, por el efecto de la posición en el genoma de genes de concentración, o evolutivamente, por algunos (ciertamente altamente especulativo) genoma de la posición dependiente de la mutación que tendería a hacer más fuertes promotores de cerca el origen de Replicación. Expresión como un tipo de causa de la ubicación definitiva podría producirse a través de la selección de ciertos operones que se mantenga cerca de oriC después de ser trasladado allí por translocación, la transferencia horizontal, o inversión de operones tDNAs y en el genoma. Esta selección podría ser a través de la expresión de la posición de efecto sobre la expresión o por una hipotética ventaja de operones con fuertes promotores de por sí a la mentira cerca del origen. En la siguiente, encontramos evidencia de los dos sentidos de la causalidad: expresión es causado, en cierta medida, por la ubicación del genoma, pero la ubicación y strandedness de operones que también ha evolucionado en E. Coli explotar este y otros efectos de aumentar la satisfacción de las demandas del tRNA de la célula.

TRNA operón expresión es coherente con la replicación de genes que dependen de la dosis efectos

Para examinar la hipótesis de que la posición que dependen de los efectos de la replicación de los genes de concentración están provocando la genómica tDNA operón patrón de expresión en E. Coli, comparamos nuestro estimado operón expresiones de un modelo estadístico basado en la bien conocida teoría de la expresión de genes relacionados a la concentración de genes [14, 15]. El pleno derivación de este modelo se muestra en Materiales y Métodos. Este modelo es el siguiente:

Expr donde (X) es la expresión del operón X en la tasa de crecimiento y la genómica posición μ m (como una fracción de la longitud de la mitad de un cromosoma), μ k es una constante de proporcionalidad desconocida relativas a la media de la expresión de un conjunto de genes que Sus concentraciones, ɛ es un término de error estocástico, [oriC] es la concentración del origen de la replicación, y C μ es el tiempo necesario para completar la replicación del genoma, considerado una constante dada la cepa y la tasa de crecimiento μ.

El interceptar a este modelo depende de factores desconocidos o de las molestias parámetros tales como la concentración de oriC en relación con la tasa de crecimiento (que puede variar en bajas tasas de crecimiento y es posible que dependen de la cepa [18, 33, 34]], la distribución de la Ɛ error estocástico, y μ k, que representa el aumento de la transcripción uniforme en todos los tDNA operones como una función de la tasa de crecimiento. Sin embargo, la pendiente en este modelo, y en su forma exponencial, sólo depende de la bien estudiada parámetro μ C, y se pueden comparar directamente a nuestras estimaciones de expresión para evaluar la coherencia con la posición efectos en la concentración de genes.

Nos parece un acuerdo general de nuestras estimaciones con el modelo en la ecuación 1. Es decir, nos encontramos con pruebas para encaja exponencial de operón expresión del genoma en contra de la ubicación, la disminución desde el origen. En primer lugar, el Criterio de Información de Akaike indica que un modelo exponencial (Ecuación 9] se ajusta a la normalización de la concentración de datos mucho mejor que el modelo trigonométricas (Ecuación 6] utilizada en la circular regresiones (Tabla 4]. Esto significa que los datos están más en consonancia con una tendencia exponencial trigonométricas que con la tendencia implícita en la circular de regresión, a pesar de que no descarta que alguna otra función que mejor se ajustaba a los datos. En segundo lugar, la prueba de Box-Cox sugiere log-transformación de los datos, también en consonancia con una tendencia exponencial (Figura S1]. En efecto, los intervalos de confianza del 95% de lambda en todos los precios incluyen el crecimiento cero (log-transformación) y excluir a uno (no transformación de los datos). En tercer lugar, los intervalos de confianza para las laderas de log-lineales encaja incluyen valores esperados basados en estimaciones realistas de C en todas las tasas de crecimiento (Tabla 4]. Así, los datos muestran una gran coherencia con una posición efecto en la concentración de genes que causan incremento en la expresión de operones hacia oriC.

Por otra parte, para el modelo en la ecuación 1 a encajar en detalle, es de esperarse las laderas de las log-regresiones lineales en la Tabla 4 a disminuir con el aumento de las tasas de crecimiento. Uno espera que, en otras palabras, empinada gradientes de expresión de la distancia desde el origen de replicación en tasas de crecimiento más altas. Sin embargo, nuestro estimado laderas son constantes en μ. De hecho, las tasas de operón expresión, al igual que las concentraciones de crudo tRNA isoacceptor, bastante constante aumento de la proporción con la tasa de crecimiento. Fracciones de alta, aunque menor que con los datos brutos, de las estimaciones de las tasas de operón expresión en mayores tasas de crecimiento se explica por los menores en las tasas de crecimiento, del 82-97%. Por ejemplo, cuando a través de la regresión, origen, el crecimiento aumento dependiente de los factores en el 2,5 doublings / h de 0,4 doublings / h es 1,74 ± 0,04 (SE) para tDNA estimado operón expresión y de las tasas de 1,80 ± 0,04 para las concentraciones de tRNA crudo, que explica el 97% Y el 98% de la variación, respectivamente. Esto demuestra que los datos son inconsistentes con el gen de concentración como una de las causas del crecimiento regulado traslacional racionalización.

Es notable que, si E. Coli en realidad fueron seleccionados para un amplio crecimiento regulado traslacional simplificar, este podría haber sido fácilmente organizado por la celebración de la fuerza relativa de los diferentes promotores tDNA con una tasa de crecimiento constante y pasivamente la explotación de la ubicación de genes efecto en la concentración. El hecho de que el perfil de expresión tDNA operón es bastante constante, a pesar de los cambios en las concentraciones de operón, implica que la fuerza relativa de los diferentes promotores tDNA debe cambiar con la tasa de crecimiento. Podemos pedir que la tasa de crecimiento más adecuada para la condición de espera pendiente, que pudiera dar a entender en virtud de la cual la mayoría de expresión es condición rige por la posición operón efecto en la concentración y menos regida por una hipotética indemnización de los factores que trabajan contra este efecto. Curiosamente, los datos se ajustan a la espera laderas mejor a altas tasas de crecimiento (Tabla 4], lo que sugiere que cualquier hipotético efecto compensatorio puede ser más eficaz en virtud de las condiciones de un crecimiento lento. En este caso, la indemnización de este hipotético efecto haría que, en bajas tasas de crecimiento, ya sea de origen proximal de los promotores más fuertes, término-proximal promotores más débiles, o de ambos, que lo que cabría esperar sobre la base de comparaciones con las expresiones en tasas de crecimiento más altas.

También podemos esperar un retroceso a la posición operón efecto en la concentración para estudiar las tendencias de la estimada por copia de cada uno de los tipos de expresión tDNA operón en cada tasa de crecimiento, mediante la derivación se indica en Materiales y Métodos (Cuadro 5]. Nuestros datos bastante bien de acuerdo con cálculos independientes para ADNr (rrn) operones [35]. Según estos cálculos, el promedio de expresión de todos los operones rrn combinado aumentos del 8,9 por min iniciaciones por copia en μ = 0,7 a 16,0 en μ = 1,07 y hasta 66 iniciaciones por minuto por copia en μ = 2,5 doublings / h (Cuadro 5 ). Estas estimaciones son bastante similares, si un poco menos, los estimados en [35] sobre la base de distintas hipótesis, los datos, y cepas bacterianas. Sobre la base de las mediciones de ARN total, se calculó la tasa media de inicio de operones rrn a ser alrededor de 10 en μ = 0,6, en poco menos de 20 μ = 1,1, en cerca de 64 μ = 2,2, y en casi el 90 μ = 2,7. Los datos en [35] se presentan sólo como cifras, no los cuadros, por lo que los valores citados aquí son aproximados. El acuerdo parece satisfactorio. Nuestras estimaciones de los operones rrn puede ser baja debido a que sus distal tDNAs se ponderan por igual (véase más arriba), y debido a la relativa falta de información para la isoacceptors expresan (es decir, Ile-tRNAs). No obstante, estos resultados sugieren que el cuadro 5 se indica predicciones razonables de las tasas de iniciación de tDNA operones, con una advertencia: el exceso de síntesis para compensar la eventual degradación de tRNA, o transcripcional de aborto y de bajada, no se pueden detectar a partir de la combinación de los datos y la teoría Hemos utilizado para realizar las estimaciones. Las estimaciones en el cuadro 5, por lo tanto, deben ser consideradas como estimaciones mínimas suponiendo que no haya pérdidas, o como "neto" después de la síntesis de las tasas de tales pérdidas no han tenido lugar.

El por copia operón estimaciones de las tasas de expresión ( "promotor velocidades"; En Materiales y Métodos] no tienen ninguna tendencia significativa en contra de la ubicación en el genoma de cualquier tasa de crecimiento. Este argumenta en contra de los promotores de por sí fuerte evolución oriC cerca de la ubicación, ya sea por los efectos que dependen de la mutación in situ o por translocación. Sin embargo, la proporción de la tasa de crecimiento-aumento de la síntesis por copia tasas son muy significativa y positivamente dependientes de la distancia de oriC (Figura 6], ambos de 0,4 a μ = μ = 2.5 ( ) Y μ = 0,7 a μ = 2.5 ( ). Importancia y explicó variación aumenta cuando se excluye a los valores de la periferia IleX y IleY operones ( Y , Respectivamente). Esta es la evidencia de la citada celebración el efecto compensatorio tRNA perfil relativamente constante a pesar de la posición operón efecto en la concentración. Dado que no hemos examinado ningún modelo para el crecimiento de la regulación de tDNA promotores en su conjunto, no podemos decir si este efecto compensatorio actos a través de una mayor aceleración de origen distal de los promotores o menor aceleración de origen proximal de los promotores en las tasas de crecimiento más altas.

En resumen, hemos dado pruebas fehacientes de que la ubicación de genómica tDNA operones desempeña un papel importante en la configuración del perfil de tRNA en E. Coli. Aunque es evidente que la ubicación de genes que dependen de las concentraciones deben tenerse en cuenta para el cálculo de los tipos de expresión de cualquier operón, nuestro resultado de que tal posición efectos explicar, en parte, la variación de concentración a través de los diferentes tRNAs es inesperado y novedoso. Sin embargo, los resultados no son plenamente coherentes con el modelo más simple de determinar la ubicación operón expresión. En primer lugar, la ubicación sólo explica alrededor del 15% de la tasa de variación de expresión (Figura 5], por lo que se puede decir que las causas intrínsecas de expresión, como promotor de velocidad son el principal factor determinante. En segundo lugar, el tRNA perfil es relativamente constante a diferentes tasas de crecimiento mientras tDNA operón expresión es una función exponencial negativa de la tasa de crecimiento del producto de la genómica y la distancia de oriC (Ecuación 1]. Esto implica la existencia de un efecto compensatorio que trabajan contra el efecto sobre la posición de expresión (Figura 6].

TRNA Operon Localizaciones y Expresión ¿Diferentes en el principal y Quedándose capítulos

TDNA operones en E. Coli son diferentes en los principales ejes y menos con respecto a la ubicación de ambos y el efecto de la ubicación de la expresión. Hemos definido las strandedness de un operón por el angular coordinar relativo a oriC (α), de su primer tDNA y su orientación respecto a la secuencia del genoma K12; si α <180 °, el operón está llevando si paralela y menos si antiparallel, y Viceversa otra (véase el cuadro 1]. Las principales líneas retrasadas y son muy diferentes en lo que respecta a la colocación y la expresión de operones tDNA (ver figura 4]. TRNA genes considerarse por separado se encuentran preferentemente en el primer capítulo 2 = 5,069, df = 1, p = 0,02), pero hace caso omiso de esta organización operonic con sus limitaciones de co-orientación y tendencia de los tDNA repite dentro de operones. Nos parece que tDNA operones están distribuidas de manera uniforme sobre los dos capítulos 2 = 1,454, df = 1, p = 0.23). Además, estadísticamente hablando, no hay diferencia en el tamaño medio (número de tDNAs), de líder y menos tDNA operones, ya sea una permutación de la prueba (p = 0,35; ver Materiales y Métodos] o el test de Wilcoxon (p = 0,52). Sin embargo, después de dividir en dos conjuntos de operones según que se encuentran más cerca de la estación terminal oriC o región, filamento principal operones mentira mucho más cercano al origen y menos operones capítulo más cerca de la termini (Figura 5 y el test exacto de Fisher, p = 0,010) . Esta observación es, en parte, se reafirma en las estadísticas de la circular [32, 36]. El Watson de dos muestras de prueba rechaza la homogeneidad de la distribución espacial de los principales y menos capítulo tDNA operones (U 2 = 0,1949, p <0,05) y la prueba de Rayleigh circular rechaza la uniformidad de la colocación de filamento principal operones contra una alternativa a la distribución unimodal El origen ( R 0 = 0,3214, p <0,01).

Sin embargo, la distribución de los rezagados capítulo operones no es significativamente diferente del uniforme circular por cualquier estadística de una muestra de prueba que hemos intentado, incluyendo Watson, de Kuiper, y de Rayleigh. Aunque estas pruebas hacen diferentes hipótesis, todas ellas conducen a la misma conclusión. La falta de poder sin incluir el conocimiento previo de la importancia biológica de origen o el termini puede explicar en parte este, ya que estas pruebas tampoco de rechazar la uniformidad de filamento principal operones. Cuando se suministra una alternativa menos hipótesis de que el capítulo operones están orientados hacia el termini, la prueba de menos de Rayleigh capítulo operones apenas no rechazar la uniformidad ( R 0 = 0,2446, p = 0,07). Llegamos a la conclusión de que filamento principal tDNA operones son significativamente agrupadas espacialmente hacia oriC menos mientras no se operones capítulo.

Con respecto a la expresión, de filamento principal operones muestran un mayor aumento en la estimación de expresión hacia oriC operones que todos en conjunto (coseno término 2,07 ± 0,75, p = 0,0108, sine plazo NS), mientras que el capítulo operones quedando solos no muestran ninguna relación significativa de expresión Ubicación en el genoma. Sin embargo, ya sea por análisis de la covarianza o un test de Wilcoxon de los residuos, no se encontraron efectos de la línea-es decir, sin diferencia estadística entre los dos elementos-el grueso estimado expresión de operones en cualquier tasa de crecimiento, después de tener en cuenta para el efecto de operón Ubicación.

Así, en E. Coli, el genoma ubicación efectos son muy fuertes en el primer capítulo y estadísticamente insignificante en el capítulo menos. En el primer capítulo, se colocan operones nonrandomly con respecto a oriC, y existe un fuerte efecto sobre la ubicación de expresión. Sin embargo, la expresión general de operones y se distribuyen por igual en ambos, los dos elementos. ¿Cómo explicar estas observaciones estadísticas? Rocha se desarrollan dos hipótesis para explicar el capítulo asimetrías en la colocación de genes y la expresión de los genes [37]. Ambos dependen de los efectos de la cabeza en las colisiones de la polimerasa de ADN y ARN polimerasa en la transcripción de los genes retrasadas capítulo. Una hipótesis hace hincapié en el efecto de tales colisiones en la replicación del genoma a través de estancamiento de las horquillas de replicación. La otra hipótesis se hace hincapié en el efecto de tales colisiones en la transcripción, ya sea a través de transcripciones abortado no cumplir la demanda de productos de genes o por sus efectos negativos dominante debido a la hipotética toxicidad. "Creemos que transcripcional de salida podría ser reducido después de una colisión en la cabeza de la RNA polimerasa con la bifurcación de la réplica, no sólo por el aborto de un elongating transcripción en el momento de la colisión, sino también posiblemente por la interferencia con la transcripción de la resolución durante la replicación se bifurca en punto muerto después de una colisión .

Estudios sistemáticos de los genes codificantes de proteínas en E. Coli y otras bacterias han señalado hacia la esencialidad de genes en lugar de la expresión génica, como mejor variable explicativa para predecir strandedness [38]. Esto favorece la interpretación de que es el efecto de las colisiones en la polimerasa de transcripción que determina capítulo asimetrías en la colocación de genes. Con tRNA precursores, parece poco probable que a nosotros incompleta transcripciones tendría efectos tóxicos, pero un efecto negativo de no cumplir la demanda fisiológica de la traducción parece probable. Limitaciones de gran demanda en un operón podría seleccionar en que se encuentra cerca de origen con el filamento principal orientación, mientras que en menor demanda podría permitir a un operón evolucionando más aleatoria la ubicación y orientación a través de la transposición y la inversión, con los ajustes por la evolución de la promotora local de la fuerza Como el factor dominante en el establecimiento de los niveles de expresión en las dos vertientes. Tomamos nota, de paso, que si había un efecto tóxico del aborto transcripcional del operón a través de cualquier tenedor de colisión con la RNA polimerasa, que sería amplificado por la proximidad genómica operones de ofender al origen de replicación, ya que la toxicidad sería proporcional al promedio de genes Concentración (la proporción de productos tóxicos a la producción total de un operón sería independiente de la ubicación, pero la cantidad absoluta de los productos tóxicos que aumentan con la concentración de la operón). "Creemos además que el efecto negativo de menos strandedness-transcripcional en la productividad sería una proporción constante de la producción, independientemente del lugar, y podría, por lo tanto, se espera que sea neutral a la ubicación. Estas especulaciones demanda una evaluación cuantitativa de los datos sobre los mecanismos y la cinética de los acontecimientos durante y después de tales colisiones para su posterior evaluación.

Nuestros resultados nos llevan a la conclusión de que comprobables fisiológicas demanda de tRNA puede servir como causa de evolución de la genómica y la ubicación strandedness de tDNA operones. El perfil del tRNA, que es conocido por ser seleccionado para la racionalización de la traducción en covariación con codones preferido, ahora se ha demostrado que se correlaciona con la ubicación y strandedness de tDNA operones. Esto sugiere que la genómica tDNA operones de la arquitectura es en sí en virtud de un cierto grado de la selección natural en E. Coli.

El fortalecimiento de las conclusiones de la presente análisis, no se puede hacer antes de tDNA análisis comparativo de las secuencias de promotor operón y se lleva a cabo dentro y entre los genomas enterobacterial. Esto será objeto de futuras investigaciones.

Materiales y Métodos

87 tDNAs fueron identificados por tRNAscan-SE [26] a partir de la E. Coli K12 MG1655 genoma y, a continuación, acompañada de expresiones regulares para invertir completa de los datos de la sonda oligo [2]. Sólo un tDNA fue inigualable por cualquiera de los oligos: uno de los principales Leu1 tDNAs con un solo desfase en la variable de bucle de otros ejemplares. Este desfase se produce en medio de la oligo pertinentes, de modo que este tDNA se incluyó. Hemos incluido una Thr2 gen que llamamos thrX en coordinar 296402. Este gen es Thr2 anotado en la base de datos del genoma del tRNA (http://lowelab.ucsc.edu/GtRNAdb/), pero no es anotado en EcoCyc ( Http://www.ecocyc.org ) Ni en el NCBI anotación del genoma, y no hay pruebas concretas de su expresión. Usando tRNAscan-SE, la thrX gen tiene una puntuación de 42,36 covarianza, que es casi la mitad que la de los demás y cerca Thr2 gen thrW en coordinar 262095, indique que contiene irregularidades estructurales. Una inspección más cercana muestra que 1) thrX es una quimera con un extremo 3 'idénticos a partir de la thrW anticodon tallo 5' del bucle, 2) que el oligo utilizado contra Thr2 en [2] coincide con el extremo 3 'del anticodon tallo En la variable de bucle y, por lo tanto, perfectamente a esta hibridación tRNA se expresó, 3) este tRNA probablemente veces normalmente si se expresó, incluidos los contactos terciario, y 4) la thrX gen tiene un razonable aguas arriba promotor [31]. Por lo tanto, thrX incluido en el análisis, pero tras extraer del análisis no cambia nuestros resultados de la regresión (diseño de la matriz y, a mano derecha siempre en Conjuntos de datos S7 y S8], ya que la única otra Thr2 operón que contiene un gen en E. Coli K12 es próximo y co-orientado a thrW.

Todos los análisis estadísticos fue ejecutado en la I [39]. Estamos isoacceptors clasificados como "importantes", "menor" o "ni", en referencia a preferido codones en genes altamente expresado en altas tasas de crecimiento. Por este codón basado en criterios, analizamos el uso en el codón 45 ribosomal genes de la proteína E. Coli K12 genoma [25] con codonw (J. Peden, Http://www.molbiol.ox.ac.uk/cu/ ). Los dos mejores de cada uno de los codones de aminoácidos se verificaron contra anticodon afines como los patrones de lectura de acuerdo a [2], que es también la fuente de la correspondencia entre tRNA isoacceptor numeración y anticodons muestra en el Cuadro 1. Una de las principales isoacceptor fue recogido en forma exclusiva todos los aceptor clases a excepción de dos casos (threonine con dos tRNAs, Thr1 y Thr3, que tanto han GGU anticodons preferido que concuerden con los codones CAC y la UAC, y prolina con dos tRNAs, Pro1 y Pro3, que tanto Coincidir con el codón preferido CGG). Thr1 y Thr3 Se sumaron como se Pro1 y Pro3, y estos datos combinados fueron asignados a la clase principal. Esta cesión de las principales isoacceptors es idéntica a la utilizada por Ikemura [40], con la excepción de Ser5, que no Ikemura medida. Dos casos undecidable (Ile1 + Ile2, que Dong et al. No podía distinguir, y Tyr1 y Tyr2, que coinciden con los dos Tyr codones), y en todos los tRNAs solo isoacceptor familias fueron etiquetados como "tampoco". El resto fueron asignados a El menor isoacceptor clase. Las clasificaciones se muestran en Dataset S1. La prueba de arranque para la diferencia de medias entre los coeficientes de mayor y menor grupos se calculó en 16,2 algoritmo p. 224 en [41]].

Para predecir operones, tDNAs con la misma orientación en el genoma se agrupan automáticamente utilizando un término-terminal a distancia (Radio de la agrupación), de 300 pb. En los casos conocidos de operones heterogéneos (tDNAs mezclada con proteína de los genes de codificación), tDNAs siempre son lo primero en el operón [28]. Nosotros no han encontrado pruebas de otro modo en un análisis separado de aguas arriba promotores [31]. El procedimiento de dividir aparte tres operones ribosomales que se sumaron manualmente como se describe en el texto.

OSCs se derivan de la concentración de datos en la Tabla 5 en [2] se proyecte sobre la operones definido por mínimos cuadrados de regresión múltiple y se encuentran en μ M de unidades (véase Dataset S5]. Para llevar a cabo este modelo de regresión operón, hemos tenido que añadir otros diez primeros en señalar las limitaciones de diseño de la matriz de rango completo, y, a continuación, una dificultad adicional para hacer valer cerca de la igualdad de expresión de operones ribosomales (véase el cuadro 2]. Diez de los 11 ascendía a limitaciones añadiendo supuestos, como si hubiera dos operones en alimentación, y sólo en un único isoacceptor piscina, que lo hacen por igual y son absolutamente necesarios para realizar la regresión. Uno de estos diez implicados dificulta los dos de los tres operones ribosomales rrnA, rrnD, y rrnH y era necesario para realizar la regresión, pero en una elección entre dos alternativas. Sin embargo, con cualquiera de estos diez mínimas limitaciones, los dos operones rrn limitada se estimaba que había expresado en niveles bajos y poco realistas y el otro, a un nivel poco realista, cuando se sabe que todos los operones ribosomales tienden a ser bastante similares expresadas en altos niveles [10, 11, 42] (Diseño de la matriz y, a mano derecha siempre en Datasets S9 y S10]. Esto puede haber sido debido a que hay relativamente pocos datos de la isoacceptor en piscinas alimentadas por operones ribosomales-por ejemplo, Dong et al. No fueron capaces de distinguir los Ile1 y Ile2 isoacceptors. Por lo tanto, vuelve a añadir la dificultad adicional sobre estos operones ribosomales para hacer valer sus cerca de la igualdad de expresión (véase el cuadro 2].

Se valoran las OSCs De operón j μ en la tasa de crecimiento por mínimos cuadrados de la matriz de soluciones de las ecuaciones de la forma

Donde S es el número de isoacceptors, P es el número de operones, C es el número de limitaciones, Es la dosis de tDNA i en el operón j, Es el coeficiente de coacción sobre operón i j, i μ es una interceptar plazo, y Es la concentración de tRNA i en la tasa de crecimiento μ. Para facilitar la consulta, se puede reescribir la ecuación 2 como

Donde D es una matriz S × P, C × C es una matriz P, H es una (S + C) × P matriz, Es un vector columna de unos de longitud N, Es un vector de la columna De longitud P, Es un vector de la columna De longitud S, Es un vector columna de ceros de longitud C, y Es la concatenación de Y .

Pedimos una matriz M en el lado izquierdo de la ecuación 3 una "matriz de diseño." Por lo que llamamos el modelo de operón, S = 44, P = 44, y C = 11. Todo el diseño de las matrices M y sus correspondientes Conjuntos de datos están disponibles en S2 - S5 y S7-S10. Por comparación con el modelo de operón, que repitió la regresión lineal en [2] sobre la concentración de tRNA tDNA sola dosis (dosis génica modelo), que asume la expresión de la igualdad de todos los tDNAs, con lo que la concentración de los datos mediante el montaje de una sola variable x μ y genómica TDNA número de copias como predictor. En nuestra notación, el modelo de la dosis génica es simplemente

Donde , Y Es un vector columna de tamaño S, el componente i ª de la que es g i.

A los efectos de evaluar y comparar el operón de genes y modelos de la dosis ( Y F en el Cuadro 3], se incluyeron en términos interceptar las regresiones. Los grados de libertad son 42 para el gen modelo de la dosis y 10 para el modelo operón (44 puntos menos 44 operones más 11 limitaciones menos 1 interceptar plazo). Los coeficientes de determinación ajustado ( En el cuadro 3] se corrige con grados de libertad en la definición .

A los efectos de estudiar la variación de operón genómica de expresión en el marco del modelo de operón, regresiónde la intercepción de datos sin un plazo de acuerdo con el modelo

Razonablemente que implica que estos operones son las únicas fuentes de tRNAs en la celda, y también es razonable porque las concentraciones de tRNA y la dosis de genes se encuentran en relación con las escalas de cierto ceros.

La circular de regresión se presentan en el cuadro 3 se utiliza un modelo

Donde Es la normalización de la concentración de operón j calcula de acuerdo con el modelo en la ecuación 5, α j es la distancia angular de operón de oriC j en la dirección del acta de la distancia genética, β I son los coeficientes de regresión, y es un error ɛ plazo. La regresión se muestra en la Figura 5, y el coseno modelo en el cuadro 4, se basa en este modelo sin la sine término, que es insignificante en todos los índices de crecimiento. En el caso de la Figura 5, el modelo fue montado por una escalada constante de dar mayor parte predijo operón expresiones. El cálculo de esta constante se describe a continuación.

Basura operón expresión (expresión total de las tasas) se observan (estimado por el modelo de ajuste en la ecuación 4] o previstos (de un ajuste al modelo en la ecuación 6] OSCs Multiplicado por un tipo de crecimiento que dependen de los factores μ r = (N A V μ / 10 21 μ M) (ln2 μ μ ln2/60), donde N es el número de Avogadro, μ es la tasa de crecimiento en doublings / h, V es μ Volumen medio de células en μ m 3, y M μ es el promedio de la masa de células en gramos como funciones de μ. Por este factor de multiplicación de los rendimientos de las unidades número de iniciaciones por min por gramo de cultivo de células. Relaciones funcionales de las células volumen promedio (V μ = 0,4 × 2 μ μ m 3) y el promedio de la masa de células (M μ = 1,6 × 10 -13 × 2 μ g) con una tasa de crecimiento se tomaron de μ [17]. El primer factor en el rendimiento r μ una densidad mientras que el segundo factor en μ r deriva de la relación entre la densidad y la tasa de síntesis durante el crecimiento equilibrado [18]. Valores en la figura 5 se multiplican por un factor adicional de 10 -12 a dar valores por picogramo. Resultados estadísticos calculados sobre datos dentro de una tasa de crecimiento (como en los cuadros 3 y 4] son invariantes a la multiplicación por este factor constante. Por lo tanto, algunos resultados son discutidos y presentados como equivalente o total normalización de las concentraciones de los tipos de expresión.

La concentración media [X] de un gen por concentración [oriC] del origen de replicación oriC en la tasa de crecimiento y la ubicación μ m (distancia relativa desde el origen de la réplica como una fracción de la distancia, con la duración media de un cromosoma Establecido en 1) la relación de la siguiente manera [14, 15]:

Μ donde C es el tiempo necesario para completar la replicación del genoma, considerado una constante dada la cepa y la tasa de crecimiento μ (equivalente, esta fórmula se puede presentar en términos de tiempo de duplicación en el min τ, donde τ = 60 / μ). Un derivado modelo estocástico para predecir la expresión Expr (X), de ese gen es, por lo tanto,

Donde la constante de proporcionalidad k desconocidos μ refiere la media estimada expresión de un conjunto de los genes de sus concentraciones como un desconocido, sino común función de la tasa de crecimiento, y es ɛ algunos estocástico de error. Tomando logaritmos rendimientos Ecuación 1 en el texto.

El Box-Cox pruebas de la probabilidad de diferentes familias funcionales con los datos utilizando un único parámetro lambda. Se ha utilizado la serie por defecto para caber en I lambda, que es de -2 a 2 en incrementos de 0,1.

Cuadro 4 compara el modelo de regresión circular en la ecuación 6, equipado sin sine plazo, a la adecuación de los datos a un modelo exponencial de la forma en la ecuación 1, a saber:

Donde m j es la distancia de oriC fraccional de operón j con el máximo de 1. La espera pistas en el Cuadro 3 se calculan a partir de la ecuación 1 y la asunción de una cepa-y lineal independiente [33, 34] dependencia de la replicación del genoma C en el período la tasa de crecimiento μ, calibrada a partir de datos en [18, 33] que se C Μ = (220 / 3) - (40 / 3) μ. También repitió estas comparaciones con exclusión de la periferia estimaciones para el ileX y IleY operones. Que esas estimaciones eran atípicos puede verse comparando las tendencias en relación proporcional de las estimaciones en contra de las tasas de crecimiento (por ejemplo, el cuadro 5 o Figura 6], así como por sus efectos en las pruebas estadísticas (por ejemplo, Cuadro 4]. La inestabilidad en estas estimaciones porque vino de la mencionada falta de datos en Ile isoacceptors (Ile1 y Ile2 no puede ser distinguido por la oligos en Dong et al. "S de datos) en relación con su limitación en la regresión de mínimos cuadrados.

Por copia operón estimaciones de las tasas de expresión, que también llamada "promotor velocidades" (Véase el texto de reservas) y se muestra en el Cuadro 5, son proporcionales a las tasas de expresión masiva operón A través de un adicional de la tasa de crecimiento que dependen de los factores . El primer factor en μ l convierte gramos a espectrofotométrico OD 450 unidades de un factor que se mide en [43]. El segundo factor es la densidad de reciprocidad oriC por unidad OD 450 tomadas para ser constantes con la tasa de crecimiento en valor de 10 -9 [33]. El tercer factor es en unidades de la dosis de un operón relación a la ubicación m a oriC dada por la ecuación 7 con C = μ (220 / 3) - (40 / 3) μ como anteriormente. Promotor velocidades Son, por tanto, en unidades de iniciaciones por minuto por copia. Los valores en el cuadro 5 se muestran en sólo dos cifras significativas para hacer hincapié en su naturaleza muy aproximados, debido a la incertidumbre de aproximadamente 10% en las mediciones de concentración de la isoacceptor del que se derivan, y en la áspera naturaleza de las hipótesis que invirtieron en el de mínimos cuadrados Estimación, y se subestima probablemente por razones en el presente texto. Figura 6 muestra los coeficientes Promotor de las velocidades en una alta tasa de crecimiento de 2 μ y una menor tasa de crecimiento μ 1.

Circular cálculos estadísticos se calculan en I con el paquete adicional CircStats (S-plus original por Ulric Lund, R puerto por Claudio Agostinelli, disponible en Http://cran.r-project.org/ ). Para comparar el número de tDNAs en la dirección y menos por un capítulo operones permutación de prueba, se calculó el tamaño de los operones, donde el tamaño de las s j jth operón, 1 ≤ ≤ j es P . Los medios y las diferencias fueron similares entre los dos grupos, con el grupo de cabeza: al menos 2,077 y el grupo de media en 1,833, 2,474 y de las varianzas y 2,5, respectivamente. A continuación, llevó a cabo una prueba de permutación de muestreo R = 10000 permutada a la cesión de los tamaños de los principales grupos y quedando capítulo utilizando la norma de igualdad de varianza de dos muestras t-test como una prueba estadística y el informe de la proporción , Donde i es un indicador de función igual a uno si su argumento es cierto y cero en caso contrario, t es el valor de la estadística de ensayo para los grupos observados y Es el valor de la prueba estadística para la pth pth permutada grupo de cesión.

Apoyo a la Información
Dong et al. "S tRNA Concentración de datos con la Clasificación de Isoacceptors
Este conjunto de datos contiene Dong et al's
Con la concentración de datos, y la cesión de isoacceptor tipos de tRNAs: "principales", "menor", y "ninguna de las dos."
Diseño de la matriz de la regresión de Mínimos Cuadrados con 44 Operons y 11 Limitaciones
Esta es la "correcta" matriz utilizada en el análisis, uniéndose operones ribosomales
RrnC, rrnD,
Y
RrnH
Pueden ingresarse directamente en R.
Concentración y Constraint Matrix que se usan con la S2
(1 KB TXT).
Diseño Automatizado de Matriz para la regresión de Mínimos Cuadrados con 47 Operons y 13 Limitaciones
Corresponde a los grupos tDNA encontró con una agrupación radio de 300 bp utilizados en el documento, que divide aparte operones ribosomales
RrnC, rrnD,
Y
RrnH
Pueden ingresarse directamente en R.
Concentración y Constraint matriz que se usa con S4
(1 KB TXT).
OSCs y otros correlatos
Este cuadro da OSCs hizo con la "correcta" diseño de la matriz
Llamado "design_matrix.correct" y estimó por regresión de mínimos cuadrados a través del origen. Operón propiedades adicionales se recogen aquí.
Diseño de la matriz de la regresión de Mínimos Cuadrados con 43 Operons y 10 Limitaciones
Esto es lo mismo que la "correcta", pero excluye la matriz operón
ThrX
En el presente texto. Pueden ingresarse directamente en R.
Concentración y Constraint matriz que se usa con
(1 KB TXT).
Minimal Diseño de la matriz de regresión de Mínimos Cuadrados con 44 Operons y 10 Limitaciones
Esto impone mínima expresión las posibles limitaciones a la igualdad entre los operones ribosomales
RrnC, rrnD,
Y
RrnH
Pueden ingresarse directamente en R.
Concentración y Constraint matriz que se usa con
(1 KB TXT).
Log-Perfil de Riesgo de Box-Cox Test
(4 KB EPS).

Damos las gracias a Diarmaid Hughes, Kurt Nordström, Otto Berg, Måns Ehrenberg, Charles Kurland, Johan Elf, Hugo de Boer, y los revisores anónimos de los útiles comentarios y debate, Måns Ehrenberg y Eduardo Rocha para el intercambio de manuscritos inéditos, y una subvención a reconocer desde LAK Wallenberg el Consorcio Norte y al Departamento de Asuntos Humanitarios y de Vetenskapsrådet LAK, el Consejo de Investigación sueco.