Genome Biology, 2005; 6(4): R31-R31 (más artículos en esta revista)

Conservación de los codones de parada en tándem levaduras

BioMed Central
Han Liang (hliang@Princeton.edu) [1], Andre RO Cavalcanti (acavalca@Princeton.edu) [2], Laura Landweber F (lfl@Princeton.edu) [2]
[1] Department of Chemistry, Princeton University, Princeton, NJ 08544, USA
[2] Department of Ecology and Evolutionary Biology, Princeton University, Princeton, NJ 08544, USA

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen

Este estudio muestra que un exceso estadístico de los codones de parada se ha convertido en el tercer codón aguas abajo del codón de parada UAA real en levaduras. Análisis comparativo indica que los codones de parada en este lugar son considerablemente más sentido que se conserva codones, lo que sugiere que estas tándem codones de parada son mantenidos por la selección.

Antecedentes

En la mayoría de los organismos, uno de los tres codones de parada (UAA, UAG y UGA) las señales de la terminación de la traducción de proteínas. En ocasiones, una cerca afines-tRNA misreads una parada codón y el ribosoma lee a través de la señal de terminación. Nichols [1] propone que un segundo codón de parada después de la terminación real codón podría actuar como una copia de seguridad. Desde este codón siguiente codón de la real, se llama un 'tándem del codón ". Al dar a la maquinaria de traducción una segunda oportunidad de terminar la traducción de proteínas [2], junto codones de parada proporcionar un "mecanismo de seguro no".

Cuando se da lectura a través, aminoácidos adicionales se añaden a la final de la cadena peptídica. La presencia de los codones de parada tándem de los genes reduce el número extra de aminoácidos, lo que influiría en el plegado de proteínas, la adición de un menor número de aminoácidos extra aumenta la probabilidad de que la proteína mantendrá su estructura tridimensional. Además, reducir al mínimo el número de aminoácidos añadido a la cadena del polipéptido también es beneficiosa desde un punto de vista puramente punto de vista energético. Estos factores sugieren que la existencia de los codones de parada tándem conferiría una ventaja selectiva, y que implican tales codones no necesita seguir el verdadero cese inmediatamente la señal a ser beneficioso.

Hasta el momento, la existencia de los codones de parada tándem ha seguido siendo difícil de alcanzar. En Escherichia coli, por ejemplo, un reciente estudio alegó que la poco más de una representación tándem codones de parada sólo se producen como consecuencia de la marcada preferencia por la U en la primera posición después de los nucleótidos del codón como parte de una eficiente señal de parada [3] . Tandem codones de parada en eucariotas no han sido rigurosamente examinado. Por lo tanto hemos decidido analizar conjuntamente los codones de parada en levaduras. Elegimos la levadura como modelo el sistema por dos razones principales: en primer lugar, Saccharomyces cerevisiae es la mejor estudiada del genoma eucariota y la calidad de su anotación se ha mejorado en gran medida por las recientes análisis comparativos [4 - 6], que permiten detectar las señales de La debilidad de las fuerzas de la selección en el nivel genómico, en segundo lugar, ricos en datos experimentales sobre la eficacia de terminación de traducción están disponibles para caracterizar mejor la naturaleza de esas fuerzas.

En este estudio se ha llevado a cabo un análisis computacional para abordar la cuestión de si tándem codones de parada ocurrir en cualquier ubicación de los genes de levadura con inusualmente alta frecuencia; si tándem codones de parada están en la selección, y lo que es el principal factor que influye en tándem codones de parada.

Resultados
¿Tándem codones de parada sobre-representados en la secuencias de los genes de la levadura?

En este estudio definir conjuntamente los codones de parada como cualquier codón de parada que es de abajo, en el mismo marco, ya que, y dentro de una distancia relativamente corta de, la real del codón. Sólo se consideraron los nueve primeros lugares codón anotado abajo de la del codón, que se encuentran en las regiones no codificantes. La frecuencia de los codones de parada en cada uno de estos lugares después de la del codón real se determinó por separado para todos los genes de S. Cerevisiae que utilizar TAA, TAG, TGA y como codones de parada, respectivamente (T a lo largo de este documento se utiliza en lugar de U, donde se consideran las secuencias genómicas). La frecuencia de los codones de parada en las localidades correspondientes conforme a cada una de estas tres tripletes de nucleótidos (TAA, TAG y TGA), en las regiones no codificantes También se calculó como control.

Estos resultados se muestran en la Figura 1a-d. Sorprendentemente, encontramos que una parte muy significativa del exceso de los codones de parada se ha convertido en el tercer codón situado aguas abajo de la realidad del codón TAA, designada aquí como el codón UAA +3 (U usamos en lugar de T para indicar mRNA) (9,0% frente a 6,4%, χ 2 = 24,2, P <9 × 10 -7). No significativo exceso de los codones de parada se detectó en cualquier otro lugar. La identidad de los codones de parada en el codón UAA +3 ubicación no importaba (Figura 1e], no encontramos significación estadística de ningún codón de parada están bien representados en exceso o insuficientemente representados en este sitio.

Examinamos esta situación en otras tres especies estrechamente relacionadas con la levadura, S. Paradoxus, S. Mikatae y S. Bayanus, y alejadas de la levadura Candida glabrata, que fue recientemente secuenciado [7]. Estadísticamente significativa excesos de los codones de parada se confirmaron en esta ubicación en todas las especies (S. paradoxus χ 2 = 15,1, P <1 × 10 -4, S. mikatae χ 2 = 9,4, P <2 × 10 -3; S . Bayanus χ 2 = 20,6, P <6 × 10 -6; C. glabrata χ 2 = 9,0, P <3 × 10 -3) (Figura 2 y archivo de datos adicional 1). Como otro de control, se realizó el mismo análisis en los otros dos cuadros (frame +2, con los codones que comienza en la segunda después de los nucleótidos del codón, y marco +3, con los codones que comienza en la tercera después de los nucleótidos del codón) en S . Cerevisiae y encontró varios otros más débilmente representadas lugares, como en la SAU +1 (cuadro 2), pero ninguno de estos lugares trinucleótidos muestra la misma tendencia en las otras especies (archivos de datos adicionales 2 y 3).

En el marco de la SAU +3 codón es el único lugar excesivamente representados entre todas las especies de levadura, lo que indica que junto a los codones de parada UAA +3 están bien conservados en levaduras en gran medida. Esta conservación de las especies en todos los examinados sugiere que el exceso observado es biológicamente significativo, en lugar de ruido aleatorio. Por lo tanto, el siguiente análisis se centrará sólo en tándem codones de parada en este lugar.

¿Tándem codones de parada en el codón UAA +3 ubicación en virtud de la selección?

Con el fin de determinar si el exceso de los codones de parada junto a la SAU +3 1029 inequívoca entre pares de genes ortólogos S. Y S. cerevisiae Bayanus (que se define en [4]] en la que ambas orthologs uso del codón de la SAU. S. Bayanus fue escogido debido a que, entre las tres especies de Saccharomyces, que es el más alejadas a S. Cerevisiae [4] y, por tanto, las suplencias entre estas dos especies de proporcionar una mejor resolución para la comparación.

La ancestral estados de la SAU +3 codones fueron reconstruidas usando parsimonia. Entonces se conserva el número de codones de parada, no se conserva codones de parada, conservada sentido codones y no conservados sentido codones se calcularon y se muestran en la Tabla 1. Para probar si los codones de parada en este lugar son estadísticamente más conservadas de los codones sentido, se utilizó una independencia chi-squared test. Hemos encontrado que la conservación de los codones en el SAU +3 ubicación depende en gran medida de si se trata de un codón de parada (χ 2 = 6,1, P <0.01) (Tabla 1]. Además, se realizó el mismo análisis entre S. Cerevisiae y cada uno de los otros dos restantes especies de Saccharomyces. La tendencia de los codones de parada que se conserva más que en sentido codones SAU +3 es la misma en todas las comparaciones (entre S. cerevisiae y S. paradoxus, 1509 pares de genes ortólogos, χ 2 = 2,8, P <0,1; entre S. S. cerevisiae y mikatae, 1075 pares de genes ortólogos, χ 2 = 4,6, P <0,03). Con el aumento de la divergencia evolutiva en el análisis comparativo, la significación estadística se vuelve más sorprendente.

Además, entre los 504 grupos de genes en el que todos los genes ortólogos en las cuatro especies de Saccharomyces uso SAU como codones de parada, el 10,5% de ellos han tándem codones de parada en la SAU +3, que es mucho mayor que la expectativa azar (χ 2 = 18, P <2 x 10 -5). Por lo tanto, el tándem codones de parada en el codón UAA +3 ubicación parecen ser mantenida por la selección.

¿Codón prejuicios influyen en la distribución de los codones de parada tándem?

Se calculó el codón sesgo (número efectivo de los codones, ENC) [8] de todos los genes de la SAU con los codones de parada en S. Cerevisiae. El número de genes con un codón de parada situada junto a la SAU +3 ubicación en el codón sesgo alto cuartil (25% de los genes con los valores más bajos ENC) y la baja codón sesgo cuartil (25% de los genes con los más altos valores ENC) Y, a continuación, se determinó en comparación. Para probar si tándem codones de parada tienden a seguir los genes con alto sesgo codón, se utilizó una independencia chi-squared test. Se encontró que la proporción de los genes en tándem con un codón de parada en el codón sesgo alto cuartil es considerablemente mayor que la baja en el codón sesgo cuartil (15% versus 6%; χ 2 = 27,2, P <2 × 10 -7, Cuadro 2].

Una prueba de Kolmogrov-Smirnov indicó también que el codón sesgo de las distribuciones fueron significativamente diferentes (P <2,7 × 10 -9, Figura 3] entre los genes con y sin un tándem codón de parada.

¿Tándem codones de parada tienden a ocurrir en los genes o los genes esenciales con funciones compartidas?

En primer lugar, hemos clasificado los genes con los codones de parada UAA en cuatro grupos (genes esenciales, fuerte efecto fitness, fitness efecto moderado y débil efecto de fitness) sobre la base del valor mínimo de aptitud a través de cinco diferentes condiciones de crecimiento [9]. La aptitud de los valores medios de cada condición se calcula como la medida de la supervivencia y la reproducción de la cepa con respecto a la supresión de la reserva de todas las cepas cultivadas y mide colectivamente [10]. El número de genes en tándem con los codones de parada en el grupo de genes esenciales y débil efecto se han determinado grupo y, a continuación, en comparación. Hemos probado si tándem codones de parada tienden a seguir biológicamente importantes genes utilizando una independencia chi-squared test. Se encontró que la proporción de los genes en tándem con un codón de parada en el grupo de genes esenciales no es significativamente diferente de la de los débiles fitness efecto grupo (9,2% frente a 8,0%, χ 2 = 0,621, P = 0,43, Tabla 3].

En segundo lugar, hemos estudiado la distribución de los genes en tándem con los codones de parada en los distintos procesos biológicos, la función biológica de las categorías y los componentes biológicos, respectivamente (10 Gene Ontología (GO) los procesos biológicos, siete categorías funcionales GO GO y siete componentes biológicos; ver detalles adicionales en Archivos de datos 4, 5, 6) [11]. En términos de los procesos biológicos, junto con los genes codones de parada están excesivamente representados en Metabolismo (P <0,006) y el menos representado en el Ciclo Celular (P <0,01). En términos de las funciones biológicas, de los genes en tándem con los codones de parada están excesivamente representados en la actividad Estructurales Molecular (P <0,008). En términos de los componentes biológicos, junto con los genes codones de parada están excesivamente representados en la Cytosol (P = 0) y Cytoplasm (P <0,01). Estos sesgos podrían intrínsecamente observado se explica por la diferencia en los niveles de expresión de estos grupos específicos de genes. En tercer lugar, hemos estudiado la distribución de los genes en tándem con los codones de parada entre los diferentes cromosomas. No se detectó sesgo de la distribución, lo que indica que la existencia de tándem codones de parada se extiende a la totalidad de su genoma. En cuarto lugar, hemos examinado la distribución de genes junto con las transcripciones de los codones de parada con diferentes longitudes. No hay correlación entre el tándem codón de la frecuencia y la duración de las transcripciones podría ser detectado, lo que indica que la duración de una transcripción no tiene ninguna influencia en la presencia de un codón de tándem.

Discusión

Nuestros resultados muestran que un exceso estadísticamente significativo de los codones de parada se ha convertido en el tercer codón ubicación aguas abajo de los codones de parada UAA, designado SAU +3, y que esta característica se conserva a través de cinco diferentes especies de levaduras que se dispone de datos. Análisis comparativo entre la especie vecina ha demostrado que estos codones de parada son más sentido codones que se conserva en el mismo lugar, lo que indica que el tándem codones de parada son mantenidos por la selección. Si bien nuestros resultados apoyan la hipótesis de larga data que existen tándem codones de parada, plantea dos cuestiones centrales: (i) ¿por qué es un exceso de los codones de parada observó sólo en los genes utilizando la SAU como parada, y no en los genes usando UAG y UGA? (Ii) ¿por qué los codones de parada tándem evolucionar principalmente en el tercer lugar después de codón UAA, y no el primer o segundo codón lugares?

Hay varias posibles respuestas a la primera pregunta. Una sencilla explicación es que la SAU puede ser una debilidad frente al codón UAG y UGA, por lo cual se requería una copia de seguridad del codón más a menudo. Este no es el caso: los experimentos han indicado que la SAU es la más eficiente en el codón de terminación de levadura [12]. Desde la SAU es la más utilizada del codón altamente expresado en la levadura genes [13], otra explicación es que el tándem codones de parada tienden a ocurrir en los genes cuyos productos son de alta abundancia.

Para probar esta hipótesis, se analizó la correlación entre el tándem codón de la distribución y el codón sesgo. Codón sesgo refleja la propensión de un organismo a utilizar selectivamente ciertos codones. Varios estudios han demostrado que el codón sesgo es un buen indicador de la abundancia de proteínas, porque las proteínas altamente expresado en general tienen un alto sesgo codón [14, 15]. Por lo tanto, el codón sesgo puede ser utilizado como una aproximación a la expresión de la proteína nivel, a pesar de la abundancia de proteínas de un gen no se puede predecir específicamente sobre la base de su codón sesgo solos [16]. Se encontró que la distribución de los codones de parada tándem se correlaciona fuertemente con el codón sesgo, que indica que la expresión de la proteína nivel es un factor importante que influye en tándem codones de parada. Asimismo, examinó la relación entre el tándem codón de la distribución y la aptitud efectos de los genes, basado en la comparación de tándem codón de frecuencia entre el grupo de genes esenciales y débil grupo de genes-efecto, y no encontró ninguna correlación.

Selección en tándem codones de parada no es insignificante en este estudio sólo altamente expresado en la traducción de los genes que la rescisión se produce muchas veces durante el ciclo de vida de la levadura. Por lo tanto, independientemente de la aptitud de los efectos de genes, parece que los codones de parada tándem tienden a seguir los codones de parada de uso frecuente en el tercer codón abajo. Como resultado de ello, no es de extrañar que junto codones de parada seguir los genes de levadura que utilizan como parada UAA y no los que usan la UAG o UGA, porque sólo un pequeño número de los genes de levadura altamente expresado utilicen los dos últimos codones de terminación.

En cuanto a la ubicación de los codones de parada tándem, es sorprendente que los codones de parada tándem evolucionar principalmente en el tercer lugar después del codón real de los codones de parada. La razón biológica que se esconde tras esta observación no está claro. Una posible explicación es que la ubicación de los codones de parada tándem puede estar relacionada con la terminación del contexto real para. Numerosos resultados han indicado que la eficiencia de la traducción de terminación está influenciado por el contexto local en torno a los codones de parada [12, 17]. En estudios recientes se estableció que los seis nucleótidos después del codón de parada (correspondiente al codón lugares +1 y +2 en este estudio) son los principales factores determinantes de la lectura a través de frecuencias en la levadura, y que estos nucleótidos pueden influir en la eficiencia de lectura a través de más de 10 -- Veces [18, 19]. Por lo tanto puede haber fuertes restricciones a la evolución de los dos primeros codones río abajo, para mantener una eficiente para el contexto real del codón, el sitio principal para la señalización de la rescisión. A la par del codón puede no ser favorable en ninguno de estos lugares, ya que puede no funcionar bien como parte de la señal de terminación. Por ejemplo, en la primera tras la real de nucleótidos del codón de la SAU, la más común y la más eficiente es la base para la terminación G en lugar de U [12, 17], que se opone a esta nucleótidos de ser la primera posición en un codón de parada. Esto también puede explicar la escasa representación de los codones de parada tándem en el primer codón inmediatamente después de la del codón en levaduras (Figura 1]. La misma tendencia se observa también en otros eucariotas (véanse detalles adicionales en los archivos de datos 7 y 8).

Como una copia de seguridad, un tándem codón de parada pueden reducir los efectos negativos de la terminación de los errores de traducción y, por lo tanto, proporcionar una ventaja selectiva. Sin embargo, esta selección debe ser muy débiles ya que la traducción de terminación en general es muy eficiente, y la lectura a través es muy rara, con los niveles de error estimado en 0,3% en la levadura [18]. Por lo tanto, si la selección dominante en los dos primeros lugares codón (los próximos seis nucleótidos), a raíz del real codón de parada es el de mantener un contexto favorable para la terminación de la traducción eficiente, en lugar de acumular tándem codones de parada como copia de seguridad, la tercera ubicación puede convertirse en el codón El principal sitio de tándem codones de parada.

Tandem codones de parada son un mecanismo regulador relativamente sutil. Si bien la contribución de la aptitud de un solo tándem codón de parada puede ser insignificante, todo el efecto de sobre-representados tándem codones de parada en el nivel genómico es probable que no. Sería conveniente saber si esta (o similar) mecanismo opera en otras especies. Sin embargo, la respuesta no es fácil de abordar en este momento. Para la mayoría de las bacterias y arqueas, el número total de genes en general es muy pequeño. Por lo tanto, es imposible realizar un análisis estadístico similar en estos genomas, como el porcentaje absoluto de los genes en tándem con los codones de parada es bajo. En cuanto a otros eucariotas, se realizó el mismo análisis sobre la Drosophila melanogaster y Caenorhabditis elegans y encontrar uno o dos excesivamente representados los codones (ver archivos de datos adicionales 7 y 8), pero la significación estadística es muy débil. Aquí hay que destacar que nuestro éxito en la identificación de los codones de parada en tándem levaduras radica en tres factores necesarios. En primer lugar y por encima de todo, los recientes análisis comparativo ha mejorado en gran medida la calidad de las especies Saccharomyces anotación del genoma, que conduzca a la eliminación de unos 500 genes espurio y la modificación de cerca del 10% de los límites anotado regiones de codificación [4]. Esto nos permitió observar una fuerte señal más de fondo. En segundo lugar, la disponibilidad de varios genomas estrechamente relacionados con la levadura permita la identificación de las señales y se conserva más el filtrado de ruido de fondo. En tercer lugar, la influencia de los contextos locales en la terminación y la lectura a través de la eficiencia en levaduras ha sido objeto de intenso estudio experimental, que no es cierto para la mayoría de eucariotas. Juntos, estos factores limitan la capacidad de ampliar este estudio en la actualidad.

Conclusión

Nuestro estudio demuestra por primera vez la existencia de los codones de parada junto a la genómica nivel - un compromiso de larga data e intrigante hipótesis. Nuestros resultados indican que la expresión de la proteína a nivel biológico es un importante factor que influye en la presencia de tándem codones de parada. Esperamos que nuestro estudio de las levaduras servirá de modelo para futuros exámenes de otros grupos de especies.

Materiales y métodos

Secuencias de genes de las cuatro especies de levadura (S. cerevisiae, S. paradoxus, S. mikatae y S. bayanus) fueron descargados de [20]. Espurias genes y los genes con ambiguas fronteras fueron excluidos de nuestro análisis. Secuencias de C. Glabrata fueron descargados de GenBank (NC_005967-005968-006036 y NC_006026).

Utilizamos scripts de Perl para calcular la frecuencia de los codones de parada en las nueve localidades codón anotado abajo de los codones de parada. Como control, se emplearon las regiones no codificantes del genoma de la misma: en primer lugar buscamos la ocurrencia de trinucleotides TAA, TAG y TGA; entonces, se calculó la frecuencia de ocurrencia de estos trinucleotides en el mismo marco, en los próximos nueve codones. Significación estadística de la diferencia observada entre el tándem del codón correspondiente frecuencia y de la frecuencia en el control se determinó por la independencia chi-squared tests. Debido a que no utiliza la codificación de las secuencias de ADN del genoma de la misma como un control, factores como la única y dinucleotide composición son automáticamente incluidos en el análisis y no necesitan ser explícitamente considerados. Análisis similares se realizan también en los otros dos marcos de lectura para la comparación. Porque aquí hemos estudiado el codón muchos lugares simultáneamente y menos restrictivas utilizado un P-valor de corte (0,05), es muy importante examinar las señales en todas las especies de levadura. Interpretamos sólo el codón lugares excesivamente representados en todas las especies como biológicamente significativos.

La información acerca de uno a uno entre pares de genes ortólogos S. Y S. cerevisiae Bayanus fue extraída de [4]. Los pares de genes ortólogos utilizando como codón de parada UAA han sido utilizados en el análisis de la conservación. En primer lugar, hemos reconstruido los estados ancestrales de la SAU +3 codones usando una simple regla de parsimonia. Si dos genes ortólogos comparten una idéntica en el codón UAA +3 ubicación, el codón se supone que es el estado ancestral de la SAU +3 codón. Si dos genes ortólogos tienen diferentes codones en el codón UAA +3 ubicación, cada codón se supone que es el estado ancestral con 0,5 de probabilidad. Luego se compararon los inferirse ancestrales SAU +3 codón con la SAU +3 codón en cada uno de los genes ortólogos y decide si es conservada en la evolución. El número de conserva codones de parada, no se conserva codones de parada, conservada sentido codones y no conservados sentido codones se calcularon, respectivamente. Significación estadística de la diferencia entre la conservación de los codones de parada y el sentido codones se puso a prueba por una independencia chi-squared test. Aquí hemos utilizado una definición estricta de conserva codón de parada, lo que requiere que sea idéntico entre los inferirse antepasado y su descendiente (especies modernas). Incluso con este criterio estricto, el P-valor es significativo. Si la definición que relajarse para permitir que cualquier codón de parada, el resultado sería aún más significativa. El mismo análisis se llevó a cabo entre S. Y S. cerevisiae Paradoxus / S. Mikatae, respectivamente.

Codón sesgo (número efectivo de los codones, ENC), de todos los genes utilizando la SAU como codón de parada en S. Cerevisiae se calculó utilizando el programa CODONW [21]. Significación estadística de la proporción de los genes con y sin tándem codones de parada en los genes con los más altos valores ENC 25% versus el 25% más bajo fue probado por una independencia chi-squared test. La diferencia en el codón sesgo de la distribución entre estos dos grupos de genes (con / sin un tándem codón de parada) se determinó mediante la prueba de Kolmogrov-Smirnov utilizando MATLAB (versión 6.5).

Físico mediciones se obtuvieron de un estudio de alto rendimiento [9] que mide el crecimiento de cada cepa de una colección casi completa de la levadura solo gen de supresión de los cinco años los mutantes condiciones de crecimiento. Se calcularon los valores de la aptitud para el crecimiento medio en cada condición y, a continuación, clasificados todos los genes utilizando la SAU como el codón de parada en cuatro grupos sobre la base de estos valores de fitness (f). El cálculo del valor de fitness y de clasificación de genes son los mismos que en [10]. Significación estadística de la diferencia en tándem codón de frecuencia entre los débiles-efecto grupo de genes (f> 0,95 para las cinco condiciones de los medios de comunicación) y los grupos de genes esenciales (si la supresión es letal) se determinó por la independencia chi-squared test.

El estudio de la distribución de los genes en tándem con los codones de parada en los distintos procesos biológicos, la función biológica de las categorías, y los componentes biológicos se realizó por GO Término Mapper Saccharomyces en la base de datos del genoma [22]. El conjunto de todos los genes de la SAU con los codones de parada se utilizó como control para determinar si el conjunto de genes que contiene tándem codones de parada es estadísticamente sobre-representados o insuficientemente representados en una categoría específica de genes.

Adicional de los archivos de datos

Los siguientes datos adicionales están disponibles con la versión en línea de este documento. Adicional 1 ofrece archivo de datos de la frecuencia de los codones de parada en cada codón siguiente a la ubicación real del codón en otras especies de levadura. Adicional archivo de datos 2 ofrece los resultados de los codones de parada en cada codón siguiente a la ubicación real de los codones de parada en los tres marcos de lectura en S. Cerevisiae. Datos adicionales archivo 3 se presentan los resultados de codón excesivamente representados en otros lugares de las especies de levadura. Adicional 4 ofrece archivo de datos de la distribución de los genes en tándem con un codón de parada en los distintos procesos biológicos en el S. Cerevisiae. Datos adicionales archivo 5 da la distribución de los genes en tándem con un codón de parada biológica en distintas categorías funcionales en S. Cerevisiae. Archivo de datos adicional 6 ofrece la distribución de los genes en tándem con un codón de parada en los distintos componentes biológicos en el S. Cerevisiae. Datos adicionales archivo 7 da frecuencia de los codones de parada en cada codón siguiente a la ubicación real de los codones de parada en Drosophila melanogaster. Datos adicionales de archivo 8 da frecuencia de los codones de parada en cada codón siguiente a la ubicación real de los codones de parada en Caenorhabditis elegans. Datos adicionales fichero 9 se enumeran los genes en tándem con un codón de parada en las distintas especies de levaduras.

Material suplementario
Archivo Adicional 1
Cuadro 1, Frecuencia de los codones de parada en cada codón siguiente a la ubicación real de los codones de parada en
S. bayanus
Cuadro 2, de frecuencias de los codones de parada en cada codón siguiente a la ubicación real de los codones de parada en
S. paradoxus
Cuadro 3, Frecuencia de los codones de parada en cada codón siguiente a la ubicación real de los codones de parada en
S. mikatae
Cuadro 4, de frecuencias de los codones de parada en cada codón siguiente a la ubicación real de los codones de parada en
C. glabrata
Archivo Adicional 2
En el marco de la SAU +3 es el único codón ubicación excesivamente representados en todas las especies de levadura.
Archivo Adicional 3
Porque aquí hemos estudiado muchos lugares simultáneamente y codón utilizado una menos restrictiva
P
- El valor de corte, es muy importante que se siga examinando la señales biológicas en otras especies de levadura. Por lo tanto, excesivamente representados lugares fueron examinados. Sólo en el marco codón ubicación
SAU +3
Mostró la misma tendencia en todas las demás especies. 1. Significativo
P
- Valores se muestran en negrita (95% de nivel de confianza, p <0,05). 2. Insuficientemente representados posiciones se muestran como "na".
Archivo Adicional 4
Las barras azules representan los porcentajes de los genes en tándem con un codón de parada en cada proceso biológico y las barras de color rojo representan los controles - los porcentajes de los genes con un codón TAA en los correspondientes grupos.
Archivo Adicional 5
Las barras de color rojo representan los porcentajes de los genes en tándem con un codón de parada biológica funcional en cada categoría y las barras de color rojo representan los controles - los porcentajes de los genes con un codón TAA en los correspondientes grupos.
Archivo Adicional 6
Las barras azules representan los porcentajes de los genes en tándem con un codón de parada biológica de cada componente de color rojo y las barras representan los controles - los porcentajes de los genes con un codón TAA en los correspondientes grupos.
Archivo Adicional 7
Las barras rojas representan la frecuencia de los codones de parada en cada localidad y el codón barras azules representan los controles - la frecuencia de los codones de parada en las localidades correspondientes aguas abajo de los codones de parada en las regiones no codificantes.
Archivo Adicional 8
Las barras rojas representan la frecuencia de los codones de parada en cada localidad y el codón barras azules representan los controles - la frecuencia de los codones de parada en las localidades correspondientes aguas abajo de los codones de parada en las regiones no codificantes.
Archivo Adicional 9
1. Lista de los genes con un codón de parada en tándem
S. cerevisiae
2. Lista de los genes con un codón de parada en tándem
S. bayanus
3. Lista de los genes con un codón de parada en tándem
S. mikatae
4. Lista de los genes con un codón de parada en tándem
S. paradoxus
5. Lista de los genes con un codón de parada en tándem
C. glabrata
Agradecimientos

Damos las gracias a Zhenglong Gu, de la Universidad de Chicago, por la amabilidad de proporcionar los valores calculados de fitness. También damos las gracias a dos árbitros anónimos por valiosas sugerencias. Este trabajo fue apoyado por el Instituto Nacional de Ciencias Médicas Generales de subvención GM59708 Fundación Nacional para la Ciencia y la subvención a DBI-9875184 LFL