PLoS Computational Biology, 2006; 2(3): (más artículos en esta revista)

Spatiotemporal Expresión Control Correlaciones con Intragenic Scaffold Matrix Attachment Regiones (S / MARs) en Arabidopsis thaliana

Biblioteca Pública de la Ciencia
Igor Tetko V [1], Georg Haberer [1], Stephen Rudd [2], Blake Meyers [4], Hans-Werner Mewes [1], Klaus F. Mayer X [1]
[1] GSF Nacional Centro de Investigación del Medio Ambiente y la Salud, MIPS, el Instituto de Bioinformática, Neuherberg, Alemania
[2] Grupo de Bioinformática, Centro de Biotecnología de Turku, Tykistokatu, Turku, Finlandia
[3] Departamento de Genoma Orientadas a la Bioinformática, Wissenschaftszentrum Weihenstephan, Technische Universität München, Freising, Alemania
[4] Departamento de Ciencias del Suelo y de Plantas, Instituto de Biotecnología de Delaware, Newark, Nueva Jersey, Estados Unidos de América
Resumen

Andamio / matriz archivo adjunto regiones (S / MARs) son esenciales para la estructura de la organización de la cromatina dentro del núcleo y sirven como anclas de la cromatina bucle dominios. Una importante fracción de los genes en Arabidopsis thaliana Contiene intragenic S / MAR elementos y una correlación significativa de S / MAR presencia y la expresión general de la fuerza ha sido demostrada. En este estudio, se realizó un análisis del genoma escala y nivel de expresión spatiotemporal expresión diferencias en la correlación con la presencia o ausencia de génica S / MAR elementos. Demostramos que los genes que contiene intragenic S / MARs son propensos a la expresión pronunciada spatiotemporal reglamento. Esta característica resulta ser aún más pronunciada para el factor de transcripción de genes. Nuestras observaciones demuestran la importancia de S / MARs en regulación transcripcional y el papel de la cromatina características estructurales de regulación de genes. Nuestros hallazgos abren nuevas perspectivas para la comprensión de tejidos y de órganos específicos de regulación de la expresión génica.

Introducción

Andamio / matriz archivo adjunto regiones (S / MARs) son los elementos estructurales de las células eucariotas [1]. S / MARs son necesarios para la compactación y el anclaje de la cromatina nuclear al marco. Estas regiones son aproximadamente 300 pares de bases a varias kilobases de longitud, y están presentes en todos los eucariotas superiores, incluidos los mamíferos y las plantas [2, 3]. S / MARs se definen como elementos de ADN que se unen específicamente a la matriz nuclear y como los fragmentos de ADN copurify con la matriz nuclear [4]. Participación de S / MARs en la regulación de la actividad de los genes y en la estabilización de expresión se ha demostrado de los distintos genes y S / MARs [5]. Para los vertebrados, una sorprendente superposición de los elementos conservados y no S / MAR funcionalidad ha informado [6]. Glazko y compañeros de trabajo informó de que un exceso de vertebrados conservadas S / MAR regiones intergénicas se detectó en las regiones anteriores a la 5 'finales de los genes, lo que sugiere que estas regiones embargo pudieran estar implicados en el control transcripcional. Estas conclusiones formuladas por los vertebrados cuentan con el apoyo de nuestro anterior análisis de la correlación de S / MAR elementos y niveles de expresión en Arabidopsis thaliana . S / MAR-contienen genes (S / MAR + genes) se han mostrado para llegar a general significativamente inferior en comparación con los niveles de expresión de genes que no están relacionadas con S / MARs, o que carecen de S / MARs (S/MAR- genes) [7]. Así, intragenic S / MARs muestran una correlación negativa con el nivel transcripcional de la S / MAR-que contienen genes y, por tanto, pueden participar en la regulación de la expresión génica.

Se ha planteado la hipótesis de que, además de control transcripcional mediada por factores de transcripción específicos (TFs) y sus respectivos cis-regulador promotor sitios de unión, de más alto nivel espacial y temporal de cromosomas en el núcleo de topología y su asociación con la matriz nuclear ejercer importantes funciones reguladoras . Por cada S / MARs, tejidos y temporal de las funciones de regulación están bien establecidas [1, 8, 9]. Sin embargo, hasta el momento, ningún organismo tiene para una amplia escala de análisis del genoma y se comprometió a investigar las implicaciones de S / MAR presencia dentro de los genes con respecto a la actividad transcripcional. Con la disponibilidad de una alta calidad del genoma de Arabidopsis plantilla y la localización de S / MARs sobre el genoma completo [7], así como la disponibilidad de datos de alta calidad de expresión [10 - 13], se ha hecho lo posible para hacer frente a las cuestiones relativas a La influencia de intragenic S / MARs sobre spatiotemporal regulación de la transcripción. En nuestro análisis, hemos hecho uso de la expresión datos disponibles que miden expresión en diferentes tejidos, órganos, y las etapas de desarrollo. Nuestros resultados proporcionan pruebas de que la presencia de un intragenic S / MAR no sólo se correlaciona con los niveles de expresión de los genes, pero también muestra una marcada especificidad para los tejidos, órganos, y las fases de desarrollo. Esto permite a la conclusión de que intragenic S / MARs no sólo sirven como organizadores estática de la estructura cromosómica y nucleares, sino también reflejar la presencia de elementos potencialmente dinámica de ADN que ejercen importantes funciones de regulación en la expresión de genes individuales.

Resultados

En nuestro análisis, hemos utilizado S / MARs que se detectaron como se describe en nuestro anterior análisis [7]. Dentro de este estudio muestran que S / MAR + genes que contienen S / MAR elementos tienen un menor nivel de expresión. Esto ha sido medido por EST asociaciones como sustituto de la fuerza de expresión, así como por MPSS (Massive Parallel Secuenciación Firma). La tecnología produce MPSS corta secuencia de las firmas producido a partir de una determinada posición dentro de una ARNm, y la abundancia relativa de las dos firmas en un determinado biblioteca representa una estimación cuantitativa de la expresión de ese gen. Con este fin, no distingue entre los diferentes órganos y tejidos expresión valores se han realizado y las posibles correlaciones entre el patrón y la distribución de tejidos y la presencia / ausencia de S / MARs no han sido analizados.

Expresión de alta resolución permitirá a los conjuntos de datos de alta resolución de estudios de S / MAR efectos sobre las propiedades transcripcional

Para este estudio, hemos utilizado la expresión de datos que se generaron con diferentes focos experimental y utilizando técnicas diferentes plataformas. La primera expresión de datos fue obtenida por la MPSS tecnología [7, 12, 13]. El individuo MPSS etiquetas fueron asignadas en el genoma de Arabidopsis e inequívoca MPSS etiquetas fueron seleccionadas (ver Materiales y Métodos].

Además, un conjunto de datos raíz de expresión, denominado digital de datos in situ, se ha utilizado para el análisis. Se deriva de una alta resolución espacial y temporal a lo largo del perfil de expresión de Arabidopsis raíz [10]. Estos datos representan una expresión de ruta de la raíz de Arabidopsis 22000 genes, con las mediciones realizadas dentro de los seis diferentes tejidos o combinaciones de tejidos (estelas, endodermis, endodermis además de la corteza, las células epidérmicas atrichoblast, y la tapa lateral raíz), así como tres puntos de tiempo Desarrollo de las etapas definidas por su distancia de la raíz meristemo apical (Cuadro 1].

Por último, también se utiliza una expresión de datos derivados de la AtGenExpress proyecto, que se compone de 79 diferentes experimentos que abarcan una amplia gama de etapas de desarrollo, los órganos y sistemas de órganos [11]. Hemos seleccionado tres conjuntos de datos que representan la expresión dentro de los diez diferentes órganos, tejidos de flores cinco, y cinco etapas de desarrollo de flores (Tabla 1].

La raíz y el conjunto de datos AtGenExpress proyecto se basan en la plataforma Affymetrix ATH1.

S / MAR + Genes ¿Menos Expresado Independientemente de los Tejidos y Órganos

Se calculó la mediana de expresión de los valores conjuntos de datos con mediciones de órganos y tejidos (Tabla 1, los conjuntos de datos de 1, 2, 4 y 6). Figura 1 muestra que S / MAR + genes tienen valores significativamente más bajos de expresión de todos los experimentos. La relación de la expresión de S/MAR- de S / MAR + genes fue en el rango de 1.6:2, y los resultados fueron consistentes entre los distintos experimentos y plataformas. En contraste con las ratios, la máxima expresión de los valores de cada conjunto de los experimentos no fueron significativamente diferentes de S / MAR + y S/MAR- conjuntos de genes, con la excepción de la raíz de datos (cuadro 2, el conjunto de datos 2).

S / MAR + genes tienen más probabilidades de ser expresadas diferencialmente

Para preguntar si S / MAR + genes difieren únicamente en las líneas generales de los niveles de transcripción o si la expresión nivel más bajo observado es causado por una más acentuada expresión diferencial en los tejidos y órganos, que presenta el perfil de índice diferencial EXpression (DEXP). DEXP El valor corresponde al nivel relativo de expresión de los genes en un determinado tejido, frente a su máxima expresión. Así, la medidas DEXP otra característica de los datos, es decir, su tendencia a la asimetría y se expresa sólo en algunos tejidos, órganos, o los tratamientos. Alto DEXP valores, los cerca de 1, son indicativos de los genes se expresa en todos los tejidos, órganos, y las etapas de desarrollo de niveles similares. En contraste, los genes de baja DEXP valores son expresados preferentemente en uno o muy pocos experimentos y, por tanto, se han pronunciado y limita los dominios de expresión.

Para los tejidos y órganos analizados, S / MAR + genes muestran una DEXP valor significativamente más bajo en comparación con S/MAR- genes (Figura 2]. S / MAR + genes, por lo tanto, tienden a ser confinados a determinados tejidos u órganos. Si bien los valores de las medianas de expresión sobre todos los tejidos son más bajos, la máxima expresión de los valores de S / MAR + genes se encuentran en un rango similar como para S/MAR- genes. El MPSS datos producidos DEXPs el más pequeño de la S / MAR + genes. Este resultado puede indicar un menor nivel de ruido en los datos generados por esta tecnología, en comparación con la tecnología de Affymetrix [13, 14]. Un mayor nivel de ruido puede plantear nonexpressed valores de la expresión de genes y, por tanto, aumentar la DEXP valores. Además, el método MPSS medidas de la expresión absoluta de los valores de la expresión de genes, mientras que para Affymetrix, las mediciones relativas expresión sólo se utilizan los valores. Además, los resultados medidos por medio de Affymetrix pueden ser también sensibles a los efectos de hibridación cruzada [15], lo que puede disminuir las diferencias entre altamente expresado y nonexpressed genes.

Para realizar una comparación directa de MPSS-versus Affymetrix basado en mediciones de expresión en diferentes órganos (Tabla 1, los conjuntos de datos 1 y 4), se calcularon los valores DEXP para los cuatro órganos comunes tanto a través de bases de datos, es decir, inflorescencia, hojas, raíces, y Silique. En este análisis, los perfiles de DEXP S / MAR + y S/MAR- genes fueron similares para ambos tipos de datos, como se indica en la figura S1, pero tienen diferentes valores absolutos. No obstante, aunque la expresión absoluta y DEXP valores no son directamente comparables entre ambas plataformas, diferencias significativas en la expresión de genes entre S / MAR + y S/MAR- genes dentro de cada experimento son consistentes entre todos los experimentos y las plataformas.

En resumen, S / MAR + genes habían DEXP valores significativamente más bajos en comparación con S/MAR- genes. La pronunciada expresión diferencial producido un menor valor de la mediana de expresión S / MAR + genes, mientras que la máxima expresión de S / MAR + genes estaban en el mismo rango que S/MAR- genes. Estos resultados sugieren que intragenic S / MARs puedan participar en tejido o de órganos específicos de regulación de la expresión.

Perfiles de desarrollo de S / MAR + Genes

Como la presencia de génica S / MARs mostró una marcada influencia en la especificidad de la expresión, nos interesaba efectos similares si se puede detectar el desarrollo de cursos a tiempo. Para abordar esta cuestión, hemos utilizado la expresión datos disponibles para tres etapas de desarrollo de las raíces (Tabla 1, el conjunto de datos 3) y cinco etapas de desarrollo floral (Cuadro 1, el conjunto de datos 5). Nos volvieron a analizar la media de los valores de expresión, así como la expresión diferencial de S / MAR + S/MAR- frente a los genes de las diferentes etapas de desarrollo de las raíces y flores, respectivamente (Figura 3]. S / MAR + genes tenían significativamente menor mediana de los valores y expresión DEXPs que hizo S/MAR- genes de todas las etapas, con la excepción de la etapa 3 en el origen de datos. Estas observaciones son indicadores de la función reguladora ejercida por S / MAR elementos durante el desarrollo de raíces y flores. Las diferencias en los valores DEXP mediana de expresión y los valores entre los dos grupos de genes redujo con el aumento de las etapas de desarrollo del órgano. Así, en las etapas finales de desarrollo y diferenciación de los órganos, el efecto regulador de intragenic S / MARs descensos y diferenciado y la mediana de las expresiones de S / MAR + S/MAR- genes y convertirse similares.

TFs contienen cantidades desproporcionadas de S / mars y son altamente expresados diferencialmente

TFs son fundamentales reguladores de la actividad transcripcional de los genes. Con las marcadas diferencias observadas en la expresión para el desarrollo entre los diferentes tejidos y órganos, hemos examinado el alcance de S / MAR presencia de los genes dentro de TF y pregunta si la pronunciada temporal y espacial diferencias observadas por S / MAR + genes también se pueden encontrar para TFs. Este análisis utilizó todos TF 1611 genes que figuran en el Arabidopsis thaliana Factor de transcripción de bases de datos ( Http://arabidopsis.med.ohio-state.edu/AtTFDB ) [16]. El análisis de estas TFs mostró que 240 TF genes (15%), que figura S / MAR regiones. Esta proporción es de la mitad veces mayor en comparación con el porcentaje global de 9,8% S / MAR + genes en el genoma (p <10 -8 acuerdo a la prueba binomial). Se analizó la expresión diferencial de genes y TFs con y sin S / MARs utilizando el DEXP. Estamos TF designar a los genes, que también contienen una S / MAR como TF + S / MAR +, otros genes como TF TF S/MAR- +, y el resto de S / MAR + genes como TF-S / MAR + (Figura 4].

Para todos los tejidos y órganos analizados bases de datos, hemos detectado marcadas diferencias entre las distintas categorías de los genes. El DEXP valores fueron significativamente inferiores para TF genes en comparación a los no-TF genes. Este resultado está de acuerdo con bien establecidas TF conocimientos que tienden a ser los genes expresados diferencialmente [17]. Sin embargo, S / MAR + genes habían DEXP valores significativamente más bajos que los genes y, por tanto, TF mostrar aún mayor en tejidos y órganos específicos de expresión en comparación con TFs. Los genes que contienen TF S / MARs mostró la menor DEXP valores para todos los conjuntos de datos de órganos y tejidos y, por tanto, tiene la mayor probabilidad de tener el tejido u órgano-específicas de expresión entre todas las categorías de los genes analizados. En resumen, se observó un efecto sinérgico en tejidos y órganos específicos de la expresión de genes de TF y la presencia de intragenic S / MARs.

Un análisis de conjuntos de datos de las diferentes etapas de desarrollo de las raíces y flores (Tabla 1, 3 y 5 de datos) dieron resultados similares para la expresión de TF y S / MAR + genes (figura S2]. Como en el caso de tejidos y órganos especificidad, la TF-S / MAR + genes habían DEXP valores significativamente más bajos en comparación con la carretera TF-S/MAR- genes. El DEXP valores de la TF genes que contienen S / MAR elementos muestran una marcada diferencia, y no hubo diferencia significativa en la expresión de los genes de este grupo en comparación con el TF o S / MAR + genes se detectó expresión de los datos de diferentes etapas de desarrollo de raíz. Para el desarrollo de flores (Tabla 1, el conjunto de datos 5), DEXP valores de la TF + S / MAR + genes fueron significativamente inferiores en comparación con los genes TF, pero no respecto a los S / MAR + genes.

S / mars son significativamente excesivamente TF específicas dentro de las familias

TF genes disponibles en el Arabidopsis thaliana Factor de transcripción de bases de datos se han subclassified en 42 familias [16]. Se analizó si TF específicas de las familias se enriquecen S / MAR +. Se encontraron tres notables familias (Tabla 3). Los genes homeobox en la familia, la familia MADS box, y la hélice básica-loop-hélice familia excesivamente contienen cantidades de S / MARs (30,7%, 28,2%, 22,8% y S / MAR +, respectivamente, los valores de p <0.00005 para <0,001, Tabla 3].

Estos grupos contienen numerosas TFs bien estudiado con importantes funciones en el desarrollo y durante el ciclo de vida de las plantas para la expresión concreta de localización que se ha demostrado. Los ejemplos incluyen la WUSCHEL (WUS) [18], SHOOTMERISTEMLESS (STM) [19], y BELL (BEL1) [20] genes homeobox dentro de la clase y la AGAMOUS (AG), APETALA 1 y 3 (AP1, AP3), y SEPALATA 1 y 3 (SEP1 y SEP3) en la clase MADS box [21 - 23]. Una lista completa de S / MAR-TFs que contiene se presenta en la Tabla S1.

El grado de expresión diferencial varía para los diferentes Intragenic S / MAR localizaciones

Para todos los análisis mencionados anteriormente, los genes que contenían S / MARs dentro de los 5 'UTR, de la codificación de la proteína exones, o intrones se consideraban S / MAR + genes. Hemos analizado si DEXP valores varían con la posición de un S / MAR elemento en el gen. Como se indica en el Gráfico 5, la DEXP valores de S / MAR + genes dependen de la posición de la región archivo adjunto. Los genes que contienen S / MARs dentro de intrones han DEXP valores significativamente más bajos en comparación con los genes con S / MAR regiones en el 5 'UTR o exones. Estos resultados son consistentes para ambos Affymetrix-y MPSS basada MPSS de datos.

Discusión

Para obtener una perspectiva de la función y la correlación de la presencia de S / MAR spatiotemporal elementos en el control de la expresión génica, analizamos genomewide, expresión multidimensional de datos A. thaliana . En nuestro anterior análisis, se informó de la detección de los posibles 21705 S / MAR elementos, entre los cuales 2135 han sido localizados dentro de los genes [7]. En las pruebas de funcionamiento, individual S / MARs se ha demostrado que actúan como aislantes, mediante la protección de un bucle de los efectos de la cromatina vecinos o asociados potenciador secuencias [24, 25], y su acción ha demostrado ser altamente dependientes del contexto [26 ]. Numerosos estudios demuestran la influencia de los limítrofes, aislante de tipo elementos, así como la compleja interacción de intronic potenciadores y limítrofes S / MAR elementos en el control transcripcional de los genes [25 - 27] (y las referencias en él).

Estamos ante la cuestión de si y en qué medida intragenic S / MARs afectan en el control transcripcional A. thaliana . Para este análisis, hemos hecho uso de la expresión exhaustiva de datos disponibles para los diferentes tejidos, órganos, y las fases de la vida de Arabidopsis [10, 11, 13]. La expresión de los valores de S / MAR + S/MAR- genes y los genes se analizaron las características de su expresión. Se identificaron varias características importantes de S / MAR + genes.

El análisis de expresión sobre la base de datos MPSS, in situ expresión digital de datos para los diferentes tejidos raíz, y Affymetrix expresión de datos que abarcan una amplia gama de tejidos, órganos, y el desarrollo de todas las etapas que se indica S / MAR + genes fueron significativamente inferiores en comparación con expresaron S / MAR-genes. Esto está en línea con los resultados anteriores que se basaban en sólo una expresión a nivel mundial [7]. Además, nuestro análisis muestra que el efecto global de downregulatory génica S / MARs se puede detectar en todos los órganos y tejidos analizados. Sin embargo, la máxima expresión fueron similares entre los niveles de S / MAR + y S/MAR- genes.

Nos presenta el DEXP cuantitativamente a diferenciar entre los genes que muestran pronunciados picos de expresión para los distintos tejidos y órganos a los genes que están ampliamente expresadas. Un bajo DEXP valor es indicativo de un pronunciado órgano o tejido específico patrón de expresión, mientras que un alto valor DEXP caracteriza a los genes que se expresan en niveles similares en una amplia gama de tejidos y órganos y, por tanto, no muestran o menos pronunciada de órganos y tejidos Especificidad. Se encontró que el S / MAR + genes habían DEXP valores significativamente más bajos en comparación con los de S/MAR- genes. Así, el S / MAR + genes son expresados preferentemente en sólo una de las condiciones analizadas y su expresión fue de tejidos y órganos específicos y depende de la etapa de desarrollo. Se encontró que una alta proporción de genes contienen TF S / MARs. El valor global de DEXP encontradas TF genes fue menor que para los otros tipos de genes. Sin embargo, S / MAR presencia dentro TF genes conduce a una pronunciada disminución en el valor DEXP, lo que sugiere una más pronunciada spatiotemporal regulación de la TF + S / MAR + genes.

La expresión diferencial en S / MAR + genes fue visible en la disminución de DEXP y está relacionada con la posición de la S / MAR en el gen. Los genes que contienen S / MARs dentro de intrones ha DEXP valores significativamente más bajos en comparación con los genes que contienen S / MARs dentro de los 5 'UTRs o exones. Además, la probabilidad de detectar S / MAR regiones dentro de los intrones también fue aproximadamente dos veces mayor en comparación con los exones [7]. Estos resultados son consistentes con la importante función de intronic S / MARs en la regulación de los genes, como la cadena pesada de inmunoglobulina locus (Igh) [28]. En resumen, nuestros resultados indican que la presencia de S / MARs dentro de intrones es el mecanismo dominante de S / MAR-mediada-tejido, órgano-, y el desarrollo dependen de la regulación transcripcional en las plantas.

La expresión los valores medidos por diversas tecnologías (es decir, MPSS y Affymetrix) y los valores obtenidos de diferentes laboratorios de expresión dio lugar a disímiles y DEXP valores de S / MAR + genes (Figuras 1 - 5]. Comparación directa de los diversos conjuntos de datos no era viable, por lo que nuestro análisis se basa en la comparación de S / MAR + y S/MAR- genes entre individuos, comparable series de experimentos. Las diferencias significativas entre los dos grupos de genes que se observó constantemente a través de los diversos conjuntos de datos.

Nuestros resultados no apoyan un papel importante de S / MARs en spatiotemporal regulación transcripcional. Se encontraron marcadas diferencias de S / MAR + y S/MAR- genes en todos los órganos derivados de conjuntos de datos se analizaron, para conjuntos de datos que reflejan el estado transcripcional en diferentes tejidos, y para los datos que reflejan diferentes puntos de tiempo de desarrollo. Sobre la base de nuestros conocimientos, esta es la primera observación de una fuerte y significativa correlación de la presencia de S / MARs y la spatiotemporal control de la expresión génica en una escala del genoma.

Sin embargo, los genes y el S / MARs asociados con ellos se han estudiado y caracterizado bioquímicamente. Por ejemplo, la interacción del pollo S / MAR vinculante SATB1 proteínas y SATB2 con S / MAR regiones siempre y tejidos específicos de la regulación de expresión de genes de ratón en [8, 29, 30]. SATB1 actúa como un tipo de células específicas del genoma organizador y regulador de genes esenciales para la diferenciación de células T y activación. SATB1 lo reprime numerosos genes, y bioquímica datos indican que la represión está mediado por la desacetilación de histonas H3 en Lys9 y Lys14 [31 - 34]. Desacetilación de histonas a través de la represión a través de un S / MAR asociados con SATB1 ha sido analizado en detalle [31, 35]. El bioquímico base de S / MAR acción sobre una escala genómica todavía no se conoce y será objeto de futuros análisis. Sin embargo, la Arabidopsis, en la regulación de la actividad transcripcional a través de la modificación de las histonas está bien establecida, y esto puede conducir a la compactación de la cromatina a través de la formación de la heterocromatina [36]. Más recientemente, un importante papel de la acetilación de histonas y de la remodelación de la cromatina en la expresión de genes de mediación sobre la base de señales posicionales se ha demostrado en Arabidopsis raíces y hojas [37, 38].

Estudios recientes proponen que la heterogeneidad morfológica y funcional del núcleo se genera por la presencia de distintos compartimentos nuclear [39]. Estas observaciones han llevado al desarrollo de conceptos avanzados de la arquitectura nuclear y la integración estructural de los cromosomas en el núcleo. Una importante influencia de la organización nuclear de la actividad de los genes se ha planteado la hipótesis. Varios estudios recientes indican una estrecha correlación del cromosoma territorio (CT), la estructura y la actividad transcripcional [40, 41]. CT estructura se ha planteado la hipótesis de que se prestará un importante transcriptionally estado preparada antes de la activación. Además, la estructura de la TC ha sido sugerida como un mecanismo importante en la celda de tipo específicos de activación o represión transcripcional [9]. Por lo tanto, hay niveles de orden superior de control transcripcional además de la regulación de la cis-TFs.

La existencia de diferentes tipos de S / MARs como elementos estructurales y funcionales se ha propuesto [42 - 44]. Además, se ha demostrado recientemente que la copia múltiple S / MARs son seleccionados y utilizados como matriz nuclear anclas de manera discriminatoria, a pesar de que todos los que figuran idénticas secuencias primarias [45]. Se ha planteado la hipótesis de que el proceso de selección está mediada por S / MAR disponibilidad influenciada por la posición en el ADN, la fuerza vinculante, y / o el número de copias. Aunque S / MARs funcionar como los mediadores de bucle embargo, que podrían ser utilizados en una forma selectiva y dinámica. En consecuencia, S / MAR anclas son necesarios pero no suficientes para la cromatina bucles de forma. Algunos de los pronosticado S / MAR adjunto regiones podrían servir como elementos de regulación y mostrar características dinámicas, mientras que otros no disponen de esta función y cumplen funciones estructurales. Por lo tanto, posiblemente sólo una fracción de S / MAR regiones podrían participar en los tejidos específicos de la regulación de genes, mientras que otros sólo podrían cumplir funciones estructurales [1, 42 - 44]. Nuestros resultados sugieren que intragenic S / MARs es probable que sean los elementos funcionales propuestos en dichas revisiones. La cuestión de si existen algunas preferencias para intergénicas S / MARs a ser funcionales o elementos estructurales que requieren mayor análisis.

Conclusiones

Se realizó una escala del genoma análisis comparativo de los patrones de expresión de los genes que contienen predijo S / MAR regiones en el archivo adjunto A. thaliana Expresión usando tres diferentes conjuntos de datos generados en dos diferentes plataformas. Todos los análisis proporcionado resultados consistentes. Los genes que contienen predijo S / MAR regiones han DEXP valores significativamente más bajos y es probable que se expresa en un tejido o el órgano o la fase de desarrollo. Como consecuencia de una diferencia en los valores DEXP, S / MAR + genes tienen valores más bajos en comparación con expresión S/MAR- genes. Así, S / MAR + genes sirven o se utilizan como disparadores para el tejido, órgano, y la especificidad del desarrollo en Arabidopsis. Aproximadamente el 15% de los genes contienen TF predijo archivo adjunto regiones. Además, estos TF + S / MAR + genes han DEXP valores significativamente más bajos en comparación con otros genes TF, así como otros S / MAR + genes. Este subconjunto de los genes puede corresponder a TFs participan directamente en el tejido-, órgano-, y el desarrollo de patrones específicos de la expresión génica.

Materiales y Métodos
Predicción de S / MAR + genes.

En un análisis anterior, informó la genomewide identificación y análisis de la S / MARs dentro del genoma de Arabidopsis [7]. El S / MAR predicción se ha realizado mediante el programa SMARTest [46] ( Http://www.genomatix.org ). SMARTest se basa en una biblioteca de S / MAR-asociados, AT-ricos patrones derivados de análisis comparativo de la secuencia definida experimentalmente S / MAR secuencias. Como se informó anteriormente [7], el conjunto de formación figuran 16 derivados de planta S / MARs (siete de Arabidopsis). SMARTest se ha aplicado usando la configuración por defecto de Arabidopsis. Una sensibilidad de 38% y una especificidad del 68% se han demostrado [46]. Una reciente evaluación de los diferentes S / MAR buscadores SMARTest confirmado como superior con respecto a la especificidad [47]. Dentro de nuestro anterior análisis, se informó de la identificación de un total de 21705 S / MARs todo el genoma [7]. Dos mil uno Ciento treinta y cinco por S / MARs se han encontrado que se encuentra dentro de los genes (9,8%), tal como se define por una localización de los respectivos S / MAR, ya sea dentro de la codificación de las regiones o intrones de un gen [7]. Las coordenadas que delimitan la localización cromosómica de cada uno de los candidatos S / MARs son anclados a la pseudomolecules tal y como se describe en otro lugar [7]. Para este análisis, hemos utilizado los datos de nuestro estudio anterior y se incluyeron otros 590 genes que contienen S / MAR regiones dentro de los 5 'UTR regiones (véase el cuadro S1 de la lista completa de S / MAR + genes).

Expresión de datos.

Expresión de datos procedentes de tres fuentes independientes que se han utilizado. Los detalles se dan en el texto, así como en la Tabla 1.

MPSS conjunto de datos.

Los datos de los experimentos MPSS [12, 13] se utilizaron y se describen en detalle en nuestro análisis anterior [7, 48]. MPSS representa un poderoso instrumento para la medición cuantitativa de la expresión genética [14], y puede identificar y analizar el nivel de expresión de todos los genes en una muestra por contar el número de moléculas de ARNm. MPSS proporciona una estimación cuantitativa de expresión en contraposición a la relativa estimaciones derivadas de la intensidad de la señal de hibridación en microarrays.

El número de etiquetas por MPSS gen fue en el rango de uno a diez, aproximadamente. Algunas de las etiquetas no son exclusivos y puede ser asignada a varios A. thaliana Genes simultáneamente. Después de un cuidadoso análisis, se seleccionaron 1383 S / MAR + S/MAR- y 13804 genes que pudieran ser asignadas a cada inequívocamente A. thaliana Genes. Para este análisis, se seleccionaron un subgrupo de genes que tenían un valor MPSS transcripciones mayor de 10 por millón (tpm) de las unidades de al menos una de las mediciones [7]. Este filtrado eliminado los genes con baja expresión los valores que tal vez no nos permiten diferenciar entre los genes expresados y nonexpressed. El subconjunto resultante de la etiqueta MPSS-S / MAR + genes que figuran 952 genes, así como 10340 S/MAR- genes (8,4%). Hemos utilizado los datos correspondientes a los cinco órganos: callo, inflorescencia, hojas, raíces, y silique (Tabla 1].

Microarrays de expresión de datos.

El microarray de datos se obtuvieron a partir de dos obras recientes [10, 11].

La raíz de expresión conjunto de datos utilizados para el análisis consistió en una alta resolución espacial y temporal a lo largo del perfil de expresión de Arabidopsis raíz [10]. La expresión de datos, llamada digital de datos in situ, reflejan la expresión de los genes entre los tipos de células y tejidos y de desarrollo a lo largo de un gradiente. El ordinario de la organización radial de la raíz y el desarrollo continuo de facilitar el análisis de la expresión génica en un eje spatiotemporal. La información que se incluye un mapa mundial de la expresión génica de los genes 22000 medida por microarrays de Affymetrix. El gen expresiones se midieron en seis lugares diferentes (estelas, endodermis, endodermis además de la corteza, las células epidérmicas atrichoblast, y la tapa lateral raíz) y tres etapas de tiempo de desarrollo definidas por su distancia desde el meristemo apical (Cuadro 1]. Los datos se descargan de Http://www.arexdb.org .

Por último, una expresión de datos derivados de la AtGenExpress proyecto, que comprende 79 diferentes experimentos, se ha utilizado. Los experimentos abarcan una amplia gama de etapas de desarrollo, los órganos y sistemas de órganos de Arabidopsis [11]. Hemos seleccionado tres bases de datos que abarcan de expresión A. thaliana En diez diferentes órganos, tejidos de flores cinco, y cinco etapas de la evolución floral. Sólo los experimentos que participan antecedentes genéticos similares (wild type), el mismo sustrato (suelo), y el mismo fotoperíodo (luz continua) eran considerados (Tabla 1].

Un análisis de la expresión valores indican un considerable aumento de la pendiente de la cantidad de expresiones de genes con valores por debajo de 15 a 20 unidades para ambos AtGenExpress raíz y archivos de datos. Este cambio puede corresponder al aumento en el nivel de ruido baja expresión de tales valores, es decir, este valor puede tomarse como un umbral de la sensibilidad del método. Hemos decidido filtrar todos los genes que tiene un valor máximo de expresión de todos los tejidos a menos de 30 unidades, es decir, similar a la de 10 tpm umbrales utilizados para la MPSS datos. Después de la filtración, la expresión de datos de la raíz de datos [10] contenidas 1907 S / MAR + S/MAR- y 18311 genes. Los datos derivados de AtGenExpress [11] contenidas 1602 S / MAR + S/MAR- y 16648 genes. Así, los genes que se prevé S / MAR + representaron aproximadamente el 8% y el 9% de todos los genes para tres conjuntos de datos analizados.

La mediana de los valores y la importancia de prueba.

Se utilizó la mediana de expresión y DEXP índices de valores para la comparación de los diferentes conjuntos de datos. Una de dos colas de arranque de prueba 10000 con repeticiones se utilizó para evaluar la significación estadística. El 5% de los intervalos de confianza se representan dentro de todas las cifras para todos los resultados.

DEXP.

Este índice fue presentado a la medida de la asimetría de la expresión génica a través de los diferentes tejidos y órganos. El índice mide residual expresión de un gen en tejidos y órganos frente a su máxima expresión. Al analizar varias expresiones, i = 1,…, m de genes j, primero determina un tejido u órgano, k, para el que el máximo valor de la expresión de genes se observó, E j k. Los valores del índice se calcula como media de los valores De la plaza de los coeficientes de la expresión de genes en el tejido diana a los tejidos k con la máxima expresión. Esto puede formularse matemáticamente de la siguiente manera:

Donde j indica el gen, m es el número de tejidos, y N es el número total de los genes analizados.

Apoyo a la Información
La mediana de los valores y DEXP expresión de los valores medidos por cuatro órganos MPSS Affymetrix y chips
La mediana de los valores de expresión (AyC) y valores DEXP (B y D) de la inflorescencia. Hojas, raíces, y silicuas se representan. El 5% de los intervalos de confianza calculado para el conjunto de arranque utilizando todos los valores se muestran.
DEXP valores de S / MAR + y TF S/MAR- Genes para la Raíz y la Flor del Desarrollo Expresión Datasets
El 5% de los intervalos de confianza calculado para el conjunto de arranque utilizando todos los valores se muestran.
Lista de SMAR + y SMAR -
(2,4 MB XLS)

Los autores Michael T. Mader las gracias por su ayuda con la gestión de datos y Markus Schmid Detlev Weigel y para hacer disponibles los datos antes de su publicación.