Plant Methods, 2005; 1: 10-10 (más artículos en esta revista)

Utilizando el ADN genómico basado en la sonda de selección para mejorar la sensibilidad de la alta densidad de oligonucleótidos arrays cuando se aplica a las especies heterólogas

BioMed Central
P John Hammond (John.Hammond @ warwick.ac.uk) [3], Martin R Broadley (martin.broadley @ nottingham.ac.uk) [2], David J Craigon (david@arabidopsis.info) [1], Janet Higgins (Janet.Higgins @ bbsrc.ac.uk) [1], Zoe F Emmerson (zoe@arabidopsis.info) [1], Henrik J Townsend (Henrik@arabidopsis.info) [1], Philip J White (Philip - J.White @ warwick.ac.uk) [3], Sean T de mayo (sean@arabidopsis.info) [1]
[1] Centro de Nottingham Arabidopsis Stock, de la Escuela de Biociencias de la Universidad de Nottingham, Sutton Bonington Campus, Loughborough, LE12 5RD, UK
[2] Planta de la División de Ciencias, la Escuela de Biociencias de la Universidad de Nottingham, Sutton Bonington Campus, Loughborough, LE12 5RD, UK
[3] Warwick HRI, de la Universidad de Warwick, Wellesbourne, Warwick, CV35 9EF, UK

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen

De alta densidad de oligonucleótidos (oligo) arrays son una herramienta de gran alcance para la transcripción de perfiles. Las matrices basadas en la tecnología de GeneChip ® se encuentran entre los más utilizados, aunque GeneChip ® matrices están disponibles en la actualidad sólo un pequeño número de especies vegetales y animales. Así, hemos desarrollado un método para mejorar la sensibilidad de la alta densidad de oligonucleótidos arrays heteróloga, cuando se aplica a las especies y el método de prueba mediante el análisis de la transcriptome de Brassica oleracea L., una especie para la que no GeneChip ® gama está disponible, utilizando un GeneChip ® array diseñado para Arabidopsis thaliana (L.) Heynh. ADN genómico de B. Oleracea fue etiquetado y la hibridación a ATH1-121501 GeneChip ® matriz. Arabidopsis thaliana sonda pares de hibridación que a la B. Oleracea ADN genómico sobre la base de la concordancia perfecta-(PM) señal de la sonda fueron seleccionados para su posterior B. Oleracea transcriptome mediante un análisis. Cel archivo parser secuencia de comandos para generar archivos de la sonda máscara. La respuesta transcripcional de B. Oleracea a una de nutrientes minerales (fósforo, P), el estrés se cuantificarán mediante sonda máscara de los archivos generados por una amplia gama de gDNA hibridación umbrales de intensidad. Un ejemplo sonda máscara archivo generado gDNA hibridación con una intensidad umbral de los 400 eliminados> 68% de los disponibles PM sondas del análisis sino mantenerse> 96% de los disponibles A. Thaliana sonda-sets. Noventa y nueve de estos genes fueron identificados como significativamente reguladas por estrés en P B. Oleracea, incluido el estrés P homólogos de los genes de respuesta en A. Thaliana. El aumento de la intensidad de hibridación gDNA umbrales hasta 500 de la sonda de la selección aumentó la sensibilidad de GeneChip ® de la gama para detectar regulación de la expresión genética en B. P oleracea bajo estrés por hasta 13 veces. Nuestro software de código abierto para crear archivos de la sonda máscara http://affymetrix.arabidopsis.info/xspecies/ está disponible gratuitamente y se puede utilizar para facilitar transcriptomic análisis de una amplia gama de especies de plantas y animales en la falta de costumbre arrays.

Introducción

De alta densidad de oligonucleótidos (oligo) arrays son un poderoso instrumento ampliamente utilizado y de gran escala de perfiles de expresión génica-[1]. Una amplia gama validado oligo tipo está disponible como comercial de la tecnología de GeneChip ® (Affymetrix, Santa Clara, EE.UU.). GeneChip ® arrays uso de la sonda fija en lugar de oligos por solo gen, de los de entre 11 y 20 pares de la sonda para cuantificar la abundancia de cada transcripción. Cada sonda de par consiste en un partido perfecto-(PM) y una falta de adecuación (MM) sonda. La sonda es un PM 25-base de la secuencia complementaria de la meta transcripción, mientras que la sonda MM es idéntica a la sonda de la tarde, con la excepción de un solo desfase en la 13 ª base. Transcripción abundancia se puede calcular a partir de la hibridación extrapolarse diferencias entre PM y MM sondas a través de una sonda de conjunto, o simplemente utilizando los datos de PM en función del análisis utilizado. GeneChip ® arrays proporcionar reproducible, datos precisos a altas tasas de rendimiento que puede ser fácilmente almacenado y comparado a través de los experimentos [2 - 4]. Un ejemplo de la gran escala de adopción de la tecnología de GeneChip ® se puede ver dentro de la planta de investigación de las ciencias de la comunidad, donde los datos de miles de GeneChip ® arreglos en virtud de un gran número de problemas experimentales en la planta modelo Arabidopsis thaliana (L.) Heynh. Están disponibles públicamente-[4]. Lamentablemente, en la actualidad, GeneChip ® arrays sólo están disponibles para unas pocas especies de eucariotas. Así, en contraste con A. Thaliana, el transcriptomes agrícola de la mayoría-o ecológicamente importantes especies de plantas son menos estudiado de forma exhaustiva, ya que una amplia secuencia de la información y la fabricación de matrices caro costumbre se necesitaría antes de la experimentación puede comenzar.

Una solución a este problema es utilizar GeneChip ® que se han diseñado para los organismos modelo para el estudio de especies estrechamente relacionadas [5 - 12]. Si bien esta estrategia es posible, los estudios realizados hasta la fecha no han representado la probabilidad de que la ineficiencia de la hibridación de las transcripciones de las especies objetivo de sondas GeneChip ® diseñado para el modelo de las especies atenuar la señal global calculada a través de una sonda-conjunto [13]. Por ejemplo, Ji et al. [13] describen un escenario donde la expresión de datos analizados en Análisis Microarray Suite (MAS Versión 5,0; Affymetrix), se basa en el cálculo de que el peso transportado por una sonda dentro de un conjunto de la sonda es inversamente proporcional a su distancia del valor medio de Todas las sondas dentro de la sonda-set. Así, la generación de señales de las sondas no debido a la secuencia de los polimorfismos con el organismo objetivo será reducir la calidad de la información disponible a partir de experimentos con GeneChip ® que se han diseñado para un modelo de las especies para controlar la transcriptome de una especie vecina. Ji et al. [13] por lo tanto, adoptó una RNA basada en la sonda-sistema de selección, para el estudio de mamíferos no humanos con los humanos transcriptomes GeneChip ® arrays, utilizando sonda máscara de los archivos a excluir sondas de hibridación que débilmente a sus destinatarios transcripción. Sin embargo, esta técnica reduce el número de la sonda-transcriptome juegos disponibles para análisis por sesgar el análisis hacia la medición de la abundancia de las transcripciones.

Para hacer frente a los problemas potenciales de la utilización de GeneChip ® que se han diseñado para controlar una especie a la transcriptome de una especie, hemos desarrollado una novedosa técnica para mejorar la sensibilidad de la alta densidad de oligonucleótidos arrays cuando se aplica a las especies heterólogas. En contraste con Ji et al. [13], esta técnica se basa en la selección de la sonda de pares basado en la eficiencia de la hibridación de la sonda PM oligonucleótido con el ADN genómico de una especie objetivo para el que el GeneChip ® no fue diseñada originalmente. Inicialmente se utilizó el A. Thaliana ATH1-121501 GeneChip ® serie para estudiar la transcriptome de Brassica oleracea L., que representa a varios cultivos importantes, incluyendo el repollo, la col rizada, brócoli, col de Bruselas, coliflor y kohlrabi, y la mitad de la B. Napus (aceite de semillas de violación) genoma. Brassica oleracea fue elegido por el linaje ancestral de Arabidopsis y Brassica (familia Brassicaceae) divergieron sólo 12 a 19 millones de años [14]. Los efectos de ADN genómico basado en la sonda de la selección sobre las estimaciones de la regulación transcripcional en el B. Oleracea fueron cuantificados en virtud de un impuesto estrés fisiológico de fósforo (P), la privación. Probe máscara archivos aumento de la sensibilidad de la ATH1-121501 GeneChip ® serie cuando la detección de regulación de la expresión genética en B. P oleracea bajo estrés por hasta 13 veces. La respuesta de B. Oleracea a P estrés se comparó con la de A. Thaliana [15 - 17]. La respuesta transcripcional de las plantas a P estrés puede proporcionar conocimientos sobre las vías de la señal de nutrientes [18] y puede informar a los esfuerzos para mejorar la eficiencia del uso de fertilizantes de la producción de cultivos a través de los sistemas de cría y diagnósticos nutricionales [16].

Resultados y Discusión
- Genómica y la hibridación del DNA probe-selección

Se utilizó A. Thaliana ATH1-121501 GeneChip ® arrays para estudiar la transcriptome de B. Oleracea. Secuencia de polimorfismos entre las dos especies pueden dar lugar a una subestimación de la abundancia de transcripción si todas las sondas se utilizan dentro de los conjuntos de sonda-[13]. Por lo tanto, se han seleccionado los subconjuntos de la sonda de pares de cada sonda-en el conjunto A. Thaliana GeneChip ® serie basada en la eficiencia de la hibridación genómica ADN de B. Oleracea homóloga a la A. Thaliana GeneChip ® PM gama de sondas.

ADN genómico de B. Oleracea fue marcado con biotina y hibridación a la A. Thaliana ATH1-121501 GeneChip ® matriz. Probe-sets fueron seleccionados para su posterior análisis transcriptome si la sonda-set estuvo representada por PM gDNA hibridación con sondas de intensidad por encima de un umbral establecido. La selección se efectuó a través de la. Cel archivo parser script escrito en el lenguaje de programación Perl (Xspecies la versión 1,1, disponible en http://affymetrix.arabidopsis.info/xspecies/]. El método fue optimizado empíricamente mediante la generación de 13 archivos con máscara sonda gDNA hibridación umbrales de intensidad que van desde 0 (es decir, sin sonda de selección) para 1000. Estos 13 sonda máscara de los archivos a su vez fueron evaluados para investigar la cuantificación de la respuesta transcripcional de B. Oleracea a un impuesto de nutrientes minerales (fósforo; P) estrés.

Arabidopsis thaliana PM sondas de hibridación ampliamente a la B. Oleracea ADN genómico (Figura 1]. Cuando la intensidad de hibridación gDNA se aumentó el umbral de 0 a 1000 durante la sonda máscara archivo generación, la sonda PM retención en la máscara de los archivos de la sonda disminuyó rápidamente. Sin embargo, la retención de toda la sonda de conjuntos, en representación de las transcripciones, eran menos sensibles a los aumentos de la intensidad de hibridación gDNA sonda durante máscara de la generación de archivos, ya que sólo un mínimo de un PM sonda fue necesario para mantener un conjunto de la sonda. Por ejemplo, aunque la sonda máscara archivo generado mediante una hibridación gDNA intensidad umbral de 300 enmascarado> 50% de todas las sondas PM, 98,8% dispone de A. Thaliana sonda fija-se mantienen.

Exámenes de ADN sonda de la selección: transcripción abundancia en el control de Brassica oleracea

Brassica oleracea hidropónicos se cultiva utilizando las técnicas descritas en otra parte fisiológica [15]. Control de las plantas se suministra con una completa solución nutritiva en todo el experimento; tratamiento (P-hambre) las plantas se suministran con una solución nutritiva que contiene no para P 100 h. Transcripcional de las respuestas B. Oleracea fosfato de estrés fueron determinados por desafiante A. Thaliana ATH1-121501 GeneChip ® arrays con ARN total extraído de plantas de tratamiento y de control. A raíz de la digitalización de la GeneChip ® arrays, cruda intensidad de células archivos de datos (. Cel archivos) fueron cargados en GeneSpring (Silicon Genética, CA, EE.UU.), utilizando 13 sonda máscara archivos. Para cada una de las 13 condiciones de selección de la sonda, los datos se utilizan prenormalised robusta Multichip Promedio (RMA) algoritmos [19]. Posteriormente, los datos de los ocho GeneChip ® arrays (cuatro y cuatro de control P-hambre muestras) fueron tratados como cada 13 'experimental escenarios' para evaluar la sonda de selección de rigor. Dentro de cada escenario ", los datos son aún más normalizada dentro GeneSpring; valor de la señal P-repetir cada planta de hambre fue normalizado para su correspondiente control de la muestra para dar una expresión ratio para cada gen.

El uso de máscaras sonda transcripción aumento de las estimaciones de abundancia en B. Oleracea en tanto el control y la P-muestras de hambre (datos de muestra para muestras de control; Figura 2a-e]. La sonda máscara archivo generado gDNA hibridación con una intensidad umbral de 50 no afecta a las estimaciones de abundancia transcripción; sólo nueve de 250206 disponible PM sondas fueron excluidos de esta sonda máscara de archivo. Por lo tanto, todos los conjuntos de la sonda-se conservaron para su posterior análisis transcriptome (Figuras 1, 2a]. Sin embargo, la sonda máscara archivos generados con gDNA hibridación umbrales de intensidad por encima de 100 y aumento de las estimaciones de la abundancia de transcripción en comparación con el uso no-selección de la sonda (Figura 2b-d]. Las estimaciones de abundancia en la transcripción B. Oleracea aumentado en más de 2,5 veces, cuando la sonda se utilizaron máscaras (Figura 2e]. El aumento de la intensidad de hibridación gDNA umbral de la sonda durante máscara archivo generación también aumentó el coeficiente de variación (CV) calculado para el ranking transcripciones (sonda-juegos) en los cuatro replicar el control de los vectores (Figura 2f]. Por lo tanto, si la sonda-un estricto criterio de selección se va a utilizar para analizar los datos experimentales transcriptome, puede resultar conveniente para aumentar la reproducción biológica. Sin embargo, el control de vectores de CV fueron mínimamente afectados mediante sonda máscara archivos generados en gDNA hibridación umbrales de intensidad por debajo de los 500 (Figura 2f].

Exámenes de ADN sonda de selección: en virtud de la regulación de genes P estrés en Brassica oleracea

Coeficientes de la expresión de genes se distribuyen log-normalmente cuando los experimentos se analizaron utilizando cualquiera de los 13 archivos de la sonda máscara (datos no presentados). Para cada una interpretación experimental, de tapa cambio diferencias en la expresión de genes se calcula como el cociente normalizado de los medios de cada gen en la muestra tratada con relación a la muestra de control. Un utilizó un modelo lineal, con un Benjamini y Hochberg Falso Descubrimiento Votar (BH-FDR = 0,05), varias pruebas de la corrección aplicada (MTC), se utilizó para poner a prueba si transcripción abundancia fue significativamente diferente entre el control y la P-muestras de hambre. El aumento de la intensidad de hibridación gDNA umbral de 0 a 500 por sonda máscara archivo aumento de la generación de la sensibilidad de la ATH1-121501 GeneChip ® gama para detectar regulación de la expresión genética en B. P oleracea bajo estrés, en términos de significativo> ± 1,3 veces las diferencias en la expresión de genes entre P-hambre y de muestras de control (Figuras 3, 4].

Estimaciones de veces-las diferencias en la expresión de genes (P-muestras de hambre frente a muestras de control) mediante el aumento de la sonda máscara archivos generados con gDNA hibridación umbrales de intensidad hasta 500 (Figura 3, 4 c]. 'Volcán' parcelas resumir estos efectos (Figura 3a-c]. En volcán parcelas, el eje "y" representa el registro de 10 de la reciprocidad de los utilizó un modelo lineal P-valor corregido de varias pruebas utilizando el BH-FDR; el eje "x" representa el registro 2, de la tapa de cambio en la expresión de genes . Hubo un aumento de 13 veces en el número de genes regulados diferencialmente identificados como> ± 1,3 veces al P estrés utilizando una sonda máscara archivo generado gDNA hibridación con una intensidad umbral de 500 (Figuras 3, 4 c]. El uso de la sonda máscara archivos generados con mayor intensidad los umbrales gDNA hibridación (hasta 1000) dieron lugar a una importante pérdida de la sonda-juegos disponibles para transcriptome análisis (Figuras 1, 3 ª]. Sin embargo, el número de genes regulados diferencialmente identificados como> ± 1,3 veces era todavía mucho mayor cuando se utiliza la sonda máscara archivo generado gDNA hibridación con una intensidad umbral de 1000, que cuando la sonda de la selección no se utilizan, aunque sólo el 7,3% de El número total de PM sondas GeneChip ® de la serie se utilizaron (Figura 4c]. Las estimaciones del número de genes regulados diferencialmente significativa al P estrés (en BH-FDR MTC P <0.05) el aumento de la sonda cuando se utilizaron los archivos de máscara (Figura 4a]. Por ejemplo, utilizando una sonda de máscara de archivo generado gDNA hibridación con una intensidad umbral de 500, 111 genes que se estima como significativa diferencialmente regulados, en comparación con sólo ocho genes regulados mediante sonda no-selección.

La mejor selección de la sonda-transcripcional estrategia para el análisis de la B. Oleracea es utilizar una sonda máscara archivo generado en una hibridación gDNA intensidad umbral de 200 o más. Aunque las estimaciones de las veces-las diferencias en la expresión de genes en P-hambre frente a muestras de control son mayores utilizando sonda máscara archivos generados con gDNA hibridación umbrales de intensidad de hasta 500 (Figura 4c, d], hubo una pérdida significativa de la disponibilidad de conjuntos de sonda Transcriptome análisis gDNA hibridación con intensidad los umbrales de> 500. Además, estima que el número de genes regulados disminuido significativamente utilizando sonda máscara archivos generados en la hibridación del DNA umbrales de intensidad> 500.

Importancia biológica de los genes regulados en el marco de P estrés en Brassica oleracea

Tras la selección de la sonda utilizando un gDNA hibridación intensidad umbral de los 400, 99 fueron identificados como genes diferencialmente regulados significativamente en los brotes de B. Oleracea después de la retirada de P de la solución nutritiva (BH-FDR MTC P <0,05; archivo adicional 1]. De estos genes, 39 tuvieron mayor abundancia en la transcripción P-muestras de hambre que en las muestras de control y los 60 tuvieron una menor abundancia en la transcripción P-hambre que en las muestras de muestras de control. Los datos de todos los genes, analizado con todos sonda máscara archivos generados en gDNA hibridación umbrales de intensidad 0 1000, se presentan en el Cuadro I. Suplementario

Secuencia de polimorfismos entre A. Thaliana y B. Oleracea pueden dar lugar a la identificación de genes homólogos o alternativos de los miembros de las familias de genes además del gen orthologues posible. Por esta razón, en comparación con anterioridad los estudios publicados sobre la respuesta de A. P thaliana a la hambruna [15 - 17] a nivel de genes individuales y también a nivel de la familia de genes funcionales y categoría. Varios genes homólogos respondido de manera similar a la de P inanición en B. Oleracea y A. Thaliana. Por ejemplo, SQD2 (At5g01220), que participa en la biosíntesis sulpholipid, aumenta su expresión en las respuestas al hambre en A. P Thaliana [15 - 17, 20 - 22]. Un homólogo de este gen tenían mayor hibridación en las señales de hambre-P B. Oleracea que en las muestras de control. La señal de SQD2 valores, obtenidos mediante la sonda máscara archivo generado gDNA hibridación con una intensidad umbral de 400, se basa en dos sondas, en contraste con 11 sondas de la sonda cuando no se utilizó la selección. El uso de la sonda de selección aumento de la importancia y las diferencias en la abundancia de transcripción entre P-hambre y de control de las plantas (SQD2, 1,60 ± 0,2, BH-FDR MTC P = 0,047, con una media de ratio de señal normalizado ± 1) que en la ausencia de sonda - Selección (SQD2, 1,53 ± 0,58, BH-FDR MTC P = 0,382).

Ribonucleasas, y fosfatasas fosfodiesterasas participan en el reciclaje de P en las plantas durante la hambruna de P [16, 23, 24]. La intensidad de la hibridación ribonucleasas RNS2 (At2g39780) fue mayor en las muestras P-hambre en comparación con muestras de control, y se cree que participan en la liberación de P de fuentes internas durante P hambre [23]. La señal de valor para RNS2, obtenidos mediante la sonda máscara archivo generado gDNA hibridación con una intensidad umbral de 400, se basa en seis sondeos en contraste con 11 sondas de la sonda cuando no se utilizó la selección. El uso de la sonda de selección normalizado el aumento de ratios en señal P-plantas de hambre en comparación con el control de las plantas en mayor cantidad (RNS2, 1,92 ± 0,43, BH-FDR MTC P = 0,06, con una media de ratio de señal normalizado ± 1) que en la ausencia - Selección de la sonda, cuando la sobre regulación de los genes no se detectó (RNS2, 1,07 ± 0,06, BH-FDR MTC P = 0,43).

Superior señales de hibridación en plantas de hambre-P en comparación con las muestras de control se observó también para los genes que pertenecen a familias de genes o grupos funcionales que han sido previamente observado en respuesta a la hambruna en A. P Thaliana, aunque no de forma significativa [15 - 17]. Estos incluyen genes implicados en el transporte de fosfato y el fosfato que contienen los hidratos de carbono y compuestos, lo que indica un cambio en la economía interna de P utilización en respuesta a la inanición P (archivo Adicional 1]. Por ejemplo, en una hibridación gDNA intensidad de 400, dos synthases sacarosa-fosfato, y una enzima malic tuvieron mayor intensidad de la hibridación en el P-hambre en comparación con muestras de control, mientras que las intensidades de hibridación inferior a los genes que participan en reacciones glycolosis alternativa que conservar durante P P condiciones de inanición [16] se señaló. Hay otras similitudes notables en la respuesta de inanición P B. Oleracea publicado con las respuestas de A. P thaliana a la hambruna a nivel de la familia de genes. Estos incluyen factores de transcripción de los dedos de zinc, F-box, bHLH y myb familias, genes implicados en la biosíntesis y flavanoid genes que codifican proteínas del citocromo P450, glicosil hidrolasa, peroxidasa y familias.

Conclusión

Desde GeneChip ® matrices están disponibles sólo para un pequeño número de especies, hemos desarrollado un novedoso método de selección de la sonda para estudiar la transcriptome de una planta o especie animal para el que GeneChip ® matrices no están disponibles. ADN genómico de B. Oleracea fue etiquetado y la hibridación a la A. Thaliana ATH1-121501 GeneChip ® matriz. Perfect match-A. Thaliana sondas de hibridación que a la B. Oleracea ADN genómico por encima de las intensidades de hibridación seleccionadas fueron seleccionados para su posterior B. Oleracea transcriptome análisis utilizando sonda máscara archivos generados utilizando una. Cel archivo parser script. Software para crear archivos de la sonda máscara está disponible gratuitamente http://affymetrix.arabidopsis.info/xspecies/ y está diseñado para facilitar el análisis de la transcriptomes de una amplia gama de otras especies, a falta de costumbre arrays.

Sonda de selección fue puesto a prueba por la cuantificación de la respuesta transcripcional de B. Oleracea a una de nutrientes minerales (fósforo; P) utilizando la sonda estrés máscara archivos generados en gDNA hibridación umbrales de intensidad que van desde 0 (es decir, sin sonda de selección) para 1000. Una sonda máscara archivo generado en una hibridación gDNA intensidad umbral de 400 enmascarado> 68% de todos los de la A. Thaliana sonda de pares de la posterior análisis transcriptome conservando al mismo tiempo el 96,4% del total disponible, la sonda-sets. El aumento de la intensidad de hibridación gDNA umbrales de la sonda máscara archivo aumento de la generación de la sensibilidad de GeneChip ® de la gama para detectar regulación de la expresión genética en B. P oleracea bajo estrés por hasta 13 veces. Noventa y nueve fueron significativamente genes regulados en los brotes de B. P oleracea bajo estrés (BH-FDR MTC P <0,05). Análisis de confirmación mediante PCR cuantitativa y reportero de genes fusionados de nutrientes que responda a los promotores ya se han llevado a cabo durante varios genes regulados P estrés en A. Thaliana [15, 16] y detallada de confirmación funcional y molecular de estos genes es necesaria ahora claramente en B. Oleracea para resolver la importancia biológica de la respuesta de estrés P. Entendimiento P respuestas de estrés en las plantas es probable, (i) para acelerar el desarrollo de variedades más eficientes de nutrientes de los cultivos, (ii) mejorar nuestra comprensión de las vías de señalización de nutrientes, y (iii) para obtener rápidos avances en el diagnóstico nutricional, en particular, Si los costos unitarios para el análisis de microarrays continúan disminuyendo [16, 18]. Apreciamos que la resolución y la claridad de la máscara método de la sonda será la influencia de la duplicación de genes y exigirá la validación de los posibles homólogos encontrados en las especies objetivo, no obstante esta precaución es generalmente cierto en el diseño de cualquier nuevo microarrays. La mayoría de los usuarios son principalmente gama interesados en la transcripción diferencias entre las muestras como pistas para una investigación más a fondo de un gen o genes familiares. Esta técnica permite que tales indicadores de la expresión diferencial de genes de especies inusuales y, además, proporciona putativo organismo modelo gen homólogo ontologías a través de la norma de Affymetrix gen anotación. Como método pragmático basado en la técnica de hibridación gDNA requiere de la investigación de una serie de umbrales a prueba sistemáticamente la sonda de selección en la bioinformática. Re-optimización de los umbrales gDNA hibridación es particularmente importante para las nuevas especies teniendo en cuenta que gDNA calidad y origen pueden afectar general absoluta hibridación intensidades por experimento, pero no debería afectar clasificación relativa de intensidades entre hybridisations genoma de la misma. La técnica, por tanto, permite un análisis económico de cualquier ARN hybridisations realizado, desde gDNA basado en la sonda de selección pueden ser optimizados en cualquier momento sin tener que repetir el trabajo de ARN. El método también requiere configuración mínima gasto representado por un representante gDNA hibridación y algunos sencillos bioinformática tiempo, en contraste con los costes de fabricación, incluso una simple oligo sola matriz. Más importante, sin embargo, gDNA basado en la sonda-transcripcional podría facilitar la selección de perfiles de una amplia gama de especies animales y vegetales de la agricultura, la importancia ecológica y evolutiva, incluso en ausencia de información genómica disponible.

Materiales y métodos
ADN genómico hibridación y selección de la sonda -

Probe-pares de la A. Thaliana ATH1-121501 GeneChip ® array (Affymetrix, Santa Clara, CA, EE.UU.) fueron seleccionados para el análisis de transcriptome B. Oleracea gDNA utilizando una sonda basada en la selección de la estrategia basado en la hibridación de gDNA PM a la sonda. Total ADN genómico fue extraído a partir de 5 g de B. Oleracea var. Alboglabra cv. A12DHd hoja de tejido utilizando un mini kit DNeasy Plant (Qiagen Ltd, Crawley, Reino Unido). ADN genómico fue etiquetado Bioprime ADN utilizando el sistema de etiquetado (Invitrogen, Paisley, Reino Unido) y, posteriormente, a la hibridación ATH1-121501 Affymetrix GeneChip ® arrays durante 16 horas a 45 ° C utilizando protocolos estándar de Affymetrix hibridación. Posteriormente, el GeneChip ® gama de escaneado en un escáner Affymetrix G2500A GeneArray una celda y la intensidad de archivo (. Cel archivo), se ha generado utilizando Análisis Microarray Suite (MAS Versión 5,0; Affymetrix). Este. Cel archivo contiene las intensidades de hibridación entre gDNA B. Oleracea fragmentos de ADN genómico y de todos A. Thaliana sondas. Probe-de los pares. Cel archivo fueron seleccionados para su posterior análisis mediante un transcriptome. Cel archivo parser script (Xspecies Versión 1.1) escrito en el lenguaje de programación Perl http://www.perl.com. El script de Perl fue diseñado para crear sonda máscara (. Cdf) archivos compatibles con una amplia gama de paquetes de software de análisis de microarrays. Una sonda-set fue seleccionado cuando fue representada por uno o varios PM sonda de par (s) por la sonda de serie (es decir, un mínimo de 25 pb sonda idéntica a la secuencia de A. thaliana se requería para su posterior análisis de transcriptome B. oleracea) . No había ninguna restricción a priori de un adecuado gDNA hibridación intensidad umbral para la generación de archivo de máscara de la sonda en una especie objetivo. Por lo tanto, el algoritmo ha sido diseñado para permitir que un usuario determinado umbral de intensidad gDNA hibridación de la sonda máscara de archivo de la generación que se establezcan. Archivos (cdf.) se generó, por lo tanto, utilizando una serie de umbrales de intensidad gDNA hibridación (de 0 a 1000). El algoritmo de Perl y B. Oleracea ADN. Cel archivos están libremente disponibles de http://affymetrix.arabidopsis.info/xspecies junto con ficheros similares para otras especies. El script de Perl enmascaramiento y las instrucciones para usar el script también están disponibles como archivos adicionales 2 y archivo adicional 3.

Prueba de la sonda gDNA basada en la estrategia de selección: determinar la respuesta transcripcional de B. Oleracea fosfato a estrés

Brassica oleracea var. Alboglabra cv. A12DHd se cultivaron hidropónicos de las semillas en un sistema descrito en Hammond et al. [15]. Control de las plantas se suministra con solución nutritiva que contiene todos los nutrientes a lo largo del experimento, mientras que las plantas tratadas se suministran con una solución nutritiva que contiene no para P 100 h. Muestras duplicadas (que comprende repetir cada 8-10 plantas individuales) fueron cosechadas de plantas de tratamiento y de control, a mitad camino en el foto-período, y el broche de congelados en nitrógeno líquido. Todas las plantas tenían aproximadamente 6-8 hojas a la cosecha. Tres biológica repeticiones y un técnico se utiliza para replicar transcriptome análisis.

Muestras de tejido, previamente almacenados a -70 ° C, fueron colocados en nitrógeno líquido antes de la molienda. Para cada muestra, 1 ml de reactivo TRIzol (Invitrogen) y se añadió ARN total fue extraído, tal como se describe anteriormente [15]. Total RNA rendimiento y pureza se determinaron utilizando un Bioanalyser Agilent 2100 (Agilent Technologies, Stockport, Cheshire, Reino Unido). Aproximadamente 5 μ g de ARN total fue transcrita inversa a los 42 ° C durante 1 h para generar primer capítulo cDNA utilizando 100 pmol oligo dT (24) que contiene un primer 5'-T7 RNA polimerasa secuencia promotora, 50 mM Tris-HCl (pH 8.3) , 75 mM KCl, 3 mM MgCl 2, 10 mM dithiothreitol (TDT), 10 mM dNTPs y 200 unidades de la transcriptasa inversa SuperScript II (Invitrogen Life Technologies). Tras la síntesis de ADNc primer capítulo, el segundo capítulo de cDNA fue sintetizado utilizando 10 unidades de Escherichia coli polimerasa I, 10 unidades de E. Coli ligase de la DNA y 2 unidades de RNasa H en una reacción que contenía 25 mM Tris-HCl (pH 7.5), 100 mM KCl, 5 mM MgCl 2, 10 mM (NH 4) SO 4, 0,15 mM b-NAD + y 10 mM DNTPs. El segundo capítulo de síntesis reacción procedió a 16 ° C durante 2 h antes de las 10 unidades de T4 ADN polimerasa se añadió la reacción y permitir que procedió por otros 5 minutos. La reacción se dio por terminado mediante la adición de 0,5 M EDTA. Doble varados cDNA productos fueron purificados utilizando el GeneChip ® Módulo de Limpieza de la muestra (Affymetrix). El ADNc sintetizado in vitro fueron transcritos por la RNA polimerasa T7 (Enzo BioArray Alto Rendimiento RNA Transcripción Etiquetado Kit, Enzo Life Sciences Inc, Farmingdale, NY, EE.UU.), utilizando para generar biotina biotina nucleótidos complementarios ARN (cRNAs). El cRNAs fueron purificados utilizando el GeneChip ® Módulo de Limpieza de la muestra (Affymetrix). El cRNAs fueron fragmentados al azar a 94 ° C durante 35 minutos en una solución tampón que contiene 40 mM Tris-acetato (pH 8,1), 100 mM de acetato de potasio, magnesio y 30 mM acetato de generar moléculas de aproximadamente 35 a 200 pb. Affymetrix A. Thaliana ATH1-121501 GeneChip ® arrays se hibridación con 15 μ g de fragmentación etiquetados cRNA durante 16 horas a 45 ° C como se describe en el Manual de Análisis Técnico Affymetrix. GeneChip ® arrays se tiñeron con Estreptovidina-Phycoerythrin solución y escaneadas con un escáner Affymetrix G2500A GeneArray.

Análisis Microarray Suite (MAS Versión 5,0; Affymetrix) se utilizan para generar. Cel archivos para cada una de las repeticiones de ARN biológica mediante el escaneo de la computación y las intensidades de resumen para cada sonda sin el uso de máscara de los archivos de la sonda. Estos. Cel archivos fueron cargados en GeneSpring (Agilent Technologies) análisis utilizando el paquete de software robusta Multichip Promedio (RMA) antes de la normalización algoritmo (Irizarry et al., 2003). Durante. Cel archivo de la carga y antes de la normalización,. Cel archivos se interpretaron utilizando ya sea, (1) la A. Thaliana. Cdf archivo (es decir, sin sonda de selección utilizado), o (2) utilizando. Cdf archivos generados por la gDNA. Cel archivo gDNA hibridación con intensidad los umbrales de 50 a 1000. Después de RMA antes de la normalización y de enmascaramiento de sondeos individuales, más normas se aplicaron a la sonda-en bruto fijado en el valor de señal GeneSpring. Para cada variedad repetir, cada señal de la sonda-valor conjunto de tratados (P-hambre) muestras fue normalizado a la sonda-set valor de la señal de su correspondiente muestra de control para dar la expresión de genes ratios entre las dos condiciones. Hibridación diferencial de los genes con intensidades entre P-hambre y de control de las muestras se identificaron utilizando un ANOVA de una vía, con un Benjamini y Hochberg falso descubrimiento tasa (0,05), varias pruebas de la corrección aplicada, para identificar los genes que son significativamente expresadas diferencialmente entre las dos condiciones. Los genes con Benjamini y Hochberg FDR múltiples test corregido P-valores inferior a 0,05 se consideraron P diferencialmente regulados en la inanición.

Material suplementario
Archivo Adicional 1
Un archivo de la media del conjunto de señales de la sonda de todos los genes en P-hambre versus control (P-repleto)
Brassica oleracea
Var. Alboglabra CV. A12DHd. Se analizaron los datos en bruto con el RMA antes de la normalización utilizando el algoritmo ATH1-121501 sonda máscara de archivo (sin sonda de selección) o una sonda personalizada máscara de archivo. La sonda personalizada máscara de los archivos han sido generados por hybridising de gDNA
B. oleracea
A Affymetrix
A. thaliana
ATH-121501 GeneChip
®
Arreglos y selección de la sonda-en el que pares
B. oleracea
GDNA hibridación valores de intensidad fueron de más de 50, 100, 150, 200, 300, ... 1000. Señal intensidades son estimaciones de ARN total extraído de los tallos de las plantas cultivadas-hidropónicos (n = 4) al P-deficiente (en bruto) y P-repleto (control). El
P
- Valores se derivan de una sola dirección mediante un ANOVA Benjamini y Hochberg Falso Descubrimiento (0.05) Tasa de múltiples pruebas de corrección.
Archivo Adicional 2
Un archivo que contiene todos los scripts de Perl necesarias con el fin de producir nuevos ficheros MID para su utilización en el análisis de la hibridación entre especies resultados.
Archivo Adicional 3
(CDF_filtering script instructions.doc: archivo DOC). Un documento con los detalles de instrucciones para el uso de los scripts contenidos en
Agradecimientos

Semillas de Brassica oleracea var. Alboglabra cv. A12DHd facilitaron amablemente Graham King (Warwick HRI, Reino Unido). J. Okyere (Universidad de Nottingham, Reino Unido) y Santhoshi Bandla, Cheng Li (Departamento de Bioestadística, Escuela de Harvard de Salud Pública, EE.UU.), siempre útiles discusiones técnicas en las primeras etapas del proyecto. El trabajo fue apoyado financieramente por el Departamento del Reino Unido para el Medio Ambiente, Alimentación y Asuntos Rurales (subvenciones HH3501SFV y HH3504SPO), por el Reino Unido BBSRC investigación de la función de genes de Arabidopsis adjudicación (IGF12422), y por la Universidad de Nottingham Nueva Profesor del Premio.