PLoS Genetics, 2005; 1(2): (más artículos en esta revista)

Transcriptome análisis de pez cebra embriogénesis utilizando microarrays

Sinnakaruppan Mathavan [1], G. P Alteza Serenísima Lee [1], Alicia [1] Mak, Lance D [1] Miller, Radha Krishna Murthy Karuturi [1], Kunde R Govindarajan [1], Yan Tong [2], Yi Lian Wu [2], Siew Hong Lam [2], Henry Yang [4], Yijun Ruan [1], Vladimir Korzh [3], Zhiyuan Gong [2], Edison Liu T [1], Thomas Lufkin [1]
[1] Instituto del Genoma de Singapur, Singapur
[2] Departamento de Ciencias Biológicas, Universidad Nacional de Singapur, Singapur
[3] Instituto de Biología Molecular y Celular, Singapur
[4] Instituto de Bioinformática, Singapur
Resumen

Pez cebra (Danio rerio) es un bien reconocido modelo para el estudio de la genética del desarrollo de vertebrados, pero, al mismo tiempo, se sabe poco acerca de la transcripción acontecimientos que subyacen en la embriogénesis pez cebra. Aquí hemos empleado el análisis de microarrays para estudiar el desarrollo temporal de la actividad regulada de los genes de pez cebra durante la embriogénesis. Transcriptome análisis a los 12 puntos diferentes de embriones tiempo que abarca cinco diferentes etapas de desarrollo (materna, blástula, gastrula, segmentación, y pharyngula) reveló un perfil altamente dinámico transcripcional. Agrupación jerárquica, la fase específica de la agrupación, y los algoritmos para la detección de inicio y pico de la expresión génica revelaron claramente delimitados transcripción grupos con un máximo de la actividad de los genes en diferentes etapas de desarrollo, así como co-regula la expresión de genes implicados en grupos dedicados funciones como la organogénesis. Nuestro estudio también reveló una cohorte previamente identificados de los genes que son transcritos antes de la blástula mediados de transición, un momento en el punto anterior a cuando el genoma cigótico tradicionalmente se cree que se activan. Aquí nos proporcionan, por primera vez, a nuestro conocimiento, una lista completa de los genes de pez cebra regulado de desarrollo y de sus perfiles de expresión durante la embriogénesis, incluidas las nuevas informaciones sobre la expresión temporal de varios miles de genes previamente no. La expresión de datos generados a partir de este estudio son accesibles a todos los interesados científicos de nuestro instituto base de datos de recursos ( Http://giscompute.gis.a-star.edu.sg/ ~ govind / pez cebra / data_download.html ).

Introducción

Pez cebra es un importante vertebrados modelo para el análisis de los genes de desarrollo regulados. Sus ventajas son transparentes rápido desarrollo de los embriones, un corto tiempo de generación, y amenability a la manipulación genética. En los últimos años, mutagénesis a gran escala se ha llevado a cabo tanto por mutágenos químicos [1 - 3] y proviral inserciones [4 - 6]. Herramientas genéticas como la transgénesis y morpholino knock-down ensayos también se han establecido para el pez cebra [7, 8]. En efecto, una combinación única de estas características hace pez cebra es un modelo para estudiar trastornos del desarrollo de vertebrados y humanos enfermedad hereditaria [1, 9 - 11]. Se cree que el pez cebra genoma puede contener alrededor de 30% más de genes que el genoma humano, debido a una nueva ronda de la duplicación del genoma, alrededor de 450 millones de años, seguida de una amplia pérdida de genes [12]. Varios etiqueta de secuencia expresada (EST) se iniciaron proyectos para caracterizar genes expresados durante las diferentes etapas de desarrollo [13 - 15] y en los diversos tejidos del pez cebra [16]. El pez cebra base de datos contiene más de 400000 EST agrupan en alrededor de 18000 grupos, pero sólo unos pocos miles de tecnologías ecológicamente racionales se han analizado por todo el embrión de hibridación in-situ (WISH) ( Http://zfin.org ). El análisis sistemático de la expresión temporal de las tecnologías ecológicamente racionales por WISH puede tardar varios años en completarse. Un alto rendimiento expresión genómica enfoque proporcionaría información complementaria a los enfoques de un único gen en curso. Microarrays son actualmente los más fuertes de la plataforma de la tecnología a gran escala de análisis de los perfiles de expresión génica durante la embriogénesis. Ofrecen la oportunidad de controlar simultáneamente la expresión de miles de genes en distintas etapas de desarrollo, proporcionando así una oportunidad para analizar las pautas temporales y espaciales de la expresión genética [17 - 23]. El análisis preliminar de la expresión de un subgrupo de genes de pez cebra se ha realizado utilizando microarrays de ADNc [14, 24, 25]. Evaluación global de la expresión génica durante el ciclo de vida de Drosophila y de la organogénesis y el ratón se ha comunicado [20, 23, 26 - 29]. En cambio, una alta densidad de los microarrays de todo el genoma de la expresión de genes (transcriptome) el análisis no ha sido anteriormente objeto de intento de pez cebra. En el presente estudio, hemos utilizado de alta densidad de oligonucleótidos microarrays 16416 que contiene el mapa de los genes transcriptome perfiles diferentes a los 12 puntos de tiempo de desarrollo (de óvulos no fertilizados a la etapa de incubación). ARN fue colectada en poco espaciados momentos a lo largo de blástula y gastrula etapas de la dinámica de las etapas de desarrollo-y, por tanto, proporciona una densa cobertura y un análisis exhaustivo de los patrones de expresión de genes regulados durante el desarrollo de la embriogénesis.

Tradicionalmente, se cree que el genoma cigótico se activa en la transición a mediados de blástula (MBT) [30]. Sin embargo, las recientes pruebas de Xenopus ha demostrado en el inicio de la transcripción del genoma cigótico que se produzca antes de MBT [31]. Estamos especuló que podría haber un subconjunto de los genes activados por lo que respecta a la acumulación de transcripción antes de MBT que a su vez podría desempeñar un papel en la posterior a nivel transcripcional del genoma de activación, pero se había fugado de detección debido a su bajo número en relación con la totalidad del genoma. Para poner a prueba nuestras especulaciones, hicimos un análisis sistemático de los perfiles de expresión génica anterior MBT, que se puso de manifiesto por primera vez a nuestro conocimiento un impresionante cohorte de genes de transcripción que activa aumentar los niveles de antes de MBT. Estos nuevos datos forman el punto de partida para determinar el papel de estos genes en el genoma de pez cebra control de la activación y la embriogénesis. Para que los datos que hemos generado aquí fácilmente disponibles para el público, hemos creado un Sistema de Información Geográfica patrocinado sitio Web ( Http://giscompute.gis.a-star.edu.sg/ ~ govind / pez cebra / index.html ) Que incluye la anotación de datos y todos los datos de expresión de todos los genes del pez cebra microarrays.

Resultados y Discusión
Validación de datos de microarrays de pez cebra

El microarray de los datos obtenidos en este trabajo se validaron con los siguientes criterios: en primer lugar, 172 copias de la beta-actina de genes fueron impresas en la gama oligonucleótido como puntos de calibración. Biológicas y experimentales de la serie hibridaciones repeticiones mostraron que, en el período de tiempo seleccionado de puntos, las señales de todos los beta-actina de calibración de los puntos son idénticos (Figura S1], que indica la reproducibilidad y confiabilidad de la matriz de datos. En segundo lugar, los genes candidatos conocidos con los patrones de expresión se compararon con la variedad derivada de los patrones de expresión, y los patrones fueron similares entre sí (Tabla S1]. Además, la PCR en tiempo real se realizó un análisis de dos genes (beta-actina y la miosina de cadena ligera, mlc2f) en todos los puntos de tiempo seleccionado. La cantidad de transcripciones detectado no puede compararse a causa de los diferentes métodos de cálculo. Sin embargo, el patrón de abundancia transcripción de estos genes detectados en el sistema y en tiempo real PCR mostró casi idénticos perfiles de expresión (figura S2]. Además, los datos de expresión de la proteína ribosomal (RP) de los genes de pez cebra obtenidos de las matrices mostró temporalmente coordinada expresión (véase la sección de resultados en la expresión de genes de la RP). Con el fin de confirmar la matriz de datos, una mancha del Norte se realizó un análisis de determinados genes (rpl7a-, rps3a-, rps12-, y-rps10) utilizando el ARN muestras recogidas en 14 diferentes momentos a lo largo de la embriogénesis. El patrón de expresión de genes RP obtenidos en el conjunto del Norte y de mancha son esencialmente idénticas, la validación de la matriz de datos (Figura S3 A). La intensidad de la hibridación de genes en el RP del Norte mancha se digitalizaron y medido. Uso de la información digitalizada, el patrón de acumulación de transcripción se comparó con datos de serie, y el patrón de expresión fue similar en ambos los experimentos (Figura S3 B). Estos análisis demostraron la validez y la fiabilidad de la serie de datos presentados en este trabajo.

Anotación de la Zebrafish Oligoarray

La anotación dada por Compugen (oligonucleótido proveedor) se basa en Entrez nucleótidos, BLAST, y Gene Ontología (GO) ( Http://www.labonweb.com/oligo ) Y está obsoleta. Por ejemplo, la compañía de bases de datos ofrece una descripción sobre la base de términos GO para 1152 acerca de las sondas, y el resto se indican como "GO desconocido." A partir de nuestra reciente anotación, hemos encontrado GO términos de más del doble de los reportados por la empresa. Hemos hecho un análisis crítico de los clones y los duplicados identificados para determinar el número real de la no redundante clones en la matriz. El conjunto representó 16.416 entradas GenBank. De esta cantidad, 16177 sondas no había entradas redundantes GenBank y el resto de las 239 entradas que se han duplicado GenBank (incluyendo 171 copias de la beta-actina) en la matriz. Estudiamos la no redundante GenBank entradas a la base de datos UniGene pez cebra (UniGene construir 79) y encontró que 2751 GenBank entradas no han UniGene identificaciones y el resto de las 13426 entradas corresponden a UniGenes. De estos clones con UniGene entradas, 12153 clones no eran redundantes, mientras que el resto (1273 UniGenes) fueron duplicados. En su conjunto, las sondas en el sistema representado 14904 genes no redundante (12153 no redundante UniGene más identificadores de 2751 no redundante GenBank entradas). Hemos incluido aquí la más reciente putativo anotaciones, en los clones de la variedad mediante la obtención de la base de datos de anotaciones de diversas fuentes. Las anotaciones se pueden obtener de nuestro instituto de recursos sitio web ( Http://giscompute.gis.a-star.edu.sg/ ~ govind / pez cebra / index.html ). También hemos incluido ejemplos de las anotaciones en los Conjuntos de datos. Los recursos utilizados para construir la base de datos de anotación de pez cebra, las estrategias seguidas, y la consulta de los métodos de recuperación de anotación se describen en la sección Materiales y Métodos.

Transcriptome análisis de los genes identificados desarrollo regulado

El patrón de expresión de genes del genoma del pez cebra durante la embriogénesis se investigó el uso de oligonucleótidos de alta densidad de los vectores que representan a 16416 genes de pez cebra. Tiempo de alta resolución-curso de expresión de datos se generaron durante la embriogénesis. Teniendo en cuenta la sensibilidad de la matriz de datos y el número de repeticiones de cada muestra, es muy probable que la mayoría de las transcripciones se detectaron polyadenylated de los genes representados en la matriz de punto cada vez. ARN total fue extraído a los 12 diferentes puntos de tiempo de desarrollo (véase Materiales y Métodos para más detalles), y para cada punto de tiempo de dos a tres análisis independientes biológica se hicieron repeticiones. ARN de referencia fue preparado por la puesta en común de la igualdad de la concentración de ARN total de las diversas etapas embrionarias y también la de los adultos, hombres y mujeres de pescado. La intensidad de valor de cada terreno y de cada una de las partes se normalizó el uso de la intensidad basada en el método de registro ratio media [32]. Genes expresados diferencialmente fueron seleccionados utilizando modificados t-estadística (SAM) [33] con el 15% de la desviación estándar como el percentil chapuza constante y log2 ratios. Etapa de genes específicos fueron seleccionados tras prueba "t" pareada (véase Materiales y Métodos para más detalles). Mediante este procedimiento, se ha identificado 3657 genes que mostraron niveles importantes de la expresión diferencial con un solo pico en el curso del desarrollo. Este subconjunto de los genes regulados de desarrollo se utilizó para profundizar el análisis de la actividad de los genes durante la embriogénesis. Para el beneficio de otros científicos, todo el conjunto de datos generados a partir de este estudio se ha puesto en nuestra base de datos de recursos instituto, que puede ser visitada en Http://giscompute.gis.a-star.edu.sg/ ~ govind / pez cebra / data_download.html .

Agrupación jerárquica de 3657 genes demostrado diversos perfiles de expresión temporal de pez cebra durante la embriogénesis (Figura 1 y Dataset S1]. La complejidad de la agrupación de genes muestran claramente las modulaciones importantes en el desarrollo temporal de la actividad de los genes regulados. El grupo también reveló la expresión idéntica perfil de todas las copias de los genes beta-actina. De los 3657 genes extraídos para el análisis, 622 genes mostraron un nivel máximo de acumulación de transcripción en la etapa de la maternidad (unfertilized huevo), y el resto de los genes de 3035 mostró un inicio de la transcripción y pico de abundancia durante una o más etapas del desarrollo embrionario (Figura 2].

Diferencial de la degradación de la madre cargada de genes transcripciones

El conjunto de datos de 622 transcripciones de genes que muestran máximos de abundancia en la fase de huevos unfertilized (la madre cargado transcripciones; (Figura 2 B Dataset y S2] se dividió en tres grupos basados en el patrón de degradación de transcripción. El primer grupo representa 221 genes, y las transcripciones De estos genes persisten unfertilized sólo en la fase de huevos y fueron degradados antes del comienzo de la blástula (Figura 2 B de la partida a). En este grupo figura el conocido materna genes (ejemplos son las proteínas de codificación de la zona pelúcida, zp2, Zp2.4, y zp3 [34]] y la proteína componente de corion. Varios de los genes con anotaciones putativo también mostraron un patrón de expresión idéntica a la madre previamente caracterizado los genes, lo que sugiere una posible función materna. Putativo Los clones con anotación de ramnosa vinculante Lectinas (STL), de otros peces que se incluyen en este grupo de genes. Esta familia de las lectinas se expresa en el ovario y de los huevos de la trucha steelhead (Oncorhynchus mykiss). Por otra parte, algunos miembros de la familia de lectinas (STL2 y STL3) Que se encuentran abundantes en el ovario y disminuyó los niveles dramáticamente después de la fertilización [35, 36], lo que indica la especificidad materna de este gen. Hemos identificado aquí, por primera vez, a nuestro entender, un gran número de genes y no previamente EST Que parecen haber materna específicos de la actividad. Materna La función de estos clones y su control de la activación del genoma cigótico será un área importante para futuras investigaciones.

El segundo grupo de transcripciones (259 genes) persiste en mayor medida durante la maternidad y la blástula etapas y, posteriormente, degradado (Figura 2 B, la línea b). Estos genes pueden intervenir en la división embrionaria temprana y otras funciones. Un ejemplo es el gen los procedentes de la madre ciclina B1, que se expresa a los principios de blástula. Se sabe que se someten los embriones de pez cebra sincrónica de células divisiones durante la etapa de división antes de su entrada en el MBT [30]. Ciclina B1 ha mostrado ser involucrados en la fase de la división celular síncrona [37], en consonancia con su máxima actividad durante estos Etapas. Similar a la ciclina B1, hay una serie de genes que muestran la actividad en la maternidad temprana y cigóticos etapas. La transcripción de genes que persistió durante la blástula participan, de un modo u otro, en funciones de desarrollo temprano. Algunos de los genes funcionalmente relevante durante la maternidad y blástula etapas se dan aquí como ejemplos: calreticulin (un acompañante que participan en plegamiento de glicoproteínas de nueva síntesis), la catalasa (funciones de catalizador en el crecimiento de las células), birc5b/survivin2 (regulador de la muerte celular), mcl1a ( Apoptosis celular función), como claudin-gen (apretado nudo de la función en período de crecimiento), lmnl3 (materna lamina L3), ovocitos y blástula nucleoskeletal proteínas de la membrana nuclear durante la división celular. Estas transcripciones de genes se degradan lentamente (a finales de la blástula). El tercer grupo (Figura 2 B, la línea c) había 142 genes con un nivel máximo de transcripciones en la etapa de la maternidad; este grupo de genes sometidos a un ritmo muy lento de la degradación de transcripción. Algunas de las transcripciones persiste hasta la fase de segmentación, y el rendimiento promedio de este grupo se presenta.

Estas observaciones revelaron que la madre depositó transcripciones de genes no son degradadas a la misma velocidad y existe un diferencial de genes específicos de la degradación. El diferencial de la degradación de la estabilidad y la ampliación de determinados genes implicados materna una posible relevancia de estos genes en las etapas posteriores cigóticos. Se sabe que después de la fecundación antes los procesos de desarrollo en el huevo son programadas por la madre depositó transcripciones de genes [38]. Posteriormente, los embriones cigóticos iniciar genoma de activación para la continuación del desarrollo embrionario. El control de la maternidad de pez cebra de desarrollo antes y después de MBT ha informado recientemente siguientes extenso análisis de mutantes materna [2, 3]. Estos autores mostraron que las mutaciones en algunos de los genes maternos han generado los embriones cigóticos con defectos en las funciones de los genes y alteraciones durante el desarrollo pre-MBT, MBT, y también más allá de estas etapas. En este estudio, hemos identificado materna etapa específica de la expresión de una serie de tecnologías ecológicamente racionales no anteriormente, que pueden desempeñar un papel vital en el desarrollo normal de la modulación. Se ha informado de que en Drosophila materna ARN es degradado en el transcurso de las primeras fases del desarrollo, ya sea por factores de los procedentes de la madre (para degradar transcripciones transitorio) o factores derivados zygotically (a degradar moderadamente estable transcripciones), y que la acción combinada de factores maternos y cigóticos Se necesita para degradar la elevada estabilidad materna transcripciones [39 - 42]. Cigóticos regulación de la maternidad y la ciclina A1 ciclina B2 mRNAs se ha demostrado en Xenopus laevis [43, 44]. Suponemos que mecanismos similares de la madre informó de la degradación del RNA para Drosophila y Xenopus pueden actuar en forma diferente de pez cebra a degradar la madre cargada de mensajes.

Cigóticos Transcriptome Análisis y Descripción de la Etapa Las agrupaciones específicas -

El tiempo punto en el que el gen transcripciones comenzó la acumulación de su nivel basal de expresión se considera como el tiempo de aparición, y se determina mediante un algoritmo (ver Materiales y Métodos y Protocolo S1]. En el presente estudio, la fase de inicio de la sabia de desarrollo de genes de transcripción se determinó para 3052 cigóticos genes expresados durante MBT y años subsiguientes (Figura 2 A). De éstos, la acumulación de transcripción de los genes 1967 comenzó durante la blástula, que representa el 64,8% de los genes cigóticos. Aunque estos genes comenzó transcripción acumulación en la blástula, un subgrupo de estos genes mostró picos de expresión en las subsiguientes etapas de desarrollo. También se observó que el 15,7% (477genes), el 15,1% (460 genes), y el 4,4% (131 genes) de los genes cigóticos comenzaron su inicio de la transcripción en la acumulación de gastrula, segmentación, y pharyngula etapas, respectivamente. Rendimiento promedio de los genes de estos grupos se presenta como un clustergram (Figura 2 A y Conjuntos de datos S3 - S12]. Aparición de la expresión de genes temporalmente alineada con sus funciones requiere de desarrollo. Por ejemplo, algunos de los genes que exhiben principios de la acumulación de transcripción son los que participan en las funciones tempranas del desarrollo tales como el ciclo celular (ciclinas), la regulación de células y la adhesión celular (claudins, conexinas), de embriones funciones apoptosis (survivins), regulación transcripcional (smad, Pou, sox, wnt), y otros principios de los procesos de desarrollo. La transcripción de los genes que se inició durante las etapas posteriores de desarrollo (segmentación y pharyngula) se asocia más con la organogénesis y codificar, en gran medida, proteínas estructurales (por ejemplo, collagens, pro-collagens, músculo esquelético proteínas, selenoproteins, ceruloplasmina).

En el desarrollo embrionario de pez cebra (a la eclosión de la fertilización) se extiende durante 48 h. Dentro de los primeros 5 h después de la fertilización (hpf), la división y la blástula se terminan, y el proceso de gastrulación toma otro 5 h. Así, dentro de los 10 hpf (que es igual a cerca del 21% del total del período embrionario), los primeros son los procesos de desarrollo. Segmentación y pharyngula etapas se completan en unos 14 y 24 h, respectivamente (Figura 2 G). Aproximadamente 80,5% de los genes cigóticos inició su transcripción acumulación durante la blástula (64,8%) y gastrula (15,7%) etapas. Teniendo en cuenta el pico de expresión de los genes cigóticos, alrededor del 53% (Figura 2 F) de los genes alcanzado su punto máximo durante la blástula y gastrula etapas. Esa alto nivel de actividad se produjo en cerca del 21% del periodo de desarrollo. Análisis acumulativo de inicio y pico de expresión mostraron un patrón sigmoide: el inicio de la transcripción acumulación aumentado, mostrando alrededor del 99% de la actividad para el 12 de hpf (Figura 2 C). Del mismo modo, la mayoría de los genes regulados de desarrollo alcanzado su punto máximo alrededor del 24 por hpf (Figura 2 C insertar). Análisis de la frecuencia de distribución indica el dominio de la dinámica durante transcriptome blástula y gastrula etapas (Figura 2 y D 2 E). Es interesante el hecho de que tan alto porcentaje de genes que se activan dentro de la relativamente corta ventana del periodo de desarrollo.

Para obtener una visión general de la expresión génica embrionaria, que trató de abordar de forma específica los patrones de expresión temporal en las siguientes etapas de desarrollo: (1) materna (huevos no fecundados); blástula (2), (3) gastrula; segmentación (4), y ( 5) pharyngula / eclosión etapas (Figura 3 A). A partir de la expresión de datos, se seleccionaron los genes que mostraron picos de actividad en cada etapa y presenta los datos en clustergrams (Figura 3 B). El promedio de rendimiento de los genes en cada etapa de desarrollo es también presenta gráficamente (Figura 3 C). Este análisis pone de manifiesto que los diferentes conjunto de genes han picos de expresión en diferentes etapas de desarrollo sugerente de su pertinencia para la etapa de desarrollo de las funciones específicas. Curiosamente, los grupos de desarrollo de los genes regulados agrupan en grupos específicos o adyacentes, formando una ola de la actividad de los genes maternos para pasar de la blástula y a través de cada una de las etapas de la embriogénesis. La agrupación de los genes relacionados con el desarrollo indica que el proceso de embriogénesis está regulado y se muestra dinámica la actividad de los genes que, a su vez, dirige la evolución del programa de desarrollo.

Las siguientes observaciones se pueden hacer de este análisis. Del total de 3657 genes analizados, 622 genes (17%; Dataset S13] mostró máxima actividad en la etapa de la maternidad. De los restantes 3.035 genes (cigóticos), 609 (16,6%), 1006 (27,5%), 688 (18,9%), y 732 (20,0%) genes mostraron niveles máximos de transcripción en blástula (Dataset S14], gastrula (Dataset S15] , La segmentación (Dataset S16], y pharyngula (Dataset S17] etapas, respectivamente (Figura 3 B). El análisis de nuestros resultados indican que algunos de los genes que han de actividad se extiende a corto, mientras que otros se han extendido los períodos de expresión, indicativos de las necesidades funcionales. A modo de ejemplo, analizamos la matriz de datos y encontraron abundantes transcripciones de birc5b (IAP baculoviral repetir que contienen 5B, también llamado survivin2) y la muerte de células-regulador mcl1a (células de leucemia mieloide secuencia 1a) hasta la blástula. Estas familias de genes han sido implicados en las funciones de anti-apoptóticos [45 - 47]. También se ha demostrado que survivin es abundantemente expresado en Xenopus oogenesis durante la embriogénesis y principios de funcionamiento como un inhibidor de la apoptosis y un regulador del ciclo celular [48]. La transcripción de la abundancia birc5b y mcl1a, negativas de los reguladores de la apoptosis, durante la maternidad / blástula etapas, indicó la importancia de regular el proceso de apoptosis durante el desarrollo embrionario temprano. Se ha informado de que se activa la apoptosis embrionaria en el pez cebra durante la fase de gastrula, y lo más probable es que la baja regulación de los reguladores de los procedentes de la madre negativo puede activar el proceso de apoptosis en embriones de pez cebra durante la fase de gastrula [49].

Los genes que muestra un pico de expresión en la continuación de su etapa pharyngula expresión pharyngula más allá de la etapa, lo que sugiere una necesidad funcional de estos genes en embriones y después de las fases de desarrollo embrionario. Por ejemplo, ceruloplasmina (cp), que ha sido implicado en el desarrollo de hígado [50], muestran la máxima expresión durante la etapa pharyngula. La expresión de este gen no finaliza al final de la etapa pharyngula, lo que sugiere que durante la continuación de su expresión post-embrionarios pueden estar jugando un papel en la función hepática. Los genes que muestran expresión similar participan en paralelo embrionario y después de los procesos de desarrollo embrionario. Por ejemplo, los músculos específicos de los genes y collagens también muestran patrones similares de expresión, ya que están implicados en la formación progresiva de los músculos esqueléticos y en el desarrollo de pez cebra. Se sabe que casi todos los procesos primordiales de la organogénesis comenzará a las gastrulación y continuar durante y después de la segmentación de las etapas de segmentación. Por lo tanto, una visión general de todo el genoma análisis de la expresión temporal demarked demostrado un patrón de expresión de genes regulados desarrollo y demostraron que el gen actividades se correlacionan bien con el desarrollo de los acontecimientos en las respectivas etapas. Antes de nuestro análisis, sólo el 7% de los genes expresados diferencialmente fueron plenamente anotado (con IR), y temporal de los patrones de expresión de la mayoría de los clones en la matriz no se establecieron. Nuestro análisis, por primera vez, a nuestro conocimiento, identificado en el tiempo los patrones de expresión de alrededor de 80% -90% de los clones, y para la mayoría de ellos los patrones de expresión se presentan aquí por primera vez, a nuestro conocimiento.

Análisis de la transcripción de determinados grupos de genes funcionalmente relacionadas

De la matriz de datos, los patrones de expresión de varios genes relacionados funcionalmente podría ser identificados sobre la base de su GO y / o putativo funciones. Sin embargo, se seleccionaron tres grupos de genes implicados en el (1) del ciclo celular, (2) ubiquitin funciones (ubiquitins y proteasomas), y (3) somitogenesis como ejemplos y discutir aquí los patrones de expresión de estos genes en relación con su importancia biológica.

Análisis de Expresión Génica durante Somitogenesis

Inicio de la organogénesis en el embrión es realizada por un conjunto de genes estructurales y los factores de transcripción que modulan su expresión. Hemos tomado como ejemplo somitogenesis y analizaron un subconjunto de los genes implicados en este proceso. En líneas generales, somitogenesis se puede dividir en una primera fase en la que el mesodermo paraxial se subdivide en un rostrocaudal patrón en bloques de células llamadas somitas y una posterior fase de la diferenciación celular en el que las células somáticas somitas adquirir una variedad de distintos destinos dorsoventral y mediolateral. En el pez cebra, las células dorsolateral somitic mesodérmico contribuir al desarrollo muscular. En consonancia con esto, la mayor parte de la proteína muscular específica de los genes (MSP) se inició en los primeros meses de somitogenesis expresión, y que de manera constante aumento de la abundancia en su transcripción correlación positiva con somite formación. Expresión de la matriz de datos, el MSP transcripciones de los genes se detectó por primera vez alrededor de 11 hpf (Figura 4 D; Dataset S20], y, posteriormente, su transcripción aumento de los niveles de acuerdo con el progreso de somitogenesis. Se comparó la expresión de determinados genes de MSP con arrays del Norte mancha análisis de los mismos genes informado anteriormente [56], y los resultados fueron idénticos. Por lo tanto, la matriz de análisis fielmente recapitulación de los datos obtenidos a partir de un gen único análisis (del Norte o deseos).

Distintas clases de genes que codifican reguladores transcripcionales se expresan dinámicamente durante somitogenesis en todos los vertebrados y preceder a la aparición de la expresión de genes MSP. Las actividades de los miembros de la bHLH factores de transcripción, es decir, peludo (h), la división Enhancer (S spl), y relacionados con el peludo, se ha demostrado que desempeñan papeles críticos durante somitogenesis en vertebrados. Análisis de la familia del pez cebra bHLH h / E (spl) - relacionados con genes ha demostrado la participación de los relacionados con el peludo 9 (her9-) [57], her1-, her4-, her6-, y her7-[58, 59] en Somitogenesis. Nuestra gama de datos pone claramente de manifiesto que la mayoría de estos factores de transcripción (mespa-, mespb-, mef2a-, mef2c-, mef2d-, foxc1a, y varios de sus genes) inició su expresión antes de la aparición de los músculos de la expresión de genes específicos ( Figura 4 E). Estos resultados revelaron que el análisis global de la expresión génica mediante microarrays podría detectar una cascada de la actividad de los genes que participan en somitogenesis en el pez cebra. Similar análisis podría extenderse a explorar los patrones de la expresión de genes implicados en otros sistemas orgánicos.

RP coordinadamente los genes son expresados durante la embriogénesis pez cebra

Expresión de la matriz de datos, el 35 RP genes de pez cebra (similares a los genes conocidos RP) mostró temporalmente coordinada expresión (Figura 4 F; Dataset S21]. Desde el clustergram, es evidente que el nivel de las transcripciones de casi todos los genes modificados en la RP concierto con excepción de unos pocos, que difieren ligeramente en su perfil de expresión. En promedio, el inicio de la transcripción de genes RP acumulación comenzó en la blástula y la expresión aumentado continuamente. Asamblea de los ribosomas se requiere la coordinación en la expresión de genes que codifican para los componentes estructurales, y están representadas por varias moléculas de rRNA y alrededor de 80 RPs. En eucariotas, genes que codifican ARN 5S rRNA y se amplifican y presentado por varias copias, mientras que los genes de RPs están presentes en sólo una o dos copias por genoma haploides. Se ha informado de que después de la fecundación y durante el período de división celular sincrónica, no se detectaron las transcripciones de los genes cigóticos [60]. Este bloque se rescinda transcripcional en MBT en concierto con desincronización del ciclo celular. Se demostró que las transcripciones de algunos de los RPs (rps3, rpl17, y rpl31) [61] y rps24 [62] se han detectado en las primeras blástula antes de la detección de nuevos cigóticos transcripciones en el erizo de mar, lo que sugiere su origen materno . Los datos publicados sobre la expresión de genes de pescado RP no han presentado una visión global [63, 64]. Sin embargo, los resultados presentados aquí indican que casi todos los genes de la AD se expresa en forma coordinada a nivel mundial y de forma continua desde el inicio (a partir de MBT) a la eclosión.

La acumulación de Gene Transcripción ¿Se produzcan antes de la MBT en Zebrafish

Patrones de la expresión génica durante el desarrollo temprano (pre-y post-MBT MBT etapas) fueron estudiados con el examen de los perfiles de expresión en determinados momentos a lo largo de principios de división y después de la división etapas. La expresión datos obtenidos durante estas etapas fueron seleccionados tras el método estadístico descrito en la sección Materiales y Métodos. Los grupos de genes que muestran distintos patrones de expresión se agruparon basado en el inicio de la transcripción acumulación (Figura 5; Dataset S23 - S25]. Cuatro distintos patrones de expresión se registraron. El primer grupo representa la madre cargado transcripciones (Dataset S22], y casi la totalidad de las transcripciones de este grupo degradado rápidamente antes de la blástula (4 hpf). Grupo 3 (Dataset S24] y Grupo 4 (Dataset S25] representa la expresión de genes cigóticos de iniciar la transcripción después de la acumulación de MBT etapa (blástula y gastrula). Este patrón de expresión es, de conformidad con el patrón descrito anteriormente [30]. Grupo 2 figura una cohorte de genes (Dataset S23], que comenzó transcripción acumulación antes de la aparición de MBT. Este patrón de expresión es un nuevo descubrimiento, lo que demuestra la validez de MBT acumulación de cigóticos transcripciones. Como transcripción acumulación sólo puede tener lugar en presencia de la transcripción de genes, estos genes representan un grupo de pre-MBT transcriben los genes. De un total de 16416 genes analizados en la matriz, 125 genes mostraron evidencia de la validez de MBT transcripción acumulación. Estos genes no mostraron acumulación durante la transcripción de una célula, cuatro células, y de ocho etapas de células, sin embargo, las transcripciones de este subconjunto de 125 genes 64-/128-cell pasó de la etapa en adelante. Este patrón de la validez de la expresión de genes cigóticos MBT no se ha informado anteriormente en el pez cebra. Fuimos los primeros en detectar la acumulación de transcripción en estas primeras etapas de división, debido a la naturaleza mundial imparcial y de microarrays de alta densidad.

Dado que estos nuevos genes transcritos de las primeras activado en el desarrollo de pez cebra, es probable que participen en las funciones específicas embrionaria temprana y, posiblemente, también en los siguientes, en toda la activación del genoma. Se analizaron varios de los genes de este grupo sobre la base de la predicción putativo funciones, que son las siguientes. Varios subunidades del proteasoma en este grupo son las que se sabe están involucrados en la degradación de proteínas por el ubiquitin mediada vía proteolítica [54, 55]. Los proteasomas puede ser necesario en esta etapa de la degradación proteolítica de la maternidad productos genéticos. Una serie de subunidades del proteasoma han demostrado ser funcional en el que proliferan ARPE19 células del epitelio pigmentario de retina. Desde la división etapa es similar a la proliferación de células, que es razonable para encontrar las transcripciones del proteasoma en la presente etapa. Este grupo también contiene el gen putativo de ubiquitin conjugando enzima, y se sabe que ubiquitin conjugando enzimas mediar ubiquitination y la degradación de sustratos específicos de la ubiquitin dependiente de la degradación de la vía [65]. Esta enzima también se ha demostrado para promover la ciclina proteólisis durante la mitosis [66]. Hemos informado en el presente estudio que los niveles de transcripción de las ciclinas participan en la regulación del ciclo celular (ciclina A2, ciclina B, ciclina B1, ciclina E) son muy abundantes en óvulos no fertilizados y división durante las etapas [37, 53]. De la degradación de estos productos genéticos, y proteasomas ubiquitin conjugando enzima puede ser necesario en la etapa de los ciclos de células sincrónicas (pre-MBT) de pez cebra desarrollo.

Otro gen de este grupo es un putativo RNA helicasa. RNA helicases están implicados en una serie de procesos celulares de ARN estructuras secundarias como la traducción y la puesta en marcha y el ribosome spliceosome asamblea. Algunos de los miembros de esta familia han participado activamente en la embriogénesis y en células madre embrionarias. RNA helicasa ha demostrado ser esenciales para el normal gastrulación en el ratón [67]. Se ha demostrado que el RNA helicasa II es necesaria para el crecimiento celular y la progresión del ciclo celular [68], y una función de ARN ribosomal RNA helicases en la biogénesis en ovocitos de Xenopus se ha observado [69]. Además, se ha demostrado que baja regulación de RNA helicasa II resultados en el agotamiento de la producción del RNA ribosomal en ovocitos de Xenopus y cultivo celular [69, 70]. Así, la expresión de RNA helicasa putativo, en la etapa pre-MBT pueden ser esenciales para el crecimiento celular y / o celular durante el ciclo de la división etapas de la embriogénesis y también a principios de compromiso normal gastrulación. Además, parece que la presencia de RNA helicasa II durante la embriogénesis temprana puede facilitar la producción de ARN ribosomal y el posicionamiento de la maquinaria de traducción a fin de satisfacer la demanda en MBT.

Otros genes interesantes en este grupo son alanil-tRNA-sintetasa y la naciente del polipéptido asociado complejo alfa (DNA primase subunidad pequeña). Transcripciones de estos genes también se han encontrado en células madre embrionarias. DNA primase participa en la producción de derivados del polipéptido naciente en la biosíntesis de proteínas, y tRNA sintetasa participa en la síntesis de proteínas relacionadas con procesos tales como el tRNA vinculante y tRNA ligase de la actividad. Así, todos los genes descritos anteriormente están relacionados con el crecimiento de las células, la proliferación celular, la adhesión celular, la síntesis de RNA naciente y la estabilidad, y otras funciones celulares. Es posible que estos genes necesidad de comenzar su función durante las etapas pre-MBT, a fin de facilitar la progresión normal a través de MBT y el posterior desarrollo embrionario. GO análisis de los genes de este grupo revela que más del 50% de los genes muestran putativo funciones como la de ADN / ARN vinculante, el desarrollo, el plegamiento de proteínas, y la biosíntesis de proteínas (Figura S4]. Humanos y de ratón orthologs de algunos de los genes conocidos en este grupo se presentan en la Tabla S2. Grupos 3 y 4 muestran la cohorte de genes cigóticos mostrar la máxima acumulación de transcripción en blástula (4 hpf) y gastrula (6 hpf) etapas, respectivamente. Los genes que se han demostrado que se expresa en blástula-(por ejemplo, la ciclina D1) y gastrula-(por ejemplo, la catepsina L) embriones fueron identificados con Clusters 3 y 4, respectivamente, como se esperaba. Así, el microarray detectado la expresión de los genes conocidos en el tiempo de espera de puntos, una vez más se confirma la fiabilidad de la gama de detección.

Se ha demostrado que la transcripción puede ocurrir antes de MBT en Xenopus embriones [31], es decir, estos autores demostraron que la beta-catenina y tcf regulado pre-MBT transcripción de los genes nodal xnr5 y xnr6 tiene lugar. Sin embargo, en este estudio, restringida solo a la investigación de los análisis de expresión génica. La mayoría de los estudios anteriores sobre el análisis funcional de los genes de pez cebra se limitaron a un puñado de genes usando deseos del Norte o blot con embriones en MBT o fuera de ella. Paralelamente análisis de la expresión de miles de genes seleccionados en puntos separados por un pequeño espacio de tiempo ya principios de división etapas no se ha intentado anteriormente, a nuestro conocimiento. Por lo tanto, somos los primeros en nuestro conocimiento para llevar a cabo paralelamente el análisis de expresión de genes tempranos usando alta densidad de pez cebra arrays. Este enfoque revela una cohorte de genes que se acumulan activamente cigóticos transcripciones antes de la etapa MBT, y los datos que aquí se presenta sirva de punto de partida para las investigaciones funcional de las funciones de estos genes de pez cebra durante la embriogénesis.

Para validar los perfiles de expresión, PCR en tiempo real se ha hecho de determinados genes de cada grupo. PCR en tiempo real fue realizado con 16 muestras de Grupo 2 (Figuras 5 y 6], utilizando el mismo total para el conjunto de ARN utiliza hibridación. El patrón de expresión fue similar en ambos análisis. Posteriormente, se obtuvieron los nuevos lotes de ARN de una sola célula, two-/four-cell, 64-/128-cell, 256-/512-cell, y 4-hpf embriones y realizó PCR en tiempo real para ocho genes de la Categoría 2 y la variedad de datos en comparación con los datos RT-PCR (Figura S5]. De estos ocho genes, PCR en tiempo real se realizó durante cuatro genes aislados independientemente usando lotes de ARN, y los resultados son comparables. Cantidad de transcripciones de los genes seleccionados en 64-/128-cell y 256-/512-cell (etapas pre-MBT) es que en más de una a cuatro etapas de células que indican la acumulación de nuevas transcripciones antes de MBT. Del mismo modo, PCR en tiempo real también fue seleccionado para hacer los genes de Clusters 3 y 4 (datos no publicados). Los resultados muestran que el patrón de expresión obtenida a través de PCR en tiempo real de análisis paralelos de las observaciones formuladas en la matriz. Además, todo el RNA-embrión hibridación in situ se realizó durante ocho diferentes clones de los primeros genes que de PCR en tiempo real también se hacer. Hibridación intensidad fue significativamente mayor en 64-/128-cell y 256-/512-cell en comparación con uno a cuatro etapas de células, lo que indica acumulación de transcripción durante la pre-MBT etapas de desarrollo (Figura 7]. El patrón de datos in situ es similar a la PCR en tiempo real el perfil. Todas estas observaciones apoyan claramente la presencia de una cohorte de principios de los genes de pez cebra en la exhibición previa a la acumulación de MBT transcripción.

En resumen, que se describe aquí el primer genoma en todo el análisis de los microarrays de embriones de pez cebra transcriptome. Este estudio reveló una notable expresión programa de desarrollo ondulado y temporal de la agrupación de grupos de genes nunca antes caracterizado (a nuestro conocimiento) durante la embriogénesis. Además, un grupo previamente desconocido de los genes transcritos muy temprano antes de MBT fue descubierto en este estudio, que ahora representa a la conocida antes (a nuestro conocimiento) y la acumulación de ARN transcrito en el pez cebra y revisado antes de pensar que nuestro MBT marcó el inicio de todos los cigóticos La transcripción de genes. Somos los primeros en crear una completa base de datos integrada de los recursos mediante la incorporación de diferentes bases de datos para la anotación de los clones en el pez cebra oligoarray (Compugen), que servirá como un importante recurso para la comunidad de pez cebra.

Materiales y Métodos
De recogida de embriones.

Wild-tipo de pez cebra (Singapur bursátiles locales) se obtuvieron de embriones de pez cebra de la instalación del Instituto de Biología Molecular y Celular. Los embriones fueron recolectados inmediatamente después de la fertilización, mantiene a 28,5 ° C, y organizadas por hpf estándar utilizando criterios morfológicos [71]. Huevos no fecundados fueron recolectados por apretar el abdomen de las hembras de desove. Los embriones fueron recolectados tiempo a los 12 puntos (unfertilized huevo, 3, 4,5, 6, 7,7, 9, 10,7, 12, 15, 24, 30, y 48 hpf) (Tabla S3], snap-congelado en nitrógeno líquido, y se almacenan en -80 ° C. Los 12 puntos de tiempo fueron asignados a las siguientes etapas de desarrollo: (1) materna (unfertilized huevo), (2) blástula (3,0 y 4,5 hpf), (3) gastrula (6,0, 7,7, 9,0 y hpf), (4) la segmentación (10,7, 12,0, 15,0 y hpf), y (5) pharyngula (24,0, 30,0, 48,0 y hpf). Con el fin de mantener un modelo uniforme de antecedentes genéticos, todos los embriones se obtuvieron de los mismos lotes de las poblaciones de peces.

El aislamiento y la referencia RNA RNA.

ARN total fue extraído a partir de todos los embriones congelados mediante reactivo Trizol (Gibco BRL, Gaithersburg, Maryland, Estados Unidos). ARN de calidad fue evaluada por electroforesis en gel, y la concentración se midió con un espectrofotómetro UV. Para preparar referencia RNA, RNA total se obtuvieron de las siguientes etapas (embriones o adultos) y mezclado en la igualdad de concentración: 1 hpf, 4 hpf, 24 hpf, 48 hpf, 3-Semana de edad, alevines, de los adultos, hombres y mujeres. Suficiente cantidad de ARN de referencia necesaria para todo el proyecto se preparó en un tiempo, y el alícuotas fueron almacenadas a -80 ° C.

Pez cebra oligonucleótido sonda de diseño y construcción de microarrays.

Pez cebra sondas de oligonucleótidos para esta serie fueron diseñados por Compugen y sintetizado por Sigma-Genosys (The Woodlands, Texas, Estados Unidos). Para cada gen, uno de 65-mer oligonucleótido sonda fue diseñada a partir de la 3 'región de la secuencia. Cada sonda se seleccionó una secuencia de la serie de sesiones que es común a un número máximo de empalme predijo variantes para cada gen. Las matrices contenidas en representación de 16416 sondas de oligonucleótidos de determinados genes. Sondas de oligonucleótidos fueron re-suspendido en 3XSSC a 20 μ M de concentración y manchas en poli-L-lisina-revestidos utilizando el microscopio en una costumbre-construido microarrayer ADN. Impreso después de los arreglos fueron procesados a raíz de la norma de procedimiento que se describe para cDNA arrays [72].

Objetivo para el etiquetado y la hibridación estrategia.

Para el etiquetado de fluorescencia de la meta ADNc, 20 μ g de RNA total de las muestras de referencia y experimental fue transcrita invertir en la presencia de Cy3-dUTP y Cy5-dUTP (Amersham Biosciences, Little Chalfont, Reino Unido), respectivamente. La etiqueta meta ADNc se combinaron, concentrado, y resuspendido en EasyHyb DIG (Roche, Basilea, Suiza) de amortiguación para la hibridación. Estrategias de hibridación como fueron descritos por [72] con las siguientes modificaciones: (1) el uso de DIG EasyHyb de amortiguación (Roche) y (2) la hibridación a 42 ° C. Para cada etapa de desarrollo, dos a cuatro independientes replicar hibridaciones se realizaron con un mínimo de dos biológica repeticiones. Para teñir el sesgo de control, se emplearon un "tinte-swapping" estrategia de hibridación microarrays mediante el cual el régimen de etiquetado Cy tinte se invirtió para replicar alterna hibridaciones [73].

Adquisición de datos y análisis estadístico.

Los arreglos fueron escaneados utilizando el escáner GenePix 4000B microarrays (Axon Instruments, EE.UU.) para generar 16 bits de imágenes TIFF Cy3 y Cy5 intensidad de la señal. GenePix Pro 4,0 software de análisis de imágenes (Axon Instruments, Union City, California, Estados Unidos) fue empleada para medir la intensidad de la señal de fluorescencia de la matriz y las características locales de antecedentes.

La normalización de los dos canales (muestra y referencia) se hizo para cada diapositiva utilizando la intensidad basada en el método de registro ratio media [32]. Para la selección de genes expresados diferencialmente, que se supone que deben ser específicos para una etapa de desarrollo, un plan en dos etapas proceso de filtrado se utilizó. En primer lugar, que sólo los genes expresados diferencialmente por lo menos en un punto del tiempo (en todos los arreglos de la prueba) se mantienen. Modificado t-estadística (SAM) [33] con el 15% de la desviación estándar como el percentil chapuza constante se utiliza para la identificación de genes expresados diferencialmente, y log2 ratios fueron modificados utilizados en la t-estadística. Predijo falso descubrimiento tasa de 0,05 se utilizó como umbral para la expresión diferencial. En el siguiente paso, los genes expresados diferencialmente más fueron filtradas para determinar si eran específicas para una determinada etapa. Prueba "t" pareada se utilizó para comprobar si los medios de log2 ratios de sus niveles de expresión (más de las repeticiones), en una etapa fue significativamente (al nivel de confianza del 95%) mayor que el de otros medios de etapa (s). El análisis de los métodos anteriores se han utilizado para todos los datos experimentales que se presentan en este documento. El registro de los coeficientes de los vectores se reproducen en promedio, y el promedio de valores de expresión se utilizaron en los análisis posteriores. Los datos extraídos fueron agrupadas jerárquicamente y visualizados (Cluster y vista en árbol, [74]].

El inicio y el algoritmo de búsqueda de compensar.

El objetivo del algoritmo es detectar la aparición (comienzo), y en horario de la acumulación de transcripción de genes para un determinado uso de su tiempo-por supuesto perfil de expresión. Pico de la expresión se define como el momento en el que el ARNm abundancia alcanza su nivel más alto. La aparición de expresión se define como la fecha más próxima de la cumbre en el perfil. Este algoritmo fue utilizado para el único pico de genes expresados diferencialmente como seleccionado para este estudio. Antes de aplicar el algoritmo, se ha seleccionado el conjunto de datos basado en métodos estadísticos (SAM y FDR) se ha descrito anteriormente, que eliminan el ruido de los perfiles. Aparte de esto, el algoritmo de suavizado de Gauss contiene un paso que también elimina el ruido de los perfiles. Ambos inicio y pico de expresión son el inicio y pico de abundancia relativa en lugar de absoluta abundancia. Manual de verificación de los perfiles obtenidos mediante el algoritmo mostró que menos del 0,1% de los datos se desvió de tiempo de latencia de tan sólo un punto del tiempo. La predicción del pico de expresión no varían de los datos observados. Los detalles del algoritmo se dan en el Protocolo de S1.

Anotación del pez cebra oligoarray.

A fin de obtener la más reciente anotación, hemos tratado de obtener la plena longitud secuencias o secuencias montadas para los clones en la gama de diferentes fuentes: Zebrafish colección de genes (ZGC: Http://zgc.nci.nih.gov/ZGC ; Ftp://ftp1.nci.nih.gov/pub/MGC/fasta ); Zebrafish UniGene (UniGene construir 79: Ftp://ftp.ncbi.nih.gov/repository/UniGene/ ) Y Zebrafish Gene Index ([ZGI] liberar 16: Http://www.tigr.org/tigr-scripts/tgi/tc_ann.pl?db=zest Ftp://ftp.tigr.org/pub/data/tgi/Danio_rerio/ ). Si la secuencia de longitud completa no estaba disponible, se obtienen el ensamblado de secuencias de la asamblea UniGene pez cebra (singular, en el más largo de las secuencias de montaje UniGene) y de la ZGI (versión 16), que proporciona secuencias consenso tentativo actual generación de tecnologías ecológicamente racionales de las asambleas Gen. Sin embargo, algunos de los clones de la gama están representados de tecnologías ecológicamente racionales. Por lo tanto, para descargar las secuencias de los clones de longitud completa, montado secuencias, y las tecnologías ecológicamente racionales para todas las sondas en la matriz.

Putativo anotaciones disponibles para los clones en la matriz fueron descargados de las siguientes bases de datos: (1) descripción de Compugen (oligo proporcionada por proveedor: http://www.labonweb.com/oligo (2) Entrez Gene (gen para la identificación, descripción gen , Y de genes símbolo: Ftp://ftp.ncbi.nlm.nih.gov/gene/ ; Http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=gene ), (3) Zebrafish UniGene cluster (por UniGene ID, UniGene descripción: Ftp://ftp.ncbi.nlm.nih.gov/repository/UniGene/ ; Http://www.ncbi.nlm.nih.gov/UniGene/clust ), (4) GO Http://www.geneontology.org Liberación 21 de noviembre de 2004; Ftp://ftp.geneontology.org/pub/go/ ); (5) Locus enlace ( Ftp://ftp.ncbi.nih.gov/refseq/LocusLink/ ; Liberación 21 de noviembre de 2004); (6) UniGene proteína similitud y la descripción (de proteína de ratón y humanos similitud ID, el porcentaje de similitud y descripción: Ftp://ftp.ncbi.nlm.nih.gov/repository/UniGene/ ; Http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=protein&dopt=GenPept&list ); (7) ZGI (build 16) (gen de la descripción y número de secuencia consenso tentativo; Ftp://ftp.tigr.org/pub/data/tgi/Danio_rerio/ ; Http://www.tigr.org/tigr-scripts/tgi/tc_ann.pl?db=zest ); (8) HomoloGene (ratón homólogo de genes humanos y de identificación y descripción; Http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?DB=homologene ; Ftp://ftp.ncbi.nih.gov/pub/HomoloGene/ ); (9) cromosómicas lugar ( Ftp://ftp.ncbi.nih.gov/repository/UniGene/ ).

Todos los datos de la secuencia y anotación de información se almacena en una base de datos MySqL y se puede acceder a Http://giscompute.gis.a-star.edu.sg/ ~ govind / pez cebra / index.html Detalles de la recuperación se da en el archivo de ayuda. La base de datos puede ser consultada utilizando el GenBank número de las sondas en Compugen Zebrafish variedad y el siguiente puede obtenerse información: (1) descripción Compugen, (2) Zebrafish UniGene ID (build 79), (3) descripción Zebrafish UniGene (construir 79), (4) Entrez Gene descripción, (5) Entrez Gene Gene símbolo de identificación y, (6) GO plazo, (7) Locus vínculo, (8) UniGene proteína similitud y descripción (de ratón y humanos), (9) la plena - O montados secuencias de longitud, (10) HomoloGene (humanos y de ratón, la construcción 38,1), y (11) de la localización cromosómica de genes. La anotación de todas las entradas en el GenBank Compugen gama está disponible en el SIG-patrocinado sitio Web diseñado para los microarrays anotación pez cebra ( Http://giscompute.gis.a-star.edu.sg/ ~ govind / pez cebra / index.html ). Por lo que sabemos, somos los primeros en crear esa base de datos integrada y el servicio de búsqueda de los genes de pez cebra presentes en la matriz. Esta base de datos GIS de pez cebra se actualizará periódicamente mediante la integración de la última versión de la base de datos de recursos.

De nuestro análisis de la expresión durante la embriogénesis, 3657 genes expresados diferencialmente se identificaron y anotada. No se duplica en los genes expresados diferencialmente seleccionado para el análisis. Para obtener la anotación de estos genes, los siguientes procedimientos fueron aprobados. Anotaciones / gen putativo descripciones se obtuvieron de las siguientes bases de datos GenBank, utilizando como número de consultas de información: Entrez Gene, UniGene descripciones, similar a la proteína humana / ratón, y ZGI (build 16). De lo anterior fuentes, que obtuvo anotación de alrededor del 75% de los clones. (Entrez Gene: 31%; UniGene, proteína similitud, y ZGI: 44%). Para describir el resto de los clones, BLASTed montado la secuencia de ADN de los clones contra la base de datos no redundante ( Ftp://ftp.ncbi.nlm.nih.gov/blast/db/ Proteína; Ftp://www.expasy.ch/databases/sp_tr_nrdb/ ). Putativo anotaciones se obtuvieron alrededor del 20% de los clones a partir de la base de datos no redundante. Para el resto de los clones (5%), llegamos a la descripción obtenida de búsqueda BLAST ( Ftp://ftp.ncbi.nlm.nih.gov/blast/db/ ). En este proceso, hemos obtenido putativo anotación para la mayoría de los genes expresados diferencialmente. Todos los datos sobre los recursos utilizados en las anotaciones están disponibles a través de nuestra base de datos ( Http://giscompute.gis.a-star.edu.sg/ ~ govind / pez cebra / index.html Http://giscompute.gis.a-star.edu.sg/ ~ govind / pez cebra / data_download.html Conjuntos de datos) (S26 y S27]. Sobre la base de la descripción de genes y GO, los genes implicados en funciones seleccionadas se identificaron utilizando las palabras clave adecuadas, como el "ciclo celular", "proteasomas", "RPs", y así sucesivamente.

Del Norte mancha de hibridación y análisis de deseos.

Total de ARN aislado de los embriones en diferentes etapas de desarrollo se fraccionado en 1,2% formaldehído geles de agarosa y transferidos a membranas GeneScreen siguientes procedimientos estándar. Las membranas se borró prehybridized y hibridizada siguientes protocolos estándar. Selección de clones de cDNA RP (l7a, s3a, s12 y s10) fueron utilizados como plantillas para sonda de preparación y uso de la etiqueta con 32P aleatoria de ADN Primer sistema de etiquetado (Gibco BRL). Todo el montaje hibridación in situ de RNA utilizando sondas marcadas con digoxigenina (Roche) se llevó a cabo como en el informe anterior [75].

La cuantificación por PCR en tiempo real.

Con el fin de verificar los resultados de los microarrays, dos elegidos al azar genes expresados diferencialmente se pusieron a prueba en tiempo real de RT-PCR para el análisis de todos los puntos temporales. El SYBR Green I (Roche) RNA kit de amplificación se utilizó en el LightCycler de acuerdo a las instrucciones del fabricante. El beta-actina y la miosina de cadena ligera 2 (mlc2f) transcripciones fueron amplificados utilizando los siguientes primers (beta-actina: LC1-5 'CCGTGACATCAAGGAGAAGCT-3'; LC2 5'-TCGTGGATACCGCAAGATTCC-3 '; mlc2f: LC1-5'-TCTCACTCATTACCCACAA 3 '; LC2 5'-ACTCCATCGTGCTTCTTTC-3'). Antes de cuantificación, la concentración óptima de la plantilla, los cebos, y el magnesio se determinaron. Diluido en serie de muestras de ADN plásmido se utilizaron para construir una curva estándar para cuantificar las muestras de ensayo, así como la eficiencia de amplificación. Los productos de tiempo real RT-PCR también fueron analizados por electroforesis en gel de agarosa único bandas de la talla predijo (datos no publicados). El mismo protocolo se siguió para todos los PCR en tiempo real de análisis.

Análisis de los principios de la expresión génica.

Para el análisis de la expresión génica durante las primeras etapas del desarrollo de puntos de tiempo, los embriones fueron recolectados en la siguiente división, y después de la división etapas: una de las células, four-/eight-cell (en su mayoría de cuatro células), 64-/128-cell (en su mayoría 64-cell), el 4 de hpf, y 6 hpf. Total de ARN extraído de huevos no fecundados se utilizan como referencia en este análisis de ARN de la expresión génica. Para realizar la PCR en tiempo real usando la nueva serie de ARN, el ARN total fue extraído a partir de una sola célula, two-/four-cell, 64-/128-cell, 256-/512-cell, y de 4 embriones y hpf Utilizados para el experimento. Para calcular el ratio de expresión de la PCR en tiempo real de datos, en tiempo real los datos de una sola célula fase se utilizó como referencia. La normalización de los análisis estadísticos se realizaron como se describe en el Material y Métodos.

Apoyo a la Información
Desarrollo regulado de datos de expresión de genes con
Este conjunto de datos contiene todos los genes seleccionados para su posterior análisis.
Genes materna
Genes que muestran máximos de transcripción en los niveles de huevos no fecundados y los diferentes patrones de degradación.
Lista de los genes con el inicio de acción de Transcripción de Acumulación en la fase Blastula y pico de expresión en la Etapa Blastula
(130 KB DOC)
Lista de los genes con el inicio de acción de Transcripción de Acumulación en la fase Blastula y pico de expresión en la Etapa Gastrula
(191 KB DOC)
Lista de los genes con el inicio de acción de Transcripción de Acumulación en la fase Blastula y pico de expresión en la Segmentación de escena
(66 KB DOC)
Lista de los genes con el inicio de acción de Transcripción de Acumulación en la fase Blastula y pico de expresión en la Etapa Pharyngula
(44 KB DOC)
Lista de los genes con el inicio de acción de Transcripción de Acumulación en Gastrula y pico de expresión en Gastrula Etapas
(27 KB DOC)
Lista de los genes con el inicio de acción de Transcripción de Acumulación en Gastrula y pico de expresión en Segmentación Etapas
(51 KB DOC)
Lista de los genes con el inicio de acción de Transcripción de Acumulación en Gastrula y pico de expresión en Pharyngula Etapas
(29 KB DOC)
Lista de los genes con el inicio de acción de Transcripción y pico de expresión en la Segmentación de escena
(36 KB DOC)
Lista de los genes con el inicio de acción de Transcripción de Acumulación en la Segmentación de escena y pico de expresión en la Etapa Pharyngula
(88 KB DOC)
Lista de los genes con el inicio de acción de Transcripción de Acumulación y pico de expresión en la Etapa Pharyngula
(43 KB DOC)
Exponer los genes pico de expresión en el Unfertilized Egg (Maternally Cargado ARN)
(137 KB DOC)
Exponer los genes pico de expresión en la Etapa Blastula
(130 KB DOC)
Exponer los genes pico de expresión en la Etapa Gastrula
(199 KB DOC)
Exponer los genes pico de expresión en la Segmentación de escena
(142 KB DOC)
Exponer los genes pico de expresión en la Etapa Pharyngula
(156 KB DOC)
Cell-Ciclo de genes relacionados con
(21 KB DOC)
Proteasomas, Ubiquitins
(24 KB DOC)
Somitogenesis relacionadas con los genes
(24 KB DOC)
RP Genes
(25 KB DOC)
Expresión Génica Dataset de pre-y post-MBT MBT Etapas de la maternidad dominantes Genes
(22 KB DOC)
Expresión Génica Dataset de pre-y post-MBT MBT etapas con inicio de acción de Expresión de 64 celdas Onwards
(39 KB DOC)
Expresión Génica Dataset de pre-y post-MBT MBT etapas con inicio de acción de Expresión del 4 hpf Onwards
(40 KB DOC)
Expresión Génica Dataset de pre-y post-MBT MBT etapas con inicio de acción a partir del 6 de Expresión hpf Onwards
(100 KB DOC)
Anotación putativo obtenidas para la Selección de 3675 Genes Zebrafish Uso de la Base de Datos de anotación en el trabajo de creación también de la búsqueda NR PP Blast
(3,5 MB XLS)
Anotación putativo obtenidas para la selección de pre-y post-MBT MBT Genes Zebrafish anotación utilizando la base de datos generados en este trabajo
(525 MB XLS)
Perfil de expresión de la beta-Actina Gene en el array
Todas las copias de los oligos en el conjunto mostró un patrón de expresión casi idéntica, lo que indica la reproducibilidad y la homogeneidad de la matriz de datos.
Comparación de los perfiles de expresión para la obtención de Myosin Luz Cadena (mlc2f) y Beta-Actina Genes Utilizando Microarray Análisis y Real-Time PCR
Los patrones de expresión detectados en ambos métodos son prácticamente idénticas.
Del Norte blot de los genes rp
(A) Northern blot para detectar la transcripción abundancia de determinados genes RP
(L7a, s3a, s12,
Y
S10)
Durante la embriogénesis. El patrón de expresión del Norte mancha obtenida por el análisis es similar a los datos obtenidos de la matriz de análisis.
Distribución de los Principios de la Expresión Génica en etapas posteriores de la base de Embryogenesis Peak Expresión y Clasificación de los Principios de genes en grupos funcionales Sobre la base de Terminología GO
(227 KB PDF)
PCR en tiempo real de los principios de análisis de los genes
PCR en tiempo real se hace usando ARN total extraído de las primeras etapas del desarrollo embrionario (en una celda, two-/four-cell, 64-/128-cell, 256-/512-cell, y 4-hpf) durante ocho genes Del Grupo 2 (pre-MBT transcriben los genes). El patrón de expresión de estos genes por PCR en tiempo real y se comparan los microarrays. El patrón de expresión es similar en ambos tipos de análisis.
Comparación del perfil de expresión de genes seleccionados en el Microarray Análisis y Otros métodos de detección Transcript
(11 KB PDF)
Pez cebra Pre-MBT Transcritas (Principios de Genética) Orthologs en Mouse y Humanas
(9 KB PDF)
Características de las etapas del desarrollo de embriones Que Se recolectadas para el perfil de Análisis de Expresión en este trabajo
(24 KB PDF)
El inicio y el algoritmo de búsqueda de compensar
(71 KB PDF)

Damos las gracias a Aradhana Rani para ayudar en el análisis de datos, y Ben Zion Caveri para ayudar con el análisis del Norte. El apoyo financiero recibido de la Investigación Biomédica del Consejo de Singapur Se agradece.