PLoS Genetics, 2005; 1(1): (más artículos en esta revista)

El uso de Microarrays para Facilitar posicionales Clonación: Identificación de Tomosyn como un Inhibidor de Neurosecretion

Biblioteca Pública de la Ciencia
Michael Dybbs [1], John [2] Ngai, Joshua M Kaplan [1]
[1] Departamento de Biología Molecular, del Hospital General de Massachusetts, Boston, Massachusetts, Estados Unidos de América
[2] Departamento de Biología Molecular y Celular, Laboratorio de Genómica Funcional, Helen Wills Neuroscience Institute de la Universidad de California, Berkeley, California, Estados Unidos de América
Resumen

Adelante genéticos pantallas se han utilizado como una poderosa estrategia para diseccionar vías biológicas complejas en muchos sistemas modelo. Una limitación importante de este enfoque ha sido el largo y costoso proceso de la clonación posicional y caracterización molecular de las mutaciones aisladas en estas pantallas. En este sentido, los autores describen una estrategia utilizando microarrays hibridaciones para facilitar la clonación posicional. Este método se basa en el hecho de que los codones de parada prematura (es decir, mutaciones sin sentido) constituyen una clase de mutaciones frecuentes aisladas en las pantallas y que una tontería mutante ARN mensajero son degradados de manera eficiente por la tontería conservadas mediada por vía de la decadencia. Ellos validar esta estrategia mediante la identificación de dos mutaciones previamente no: (1) tom-1, encontraron una mutación genética en una pantalla hacia adelante para aumentar la secreción de acetilcolina en Caenorhabditis elegans, y (2) una aparentemente mutación espontánea en la hif-1 factor de transcripción de genes . Además, demuestran la amplia aplicabilidad de esta estrategia de utilización de otros mutantes conocidos en C. Elegans, la Arabidopsis, y el ratón. Caracterización de tom-1 mutantes sugiere que TOM-1, el C. Elegans ortholog de mamíferos tomosyn, funciona como un inhibidor endógeno de la secreción de neurotransmisores. Estos resultados también sugieren que los microarrays hibridaciones tienen el potencial de reducir significativamente el tiempo y el esfuerzo necesarios para la clonación posicional.

Introducción

Adelante genéticos pantallas han sido tradicionalmente utilizados en el modelo de los sistemas (por ejemplo, el Caenorhabditis elegans, Drosophila, levadura, y Arabidopsis). Más recientemente, las pantallas de gran escala se han realizado en vertebrados como el pez cebra sistemas [1, 2] y el ratón [3 - 5]. Las mutaciones genéticas aisladas en las pantallas suelen ser identificados por clonación posicional. La dificultad que plantea la clonación posicional es determinada por el tamaño del genoma, la tasa de recombinación, y la dificultad de evaluar el fenotipo mutante. Por ejemplo, el genoma del ratón está compuesto 3600 centimorgans (cM) y 3 × 10 9 pares de bases. El objetivo final de un típico proyecto de clonación posicional es analizar un número suficiente de recombinantes mapa de la mutación genética a un pequeño intervalo (normalmente alrededor de 0,1 cM). Una vez que la mutación se ha mapeado precisamente, la identificación de genes suele ser alcanzado por una variedad de estrategias: la secuenciación directa de la región (100 kb en el ratón), el candidato las pruebas genéticas, o la detección de alelos informativo (por ejemplo, microdeleciones). La dificultad de un particular, la clonación posicional se pueden ver agravados por la naturaleza de la fenotipo mutante. Este problema es particularmente agudo para los mutantes de comportamiento, que a menudo tienen fenotipos que deben ser anotadas en múltiples ensayos, o en poblaciones de los animales. En conjunto, estas cuestiones conspiran para que la posición tradicional de la clonación un importante y costoso cuello de botella.

Para sortear estas dificultades, varias nuevas tecnologías se han desarrollado para aislar mutaciones de la genética inversa. Reverse genéticos estrategias incluyen el uso de inserción mutágenos [6-10], PCR pantallas para supresiones, aleatoriamente, [11], la orientación de genes homólogos [12, 13], y, físicos o genéticos de detección de mutaciones puntuales en los genes secuenciados [14, 15]. Si bien las estrategias de genética inversa eludir la clonación posicional cuello de botella, estos enfoques también tienen limitaciones. Las mutaciones aisladas por genética inversa a menudo carecen de defectos evidentes fenotípicas (por ejemplo, porque están en los genes funcionalmente redundante). Diferencias fenotípicas observadas en mutantes aisladas por genética inversa puede ser confundida por otras mutaciones en el fondo genético, en particular porque los animales suelen ser mucho mutagenized en estas estrategias. Por estas razones, sería útil para desarrollar métodos que permitan más rápida caracterización de las mutaciones genéticas aisladas en adelante pantallas.

Nos pregunta si los microarrays de expresión de datos podría facilitar la identificación de mutaciones responsables de los defectos de comportamiento aislado en adelante genéticos pantallas. Está demostrado que las mutaciones sin sentido en el resultado de la degradación de los mutantes ARN mensajero (ARNm) a través del absurdo mediada la decadencia (NMD) vía. Un mecanismo de vigilancia común a todos los eucariotas, dicho sistema sirve como un sistema de control de calidad defectuosa de destruir mRNAs cuya traducción podría dar lugar a una proteína truncada indebidamente [16-18]. NMD protege a las células inactivas o mediante la eliminación de los posibles dominante negativo proteínas, que son el resultado de una mutación somática, errores de transcripción, empalme o errores.

Se ha propuesto que dicho sistema podría ser utilizado como base para identificar las mutaciones sin sentido en las líneas celulares [19, 20]. En principio, una mutación sin sentido en los animales mutantes podrían identificarse utilizando microarrays hibridaciones para encontrar transcripciones con disminución de la abundancia. En la práctica, los microarrays de datos por sí solo es poco probable que sea suficiente para la identificación de mutaciones sin sentido. Además de la espera del ruido estadístico de experimentos relacionados con los microarrays, es probable que haya cambios en la transcripción de otros genes que son causados por la mutación en estudio. El más poderoso de la clonación con fines de enfoque, pues, que utiliza datos de microarrays junto con información de la cartografía tradicional. Aquí, se presenta la documentación justificativa de la viabilidad y la utilidad general de esta estrategia.

Resultados

Para poner a prueba la viabilidad de la utilización de microarrays para facilitar la clonación posicional, que se ocupará de cuatro preguntas. (1) ¿Con qué frecuencia son tonterías alelos recuperado en adelante genéticos pantallas? (2) ¿microarrays hibridaciones suficientemente sensible para detectar la disminución de la abundancia de una transcripción sin sentido mutante? (3) ¿microarrays hibridaciones ser utilizado para identificar un comportamiento uncloned mutante en C. Elegans? (4) Es microarrays estrategia basada en el modelo aplicable a otros organismos?

Tonterías alelos representan una gran proporción del C. Mutaciones elegans

La utilidad de los microarrays en la clonación depende de la frecuencia con la que se recuperan tontería alelos fenotípica en las pantallas. Desde el 15 de los 61 aminoácidos de la codificación de los codones son mutables de los codones de parada por una sola base de par de sustitución, absurdo alelos probablemente representan una gran proporción de todos los alelos recuperado después de la mutagénesis aleatoria con agentes que aumentan la tasa de nucleótidos misincorporation. Para evaluar la prevalencia de alelos absurdo aislados siguientes mutagénesis aleatoria, se compiló una lista de la secuencia C. Elegans alelos mutantes por descargar información de la realización de WormBase y orientados búsquedas en la literatura (figura 1; Tabla S1]. Nos centramos en misincorporation mutaciones ya que estos representan la más común de lesión causada por agentes alquilantes como el etil metano sulfonato o N-etil-N-nitrosourea. En total, se examinaron 943 solo nucleótido sustitución de la pérdida de la función de los alelos en 246 genes, que se publicaron por 99 laboratorios. A continuación, estos alelos clasificados como putativo NMD objetivos (tontería) o no NMD objetivos (missense). Se encontró que el 41% de los alelos se putativo NMD objetivos. Curiosamente, esta cifra es comparable con las estimaciones de que un tercio de las enfermedades genéticas humanas son el resultado de mutaciones sin sentido [21, 22].

Se calculó el porcentaje de tonterías alelos recuperados para cada uno de los 117 genes en nuestra base de datos con tres o más alelos caracteriza (Figura 1]. Para el 20% de estos genes, alelos tontería no han sido identificados, incluso en los casos en que se conocen diez alelos. Muchos de estos genes son conocidos por causar un fenotipo letal como una mutación nula (por ejemplo, acy-1, unc-17, y dejar-502). Dado que muchas pantallas de la demanda fenotipos homocigotos viable, no es de extrañar que una tontería alelos rara vez se recupera en estos genes. Para otro 20% de estos genes, conocidos todos los alelos son mutaciones sin sentido. Estos genes podrían comprender de fenotipos mutantes, que se expresan sólo cuando la función de genes se elimine por completo. Para todos los otros genes, parece haber una amplia distribución en la fracción de alelos tontería recuperado, con un modo que ocurre en el 40% alelos tontería. Así, mientras que una alta frecuencia de los alelos absurdo parece ser una característica común a muchas pantallas en C. Elegans, esto puede variar considerablemente para diferentes clases de genes.

Prueba de Principio: mec-3 y unc-43 CaMKII ¿Las mutaciones detectables por Microarray

Microarrays hibridaciones son lo suficientemente sensibles como para detectar cambios en la abundancia de mutantes transcripción debido a una lesión tontería encima de la variación global en la expresión genética entre las cepas mutantes y el control? Algunas posibles fuentes de variación en la expresión de genes incluyen fluctuaciones aleatorias en la expresión de genes [23, 24], incontrolada diferencias entre los mutantes y el control de la población (por ejemplo, las diferencias en el grado de desarrollo o estado fisiológico), y las diferencias en las bases genéticas [25, 26] . Tal vez la más importante es la limitación de los posibles cambios en la expresión de genes que son una consecuencia secundaria de una mutación. Esto puede ser particularmente problemático para las mutaciones en genes que codifican factores de transcripción o de otros componentes de las cascadas de transducción de señales, la pérdida de la que se espera que modifique la expresión de muchos genes río abajo.

Para abordar algunos de estos problemas, hemos examinado la gran colección de experimentos de microarrays utilizado para construir todo un genoma de perfil de expresión de C. Elegans [27]. La mayoría de estos experimentos, que se realizó con microarrays impresos, fueron diseñados para identificar los perfiles de expresión génica asociados con diversos programas de desarrollo o tejidos específicos. Sin embargo, una serie de experimentos analizaron los cambios en la expresión génica en mutantes que carecen de la MEC-3 factor de transcripción (véase Materiales y Métodos] [28]. La mec-3 (e1338) corresponde a un alelo W69Stop mutación, y homocigotos animales portadores de esta mutación son insensibles al tacto [29, 30].

El uso de este conjunto de datos, clasificados como los genes expresados diferencialmente en mec-3 (e1338) sobre la base de dos criterios: la media de veces de cambio en el nivel de expresión y significación estadística utilizando una prueba t de Student. Hemos construido un volcán parcela con el log 2 (cambio de tapa) en el eje "x" y la negativa de registro 10 (p-valor) en el eje "y" [31]. Esto proporciona una manera útil de visualizar los genes expresados diferencialmente a aquellos cuyo nivel de expresión es abajo (negativo en el eje "x") y que muestran alta significación estadística (grandes en el eje "y"). Setenta genes fueron identificados como haber reducido de manera significativa expresión en mec-3 (e1338), el cambio de uso de veces mayor que -1,0 (log 2 de la escala) y p <0,01 como disminución de los umbrales para la expresión (Figura 2]. E1338 ha sido una mutación que no se trata de clonar, el siguiente paso sería la de reducir la lista de candidatos de 70 genes utilizando la cartografía de datos. Quince de estos genes se encuentran en cromosomas 4, que contiene mec-3 y otros aproximadamente 2900 genes. De ellos, sólo tres genes expresados diferencialmente caen dentro de dos mapa de la unidad intervalo que abarca mec-3 y alrededor de 100 otros genes. Por lo tanto, incluso en el caso de un factor de transcripción, microarrays hibridaciones son lo suficientemente sensibles para detectar cambios en el mRNA mutante, a pesar de la abundancia de cambios más amplios, en la expresión de genes. En el caso del MEC-3, es probable que la reducción de la abundancia de ARNm e1338 se debe tanto a NMD y positivo de autorregulación mec-3 de transcripción [32]. Por lo tanto, la triangulación entre la información y la cartografía aproximada microarrays datos que han facilitado la rápida clonación de mec-3.

Para seguir haciendo frente a la sensibilidad de los microarrays con ayuda de la clonación, analizamos los cambios en la expresión de genes observados en KP3365 unc-43 (n1186) mutantes. El unc-43 gen codifica tipo II y calcio-calmodulina dependiente de la proteína quinasa (CaMKII), que se expresó ampliamente en el sistema nervioso del gusano, así como en los músculos y en el intestino [33]. Este es otro caso de prueba exigente porque CaMKII desempeña un papel fundamental en la señalización mediada por calcio en las neuronas, y unc-43 mutaciones son conocidas por causar cambios en la expresión de otros genes [34]. El n1186 alelo Q67Stop corresponde a una mutación, y homocigotos animales portadores de esta mutación tienen relativamente sutiles defectos de comportamiento [33].

Hemos hibridizado total de ARN aislado de tipo salvaje y KP3365 unc-43 (n1186) CaMKII animales mutantes a la Affymetrix C. GeneChip elegans (Dataset S1]. - Uso de los cambios veces mayor que 0,5 (escala log 2) y p <0,01 como umbrales, encontramos 20 probesets con disminución de expresión en KP3365 unc-43 (n1186) CaMKII mutantes en comparación con los controles de tipo salvaje (Figura 3]. Ocho de estos probesets corresponden a secuencias de cromosomas 4, que contiene unc-43 CaMKII y 2900 aproximadamente otros genes. Llamaba la atención que siete de estos ocho probesets corresponden a los genes unc-43. Estos siete probesets corresponden a nonoverlapping regiones de la secuencia de codificación, así como a los 5 'y 3' de la región sin traducir unc-43 (Figura S1]. Sólo dos de estos probesets (193459_s_at y 193463_s_at) fueron anotados como correspondiente a la unc-43 CaMKII mRNA transcripción de acuerdo a la anotación de la C. Elegans proporcionada por Affymetrix GeneChip (descargable en Http://www.affymetrix.com ). Durante nuestro examen de los ocho candidatos probesets que mostraron disminución en la expresión y se cromosomas 4, descubrimos los otros cinco probesets que correspondían a unc-43 CaMKII. Estos adicionales probesets proporcionado un control de serendipidad ciego, ya que no eran conscientes de su existencia hasta que apareció en nuestra lista de candidatos a partir de la hibridación. Esta redundancia en sondas es el resultado de la superposición de las distintas bases de datos utilizados para el diseño y GeneChip inexactitudes en predications gen en el momento de la concepción (diciembre de 2000). Aproximadamente 2.400 (13%) de los genes en el C. Elegans GeneChip son representados por múltiples sondas. Si bien es inusual que tienen siete probesets en un microarray que corresponde a un solo gen, esto pone de manifiesto la solidez de nuestra capacidad para medir los cambios en la expresión de la unc-43 CaMKII. Esto demuestra que los microarrays hibridaciones se pueden utilizar para medir la disminución de la unc-43 en la transcripción unc-43 (n1186) mutante. Estos resultados también sugieren que la utilización de microarrays hibridaciones arrays impresos y la utilización de los chips de Affymetrix son a la vez suficientemente sensible para detectar cambios en la abundancia de mRNAs mutante, incluso en los casos relativamente estrictos de los factores de transcripción y transducción de señales componentes.

Identificación de un hif-1 polimorfismo en el KP3365 Strain

Una potencial limitación de nuestra estrategia es que las cepas mutantes pueden contener múltiples mutaciones, algunas de las cuales no contribuyen al fenotipo mutante. Esto será especialmente cierto en gran medida mutagenized cepas, y en los casos en que los mutantes no han sido ampliamente backcrossed con cepas de tipo silvestre. Por lo tanto, hemos examinado la KP3365 unc-43 (n1186) CaMKII datos de la hibridación con otros genes reducido de manera significativa expresión. Curiosamente, el gen con la mayor disminución en la expresión KP3365 unc-43 (n1186) los animales no es unc-43, sino que se hif-1 (Figura 3], que codifica el gusano ortholog de hipoxia-inducible factor 1 α, Factor de transcripción que media transcripcional respuestas a la privación de oxígeno [35]. Esta es la única sonda correspondiente a hif-1 en la C. GeneChip elegans. Hay dos posibles motivos para la disminución observada en hif-1 transcripción niveles: o bien hif-1 de expresión está regulada por unc-43 CaMKII, o la cepa KP3365 contiene una pérdida de la función de polimorfismo en el gen hif-1. Secuenciación de DNA genómico KP3365 animales revelaron dos mutaciones en el último exón de hif-1 (nu469) (Figura 4 A). Dado que ninguna de estas mutaciones resulta en una parada prematura, ¿por qué se redujo el nivel transcripción? Para abordar esta cuestión, secuenciado hif-1 cDNA hechos de la naturaleza y el tipo de animales KP3365. Este reveló que la nu469 mutaciones causan un aberrante empalme de la hif-1 mRNA, la supresión de 135 pares de bases a partir del último exón (Figura 4 A). Hemos confirmado este cambio en hif-1 empalme por RT-PCR (Figura 4 B). El aberrantly empalmados hif-1 (nu469) transcripción es probable que se ha reducido la estabilidad.

En condiciones aerobias, la proteína HIF-1 es constitutivamente degradadas por la de von Hippel-Lindau ubiquitin ligase [36 - 38]; en consecuencia, el hif-1 (nu469) mutación presumiblemente ser fenotípicamente silencioso en condiciones normales de crecimiento. El hif-1 (nu469) mutación no estaba presente en varias otras cepas que contienen la unc-43 (n1186) alelo, lo que sugiere que esta mutación se produjo espontáneamente durante el cultivo en nuestro laboratorio (datos no presentados). En resumen, KP3365 animales previamente no llevar un polimorfismo en hif-1, que hemos identificado basado únicamente en nuestros resultados de la hibridación microarrays. La identificación de tales polimorfismos puede permitir a los investigadores a explicar los aspectos inesperados de fenotipos mutantes de especial tensión.

El uso de Microarrays para Identificar una mutación en Tomosyn, un inhibidor de la secreción Neurotransmitter

Para seguir haciendo frente a los microarrays hibridaciones si se puede utilizar para identificar las mutaciones no, analizamos un comportamiento mutante que se aisló en una pantalla para avanzar genéticos inhibidores de la secreción de neurotransmisores. Neurotransmisión sirve como el principal medio de comunicación entre las células del sistema nervioso. Neurotransmisores como la acetilcolina (ACh) son secretados por las células nerviosas presináptica, y activar los receptores postsinápticos de las células. De comportamiento y farmacológicos en las pantallas de C. Elegans han demostrado ser un poderoso enfoque a la identificación de las moléculas que participan en la transmisión sináptica y la función del sistema nervioso [39 - 42]. El inhibidor de la colinesterasa aldicarb es ampliamente utilizado como medio para controlar la secreción de ACh en la C. Elegans unión neuromuscular [41, 43 - 46]. En presencia de aldicarb, ACh acumula en la hendidura sináptica, causando pared de los músculos del cuerpo para convertirse en hypercontracted y de los animales a ser paralizado. Las mutaciones que aumentan la secreción de ACh causa hipersensibilidad a los efectos de la paralítica aldicarb [46 - 48]. Para identificar los reguladores negativos de la secreción de ACh, hemos utilizado hipersensibilidad a aldicarb como base para un futuro genéticos pantalla. Una de las más fuertes mutaciones recuperado en nuestra pantalla se nu468 (llenado plazas en la Figura 5].

Estamos meiotically asignada a nu468 de cromosomas 1, que contiene aproximadamente 2700 genes. Luego de ARN hibridizada KP3293 nu468 animales a la C. GeneChip elegans, la comparación de hibridaciones a la de tipo salvaje hibridaciones que se describió anteriormente (Dataset S1]. Seis probesets mostró disminuyó significativamente expresión en KP3293 animales (pliegue de cambio <-0,5, p <0,01) (Figura 6], de los cuales dos corresponden a los genes en cromosomas 1. Secuenciación del ADN de los mutantes reveló una tontería mutación en uno de estos genes, tom-1, el C. Elegans ortholog de mamíferos tomosyn (Figuras 7 A y S2]. Esta lesión, una NMD meta prevista, está en consonancia con la disminución de los niveles de transcripción que se observó por la hibridación microarrays. Esta es la única sonda correspondiente a tom-1 en la C. GeneChip elegans.

Hemos realizado varios experimentos para confirmar que el tom-1 (nu468) causó la mutación aldicarb hipersensibilidad observada en la cepa KP3293. En primer lugar, hemos probado una segunda tom-1 alelo, ok285, que fue generada por el C. Elegans Gene Knockout Consorcio ( Http://celeganskoconsortium.omrf.org ). Este alelo, tom-1 (ok285), codifica una proteína mutante que carecen de residuos de 202 en una región altamente conservada, y homocigotos tom-1 (ok285) mutantes exhiben aldicarb hipersensibilidad similar a la observada en KP3293 tom-1 (nu468) mutantes (triángulos En la Figura 5]. En segundo lugar, la hipersensibilidad de aldicarb KP3293 tom-1 (nu468) animales fue rescatado por un transgén conducción expresión de un tom-1 cDNA en neuronas colinérgicas (círculos abiertos en la Figura 5]. En tercer lugar, encontramos que un 4,2 kb-tom-1 promotor fragmento es suficiente para conducir expresión de la proteína verde fluorescente en el cordón ventral neuronas motoras (Figura 7 B), en consonancia con la idea de que tomosyn actúa como un inhibidor de la secreción de ACh en el motor Neuronas. Tomosyn mostró también su expresión en varias neuronas en la cabeza (Figura 7 C) y los ganglios de la cola (Figura 7 D).

Tomosyn es un aproximado de 1100-aminoácidos de proteínas con dos dominios funcionales: (1) el C-terminal en espiral-bobina de dominio, que comparte homología con synaptobrevin y se ha demostrado que se unen a syntaxin y SNAP-25, y (2) los aproximadamente 600-WD40 residuo N-terminal rica región, que muestra fuerte homología a la mosca de la proteína letal supresor de tumor gigante de las larvas (Figura 7 A) [49, 50]. Estudios anteriores han demostrado que la synaptobrevin-como en espiral-bobina de dominio de rata tomosyn une syntaxin y SNAP-25, formando un complejo SNARE-al igual que obstruye y cierra synaptobrevin [51]. Esto sugiere un mecanismo por el cual inhibe la secreción de tomosyn competitivos SNARE mediante la prevención de formación de los complejos. En apoyo de esta hipótesis, la sobreexpresión de tomosyn en neuroendocrino de células resulta en una disminución de la exocitosis en respuesta a la despolarización [49 - 52]. Si bien estos estudios indican que la sobreexpresión tomosyn puede funcionar para inhibir la liberación de vesículas núcleo denso, que no se ocupan de la función de tomosyn endógeno. Nuestros resultados proporcionan la primera evidencia in vivo sugieren que la forma endógena expresó tomosyn inhibe la secreción de neurotransmisores en las neuronas.

Generalización de Microarray Asistida Clonación

Dado que las funciones de dicho sistema en todos los eucariotas [16, 18], que se pregunta si nuestra estrategia se puede aplicar a otros modelos. Para tratar este problema, se realizó un análisis retrospectivo de datos procedentes de microarrays mutantes en otros organismos. Se hicieron búsquedas en las bases de datos públicas para experimentos de microarrays en el que los investigadores han analizado en otros organismos mutantes. En concreto, buscamos hibridaciones donde mutante ARN ha sido comparado con ARN de tipo salvaje y que la mutación fue el resultado de un codón de parada prematuro (y, por tanto, un objetivo previsto NMD). Por razones prácticas, se requiere también que el gen mutante estar representados y detectables en el microarray. Sorprendentemente, se observa que sólo dos experimentos cumplido estos criterios. La primera fue un estudio de pmr4 (resistente al mildiu 4), una biosíntesis de la pared celular en Arabidopsis gen que confiere resistencia al patógeno mutado. La lesión utilizados en el estudios de microarrays es un codón de parada prematura en el segundo exón (PMR4 de datos) [53]. El segundo fue un estudio de los ratones mdx, un modelo animal de distrofia muscular de Duchenne, con un codón de parada prematuro en el exón 23 de la distrofina (MDX de datos) [54, 55]. En ambos estudios, los autores sabían de la naturaleza de la mutación y se esfuerzan por encontrar los genes cuya expresión cambiado en el mutante de fondo.

Para estos dos ejemplos, hemos pedido a posteriori si la hibridación de datos que han ayudado identificación de los genes mutantes. Para ello, reanalizamos PMR4 y el MDX de datos como se describe para la C. Elegans mutantes y construido volcán parcelas (Figura 8]. Cada uno de estos conjuntos de datos tuvo una distribución diferente en la tapa de cambio y ejes de significación debido a las diferencias en la preparación de muestras, el etiquetado de eficiencia, el tipo de GeneChip, y el número de hibridaciones. Por lo tanto, ajustar nuestra importancia y relación con los umbrales para la expresión diferencial (véase Materiales y Métodos]. En el PMR4 hibridaciones, 17 genes mostraron expresión disminuyó significativamente (cambio de tapa <-1,0, p <0,01). De ellos, dos fueron en los genes de cromosomas 4, el más importante de las cuales es la PMR4 (Figura 8 A). En el caso de los datos MDX, el 22 de genes mostraron expresión disminuyó significativamente (cambio de tapa <-1,5, p <0,0001). De ellos, sólo el gen de la distrofina fue sobre X (Figura 8 B). En cada caso, hay una sola sonda en el GeneChip correspondiente a la gen mutante. Para ambos ejemplos, la combinación de datos de microarrays y cartografía cromosómicas rápidamente reducido el número de candidatos a uno o dos genes.

Discusión

Se presenta pruebas que demuestran la utilidad de los microarrays hibridaciones para facilitar la rápida identificación de mutaciones genéticas aisladas en adelante pantallas. Varios resultados sugieren que esta técnica se aplica ampliamente. Esta estrategia tuvo éxito en la identificación de C. Elegans, ratón, Arabidopsis y mutaciones. Las mutaciones fueron identificadas con éxito en los dos factores de transcripción y transducción de señales componentes, que serán probablemente los más difíciles casos. Genes mutantes fueron detectados con éxito utilizando los datos obtenidos con ambos arrays impresos y chips de Affymetrix. Y finalmente, hemos sido capaces de identificar dos anteriormente no C. Elegans mutaciones con este enfoque.

¿Esta estrategia de trabajo para los genes que regulan la expresión de muchos otros genes? Se incluyen ejemplos de éxito de la identificación de tres genes que afectan directamente a la transcripción de dos factores de transcripción (mec-3 y hif-1) y una proteína quinasa que regula la expresión de genes neuronales (unc-43). Aunque el 70 genes que se expresan en forma diferente mec-3 mutantes, sólo tres genes expresados diferencialmente mapeado dentro de un intervalo de 2 cM contengan mec-3 y otros 100 genes. Por lo tanto, los microarrays hibridaciones habría facilitado la identificación de mec-3.

La tasa de éxito de esta estrategia depende de tres factores: (1) la fracción de los genes que son detectables por microarrays, (2) la frecuencia de los alelos tontería recuperado en las pantallas, y (3) la eficiencia con la que tontería mutado mRNAs son degradados por NMD. En nuestra hibridaciones utilizando mRNA preparado de toda gusanos, el 80% de los genes en el conjunto mostró detectables expresión. En el caso de que una mutación afecta a un determinado tipo de células o tejidos, la probabilidad de detectar una transcripción puede aumentarse utilizando ARN aislado de ese tipo de células o tejidos [28, 56].

¿Qué fracción de los recién aisladas de mutaciones se tonterías alelos (ver Figura 1)? Nuestro análisis sugiere que para el 20% de C. Elegans genes, mutaciones sin sentido rara vez se recuperan. Para el 80% restante de C. Elegans genes, el 45% de los alelos fueron recuperados tontería alelos. Dados estos coeficientes, la tasa de éxito en la identificación de genes por hibridación microarrays podría aumentarse a través del análisis de múltiples alelos de un mismo gen y de la selección de genes para los que son los alelos null aislados con mayor frecuencia de los alelos de clase recupera en las pantallas. Además, con ayuda de la clonación con fines de microarrays probablemente será útil para otras categorías de alelos que disminuir la abundancia de transcripción, por ejemplo, la espontánea hif-1 (nu469) mutación. Estas mutaciones incluyen alteración de pre-mRNA splicing, mutaciones en los promotores, mutaciones frameshift, produciendo mutaciones y transcripciones que carecen de los codones de terminación [57 - 59].

¿Qué fracción de tonterías alelos están orientados de manera eficiente por la Dirección Nacional de Vigilancia maquinaria? En cada uno de los seis ejemplos que presentamos anteriormente, este es el caso, pero ¿con qué frecuencia absurdo eludir la degradación de las transcripciones por la Dirección Nacional de Vigilancia maquinaria? Las normas que rigen dicho sistema de reconocimiento de mRNAs mutantes se han descrito en la levadura, C. Elegans, y los mamíferos [16 - 18, 59 - 63]. La Dirección Nacional de Vigilancia maquinaria distingue de los codones de parada prematura natural deja de utilizar el exón-cruce complejos que se depositan en las fronteras exón-exón por el spliceosome. Detiene los que son mayores que 50-55 pares de bases antes de la última salida de exón complejos son reconocidos por la Dirección Nacional de Vigilancia como mecanismo prematuro y están orientados de manera eficiente para su destrucción [61, 64]. Estudios anteriores han demostrado que el 100% (n = 23), de C. Elegans tontería mutaciones son susceptibles de dicho sistema de vigilancia (medido ya sea por la abundancia de ARNm o por represión de los fenotipos mutantes por vía de las mutaciones NMD) [17]. De ellos, seis mutaciones (26%) se consideraron sólo parcialmente blanco de NMD. Sobre la base de estos ejemplos y los que se describen aquí, calculamos que el 75% -100% de los alelos en tonterías C. Elegans sería detectable muestran una disminución en los niveles de mRNA. Teniendo en cuenta estos tres factores (detección de los microarrays de genes, absurdo alelo frecuencia, la eficiencia y NMD), esperamos que con ayuda de la clonación con fines de microarrays para tener éxito en el 25% -30% de la posición clonings (suponiendo sólo un alelo por gen es hibridizada).

Los principales costos de la clonación posicional son los que se haya incurrido en el aislamiento, la fenotipificación, y genotipo de un número suficiente de recombinantes (es decir, informativo meioses) a trazar una mutación genética a un pequeño intervalo. Un típico clonación posicional requiere 2000-10000 informativo meioses. Nuestros resultados sugieren que los microarrays hibridaciones puede reducir significativamente el número de meioses necesarios para clonings posicional. En cinco de los seis casos, los microarrays de datos en relación con el vínculo cromosómicas eran suficientes datos para la identificación de genes. Por lo tanto, mientras esperamos que esta estrategia será útil en muchos sistemas genéticos, microarray con ayuda de la clonación se compromete a proporcionar el mayor valor en organismos como el ratón y el pez cebra, en donde la generación de los tiempos largos y grandes genomas hacer meióticas cartografía más tiempo y dinero. Además, con ayuda de la clonación microarray puede ser particularmente útil en los casos en que los fenotipos mutantes son más difíciles de evaluar, como los mutantes de comportamiento, o de forma incompleta o penetrantes complejo (es decir, multigenic) rasgos [65, 66]. Teniendo en cuenta el esfuerzo y las dificultades que meióticas en la cartografía y la relativa facilidad y rapidez de los microarrays hibridaciones, consideramos que esta estrategia basada en microarray proporciona beneficios significativos, a pesar de que tendrá éxito en sólo un subconjunto de los casos.

Microarrays puede ser utilizado para ayudar a la clonación de genes de enfermedades humanas? Un tercio de los genes humanos de la enfermedad se prevé están causadas por lesiones o mutaciones sin sentido que la disminución de la abundancia de transcripción [21, 22]. Por otra parte, absurdo mutante transcripciones codificadas por los genes de enfermedades como el BRCA1 y el factor nuclear de hepatocitos α 1 han demostrado ser efectivamente degradadas por NMD [67, 68]. Dada la enorme tiempo y los gastos que conlleva la cartografía de los genes en los seres humanos, la estrategia descrita aquí podría proporcionar una valiosa adición a la caja de herramientas de la genética humana.

Materiales y Métodos
Apoyo a la Información
Microarray de datos de expresión de Wild-Type,
(2 MB TDS)
Alineaciones a Probeset
Objetivo secuencias fueron descargados (
Http://www.affymetrix.com
) Y alineados a
UNC-43
CaMKII isoforma H. Dado que una mayoría de los genes en la
C. elegans
GeneChip son representados por un probeset,
UNC-43
Representa un atypica1 caso. Para explicar esto, es útil tener en cuenta la historia y el diseño de la
C. elegans
GeneChip (véase
Http://www.affymetrix.com/support/technical/datasheets/celegans_drosophila_datasheet.pdf
). Los objetivos de este fueron diseñados por GeneChip Affymetrix basado en más de 18.800 Sanger Center predijo transcripciones de diciembre de 2000 de la secuencia del genoma, así como 2.300 3 'EST agrupaciones y 300 GenBank mRNAs (módulo 121). A pesar de los esfuerzos para eliminar la redundancia, no hay una estricta uno-a-uno correspondencia entre el actual conjunto de los genes y la probesets sobre la GeneChip. Nuestro análisis indica que el 13% de los genes en el GeneChip son representados por más de una sonda. Aun así, después de haber
UNC-43
CaMKII representados por siete probesets es una situación poco habitual. Sin embargo, sólo dos de estas probesets (193459_s_at y 193463_s_at) son anotados como correspondiente a la
UNC-43
CaMKII ARNm según la transcripción de las anotaciones
C. elegans
Affymetrix GeneChip proporcionada por en el 28 de marzo de 2003, actualización (descargable en
Http://www.affymetrix.com
). Durante nuestro examen de los ocho candidatos probesets que mostraron disminución en la expresión y se cromosomas 4, hemos descubierto otros cinco que correspondían a probesets
UNC-43
CaMKII
.
Cuatro de estos probesets (172058_x_at, 175820_s_at, 175821_s_at, y 175824_s_at) se basan en las secuencias de GenBank, y uno (187759_s_at) se basó en un marco de lectura abierta predijo, Y43C5B.1, que fue parte del genoma de diciembre de 2000, pero ha Ya que se ha demostrado que corresponden a los 5 'de la UTR
UNC-43
CaMKII. Estos adicionales probesets proporcionado un control de serendipidad ciego, ya que no eran conscientes de su existencia hasta que apareció en nuestra lista de candidatos a partir de la hibridación. Hay también otra (octavo) probeset (173423_at) describe en la anotación como Affymetrix correspondiente a
UNC-43
CaMKII. Sin embargo, sobre la base del actual modelo de genes, 173423_at alinea a los intrones entre los exones 11 y 12. Como era de esperar, esta muestra no detectables probeset expresión y, por tanto, no se consideró en el análisis de la
UNC-43
CaMKII mutante.
El ajuste de los TOM-1 a Rat Humanos y Tomosyn
Las secuencias de humano y de ratón tomosyn fueron descargados de Ensembl (
Http://www.ensembl.org
). La alineación de secuencias múltiples se realizó mediante T-Café (
Http://www.ch.embnet.org/software/TCoffee.html
). Alineación de salida se produjo utilizando GeneDoc (
Http://www.psc.edu/biomed/genedoc
).
Lista de Missense y Tonterías Alelos
(51 KB PDF)

Damos las gracias a K. Vranizan de estadística y de asesoramiento en materia de programación; T. Rector Affymetrix para la preparación de muestras y de hibridaciones; J. Rine, D. Altshuler, V. Mootha, S. McCarroll, C. Murphy y útil para los debates; T. Velocidad de estadística Entrada; p. Juo, Secador de L., J. Dittman, I. Ruvinsky y de la lectura de este manuscrito; otros miembros de la Kaplan y Ruvkun laboratorios de sugerencias; K. Scott para fomentar la prestación de un fantástico laboratorio para MD en Berkeley, y Gregoire Para su sustento. Algunas de las cepas descritas aquí fueron proporcionados por el C. Elegans Genetic Stock Center. Esta labor fue apoyada con una donación de los Institutos Nacionales de Salud a JK (GM54728). MD fue apoyada por un Howard Hughes Medical Institute de becas predoctorales.