Journal of Carcinogenesis, 2005; 4: 13-13 (más artículos en esta revista)

DPF3 en polimorfismos genéticos asociados con el riesgo de cáncer de mama y metástasis ganglionares

BioMed Central
Carolyn R Hoyal (cwrightson@sequenom.com) [1], Stefan Kammerer (skammerer@sequenom.com) [1], Richard Roth B (rroth@neurocrine.com) [1], Richard Reneland (rikard.reneland @ neopharma. Se) [1], George Marnellos (gmarnellos@sequenom.com) [1], Marion Kiechle (marion.kiechle @ lrz.tu-muenchen.de) [2], Ulrike Schwarz-Boeger (schwarz-boeger@lrz.tu - Muenchen.de) [2], Lyn R Griffiths (l.griffiths @ mailbox.gu.edu.au) [3], Florian Ebner (ebner.florian @ web.de) [4], Joachim Rehbock (dr.rehbock @ Web.de) [4], Mateo R Nelson (matthew.r.nelson @ gsk.com) [1], Andreas Braun (abraun@sequenom.com) [1]
[1] Sequenom, Inc, de San Diego, California, EE.UU.
[2] Departamento de Obstetricia y Ginecología, Universidad Técnica de Munich, Alemania
[3] Centro de Investigación Genómica de la Facultad de Ciencias de la Salud, Griffith University Gold Coast, Australia
[4] I. Frauenklinik, Klinikum Innenstadt, de la Universidad de Munich, Alemania

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

Varios estudios han identificado raras variaciones genéticas responsables de muchos casos de cáncer de mama familiar, pero su contribución al total de la incidencia de cáncer de mama es relativamente pequeño. Más común de las variaciones genéticas de baja penetrancia se han postulado a cuenta de una mayor proporción de la población de riesgo de cáncer de mama.

Métodos y resultados

En un esfuerzo por identificar los genes que influyen en la no familiar, el riesgo de cáncer de mama, hemos probado más de 25000 polimorfismos de nucleótido único (SNP), ubicado dentro de aproximadamente 14000 genes en un gran estudio de casos y controles en alemán 254 mujeres con cáncer de mama y 268-edad Coincide con mujeres sin enfermedad maligna. Hemos identificado un marcador en el cromosoma 14q24.3-q31.1 que fue marginalmente asociados a la condición de cáncer de mama (OR = 1,5, P = 0,07). Genotipos de este SNP también se asoció significativamente con los indicadores de la severidad del cáncer de mama, incluida la presencia de metástasis ganglionares (P = 0,006) y la edad más temprana de inicio (P = 0,01). La asociación con cáncer de mama condición se repitió en dos muestras independientes (OR = 1,35, P = 0,05). Alta densidad sindical multa cartografía demostró que la asociación abarca alrededor de 80 kb del gen dedo de zinc-DPF3 (también conocido como CERD4). Un SNP en el intrón 1, se encuentra a ser más fuertemente asociados con el cáncer de mama en los tres colecciones de muestras (OR = 1,6, P = 0,003), así como con el aumento de metástasis ganglionares (P = 0,01) y el tamaño tumoral (P = 0,01 ).

Conclusión

Polimorfismos en el 5 'de la región DPF3 se asociaron con mayor riesgo de desarrollo de cáncer de mama, metástasis ganglionares, edad de inicio, y el tamaño tumoral en la mujer de ascendencia europea. Este gran escala asociación estudio sugiere que la variación genética en DPF3 contribuye a la susceptibilidad al cáncer de mama y la gravedad.

Antecedentes

Etiología del cáncer de mama es un proceso complejo, con la participación de los genes en las múltiples etapas de la carcinogénesis, de las iniciales del ciclo celular a una disregulación potencial metastásico [1, 2]. Aproximadamente el diez por ciento de los casos de cáncer de mama ocurren en familias en las que segrega la enfermedad en un mendelianos moda. BRCA1 y BRCA2 han sido identificados para ser responsable de una proporción importante de familiares de cáncer de mama [3, 4]. Otros genes que participan en el mismo ADN de doble filamento romper la reparación de la vía, TP53 [5], [6] ATM, y PTEN [7], se sabe también de contribuir a los casos familiares, pero son más raros. Esa alta penetrancia línea germinal mutaciones son responsables de menos del 10% de todos los casos de cáncer de mama. Sin embargo, la variación genética se estima que aportan aproximadamente el 25% de la población de riesgo de cáncer de mama, probablemente explica por un gran número de común aún sin descubrir, alelos de baja penetrancia [8, 9]. Es posible que la baja penetrancia estos marcadores pueden ser de utilidad en el desarrollo de prácticas de diagnóstico y pronóstico indicadores de mayor utilidad en la población general.

Muchos de los genes candidatos se han realizado estudios para identificar los genes que contribuyen al riesgo de cáncer de mama esporádico [10]. Lamentablemente, estos esfuerzos han sido en gran medida infructuosas. Algunos de los candidatos más informado incluir variaciones en el metabolismo de las enzimas, como el citocromo P-450, la familia [11], la N-acetyltransferases [12], y la glutathion-S-transferasas [13]. El candidato susceptibilidad alelo 1110delC * CHEK2 se mostró a conferir un mayor riesgo de cáncer de mama [14, 15], que fue más recientemente el apoyo de los resultados obtenidos en un gran estudio de casos y controles [16]. En un esfuerzo para identificar nuevos genes implicados en la susceptibilidad del cáncer de mama, hemos llevado a cabo a gran escala, el estudio de casos y controles utilizando más de 25000 SNPs situados dentro de aproximadamente 14000 genes. Hemos informado anteriormente las conclusiones sobre el cáncer de mama dos candidatos identificados en este estudio [17, 18]. En este documento se describen las variaciones en el intrón 1 del DPF3 en el cromosoma 14q24.3-q31.1 que están asociados con un mayor riesgo de cáncer de mama, metástasis ganglionares, a principios de la edad de diagnóstico, y el tamaño tumoral.

Métodos
Los temas y el diseño del estudio

Los participantes en la asociación a gran escala de estudio (denominado descubrimiento de la muestra) fueron reclutados entre los pacientes que asisten a la Frauenklinik Innenstadt, de la Universidad de Munich, Alemania, y estuvo compuesta por 254 casos de cáncer de mama. En el momento de la evaluación, 94 casos (37%) está representada la condición de los ganglios linfáticos positivos, y 18 casos (7%) tenían metástasis a distancia conocida. Veinte y siete casos (11%), informaron que por lo menos uno de primer o segundo grado con cáncer de mama. La edad media de diagnóstico fue de 56 años (rango = 23-87 años). Durante el mismo período, 268 controles con una mediana de edad de 57 años (rango = 17-88 años) fueron reclutados de los pacientes con enfermedad benigna ser visto en la clínica. Informó de los controles con una historia familiar de cáncer de mama o de ovario fueron excluidos del estudio actual. Ambos padres de estudio de cada participante, se comunicaron a ser de ascendencia alemana.

Los participantes en la muestra son la réplica alemana de contratación del Departamento de Obstetricia y Ginecología, Universidad Técnica de Munich, y constaba de 188 casos y 150 controles. La mayoría de los casos de cáncer de mama fueron reclutados en el pre-operatorio, las visitas, los controles y la hembra fueron contratados de personas sanas o de pacientes con diagnóstico no malignos. La mediana de edad de diagnóstico de los casos fue de 59 años (rango = 22-87 años) y la edad media de los controles fue 50 años (rango = 19-91 años). Dos participantes informaron uno de los padres de origen no alemán, el origen de Europa oriental, de otro a ambos padres eran de origen alemán.

Los participantes en la muestra de replicación de Australia fueron reclutados desde el Departamento de Patología del Hospital Costa de Oro o por el Centro de Investigación Genómica, Southport. La colección incluyó 180 casos de cáncer de mama con una mediana de edad de diagnóstico de 50 años (rango = 24-74 años). Los controles consistieron de 180 voluntarios sanos sin historia familiar de cáncer de contratación a través del Centro de Investigación de la Genómica. Los controles fueron emparejados por edad individual de los casos (± 5 años) con el promedio de edad de los controles a los 60 años (rango = 28-94 años).

Todos los sujetos que participan en nuestros estudios firmó un consentimiento informado y la institucional de los comités de ética de las instituciones participantes aprobó los protocolos experimentales.

SNP marcadores, genotipificación, y Resequencing

Un conjunto de SNPs 25494 que abarca el genoma humano fue seleccionado de una colección más grande de 125799 validada experimentalmente polimorfismos [19]. Este conjunto incluye SNPs que se encuentran en regiones codificantes de genes (dentro de los 10 kb de 13735 genes anotado en Entrez Gene), tienen un menor alelo frecuencias superiores a 0,02 (95% tienen frecuencias mayores que 0,1), y una mediana entre el espaciamiento de marcador 40 KB. SNP anotación se basó en la base de datos NCBI dbSNP, refSNP construir 118 [20]. Genómica anotación se basó en NCBI Genoma Build 34. Gene anotación se basó en Entrez Gene genes NCBI para que se posiciones sobre la prestación de Mapview sitio FTP [21].

Piscinas de ADN se formaron por la combinación de equimolar cantidades de cada muestra, tal como se describe en otro lugar [22, 23]. Para llevarse a cabo ensayos de SNP agrupados en el ADN, 25 ng de ADN se utilizó. Todos los PCR y MassEXTEND ™ reacciones se realizan en condiciones normales [23]. Alelo frecuencia relativa de las estimaciones se obtuvieron a partir de cálculos basados en el área bajo el pico de la espectrometría de masa por analizar las mediciones de cuatro alícuotas que se describen en otras partes [23]. El mismo procedimiento se utilizó para cada genotipo excepto 2,5 ng de DNA, y sólo se utilizó un detector de espectrometría de masa de medición se tomó. Primers utilizados genotipo se presentan en la Tabla 1. Secuenciación se realizó bajo condiciones normales de MassCLEAVE ™ [24] usando 5 ng de DNA. Por exón 1, la amplificación de los primers utilizados fueron 5'-AACGGCAGAGCACATGTAGTAA-3 'y 5'-ATATTGAAACCACGCGGAATA-3'. Por exón 2, la amplificación de los primers utilizados fueron 5'-CTGGGTGTGTTTCAGTCTTCC-3 'y 5'-CTGGTTTCCCAGACAAGCTG-3'.

Métodos estadísticos

Pruebas de asociación entre la enfermedad y la condición de cada SNP usando mezcla de ADN se llevaron a cabo de manera similar como se explica en otra parte [25]. Fuentes de variación de medición incluyó la formación de la piscina, PCR / masa extensión, y el chip de medición. Cuando tres o más repetir las mediciones de frecuencia de un alelo se dispone dentro de un modelo de nivel, la diferencia correspondiente componente se estima a partir de los datos. De lo contrario, los siguientes promedios históricos de laboratorio se utilizaron: la formación de la piscina = 5,0 × 10 -5, PCR / masa extensión = 1,7 × 10 -4, y el chip de medición = 1,0 × 10 -4. Pruebas de asociación utilizando genotipos individuales se llevaron a cabo mediante una prueba de chi-cuadrado de heterogeneidad sobre la base de frecuencias de los alelos y genotipo. Selección de las pruebas de asociación de tablas de contingencia con raras o faltan las células se llevaron a cabo utilizando el test exacto de Fisher. El DerSimonian-Laird efectos aleatorios meta-método de análisis [26] fue utilizado para el análisis de muestras de replicación a prueba de la coherencia de la asociación, permitiendo al mismo tiempo las frecuencias de los alelos difieren entre los distintos grupos. Todas las pruebas de la participación de frecuencias de los alelos sólo muestras de replicación son unilaterales, lo que confirma el efecto observado en el descubrimiento muestra. P-valores se obtuvieron utilizando el registro de las probabilidades de cada uno y su nivel de contraste errores. Múltiples enfoques se exploró en un esfuerzo por identificar los haplotipos que demuestra una asociación más fuerte con el estado de la enfermedad que solo los sitios. Estos incluyen los análisis de seis SNP haplotipos y subconjuntos del mismo utilizando la teoría coalescente basada FASE v2.0 [27] y el método de puntuación que se basa en el algoritmo EM [28]. No se hizo ningún intento de corregir P-valores de múltiples ensayos. Más bien, P-se proporcionan valores para comparar la fuerza relativa de la asociación de múltiples dependientes (por ejemplo, dentro de las muestras SNPs) e independientes (por ejemplo, entre las muestras SNPs) las fuentes de información. Valores de P inferior a 0,05 se conocen como estadísticamente significativa.

Resultados

SNP marcadores asociados a la condición de cáncer de mama se identificaron utilizando un sistema en tres etapas. En la primera fase, las mezclas de caso y control de las muestras fueron sometidas a una sola reacción PCR y la cartilla de extensión para cada uno de los ensayos de SNP 25494. Cuatro alícuotas de los productos de extensión se midieron. La relativa alelo se compararon las frecuencias, y 1619 SNPs (~ 5%) con la mayoría de las asociaciones estadísticamente significativas fueron seleccionados para ser probados en la segunda fase. En esta fase, frecuencias de los alelos se midieron en tres PCR y reacciones utilizando prórroga primer caso y de control de las piscinas, y en comparación como en la primera fase. Las 74 más importantes SNPs (~ 5%) de la segunda fase se seleccionaron para cada genotipo de las muestras de que comprendía el caso y el control de las piscinas (Figura 1].

Estudios de casos y controles que emplean a decenas de miles de SNPs del genoma en un enfoque liberal utilizando criterios de selección se espera produzcan un alto porcentaje de falsos positivos asociaciones. Para determinar si la asociación observada era un verdadero efecto genético, los 74 SNPs posteriormente fueron genotipados en dos casos adicionales de cáncer de mama-el control de las colecciones. Después de revisar los resultados de las tres muestras, un resultado importante fue observada por un C-G SNP, rs1990440, en el intrón 1 de la DPF3 gen en el cromosoma 14q24.3-q31.1. La frecuencia del alelo G en el descubrimiento de control de los sujetos fue de 0,08, similar a la media NCBI informó alelo frecuencia [29]. La frecuencia se ha incrementado un 4% en los casos. El cuadro 2 muestra la asociación de rs1990440 con cáncer de mama en el descubrimiento y dos colecciones de replicación. Aunque esta es sólo marginalmente SNP asociados en el descubrimiento de muestra alemán (OR = 1,49, P = 0,069), el alemán muestra de replicación (OR = 1,33, P = 0,29), de Australia y muestra de replicación (OR = 1,36, P = 0.22), Los efectos estimados son coherentes y el análisis de las tres muestras dio lugar a un combinado de significación de P = 0.016 (OR = 1,40) y una significación de P = 0,054 (OR = 1,35) en la replicación sólo muestras.

Para multa mapa de la región asociación, probamos otros 394 SNPs DPF3 situado en el descubrimiento de genes utilizando el caso y el control de las piscinas (Figura 2]. Se observó que la contigua región de la más alta importancia extendió unos 65 kb, que abarca los 3 'de la región intrón 1 con pruebas adicionales para una región de 15 kb que incluye el exón 2 y una parte del intrón 2. Utilizando un ensayo de división y espectrometría de masas [24], nos re-secuenciado exones 1 y 2 con sus secuencias de acompañamiento intrón en seis casos de cáncer de mama y cinco de los controles para determinar si alguna otra SNPs con más fuerte asociación con la enfermedad o aparente relevancia funcional podría ser descubierto. Se identificó sólo un SNP en el intrón 1, que no fue anotado en público (datos no presentados) y se encontró que tienen un promedio de frecuencia alelo que no difieren significativamente entre el caso y el control de las piscinas. No descrita previamente SNPs residir en el exón 1 o 2, y no se descubrieron nuevos SNPs por nuestros esfuerzos. Hemos seleccionado cinco SNPs alelo con frecuencias que varían considerablemente entre los casos y controles piscinas, distanciado unos 20 kb aparte, genotipo en el descubrimiento y la reproducción de muestras y de análisis para seguir (Tabla 1, 2]. El SNPs más fuertemente asociados en el descubrimiento y la reproducción de muestras, rs4307892, rs4899445 y rs4378563, fueron el acompañamiento original marcador SNP y que se encontraban en fuerte vinculación desequilibrio (todos | D '|> 0,9, r 2> 0,7). De los nuevos SNPs genotipo, rs4899445 demostrado el más consistente las diferencias entre los casos y controles, con un poco más grande efecto en el descubrimiento muestra (OR = 1,56, P = 0,045) y un efecto sustancialmente más consistente en el alemán (OR = 1,72, P = 0,094) y Australia (OR = 1,47, P = 0,16) muestras de replicación (Tabla 2]. El efecto combinado de la muestra de replicación era considerable en el nivel de 0,05 (OR = 1,56, P = 0,016) y de igual a la estimación de las tres muestras (OR = 1,56, P = 0,003). Los análisis de haplotipos que consta de subconjuntos de los seis genotipo SNPs no revelaron ningún haplotipo más fuerte asociación con los distintos SNPs (datos no presentados).

Los datos recogidos sobre los pacientes, en el descubrimiento alemán colección incluía información sobre la historia familiar de cáncer de mama, la edad de inicio, y la gravedad de la enfermedad. Además los análisis revelaron asociaciones entre los marcadores SNP inicial, rs1990440, y múltiples rasgos indicativos de cáncer de agresividad (Cuadro 3], incluida la disminución de la edad media de diagnóstico de cáncer de mama (P = 0,01) y metástasis ganglionares (P = 0,006). Asociaciones de órganos con metástasis (P = 0,35) y el tamaño tumoral (P = 0,17) no fueron estadísticamente significativos. El SNP más fuertemente asociados con el riesgo de cáncer de mama en las tres muestras, rs4899445, también se encontró que se asociaron significativamente con metástasis ganglionares (P = 0,008), y el aumento de tamaño tumoral (P = 0,007). Aunque no es estadísticamente significativa, el riesgo de transporte de alelo tendían a ser más jóvenes en la edad de diagnóstico (P = 0,35) y de tener una proporción más elevada de la historia familiar de cáncer de mama (P = 0.13).

Discusión

En este sentido, las variantes en el informe DPF3, identificado a través de una gran escala, el genoma en toda la asociación de estudio, que se asocian con un mayor riesgo de cáncer de mama, metástasis a los ganglios linfáticos, disminución de la edad de inicio, y el aumento de tamaño del tumor. Nuestro estudio sugiere que las personas que llevan uno o más alelos de la G-C-G de la variante rs1990440 nominalmente tienen un aumento significativo en el riesgo de cáncer de mama en comparación con los homocigotos CC. Esta asociación fue fundamentada en dos colecciones independientes de Alemania y Australia. Bellas cartografía reducido asociación de la región a unos 80 kb, que abarcan la mayoría de intrón 1, el exón 2 y una parte del intrón 2. Con posterioridad genotipado de SNPs adicional identificado un intrón 1 SNP, rs4899445, que fue más consistente asociado con el cáncer de mama en todo el estado de tres muestras (OR = 1,56, P = 0,003).

El marcador inicial en DPF3 fue uno de 74 SNPs identificados a partir de un gran estudio de asociación. El efecto estimado de este marcador es relativamente pequeño y habría sido descontados efectos similares no habían sido observadas en las dos muestras de replicación. Aun así, la significación estadística observada en las muestras de replicación sola para el marcador SNP (rs1990440; P = 0,054) o el más significativo SNP identificado cerca (rs4899445; P = 0,016) no tiene capacidad para un experimento a escala tasa de error de tipo I De 0,05 para corregir después de múltiples ensayos. Dado que las regiones que el 74 de seguimiento en la reproducción en gran medida independientes fueron en un nivel de población, un conservador de Bonferroni corrección exigiría P-valores a menos de 0,0006 para el logro de los experimentos en toda la tasa de falsos positivos. En efecto, la validación de estos resultados requiere una mayor recogida de muestras. Si fuéramos a asumir que el verdadero efecto es estimado por las muestras de replicación (OR = 1,5), con una población alelo frecuencia de 6%, el tamaño de muestra global del orden de los 1000 casos y controles será necesario contar con el poder suficiente para fundamentar El efecto de esta región sobre el riesgo de cáncer de mama.

DPF3 codifica una proteína de zinc dedo en el cromosoma 14q24.3-q31.1. Dedos de zinc-consisten en grupos de cysteines o cysteines y coordinadamente histidines que obligará a los iones de zinc. DPF3 es un gen altamente conservado homólogas a d4 miembros de la familia de los dedos de zinc. Anterior caracterización de los genes DPF3 demostrado que si bien es similar a DPF1 (neuro-d4) y DPF2 (ubi-d4/REQ), de los intrones DPF3 son mucho mayores [30]. Este hecho, junto con la estrecha similitud en las secuencias de aminoácidos de las proteínas codificadas, ha llevado a la sugerencia de que el aumento de tamaño del intrón DPF3 puede resultar en cambios en la regulación de la expresión génica DPF3. DPF3 tiene un dominio y C2H2 PHD un dominio, lo que sugiere un papel directo en la unión del ADN y en el montaje de grandes complejos de proteínas. Estudios funcionales de la familia de genes d4 han sugerido que sus miembros participen en la regulación de la muerte celular programada mieloide través de la inducción de la apoptosis [31]. Más recientemente, DPF3 ha sido identificado por el análisis de microarrays como un factor de transcripción que pueden desempeñar un papel en la patogénesis de la enfermedad de Alzheimer incipiente [32]. Disposición del público la información sobre la expresión génica DPF3 se limita, sin embargo se ha demostrado entre otros que se expresaron en los dos normales y cancerosas de mama líneas de células y tejidos [33].

Si bien el estudio actual sugiere que las variantes en DPF3 intrón 1 están asociados con un mayor riesgo de cáncer de mama, el posible mecanismo por el que estas variantes predisponen al cáncer de mama son puramente especulativas. La susceptibilidad alelo podría estar asociado con una disminución de la actividad DPF3 a través de la baja regulación de los niveles de transcripción o por ejercer un impacto negativo sobre el RNA de empalme. Esto, a su vez, puede dar lugar a una reducción en la capacidad de DPF3 para inducir la apoptosis en el nivel celular. La apoptosis es un mecanismo fisiológico de la muerte de la célula que juega un papel importante en muchas enfermedades, incluyendo el cáncer [34]. Desequilibrio entre los pro-apoptóticos y anti-apoptóticos proteínas resultantes alterado en la apoptosis puede resultar en el desarrollo de tumores o pobre respuesta a la terapia adyuvante. La apoptosis requiere de la síntesis de novo de ARNm y proteínas, y alteraciones de DPF3 puede llevar a una disminución de la respuesta a la señalización de apoptosis. Estudios experimentales adicionales serán necesarios para esclarecer con precisión el papel de DPF3 en la etiología del cáncer de mama y la progresión.

Conclusión

Nuestro estudio en mujeres de ascendencia europea identificaron asociaciones significativas entre DPF3 polimorfismos en la susceptibilidad y cáncer de mama, metástasis ganglionares, a principios de la edad de inicio, y el tamaño tumoral. Mientras que tres muestras independientes de la actual apoyo al estudio observó las asociaciones, se necesitan estudios adicionales para verificar los resultados y para caracterizar mejor los genes con el fin de entender plenamente la función de DPF3 en la etiología y la progresión del cáncer de mama. Estos y otros similares aún sin descubrir las pequeñas variaciones de efecto puede ser útil en la evaluación de cada uno de los riesgos de cáncer de mama y en las decisiones en torno a la atención de los pacientes.

Contribuciones de los autores

CRH redactado el manuscrito, participó en el desarrollo de la SNP marcador conjunto y secuencia, así como en el diseño del estudio y el análisis de datos. SK participó en el desarrollo de la SNP marcador conjunto, bajo la supervisión de los aspectos operacionales del estudio, y ayudó a redactar el manuscrito. RBR estudio fue jefe de proyecto y participó en el análisis de datos. RR participó en el diseño del estudio. GM participado en el desarrollo de la SNP marcador conjunto. MK y USB diseñado y recogido la muestra de replicación alemán. LRG diseñado y recogido la muestra de replicación de Australia. FE y JR diseñado y recogido el alemán descubrimiento muestra. MRN participó en el diseño del estudio y los análisis estadísticos realizados. AB participó en el diseño del estudio y tuvo la responsabilidad global científica para el estudio. Todos los autores leído y aprobado el manuscrito final.

Agradecimientos

Los autores desean agradecer a los equipos de laboratorio por sus continuos esfuerzos, y los pacientes y el control de los individuos por su participación en el estudio.