Journal of Translational Medicine, 2005; 3: 32-32 (más artículos en esta revista)

Predictores de los cánceres de mama primarios de respuesta a preoperatorio Epirubicin / Ciclofosfamida quimioterapia basada en la traducción de los datos en los microarrays clínicamente útil predictivo firmas

BioMed Central
Olga Modlich (omodlich@onkochemie.uni-duesseldorf.de) [1], Hans-Bernd Prisack (hprisack@onkochemie.uni-duesseldorf.de) [1], Marc Munnes (marc.munnes @ bayerhealthcare.com) [2] , Werner Audretsch (brustzentrum@kliniken-duesseldorf.de) [3], Hans Bojar (bojar@uni-duesseldorf.de) [1]
[1] Instituto de la Química de Oncología de la Universidad de Düsseldorf, Düsseldorf, Alemania
[2] Bayer Healthcare AG, de diagnóstico de Investigaciones Alemania, Leverkusen, Alemania
[3] Centro Interdisciplinario de mama IBC, City Hospital, Düsseldorf, Alemania

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

Nuestro objetivo fue identificar los genes firmas predictivo de la respuesta a la quimioterapia sistémica preoperatoria (PST) con epirrubicina / ciclofosfamida (CE) en pacientes con cáncer de mama primario.

Métodos

Se obtuvieron biopsias de aguja de pre-tratamiento de 83 pacientes con cáncer de mama y el ARNm se perfiladas sobre Affymetrix HG-U133A arrays. Respuesta varió de silicona, confirmó la remisión completa (pCR), a la remisión parcial (PR), a estable o progresión de la enfermedad, "No No Cambio" Change "(NC). Uno de los principales análisis se realizó en muestras de tejido de mama de 56 pacientes normales y 5 individuos sanos como de capacitación para la cohorte marcador predictivo de identificación. Gene firmas la identificación de las personas con más probabilidades de responder completamente a PST-CE se extrajeron mediante la combinación de varios métodos estadísticos y criterios de filtrado. Con el fin de optimizar el pronóstico de los tumores no respondieron la prueba t de Student y test de Wilcoxon se aplica también. Un independiente cohorte de 27 pacientes se utilizó para impugnar la predicción de firmas. K-Un algoritmo vecino más cercano, así como dos independientes lineal parcial determinante el análisis de los mínimos cuadrados (PLS-DA) modelos basados en la formación de cohorte fueron seleccionados para la clasificación de las muestras de ensayo. El promedio de especificidad de estas predicciones es mayor que el 74% de los pCR, 100% para PR y mayor que el 62% de NC. Los tres modelos de clasificación podría identificar pCR todos los casos.

Resultados

La expresión diferencial de 59 genes en la formación y la prueba de cohortes demostrado capacidad de predecir la respuesta al tratamiento PST-CE. Sobre la base de la formación de cohorte un clasificador fue construido a raíz de un árbol de decisión.

En primer lugar, un perfil transcripcional capaz de distinguir canceroso de tejido normal fue identificado. A continuación, un "resultado favorable firma" (31 genes), y un "mal resultado la firma" (26 genes) se extrajeron de las firmas de cáncer específico. Esta aplicación gradual podría predecir pCR y distinguir entre NC y PR en una serie posterior de los pacientes. PLS-DA Ambos modelos se aplicaron a discriminar las tres clases de respuesta en un solo paso.

Conclusión

En este estudio se identificaron las firmas capaces de predecir el resultado clínico en un conjunto independiente de cáncer de mama primario pacientes sometidos PST-CE.

Introducción

El cáncer de mama es la neoplasia más común de la mujer que se diagnostica en aproximadamente 211000 mujeres cada año en los Estados Unidos. A pesar de anteriores detección y tratamiento mejorado, sigue siendo la segunda causa de muerte por cáncer en los Estados Unidos y en otros países desarrollados [1]. El fondo genético de los pacientes y el tumor de anomalías genéticas y epigenéticas crear, en combinación, molecularmente diferentes subtipos derivados de distintos tipos de células en el epitelio ductal [2, 3]. Esta complejidad genética subyacente a la heterogeneidad clínica de cáncer de mama limitar la selección racional de tratamiento adaptado a cada paciente y tumor de características.

Terapéutica estándar de toma de decisiones (es decir., NIH; consenso de St Gallen) clinicopathological dependen de varios factores como la edad del paciente, estado del tumor, grado, tamaño, estado ganglionar, así como la hormona, y el crecimiento del receptor. El único análisis de marcadores moleculares como el ki-67 y ERBB2 también puede contribuir a la toma de decisiones terapéuticas. Aunque todos estos factores han sido correlacionada con la supervivencia de los pacientes en general, el mismo pronóstico perfil a menudo resultados disímiles en los resultados clínicos en los pacientes individuales. Así, los factores pronósticos convencionales no proporcionan la información para evaluar la heterogeneidad de la enfermedad y para hacer el tratamiento más eficaz para cada paciente.

Uno de los problemas actuales que enfrenta la terapia del cáncer es el exceso de tratamiento de los pacientes con quimioterapia, que se asocia a toxicidad severa y el aumento de los gastos de asistencia sanitaria sin claro beneficio en la supervivencia durante los controles no tratados [4, 5]. Debido a la falta de marcadores predictivos (es decir, ER, Her2/neu), casi todos los pacientes reciben rutinariamente en el tratamiento estándar sombría pesar de los cambios derivados de cualquiera de las prestaciones. Por lo tanto, la identificación de marcadores moleculares predictivos de los pacientes la respuesta al tratamiento se está convirtiendo en un foco central de la investigación "traslacional".

Micro ofrece la tecnología para conocer la expresión simultánea de miles de genes de la prestación global de la información sobre el programa de transcripción específicos relacionados con el tejido celular o condiciones. Esto proporciona un alto rendimiento herramienta de cribado para la identificación de patrones moleculares de las células cancerosas, posiblemente relacionados con su sensibilidad al tratamiento [6 - 9]. Esta estrategia dio lugar a una de las contribuciones más allá de la disección características histopatológicas los aspectos moleculares de los cánceres de mama, su asociación con la propagación ganglionar linfático-, metastatization y la supervivencia general.

Un importante y hasta ahora pocas veces explorado la utilización de la tecnología de micro array es la identificación de las firmas de predicción de la respuesta a la quimioterapia. Para obtener una correlación clara entre el éxito y el quimioterápicos pre tratamiento la expresión de los genes necesarios para que se basan en un modelo en que la quimioterapia se administra antes de la resección quirúrgica de modo que sus resultados pueden ser evaluados. Además de los más comunes postoperatorio (adyuvante), la quimioterapia, la terapia sistémica preoperatoria (PST), se ha propuesto recientemente para las fases iniciales de cáncer de mama. PST, utiliza fármacos citotóxicos como la primera modalidad de tratamiento que permitan el seguimiento en vivo de la respuesta terapéutica de un tumor primario durante un determinado período de tiempo (por ej., 4 meses). PST se ofrece preoperatoriamente a los pacientes con cualquiera de las dos grandes cánceres de mama inoperables o a los pacientes interesados en la conservación de la cirugía de mama [10 - 16]. PST en general no ofrece una ventaja en la supervivencia durante el tratamiento adyuvante estándar, pero sí identificar a los pacientes (hasta 20%) con tumores de reaccionar con una remisión completa de las drogas [17, 18]. La remisión completa del tumor, como se ha confirmado por examen patológico, es a menudo asociados con el aumento de la supervivencia libre de enfermedad [19 - 22]. Además, PST puede reducir la tasa de crecimiento de micrometástasis distante residual en comparación con la terapia adyuvante clásica [17].

Por la predicción de que subconjunto de los tumores pueden responder a PST transcripcional de perfiles de pre-tratamiento de muestras podría representar una herramienta de gran alcance para la selección de los pacientes.

Pacientes, materiales y métodos
Los pacientes

Este estudio se realizó en colaboración con el Instituto de Oncología de la Química de la Universidad de Düsseldorf, Alemania, y Bayer Healthcare AG, de diagnóstico de la Investigación, Leverkusen, Alemania. Todos los pacientes fueron reclutados en el Centro Interdisciplinario de mama IBC, Hospital de la ciudad de Düsseldorf. Los pacientes firmaron un consentimiento informado antes de cualquier procedimiento. Estudio de los criterios de elegibilidad exige que los participantes presentaron no tratados previamente, con cáncer de mama primario a ser tratados preoperatoriamente.

Las muestras de carcinomas de mama primario se recolectaron entre mayo de 1999 y marzo de 2003 de los pacientes sometidos a tratamiento con epirubicine PST / ciclofosfamida (CE). Dado que, en varios casos, el tratamiento se produjeron modificaciones o patológicas plena confirmación de la respuesta de status no fue concluyente, no todas las muestras fueron estudiadas. Calidad de las muestras relacionadas con demoras en la tramitación también limita el número de muestras estudiadas. Al final, un total de 56 muestras tumorales se identificaron comparables de los grupos de tratamiento y fueron estudiados por marcador descubrimiento junto con cinco muestras de mama normales extirpados de pacientes con patología benigna. Además, muestras tumorales retirado de 27 pacientes tratados con CE basado PST entre diciembre de 2002 y septiembre de 2003 fueron analizados en una segunda cohorte de validación independiente. CE consistía en epirrubicina 90 mg m 2 por día 1 en un breve infusión iv, y ciclofosfamida 600 mg m 2 por día 1 en un breve infusión iv. Cuatro ciclos de la CE Se administraron 14 días de separación. Algunos pacientes recibieron, además, Tamoxifen, Femara o rara vez Zoladex para 4-5 semanas después de la CE y por supuesto antes de la cirugía. Todos tumor, se recogieron muestras de biopsias de aguja como tumores primarios antes de cualquier tratamiento. Las biopsias fueron obtenidas bajo anestesia local usando Bard ® MAGNUM ™ Biopsia Instrumento (CR Bard, Inc, Covington, EE.UU.) con Bard ® Magnum biopsia de agujas (BIP GmbH, Tuerkenfeld, Alemania) siguiente guía ecográfica. Se recogieron muestras de rutina siguientes condiciones para diagnóstico patológico después de la junta de examen de las directrices institucionales. Patológica examen se llevó a cabo para todas las muestras tumorales por el mismo patólogo en el Centro Interdisciplinario de mama IBC. El resto de las muestras fueron congeladas-flash. Después de PST, todos los pacientes fueron sometidos a una radical mastectomía o una tumorectomía y disección de los ganglios axilares, a discreción del tratamiento de la mama cirujano. Se administró quimioterapia postoperatoria a discreción del médico oncólogo. De mama o pared torácica irradiación fue administrado en pacientes seleccionados. Además, todas las mujeres con tumores ER-positivos se inició el tamoxifeno terapia. Una lista detallada de todas las muestras y los datos clínicos se presentan en las tablas 1 y 2 (véase también archivos adicionales 1 y 2]. Además, cinco de mama normal mammoplasties reducción de las muestras se analizaron.

Inmunohistoquímica (IHC)

Hematoxilina / eosina-manchado secciones de tumor especímenes fueron examinados para evaluar las cantidades relativas de las células tumorales, benignas epitelio, estroma, y los linfocitos. Estándar de los parámetros clínicos, como la α-receptor de estrógeno (RE), receptor de progesterona (PgR), marcador de proliferación (ki-67), el gen supresor tumoral p53, Bcl2 regulador de la apoptosis, protooncogen cerbB2/HER2neu, receptor del factor de crecimiento epidérmico (EGFR) Evaluada de acuerdo a la rutina de bioseguridad y / o métodos inmunohistoquímicos.

Tinción inmunohistoquímica se realizó el 5 - μ m secciones de parafina. Secciones se deparaffinized en xileno y re-hidratados. Epítopo recuperación fue realizada por la inducción de calor en Meta Retrival Solución pH6.1 (DAKO, DakoCytomation GmbH, Hamburgo, Alemania). Los tejidos fueron bloqueadas para peroxidasa endógena en un 0,3% H 2 O 2 solución durante 15 min. Los anticuerpos monoclonales (ERa: ER1D5 DAKO 1:35, PR: PGR636 DAKO 1:50, bcl-2: Clon 124 1:200 DAKO, EGFR: 31G7 CYTOMED 1:20, cerb2/Her-2/neu policlonales DAKO 1:250 , Y ki67 (MIB-1) DAKO 1:200) fueron utilizados para la detección específica epítopo. El ChemMate DAKO peroxidasa / DAB Kit de detección se utiliza para la vinculación y la tinción. Las láminas fueron counterstained con verde de metilo y coverslipped con entelan. Histológico resultados se calcula multiplicando la intensidad del color (rango de 0 a 5) con la proporción de células de la tinción positiva.

Criterios de Respuesta

Respuesta al tratamiento seguido la Unió Internacional Contra Cancrum criterios [23]. PCR (diagnóstico patológico completo basado respondedores), se definió como la ausencia de un carcinoma invasivo en el examen de mama por el patólogo y la falta de afectación ganglionar linfático. CCR (clínica completa respondedores) se definió como la ausencia clínica de carcinoma invasor de la mama. Este parámetro se utiliza como sustituto de la pCR en una ocasión, cuando un paciente se redujo después de la extirpación quirúrgica PST. PR (parcial respondedores) se determinó como una reducción de la masa tumoral de ambos perpendicular dimensiones que van desde 10% a 75% del tamaño tumoral medido inicialmente sobre la base de una mayor dinámica de contraste de la resonancia magnetica o la tomografía por resonancia magnética (MRT), y, a veces, En tanto, MRT y ultrasonografía. NC (no respondedores o ningún cambio que no ha habido cambios) se define como la falta de reducción del tumor o un aumento en el tamaño tumoral (enfermedad estable o progresiva). El porcentaje de reducción del tumor (Cuadro 1 y 2] se calculó como la relación entre el tamaño tumoral patológica [cm] después de la quimioterapia neoadyuvante en el momento de la extirpación quirúrgica en comparación con el tamaño de los tumores clínicamente definida en el momento del diagnóstico. Más detalles están disponibles como archivos adicionales 3 y 4 de la página web de JTM.

ARN preparación y análisis de microarrays

ARN total fue extraído a partir de células de tejidos lisados de terreno y la posterior purificación con columnas RNeasy mini spin (Qiagen, Hilden, Alemania). Posterior lavado y elución medidas se realizaron de acuerdo a las instrucciones del fabricante. ARN de alta calidad se obtuvo a lo sugerido por su bien conservada 28S y 18S del RNA ribosomal bandas (presente en una proporción de aproximadamente 2:1 intensidad), junto con A260/A280 ratios de entre el 1,8 y el 2,0. La calidad y la integridad del ARN total fue probado con Bioanalyzer 2100 (Agilent Technologies Inc, Palo Alto, CA, EE.UU.). La expresión de genes se realizó en un Affymetrix GeneChip Human Genome U133A plataforma que contiene sondas 22283. Preparación y tramitación de la etiqueta y fragmentada cRNA objetivos, la hibridación y se ejecutaron los procedimientos de exploración según el protocolo del fabricante (Affymetrix, Santa Clara, CA, EE.UU.) [24]. Material de partida para el etiquetado constaba de 5 μ g de RNA total de cada espécimen del tumor. Etiquetado se limitó a un ciclo de transcripción in vitro. Así, a partir de 5 μ g de RNA total, de aproximadamente 50 a 60 μ g de amplificación de RNA (cRNA) se pudieran generar, que pueden ser utilizados en múltiples experimentos de microarrays. El cRNA se cuantificó por Agilent Nano tecnología Chip y evaluados por el tamaño relativo a la pura polyadenylated RNA. Quince microgramos de cRNA posteriormente fueron utilizados para la hibridación. Después de lavar y tinción arrays fueron digitalizadas por el escáner Gene Array 2500 (Affymetrix). Hibridación intensidad datos fueron adquiridos y procesados automáticamente por Affymetrix Microarray Suite 5,0 software. El nivel de expresión (media) de cada gen se determinará calculando la media de las diferencias de intensidad (pareja perfecta-mismatch) entre sus pares de la sonda, tal como se describe en otro lugar [25]. Analiza fueron rechazadas si el factor de escala superior al 2 o "chip de la superficie de exploración" reveló arañazos, o gradientes de partículas en general que afectan a la calidad de los datos (Refiner, GeneData AG, Basilea, Suiza).

Cuantitativo Real-Time PCR.

Alícuotas del total de ARN GeneChip expresión utilizada para el análisis cuantitativo se utilizaron para la RT-PCR con un ABI PRISM 7900 Sequence sistema de detección (Applied Biosystems, Foster City, CA, EE.UU.). CDNA de amplificación de PCR se generó por oligo dT cebados transcripción reversa (Superscript Primera Línea del Sistema, Invitrogen Corporation, Carlsbad, CA, EE.UU.), incluyendo DNAse I tratamiento. Primers y sondas fueron diseñadas con el software Primer Express (Applied Biosystems, Foster City, CA, EE.UU.), y abarcó la región del gen mismo de los respectivos Affymetrix sonda conjunto. Etiquetados oligonucleótidos fueron obtenidos de Eurogentec sa (Lieja, Bélgica). Copia números absolutos se normalizaron según GAPDH como referencia gen. El primer / sondas fueron preparados mediante la mezcla de 25 μ l de 100 μ M existencias solución "superior cartilla", 25 μ l de 100 μ M existencias solución "primer menor" y más 12,5 μ l de los 100 μ M solución madre-sonda TaqMan (FAM / TAMRA), y ajustada a 500 μ l con H 2 O (Primer / sonda-mix). Reacciones de PCR usando cDNA generados a partir de 1,5 ng RNA total se realizaron en los duplicados en un volumen de 10 μ l. Esto incluyó TaqMan universal Mix (Eurogentec sa) de acuerdo con las instrucciones del fabricante en un protocolo de 384-así formato y 1 μ l de los P & P mezclar. Termociclador parámetros fueron de 2 min a 50 º C, 10 min a 95 ° C y 40 ciclos, cada uno de ellos consistente en un 15 s paso de desnaturalización a 95 ° C y un 1 min recocido / paso de extensión a 60 ° C. Abundancia relativa transcripción de un gen se calculó bien por el método ΔΔ Ct o arbitrariamente definido por el número de copias de ARN estimaciones en un Ct = 24 como 10 6 copias. Posterior análisis incluía medidas como la normalización de centrado y media por gen división mediana.

Filtrado de datos

Cincuenta y seis de cáncer de mama primario y 5 no canceroso del tejido del seno se analizaron muestras de la formación como un conjunto de marcador descubrimiento. Datos brutos fue adquirido utilizando Microsuite 5,0 software de Affymetrix y normalizaron después de la práctica normal de la ampliación a la media de todas las intensidades de la señal de genes comunes a un valor arbitrario (TGT = 100). La expresión de genes se almacenan los datos incluidos P-valor, la generada por el software Microsuite 5,0, para la evaluación de la calidad de las medidas individuales para cada transcripción. Los datos de archivo se ha importado en el paquete de software expresionista Analistas (GeneData AG) para profundizar el análisis estadístico. Para mejorar la calidad genética que excluye la sonda fija por las siguientes razones. Cincuenta y nueve conjuntos de sonda a la hibridación de referencia (limpieza genes, etc) y que fueron identificados por Affymetrix se eliminaron con la excepción de GAPDH y β-actina, de la que un 3 'sesgada sonda conjunto se incluyó. Un centenar de genes, cuya expresión se utiliza habitualmente para la normalización de la HG-U133A y HG-U133B GeneChip versiones [26], también fueron retirados del análisis. Estos genes reflejan un patrón de expresión muy homogénea entre varios tejidos humanos, y para ello podría ser clasificado como "de mantenimiento de la casa" genes. Los genes potencialmente con altos niveles de ruido (81 conjuntos de sonda) frecuentemente observada con baja expresión los valores absolutos (por debajo de 30 unidades de la señal relativa (RSU) en todos los experimentos) también fueron eliminados. El resto de los genes son los que se procesan para eliminar (3196), cuya intensidad de la señal no fueron significativamente diferentes (P> 0,04) de sus niveles de fondo y, por tanto, etiquetados como "Ausente" por MicroSuite 5,0. Para aplicar un mayor rigor a los datos, hemos eliminado los genes cuyos niveles de significación (P <0,04) sólo se alcanzó en el 10% de las muestras de cáncer de mama (3841 sonda fija). Los datos de la sonda 15006 restantes conjuntos se utilizaron para el posterior análisis.

Análisis Estadístico

Para el análisis hemos aplicado una estrategia similar a la aplicada por E. Wang y colegas [27] para predecir la respuesta inmune de metástasis de melanoma. Los genes expresados diferencialmente por lesiones caracteriza por la respuesta a diferentes PST se identificaron con técnicas con la prueba de Wilcoxon rango suma, de dos muestras independientes Students't los ensayos de prueba y Welch. Las sondas se clasificaron en orden de importancia (SUM-Rank test) la combinación de los resultados de estas pruebas utilizando como línea de corte de valor P <0,05 veces y el cambio entre los grupos> 2. El Kruskal-Wallis ANOVA y las pruebas se aplicaron cuando dos grupos distintos (es decir, pCR vs NC) con extrema donde estudiaron los patrones de respuesta en la presencia de un tercer grupo intermedio (PR). Todas las pruebas estadísticas fueron de dos colas. El análisis de componentes principales (PCA) y la agrupación jerárquica se aplicaron para la visualización de datos y análisis estructural, y en ciertas medidas de dimensiones (sonda conjunto) de reducción. Todas estas herramientas se han utilizado diferentes tal como se aplican en la GeneData expresionista Analistas paquete de software y sólo fueron modificados a partir de una selección de los parámetros de peso y distancia adecuada matrices. Además, el parcial de los mínimos cuadrados análisis discriminante para datos multivariante (PLS-DA) con el software SIMCA-P (Umetrics, AB, Umea, Suecia) se utilizó.

Resultados
El análisis preliminar acerca de la condición de ER y de la inflamación

En estudios anteriores [28 - 31] informó de que los pacientes con receptor negativo de estrógeno (ER), la condición de responder mejor a PST en comparación con aquellos con un positivo. Además, PgR1 la expresión de los genes pueden afectar a los resultados. Además, los pacientes con tumores ER-negativos sufren más corto libre de enfermedad y supervivencia general [32 - 34]. ER condición también está asociada con un perfil de expresión de genes característicos independiente de otras clínicas y patológicas parámetros [35, 36]. Por lo tanto, los genes estudiados por separado las que se sabe están asociados con la señalización de ER. Se analizó previamente el perfil de expresión del cáncer de mama en dos cohortes de pacientes con ER positivo y negativo estado (no forma parte de este estudio). La lista completa de genes y expresión de datos dentro de las dos cohortes está disponible (archivo adicional 5]. Se identificaron 828 Affymetrix sonda fija por ANOVA y t-test (P <0,005) con una mediana de cambio de 1,2 veces o más. Análisis de la ER-828 firmas relacionadas en los 56 tumores del presente estudio correlaciona bien con la condición de ER-α por inmunohistoquímica. Para evitar la influencia en el resultado clínico de ER-firmas específicas e identificar alternativas, ER-predictores independientes de la respuesta y la supervivencia, estos genes se excluyeron

También excluidos genes relacionados con la función inmunológica ya que no puede predecir el efecto que la heterogeneidad de los infiltrados inmune podría influir en el perfil transcripcional de las distintas lesiones. Inmune genes (1025) se identificaron y excluidos. La lista completa de los genes está disponible excluidos (archivo adicional 6]. Muchos de los genes están excluidos los miembros de las familias de inmunoglobulina. El último conjunto de datos que figuran 13.145 sonda fija. Aunque en la actualidad existe un gran interés sobre el impacto de la inmunidad como predictor del resultado, esto fue más allá del propósito de este trabajo y será considerado en una próxima manuscrito.

Determinación de los genes predictor

A partir de la cohorte de capacitación, hemos construido respuesta subclases basadas en el post quirúrgico clinicopathological examen. Ocho de los 56 casos experimentaron una formación pCR y ocho avanzado (NC). Para identificar los genes predictivos más por cada clase que puso en práctica un programa de comparación para establecer la formación de la siguiente manera:

(I) NC vs PR (n = 40 vs 8), (II) pCR vs PR (n = 8 vs 40), y (III) pCR vs NC (n = 8 vs 8). Estas comparaciones se llevan a cabo por organizaciones no-paramétrica a la prueba t, Welch, Wilcoxon, Kolmogorov-Smirnov tests usando el expresionista analista de software (GeneData AG). Genes expresados diferencialmente se consideraron los que lleguen a cortar un significado de valor P <0,05 en todos los ensayos; 2301 se identificaron. Las restricciones adicionales se aplican (por lo menos 2 veces el nivel de expresión de la mediana y el promedio de expresión de más de 30 RSU (en relación señal unidades) en los tres grupos), con lo que en 1512 sólo establece sonda útil para nuevos análisis.

Para el "grupo de tres ensayos" (pCR vs PR vs NC) significación estadística fue medida con el Test de Kruskal-Wallis y utilizó un modelo lineal pruebas con un corte de P-valor <0,05 identificación de 414 conjuntos de la sonda. La superposición de las listas de genes (1512 establece sonda sonda fija y 414) por el análisis de diagrama de Venn cualificada 397 sonda fija. Este alto rigor potencialmente eliminado los genes de interés, pero la disminución de las tasas de falso descubrimiento de los genes seleccionados al azar en el P-valor cortado <0,05. PCA utilizando todas las clases predefinidas de tejido: tejido mamario no canceroso pCR, cCR, PR y NC se aplicó a los 397 conjuntos de la sonda. Separación de pCR y cCR tumores, por un lado, NC muestras y por el otro se definió por 2 componentes más distintivos. Hemos aplicado un corte en la correlación de la matriz de ACC y filtrada en los genes <-0,4 y> 0,4. Este resolverse mediante la eliminación de 325 conjuntos de 72 sonda.

Estamos entonces excluidos de los restantes 325 genes que se sabe que son los que concretamente se expresa en los vasos sanguíneos, los adipocitos, músculo y tejidos basados en perfiles de expresión diferencial de las células tumorales y las células normales después de su separación por láser captura microdissecction o tumor de mama mediante la comparación de la expresión de genes con perfiles Perfiles de expresión normal de los vasos sanguíneos, el tejido adiposo y el músculo muestras de la reducción del número de genes de 61. La lista de los excluidos 61 genes está disponible (archivo adicional 7]. Fila orden de los restantes 264 genes' importancia fue determinado por SUM-Fila prueba para todas las muestras y en comparación con el original de 13145 genes.

Además, dos genes fueron identificados clasificador (FHL1 y CLDN5) altamente discriminativa entre las más "normales" de muestras de tejidos y de todas las muestras de cáncer de mama analizados. Considerando que estos genes se expresan en niveles muy altos en el tejido mamario normal de su bajo nivel de expresión rara vez se detectó en las muestras malignas de mama. Se combinaron estos 2 genes con 57 más de 264 genes discriminativa filtrada sonda fija (archivo adicional 8]. Esa combinación permite que simple y rápida separación de las muestras de tejido normal maligno, que puede ser útil para el diagnóstico clínico de rutina. Un cuadro detallado que contenga los datos brutos para 59 genes y 83 tumores está disponible como suplemento de información (archivos adicionales 9 y 10].

Validación independiente sobre los casos

Los clasificadores pueden determinarse, se dividen en tres categorías: los genes / sonda fija capaz de distinguir entre (a) normal de la mama y el cáncer de mama tejidos (2 genes, FHL1 y CLDN5), (b) pCR o cCR desfavorable de los resultados (PR o NC ) (31 sonda fija o "respuesta favorable firma"), y (c) NC y PR (26 sonda fija o "pobre respuesta de la firma"). Nos espera que ambas firmas, favorable y pobres, sería separar las dos clases más extrema y pCR NC y reconocer efectivamente los respectivos patrones de expresión. Estos clasificadores se impugnó contra muestras de una prueba independiente de cohorte (n = 27 4; pCR, 4 NC, el 19 de PR; véase el cuadro 2 o archivo adicional 2]. La clasificación fue realizada por k-NN (k = 3) luego de un período de tres paso árbol de decisiones sobre la base de los 59 genes antes mencionados. Las 27 muestras tumorales fueron correctamente calificados como los tejidos cancerosos mediante la firma de dos genes (FHL1 y CLDN5). Pentecostés la "respuesta favorable firma" un grupo de 8 muestras tumorales fue clasificada como CR o PR. Por último, el resto de los tumores fueron clasificados como NC o PR por el "pobre respuesta de la firma". Hubo cuatro casos potencialmente mal clasificados. Resultados de la clasificación para la prueba de cohorte se muestran en la Tabla 3. Resumió los resultados de la validación, así como la sensibilidad, especificidad valores predictivos positivo y negativo (VPP y VPN, respectivamente) para cada clase se muestran en la Tabla 4.

PCA y la agrupación jerárquica

Una parcela ACC se creó la visualización de la posición de cada tumor muestra de la formación y la prueba de cohortes (83 tumores) a través de tres principales Eigenvectors (Figura 1A]. El PCA se realizó con el conjunto de 57 genes predictivos de respuesta a modo de ilustración. Los dos grupos más dispares respuesta (pCR y NC) están claramente separados con la excepción de un caso NC, BC1492, que los grupos con pCR tumores. Esta parcela está en consonancia con k-NN resultados de la validación cruzada para la formación de cohortes, que se define caso de que NC BC1492 como respuesta completa. Agrupación jerárquica de todos los tumores de 83 y 57 genes que predicen la respuesta se muestra en la Fig. 1B y 1C: once de los doce pCR tumores están organizados en una sub-rama de la muestra dendrograma NC tumores y se colocan en la rama separada dendograma.

Parcial de los mínimos cuadrados análisis discriminante (PLS-DA)

Direct análisis discriminante lineal se aplicó para comparar los resultados anteriores y prueba de las posibilidades de nuestro primer modelo clasificador. PLS-DA se aplica también a la gran cantidad de predictores y la multicollineality. PLS-DA supervisado el análisis de los usos independientes (niveles de expresión) y variables dependientes (las clases) para la clase de comparación aplicando métodos estadísticos multivariados, tales como el modelado suave independiente de la clase analogía (SIMCA), y el modelado de los mínimos cuadrados parciales con variables latentes para permitir el análisis simultáneo de todas las variables [37 - 42]. Además, PLS-DA proporciona una estimación cuantitativa del poder discriminatorio de cada descriptor por medio de VIP (variable de importancia para la proyección) parámetros. VIP valores representan un rango de parámetros estadísticos cuantitativos descriptores (valores de la expresión génica) de acuerdo a su capacidad para discriminar Diferentes clases.

PLS-DA se llevó a cabo en el original sonda 13145 establece que transcurrido el proceso de filtrado de CC en la formación de cohortes. Aunque este proceso puede dar lugar a un modelo con más de la parametrización de predicción de propiedades pobres, que proporciona una evaluación preliminar de las variables más importantes discriminativa. Dos modelos fueron probados independiente de cada una de ellas de dos clases: modelo 1 (clase 1 - pCR, clase 2 - NC, y se excluyeron los casos PR); modelo 2 (clase 1 - pCR, clase 2 - NC y junto PR). El modelo con tres clases (pCR, NC y PR) en vez de manifiesto el poder de predicción de los pobres están dependiendo en gran medida de la definición de respuesta parcial (Tabla 1]. Posiblemente la comparación de las estimaciones patológica (después del tratamiento), en comparación con las mediciones clínicas (pre-tratamiento) calcula que más de la reducción del tumor y de las mediciones parciales de la atribución de muestras como PR en lugar de NC.

Esas variables que cumplan los criterios de los niveles de expresión por encima del 60 RSU (como valor medio en al menos una muestra de cada grupo, y pCR NC), proporción (pCR / NC)> 1,9 o <0,55, y el VIP de> 1,9 Se mantienen. La figura 2 muestra un gráfico de dispersión de las muestras de la serie de capacitación agrupados de acuerdo a los dos componentes, ya sea para PLS en el modelo 1 (96 sonda fija; Fig. 2] o en el modelo 2 (90 sonda fija; Fig. 3] después de la segunda Iteración. Los números junto a los símbolos son identificadores de la muestra, según se detalla en la Tabla 1. Es evidente que pCR y NC muestras están claramente discriminados. Sin embargo, los resultados de las pruebas de permutación de ambos modelos (datos no presentados) demostró que ambos modelos se redujo aún más-la parametrización. Por lo tanto, mantenerse a los 20 conjuntos de sonda deducirse de modelo 1 y 20 conjuntos de sonda modelo VIP 2 con valores más altos. En ambos casos, los modelos de comportamiento mucho mejor de lo esperado por el azar.

Dos grupos de conjuntos seleccionados sonda se compararon y nueve conjuntos de la sonda se encontraron representados en ambas listas, que se deduce de modelo 1 y 2. Una lista combinada que contiene 31 conjuntos de sonda se utiliza para la validación de modelos (cuadro 5] por la aplicación de PLS-DA a la segunda, grupo independiente de los tumores (n = 27; Cuadro 2] para poner a prueba el poder discriminativo de la lista definitiva de genes. Los resultados se presentan en la Tabla 3. PLS-DA clasificada parcialmente los tumores con buena respuesta (> 60% de reducción tumoral) o muy mala respuesta al tratamiento como respuesta completa (por ej., BC1837, BC1848, BC1448), o de no respuesta (por ejemplo, BC1877, BC1134, BC1840), respectivamente. Esta observación indica que la realización de más estudios de seguimiento de la reducción tumoral durante PST es fundamental para juzgar correctamente la respuesta final de clasificación, y podría haber sido la mayor limitación de este estudio. Ambos enfoques estadísticos, dado que el 59 de genes y PLS-DA y se compararon identificado 19 genes en común. PLS-DA solos demostrado una menor capacidad de predicción en comparación con el primer paso de varios análisis combinado con k-NN clasificación.

La confirmación de la expresión de las mediciones en tiempo real RT-PCR

Real-time RT-PCR (qPCR) medición de los niveles de expresión de genes en el mismo ARN utiliza para experimentos de hibridación obtenido GeneChip de 32 tumores de mama y de formación de las cohortes de prueba se realizó en 46 genes seleccionados de los presentados en la Tabla 3. Primer y sondas fueron diseñados en regiones dentro o cerca de la meta de la región GeneChip oligonucleótidos. Un valor de 24 Ct empíricamente se considera que representan 10 6 copias de ARN por spiking bien sobre la base de experimentos. De los datos brutos en tiempo real RT-PCR se presentan en el Adicional de datos en la página web, como el anterior, junto con los datos de Affymetrix GeneChip. Expresión relativa, medida por el GeneChip qPCR se comparó con los resultados de adaptación de la mediana de expresión de los 46 genes en una muestra de 100 unidades relativas. Para detectar la diferencia relativa entre las muestras de expresión de cada gen, todas las mediciones se dividieron por la mediana de expresión de este gen. Esta mediana de normalización se llevó a cabo para ambas plataformas independiente. Raw y normalizado de datos de Affymetrix y TaqMan plataformas figuran en el archivo adicional 11. Con el fin de comparar las mediciones correspondientes y de la abundancia relativa de cada transcripción que preformados agrupación jerárquica con los datos generados con el sistema GeneChip. Se realizó esta acumulación (Fig. 4] con una matriz de correlación de las muestras, así como sobre los genes mientras que la distancia de medición se realizó con un peso promedio de matriz. Una vez que el grupo de GeneChip de datos en el lugar que ordenó a todas las muestras y de todos los genes de la qPCR datos en el mismo orden que deriva de la anterior agrupación. Esta operación dio lugar a muy similares a los mapas de calor como se muestra en la Figura 4 con un total de correlación R 2 = 0,73. También se realizó la agrupación independiente de la qPCR datos (Fig. 5], que dio lugar a semejante correlación de los árboles.

Discusión

El objetivo de este estudio fue identificar una multigene predictor de la respuesta a la CE en un PST. Varios estudios recientes demostraron que la expresión de los genes puede predecir la respuesta de perfiles en el neoadyuvantes, [43 - 47]. Dado que el paciente especificidad de tales predictores siendo cuestionable [48], nuevos intentos dedicado a la comprensión de los procesos (es) en que la respuesta a la terapia sistémica son de evidente importancia.

Primaria de la quimioterapia sistémica es a menudo que se utiliza para downstage grandes y los tumores de mama localmente avanzado en pacientes antes de la cirugía. Cada vez hay más pruebas de que la respuesta y, en particular, la respuesta completa a la quimioterapia neoadyuvante predice la mejora libre de enfermedad y supervivencia general [49 - 51]. Incuestionable, la respuesta patológica completa (pCR) no es sinónimo de curación, ya que sigue siendo un riesgo para la enfermedad metastásica. Sin embargo, ese riesgo disminuye en asociación con la escena de abajo del tumor primario y el logro de un estado de los ganglios negativos confirmados en el momento de la cirugía. Por lo tanto, es razonable sugerir que una buena respuesta a la terapia neoadyuvante puede corresponder a beneficio en la supervivencia.

La función de características biológicas y / o marcadores moleculares como predictor de la sensibilidad a los tratamientos específicos ha sido ampliamente estudiada [52 - 56]. Sin embargo, su papel en la predicción de la respuesta sigue siendo poco clara. Los resultados de los diferentes estudios son a menudo contradictorios y, en consecuencia, ninguna persona marcador biológico puede ser utilizado clínicamente fiable para la predicción de la respuesta a la quimioterapia [57, 58].

Los pacientes analizados en este estudio son parte de una mucho más amplia cohorte (n = 319) en tratamiento con CE basado en PST. Hemos observado en esta población de pacientes de esa edad, el grado histológico, receptor de estrógeno (RE), receptor de progesterona (PgR), los niveles de oncogen leucemia de células B-2 (Bcl2), la proliferación relacionados con el antígeno Ki-67 (ki-67), Y el receptor del factor de crecimiento epidérmico (EGFR) se relacionan con la expresión de respuesta en un análisis univariado, también confirmado por Colleoni et al. [33] en la configuración de preoperatorio. Sin embargo, en un modelo multivariado sólo fue ki-67 expresión que predice una mejor respuesta patológica (P = 0,011), y este factor está vinculado a la edad del paciente [59]. Por lo tanto, un verdadero marcador predictivo que podría ser medido por métodos de rutina (por ej., IHC) para identificar a los pacientes susceptibles de beneficiarse de la neo-adyuvante CE sigue siendo difícil de alcanzar.

Varios estudios sobre el cáncer de mama evaluó clasificadores predictivos de la supervivencia [60 - 65]. Un grupo holandés informó de 70 genes predictivos de recurrencia de la enfermedad en mujeres con ganglios linfáticos negativos de cáncer de mama primario y confirmó las conclusiones en un segundo estudio que comprende adicionales de 198 pacientes [65]. Este estudio podría asignar algunas mujeres a la categoría de bajo riesgo más allá del poder de discriminar criterios histopatológicos convencionales.

Sin embargo, la concordancia entre los diferentes estudios sobre la supervivencia de pacientes con cáncer de mama es baja. Incongruencia de datos puede ser particularmente explicada por el uso de diferentes tecnologías y diferentes microarrays de los pacientes demográficos. Además, sutilezas en el análisis de datos pueden explicar algunas discrepancias ya que no existe un método para estandarizar el análisis de datos de expresión cuando un gran número de puntos de datos se estudian por individuo en la muestra relativamente baja población.

En este estudio, que discrimina con precisión que las muestras tenían un alto contenido de tumor del tejido normal del seno basa en la demostración de que la anterior FHL1 y CLDN5 puede servir como tales predictores. Entonces, hemos identificado predictores en el cáncer de los tejidos de tumores primarios mediante la identificación de genes capaces de segregar dos diferentes clases de tumores de acuerdo a la respuesta al tratamiento (pCR vs NC). "Favorables resultados firma" podría predecir remisión completa de un tumor primario con> 90% de sensibilidad. Algunos genes que se encuentran altamente expresados en pCR muestras pertenecen a la "cuestión biológica" de la mitosis y la proliferación celular (por ejemplo,. MAD2L1, CCNB2). Esto es concordante con las observaciones que nosotros [59] y otros realizados en el ki-67 y la expresión negativa ER estado en la respuesta de tumores [66]. Posiblemente, activamente dividir a los tumores, ya sea impulsada por la falta de control hormonal o por otras señales, como a través de la vía del receptor de insulina pueden responder mejor. El "mal resultado la firma" distinguir tumores poco probable que responda a PST incluido DDB2 o XPA, que participan en la reparación de los daños del ADN que hace perfecto sentido lógico. El más alto valor predictivo fue tratado en una forma gradual mediante la comparación de pCR a NC y comparación de los casos de cada grupo de predictores en la multiplicidad de enfoques estadísticos y de paso k-NN (k = 3) de validación. Este clasificador podría predecir con un alto grado de precisión una respuesta patológica en el posterior cohorte de 27 pacientes utilizados para su validación. También es posible que hubo mala cesión de los casos la respuesta especialmente en casos límite que respondieron con pequeños cambios en el tamaño de los tumores o bifocales. Ultra-sonido de imágenes aplicadas para la determinación de tamaño antes de la quimioterapia podría no ser comparable a la precisión de las mediciones, que los patólogos pueden hacer en muestras resecado. Así, en 10 casos la formación PR conjunto considerado como tal vez no se han beneficiado de medidas comparables si se podrían utilizar antes y después de la terapia. Este error puede tener indefinido parcialmente afectan a nuestro análisis estadístico disminución de la sensibilidad del modelo adoptado (es decir, predecir NC muchos casos como BP y viceversa).

También observó que la aplicación de diferentes algoritmos estadísticos para el análisis de datos conducir a la extracción de la superposición predictor de las firmas (19 de 57 genes en común). Aunque algunos de los genes identificados por el PLS-DA podría haber sido despedidos por los estrictos criterios que se aplican en la filtración, ambos enfoques analíticos podría predecir pCR. NC exactitud de la predicción sólo se podía lograr a través de la gradual identificado firmas. Más a fondo en la interpretación de los procesos biológicos asociados a los genes identificados estadísticamente probablemente mejorar la solidez de nuestros resultados en el futuro [67 - 69] [70].

Hemos tratado de anular el riesgo de overfitting del modelo de formación basado en los datos (es decir., La búsqueda de una masa de menos relevantes genes que pueden conducir a la pérdida de unos pocos pertinentes). La precisión de la predicción era relativamente alto, pero estaba limitado por el número de eventos de validación (pCR o NC) analizados hasta ahora sugieren que una mejor predictor de selección de entre todos los genes identificados sobre la base de un mayor estudio de validación puede aumentar la exactitud de nuestros hallazgos y, como consecuencia Su valor clínico. En la actualidad, la recogida de muestras para una segunda cohorte de validación recibir CE PST basado en condiciones similares en una institución independiente.

Conflicto de intereses

Los autores declaran que no tienen intereses en conflicto.

Contribuciones de los autores

OM y MM contribuido igualmente a esta labor. Todos los autores leído y aprobado la versión final del manuscrito.

Material suplementario
Archivo Adicional 1
Clinico-/pathological contiene información sobre pacientes en la formación de cohortes.
Archivo Adicional 2
Clinico-/pathological contiene información sobre pacientes en el ensayo de cohorte.
Archivo Adicional 3
Clinico-/pathological contiene más información sobre los pacientes en la formación de cohortes.
Archivo Adicional 4
Clinico-/pathological contiene más información sobre los pacientes en el ensayo de cohorte.
Archivo Adicional 5
Contiene la lista completa de genes y de expresión dentro de los datos de dos cohortes de pacientes con ER ER positivo y negativo.
Archivo Adicional 6
Contiene una lista completa de los genes relacionados con el sistema inmune (1025), que fueron excluidos del análisis.
Archivo Adicional 7
Contiene la lista de 61 genes. Estos genes se excluyeron del análisis de tumores de mama mediante la comparación de la expresión de genes con perfiles de los perfiles de expresión normal de los vasos sanguíneos, el tejido adiposo y el músculo muestras.
Archivo Adicional 8
CE contiene predictor.
Archivo Adicional 9
Contiene datos en bruto para 59 genes y 83 tumores en la formación y la prueba de cohortes, respectivamente.
Archivo Adicional 10
Contiene datos en bruto para 59 genes y 83 tumores en la formación y la prueba de cohortes, respectivamente.
Adicional 11 Archivo
Contiene Affymetrix y TaqMan normalizado de datos en bruto y el 46 genes y 32 tumores primarios de mama (estudio de la expresión de confirmación de las mediciones de tiempo real RT-PCR).
Agradecimientos

Damos las gracias a Michael Korenberg, un editor de un nuevo volumen, titulado provisionalmente "Microarray Análisis de datos: Métodos y Aplicaciones", en una serie en curso "Métodos en Biología Molecular" por Humana Press, EE.UU. útil para la lectura y discusión de la Estadística de los métodos aplicados para el análisis de datos de microarrays en el presente manuscrito.