BMC Medical Imaging, 2006; 6: 14-14 (más artículos en esta revista)

En gran escala en los cálculos histología imágenes revelan el grado de diferenciación de los parámetros para el cáncer de mama

BioMed Central
Sokol Petushi (spetushi@drexel.edu) [1], Fernando García U (Fernando.Garcia @ DrexelMed.edu) [2], Marian M Haber (marian.haber @ drexelmed.edu) [2], Constantino Katsinis (constantine. katsinis@drexel.edu) [3], Aydin Tozeren (aydin.tozeren @ drexel.edu) [1]
[1] Escuela de Ingeniería Biomédica, Ciencias y Sistemas de Salud, Drexel University, 3141 Chestnut St, Filadelfia, PA 19104, EE.UU.
[2] St, Filadelfia, PA 19102, EE.UU.
[3] Godwin Escuela de Estudios Profesionales, Drexel University, 3001 Market St, Filadelfia, PA 19104, EE.UU.

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.

Resumen
Fondo

Tumor clasificación es inexacta y depende en gran medida de la anatomía patológica confirmó el diagnóstico cualitativo de las imágenes del tumor del tejido diapositivas. En este estudio, nuestro objetivo fue desarrollar un método computacional automatizado para clasificar hematoxilina y Eosin (H & E) de tejidos teñidos secciones sobre la base de cáncer de tejidos de textura características.

Métodos

El procesamiento de imágenes de histología de diapositivas imágenes se utilizó para detectar e identificar el tejido adiposo, matriz extracelular, morfológicamente distintos tipos de núcleos celulares, y la estructura tubular. La textura parámetros derivados de análisis de imágenes se aplica luego a clasificar las imágenes en un esquema de clasificación supervisada utilizando el grado histológico de una serie de pruebas de orientación.

Resultados

El grado histológico asignado por patólogos para el carcinoma de mama invasivo imágenes fuertemente correlacionada con la presencia y el alcance de núcleos de células dispersas con cromatina y la arquitectura, específicamente el grado de presencia tubular de las secciones transversales. Los dos parámetros que diferencian grado tumoral encontrado en este estudio fueron (1) el número de densidad de núcleos de células dispersas con cromatina y (2) el número de densidad tubular secciones transversales identificados a través de procesamiento de imágenes como manchas blancas que estaban rodeados por una cadena continua de núcleos celulares. Clasificación basada en las subdivisiones de una imagen de conjunto de diapositivas que contienen una alta concentración de núcleos de células de cáncer constantemente de acuerdo con el grado de clasificación de toda la diapositiva.

Conclusión

El análisis de imágenes automatizado y la clasificación se presentan en este estudio demuestran la viabilidad de desarrollar clínicamente relevantes clasificación de imágenes de histología sobre la base de micro-textura. Este método proporciona patólogos una valiosa herramienta cuantitativa para la evaluación de los componentes del sistema de Nottingham para la clasificación del tumor de mama y evitar intra-observador variabilidad aumentando así la coherencia del proceso de toma de decisiones.

Fondo

En este artículo se presenta un cuadro clínico correspondiente clasificación de hematoxilina y Eosin (H & E) histología diapositivas automatizado basado en el procesamiento de imágenes, aprendizaje supervisado, y en gran escala microtexture cálculos. El H & E mancha tintes de ADN ricos en núcleos celulares de color azul y ricas en colágeno matriz extracelular (ECM) de color rosa, lo que permite la diferenciación de ADN que contienen los núcleos de su entorno ECM [1]. Actualmente tumor de mama utilizan sistemas de clasificación de evaluar las características nucleares, la formación de túbulos, y la tasa mitótica de formular un grado tumoral [1, 2]. Los patólogos evaluar cada uno de estos parámetros en las regiones pequeña muestra de la imagen microscópica y dar una puntuación de 1 a 3 en orden creciente de mejor a peor de los casos. El grado del tumor de mama es la suma de los tres resultados [3]. El puntaje más bajo posible (1 + 1 + 1 = 3), junto con las puntuaciones 4 y 5 corresponden a tumores de grado I. Estas bajo grado poseen tumores bien diferenciados con células mitóticas tasas bajas, y un patrón de crecimiento tubular. Los tumores de grado intermedio (grado II) tienen una puntuación total de 6 o 7 mientras que alto grado tumores (Grado III) tienen una puntuación total de 8 o 9. Alto grado de los tumores conocidos como carcinomas pobremente diferenciado, se caracterizan por el cáncer de mama infiltrante con menos del 10% de la lesión organizado como túbulos, muy núcleos pleomórficos y muchas mitosis.

Patólogo de evaluación basado en los tejidos de diapositivas para la clasificación del tumor se considera el estándar de oro para la evaluación de neoplasias de tejidos. Sin embargo, es objeto de observación tanto a la variación y la variabilidad basada en el enfoque espacial de observación [4 - 7] Por otra parte, tumor clasificación basada en el análisis cualitativo de la morfología, en los casos individuales, no es necesariamente de predicción de resultados clínicos [3]. Algunos de los pacientes en el 'mejor' pronóstico categoría se manifiesta la enfermedad agresiva y viceversa. El resultado es la mala gestión del paciente con quimioterapia y terapia hormonal dada innecesariamente a algunos y no a otros que podrían beneficiarse. La inconsistencia entre la imagen basada en la clasificación y el resultado clínico ha dado lugar a estudios de mejores marcadores para predecir el comportamiento biológico, que incluyen el potencial de desarrollo global y la expresión de genes del genoma a escala firmas para diversos tipos de cáncer y subtipos [8 - 11]. Paralelamente, otros estudios se han centrado en automatizados de procesamiento de imágenes para una mejor precisión en la clasificación de tumor [12, 13]. Híbrido segmentación métodos se han utilizado para detectar los núcleos de imágenes de histología diapositivas teñidas en diferentes condiciones [12 - 14]. Una imagen morfométricas nucleares método de clasificación basado en Z-puntuación ha sido desarrollado por Bacus et al. [15] de mama carcinoma ductal in situ (DCIS). Del mismo modo, Hoque et al. [16] cuantificado la media nuclear características tales como área, excentricidad, compacidad y alargamiento en periódicas y no periódicas DCIS y determinó los rasgos nucleares que son predictivos de grado y / o tiempo de supervivencia. Wolberg a al. [17] investigaron la eficacia de una computadora basada en la morfología nuclear técnica de evaluación para cáncer de mama y demostró que la morfología nuclear es una evaluación mejor prognosticator de supervivencia libre de enfermedad en comparación con los ganglios linfáticos.

Nuestro estudio se expande el trabajo previo ya que se aplica a gran escala los cálculos y la máquina de aprendizaje de algoritmos que pueden ayudar en el desarrollo de nuevos índices basados en el tejido micro-textura de motivos para la clasificación de imágenes de mama histología. Este estudio utiliza nuestro publicados anteriormente híbrido método de segmentación y de aprendizaje supervisado para identificar micro-texturas que pueden ser utilizados como elementos para clasificar histología imágenes [18]. Tejidos imagen de los objetos así como de núcleos de células híbridas segmentación jerárquica se clasificaron de aprendizaje supervisado en tres categorías y la morfología de una categoría de falsa detección. La posición espacial de millones de núcleos celulares y su morfología tipos se identificaron en la histología imágenes. El presente estudio se inicia con la recogida de los núcleos de distribución espacial de información sobre la histología de mama imágenes de diapositivas y se identifican las regiones del tumor con alta densidad de núcleos. Tubular secciones transversales en las imágenes espaciales y otros parámetros de textura, como la media distancia entre los núcleos vecinos se han detectado utilizando la información espacial sobre la distribución de núcleos celulares. Clasificación basada en algoritmos de aprendizaje supervisado fueron utilizadas con el fin de clasificar la histología sección de imágenes en función de la morfología y los patrones de textura. Nuestros resultados indican que el número de densidad de la cromatina dispersa núcleos celulares y el número de densidad de mama tubular secciones transversales funcionar como grado de diferenciación características. En combinación con otros textura / biomarcador características derivadas de plataformas, como biomarcador de datos de imágenes decoradas, mundial perfiles de expresión génica, aberraciones cromosómicas y las mediciones, el potencial de diferenciación de estas nuevas conclusiones se incrementará debido al aumento de longitud de resultados característica específica vectores utilizados en clasificación.

Métodos
Las imágenes usadas para el cáncer de mama de células de identificación y clasificación de grado

La histología de datos de imagen utilizado clínicamente relevantes para la clasificación de imágenes de histología consta de 24 H & E manchadas de diapositivas de imágenes. Estas imágenes que figuran las secciones transversales de millones de células cancerosas y miles de túbulos conductos mamarios. Cada imagen de la histología en el conjunto de datos pertenecía a otra paciente. Estos casos fueron seleccionados de un gran conjunto de datos asociados con el cáncer de mama banco de datos de la Drexel University College of Medicine (DUCOM). Esta base de datos es un archivo de aproximadamente 2200 parafina embebido en el cáncer de mama especímenes recolectados desde 1997 hasta el presente. La recopilación de datos y estudio para este proyecto fue cubierto por la IRB (Junta de Revisión Institucional), con estudio #: 10128 y protocolo título: 3-D Reconstrucción de carcinoma de mama ". La IRB fue aprobado como un exenta de investigación # 4 ya que este proyecto consistió en la recopilación y estudio de deidentified existentes especímenes patológicos (parafina de los bloques de tejido fijado e histología diapositivas). El conjunto de datos se filtra para mostrar sólo los casos lumpectomía y un subconjunto fue seleccionado para representar a los tres grados del tumor de mama (I, II, III) en el conjunto de datos a un número igual. Dos patólogos experimentados que se especializan en la histopatología del tumor de mama (Drs. Fernando U. García y Marian M. Haber) re-marcó la histología diapositivas de este subconjunto en orden secuencial. Los ocho primeros casos de cada grado tumoral, idéntica puntuación de dos patólogos, se han utilizado en esta investigación. El sistema de clasificación Nottingham [2, 3], fue utilizada en la asignación de grado a la histología diapositivas. El cuadro 1 muestra los distintos componentes del sistema de puntuación Nottingham y el grado global asignado por unanimidad por los dos patólogos a los 24 toda la sección de diapositivas imágenes utilizadas en el estudio.

Para digitalizar diapositivas nuestra hemos utilizado una configuración personalizada para microscopio Olympus BX60 equipado con un LUDL la etapa BioPrecision motorizado, un suelo de baldosas de alta velocidad del sistema (objetivo de imagen), y un Retiga 2000R cámara de color digital. La histología diapositivas fueron escaneados utilizando un 40 × UPlanApo objetivo Olympus (400 × ampliación) lente, lo que permite la visualización de los núcleos celulares. A Dual-Core Intel Xeon 3.0 GHz, 2 GB Ram, estación de trabajo Dell Precision se utilizó para el análisis. Por automatizado de procesamiento de imágenes y análisis, la histología de diapositivas imágenes fueron dividido en 64 (8 de 8) secciones de tamaño 1150 por 1540 píxeles y, a continuación, cada una de estas imágenes de la sección fue de nuevo dividido en 25 (5 de 5) sub-imágenes (Fig 1]. Como resultado de ello, el insumo básico en nuestro bajo nivel de procesamiento de imagen pasos fue una sub-imagen de tamaño 230 por 310 píxeles, con 1 píxel correspondiente a 0,73 μ m de nuestra imagen. En la celda de hacinamiento regiones, sub-imágenes que figuran cientos de núcleos celulares. La imagen resultante de datos que figuran sub-38400 imágenes.

Morfología clasificación de los núcleos celulares en la histología y diapositivas de formación y validación de datos

El tejido micro-texturas en las imágenes se clasifican de la siguiente manera [18]:

Automatizado de análisis de imágenes

Nuestro método para el tratamiento automatizado de procesamiento de imagen de 38400 sub-imágenes previamente descritas por Petushi et al. [18]. MATLAB Toolbox de procesamiento de imágenes. se utilizó para prototipos de los algoritmos diseñados para este estudio. Del mismo modo, la interfaz gráfica de usuario utilizado para automatizar el procesamiento de imágenes y análisis en este estudio fue diseñado en el entorno de programación MATLAB. El proceso incluyó la conversión en escala de grises, con la segmentación de adaptación thresholding morfológicas y operaciones, BLOB (micro-objeto) de etiquetado, extracción de características, clasificación blob, y su clasificación de acuerdo con los núcleos de aprendizaje supervisado (Fig 3]. Formación y validación de datos para la identificación de núcleos de células de la morfología de diferentes tipos usando el aprendizaje supervisado se generaron a partir de la histología imágenes utilizadas en esta investigación. Ambos conjuntos de datos que figuran 250 ejemplos de núcleos celulares en tres categorías morfología y 250 manchas que fueron consideradas como objetos de arte visual y no núcleos. Identificación de los micro-texturas se muestra en la Figura 2, sobre la histología imágenes utilizadas en este estudio nos permitió determinar la densidad de superficie número de núcleos y detectar la presencia de más alto orden estructural objetos en las imágenes, como las secciones transversales de la mama como conductos cerrados de las regiones pixel de alta intensidad que están rodeadas de núcleos celulares.

Núcleos de alta densidad de las regiones

Núcleos de alta densidad de las regiones en cada sección de imágenes se identifican como sigue: una ventana cuadrada, lo suficientemente grandes como para contener múltiples núcleos (50 píxeles × 50 píxeles), escaneada toda la sección de imágenes y asigna un valor de densidad de la NM1, NM2, y Nm3 tipo núcleos (núcleos número de píxeles cuadrados por cada ventana de imagen) a cada píxel. El resultado de esta filtración operatorion fue la generación de un mapa topológico al igual que con los máximos regionales, indicando los núcleos de alta distribución para cada tipo de núcleos (NM1, NM2, Nm3, NM1, NM2, Nm3-NM1, NM2-Nm3, NM1, NM2-Nm3 ). Estos núcleos de densidad de la sección de imágenes fueron segmentadas para identificar los máximos regionales que representan a alta densidad de concentración de núcleos. Segmentación estaba compuesto de adaptación óptima thresholding morfológicas y el nivel de llenado y borde suavizado las operaciones [19, 20] (Fig. 4]. Si la sección de imagen no posee más de 300 núcleos identificados, que fue rechazada de tratamiento posterior con el fin de asegurar estadísticamente significativa densidad de núcleos de valores para cada procesado la sección de imagen. El conjunto de diapositivas imágenes que no contienen al menos 11 imágenes de sección con un mínimo de 300 núcleos también fueron eliminados del conjunto de datos. Hubo dos de esas imágenes de diapositivas en la categoría de grado I y uno en la categoría de Grado II. El resto de imágenes de diapositivas en el conjunto figuran un mínimo de 29 imágenes a cabo la sección de la máxima 64. Tenga en cuenta que una diapositiva la imagen se compone de 64 imágenes de sección. El proceso de filtrado reducido el número de la sección de imágenes en el estudio de 24 × 64 = 1536 a 1062.

Teniendo en cuenta que una sección de imagen ha pasado los filtros basados en al menos 300 núcleos identificados, el número de NM1, NM2, y Nm3 núcleos por unidad de núcleos de alta densidad de área se calcularon para cada sección de imagen y denominado DNM1, DNM2, DNM3, DNM1-2 , DNM1-3, DNM2-3, DNM1-2-3, respectivamente.

Otras características de textura

El número de túbulos (DT) por unidad de núcleos de alta densidad de la zona se determinó mediante la identificación de los píxeles de alta intensidad las regiones que estaban rodeados por una cadena de núcleos de células (Fig. 5]. La distancia media (DN) entre los centroides de los núcleos más cercanos a la alta densidad de las regiones también se determinará para cada sección de imagen como un posible grado de diferenciación característica. Por lo tanto, la función de vector para cada imagen figura la sección 9 características: DNM1, DNM2, DNM3, DNM1-2, DNM1-3, DNM2-3, DNM1-2-3, DT, y DN.

Clasificación de imágenes utilizando la sección de orientación asignadas grado

Se utilizó la LNKnet [21] paquete de software con el fin de clasificar las imágenes usando la sección de orientación en un grado de formación y validación de datos. LNKnet es un paquete de software que integra la red neuronal, estadística y aprendizaje automático de clasificación, agrupación, y de la característica de selección de algoritmos en un paquete de software modular.

La sección de datos de imagen de 1062 característica vectores se divide en dos: uno que contiene 536 vectores característica para la formación y la otra característica que contiene 526 vectores para la realización de pruebas de la misma sección portioning imágenes de cada diapositiva en estos subconjuntos. Si el número de la sección de imágenes de una diapositiva es un número impar, el número de imágenes en la sección asignada a la formación de esta diapositiva es uno mayor que el número de imágenes en la sección asignada a las pruebas establecidas. Pasando por el proceso de selección característica, utilizando tanto Análisis discriminante lineal (LDA) y Adelante / métodos retrospectivos de búsqueda en LNKnet, dos de los extrajeron las características de orden superior, DNM3 y DT, fueron identificados como predecir con exactitud el grado histológico significativamente con más frecuencia que los otros siete. Estos dos insumos discriminante fueron los DNM3 y el DT. La Figura 6 muestra las diapositivas en su conjunto normalizado de las densidades de estas dos características en todos los 24 casos de pacientes en relación con los resultados de Nottingham y el grado histológico asignadas por los dos patólogos. El uso de estas dos características diferentes discriminante clasificadores supervisados por el LNKNET fueron entrenados y probados. De los distintos clasificadores disponibles (lineal, cuadrática, redes neuronales, árbol de decisiones, etc) en el LNKnet, el clasificador cuadrático dado lugar a la prestación media mínima de clasificación errores cuando se evalúan en las pruebas establecidas (Fig. 7].

Resultados y discusión

En este estudio, hemos utilizado un algoritmo automatizado de imágenes que identifica el cáncer de núcleos de células en histología de diapositivas y clasifica las imágenes de estos núcleos en tres categorías en función de la morfología [18]. El algoritmo también determina las pautas espaciales en la distribución de núcleos de células en histología imágenes. El micro-textura de los parámetros obtenidos a partir de imágenes de histología son posibles indicadores de cáncer de tipo y grado. El resultado final del procesamiento de imágenes en diapositivas histología fue la separación de la imagen en las siguientes regiones: el tejido adiposo y vacío regiones de la diapositiva (AT), ECM, y los núcleos celulares clasifican en tres categorías según la morfología (NM1, NM2, Nm3). De esta manera, procedimiento automatizado identificado las posiciones espaciales de cientos de miles de núcleos celulares por histología de diapositivas de imágenes.

Los cálculos con los datos de la etiqueta de imagen muestran objetos cercanos a coincidir con los núcleos de identificación de inspección visual automática y el procesamiento de imágenes. Gráficos de barras en la figura 8 muestra los resultados de la clasificación de los ensayos de datos que fueron obtenidos mediante el uso de la LNKnet binario árbol de decisiones clasificador compuesta por 50 nodos y 51 hojas. Los resultados están representadas por los gráficos de barras en esta cifra indica que el procedimiento automatizado descrito en este estudio correctamente identificados manchas causadas por manchas y otros artefactos como no-239 núcleos en 250 veces (95,6%) y se evaluó sólo el 24 núcleos de células de 750 ( 3,2%) como objetos (núcleos no). De este modo, el sistema automatizado utilizado en el estudio, el 4,4% de los objetos que patólogos considerarse como bienes culturales como núcleos celulares y el 3,2% de los objetos que patólogos considerarse como núcleos como artefactos. Estos resultados indican que el procesamiento de imágenes automatizado previsiones están en línea con los de la inspección visual y así comparar con los resultados de otros estudios [12 - 14].

La discrepancia entre las predicciones automatizado de la morfología de tipo nuclear y evaluación visual también se muestra en la Figura 8. El procedimiento identificado alrededor del 20% de los núcleos considerados como Nm3 por inspección visual como NM2 núcleos. En el conjunto de 250 núcleos previamente etiquetados por inspección visual como pertenecientes a la morfología Nm3, nuestro sistema automatizado identificado 176 núcleos como Nm3 núcleos, 64 como NM2 núcleos y 10 como ECM. No hay núcleos previamente clasificado como NM1 fueron identificados por automatizado de imágenes como Nm3 mientras que sólo un pequeño porcentaje de NM2 clasificado núcleos fueron identificados por nuestro sistema automatizado como Nm3 (7 / 250). Estos resultados indican que Nm3 podría ser subestimada en algunas diapositivas de hasta 20% en comparación con la evaluación visual. Sin embargo, dado que todas las transparencias se evaluaron utilizando el mismo análisis de imágenes automatizado de los resultados se puede esperar que sea coherente en el conjunto de datos.

Clasificación de la sección de imágenes

Los patólogos utilizan frecuentemente las subsecciones de la imagen de toda una sección histología imagen. Por lo tanto, nos centramos en la clasificación de 1062 la sección de imágenes procedentes de los 24 toda la sección de diapositivas de imágenes. La característica de vectores para cada sección de imagen consistió en el número de núcleos de densidad (DNM1, DNM2, DNM3, DNM1-2, DNM1-3, DNM2-3, DNM1-2-3), el número de densidad de los túbulos (DT) y la media distancia entre los núcleos vecinos (DN). Como se describe en la sección de métodos, clasificación supervisada se utilizó para identificar las características discriminante de los nueve elementos anteriormente descritos. La clasificación indica DNM3 y el DT como parámetros el grado de diferenciación. El diagrama de dispersión se muestra en la Figura 9 identifica DNM3 DT y valores para cada uno de la sección de imágenes utilizadas en el estudio. Sección de imágenes se identifican como punto de símbolos en este gráfico por el grado de toda la diapositiva a la que pertenecen. La figura muestra que normalmente DNM3 aumentado y disminuido DT cada vez con mayor grado de imágenes de histología, pero la característica que coordina la sección de imágenes no grupo en tres grupos fácilmente identificables. A continuación, utiliza un clasificador cuadrático de la LNKnet paquete de software para asignar la sección de imágenes en tres clases identificadas como C1, C2 y C3. Como se describe en la sección Métodos, el clasificador cuadrático fue entrenado para asociar a la clase 1 (C1) de la sección imágenes con Grado I (GI), con C2 y C3 GII con G3. La continua líneas que separan el gráfico de dispersión en la Figura 9 en tres regiones identificar los límites de la C1, C2 y C3 clases de la sección de imágenes que fueron determinados por el clasificador cuadrático. La cifra muestra que la sección de imágenes previamente clasificado por patólogos como de grado I y III (GI, GIII) estaban bien separados en las clases C1 y C3 mientras que la mitad de las diapositivas-imágenes clasificado como II (GII) se asignaron en C2 y el resto en C1 o C3. Este punto se ha vuelto a destacar en la figura 10 en los gráficos de barras que indica el número de C1, C2 y C3 categoría de la sección de imágenes en cada diapositiva histología en el conjunto de datos. La figura muestra que el grado del tumor está fuertemente correlacionada con las observadas con mayor frecuencia la clasificación tipo en la sección de imágenes de la diapositiva.

Automatizado de técnicas de procesamiento de imágenes como el nuestro tienen la capacidad de escanear toda la sección a través de imágenes e identificar las regiones de similar textura, representada en este caso por C1, C2 y C3 clasificación. Los gráficos de barra se muestra en la Figura 10 indica, además, la posibilidad de explotar la imagen del tejido del tumor para determinar la heterogeneidad subclases asociadas a cada grado tumoral. Este sub-clasificación podría depender de la C1, C2 y C3 composición de la histología diapositivas. Se necesitan más estudios para explorar estas ideas con más detalle.

Conclusión

En este artículo se presenta un sistema automatizado de clasificación de imágenes de mama histología textura utilizando dos características: la densidad de superficie de los núcleos y posteriormente posición espacial. Superficie densidad es evaluada por una técnica que detecta e identifica millones de núcleos celulares en las imágenes de histología diapositivas y los clasifica en tres categorías en función de la morfología [18]. La posición espacial de núcleos celulares se utilizan para la detección de tejido de orden superior, como las estructuras tubulares secciones transversales y los límites de los núcleos de alta densidad de las regiones. El programa desarrollado permite una investigación sistemática de imagen de micro-textura parámetros con respecto a su potencial para diferenciar etapa y el tipo de cáncer de mama.

Nuestro estudio se centró en las imágenes de H & E manchadas histología diapositivas porque esta mancha es el más utilizado de diagnóstico en patología [1]. H & E manchas de ADN azul y rosa de colágeno y, por tanto, permite la segmentación de los núcleos de células de la estroma. Análisis de imagen de H & E tinción es una tarea difícil debido a la técnica y tumor factores tales como las grandes diferencias encontradas en la sombra y la intensidad de la coloración y la no uniforme distribución de la cromatina en los núcleos de células de cáncer. A pesar de estas dificultades, nuestra segmentación automática adaptativa método nos ha permitido distinguir el adiposo y / o tejidos de espacios vacíos de la estroma adyacente. Adaptive segmentación fue también muy eficaz en la identificación de núcleos celulares con casi uniforme pixel intensidad. Sin embargo, supervisó el aprendizaje y la posterior clasificación tenía que ser utilizado para distinguir las células con núcleos muy variable cromatina mancha la intensidad de los tejidos circundantes.

Nuestros cálculos identificado núcleos celulares en tres diferentes categorías morfológicas. Los núcleos en la categoría general, NM1 había pixel intensidad uniforme y representa el núcleo de los linfocitos y otras células inmunes. Los núcleos en NM2 tuvieron mayor intensidad de los píxeles y un tamaño mayor en comparación con NM1. Los núcleos de esta categoría se encontraron en los tres grados de cáncer. Nm3 núcleos, por otra parte, muestra una amplia variación de la cromatina y la distribución se encontraron preferentemente en alto grado de cáncer. Automatizado de detección de estos tejidos de micro-objetos en la imagen histológico no sólo elimina el sesgo del ojo humano en la determinación del grado histológico se desliza sino que también nos ha permitido detectar e identificar el tipo de núcleos de cientos de miles de células por diapositiva, una tarea que no puede ser realizada por determinación visual de la morfología de los núcleos.

Los núcleos de alta densidad de las regiones del estroma se calcularon utilizando la siguiente segmentación de adaptación método descrito en los Materiales y Métodos sección. Estas regiones potencialmente contienen información importante acerca de la progresión del tumor. Hemos encontrado la medida de tejido graso y el tejido de las regiones carentes de la imagen varía bruscamente de diapositiva a diapositiva, incluso en los subgrupos de histología idéntica clasificado diapositivas y, por tanto, este parámetro no puede ser utilizada clínicamente relevante en la clasificación de las imágenes histológicas. Por otra parte, la distribución espacial de los núcleos de datos permite la identificación de los conductos mamarios y las secciones tubulares en la histología diapositivas. Distinción de la sección tumor imágenes utilizando diferentes algoritmos de clasificación basados en el aprendizaje supervisado prueba de la capacidad de diferenciar el grado de dos micro-objeto características: el número de núcleos Nm3 por unidad de área (DNM3) y el número de túbulos por unidad de área (DT) en la núcleos de alta densidad región del estroma. Clasificación de la sección de imágenes utilizando estos dos parámetros de textura separados imágenes obtenidas de Grado Iy Grado III histología diapositivas en distintas categorías (C1, C3) y se colocan las imágenes obtenidas a partir de grado II en diapositivas entre estas dos categorías. En muchos casos la sección de imágenes obtenidas a partir de la misma diapositiva se clasifican en diferentes categorías (C1, C2, C3), pero el grado de la diapositiva (GI, GII, GIII) era típicamente asociados con la más frecuentemente observada tipo de clasificación. Estamos prever la incorporación de características adicionales, como el número de dividir la densidad de núcleos y la intensidad de las manchas de identificar el cáncer de marcadores moleculares asociados en el sistema de clasificación para lograr una sub clasificación de los tumores de mama.

Nuestros resultados sugieren que la computadora basada en el procesamiento de imágenes y análisis pueden ser usados en para ayudar a los patólogos el desempeño de esta tarea y dar lugar a una reducción en los intercambios intracomunitarios, la variabilidad del observador. El potencial clínico de la de procesamiento de imagen y sistema de clasificación que aquí se presenta se incrementará cuando se estudió en combinación con otras características de múltiples plataformas de evaluación de cáncer, como biomarcador de datos de imágenes decoradas, mundial perfiles de expresión génica y de aberraciones cromosómicas mediciones.

Conflicto de intereses

Los autores declaran que no tienen intereses en conflicto.

Autores de las contribuciones

SP llevó a cabo la adquisición y digitalización de diapositivas histología, diseñado e implementado los algoritmos para el procesamiento de imágenes, análisis y clasificación de la histología diapositivas, y ayudó a redactar el manuscrito. FG y MH llevó a cabo la clasificación patológica y la selección de diapositivas y la histología guiado SP en la generación de la capacitación y la validación de datos. CK participado en la aplicación de procesamiento de imágenes y análisis de algoritmos. AT supervisado y coordinado todo el proyecto, participaron en el proceso de análisis, y ayudó a redactar el manuscrito. Todos los autores leído y aprobado el manuscrito final.

Pre-publicación de la historia

La pre-publicación de la historia de este documento puede accederse en:

Agradecimientos

National Science Foundation Grant # 235327.

Instituto Nacional de Salud Grant # 232240.

Pennsylvania Departamento de Salud Grant # 240205.