Journal of NeuroEngineering and Rehabilitation, 2005; 2: 16-16 (más artículos en esta revista)

El uso de métodos de agrupamiento jerárquico para clasificar las actividades de motor de pacientes con EPOC de datos de sensores portátiles

BioMed Central
Delsey M Sherrill (dsherrill@partners.org) [1], Marilyn L Moy (mmoy@partners.org) [2], John J. Reilly (jreilly@partners.org) [2], Paolo Bonato (pbonato@partners.org ) [1]
[1] Departamento de Medicina Física y Rehabilitación, Escuela de Medicina de Harvard, Spaulding Rehabilitation Hospital, Boston, MA, EE.UU.
[2] Departamento de Medicina, Escuela de Medicina de Harvard, Brigham and Women's Hospital, Boston, MA, EE.UU.
[3] La División Harvard-MIT de Ciencias de la Salud y Tecnología, Cambridge, MA, EE.UU.

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

Los avances en tecnología de sensores en miniatura han llevado al desarrollo de sistemas portátiles que permiten un motor para vigilar las actividades en el campo. Una variedad de clasificadores que se han propuesto en el pasado, pero se ha hecho muy poco al desarrollo de enfoques sistemáticos para evaluar la viabilidad de discriminar las tareas de motor y de interés para orientar la elección de la arquitectura clasificador.

Métodos

Se introduce una técnica para resolver este problema de acuerdo a una estructura jerárquica y su uso está demostrado por la aplicación de la detección de las actividades de motor en pacientes con enfermedad pulmonar obstructiva crónica (EPOC) en la rehabilitación pulmonar. Acelerómetros se utilizan para recopilar datos de 10 diferentes clases de actividad. Características se extrajeron para capturar propiedades esenciales del conjunto de datos y reducir la dimensionalidad del problema a la mano. Cluster medidas se utilizaron para encontrar agrupaciones naturales en el conjunto de datos y, a continuación, la construcción de una jerarquía de las relaciones entre los grupos para orientar el proceso de fusión de las agrupaciones que son demasiado similares para distinguir con fiabilidad. Proporciona un medio para evaluar si los beneficios de la fusión para el cumplimiento de un clasificador superan a la pérdida de la resolución se haya incurrido a través de la fusión.

Resultados

Análisis de la EPOC conjunto de datos de motor de manifiesto que las tareas relacionadas con la deambulación puede ser discriminado fiable de tareas realizadas en una posición sentada con las piernas en movimiento o estacionarios utilizando dos características derivadas de un acelerómetro. Clasificación de las tareas de motor dentro de la categoría de las actividades relacionadas con la deambulación requiere técnicas más avanzadas. Si bien en algunos casos todas las tareas que podrían ser clasificados con precisión, en la fusión de otros grupos asociados con diferentes tareas motrices era necesario. Cuando la fusión de los grupos, se constató que el método propuesto podría dar lugar a más de 12% de mejoría en la precisión del clasificador sin perder resolución, de 4 tareas.

Conclusión

Agrupación jerárquica métodos son relevantes para el desarrollo de los clasificadores de actividades de motor a partir de los datos registrados utilizando sistemas vestibles. Permiten a los usuarios a evaluar la viabilidad de un problema de clasificación de las arquitecturas en las que elegir y maximizar la precisión. Basándose en este enfoque, la importancia clínica de discriminar tareas motrices pueden ser fácilmente tomados en consideración al formular el clasificador.

Antecedentes
Móvil de Vigilancia de Actividades de motor

Durante la última década, el interés de investigadores y clínicos se ha centrado en portátiles y sistemas de sensores, como medios para vigilar las actividades de motor en el hogar y en el seno de la comunidad [1 - 3]. Las medidas objetivas de las actividades físicas fuera del cuadro clínico son solicitados por objeto informe es notoriamente inexactas. Por ejemplo, Pitta et al. [4] muestran que los sujetos sobrestimado el tiempo dedicado a pie, en bicicleta, y de pie, y subestimó el tiempo dedicado sesión y mentiras. Se utilizó un acelerómetro triaxial para cuantificar el tiempo pasado en un protocolo normalizado de pie, en bicicleta, de pie, sentado, tumbado y en pacientes con enfermedad pulmonar obstructiva crónica (EPOC). Ellos grabado en vídeo la ejecución del protocolo y pidió a los sujetos para estimar el tiempo pasado en cada actividad. Las diferencias entre los resultados de la cinta de vídeo y el acelerómetro osciló entre el 0% (sesión) a 10% (acostado). En contraste, las diferencias entre el paciente y la cinta de vídeo informe osciló entre el 18% (mintiendo) al 59% (a pie).

El dispositivo más sencillo para controlar las actividades de motor consta de un solo acelerómetro colocado en el cuerpo segmento de la mayoría de los que participan en la actividad motora de interés [3]. Podómetros y contadores paso son los más populares entre estos dispositivos. Desde mediados de los noventa, los investigadores han utilizado este método para estimar el nivel general de actividad y gasto de energía (por ejemplo, [5, 6]]. Una serie de estudios se han dedicado a investigar los usos clínicos de los sistemas basados en una única acelerómetro. Entre otros, Steele et al. [7, 8] medido movimiento humano en tres dimensiones de más de 3 días y demostró que la magnitud de la aceleración de vectores se correlaciona con medidas clínicas existentes, tales como los seis minutos de distancia a pie, VEF1 (volumen espiratorio forzado en 1s), la disnea, y Función física dominio de la salud relacionados con la calidad de vida. Moy et al [9] puso de manifiesto que la vigilancia de la deambulación en pacientes con EPOC durante períodos de dos semanas en el entorno familiar se correlaciona con las evaluaciones mundiales de la salud relacionados con la calidad de vida como la General de Salud y Salud Mental de la SF-36. Las limitaciones de estos dispositivos es que registran únicamente la deambulación, no evaluar los movimientos parte superior del brazo, no puede discriminar cambios en el grado y la intensidad de trabajo, y no evaluar las respuestas sistémicas concomitantes.

Para superar, al menos, algunas de las limitaciones de los dispositivos basados en un único dispositivo, los investigadores han desarrollado sistemas vestibles ambulatorios y al mismo tiempo controlar el movimiento de varios segmentos corporales. Aunque existe un equilibrio en la sencillez de uso, la capacidad de estos sistemas para medir la orientación (debido al efecto de la gravedad) y la aceleración de los distintos segmentos, así como la coordinación intersegmental, ha abierto la puerta a una gran variedad de aplicaciones Que requieren la identificación de las actividades específicas. A finales de los años noventa, varios equipos de investigación [10 - 13] alcanzado más de un 70% de sensibilidad a cada una de 4 clases de actividad: sentado, de pie, acostado, y el movimiento dinámico. Los investigadores utilizaron los datos de los madereros en miniatura conectado a acelerómetros que se adjunta al esternón / cintura (bi-o triaxial) y de uno o de ambos muslos (uniaxial), y los datos fueron recolectados en condiciones controladas de laboratorio. 5-El uso de un sensor de configuración, Fahrenberg y Foerster [13] subdividen las 4 clases separadas en 13 tareas: 3 tipos de la sesión, 4 tipos de mentir, 5 tipos de dinámica de movimiento, y de pie. Sensibilidad para las diferentes tareas que osciló entre 82 y 98%.

Durante los últimos cinco años, numerosos equipos de investigación desarrollado aún más el potencial de los sistemas basados en acelerómetro para vigilar las actividades de motor en el campo. Entre otros, Schasfoort et al [14] primera se centró en la cuantificación de la actividad superior del cuerpo por medio de acelerómetros. El desarrollo de la técnica fue seguida de su aplicación a la evaluación del grado de discapacidad y limitación de actividad en pacientes con síndrome de dolor regional complejo tipo I [15]. Sherrill et al [16] explorado el uso de un seguimiento de la actividad para reunir la información relacionada con el nivel de independencia de las personas similar a lo que es, por lo general realizado por una Medida de Independencia Funcional de evaluación [17]. Bussmann et al [18] utilizaron un acelerómetro basado en el sistema para evaluar la movilidad en transtibial amputados. Otros equipos de investigación exploró el uso de acelerómetros para vigilar pautas motoras en pacientes con enfermedad de Parkinson [19 - 22] y después de la rehabilitación después de un accidente cerebrovascular personas [23, 24].

En los estudios mencionados hasta el momento, los algoritmos desarrollados y se utilizan para identificar las diferentes actividades de motor constituyen un punto clave de los métodos propuestos. Varios métodos han sido desarrollados por nuestro equipo y otros que van desde la simple aplicación de la norma basada en clasificadores [12, 23, 25, 26] a los complejos algoritmos de reconocimiento de patrones de una combinación de redes neuronales y neuro-difusos sistemas de inferencia [16, 19 ]. Cuando las diferencias se conocen claramente a priori que existe entre las actividades de motor para ser identificado (por ejemplo, sentado frente a caminar), basado en normas sencillas clasificadores suelen ser suficientes. Sin embargo, cuando las actividades de interés son complejos, y las diferencias entre ellos más sutil y sujeto a la variabilidad individual, más avanzados algoritmos de reconocimiento de patrones son llamados para. En la mayoría de situaciones del mundo real, el conjunto de las actividades de motor objeto de la investigación incluye a miembros de ambas categorías. Un enfoque jerárquico como la propuesta por Mathie et al. [2] parece un buen compromiso. En Mathie et al. "S sistema de clasificación, los movimientos se clasificaron muy general, en la parte superior de la jerarquía (frente a la actividad de descanso) y luego subdividen, de más de 4 niveles adicionales, en cada vez más especializados submovements utilizando un binario de decisión en cada nodo. Los autores alcanzado un promedio del 97% precisión en la identificación de 15 submovements (7 posturas estáticas, 5 postural transiciones, dinámico y 3 categorías).

Los métodos descritos en el presente documento pueden ser vistos como una extensión de Mathie et al. "S marco para incluir una mayor variedad de actividades de dinámica de las extremidades superiores e inferiores. En particular, para la EPOC población (la población de pacientes objetivo de la solicitud se describe en este manuscrito) es importante distinguir los subtipos de la deambulación, ya que corresponden a distintos niveles de esfuerzo físico: subir escaleras o una inclinación es más que fatiga caminar Sobre terreno plano o descender escaleras o una inclinación. Para estas actividades, no está claro desde el principio que el acelerómetro características de los datos mejor distinguir estas condiciones. De hecho, no hay ninguna garantía de que los datos aún contienen información suficiente para hacer tales distinciones en todos los casos, o en todos los temas, debido a las variaciones individuales en el tipo de cuerpo y el patrón de movimiento. Nuestro enfoque es esencial para confiar en las técnicas de agrupación de explorar el conjunto de datos para cada individuo, determinar si corresponden a distintos grupos de motor diferentes tareas, determinar si unas reglas sencillas puede contraste en relación con los distintos grupos de tareas, y evaluar la necesidad de la fusión de grupos en la que la información Acelerómetro derivados de los datos parece insuficiente para resolver diferentes tareas motrices.

Aplicación de Medicina

Para demostrar la eficacia del enfoque propuesto, de un conjunto de datos registrados de los pacientes con EPOC se utiliza. Supervisión de las actividades de motor en los pacientes con EPOC es de gran interés clínico. La EPOC es que se predice la tercera causa más frecuente de muerte en el mundo para el año 2020 [27]. Que afecta a más de 15 millones de estadounidenses, es el resultado de más de 15 millones de visitas al médico cada año, y causa alrededor de 150 millones de días de incapacidad por año [28]. El total de costos directos de atención médica relacionadas con la EPOC es de aproximadamente $ 15 mil millones por año [29]. La EPOC es una constante progresiva, debilitante enfermedad en la que los médicos son en gran medida ineficaces. Con la disminución de la función pulmonar, los pacientes tienen un mayor riesgo de hospitalizaciones, necesidad de oxígeno suplementario terapia, la disminución de la capacidad de ejercicio, y de la muerte. El ejercicio físico, en particular, es un componente fundamental para el tratamiento médico de la EPOC para prevenir deconditioning, para mejorar la salud relacionada con la calidad de vida, y para optimizar la respuesta a las intervenciones quirúrgicas [30]. De ahí que la mejora de la capacidad de ejercicio es un objetivo de mayor importancia en el tratamiento de pacientes con EPOC.

Celli et al [31] mostró que la tolerancia al ejercicio, que refleja las consecuencias sistémicas de la EPOC, sumado a la capacidad de predicción para predecir la mortalidad de VEF1, la larga data de "estándar de oro" medida de la progresión de la enfermedad en la EPOC. La tolerancia al ejercicio se puede evaluar en el ámbito clínico progresivo a través de la prueba de ejercicio cardiopulmonar incremental. Desarrolladas tanto en un tapiz rodante o bicicleta estacionaria, cardiopulmonar ejercicio de las pruebas de integración de información sobre el rendimiento metabólico, cardiovascular, ventilatorio y procesos que se producen durante el ejercicio. La tolerancia al ejercicio también se puede medir indirectamente a través de pruebas de tiempo de pie, las ventajas de las cuales son la sencillez, la mínima las necesidades de recursos, y la aplicabilidad general. Sin embargo, los inconvenientes de tiempo de caminar pruebas incluyen la dependencia de los pacientes y el administrador de la motivación, los efectos de aprendizaje, y un potencial de la variabilidad inter-ensayo si los administradores dar instrucciones diferentes o el aliento durante las pruebas por separado en el tiempo [32].

Por otra parte, ni la prueba de ejercicio cardiopulmonar, ni el tiempo de las pruebas a pie de captura trabajo realizado por las extremidades superiores. Se ha demostrado que el brazo no ejercicio en pacientes con EPOC produce dyssynchronous respirar, y, por tanto, la sensación de disnea y fatiga muscular [33]. Durante el brazo sin trabajo, el accesorio de los músculos de inspiración ayudar a la posición del tronco y los brazos. Se aventura la hipótesis de que el exceso de demanda a los músculos durante estos brazo esfuerzo conduce a la fatiga temprana, una mayor carga sobre el diafragma, y dyssynchronous toracoabdominal inspiraciones. Por lo tanto, una medición precisa de los superiores, así como extremidades inferiores la capacidad de ejercicio es importante en la evaluación de estos pacientes.

Los pacientes con EPOC experiencia variaciones diarias de su estado clínico, con "buenos y malos días" se producen en función de secreciones de la vía aérea, el clima húmedo, y otros factores ambientales. Además, los pacientes con EPOC demuestran ampliamente la capacidad de ejercicio variable incluso cuando tienen idénticos grados de obstrucción al flujo aéreo por las pruebas de función pulmonar [34]. Estos factores motivan fuertemente el desarrollo de un portátil, a título individual-personalizable sistema para supervisar la actividad en el hogar y la comunidad durante días o semanas a la vez como un suplemento (o alternativa) a los ensayos controlados de laboratorio administrado en un solo punto en el tiempo. Hasta la fecha, un número de investigadores [7, 8, 26, 30, 35] han llevado a cabo estudios preliminares para evaluar la pertinencia de las medidas en el campo de la EPOC pacientes con resultados alentadores. Por tanto, es especialmente apropiado para utilizar los datos registrados de los pacientes con EPOC como una demostración de la actividad motora de clasificación de las técnicas propuestas en el presente documento. En las secciones siguientes, que resumen el protocolo de recogida de datos, describir los procedimientos para estimar las características de la aceleración de datos, demostrar el uso de métodos de agrupación para el análisis de la función fija, y discutir la generalización del enfoque propuesto para la construcción de clasificadores de las actividades de motor De los datos de campo.

Métodos
Recolección de Datos

Hemos reunido los datos de seis personas con EPOC grave en un entorno clínico controlado (Brigham & Women's Hospital de la División de Rehabilitación Pulmonar). Los sujetos con edades de 51 a 80 años (edad media 63). Biaxial se acelerómetros montados en el aspecto lateral de cada uno de los temas del derecho y antebrazo izquierdo (aproximadamente 10 cm proximal a la muñeca conjunta) y en el aspecto lateral de la derecha y muslo izquierdo (aproximadamente 10 cm proximal a la articulación de la rodilla). Los ejes sensibles estaban orientadas a la captura en el aceleraciones de hasta abajo y anteroposterior direcciones. Tenga en cuenta que la ubicación de los sensores se describe asumiendo una posición de referencia de la postura erguida, con los brazos a los lados y las palmas frente a la línea media del cuerpo. Otra biaxial sensor se coloca sobre el esternón al sentido hasta abajo y de las mociones mediolateral del tronco. Los sujetos fueron equipado con una grabadora de Vitaport 3 ambulatoria (Temec BV, Países Bajos, que se muestra en la Figura 1], desgastados sobre la cintura, a la muestra digitalmente (128 Hz) y almacenar 10 canales de datos continuamente durante todo el experimento. Se presto atención a los cables de seguridad y minimizar el impacto del sistema sobre la capacidad de los pacientes a desplazarse libremente.

Los sujetos tuvieron que llevar a cabo 10 tareas de acuerdo a un protocolo pre-definido por lo menos un minuto cada una. El protocolo incluyó tres ejercicios aeróbicos típico de la rehabilitación pulmonar prescrito ejercicio físico para estos pacientes (caminar sobre un tapiz rodante, el ciclismo en una bicicleta estacionaria, y la bicicleta en un brazo ergometer), cinco en representación de la deambulación tareas en un medio ambiente de vida libre (nivel caminar En un pasillo, de ascenso y descenso, hay una rampa ascendente y / bajar escaleras), y otros dos de vida libre, plegado de lavandería en un posición sentada y barrer el suelo con una escoba. Estas dos últimas tareas motrices fueron considerados para evaluar si es posible rechazar las tareas que son de alguna manera similares desde un punto de vista biomecánico a los de los intereses, es decir, ejercicios aeróbicos y de las tareas que representan a la deambulación. La identificación de toda la gama de condiciones de circulación permitiría a la evaluación de los pacientes en general la movilidad, además de su cumplimiento de una rutina de ejercicios prescritos. Tenga en cuenta que para ciertas tareas, como subir escaleras, no fue posible reunir datos de forma continuada durante todo un minuto en todos los temas, debido a la naturaleza físicamente exigente de esas tareas. El experimentador mantiene un diario de las actividades del sujeto y se utiliza un manual marcador a la serie de sesiones de grabación. El protocolo experimental fue examinado y aprobado por el Brigham & Women's Hospital grupo de Partners HealthCare Humanos, la Comisión de Investigación.

Ejemplos de señales para un acelerómetro pocas tareas motrices de una asignatura se muestra en la Figura 2. Los datos se presentan para cuatro tareas motrices, es decir, el nivel en un pasillo caminando, en bicicleta, subiendo una rampa, escaleras y ascendente. Las señales de los acelerómetros coloca a la derecha y la izquierda piernas orientada en el antero-posterior y hasta abajo se trazan direcciones. Estos ejemplos demuestran las diferencias y semejanzas en los patrones de acelerómetro datos a través de tareas motrices. Por ejemplo, los datos relacionados con el ciclismo son notablemente diferentes de los datos relacionados con el nivel de caminar. Por otra parte, más sutiles diferencias acelerómetro marca registrada de datos mientras que el tema era ascendente escaleras y las señales se reunieron mientras el tema era una rampa ascendente.

Pre-procesamiento y extracción de características

Todas las rutinas de procesamiento se desarrollaron utilizando Matlab (The MathWorks, Natick, MA). Los datos fueron filtrados digitalmente (5 º orden elíptica lowpass, fc = 15 Hz, 1 Hz de ancho de banda de transición, la tolerancia paso 0,5 dB, stopband mínimo de 20 dB de atenuación, la no aplicación de causalidad) para eliminar de alta frecuencia (ruido) no guardan relación con los componentes o las extremidades Tronco movimiento. Además, para separar los componentes relacionados con la aplicada aceleraciones de los relacionados con la serie de sesiones de cambio de la orientación de cuerpo, un alto filtro digital se aplicó (2 º orden elíptica, fc = 0,5 Hz, 0,5 Hz de ancho de banda de transición, la tolerancia paso 0,5 dB, stopband mínimo de 20 dB de atenuación , La no aplicación de causalidad).

La extracción de las épocas de mayor análisis fue realizado por un deslizamiento 3s ventana a través de la grabación en intervalos de 1s para extraer las épocas. Tenga en cuenta que esto dio lugar a una superposición del 66% entre las sucesivas épocas. Luego los 9 rasgos fueron extraídos por época para cada canal (o par de canales, como se indica):

I. Series temporales características (3):

• La media (antes de filtrado de alto) se calcula como una medida de orientación de las extremidades y / o postura (todas las demás características se derivan de los datos filtrados alto)

• RMS por cada canal de la energía se calculó como medida de la magnitud de la aceleración global de aplicarse a cada segmento corporal

• Rango de cada canal, una medida de la aceleración máxima

II. Características espectrales (2):

• componente dominante de frecuencia (es decir, 0,5 Hz bin con mayor energía) de entre 0,5 y 15 Hz

• Relación de la energía dominante en el componente a la frecuencia total de la energía por debajo de los 15 Hz (una estimación de la cantidad de la señal está dominada por una determinada frecuencia, es decir, su periodicidad)

III. Correlación características (4):

• Rango de la función de autocorrelación, una medida de la modulación de la señal (estimación objetiva)

• Valor de la función en cero crosscorrelation lag (para todos los posibles pares de brazo y pierna canales), una medida aproximada de intersegmental coordinación.

• Peak crosscorrelation valor de la función (por un retardo en el tiempo entre -0,5 a 0,5 s), una medida de la similitud de los patrones de movimiento a través de los segmentos corporales.

• Tiempo de desfase correspondiente a la cima de la crosscorrelation función, que es una medida de la demora entre la circulación de los pares de segmentos corporales

Todas las características fueron evaluados inicialmente por la coherencia y la variabilidad a través de tareas por medio de técnicas de visualización de datos. Algunas funciones fueron excluidas de un nuevo análisis de las tareas motrices asociados a la deambulación, ya que se encontraron fiable para interferir con la separación de estas tareas. En primer lugar, todas las funciones derivadas de los sensores en los brazos fueron excluidos debido a que su posición puede variar mucho. Por ejemplo, durante una determinada tarea ambulatorio, el individuo podría swing sus armas libremente, aferrarse a una barandilla con un brazo, o llevar un objeto, mientras que el objetivo es identificar independientemente de la tarea de esta índole. En segundo lugar, porque el actual objetivo es identificar la tarea independientemente de la velocidad, la característica dominante de frecuencia para todos los canales, fue excluido a causa de su dependencia de la velocidad de locomoción. Es previsible que se puede utilizar esta función en el futuro, a fin de evaluar la velocidad, que puede resultar de utilidad para el marcado de las condiciones que son físicamente más gravar. En total fueron 48 los valores característica por la época en la tarea de análisis ambulatorio. Los datos se normalizaron a través de los sujetos. El análisis de componentes principales [36] se realizó para reducir aún más la dimensión de la transformación de los datos y la retención de los 6 primeros componentes, que representaron alrededor del 90% de la varianza total. Este paso fue necesario debido al pequeño tamaño de la muestra.

Análisis de Procedimientos

La primera etapa en la evaluación del grado de similitud entre las clases era de visualizar el conjunto de características reducido en dos dimensiones con un gráfico de dispersión de la 1 ª y 2 ª componentes principales. Esto es útil para construir la intuición acerca de la estructura del conjunto de datos, sino un método más objetivo para el análisis de similitud es deseable desde un punto de vista de automatización. Una medida objetiva de la similitud permitiría análisis más sistemático de la tarea de identificación exactitud cómo se ve afectada por la fusión de las clases.

Con el fin de medir la distinguishability de un subconjunto de tareas sobre la base de acelerómetro derivadas de los datos, los grupos se definieron sobre la base de las etiquetas de clase y, a continuación, la correspondencia entre las etiquetas y las agrupaciones naturales en los datos que se midió. Debido a que comienzan con el conocimiento de los datos de las etiquetas, se trata de una inversión de la clásica sin supervisión paradigma de aprendizaje donde los grupos se definen sobre la base de las propiedades de los datos y, a continuación, utiliza para etiquetar los datos. En el problema sin supervisión, el número de grupos rara vez se conoce a priori. Un típico enfoque es tratar una gama de valores posibles para el número de grupos y, a continuación, elegir la agrupación que maximiza una pre-definidos grupo índice de calidad (PMC). Nuestro enfoque se utiliza para medir el grupo PMC similitud mediante el cálculo de su valor para cada par de grupos.

Dos de los más citados en la máquina CQIs aprendizaje Dunn literatura son el índice de [37] y el índice de Davies-Bouldin [38]. Bezdek y Pal [39] presentó un marco para generalizar el índice de Dunn, para que virtualmente cualquier combinación de las cifras de la separación del grupo y la categoría de tamaño podría ser utilizado para definir un índice de calidad del grupo. El Generalizado Dunn's "intercluster distancia" V GD para un grupo determinado pareja es la separación entre agrupaciones normalizado por el promedio de su diámetro (favoreciendo, por lo tanto, ajustados, agrupaciones esféricas espaciados muy separadas):

La separación, δ, y diámetro, Δ, puede ser calculado de diversas maneras. Bezdek y Pal [39] presentó seis posibles métodos para calcular δ y tres métodos para el cálculo de Δ, y evalúan el desempeño de todas las combinaciones posibles en seis conjuntos de datos de referencia. Basándose en el éxito de los resultados obtenidos en el desempeño de sus simulaciones, hemos seleccionado las siguientes definiciones de δ y Δ:

En Eq. 1-3, X i denota el conjunto de puntos de datos en el grupo correspondiente a la tarea ª i, x i denota un punto de datos que figura en el X i (es decir, un vector de la función de los valores derivados de una época de los datos del sensor), | X I | el número de puntos de datos en el cluster i ª, y μ i el centroide de X i (es decir, más de media en todos los x i X i). Todas las distancias son vectores de Euclides, es decir, . La separación δ es la suma de las distancias de Euclides pairwise entre el centroide de un grupo y todos los puntos en el otro grupo, y viceversa, dividido por el número total de puntos en ambos grupos. Δ Cluster diámetro es la distancia media entre los puntos de datos en el cluster y el grupo centroide, multiplicado por un factor de 2 a convertir cada radio hasta un diámetro.

Después de haber elegido un PMC para medir la similitud, el siguiente paso es definir una jerarquía basada en esta información. En concreto, hemos utilizado un algoritmo de vinculación para construir un dendrograma, un diagrama en el que los objetos similares se han unido vínculos cuya posición vertical indica el nivel de similitud entre los objetos. El promedio de vinculación algoritmo, o UPGMA (Unweighted Pair Grupo Método con promedios aritméticos [40]], fue seleccionado debido a su probada solidez a los valores aislados [39]. Este algoritmo formas vínculos entre dos objetos basado en la distancia media entre todos los pares de objetos de menor rango. Desde el dendograma, la fusión de una secuencia de pasos se derivó a partir de la parte inferior nivel (no fusión), y se desplazan hasta un nodo a la vez, en la que cada nodo representa la fusión de dos nodos más bajos.

Ejecución y pruebas

Para evaluar el efecto de las sucesivas fusiones de la exactitud ambulatoria tarea de la discriminación, un simple clasificador se aplicó en cada punto de la secuencia. Análisis discriminante lineal (LDA) se seleccionó para la clasificación debido a que su parametrización es mínima y, por lo tanto, muy adecuado para los pequeños conjuntos de datos. Cada nivel de la fusión fue entrenado y probado independientemente, con un conjunto equilibrado de datos, es decir, un conjunto de datos de la muestra por igual de cada clase. 75% de las muestras en el conjunto de datos se utilizaron para formar el clasificador, y el restante 25% se utilizaron en las pruebas. Además, todo el proceso de formación y las pruebas se repitió para 100 rotaciones del conjunto de datos a fin de que las estimaciones de rendimiento (sensibilidad y errores de clasificación) serían menos dependientes de la época de selección y menos sensible a los valores atípicos. Sensibilidad se define como el número de veces que una Tarea fue detectado correctamente dividido por el número de las épocas correspondientes a esa tarea. Errores se define como el número de identificación de una tarea en particular derivados de otras tareas (es decir, incorrecta detecciones de esa tarea) dividido por el número de épocas que corresponden a otras tareas.

Resultados
Clasificación de alto nivel

En el nivel superior de la jerarquía, el conjunto de 10 tareas se dividió en tres subcategorías (ambulatorio, sedentarias, con las piernas en movimiento, y el sedentarismo con piernas estacionario) con un simple umbral enfoque similar a la de Mathie et al [2]. De los seis temas, una sensibilidad de 100% y 0% de errores de clasificación fueron logrados por los siguientes criterios:

1) Si la media de muslo derecho acelerómetro (hasta abajo del eje) es superior a 0,6 g, la tarea es sedentario, de lo contrario, es tarea ambulatoria.

2) Si la tarea es sedentaria y RMS del muslo derecho acelerómetro (eje anteroposterior) es elevado (por ejemplo, superior a 0,1 g), las piernas se mueven, de otro, las piernas son estacionarias.

En la Figura 3, la media de muslo derecho acelerómetro (hasta abajo del eje) y RMS del muslo derecho acelerómetro (eje anteroposterior) se trazan para épocas en representación de los seis temas estudiados con el fin de demostrar la eficacia de este enfoque. Sin embargo, es evidente que se necesitan más características que deben tenerse en cuenta con el fin de hacer más distinciones entre tareas, y no se sabe si hay suficiente información en los datos para hacer tales distinciones en todos los casos. A continuación demostrar el uso de la PMC / cluster fusión de los métodos descritos anteriormente, centrándose en la identificación de 6 ambulatorios tareas: caminar sobre un tapiz rodante, el nivel caminar en un pasillo, de ascenso y descenso escaleras, y el ascenso y descenso una rampa.

Ambulatorio tarea de clasificación

Resultados para LDA basada en la clasificación de seis ambulatorios tareas se resumen en la figura 4. Sólo tres de los seis sujetos tenían por lo menos 25 épocas disponibles para todos los ambulatorios tareas, por lo que los resultados se muestran sólo para estos tres temas (en lo sucesivo denominadas A, B, y C). Para los sujetos A y B, la mejora de la sensibilidad de 79% a 98% y los errores de clasificación se redujo de 4,2% a 1,9% en el número de racimos disminuyó. Por tema C, la fusión de tareas no se ha traducido en una mejora sustancial ya que la precisión era ya bastante elevada en el caso desinstalaste.

En general, parece que el método muy favorable para la fusión de las tareas tanto como sea posible. Este no es un resultado sorprendente ya que la probabilidad de clasificar correctamente por azar una muestra incrementos del 17% al 50% según el número de grupos disminuye de 6 a 2. La decisión final sobre qué nivel de la fusión es apropiado, deberá tomar en cuenta el contexto de la aplicación. Por ejemplo, en el caso de la EPOC vigilancia de la actividad, el objetivo es realizar el seguimiento de la respuesta fisiológica en el tiempo asociados a sus diferentes actividades extenuantes. Es por ello que dudan de fusionar las tareas, por ejemplo, escaleras de ascenso y descenso escaleras debido a la muy diferente metabólicas costos relacionados con esas actividades. Sin embargo, la fusión de nivel caminar junto con caminar por un plano inclinado es una pérdida de refinamiento aceptable si el general es la mejora de la precisión de detección. Alternativamente, la solicitud podría exigir un nivel mínimo de sensibilidad, en cuyo caso se podría elegir el conjunto fusionado mínimamente (es decir, que con el mayor número de grupos distintos) que criterio. Por ejemplo, la fijación de un mínimo de sensibilidad del 90% conduciría a la selección de la configuración de clúster de 4 para los sujetos A y B, y la selección de la configuración original para desinstalaste Asunto C.

Los resultados detallados de estos temas se muestran en las Figuras 5, 6, y 7. Dendrogramas de la jerarquía de grupo, la barra de parcelas por ciento de sensibilidad y de errores de clasificación por tarea, y gráficos de dispersión de la 1 ª y 2 ª componentes principales de la desinstalaste configuración se muestran para la comparación. Las tres parcelas en una cifra comparten un mismo esquema de color.

Por sujeto B, la Figura 5 ilustra la manera en que el grupo jerarquía se muestra en el dendrograma de la izquierda refleja la estructura interna de los datos que se visualizan en el gráfico de dispersión a la derecha. Concretamente, la parte inferior tres tareas en el dendrograma (nivel caminar, la inclinación hacia abajo, y hasta de inclinación), con una relativamente baja relación distancia (0.6-0.7) son los que tienen la mayoría de superposición en el gráfico de dispersión. El siguiente nivel en el dendograma es caminar sobre un tapiz rodante, y en el gráfico de dispersión es evidente que los correspondientes puntos de formar un grupo que está cerca, pero no con la superposición de los tres primeros. Las otras dos tareas están bien separados en el gráfico de dispersión de los primeros cuatro tareas y el uno del otro, y, de hecho, la vinculación de estas tareas las distancias son relativamente altas (1,4-1,6).

En la Figura 6, el dendograma de un sujeto es también un reflejo de las relaciones entre los grupos de tareas que son evidentes en el gráfico de dispersión de acompañamiento. Es decir, existe una clara escisión de tres vías en el gráfico de dispersión de datos, que corresponde a tres agrupaciones naturales. Lo que se propone por el gráfico de dispersión se corresponde con el segundo y tercer niveles de la fusión en el dendograma, la tarea de caminar sobre un tapiz que muestra el mayor vinculación distancia de las otras dos secciones. Este ejemplo muestra también que el dendrograma no es estrictamente de izquierda ramificación en todos los casos.

En el gráfico de dispersión para la reserva de C, a la derecha se muestra en la Figura 7, las seis de los ambulatorios tareas están bien separados sobre la base de sólo los dos primeros componentes principales. De hecho, cada tarea se identifica con una alta precisión, como se ha visto en la barra de parcelas de las características de funcionamiento. La estructura del dendrograma es coherente con estos resultados, además, porque incluso los más bajos niveles tiene un vínculo distancia comparativamente elevada (≥ 1,75). Este ejemplo demuestra que la fusión no es necesaria en todos los casos.

Discusión

Empezamos este trabajo por la revisión de los trabajos recientes sobre el uso de acelerómetros para vigilar las actividades de motor en el laboratorio y sobre el terreno. En particular, nos centramos en Mathie et al [2] de la estructura jerárquica, como una manera útil de formular el problema, y desarrolló una metodología que ampliar este marco para manejar las tareas más complejas dinámicas de las extremidades superiores e inferiores. El enfoque que hemos descrito combina las técnicas de análisis de cluster (PMC es decir, el promedio de conexión, dendrogramas) de una forma que es, a nuestro conocimiento, la novela. Para demostrar la aplicación de este enfoque a un conjunto de datos reales, la aplicación de la vigilancia y el libre ejercicio de actividades de vida en sujetos con EPOC a través de acelerómetros se utilizan. Alto nivel de las clasificaciones de la EPOC de datos no requiere el uso de técnicas especiales. La separación de las tareas en tres grupos de primaria se logra fácilmente utilizando umbrales en dos de las características derivadas de la acelerómetro señales de datos a través de los 6 temas. Sin embargo para el ambulatorio de la discriminación de las tareas de la técnica de la fusión era necesario en dos de los tres temas en los que se disponía de datos suficientes para estudiar la clasificación de las tareas ambulatoria. La fusión de tareas es necesario cuando los grupos asociados a algunas de las tareas motrices se superponen considerablemente. En los dos temas para los cuales la fusión de las agrupaciones era necesario, la técnica nos ha permitido mejorar la sensibilidad media en más de un 12% sin perder la resolución de 4 de tareas. En el tercer tema, la detección es muy buena, incluso para la desinstalaste conjunto, de modo que la fusión no tienen mucho efecto sobre el rendimiento.

Una de las ventajas de la técnica propuesta en este documento es la gran flexibilidad que permite en la elección de los algoritmos que se utilizarán en los diferentes niveles de la jerarquía clasificador. Esto fue demostrado por nuestro uso de una regla simple enfoque basado en tareas para discriminar ambulatorios y tareas realizadas en una posición sentada, junto con el uso de LDA para distinguir los diferentes tipos de tareas motrices ambulatoria. En cualquier momento del procedimiento, el usuario puede elegir el método que él / ella considera más probable que conduzca a la clasificación fiable, y de rechazar la fusión de las agrupaciones asociadas a determinadas tareas motrices porque su discriminación es esencial desde un punto de vista clínico. Si la fusión no es aceptable desde un punto de vista clínico, el usuario tiene la opción de modificar cualquiera de los análisis para tener en cuenta la limitada sensibilidad y especificidad alcanzable con el conjunto de datos disponibles (por ejemplo, mediante la sustitución de un algoritmo de clasificación), o añadir sensores vestibles Para reunir información que pueda distinguir mejor los pares de motor de tareas relacionadas con la superposición de los grupos.

Cabe mencionar que los métodos de manifiesto en este documento no se limitan a la tipo particular de los datos recogidos en este experimento. Que se puede aplicar a casi cualquier serie temporal de datos de una o más características derivados de múltiples sensores como los giroscopios, el Grupo de Gestión Ambiental, y la reconstrucción de la continuidad de las variables cinemáticas a través de sensores vestibles [16, 41 - 43]. Este trabajo también se puede utilizar para identificar subconjuntos de tareas que son más difíciles de determinar sobre la base de las funciones disponibles, y, en consecuencia, ayudar a diagnosticar qué tipo de sensor podría ayudar para distinguir la tarea (es decir, que tipo de sensor en qué lugar debe ayudar a mejorar La clasificación de actividades de motor).

La aplicación de la propuesta técnica a los datos obtenidos de pacientes con EPOC de puntos a una importante área de investigación en sistemas portátiles. Control de la situación de salud de los individuos sometidos a rehabilitación cardiopulmonar es, en efecto, una importante aplicación clínica de los sistemas portátiles. Creemos que los médicos puedan mejorar la gestión de los pacientes con EPOC si la información relacionada con el paciente el nivel de la actividad motora y las respuestas sistémicas asociadas fueron controlados. También creemos que la vigilancia se logró optimizar la capacidad de ejercicio y sostenida por los pacientes con EPOC después de participar en un programa de rehabilitación pulmonar. Sensores portátiles están ahora disponibles para vigilar la frecuencia respiratoria, frecuencia cardíaca, saturación de oxígeno y en una manera más discreta largos períodos de tiempo [44, 45]. A medida que los sistemas portátiles incluyen acelerómetros y otros sensores inerciales fácilmente disponibles se han convertido en [1], ha aumentado la necesidad de herramientas como la que hemos propuesto que a la sistemática de diseño de los clasificadores para identificar las actividades de motor. El siguiente paso en nuestra investigación sobre los pacientes con EPOC será la de estudiar la asociación de motor de las actividades y las respuestas sistémicas. Visualización de técnicas de minería de datos [46] será clave en la exploración de formas de presentar esta información a los médicos de una manera adecuada a las intervenciones clínicas rápida cuando sea necesario.

Conflicto de intereses

Los autores declaran que no tienen intereses en conflicto.

Contribuciones de los autores

Todos los autores contribuyeron a la identificación de la necesidad de vigilancia de pacientes con EPOC y el desarrollo de procedimientos experimentales para recoger datos clínicamente relevantes para el estudio. DMS PB y contribuido a la elaboración de los algoritmos utilizados en el estudio. Todos los autores contribuyeron a la discusión de los resultados.

Agradecimientos

Los autores desean agradecer a los siguientes miembros de la Brigham & Women's Hospital de la División de Rehabilitación Pulmonar por su asistencia en la coordinación de la programación y pruebas de los pacientes en el estudio: Carol Fanning, Sarah Hooper, Susan Peterson, y Priscilla Perruzzi. También estamos agradecidos por los esfuerzos de Mateo Lazzara durante las primeras etapas de la recopilación de datos.