Journal of NeuroEngineering and Rehabilitation, 2005; 2: 22-22 (más artículos en esta revista)

La gestión de la variabilidad en el resumen y la comparación de datos de andar

BioMed Central
Chau Tom (tom.chau @ utoronto.ca) [1], Scott Young (scott.young @ rogers.com) [1], Sue Redekop (sredekop@bloorviewmacmillan.on.ca) [1]
[1] Bloorview MacMillan Children's Centre, Toronto, Canadá
[2] Instituto de Ingeniería Biomédica y Biomateriales de la Universidad de Toronto, Toronto, Canadá

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen

Variabilidad en los datos cuantitativos de andar surge de muchas fuentes potenciales, incluidos los naturales de la dinámica temporal de control neuromotor, patologías neurológicas o de los sistemas musculoesquelético, los efectos del envejecimiento, así como las variaciones en el entorno externo, de asistencia, o de la instrumentación de metodologías de recolección de datos. A la luz de esta variabilidad, unidimensional, basado en el ciclo de andar variables como paso período debe considerarse como variables aleatorias y prototípicos único ciclo de cinética o cinemática curvas debe ser considerado como tiempo de las funciones aleatorias. Dentro de este marco, que ejemplifican algunas soluciones prácticas a una serie de problemas analíticos comúnmente en el tratamiento de la variabilidad de andar. Sobre el tema de andar univariado de las variables, estimación robusta se propone como un medio de hacer frente a los datos de andar contaminado, y el resumen de no andar normalmente distribuyen los datos se demuestra por medio de ejemplos empíricos. En el resumen de las curvas de andar, hablar de métodos para el manejo de la fase variación indeseable y no robusto propagación estimaciones. Para superar las limitaciones convencionales de las comparaciones entre la curva de hitos o parámetros, proponemos como una alternativa viable, la combinación de la curva de registro, la estimación robusta, y la estadística oficial de los ensayos de curvas como unidades coherentes. Sobre la base de estos debates, ya que proporcionamos heurístico directrices para el resumen de las variables de andar y de andar a la comparación de las curvas.

Introducción
Definición de la variabilidad

En el análisis cuantitativo de andar, la variabilidad es comúnmente entendida como la fluctuación en el valor de una cinemática (por ejemplo, conjuntos de ángulo), cinética (por ejemplo terreno fuerza de reacción), de espacio y tiempo (por ejemplo, intervalo de paso) o electromiográfica de medición. Esta fluctuación puede ser observado en mediciones repetidas en el tiempo, a través o dentro de las personas o del flujo, o entre diferentes medición, de intervención o de las condiciones de salud. En este artículo, nos centraremos en la variabilidad de dos tipos de datos: las variables y unidimensional de andar solo ciclo, prototípicos de andar curvas, que son los más comunes de las abstracciones espacio-temporales, cinemática y cinética de los datos, por lo general, recogidos dentro de un andar Laboratorio.

Medición

Muchos diferentes métodos de análisis que se han propuesto para la estimación de la variabilidad en las variables de andar. Las medidas más utilizadas son las relacionadas con el segundo momento de la subyacente de la distribución de probabilidad de andar variable de interés. Ejemplos de ello, la desviación estándar (por ejemplo, [1 - 4]], el coeficiente de variación (por ejemplo, [5 - 8]] y el coeficiente de correlación múltiple (por ejemplo, [9, 10]]. Otras medidas menos convencionales variabilidad también se han sugerido. Por ejemplo, Kurz et al. Demostrado una información teórico-medida de la variabilidad, en que el aumento de la incertidumbre en el conjunto de rango de movimiento (ROM), y, por tanto, la entropía, que se refleja en la variabilidad aumentada conjunta ROM [11].

Para medir la variabilidad de andar entre curvas, algunas medidas basadas en criterios de distancia se han presentado, incluido el promedio de distancia de todas las curvas a la media de la curva de crudo en 3 dimensiones de datos espaciales [12], el punto por punto intercurve oscila en promedio en todo el Ciclo de andar [13] y la norma de la diferencia entre los vectores que representan a coordinar superior e inferior de desviación estándar de las curvas de un vector en el espacio atravesado por un polinomio base [14]. En lugar de un único número de información, una alternativa y popular que determine cuál ha sido la curva de variabilidad de vincular las bandas de predicción en torno a un grupo de curvas. Investigaciones recientes sobre este tema ha demostrado que arranque derivados de las bandas de predicción de proporcionar una cobertura más amplia que los tradicionales bandas de desviación estándar [15 - 17].

Además, el resumen de estadísticas diversas, como la intra-clase coeficiente de correlación [8] y el coeficiente de correlación de Pearson [18], para la estimación de la medición de andar fiabilidad, reproducibilidad y repetibilidad se han desplegado en la evaluación de la metodología, el medio ambiente y la instrumentación de dispositivos o inducida Variabilidad. Componentes principales y análisis de correspondencias múltiples también se han aplicado en la cuantificación de la variabilidad en las dos variables de andar y curvas, tal y como diferencia y la inercia, respectivamente, en baja dimensional proyecciones de los datos originales [19].

Fuentes de la variabilidad

Como se muestra en la Figura 1, de las numerosas fuentes de la variabilidad en las mediciones de andar puede ser categorizada como vagamente ya sea interna o externa a la persona que se observó [20].

Significación clínica de la variabilidad

La magnitud de la variabilidad y su alteración tiene valor clínico importante, al que se ha vinculado a la salud de muchos sistemas biológicos. Especialmente en la locomoción humana, la pérdida de la variabilidad natural fractal en la dinámica de avance se ha demostrado en edad avanzada [32] y en la presencia de patologías neurológicas como la enfermedad de Parkinson [42], y la esclerosis lateral amiotrófica [42]. En algunos casos, este fractal de la variabilidad se correlaciona con la gravedad de la enfermedad [32]. La variabilidad también puede servir como un indicador útil del riesgo de caídas [43] y la capacidad de adaptarse a condiciones cambiantes mientras caminaba [44]. Paso-a-paso variabilidad temporal puede ser útil en el estudio de la dinámica de avance de desarrollo en los niños [45]. Variabilidad natural ha sido implicado como un mecanismo de protección contra las fuerzas de impacto repetitivo en marcha [14] y, posiblemente, un ingrediente clave para la energía eficiente y estable de andar [46]. La variabilidad no siempre es informativa y útil y, de hecho, puede dar lugar a discrepancias en las recomendaciones de tratamiento. Por ejemplo, debido a la variabilidad en el rango estático de la moción y cinemática mediciones, Noonan et al. Encontró que se recomienda diferentes tratamientos para el 9 de los 11 pacientes con parálisis cerebral, se examinaron en cuatro diferentes centros médicos [13].

Manejo de la variabilidad

Dada la ubicuidad y la salud pertinencia de la variabilidad en las mediciones de andar, es fundamental que hemos de andar resumir y comparar los datos de una manera que refleje la verdadera naturaleza de su variabilidad. Pese a la aparente simplicidad de estas tareas, si no se llevó a cabo con prudencia, de los derivados de los resultados pueden ser engañosos, ya que ejemplifican. De hecho, hasta la fecha hay muchas cuestiones pendientes en relación con el análisis de los datos cuantitativos de andar, como el problema de la esquiva sistemáticamente la comparación de dos familias de curvas.

Los objetivos de este documento es doble. En primer lugar, tenemos como objetivo revisar algunas de las cuestiones analíticas comúnmente encontradas en el resumen y la comparación de las variables de datos y de andar curvas, como consecuencia de la variabilidad. Nuestro segundo objetivo es demostrar algunas soluciones prácticas a los retos determinados, el uso real de los datos empíricos. Estas soluciones de gran éxito recurrir a los métodos reportados en la literatura estadística. El resto del documento se ocupa de estos objetivos en dos grandes epígrafes, uno de las variables de andar y de andar sobre las otras curvas. El documento concluye con algunas sugerencias para el resumen y la comparación de datos de andar y orientaciones para futuras investigaciones sobre este tema.

De andar variables aleatorias

Unidimensional variables que se miden o computado una vez por ciclo de andar se refirió a andar como variables aleatorias. En esta categoría se incluyen los parámetros espacio-temporales como la longitud de zancada, el período y la frecuencia, velocidad, individuales y dobles de apoyo veces, y de paso de ancho y largo, así como de parámetros tales como la gama de movimiento de un determinado conjunto, los valores máximos, y Momento de la aparición de un pico, que se extraen de las curvas de cinética o cinemática en una base por ciclo.

Debido a la variabilidad, de andar univariado medidas y parámetros derivados deben considerarse como estocásticos y no determinista variables [47, 48]. En este marco variable aleatoria, una dimensión variable de andar se representa como X y se rige por un subyacente, desconocida función de distribución de probabilidad F X, o la función de densidad . La realización de esta variable aleatoria se escribe en minúsculas como x.

Infladas variabilidad y no estimación robusta

Se ha demostrado recientemente que la ubicación y la propagación estimadores utilizados en el análisis de datos cuantitativos de andar, es decir, la media y la varianza, son altamente susceptibles a las pequeñas cantidades de contaminantes de los datos [48]. De hecho, algunos falsos o atípicos mediciones pueden dar lugar a estadísticas erróneas no robusto estimaciones de la variabilidad de andar. El reto en el resumen de andar muy variable univariante de datos radica en la ubicación y la propagación de información, fiel a los datos de distribución y con un mínimo de la influencia de observaciones extraordinarias.

Aquí, nos centramos en la cuestión de la variabilidad inflados y no mediante el examen de estimación robusta cuatro diferentes propagación estimadores, aplicado a los datos de paso período de un niño con parálisis cerebral espástica diplegic. Como se señaló anteriormente, el coeficiente de variación y la desviación estándar son habitualmente empleados en el resumen de las variables de andar. Dada una muestra de N observaciones de un andar variable X, es decir, (x 1 ,..., x n), el coeficiente de variación se define como,

Donde el numerador es simplemente la muestra de la desviación estándar y el denominador, , Es la muestra media. También se incluyen otros dos estimadores, aunque rara vez se utilizan en el análisis de andar, para ilustrar las diferencias cualitativas en el estimador de robustez. El rango intercuartil de la muestra se define como

IQR (X) = 0,75 x - x 0,25 (2)

Donde x 0,75 x 0,25 y son el 75% y el 25% cuantiles. El q-cuantil se define como Donde como es habitual, F X es la distribución de probabilidad de X. Equivalente, el q-cuantil es el valor, q x, de donde la variable aleatoria . Es decir, q × 100 por ciento de la variable aleatoria de los valores se encuentran por debajo de x q. También introducir la mediana de la desviación absoluta [49],

MAD (X) = med (| X - med (X) |) (3)

Donde med (X) es la mediana de la muestra, o el 50%, tal como se define supra cuantil. Este último estimador es, como su nombre lo indica, la mediana de la diferencia absoluta entre los valores de la muestra y su valor medio. Estamos interesados en estudiar cómo estas diferentes estimadores realizar al estimar la propagación en un andar variable, de las observaciones que pueden contener valores periféricas o contaminantes. En el panel izquierdo de la Figura 2, se muestra un conjunto de datos registrados período de calma de un niño con diplejia espástica. El gráfico superior muestra los datos en bruto con una serie de valores atípicos con evidente atípicamente larga zancada veces. Hemos adoptado una definición común de las demás, el etiquetado de más de 1,5 puntos intercuartil rangos fuera de la mediana de la muestra como valores extremos. Según esta definición hubo 21 observaciones periféricas. En la parte inferior del gráfico, los valores atípicos se han eliminado. El gráfico de barras en la parte derecha de la figura 2 muestra la propagación de las estimaciones de avance de datos período, calculado con cada estimador introducido anteriormente, con y sin los "outliers".

Observamos inmediatamente que la propagación estimaciones de la presencia de valores atípicos son más altos. La desviación típica y el coeficiente de variación del cambio de la mayoría, disminuyendo 42 y 36 por ciento en valor, respectivamente, tras la eliminación de las demás. Esta observación es particularmente importante en la comparación de las variables de andar, como la variabilidad de las estimaciones infladas disminuirá la probabilidad de detectar diferencias significativas cuando lo hacen, de hecho, existen. En contraste, la mediana y el rango intercuartil desviación absoluta, el cambio sólo en un 21 y 11%, respectivamente. Vemos que estas últimas estimaciones son estadísticamente más estable, en el sentido de que no son tan fuertemente influenciado por la presencia de observaciones extremas.

Para comprender más plenamente estimador de la robustez o la falta de ella, el campo de la estadística robusta ofrece una valiosa herramienta llamada influencia funciones, que como su nombre lo indica, se resume la influencia de los locales de contaminaciones en valores estimados. Su utilización en el análisis de andar se presentó por primera vez en el contexto de la estimación de las frecuencias de paso [48].

En primer lugar, introducir el concepto de un funcional, que puede entenderse como un verdadero valor en función de un vector espacial de las distribuciones de probabilidad [50]. En el contexto actual, funcional nos permiten pensar en un estimador como una función de distribución de probabilidad. Por ejemplo, para el rango intercuartil, el es simplemente funcional, .

Deje que la mezcla de distribución F z, ε describir datos regulado por la distribución F, pero una muestra contaminada por z, con probabilidad ε. La influencia de la contaminación en función de z se define como

() Donde T es la funcional para el estimador de interés. La influencia de una función particular, el estimador medidas de los cambios en el estimador, en la presencia de grandes muestras, debido a la contaminación en z. Evidentemente, si el impacto de este contaminante sobre el valor estimado es mínima, entonces el estimador es robusto a nivel local en z. Influencia funciones pueden ser derivados analíticamente para una variedad de estimadores de andar común (véase, por ejemplo, [48]], entre ellos los antes mencionados. En aras de la simplicidad y la práctica de análisis de conveniencia, vamos a utilizar en su lugar finito muestra las curvas de sensibilidad, SC (z), que puede definirse como,

SC (z) = (n + 1) (T (x 1 ,..., x n, z) - T (x 1 ,..., x n)) (5)

Donde, como anteriormente, T () es la funcional para el estimador de que se trate, y z es el contaminante de observación. Cuando N → ∞ la curva de sensibilidad converge a la función de influencia para muchos estimadores. Al igual que la asíntota influencia funciones, la sensibilidad curvas describen el impacto local de una contaminación z en el estimador de valor. A los efectos de la simulación por computadora, el funcional T (x 1 ,..., x n, z) y T (x 1 ,..., x n) son simplemente las evaluaciones del estimador de interés en el original y aumentada Muestras, respectivamente. La Figura 3 muestra la sensibilidad de las curvas de los estimadores presentó en el período de calma ejemplo. Para generar estas curvas, hemos utilizado el período de paso a limpiar los datos (sin outliers), y gradualmente añadió un paso desviado período comprendido entre el 0,5 por debajo del valor más bajo de muestra a un 0,5 por encima de la mayor muestra de valor. La muestra significa para estos datos fue 1,41 segundos.

Observamos que tanto la desviación estándar y el coeficiente de variación cuadrática tienen curvas de sensibilidad con vértices cerca de la media de muestra. En otras palabras, asumir como contaminantes extremadamente bajas o altas valores, los valores estimados son sin límites. Evidentemente, estos dos estimadores no son robustos, que explica su alta sensibilidad a los "outliers" en el período de calma de datos. Por el contrario, tanto la mediana y el rango intercuartil desviación absoluta de sensibilidad han delimitado las curvas, en forma de paso funciones. La mediana de la desviación absoluta es, en realidad, no sensible a los valores de contaminantes por encima de 1,1 segundos mientras que el rango intercuartil tiene una sensibilidad constante a los valores de más de 1,6 contaminante. Como la mayoría de los "outliers" en el período de calma los datos fueron muy por encima de la media, esta diferencia explica el considerablemente menor sensibilidad de la mediana absoluta desviación a la influencia de las demás.

A partir de este ejemplo, nos damos cuenta de que los estimadores de propagación de andar variable (es decir, la variabilidad) deben seleccionarse con prudencia. El popular, pero no robusto medidas de la variabilidad de la desviación estándar y el coeficiente de variación tanto tiene 0 puntos de ruptura [51], lo que significa que sólo un único valor extrema se requiere para conducir los estimadores al infinito. De hecho, como se ve en la figura 2, la presencia de una pequeña fracción de los "outliers" puede dar lugar a estadísticas erróneas nuestras estimaciones de la variabilidad de andar. Atípicas de gestión [52], con métodos como el de las demás factores [53] o itemsets frecuentes [54], representa una posible estrategia para reducir la variabilidad no deseados cuando no estas usando estimadores robustos. Además de la adición de un paso de cálculo, esta estrategia presenta los efectos de enmascaramiento y atípicas smearing [55], que deben tratarse con cuidado.

En cambio, los valores atípicos no tienen por qué ser explícitamente identificado con estimación robusta, por lo tanto, por encima de eludir las complicaciones y abreviar el cómputo. La mediana y el rango intercuartil desviación absoluta, han desglose de puntos de 0,25 y 0,5, respectivamente [51]. Prácticamente, esto significa que estos estimadores se mantendrá estable (limitada) hasta que la proporción de valores atípicos alcanza el 25% y el 50% del tamaño de la muestra, respectivamente. Explícita atípicas para eludir su detección y cuestiones conexas en conjunto, y en presencia de ruido datos, que a menudo resultan de espacio-temporales de las grabaciones y parametrajes cinemática y cinética de las curvas, robusto estimadores pueden ser preferible en el resumen de las variables de andar.

No distribución gaussiana

Incluso en ausencia de atípicos, de andar univariado de datos pueden no adherirse a un simple, gaussian distribución unimodal. De hecho, las distribuciones de las mediciones del paso y los parámetros derivados pueden ser naturalmente desigual, leptokurtic o multimodal [56]. El abandono de estas posibilidades, podemos resumir los datos de andar con la ubicación y la propagación valores que no reflejan la distribución de los datos subyacentes.

Single-ciclo de andar curvas

Cinemática, cinética y del metabolismo de datos a menudo se presentan en forma de un solo ciclo de las curvas, lo que representa un valor de variables en el tiempo más de un ciclo completo de andar. El tiempo es a menudo normalizado tal que los datos sobre los porcentajes varían del ciclo de andar en lugar de tiempo absoluto. Los ejemplos incluyen las curvas de ángulos conjunta, los momentos y los poderes, las fuerzas de reacción en tierra, y el potencial y la energía cinética. Debido a la variabilidad de paso-a-paso, estas medidas no generan una sola curva, pero una familia de curvas, cada una ligeramente diferente a los demás. Vamos a considerar una familia de curvas de andar como realizaciones de una función aleatoria [69 - 71]. Vamos X j (t) denotan un tiempo discreto la función, es decir, una curva de andar, cuando por conveniencia y sin pérdida de generalidad, t es un entero positivo y t = 1 ,..., 100. Además, asumir que las diferencias entre las curvas en cada punto en el tiempo, deberá estar distribuido normalmente. Cada una de las muestras curva, X j (t), por lo tanto, puede representar como [70],

X j (t) = f (t) + ε j (t), j = 1 ,..., N t = 1 ,..., 100 (8)

Donde f (t) es la verdadera función subyacente media, ε j (t) ~ (0, σ j (t), 2) son independientes, distribuidos normalmente, gaussian variables aleatorias con varianza σ j (t) 2 y N es el número de curvas observadas. Con esta formulación en mente, ahora abordar cuatro problemas prevalentes en el análisis de las curvas de andar, es decir, la variación indeseable fase, la estimación robusta de propagación, la dificultad con el análisis histórico y, por último, la comparación de las curvas de los objetos en su conjunto y no como desconectado puntos.

Fase variación

Se ha reconocido que dentro de una muestra de un solo ciclo de andar curvas, es a la vez la amplitud y la fase de variación [71 - 73]. Normalmente, cuando se describe la variabilidad en las curvas de andar, nos referimos a la amplitud de la variabilidad. Sin embargo, sin variación fase, que es el desajuste temporal de las curvas, a menudo pueden dar lugar a estimaciones infladas amplitud de la variabilidad [72, 73]. Cálculos de corte transversal con un promedio de más de una familia de curvas de andar malaligned puede llevar a la cancelación de forma crítica las características y lugares [74]. Esta cuestión presenta un reto significativo cuando se resumen una serie de curvas para la interpretación clínica y la planificación del tratamiento. Por un lado, la presentación de un gran número de diferentes curvas puede ser difícil de asimilar por abrumadora mayoría. Por otra parte, un prototipo media curva que no refleja las características de la persona es igual de curvas uninformative.

Curva de registro [71] que en términos temporalmente el proceso de adaptación de un conjunto de curvas. Más precisamente, es la adaptación de las curvas de reducir al mínimo las discrepancias de una muestra estimada iterativamente media o por allineating curva de hitos específicos. Sadeghi et al. Demostrado el uso de la curva de registro, en particular para reducir la variabilidad interindividual en un desplazamiento angular, momento y las curvas de potencia [72, 73]. Además, informó de que la curva de características, a saber, la primera y la segunda derivados y armónico de contenido al tiempo que se conservaban pico de cadera y desplazamiento angular de energía aumentó al momento de la inscripción [72]. Este último resultado confirma que los no registrados un promedio de las curvas pueden eliminar información útil.

A juzgar por los pocos documentos de andar empleando la curva de registro, el método parece en gran parte desconocidos entre la comunidad de análisis cuantitativos de andar. En este sentido, el esbozo brevemente el criterio método de registro mundial [71, 75].

Dado que cada paso es la curva de un grupo de puntos, es útil para estimar un buen ejemplo para cada función de la curva de la muestra observada. Dado el carácter periódico de las curvas de andar, la transformada de Fourier proporciona una adecuada representación funcional de cada curva. El principio básico es, entonces, en varias ocasiones se suman un conjunto de la muestra funciones iterativamente a una tasa media de función. El acuerdo entre una muestra y la función de la media de la función puede ser medida por una suma-de-squared error de criterio. El objetivo del registro es el de encontrar un conjunto de funciones de cambio temporal de tal manera que la evaluación de cada una de las muestras en función de la transformación de los valores temporales minimiza la suma de cuadrados de error criterio. La muestra se re-significa estima en cada iteración con el actual conjunto de las curvas de tiempo-deformado. Como un problema de optimización, la curva procedimiento de registro es el iterativo minimización de la suma-de-squared criterio J,

Donde N es el número de curvas de la muestra, T es el intervalo de tiempo de pertinencia, w i () es el tiempo-deformación de la función y Es la tasa media de iterativamente basado en la hora actual-deformado curvas X i (w i (s)). Para más detalles metodológicos, se remite al lector a [71, 72, 75]. Este criterio método de registro global es sólo una de varias posibilidades de alineación curva. Relacionado métodos que se aplican a los datos de andar incluyen deformaciones tiempo dinámico basado en la curva de hitos identificados [41] y de latencia promedio corregido conjunto [28].

Tenemos un ejemplo de los efectos indeseables de la contabilidad de la fase variación angular desplazamiento del tobillo mediante los datos de un niño con diplegla espástica. La parte superior izquierda del gráfico de la Figura 6 muestra las curvas no registrados, que exhiben dorso-flexión excesiva en todo el ciclo de andar y de la ausencia del valle durante la carga inicial de respuesta. Por debajo de este gráfico son las curvas alineados. Nota especial la alineación de la gran valle en la etapa previa al swing y el máximo en la fase de oscilación.

La columna de la derecha de la figura 6 se indica que las diferencias en la media y la desviación estándar de curvas antes y después de la inscripción no son triviales, con el máximo de cambios de +15% y -51%, respectivamente. El registro posterior a la curva media, no sólo el aumento de las exposiciones, sino que fluctuaba picos (3 - 5% del ciclo de andar). Esta observación sugiere que la simple transversal, sin un promedio de la alineación no sólo puede disminuir la curva de características útiles, pero pueden también, inadvertidamente, tergiversar la posición temporal de los principales hitos. Inexacta identificación de estos hitos, como la dorso-flexión mínimo en el inicio de la fase de oscilación en este ejemplo, podría plantear problemas al intentar coordinar espacio-temporales y EMG grabaciones con cinemática curvas. El gráfico de abajo a la derecha muestra una dramática disminución en la variabilidad después de la inscripción, en particular en posición terminal. Este resultado está en línea con la tendencia a la reducción de la variabilidad informó por Sadeghi et al. [72].

Si bien la curva de la inscripción es de utilidad para la mitigación de variación no deseada fase de andar en curvas, puede haber casos en los que la variabilidad es la fase propia de interés [3]. En esos casos, la curva de registro puede ser útil para dar información acerca de la relación temporal entre los cambios de fase de curvas. Debido a la curva de la inscripción en realidad cambios en el tiempo los datos de ubicación, no debe ser aplicado en los estudios relacionados con paso temporal dinámico caracterizaciones, como exponentes de escala [21] o exponentes de Lyapunov [44]. En la actualidad, de andar sólo unos pocos estudios han aplicado la curva de registro para gestionar la variabilidad indeseada fase. Sin embargo, la evidencia en los estudios, junto con el ejemplo anterior, además apoya la investigación y la aplicación de exploración de la curva de registro para aprovechar plenamente sus méritos y limitaciones en el análisis de datos cuantitativos de andar. Por el momento, la curva de registro parece ser la solución más viable para el problema de resumir una familia de curvas de andar temporalmente a desalinearse. En las secciones, vamos a demostrar cómo la curva de registro se puede utilizar ventajosamente, en conjunción con otros métodos para hacer frente a otros curva de resumen y comparación desafíos.

La robustez de la difusión de estimación

Ya se ha visto que la curva de registro pueden mitigar la variabilidad en la amplitud de una familia de curvas de andar. El robusto de la variabilidad en la medición de curvas de andar es en sí mismo un desafío no trivial. Uno puede necesitar para estimar la variabilidad de un grupo de curvas a los efectos de la clasificación de una nueva observación como pertenecientes a la misma población, o no [15]. Por otra parte, el conocimiento de la variabilidad de las curvas puede ayudar en la comparación estadística de dos poblaciones de las curvas [16], por ejemplo derivados de dos diferentes grupos de sujetos o antes y después de la intervención.

Al igual que en las variables de andar, el problema radica en la estimación de firmeza la propagación de una muestra del paso de las curvas y para evitar la sobreestimación o falaz bajo. El intuitivo y tal vez la más popular forma de la curva de la estimación de la variabilidad es el cálculo de la desviación estándar a través de la muestra de curvas, para cada punto del ciclo de andar. Este rendimiento superior, U X, y la reducción de las bandas, L X, en torno a la muestra de curvas, es decir,

U X (t) = μ X (t) + σ X (t), t = 1 ,..., 100

L X (t) = μ X (t) - σ X (t) (10)

Donde , Para t = 1 ,..., 100, es decir la curva de la muestra. Lenhoff et al. Sostuvo, a modo de ejemplos empíricos sistemáticos y validación cruzada, que la desviación estándar bandas de proporcionar la cobertura insuficiente de la muestra curvas [15]. Ellos en lugar apoya el uso de las bandas de predicción de arranque [76] que, en su estudio, siempre cerca del 90% orientados cobertura de la muestra de curvas. Dos estudios posteriores [16, 17] han aprobado el 90% de arranque de las bandas para la clasificación de las nuevas curvas y para la comparación entre grupos de curvas. La utilidad de arranque de las bandas de predicción clínica para la identificación de las desviaciones patológicas en las curvas cinemáticas también se ha demostrado [77]. En esta sección, proporcionar más pruebas para apoyar el uso de las bandas de predicción de arranque y argumentan que son más estables que las bandas de desviación estándar.

La idea básica del método de arranque es la creación de un gran número de subconjuntos de arranque por remuestreo las curvas X j, j = 1 ,..., N con reemplazo. Para cada subconjunto, el arranque de media y desviación estándar se calculan. Uno entonces el número de controles de la muestra las curvas son "cubiertos" por la desviación estándar de arranque bandas. Una curva se considera cubierto, si su máximo absoluto de la diferencia normalizada de arranque media es inferior a la constante C de arranque. El número de cubiertas curvas promedio entre todos los subconjuntos de arranque luego el rendimiento de la cobertura dada por la probabilidad de arranque constante, C. La superior e inferior de las bandas de predicción de arranque puede ser escrito como,

Se remite al lector a [15] para más detalles prácticos para el ordenador de aplicación el procedimiento anterior.

Para ejemplificar cuestiones de fuerte propagación de estimación, que consideramos rodilla ángulo de las curvas de un niño con diplejia espástica. Inicialmente, la desviación estándar de arranque y se calculan las bandas para los datos antes de la curva de registro. La máxima absoluta desviación de la curva media de muestra se informa en la Tabla 3. Para ambos métodos, la máxima difusión disminuye significativamente el momento de la inscripción, lo que sugiere que existe una importante variabilidad en el inflado unaligned curva muestra. Una vez que las curvas están alineados, una curva sospechosas, como trazan una delgada línea de guiones en la figura 7, se hace evidente. La desviación estándar de bandas en torno a la muestra con y sin esta curva de la periferia se muestran en la parte izquierda de la Figura 7. La máxima propagación, que es max t Y C , De la desviación estándar de arranque y bandas, respectivamente, han sido etiquetados en cada gráfico. Vemos que mediante la eliminación de la curva de la periferia, tanto la desviación estándar de arranque y las bandas se estrechará. De hecho, como se ve en la Tabla 3, la máxima desviación estándar disminuye en un dramático 27%. Por ello, parece que la variabilidad entre un grupo de curvas, estimado por tanto la desviación estándar y arranqu, se puede reducir la curva de registro y redujo de nuevo en la posterior eliminación de las curvas periféricas.

Para entender aún más la solidez de las dos propiedades de los estimadores propagación, generar curvas de sensibilidad utilizando las 45 curvas de ángulo de la rodilla presenta en la Figura 4. Estas curvas están matriculados por primera vez para minimizar la variabilidad no deseada fase. En el caso de curvas de andar, el contaminante no es un punto único, sino toda una curva. Para mayor conveniencia, elegimos los siguientes contaminantes,

Donde δ ∈ ℝ y δ minδδ max. En otras palabras, el contaminante es sólo una versión desplazado de la muestra curva media, . Para la simulación de la curva de sensibilidad, elegimos δ min = -50 y δ max = 50, que reconoce que en la práctica, nunca observar desviaciones de esta magnitud. Esta gran variedad, sin embargo, nos da una idea más completa de las curvas de sensibilidad. Que se proceda a definir la sensibilidad de las curvas de la desviación estándar de arranque y de las estimaciones de la siguiente manera,

Donde Es la varianza de la muestra y la ausencia de contaminación

Es la varianza de la muestra contaminada. En lo anterior, Es la curva media de la muestra contaminada. Las notaciones C C X X y, z representan las constantes de arranque determina utilizando el original y contaminados de datos, respectivamente. En otras palabras, estas curvas de sensibilidad se refleja la influencia de la curva de un contaminante, z (t), en el máximo estimado propagación a través de un grupo de curvas, en el ciclo de andar. Figura 8 se resumen los resultados de la evaluación (15) más de la simulación de contaminantes se define en (13).

Tomamos nota de que, como en el caso univariante, la desviación estándar exposiciones cuadrática sensibilidad con vértice en la desviación de la curva de cero. Esta curva parabólica sensibilidad indica que la desviación estándar de las bandas no son sólidos a nivel local contaminante curvas. En cambio, la sensibilidad de la curva de arranque de las bandas no es lisa y quartic en la naturaleza. La falta de fluidez se debe al azar remuestreo inherentes al método de arranque, de manera que con cada contaminante curva, ligeramente diferente de arranque muestras son utilizadas en la estimación de las bandas de predicción del 90%. Inicialmente, en su calidad de contaminante curva se desvía de la curva media, la sensibilidad es negativa, lo que significa que el ancho de la estimación de las bandas son más pequeñas que las de los no contaminados datos. De hecho, el valor real de la constante de arranque inicialmente disminuye, probablemente para contrarrestar el fuerte aumento de acompañamiento en la desviación estándar de las bandas. En otras palabras, como la desviación estándar bandas de ampliar, una menor de arranque constante es necesario para cubrir el 90% de la muestra las curvas. Sin embargo, como la curva de contaminantes se desvía más lejos de la media, la pendiente de la desviación estándar de sensibilidad aumenta en magnitud con mayor lentitud. Con un pequeño cambio en la desviación estándar de banda por unidad de desviación de la curva de contaminantes, el arranque necesariamente aumentos constantes de mantener el 90% de cobertura. Este razonamiento explica la posterior aumento de las colas de la curva de arranque de sensibilidad. Por último, observamos que, en general, la sensibilidad de la curva de arranque, aunque al parecer sin límites, atraviesa una proporción mucho menor rango que la curva de la desviación estándar. Esto sugeriría que con la cinemática de datos empleados en este ejemplo, el arranque de la cobertura de las bandas gozan de una mayor estabilidad que sus muy sensible desviación estándar primos.

En resumen, el examen precedente también apoya la utilización de las bandas en la cobertura de arranque enérgicamente resumen de la variabilidad dentro de una familia de curvas de andar. Además, la curva de registro y eliminación de las demás puede reforzar aún más la ubicación de las bandas de predicción.

Problemas con el simple parametrajes

Es común comparar hitos específicos o características de las curvas de paso para medir el impacto de una intervención o para determinar diferencias entre las distintas poblaciones de sujetos. Sin embargo, la determinación de las características de la curva es de por sí problemático. En efecto, la multiplicidad de los picos y valles a través de dos grupos diferentes de las curvas puede ser inconsistente. A modo de ejemplo, la figura 9 muestra la fuerza de reacción vertical terreno de un aptos niño a la izquierda con la típica respuesta de la carga pico, valle mediados de postura y posición terminal pico [78]. A la derecha está el suelo vertical de la fuerza de reacción de la parte intacta de un niño con una amputación por encima de la rodilla, caminar con una prótesis de miembros inferiores. Tenga en cuenta que hay al menos tres picos en la curva media (delgada línea de puntos). Los intentos de comparar las condiciones físicas y amputado fuerza perfiles están afectados por la falta de claridad en la elección de los correspondientes picos. Se trata de un escollo de la comparación de las curvas de andar sobre la base de determinados hitos.

La transformada wavelet ha sido promociona como un método útil para el descubrimiento de las tendencias intrínsecas de los datos [79, 80]. Por lo tanto, es posible que se pueda extraer una tendencia subyacente baja frecuencia amputado de la curva de la fuerza en aras de lograr una comparación con las personas sanas curva. Con este fin, se descompuso la media curva de la fuerza para el niño con amputación utilizando un 4 - nivel coiflet transformada wavelet [81]. Hemos reconstruido la curva de la fuerza utilizando únicamente los coeficientes de aproximación. La línea de tendencia lo que se traza a la derecha del gráfico de la figura 9 en la línea de trazos gruesos y más a la espera perfil de la fuerza. Extracción de la extrema rendimientos plausible pico lugares en el 17% y el 44% del ciclo de andar y un valle en el 30%. Estos lugares son comparables a las de las personas sanas niño (picos en el 12% y el 44% y el 26% en el valle del ciclo de andar), pero sugieren una carga ligeramente ampliado fase de respuesta.

La extracción de la línea de tendencia en este ejemplo pone de manifiesto que en algunas curvas, los hitos deseados puede ser ocultado por la mayor frecuencia de las fluctuaciones de la señal y, por tanto, los componentes pueden ser salvables. Sin embargo, incluso cuando se encuentran claramente identificable entre curvas, que reflejan sólo una vista microscópica de toda la curva. Por ejemplo, puede tener dos curvas idénticas hitos, pero pronunciadas diferencias en la forma características. Por lo tanto, no defienden el uso aislado de simple parametrajes o hitos para la comparación de las curvas de rutina. Más bien, la comparación de los dos tipos de curvas se debe basar en toda la curva y no aislados parametrajes. Sugerimos sin embargo, que el análisis y la simple hito parametrajes puede tener sentido como un procedimiento post-hoc, es decir, la investigación de cómo las curvas son similares o diferentes, sólo después de diferencias estadísticamente significativas entre las curvas o la falta de ella se han creado. Sugerimos, por tanto, a la primera estadísticamente comparar curvas de andar todo unificado como objetos, y la reserva de lugares para análisis post-hoc. En la siguiente sección se describe cómo esa prueba estadística se pueden llevar a cabo.

Comparación de las curvas de andar como coherente entidades

Si las curvas de andar fueron estrictamente determinista, simplemente se podría definir una medida de distancia entre dos curvas y por hacer. Sin embargo, debido al paso-a-paso variabilidad, una extensión de la prueba estadística univariante es necesario, para determinar si una serie de curvas podría haber surgido a partir de la misma distribución estadística como otra. Alternativamente, se podría probar si la diferencia media entre los dos conjuntos de curvas es aproximadamente cero, en el marco de la crítica de los valores que se preveía una distribución de las diferencias. El desafío fundamental es comparar las familias de curvas de andar como coherente y no como entidades ajenas, independiente puntos. Una forma de considerar las curvas como un todo y no como disjunta puntos es para darles una adecuada representación funcional. Se puede entonces comparar las representaciones orgánicas de las curvas. La explotación de este principio, los fans y Lin [70] propuso un método general de la comparación de dos series de tiempo discreto de la muestra de curvas. En su método, la transformada de Fourier discreta de la normalización de la diferencia entre el promedio de las curvas de dos familias de curvas se calcula. Sólo los componentes de baja frecuencia de la transformar, que abarcan la mayoría de señal de la energía, se mantienen. Estos coeficientes son luego sometidos a la prueba de adaptación Neyman rendimientos que la probabilidad de que las dos familias de curvas tienen medios similares. Sobre la base de nuestros conocimientos, la adaptación Neyman estadística [69] aún no se ha aplicado en la literatura de andar para la comparación de las curvas de andar empírica. Por lo tanto, esbozo a continuación, con cierto detalle, la propuesta de procedimiento que hemos adaptado de los fans y Lin [70]. Supongamos que queremos comparar dos familias de curvas de andar, j (X (t), j = 1 ,..., N) y (X Y j (t), j = 1 ,..., N S) , Con t = 1 ,..., 100. La hipótesis nula es que la diferencia entre los medios de las dos familias de curvas es cero. En la función aleatoria formulación dada por la ecuación (8), podemos escribir, H 0: f X (t) - f Y (t) = 0, donde f X (t) y f Y (t) son los verdaderos subyacente media Curvas. Notational Por conveniencia, vamos a dejar que t = 0 ,..., T - 1, donde hemos optado T = 100 en los ejemplos anteriores. Los principales pasos de la prueba son los siguientes.

1. Cálculo de la muestra las curvas de media, μ X (t) y μ Y (t), donde Y también para μ Y (t)

2. Cálculo de la muestra las curvas de variación, Y , Donde Asimismo y para .

3. Alinear las dos curvas de media mundial utilizando el método de registro criterio. Denotar el registrado como curvas Y . Este paso no aparece en la formulación original de los fans y Lin [70].

4. Cálculo de la diferencia normalizada Z (t) registrados entre los medios,

5. Cálculo de la descomposición de Fourier discreta, , De la normalización de la diferencia,

Donde k = 0 ,..., T / 2, Real Imag () y () indican los componentes reales e imaginarios de la compleja coeficiente de Fourier , Respectivamente, y k denota la frecuencia de Fourier.

6. Forma un nuevo vector de coeficientes E, de longitud T + 1, por el enlace real e imaginaria de los coeficientes de Fourier coeficientes complejos, , De la siguiente manera,

7. Estimación estadística de la adaptación Neyman, T AN (E) para el vector definido anteriormente. Este producto en dos pasos.

(A) Determinar el número óptimo de los coeficientes de mantener para maximizar , En donde E i son los elementos del vector definido anteriormente y 1 <m <T + 1. Este valor óptimo de m, denotado , Maximiza el poder de la adaptación Neyman estadística [70]. El máximo valor estadístico se escribe como,

Donde Var (E 2), es la diferencia de los cuadrados de los elementos de E obtenido en el paso 6.

(B) Que K = ln (T ln T). Cálculo de la siguiente estadística de ensayo final transformado valor [70],

En este sentido, tenemos explicited indicó que la estadística se ha calculado para el vector E, de los coeficientes de Fourier. Asintóticamente, esta estadística tiene una exponencial de una distribución exponencial [69], es decir, P (AN Tx) → exp (-exp (- x)), como T se convierte arbitrariamente grandes.

8. Estimar el p-valor calculado de la estadística de ensayo valor, T AN (E), por simulación de Monte Carlo de un gran número, por ejemplo 10 6, de los vectores, Y i, i = 1 ,..., 10 6, cada uno de los T longitud y cuyos elementos están tomados de un estándar de la distribución normal, es decir, Y i ~ (0, 1), ∀ i. La razón es que, cuando dos grupos de curvas surgen de la misma función aleatoria, la normalización de las diferencias de sus coeficientes de Fourier se distribuyen habitualmente en torno a 0. Para cada vector normal, Y i, evaluar AN T (Y i) como en el paso 7 anterior. Cuando la hipótesis nula de las diferencias no es cierto, la probabilidad de observar un adpative neyman estadística tan extremas como T AN (S) se calcula como,

Donde H () es la función de heaviside, donde H (x) = 1 sólo si x> 0 y 0 en caso contrario. En los ejemplos siguientes, 10 6 simulados tales vectores para estimar la probabilidad de observar T AN.

Estamos ejemplificar el procedimiento anterior cinemática con dos conjuntos de datos tomados de un niño con una amputación por encima de la rodilla, el uso de dos tipos diferentes de prótesis. De interés es si el uso de un mecanismo de control de la fase de oscilación dentro de la prótesis de rodilla afecta a andar. Figura 10 representa el tobillo con los desplazamientos angulares (línea discontinua) y sin (línea continua) los mecanismos de control de la fase de oscilación. En la inspección visual, las curvas de aspecto similar en magnitud y muestran una leve diferencia de fase. Esperamos que la prueba estadística para concluir que las curvas no son diferentes. El gráfico de arriba a la derecha es la normalización de la diferencia entre la media registrada curvas. Tenga en cuenta que la mayoría de los valores fluctúan en torno a 0. La parte inferior derecha es un gráfico de tallo parcela de determinados coeficientes de Fourier de la transformada de Fourier de la normalización de la diferencia. Tenga en cuenta la concentración de la energía en las frecuencias bajas y la distribución de los coeficientes por encima y por debajo de 0. Así, no es extraño que el resultado de la adaptación Neyman estadística de ensayo, dado AN T = -9,01, que corresponde a 1 para p = = 2. En otras palabras, es muy probable que los dos grupos de curvas de vino de la misma distribución aleatoria de funciones. En el contexto actual, el mecanismo de la fase de oscilación no tuvo efecto alguno en el tobillo desplazamiento angular.

Para ilustrar la estadística de detección de las diferencias, que recurrir a un segundo ejemplo de la cinemática de las curvas de un adulto sujeto antes y después de la cirugía de reemplazo de tobillo. En la Figura 11, la pre-cirugía de las curvas no tienen picos bien resueltos o que, después de los valles quirúrgicamente, distintos picos y valles emerge con gran magnitud. Sobre la base de esta inspección visual, se podría anticipar que la prueba estadística se debería indicar que el antes y después de la cirugía curvas son realmente diferentes. La normalización de la diferencia entre la media registrada curvas de exposiciones relativamente grandes fluctuaciones en torno a 0 y los coeficientes de Fourier conservado casi todos son positivos, lo que arroja un coeficiente de distribución positivamente sesgada. El valor estadístico de Neyman de adaptación para estos coeficientes es AN T = 5,99 correspondiente a p = 2,6 × 10 -5 con = 6. Por lo tanto, la prueba estadística indica que hay una fuerte evidencia para rechazar la hipótesis nula. Parece que la cirugía ha alterado significativamente el paso de curvas. Una vez diferencia estadística significativa se ha establecido, se puede entonces tratar de identificar características específicas que lo diferencian de los dos conjuntos de curvas. Por ejemplo, el post-quirúrgica curvas muestran un valle bien definido, hacia la flexión plantar del dedo del pie en el despegue y una sólida primera dorso-flexión máximo en posición terminal. Ambos extrema están ausentes en la presurgery curvas.

Tenga en cuenta que no hemos dicho nada acerca de los tamaños de muestra necesarios para la comparación estadística de las curvas de andar. Es evidente que, como en el análisis del poder unidimensional [65], el tamaño de la muestra requerida depende del tamaño del efecto, el nivel de significación y potencia especificada. Sobre la base de nuestros conocimientos, no el poder-el tamaño de la muestra tablas se han obtenido para la adaptación Neyman estadística en el momento de la escritura. Para información sobre el tema, el lector interesado puede referirse a auténticas obras [65, 82] en el poder en el análisis univariado. La estadística demuestra aquí la prueba puede ampliarse para comparar más de dos grupos de curvas, usando alta dimensión análisis de la varianza [70]. Además, cuando la normalización de la curva de diferencia no es lisa, denoising wavelet pueden ser utilizados para identificar las bandas de frecuencias donde la mayoría de la energía se concentra la señal [69]. La adaptación Neyman estadística presenta aquí es sólo una de varias posibilidades de forma objetiva y rigurosa para determinar las diferencias entre las curvas. Otras alternativas incluyen una prueba de ANOVA para datos funcionales [83] funcional y análisis de correlación canónica [84]. El procedimiento descrito en esta sección formaliza la comparación de las curvas de andar como entidades coherentes. El método ofrece una manera de confirmar estadísticamente general de las similitudes y diferencias que podamos detectar por inspección visual, pero pueden tener dificultades para cuantificar con el tiempo y la frecuencia convencional de dominio parametrajes.

Recomendaciones

Realizamos un resumen de los debates anteriores, proponiendo algunos heurísticos directrices para hacer frente a las mencionadas cuestiones de la variabilidad en las variables de andar y curvas. Para andar variables o parámetros, la solución propuesta vías se muestran en la Figura 12.

De andar por las curvas, los procedimientos sugeridos para la síntesis y la comparación se resumen en la figura 13. Un par de observaciones más allá de las deliberaciones antes mencionadas están en regla. Tenga en cuenta que se sugiere estimación robusta en el resumen de las curvas de andar, como después de la inscripción, puede haber curvas que parecen atípicos, en forma global o de amplitud. Ubicación estimación de las curvas de andar sólo fue discutido en el contexto de la adaptación Neyman prueba, pero se incluye en la figura 13 para la exhaustividad. En la comparación de las curvas, análisis post-hoc abarcaría las comparaciones de curva parametrajes convencionales o marcas (por ejemplo, los picos y valles), como los procedimientos de investigación para explicar las diferencias estadísticas formalmente establecido o la falta de ella.

Orientación futura

Este documento ha desnatada sólo la punta del iceberg en el debate y la demostración de varios prometedores enfoques analíticos para abordar la variabilidad de la práctica en cuestiones de andar resumen de datos y la comparación. Los temas de la curva de arranque de registro y estimaciones de la curva de la variabilidad, aunque no necesariamente nuevo a andar los análisis de datos, rara vez se han estudiado y aplicado en la comunidad de investigación de andar. El puñado de estudios hasta la fecha sobre estos temas, han proporcionado pruebas iniciales fuerte potencial para mejorar el rigor y la objetividad del paso de la interpretación de los datos. Ejemplos en el presente documento se presta más credibilidad a estos métodos. Comparaciones sistemáticas de estas técnicas convencionales con parametrajes, resumen de estadísticas, e incluso de expertos interpretación de los datos de andar, daría lugar a un mayor reconocimiento de sus méritos y limitaciones de andar en los análisis de datos. Por ejemplo, que el registro y uso de bootstrapping para consolidar los datos de andar mejorar la coherencia de la toma de decisiones clínicas? Teniendo en cuenta la propensión a la variabilidad de la inflación en los datos de andar, el tema de la estimación robusta necesita ser estudiado en mayor profundidad, en términos de influencia de contaminantes y posiblemente adaptable estimadores [49]. Asimismo, la comparación estadística rigurosa de las curvas de andar como entidades coherentes en lugar de conjuntos de puntos no, es una prometedora área de investigación en el análisis de la variabilidad de andar. Este flujo de trabajo es sólo en el desarrollo embrionario, pero promete fortalecer la comparación de los datos cuantitativos de andar y para complementar su interpretación subjetiva, una práctica que se ha debatido en la literatura [85 - 87].

Contribuciones de los autores

T. Chau escribió todo el manuscrito y llevó a cabo análisis de la variabilidad de la mayoría informó aquí.

S. Redekop recogido la mayoría de los datos empíricos informó de este documento, llevado a cabo todos los cinemática y cinética de los análisis de datos, escribe los programas para la extracción de datos, con los conjuntos de datos y la ayudó en su interpretación.

S. Young siempre que la revisión de la literatura para el manuscrito y contribuyó de manera significativa a la revisión de diversos proyectos.

Agradecimientos

El principal autor desea reconocer el apoyo del programa de Cátedras de investigación de Canadá, la de Ciencias Naturales e Ingeniería de Investigación, la Fundación REMAD, la Fundación para la Innovación Canadá, el Ontario Fiduciario de la Innovación y el Instituto de Investigaciones de Bloorview. Los autores también reconocen Enero Andrysek que contribuyeron los datos amputado.