Un factor de Rasch y análisis de la evaluación funcional de la terapia del cáncer-General (FACT-G)
Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.
Aunque la evaluación funcional de la terapia del cáncer - General cuestionario (FACT-G) ha sido validado pocos estudios han explorado el factor estructura del instrumento, en particular a través de la muestra no depende de las técnicas de medición, como los modelos de Rasch. Por otra parte, pocos estudios han explorado la relación entre el tema apropiado para el Modelo de Rasch y utilidad clínica. El objetivo de este estudio fue investigar la dimensionalidad y medición de propiedades del hecho-G con los modelos de Rasch y análisis factorial.
Un análisis factorial y análisis de Rasch (Modelo Parcial de Crédito) se llevó a cabo en el hecho-G completa con una muestra heterogénea de pacientes con cáncer (n = 465). Para el análisis de Rasch tema apropiado (infit significa plazas ≥ 1,30), dimensionalidad y el tema se evaluaron invariancia. El impacto de la eliminación de misfitting temas de la utilidad clínica de las subescalas y FACT-G total escala también se evaluó.
El análisis factorial demostró una estructura de cuatro factores el hecho de que G-en líneas generales corresponden a las cuatro subescalas del instrumento. La consistencia interna de estos cuatro escalas fue muy buena (alfa de Cronbach 0,72 - 0,85). El análisis de Rasch demostrado que cada una de las subescalas y el hecho de G-total escala de misfitting temas (infit medios plaza ≥ 1,30). Todas estas escalas, con la excepción de los Social y Bienestar de la Familia Escala (SFWB) se unidimensional. Cuando misfitting temas se eliminaron, los tamaños del efecto y la utilidad clínica del instrumento se mantiene para las subescalas y el total FACT-G resultados.
Los resultados del análisis factorial tradicional y el análisis de Rasch, el hecho-G de acuerdo en líneas generales. Se debe tener precaución al utilizar el Sociales y el Bienestar de la Familia escala y aún es necesario determinar si esta escala está mejor representado por dos factores. Además, la supresión de misfitting temas de las escalas deben realizarse junto con una evaluación del impacto sobre utilidad clínica.
La calidad de vida de evaluación se utiliza cada vez más en la práctica clínica habitual en oncología [1, 2]. Por otra parte, el proceso de evaluación en sí se ha demostrado mejorar el estado clínico del paciente y consulta bienestar [3].
La evaluación funcional de la terapia del cáncer - General (FACT-G) es ampliamente utilizado de calidad de vida para los pacientes con cáncer. El cuestionario fue desarrollado originalmente usando entrevista semi-estructurada de los pacientes y los profesionales de la oncología instrumento para generar temas [4]. Un factor de análisis de los originales 28-tema versión del instrumento puso de manifiesto cinco factores que corresponden a: el bienestar físico, Sociales y Bienestar de la Familia, bienestar emocional, funcional Bienestar y la relación con el médico [4]. Análisis psicométrico del instrumento que ha demostrado alfa de Cronbach fue alto para el total de la escala (0,89) que indica altos niveles de confiabilidad. Del mismo modo, test-retest fiabilidad coeficientes oscilaron entre 0,82 (bienestar emocional y la relación con médico) a 0,88 (bienestar físico).
Se ha realizado una amplia desarrollo y la validación de una serie de sitios web y las enfermedades de módulos específicos para el hecho, por ejemplo módulos para la anemia y la fatiga, colorrectal, de mama y el cáncer de pulmón. Por otra parte, algunos validación adicional también se ha llevado a cabo en el hecho-G, por ejemplo, las evaluaciones de un mínimo de diferencias importantes [5] y la identificación de funcionamiento diferencial tema [6]. Winstead-Fry y Schultz [7] realizó un estudio de validación de la FACT-G (la versión 2) en una muestra de 344 pacientes con cáncer que viven en zonas rurales (es decir, no metropolitanos) en los EE.UU.. El análisis factorial de las puntuaciones - transformó a diario de probabilidades o logits - puesto de manifiesto los mismos cinco subescalas. Por otra parte, alfa de Cronbach niveles estaban dentro de la misma gama que informó de Cella et al. [4]. Kemmler et al. [8] investigó la estructura de la FACT-G (la versión 2) mediante escalamiento multidimensional. Este análisis reveló que la mayoría de subescalas, pero sobre todo física y Sociales y el Bienestar de la Familia, así como la relación con las escalas de médicos, demostró un alto nivel de coherencia con los temas de cada subescala de la agrupación. Los temas de la funcional Bienestar escala mostró un mayor grado de dispersión, y había una cantidad de superposición entre las funciones emocionales y de bienestar.
Más recientemente, los modelos de medición de Rasch como modelos [9] se han utilizado para explorar la estructura factor del hecho-G. Rasch modelos permiten estimaciones del tema ubicación ( "dificultad") y medidas persona ( "capacidad") para ser postulado a lo largo de rasgos latentes, como por ejemplo, el dolor, y salud física y mental. La fuerza de estos modelos es que estos parámetros estimados son independientes de la muestra y cuestionarios utilizados. Un estudio reciente realizado por Dapueto et al. [10] de la versión 4 de la FACT-G mediante análisis de Rasch en las respuestas derivadas de un español de habla (Uruguay) el cáncer de población de pacientes demostró que, con la excepción de un tema de los Social y Bienestar de la Familia escala ( "Yo soy satisfecho con mi vida sexual ") y un tema de las bienestar emocional escala (" Estoy satisfecho con cómo estoy frente a mi enfermedad "), hubo cuatro unidimensional estructuras correspondientes a los dominios del hecho-G (el relación con el médico escala ha sido eliminada de las versiones más recientes del instrumento). Sin embargo, ningún análisis de Rasch del conjunto FACT-G total de la escala se realizó y, en particular, los autores no han utilizado modelos de Rasch para estudiar la dimensionalidad de la FACT-G.
El concepto de dimensionalidad, y el consiguiente ajuste de la pieza (es decir, si los temas se adecue a los unidimensional Rasch construir) son consideraciones importantes en los modelos de Rasch, ya que sólo las escalas con los temas que se ajusten al modelo dar lugar a medidas basadas en el intervalo. Esto, a su vez permite la interpretación significativa de los cambios en los resultados [11, 12]. La eliminación de misfitting temas se defiende y, a menudo, para mejorar la medición de propiedades de los instrumentos [13]. Sin embargo poco se sabe de la relación entre la (mal) en forma y utilidad clínica. Los estudios han sugerido que misfitting artículos pueden ser removidos sin impacto en la medición de propiedades de los instrumentos [11, 14, 15], pero pocos estudios han explorado los efectos de utilidad clínica. Los pocos estudios que tienen, han encontrado que cuando misfitting temas se eliminan y el estudio original análisis repetidos con la reducción del cuestionario, los resultados generales y conclusiones de los estudios no ha cambiado (es decir, sin impacto significativo sobre la utilidad clínica se encontró) [16] .
El objetivo de este estudio fue investigar la dimensionalidad o factor de estructura y propiedades de medición del hecho-G utilizando tanto los análisis psicométricos tradicionales, como el análisis factorial, y el tema y muestra modelos independientes, como los modelos de Rasch. Por otra parte, un análisis de Rasch, el hecho-G total También se realizó para determinar si toda la escala formado una construcción unidimensional. La relación entre el tema (mal) en forma y utilidad clínica fue descubierta por evaluar el impacto de la supresión de misfitting artículos del instrumento en la capacidad de las escalas para detectar diferencias en resultados entre los diferentes grupos de pacientes en un ensayo clínico.
El paciente datos utilizados para el factor y el análisis de Rasch, el hecho-G se recopilaron a partir de dos estudios, uno publicado [3] y otro inédito, que se han llevado a cabo por el Cancer Research UK, psicosociales y de Práctica Clínica Grupo de Investigación (St. James's University Hospital, Leeds). En el primer estudio, 265 pacientes completaron la versión en papel de FACT-G como una medida de resultado en un ensayo aleatorio investigar los efectos del uso regular de medición de CVRS en la práctica de oncología. Los pacientes completaron el FACT-G en 4 ocasiones: basal, después de 3 consultas ambulatorias, a las 4 y 6 meses.
En el segundo estudio, un grupo de pacientes, una versión electrónica del hecho-G en un ordenador con una pantalla táctil monitor (n = 200). El objetivo del estudio es comparar los resultados de una serie de calidad de vida instrumentos.
Los estudios recibió la aprobación ética de los locales comité de ética de los Hospitales de Enseñanza Leeds NHS Trust (Reino Unido).
El hecho de G-la versión 4 se compone de cuatro subescalas, bienestar físico (PLP), Sociales y Bienestar de la Familia (SFWB), el bienestar emocional (EWB), funcional y Bienestar (FWB). Estos se han valorado en un período de cinco punto escala Likert (es decir, "No, en absoluto", "Un poco", "Algo", "Bastante", "mucho"). Las puntuaciones de la escala se obtienen sumando los puntajes brutos, que van desde 0 a 28 (o 0 a 24 para el bienestar emocional). Las puntuaciones de la física y bienestar emocional escalas (con la excepción de un tema) se invierten. Una puntuación total se obtiene sumando las puntuaciones de la escala de las cuatro subescalas (rango de 0 - 108). Superior subescala resultados indican una mejor salud, el funcionamiento, o el bienestar. El plazo para la FACT-G es los últimos 7 días. Faltan temas fueron tratados de acuerdo con las directrices del cuestionario desarrolladores, lo que implica resultados de prorrateo, es decir, el cálculo de la media de los elementos completados para cada subescala que contengan los datos que faltan (donde hay un 50% o más de respuesta) y la sustitución de este por los datos que faltan.
Un total de 465 pacientes completaron el estudio FACT-G, sin embargo los datos demográficos disponibles para 461 pacientes, 323 mujeres (edad promedio 55,7 años, sd 12,4) y 138 hombres (edad promedio 60,8, SD 13,0). Menos del 5% de los pacientes que asisten a los consultorios de atención ambulatoria donde las muestras fueron colectadas fueron de las comunidades de minorías étnicas. Cuadro 1 presenta un desglose de los diagnósticos y resultados de la FACT-G.
No significativo tema invariancia o parcialidad se encuentran para los temas de las dos muestras para las subescalas y FACT-G escala total. Todos los contrastes de las subescalas y FACT-G puntuación total cayó por debajo del 0,5 criterio logit (p> 0,01). Por lo tanto, no hubo diferencias significativas en el FACT-G tema parámetros derivados de las dos formas de administración, y los datos combinados de la pantalla táctil de gestión y medición de referencia en el ensayo aleatorio se utilizaron para el factor y el análisis de Rasch.
Interior fiabilidad de las cuatro subescalas era muy bueno con el alfa de Cronbach que oscilan entre 0,81 y 0,85 para la física y funcional Bienestar, respectivamente, y entre 0,78 y 0,72 para la Sociales y Familia y el bienestar emocional escalas, respectivamente.
El componente de la matriz rotada se muestra en la Tabla 2. Un total de 4 factores con valores propios significativamente mayor que 1,2 se obtuvieron. Estos en conjunto representaban casi el 55% de la varianza con un 27%, 14%, 9% y el 5% de diferencia se explica, respectivamente, por cada factor. Los factores identificados corresponden en gran medida al hecho-G subescalas. Factor 1 correspondía al bienestar físico (PLP) escala con cuatro elementos funcionales de los Well-being (FWB), también de carga escala (no significativa) en este factor ( "" capacidad de trabajo, "dormir bien", "disfrutar de cosas normalmente se hace por diversión" y "contento"). Factor 2 correspondió a la mayoría de los funcionales Bienestar de la escala (con excepción de FWB5 tema, "dormir bien"), así como un tema de los Social y Bienestar de la Familia (SFWB) escala, la aceptación de la familia sobre la enfermedad, y un tema de las bienestar emocional (EWB) escala (EWB2, "Estoy satisfecho con cómo estoy frente a mi enfermedad"). Factor 3 correspondían a cuatro de los siete temas de la Social y Bienestar de la Familia escala, es decir, los temas SFWB1, SFWB2, SFWB3 en relación con el apoyo de la familia y los amigos y la familia SFWB5 comunicación. Ni los temas con respecto a la cercanía a los Estados socios y la satisfacción con la vida sexual embarcados en este o cualquier otro factor. Factor 4 correspondieron a la mayoría de los bienestar emocional escala, salvo el punto 2 ( "Estoy satisfecho con cómo estoy frente a mi enfermedad") que cargan en Factor 2.
Este estudio describe un factor de análisis tradicional y análisis de Rasch, que se llevaron a cabo en el hecho-G [4]. Los resultados de la inicial (girado) análisis factorial (análisis de componentes principales), ha demostrado un período de cuatro factor de estructura, lo que correspondía en gran medida al hecho-G subescalas con altos niveles de coherencia interna.
Los resultados de los análisis de Rasch de cada subescala puso de manifiesto que todas las subescalas los temas que había misfit, aunque la mayoría no demostró ninguna redundante. La subescalas fueron unidimensional, la única excepción a esta regla fue el Social y el Bienestar de la Familia escala donde el 37% de los pares de medidas persona cayó fuera del 95% intervalo de confianza, por lo tanto, demostrando el carácter multidimensional de la escala. Esto sugiere que el Consejo Social y Bienestar de la Familia escala es quizás una de dos factores con factores de escala correspondientes a las preocupaciones familiares, en particular, apoyo emocional de la familia, la familia y la comunicación y la aceptación de la enfermedad (temas SFWB1 a SFWB5), y otro factor relativas, sobre todo para cerrar las relaciones personales (SFWB6 y SFWB7).
Las comparaciones entre los resultados del análisis factorial y el análisis de Rasch deben llevarse a cabo con cautela, ya que los objetivos fundamentales de cada método difiere con los objetivos de los principales componentes de análisis factorial es identificar los factores dentro de una matriz de correlación, mientras que para el análisis de Rasch es objeto para determinar si existe una multidimensionalidad en los residuos una vez que la estructura unidimensional ha sido eliminada de los análisis [17]. Sin embargo, en general, el tema de misfit observó el análisis de Rasch, en particular, para el Social y el Bienestar de la Familia y el bienestar emocional escalas correspondió en gran medida a los resultados del análisis factorial.
La eliminación de elementos de los cuestionarios (escalas) que no encajan en el modelo de Rasch pueden mejorar las propiedades de medición del instrumento. También es importante investigar si estas mejoras teórico puede cambiar la capacidad del instrumento para detectar diferencias de grupo o en situaciones clínicas con el tiempo. Nuestros resultados de la aplicación de la presente investigación para el análisis de un ensayo aleatorio que FACT-G es una medida de resultado, sugiere que la eliminación de los artículos misfitting no tuvo impacto alguno sobre el tema lugares, ni sobre la capacidad de los instrumentos revisados para detectar cambios significativos en las puntuaciones entre grupos de pacientes. Por otra parte, la supresión de los artículos misfitting no afecta los tamaños del efecto para la mayoría de las subescalas y el hecho-G total, aunque un mejor tamaño del efecto se observó Social y Bienestar de la Familia.
Estos resultados tienen que ser replicados en otros estudios. Si se confirma, puede tener importantes consecuencias para la forma en misfitting temas deben ser tratados. Es evidente que el equilibrio tiene que ser golpeado aquí entre utilidad clínica y medición de propiedades del instrumento. Los puntos de las escalas puede muy bien exponer misfit (aunque todavía conservan "cara validez"), así como la mudanza de misfitting artículos pueden tener ningún impacto en la medición de propiedades del instrumento [14, 15]. Sin embargo, los resultados de este estudio sugiere que en el mejor de supresión de partidas misfitting no afecta a utilidad clínica de las escalas, aunque el poder estadístico para detectar diferencias podrán reducirse para la revisión de los instrumentos o escalas, con la notable excepción de FWB escala donde el poder que parecía ser aumentado.
Precaución tal vez debería ser ejercida la hora de identificar los temas misfitting. Algunas preocupaciones han sido expresadas en la literatura de Rasch acerca de la capacidad de una sola residuales a base de encajar estadística para identificar correctamente misfit a través de una serie de escenarios de evaluación e instrumentos [25]. Por lo tanto, la eliminación de estos temas deben ser evaluados con arreglo a los efectos sobre utilidad clínica. Esto puede implicar la evaluación de medición de propiedades no sólo en contra de encajar las estadísticas, sino también contra el exterior de criterios clínicos. Por ejemplo, en nuestros trabajos anteriores hemos evaluado el impacto de la extracción de elementos de misfitting el Hospital Anxiety & Depression Scale (HADS) en una población cáncer Smith et al. [16]. El estudio encontró que la sensibilidad y especificidad del instrumento de medida en contra de una entrevista clínica no se vio afectado por la eliminación de misfitting temas.
Aunque tanto en el presente estudio y los resultados de Dapueto et al. [10] identificado los mismos temas misfitting (FIT> 1.3) de los interlocutores sociales y el bienestar de la familia y el bienestar emocional Escalas (SFWB7: "Estoy satisfecho con mi vida sexual"; EWB2: "Estoy satisfecho con la forma en que estoy frente a mi enfermedad "), los resultados de este estudio indican un nuevo tema misfitting en estas dos escalas, así como misfit en las otras dos escalas. Esto no fue simplemente debido a las diferencias en el rango de ajuste de las estadísticas empleadas, ya que el ajuste estadísticas de los temas restantes de la Dapeuto estudio cayó en el 0,7 - 1,3 gama empleada en este estudio. Las diferencias pueden haber surgido debido a las diferencias en Inglés y la traducción al español del hecho-G. Diferencial funcionamiento tema, en particular, se observa entre las diferentes versiones lingüísticas de otros cuestionarios de CVRS (por ejemplo, la EORTC QLQ-C30, [26]]. Además de esto, una proporción significativa de los pacientes (68%) en el estudio Dapueto asistencia necesaria al completar el cuestionario. Aunque los investigadores concluyeron que poco relevantes se encontró diferencia en términos de confiabilidad interna de las escalas entre los cuestionarios que fueron auto-administrados y las que se leían a los pacientes, el problema sigue siendo que las diferentes formas de administración pueden haber afectado los resultados y podría explicar las discrepancias entre estos dos estudios.
En un análisis de Rasch también se demostró que el hecho de G-escala total se unidimensional misfitting una vez dos temas se habían retirado, lo que sugiere que la escala puede ser utilizado como un índice, lo que indica un nivel general de calidad de vida o el bienestar . Esto puede facilitar la interpretación de bienestar resultados en la práctica clínica, como un complemento a los resultados obtenidos para cada subescala, y potencialmente también puede facilitar el uso e interpretación de FACT-G resultados cuando se utiliza como una medida de resultado en los ensayos clínicos.
Las posibles limitaciones de este estudio son el hecho de que, aunque el diagnóstico de los pacientes fue heterogénea poco más de un 50% de los pacientes tenía ya sea de mama o cáncer del tracto genitourinario que refleja una mayor proporción de mujeres que participaron en los estudios. Por otra parte, no clínicos adicionales se disponía de datos de la etapa o el alcance de la enfermedad para evaluar si el análisis se celebró a través de diferentes subgrupos clínicos. El análisis debería quizás ser replicado con un mayor tamaño de la muestra, si bien algunos estudios han demostrado que los modelos de Rasch son capaces de producir estimaciones robustas para el tema y lugares aptos para las estadísticas de los tamaños de las muestras de 100 [27].
En resumen, el análisis de Rasch, el hecho-G subescalas demostrado que tres de las cuatro subescalas y el hecho de G-escala se unidimensional, a pesar de todas las subescalas y la escala total que figura misfitting temas. Algunos tal vez las necesidades de cuidado debe ejercerse en la interpretación de los resultados de los interlocutores sociales y el Bienestar de la Familia escala, sobre todo cuando el empleo de una única puntuación como un indicador de diferencias clínicamente significativas [5], ya que si las subescalas no representan un solo subyacente construir se hace difícil extraer conclusiones válidas a partir de un cambio en las puntuaciones [12].
Por lo tanto, la futura labor debe llevarse a cabo utilizando muestras de mayor tamaño para determinar si misfit tema tiene para todas las escalas, y si éstos son observados en los subgrupos clínicos (por ejemplo, diferentes diagnósticos y la etapa de la enfermedad). En general, la relación entre el tema en forma y utilidad clínica también deberían estudiarse con más detalle y, en particular, cuál es el impacto de misfit es en la utilidad clínica del instrumento. Por otra parte, la multidimensionalidad de la Sociales y el Bienestar de la Familia escala y el potencial existencia de dos subescalas ( "Familia" y "Cerrar personales" relaciones) también debe ser investigado.
Tanto el factor de Rasch y análisis demostró que el hecho de todos los G-escalas y escala total fueron unidimensional con la excepción de los Sociales y el Bienestar de la Familia escala. El análisis reveló Rasch misfitting temas para cada subescala. La eliminación de los artículos misfitting no impacto en la utilidad clínica de las escalas.
Los autores declaran que no tienen intereses en conflicto.
ABS realizó el análisis de los datos y redacción del manuscrito. GV contribuido a la recopilación de datos, análisis de utilidad clínica, la escritura y la revisión crítica del manuscrito. EPW y PJS contribuido a la preparación y redacción del manuscrito.
Los autores agradecen a los pacientes que completaron los cuestionarios, y el profesor David Cella para la lectura y formulación de observaciones a un proyecto anterior del manuscrito.