Health and Quality of Life Outcomes, 2005; 3: 37-37 (más artículos en esta revista)

Orden efectos: un estudio aleatorio de las tres grandes cáncer de calidad de vida específico para instrumentos

BioMed Central
Yin-Bun Cheung (yinbun.cheung @ lshtm.ac.uk) [1], Celestino Lim (celestinelim@yahoo.com) [2], Cynthia Goh (dpmgoh@nccs.com.sg) [3], Julian Thumboo ( Julian_thumboo@sgh.com.sg) [4], Joseph Wee (trdwts@nccs.com.sg) [2]
[1] MRC Tropical Grupo de Epidemiología, Escuela de Londres de Higiene y Medicina Tropical, Londres WC1E 7HT, UK
[2] Clinical Trials and Epidemiological Sciences, National Cancer Centre, 11 Hospital Drive, 169610, Singapore
[3] Department of Palliative Medicine, National Cancer Centre, 11 Hospital Drive, 169610, Singapore
[4] Department of Rheumatology and Immunology, Singapore General Hospital, Outram Road, 169608, Singapore

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

En los estudios metodológicos y los resultados de la investigación, a veces en varios cuestionarios de salud relacionados con la calidad de vida (CVRS). Anterior psicológica estudios han sugerido que la modificación de la orden de las escalas de medición en un cuestionario podría alterar el patrón de respuestas. Sin embargo, la información sobre la presencia o ausencia de efectos sobre el orden de evaluación de la CVRS en los pacientes con cáncer es limitada.

Métodos

Un diseño de bloque incompleto se utilizó en este estudio de 1277 pacientes con cáncer. Cada uno de los pacientes completaron un cuestionario paquete que contiene dos de los tres grandes cáncer específico CVRS instrumentos, a saber, la evaluación funcional de la terapia del cáncer - General, la Organización Europea para la Investigación y Tratamiento del Cáncer Core Cuestionario de Calidad de Vida y el Índice de Vida Funcional -- Cáncer. Dentro de un cuestionario conjunto de la orden secuencial de los instrumentos que contiene son aleatorios. Medición de propiedades de los instrumentos, incluyendo el número de desaparecidos valores, con una media de las puntuaciones de CVRS, conocido de los grupos validez y coherencia interna se compararon entre muestras de los diferentes órdenes de presentación.

Resultados

Sin efecto orden de presentación de las cuatro propiedades mencionadas se encontró.

Conclusión

Orden de presentación no es probable que modifique las respuestas a estos instrumentos administrados CVRS de los pacientes con cáncer cuando cualquiera dos de ellas se utilizan juntos.

Antecedentes

La orden de las preguntas en una entrevista puede afectar a las respuestas a cada pregunta [1 - 3]. La sabiduría convencional sugiere que los estudios deben comenzar con sencillo, descriptivo y no sensibles preguntas [2, 3]. Los elementos utilizados en las escalas de medición de compuestos también pueden ser sometidos a un contexto efecto [4]. Sin embargo, se ha limitado la información en el ámbito de la calidad de vida de investigación para confirmar si la presentación de pedidos de compuestos dentro de las escalas de medición un cuestionario que se modifican los resultados.

Jensen et al. [5] y [6] Mook discutieron varias razones por fin efectos podrían aparecer. Por ejemplo, los encuestados pueden experimentar fatiga o perder la concentración hacia el final de un cuestionario y, en consecuencia, la probabilidad de errores de interpretación y omisión de los temas puede aumentar. Según este punto de vista, la fuerza del orden efectos está relacionada con la longitud del cuestionario. Además, los encuestados pueden producir diferentes patrones de respuestas de los cuestionarios que el anterior desensitise o familiarizarlos con un tema.

El desarrollo de nuevos sanitarios de la calidad de vida (CVRS) a menudo emplea varios instrumentos de los instrumentos con el fin de determinar la validez convergentes y divergentes. No está claro si la validez o de otras propiedades de medición de un instrumento podrían verse afectados por la orden de presentación. Además, la posibilidad de un pedido efecto señala la necesidad de cautela en la comparación de información entre los estudios en que las escalas de medición de la CVRS no se presentan en el mismo orden, aunque las preguntas son idénticos. Por lo tanto, es importante determinar o prevenir los efectos de orden en estas situaciones.

El uso de diseños aleatorios y contrarrestado, Jensen et al. [5] y [7] Lucas demostró que el orden de presentación de algunos instrumentos psicológicos tenido un impacto en los resultados. En una encuesta postal que incluye cuatro de salud y las escalas de medición de la CVRS, los investigadores usaron dos versiones de un cuestionario [8]. Uno se inició con medidas genéricas seguidas por medidas concretas; otro presentado los grupos constituyentes de los temas en orden cronológico de acuerdo con el período de tiempo los temas mencionados. Encontraron que el uso de cuestionarios orden cronológico fueron devueltos con más prontitud a pesar de la orden de presentación no parece afectar a las respuestas. Un estudio investigó esta cuestión en la evaluación de la calidad de vida de pacientes con cáncer [9]. Los participantes auto-administró un cuestionario en el que la Organización Europea para la Investigación y el Tratamiento del Cáncer Core Cuestionario de Calidad de Vida (EORTC QLQ-C30) precedió a la evaluación funcional de la terapia del cáncer - General (FACT-G). Los dos instrumentos similares que figuran preguntas sobre cuatro aspectos de la CVRS, a saber, el dolor, las náuseas, reunión necesidades de la familia, y la satisfacción general. Los investigadores descubrieron que las cuatro preguntas de los dos instrumentos se indica similar nivel de CVRS, aunque los pacientes habían estado expuestos a la EORTC QLQ-C30 antes de que se respondió a la similar FACT-G preguntas.

En un estudio reciente, el FACT-G-FLIC y rápida (una versión abreviada del Índice de Vida Funcional - Cáncer, FLIC [10]] fueron utilizados [11]. Alternando la secuenciación de estos dos instrumentos de CVRS se llevaron a cabo para formar dos diferentes paquetes cuestionario. El estudio demuestra que no existe un efecto importante del orden de presentación en la media de los resultados, la suma de los valores que faltan, y conocido de los grupos validez y coherencia interna de los instrumentos. Las deficiencias del estudio que se utilizó un cuestionario relativamente breve como el tiempo medio para completar era sólo 15,0 minutos; que participan sólo dos instrumentos de CVRS, y el tamaño de la muestra fue relativamente pequeña.

El presente estudio tiene el objetivo de verificar los resultados anteriores sobre la falta de orden efectos en la evaluación de pacientes con cáncer de la calidad de vida. Se utiliza un mayor tamaño de la muestra y de los cuestionarios ya que participan tres grandes CVRS instrumentos comúnmente utilizados en oncología.

Métodos
Diseño

En este estudio se utilizó un diseño de bloque incompleto [12], en el que los participantes fueron asignados al azar a recibir uno de los siguientes seis paquetes cuestionario (en este orden de presentación): (1) EORTC QLQ-C30 y FACT-G, (2) FACT - G y EORTC QLQ-C30, (3) EORTC QLQ-C30 y FLIC, (4) y FLIC EORTC QLQ-C30, (5) y FACT-G FLIC, y (6) FLIC y FACT-G. Elegimos contra utilizando un diseño de bloques completos de tener cada paciente completa a los tres cuestionarios, porque las experiencias del pasado sugiere que algunos pacientes podrían no pueden o no quieren gastar tanto tiempo y concentración en el mismo. En el actual estudio, el tiempo medio necesario para completar la entrevista fue del 20,4 minutos, pero el 90 percentil fue de 39 minutos. Debido a consideraciones logísticas, la asignación al azar utilizado días en lugar de como individuos y unidades asignadas a los seis paquetes en bloques de seis días [13]. En el examen de los efectos sobre el orden FACT-G, por ejemplo, el FACT-G datos de los paquetes (2) y (5), donde FACT-G se administró en primer lugar, se compararon contra los de los paquetes (1) y (6) , En donde FACT-G se administró pasado. En aras de la brevedad, hemos utilizado las frases para un fin y B a significar un instrumento de CVRS se administró primero y último, respectivamente.

Paciente de contratación

Los pacientes fueron reclutados en el Centro Nacional del Cáncer, Singapur, que sirve a aproximadamente el 70% de los pacientes con cáncer de vista por el sector público del país, entre septiembre de 2003 y mayo de 2004. El estudio fue aprobado por el Comité de Ética del Centro. El abordaje fue mientras estaban en las zonas de espera de los especialistas de consulta externa, unidad de tratamiento ambulatorio y el departamento de radiología terapéutica del Centro. Los criterios de inclusión fueron: leer y escribir en Inglés o chino, de 18 años de edad o mayores, y de acuerdo con dar su consentimiento informado por escrito. Los pacientes fueron heterogéneos en los perfiles clínicos, como la de tener diferentes tipos de tumor, y se ajuste para el estudio de los tres instrumentos que se han diseñado para su aplicación a todos los pacientes con cáncer.

Singapur es una sociedad multiétnica con los chinos que forman aproximadamente el 70% de la población total. Los chinos participantes tuvieron la opción de contestar o bien un Inglés o un chino cuestionario de acuerdo a su preferencia de idiomas, mientras que otros participantes Inglés respondido a un cuestionario. Los participantes se pidió a la libre administrar el cuestionario de paquetes (cuando sea posible). A petición de los pacientes, las entrevistas serán administrados por uno de los dos coordinadores de investigación del proyecto.

Instrumentos

El FACT-G, la versión 4 y EORTC QLQ-C30 versión 3 se utilizaron. El FLIC se había modificado en dos aspectos para su uso en España [14, 15]. En primer lugar, la palabra "cáncer" fue retirado de las preguntas debido a que algunos pacientes, en particular a los pacientes de mayor edad, tal vez no sean conscientes de su diagnóstico y, a veces, sus familias tal vez no quieres que le dijo al diagnóstico. En este sentido, es de señalar que el FACT-G y EORTC QLQ-C30 no mencionar la palabra cáncer. En segundo lugar, la escala analógica visual es difícil de algunos pacientes, especialmente los de mayor edad y con menor educación. Fue sustituida por una de siete puntos formato escala Likert. Similares modificaciones de la FLIC También se ha informado en otros países [16, 17].

El cuestionario de cada uno de los paquetes se inició con una página de las cuestiones demográficas y de salud, tales como información sobre Eastern Cooperative Oncology Group (ECOG) estado funcional [18], y si los pacientes se encontraban en la quimioterapia y / o radioterapia. Tratamiento estado se clasificó como si el paciente está en quimioterapia y / o radioterapia o no (sí o no).

Consideraciones estadísticas

Todos los temas fueron CVRS recodificado tal que una mayor puntuación refleja una mejor calidad de vida. Faltan valores en el FACT-G, y FLIC EORTC QLQ-C30 fueron imputados por la mitad de la regla [19]. ANOVA y Chi-cuadrado pruebas fueron utilizados para comparar las variables continuas y categóricas, respectivamente, entre los pacientes que respondieron el cuestionario de seis paquetes. La prueba exacta de Fisher se utilizó para comparar el número de valores que faltan en cada uno de los instrumentos entre los órdenes de presentación. Regresión binomial negativo se utilizó para estimar la diferencia en el número medio de los valores que faltan entre órdenes de presentación y el intervalo de confianza (IC) [20]; regresión lineal se utiliza para la CVRS resultados. Alfa de Cronbach fue calculado para cada instrumento de CVRS en cada orden de presentación. No hay establecido un procedimiento de análisis para la estimación de IC para la diferencia en el alfa de Cronbach. Se empleó el método de arranque, con repeticiones 1000 [21].

En consonancia con la práctica comúnmente aceptada de la equivalencia de estudios, el 90% de intervalo de confianza (IC) se calcularon [22, 23]. Equivalencia si se declaró el 90% IC cayó totalmente dentro de una zona de equivalencia. Para la comparación de la media de los valores que faltan, la equivalencia antes de la zona se define como ± 1 punto. Para la comparación de alfa de Cronbach, la zona fue de ± 0,1.

No hay consenso para la definición de CVRS resultados equivalentes. Utilizando diferentes criterios clínicos, Cella et al. [24] sugiere que la mínima diferencia clínicamente significativa en la escala FACT-G es de 4 puntos. En base a la evaluación subjetiva de importancia, Osoba et al. [25] sugiere que "un poco" el cambio en la EORTC QLQ-C30 mundial de las escalas de calidad de vida era aproximadamente de 5 a 10 puntos, en una escala de 0 a 100. Curiosamente, ambos estudios aproximadamente de acuerdo con Cohen [26] sugerencia de que un efecto de tamaño entre 0,2 a menos de 0,5 desviación estándar (DE) es pequeño. En el presente conjunto de datos, 4 puntos de la FACT-G puntuación de 5 puntos y de la EORTC mundial Resultado funcionamiento son equivalentes a 0,25 y 0,23 de sus SD's. Por lo tanto hemos definido un margen de equivalencia como ± 0,25 SD, redondeado al entero más cercano. Correspondía a 4, 6 y 5 puntos para el FACT-G, y FLIC EORTC QLQ-C30, respectivamente. Además, se definió una "pequeña diferencia" margen de ± 0,5 SD. Esto se tuvo en cuenta Osoba et al. [25] acerca de un poco de cambio (10 puntos). La pequeña diferencia de los márgenes de la FACT-G, y FLIC EORTC QLQ-C30 fueron 8, 12 y 10 puntos, respectivamente.

El principal análisis no ajustar para covariables. Suplementario análisis ajustado por covariables muestra en el cuadro 1 utilizando el análisis de regresión múltiple.

Un tamaño de muestra de 270 por instrumento por orden de presentación daría un poder de 80% y el 5% de la probabilidad de error de tipo I para confirmar la equivalencia (SD ± 0,25) entre los distintos órdenes de presentación [22]. El tamaño de la muestra aquí fue de un 50% más grande, porque el objetivo principal del estudio (para comparar la variabilidad de los diferentes instrumentos de CVRS [27]] que se requieren.

Resultados

Un total de 1317 pacientes consentido en participar. Algunos de los pacientes miembros de la familia insistió en rellenar el cuestionario en su nombre. Estas entrevistas fueron excluidos proxy. Después de esta exclusión el número de sujetos fue de 1277.

El cuadro 1 se presenta un resumen descriptivo de las características de antecedentes de los pacientes mediante un cuestionario conjunto. Los seis grupos de pacientes fueron similares en características clínicas y demográficas (cada p> 0,10). También son similares en cuanto a la modalidad de administración de los cuestionarios y el lenguaje utilizado (cada p> 0,10).

El cuadro 2 muestra el número de valores ausentes en el FACT-G, y FLIC EORTC QLQ-C30 por orden de presentación. La prueba exacta de Fisher no mostraron diferencias significativas en la distribución de la cantidad de valores que faltan entre los dos órdenes de presentación AyB, de los tres instrumentos (cada uno de ellos p> 0,10). El número medio de los desaparecidos FACT-G tema fue 0,03 valores más altos (90% IC = -0,11 a 0,18) en los pacientes que respondieron a la primera FACT-G que los que respondieron a la FACT-G segundo. Las cifras correspondientes para la FLIC y EORTC QLQ-C30 fueron 0,01 (-0,11 a 0,13) y 0,11 (0,04 a 0,18), respectivamente. Los tres intervalos de confianza totalmente comprendida en el pre-definidos equivalencia zona de ± 1 punto. Nuevo análisis utilizando análisis de regresión múltiple para ajustar las covariables para la muestra en el cuadro 1 dieron resultados similares. La diferencia de medias (90% CI) entre órdenes de presentación en FACT-G, y FLIC EORTC QLQ-C30 artículos faltantes fueron, respectivamente, 0,04 (-0,10 a 0,18), -0,09 (-0,27 a 0,09) y 0,16 (0,04 a 0,28 ).

El cuadro 3 muestra los medios y las desviaciones estándar de la FACT-G, y FLIC EORTC QLQ-C30 total / global que funcione de acuerdo con las puntuaciones de orden de presentación. Los medios y las desviaciones estándar fueron similares entre los dos órdenes a través de los tres instrumentos. La media FACT-G puntuación de 2,44 puntos fue mayor en las entrevistas donde FACT-G se administró primero. El 90% IC: 0,66 a 4,24 es ligeramente superior a la previamente definidos equivalencia zona de ± 4 puntos, pero no superior a la "pequeña diferencia" zona. Los medios de FLIC resultados fueron casi idénticos en los dos órdenes de presentación y el intervalo de confianza totalmente comprendida en el pre-definidos equivalencia zona de ± 6 puntos (diferencia = -0,62, 90% IC = -3,20 a 1,97). La media EORTC QLQ-C30 puntuación fue inferior en 3,43 puntos entrevistas donde la EORTC QLQ-C30 se administró primero; el intervalo de confianza (-5,87 a -0,99) superaron ligeramente los predefinidos equivalencia zona de 5 puntos, pero no el "pequeño Diferencia "zona. Los resultados después de las covariables de ajuste en el cuadro 1 fueron similares. La diferencia de medias (90% CI) entre órdenes de presentación en FACT-G, y FLIC EORTC QLQ-C30 resultados fueron, respectivamente, 2,78 (1,28 a 4,28), 0,28 (-1,77 a 2,33) y -4,16 (-6,27 a -2,05 ).

Cuadro 4 presenta los valores medios de la FACT-G, y FLIC EORTC QLQ-C30 total / global que funcione por resultados y rendimiento de la condición de orden de presentación. Los tres instrumentos indicó una estadística y significativamente menor calidad de vida en los pacientes que tenían un peor estado funcional (ECOG puntuación de 2 a 4) independientemente del orden de presentación (cada p <0,05). En el caso de que FACT-G se administró primero, el FACT-G puntuación de 9,39 puntos fue mayor en los pacientes con mejor estado funcional. En el caso en el que se administró último, el FACT-G Resultado era 6,68 puntos superior en estos pacientes. La diferencia entre las dos estimaciones de la diferencia entre grupos fue 9,39 - 6,68 = 2,71 (90% IC = -1,83 a 7,24). Del mismo modo, las diferencias (90% CI) en la diferencia entre grupos de FLIC y EORTC QLQ-C30 fueron 1,00 (-5,88 a 7,88) y -3,60 (-9,70 a 2,50), respectivamente. Los tres estimaciones de la diferencia en la diferencia entre grupos se encontraron dentro de la zona de equivalencia de ± 0,25 SD. Aunque los tres intervalos de confianza superado ligeramente la zona de equivalencia de ± 0,25 SD, que entra dentro de la "pequeña diferencia" zona de ± 0,5 SD. Una vez más, el ajuste de las covariables no hizo ninguna diferencia práctica. La diferencia entre las dos estimaciones de la diferencia entre grupos de FACT-G, y FLIC EORTC fueron, respectivamente, 3,26 (-1,18 a 7,71), -0,79 (-7,14 a 5,56) y -3,58 (-9,47 a 2,32).

La tabla 5 muestra los valores de alfa de Cronbach de los tres instrumentos por orden de presentación. Los valores son muy similares en todos los órdenes de presentación y los tres intervalos de confianza totalmente comprendida en el pre-definidos equivalencia zona de ± 0,1.

Discusión

La evidencia experimental sobre la cuestión de orden efectos en la evaluación de pacientes con cáncer de la calidad de vida es escasa. Existen pruebas sustanciales de que la medición de la salud psicológica y morbilidad psiquiátrica se ven afectados por el orden de presentación de los instrumentos [5 - 7]. Sin embargo, un reciente estudio experimental de 190 pacientes con cáncer sugiere que el FACT-G-FLIC rápido y se libre de estos efectos [11]. Los investigadores sugirieron que las cuestiones sobre la CVRS son menos estigmatizadores y menos amenazando a más preguntas acerca de los problemas psicológicos. También se sugirió que la más complicada de algunos patrones de salto psicológico / psiquiátrico medidas puede dar lugar a fin de los efectos relacionados con la "hipótesis de castigo" y la "hipótesis de aprendizaje" y que esas pautas son algo que no sucede en el cáncer de cuestionarios de calidad de vida [5 , 11]. En el presente estudio de un número mayor de muestras, sustancialmente, que examinó tres CVRS instrumentos comúnmente utilizados en la investigación sobre el cáncer. Debido a consideraciones logísticas, optamos por el uso días en lugar de los pacientes como de las unidades de asignación al azar. Podemos pensar en ninguna razón por la parcialidad deberían derivarse de este plan de reparto. Comparación de los diversos antecedentes características fe de la comparabilidad de los pacientes asignados al azar a los diferentes paquetes de cuestionario. Secundaria análisis ajustado por covariables dieron resultados similares. La fuerza de orden efectos (en su caso) puede depender de la duración del cuestionario. El tiempo medio para la realización de paquetes cuestionario fue del 20,4 minutos en el presente estudio, unos 5 minutos más larga que la del anterior estudio, y el 90 percentil fue 39,0 minutos.

Nuestros resultados prestan apoyo adicional a la anterior conclusión de que el orden de presentación tiene poca influencia en la evaluación de la calidad de vida en pacientes con cáncer, pone de manifiesto los siguientes resultados. En primer lugar, la equivalencia en el número de desaparecidos valores y coherencia interna de los tres instrumentos a través de órdenes de presentación fue confirmada. En segundo lugar, los valores medios de la FLIC administrados en diferentes órdenes también fueron equivalentes. El FACT-G y EORTC QLQ-C30 administrados en diferentes órdenes también mostraron valores parecidos, aunque los intervalos de confianza de la diferencia ligeramente excluidos margen de la equivalencia. Dado que los intervalos de confianza cayó totalmente dentro de la "pequeña diferencia" zona de ± 0,5 SD, se puede concluir que en la mayoría de la orden de presentación tiene un pequeño efecto sobre la media y FACT-G EORTC QLQ-C30 resultados globales. En tercer lugar, independientemente del orden de presentación, los tres instrumentos reveló una diferencia estadísticamente significativa en la calidad de vida entre los pacientes con mejor estado funcional versus pobres. Una vez más, los intervalos de confianza totalmente comprendida en el pre-definidos "pequeña diferencia" zonas aunque no la equivalencia zonas. Conocido validez de los grupos no parece verse afectada. El uso de múltiples instrumentos en una entrevista es una práctica común. Los resultados aquí debería ser una buena noticia para la calidad de vida de los investigadores, ya que estudios previos sugieren que probablemente no fueron indebidamente influenciado por diversos pedidos de instrumentos y que los diseños más complicados para evitar una orden efecto no son necesarias.

El estudio de equivalencia es a menudo controvertido. No existe un claro motivo de la definición de la equivalencia. Sin embargo, los estudios revisados anteriormente parecen converger a la conclusión de que una diferencia de menos de 0,25 SD es irrelevante y 0,5 SD es pequeño. Por lo tanto la manera en que se define la equivalencia y la diferencia de las pequeñas zonas. En segundo lugar, el uso de 90% IC es principalmente una cuestión de práctica común en los estudios de equivalencia en lugar de una cuestión de justificación teórica. En un debate sobre el uso de intervalos de confianza en la equivalencia ensayos, Senn [23] sostuvo que "todas las normas de la importancia y la confianza son, en cualquier caso, arbitraria ... Poco se puede hacer para eliminar el elemento de arbitrariedad ". Dado que tanto el 90% y el 95% son arbitrarias, es nuestra preferencia a la adopción de la práctica común de uso de 90% IC. La tasa de respuesta a este estudio fue de aproximadamente 60%. Aunque no se trata de una alta tasa de respuesta, las conclusiones son relevantes ya que los pacientes que se negaron a participar en la evaluación de la calidad de vida no son la preocupación del presente estudio. Si hay un efecto en el cuestionario para la presentación no tiene ningún interés para los pacientes que no participan, y viceversa. Una limitación del presente estudio fue que, aunque las estimaciones puntuales parece indicar la falta de una orden efecto en las puntuaciones medias y el saber validez grupos, algunos de los intervalos de confianza se trate ligeramente estirado a través de la equivalencia márgenes. Como tal, una conclusión más definida espera de nuevos estudios. Además, la cuestión debería ser evaluada de nuevo, en caso de las entrevistas en cuestión son considerablemente más largo que el actual.

Conclusión

No existe evidencia de que los principales efectos de la orden de presentación en la evaluación de pacientes con cáncer de la calidad de vida de cuando dos de los tres cuestionarios - FLIC, FACT-G y EORTC QLQ-C30 - se utilizan juntos.

Contribuciones de los autores

YBC concebido del estudio, participó en el diseño experimental, desarrollado el marco estadístico, llevado a cabo parte de los análisis estadísticos, y redactó parte del manuscrito. CL llevó a cabo una gran parte de los análisis estadísticos y redactó parte del manuscrito. CG participó en el diseño de la investigación, y la interpretación y discusión de resultados. JT participó en el diseño de la investigación, el desarrollo del marco estadístico para el análisis de la equivalencia, la interpretación de los resultados, y la escritura del manuscrito. JW participó en el diseño de la investigación, y la interpretación y discusión de resultados. Todos los autores leído y aprobado el manuscrito final.