PLoS Clinical Trials, 2006; 1(1): (más artículos en esta revista)

Factores que pueden afectar a la validez externa de los ensayos controlados aleatorios

Biblioteca Pública de la Ciencia
Peter Rothwell M

Ensayos controlados aleatorios (ECA) debe ser internamente válido (es decir, el diseño y la conducta debe eliminar la posibilidad de sesgo), pero para ser clínicamente útil, el resultado también debe ser pertinente a un grupo definible de los pacientes en un entorno clínico (es decir, Deben ser válido externamente). La falta de validez externa es la más frecuente de las críticas de los médicos ECA, las revisiones sistemáticas, y las directrices, y es una explicación de la infrautilización generalizada en la práctica habitual de muchos de los tratamientos que han demostrado ser beneficioso en los ensayos y se recomiendan en las directrices [1 ]. Sin embargo, las revistas médicas, los organismos de financiación, comités de ética, la industria farmacéutica y los reguladores gubernamentales parecen dar validez externa una baja prioridad. Es cierto que, mientras que los factores determinantes de la validez interna es intuitiva y puede, en general, a partir de primeros principios, la comprensión de los determinantes de la validez externa de un ECA en estudios clínicos en lugar de la experiencia estadística, y muchas veces depende de una comprensión detallada de la situación clínica particular En estudio y su gestión en la práctica clínica habitual. Sin embargo, fiable juicios acerca de la validez externa de la ECA son fundamentales para que los tratamientos han de ser utilizados correctamente en el mayor número posible de pacientes en la práctica clínica habitual.

Los resultados de las revisiones sistemáticas o ECA nunca será de interés para todos los pacientes y todos los ajustes, pero deben ser diseñados e informados de una manera que permite a los clínicos para juzgar a los cuales los resultados pueden ser razonablemente aplicarse. Cuadro 1 se enumeran algunas de las importantes posibilidades Factores determinantes de la validez externa, cada uno de los cuales se revisa brevemente a continuación. Muchas de las consideraciones que sólo será de utilidad en determinados tipos de ensayos, para algunas intervenciones, o en ciertos entornos clínicos, pero cada uno puede socavar a veces validez externa. Además, la lista no es exhaustiva y exige más detallada explicación de anotación y lo que es posible en este breve examen.

Algunas de las cuestiones que determinan la validez externa son pertinentes para la distinción entre los juicios y las explicaciones pragmáticas ensayos [2], pero sería un error suponer que los ensayos pragmáticos necesariamente tienen mayor validez externa de los ensayos explicativos. Por ejemplo, los criterios de elegibilidad amplia, la limitación de la recogida de datos de referencia, y la inclusión de los centros con una variedad de expertos y de diferentes poblaciones de pacientes tienen muchas ventajas, pero también pueden hacer muy difícil la generalización de la media global efecto del tratamiento a una clínica particular .

El Escenario de la prueba

Una comprensión detallada de la instalación en la que se realiza un juicio, incluidas las particularidades del sistema de atención de salud en algunos países en particular, puede ser esencial para juzgar la validez externa. El impacto potencial de las diferencias entre los sistemas de atención de salud se ilustra mediante el análisis de los resultados de la cirugía carotídea Trial (ECST) [3], un ECA de la endarterectomía para estenosis carotídea sintomática recientemente, en la Figura 1. Las diferencias nacionales en la velocidad con la que se investigaron los pacientes, con una mediana de retraso desde los últimos síntomas de la asignación al azar a más de dos meses en el Reino Unido (lentitud de los centros), en comparación con tres semanas en Bélgica y Holanda (centros rápido), dio lugar a muy diferentes Los efectos del tratamiento en los diferentes sistemas de atención de salud-debido a la brevedad de la ventana de tiempo para la efectiva prevención de los accidentes cerebrovasculares. Similares diferencias en el rendimiento entre los sistemas de salud para que existan otras condiciones, y hay, por supuesto, la cuestión más amplia de cómo hacer ensayos en el mundo desarrollado se aplican en el mundo en desarrollo. Además, otras diferencias entre los países en los métodos de diagnóstico y tratamiento de la enfermedad-que puede ser importante o sustancial de las diferencias raciales en la patología y la historia natural de la enfermedad también afecta a la validez externa de la ECA. Un buen ejemplo es la heterogeneidad de los resultados de los ensayos de bacilos calmette guerin vacunación en la prevención de la tuberculosis, con una progresiva pérdida de eficacia (p <0,0001) y con la disminución de la latitud [4].

Cómo los centros y los médicos fueron seleccionados para participar en los juicios rara vez se ha informado, pero también puede tener consecuencias importantes para la validez externa. Por ejemplo, el Estudio de la arteria carótida asintomática (ACAS) juicio de la endarterectomía para estenosis carotídea asintomática sólo aceptó cirujanos con un excelente historial de seguridad, el rechazo de 40% de los solicitantes inicialmente, y posteriormente de una mayor participación de restricción de los que habían adversos resultados operativos en el juicio. El beneficio de la cirugía en ACAS se debió en gran parte a la baja en consecuencia, el riesgo [5]. Un meta-análisis de 46 series de casos quirúrgicos que publicó riesgos operativos durante los cinco años después de ACAS encontrado mortalidad operatoria a ser ocho veces mayor y el riesgo de accidente cerebrovascular y a la muerte, es aproximadamente tres veces mayor [1]. Los ensayos no deben incluir los centros que no cuentan con la competencia para tratar a los pacientes en condiciones de seguridad, pero la selección no debería ser tan exclusiva que los resultados no pueden generalizarse a la práctica clínica habitual.

De selección y exclusión de pacientes

La preocupación es expresada a menudo muy selectivo sobre los criterios de elegibilidad de los ensayos, pero a menudo hay varias etapas de selección antes de que rara vez son registrados o declarados, pero que puede ser más problemático. Por ejemplo, considerar la posibilidad de un juicio de un nuevo reductor de la presión arterial de drogas, que al igual que la mayoría de estos juicios se realiza en un hospital clínica. Menos del 10% de los pacientes con hipertensión son administrados en el hospital clínicas, y este grupo se diferencian de los gestionados en la atención primaria. Además, sólo uno de los diez médicos que ven pacientes hipertensos en este hospital está tomando parte en el juicio, y principalmente este médico considera que los pacientes jóvenes con hipertensión resistente. Así, antes incluso de cualquier consideración de los criterios de elegibilidad o la exclusión, los reclutas potenciales son ya muy poco representativo de los pacientes en la comunidad local. Es esencial, por tanto, que, de ser posible, registrar e informar los juicios de las vías para la contratación.

Los pacientes son seleccionados de acuerdo a los nuevos criterios de admisibilidad de prueba. Algunos ECA excluyen a las mujeres y muchos excluir a los ancianos y / o pacientes con comorbilidades comunes. Una revisión de 214 ensayos con medicamentos en el infarto agudo de miocardio (MI) encontró que más del 60% excluyó a los pacientes con edades de más de 75 años [6], a pesar de que más del 50% de IMs ocurren en este grupo de edad avanzada. Un examen de los 41 Estados Unidos Institutos Nacionales de Salud ECA encontraron un promedio de la tasa de exclusión del 73% [7], pero las tasas pueden ser mucho más altos. Un estudio de los criterios de elegibilidad de un accidente cerebrovascular agudo ensayo encontró que el tratamiento de la pequeña proporción de pacientes ingresados en el hospital a tiempo para ser adecuada para el tratamiento, el 96% no tenían derecho sobre la base de los distintos criterios de exclusión [8]. Un centro en otro accidente cerebrovascular agudo juicio pantalla de 192 pacientes a lo largo de dos años para encontrar un derecho del paciente [9]. Sin embargo, muy selectivo de contratación no es inevitable. El GISSI-1 ensayo de la trombolisis aguda para MI, por ejemplo, de contratación del 90% de los pacientes ingresados en las 12 horas de la cita con el diagnóstico y no contraindicaciones [10].

La estricta los criterios de elegibilidad puede limitar la validez externa de la ECA, pero los médicos deben al menos ser capaces de seleccionar pacientes para el tratamiento similar en la práctica habitual. Lamentablemente, sin embargo, la presentación de informes de juicio los criterios de elegibilidad es a menudo insuficiente. Una revisión de los ensayos clínicos que conduzca a las alertas por los EE.UU. Institutos Nacionales de Salud reveló que de un promedio de 31 criterios de elegibilidad, sólo el 63% se publicaron en el juicio principal informe, y sólo el 19% en la clínica de alerta [11]. La insuficiencia de información es también un problema importante en las publicaciones secundarias, como las revisiones sistemáticas y guías clínicas, en donde la necesidad de un sucinto mensaje no suelen permitir el examen detallado de la elegibilidad y criterios de exclusión o de otros factores determinantes de la validez externa.

Prerandomisation en vísperas de los períodos también se utiliza a menudo para seleccionar o excluir a los pacientes. En un período en el placebo, todos los pacientes reciben el placebo, y los que están mal son compatibles excluidos. No puede haber buenas razones para hacerlo, pero las altas tasas de exclusión reducirá la validez externa. Tratamiento activo en vísperas de los períodos en los que los pacientes que tienen los eventos adversos o mostrar signos de que el tratamiento puede ser ineficaz están excluidos tienen más probabilidades de minar validez externa. Por ejemplo, dos ECA de carvedilol, un beta-bloqueante vasodilatador, en la insuficiencia cardiaca crónica excluidos el 6% y el 9% de los pacientes en tratamiento en los períodos de ejecución, principalmente a causa de empeoramiento de la insuficiencia cardíaca y otros eventos adversos, algunos de los cuales fueron mortales [1]. En ambos ensayos, las tasas de complicación en la posterior fase aleatorios eran mucho más bajos que en el período en la fase.

Los ensayos también a veces activamente reclutar pacientes que pueden responder bien al tratamiento (a menudo denominado "enriquecimiento"). Por ejemplo, algunos ensayos de fármacos antipsicóticos han selectiva de contratación pacientes que previamente han tenido una buena respuesta a los antipsicóticos [1]. Otros ensayos han excluido no respondedores en un período en la fase. Un ECA de un inhibidor de la colinesterasa, la tacrina, la enfermedad de Alzheimer en 632 pacientes reclutados para un período de seis semanas "enriquecimiento" fase en la que se asignaron al azar a diferentes dosis de tacrina versus placebo [12]. Después de un período de lavado, sólo los 215 (34%) pacientes que presentaron un moderado avance en la tacrina en el "enriquecimiento" fase se asignaron al azar a la tacrina (en sus mejores dosis) versus placebo en la fase principal del juicio. La validez externa es claramente socavada aquí.

Características de los pacientes asignados al azar

Incluso en grandes ensayos pragmáticos con muy pocos criterios de exclusión, la contratación de menos del 10% de los pacientes potencialmente elegibles en los centros participantes es común. Aquellos pacientes que son reclutados generalmente difieren de las que son elegibles pero no de contratación, en términos de edad, sexo, raza, la gravedad de la enfermedad, nivel de educación, la clase social, y lugar de residencia. Los resultados en los pacientes incluidos en los ECA es también por lo general mejor que los que no están en los juicios, a menudo de manera notable, no a causa de un mejor tratamiento, pero debido a un mejor pronóstico de referencia. Suelen incluir los informes de los ensayos clínicos de la base de referencia las características de los pacientes asignados al azar, por lo que se argumenta que los médicos puedan evaluar validez externa, en comparación con sus pacientes. Sin embargo, la base de referencia registrada características clínicas suelen decir muy poco sobre la verdadera composición de la población de prueba, y en ocasiones puede ser engañoso. Por ejemplo, el cuadro 2 muestra las características clínicas basales de los pacientes asignados al azar a la warfarina en dos ECA de prevención secundaria de ictus [1]. En un ensayo, los pacientes se encontraban en fibrilación auricular, y en los otros que estaban en ritmo sinusal, pero las características de las dos cohortes fueron de otra manera bastante similar. Sin embargo, el riesgo de hemorragia intracraneal en la warfarina fue 19 veces mayor (p <0,0001) en la Prevención del Ictus en Reversible Ischaemia Trial (SPIRIT) que en el Europeo Atrial Fibrillation Trial (EAFT), incluso después del ajuste por diferencias en las características clínicas y la base de referencia La intensidad de la anticoagulación [13]. Al juzgar la validez externa, la comprensión de cómo los pacientes se refiere, investigados, y el diagnóstico (es decir, su itinerario a la contratación), así como la forma en que fueron seleccionados y excluidos, es a menudo mucho más informativo que una lista de características basales.

La intervención, de control de tratamiento, y, antes del juicio, o Nontrial Gestión

La validez externa también puede verse afectada si los ensayos tienen protocolos que difieren de la práctica clínica habitual. Por ejemplo, antes de la aleatorización en el ECA de la endarterectomía para estenosis carotídea sintomática, los pacientes tenían que ser diagnosticados por un neurólogo y han arterial de la angiografía convencional, ninguna de las cuales son de rutina en muchos centros. El proceso de intervención en sí también pueden diferir de la utilizada en la práctica actual, como en la formulación y la biodisponibilidad de un fármaco, o el tipo de anestesia utilizada para una operación. El mismo puede ser cierto en el caso de el tratamiento en el grupo control en un ensayo, que puede utilizar una dosis baja de la comparación de drogas, o no están a la altura de las mejores prácticas actuales de alguna otra manera. La validez externa también puede ser socavada por las limitaciones demasiado estrictas sobre el uso de tratamientos nontrial. Toda prohibición de nontrial tratamientos deben notificarse de las principales publicaciones de ensayo, junto con los detalles pertinentes de nontrial tratamientos que se utilizaron. El momento de muchas intervenciones también es crítico y debe ser informado cuando sea pertinente.

Resultados Medidas y Seguimiento

La validez externa de un ECA también depende de si los resultados son clínicamente relevantes. Muchos ensayos uso "sustituto" de resultado, por lo general los marcadores biológicos o de imágenes que se cree que son medidas indirectas de los efectos del tratamiento en los resultados clínicos. Sin embargo, además de ser de dudosa relevancia clínica, los resultados son a menudo sustituto engañosa. Hay muchos ejemplos de los tratamientos que han tenido un importante efecto beneficioso sobre un sustituto resultado, que anteriormente se había demostrado que se correlaciona con un resultado clínico relevante en los estudios observacionales, pero en los que los tratamientos han resultado ineficaces o perjudiciales en los siguientes, que utilizan grandes ECA Estos mismos resultados clínicos [1].

Complejo escalas, a menudo de combinaciones arbitrarias de los síntomas y signos clínicos, son también problemáticas. Una revisión de 196 ECA en la artritis reumatoide identificado más de 70 diferentes escalas de resultados [14]. Que resulta más preocupante es la revisión de 2000 ECA identificados en la esquizofrenia 640 escalas de muchas de las cuales se diseñaron para el RCT y no tiene datos de apoyo sobre la validez o la fiabilidad, pero que era más probable que muestran los efectos del tratamiento estadísticamente significativos que estableció escalas [15] . Por otra parte, el significado clínico aparente de los efectos del tratamiento (por ejemplo, un 2,7 puntos en una reducción media de 100 puntos por resultado la escala de los diversos síntomas y signos) es por lo general imposible de discernir. Simple resultados clínicos suelen tener más validez externa, pero, incluso entonces, sólo si así lo reflejan las prioridades de los pacientes. Por ejemplo, los pacientes con epilepsia son mucho más interesados en la proporción de individuos libre de las incautaciones en el ECA de los anticonvulsivantes que en los cambios en el promedio de la frecuencia de las crisis. La determinación de que efectivamente mide el resultado también puede ser importante. Por ejemplo, el registrado el riesgo de derrame cerebral debido a la endarterectomía carotídea depende en gran medida de si los pacientes fueron evaluados por un cirujano o un neurólogo [16].

Muchos juicios se combinan los acontecimientos en su medida de resultado primaria. Esto puede producir una medida útil del efecto global del tratamiento en todos los resultados pertinentes, y que por lo general ofrece una mayor potencia estadística, pero los resultados que es lo más importante para un paciente en particular puede ser afectados de forma diferente por el tratamiento que el resultado combinado. Compuesto de los resultados a veces también se combinan los acontecimientos de muy diferente gravedad, y los efectos del tratamiento pueden ser impulsadas por los menos importantes resultados, que a menudo es la más frecuente. Igualmente problemático es el compuesto definitivo de eventos clínicos y los episodios de hospitalización. El hecho de que un paciente está en una ECA probablemente afectan a la probabilidad de hospitalización, y que sin duda varían entre los distintos sistemas de atención sanitaria.

Otro problema importante para la validez externa de la ECA es una insuficiencia de la duración del tratamiento y / o seguimiento. Por ejemplo, aunque los pacientes con epilepsia refractaria o la migraña requiere tratamiento durante muchos años, la mayoría de nuevos medicamentos ECA examinar los efectos del tratamiento de sólo unas semanas. Si la respuesta inicial es un buen predictor de beneficio a largo plazo es desconocida. El mismo problema se ha detectado en ECA en la esquizofrenia, con menos de 50% de los juicios que tengan más de seis semanas de seguimiento, y sólo el 20% de los pacientes después de más de seis meses [17]. El contraste entre los efectos beneficiosos de los tratamientos en el corto plazo y de la ECA menos alentadora experiencia de tratamiento a largo plazo en la práctica clínica ha sido destacada también por los médicos que tratan a pacientes con artritis reumatoide [18].

Los efectos adversos del tratamiento

La presentación de informes de efectos adversos del tratamiento en el ECA y revisiones sistemáticas es a menudo pobres. En una revisión de 192 ensayos farmacéuticos, menos de un tercio ha adecuado la presentación de informes de eventos adversos clínicos o de laboratorio de toxicología [19]. Tratamiento de las tasas de proporcionar alguna guía a la tolerabilidad, pero los ensayos farmacéuticos suelen utilizar los criterios de elegibilidad y en vísperas de los períodos de excluir a los pacientes que pueden ser propensos a los efectos adversos.

Los médicos son por lo general más preocupado por la validez externa de la ECA de tratamientos potencialmente peligrosos. Complicaciones de la medial intervenciones son una de las principales causas de muerte en los países desarrollados. Los riesgos pueden ser sobreestimadas en el ECA, en particular durante la introducción de los nuevos tratamientos cuando los juicios se hace a menudo en pacientes con enfermedad muy grave, pero rigurosa selección de los pacientes, el parto en centros especializados, y la intensa vigilancia de la seguridad suele dar lugar a una reducción en los riesgos de la práctica clínica habitual . ECA de warfarina en la fibrilación auricular no reumática son buenos ejemplos. Todos los ensayos informaron beneficiarse con warfarina, pero las tasas de complicaciones son mucho más bajos que en la práctica habitual, y las consiguientes dudas sobre la validez externa son en parte culpables de los principales underprescribing de warfarina, en particular en las personas de edad [1].

CONCLUSIONES

Algunos juicios han excelente validez externa, pero muchos no lo hacen, en particular algunas de las realizadas por la industria farmacéutica. Sin embargo, los investigadores, los organismos de financiación, comités de ética, revistas médicas, y todos los reguladores gubernamentales negligencia la debida consideración de validez externa. Sentencia se deja en manos de los médicos, pero la presentación de informes de los factores determinantes de la validez externa en el juicio publicaciones, y especialmente en secundaria informes y guías clínicas, rara vez es suficiente y mayor cantidad de información importante es nunca publicados. ECA no se puede esperar que producen resultados que son directamente relevantes para todos los pacientes y todos los ajustes, pero para ser válido externamente pero por lo menos deberían ser diseñados e informados de una manera que permite a los clínicos para juzgar a los que razonablemente puede aplicarse. Se requiere un consenso sobre la forma en que el diseño y la presentación de informes de los ensayos se puede mejorar con el fin de lograr este objetivo. Acuerdo sobre una lista de las cuestiones más importantes que deben ser considerados por los clínicos y los investigadores sería un útil primer paso.