BMC Medical Research Methodology, 2005; 5: 21-21 (más artículos en esta revista)

Evaluación empírica de los intervalos de predicción de la incidencia de cáncer

BioMed Central
Bjørn Møller (bjorn.moller @ kreftregisteret.no) [1], Harald Weedon-Fekjær (harald.fekjaer @ kreftregisteret.no) [1], Tor Haldorsen (tor.haldorsen @ kreftregisteret.no) [1]
[1-0310 Oslo, Noruega

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

Intervalos de predicción se puede calcular para predecir la incidencia de cáncer sobre la base de un modelo estadístico. Estos intervalos incluyen la incertidumbre de las estimaciones de los parámetros y las variaciones en las tasas de futuro, pero no incluyen la incertidumbre de las hipótesis, como la continuación de las tendencias actuales. En este estudio se evaluó si los intervalos de predicción son útiles en la práctica.

Métodos

Precios para el período 1993-97 se prevé tasas de incidencia de cáncer en los cinco países nórdicos para el período 1958-87. En un modelo de regresión de Poisson, el 95% se construyeron intervalos de predicción para 200 combinaciones de 20 tipos de cáncer para hombres y mujeres en los cinco países. El nivel de cobertura se calcula como la proporción de los intervalos de predicción que se refiere al número de casos observados en 1993-97.

Resultados

En general, el 52% (104/200) de la predicción de los intervalos comprendidos observado números. Cuando la predicción de los intervalos se dividen en cuartos según el número de casos observados en el último período, el nivel de cobertura es inversamente proporcional a la frecuencia (84%, 52%, 46% y 26%). El nivel de cobertura varía ampliamente entre los cinco países, pero la diferencia se redujo después de ajustar por el número de casos en cada país.

Conclusión

El nivel de cobertura de los intervalos de predicción depende fuertemente sobre el número de casos en los que se basan las predicciones. Como el aumento de tamaño de la muestra, la incertidumbre acerca de la idoneidad del modelo dominado, y el nivel de cobertura cayó muy por debajo del 95%. Intervalos de predicción para la incidencia de cáncer, por lo tanto, debe ser interpretado con cautela.

Antecedentes

Predicción de la incidencia de cáncer es de gran interés tanto para las autoridades sanitarias y la comunidad científica [1]. Las estimaciones de la futura carga del cáncer debe indicar la cuantía apropiada de los recursos que se necesitarán para el diagnóstico, tratamiento y rehabilitación. Dado que la cuantificación de la incidencia del cáncer es inherentemente incierta [2], algunos de medición de la incertidumbre sería útil. Se ha sugerido que, de forma similar a los intervalos de confianza del nivel calculado de la modelación estadística, intervalos de predicción debe presentarse con las predicciones de la incidencia de cáncer [3, 4].

Cuando la incidencia del cáncer se prevé en un modelo estadístico, tres fuentes de incertidumbre se asocian con el número previsto. La primera es la diferencia de los parámetros estimados en el modelo, la segunda es la variación aleatoria del futuro número de casos, y la tercera es la adecuación del modelo. La última incluye la incertidumbre tanto en la estructura matemática del modelo y la elección de los componentes de las proyecciones, como para suponer que si las tendencias actuales continuarán en el futuro. Las dos primeras fuentes de variación se pueden incluir en un modelo estadístico. Intervalos que se basan únicamente en la diferencia de los parámetros estimados en el modelo se denominan "intervalos de confianza", mientras que los intervalos de abarcar también la variación en el futuro el número de casos se conocen como «los intervalos de predicción".

La tercera fuente de incertidumbre, las variaciones causadas por las desviaciones de las hipótesis del modelo, es difícil de formalizar. Engeland et al. [5] argumentó que "Las grandes incertidumbres asociadas con la especificación de los modelos que se utilizan en las predicciones obviar la construcción de intervalos de confianza." Una forma de investigar el grado de incertidumbre en la especificación de un modelo de predicción para calcular intervalos de Datos históricos y, a continuación, calcular la proporción de los intervalos que cubren la realidad observada número de casos de cáncer. Si la proporción está cerca del nivel nominal, por ejemplo, el 95%, los intervalos de predicción se podrían adoptar para dar una buena descripción de la gama de posibles valores que se espera. Una baja proporción indicaría que existe gran incertidumbre en la hipótesis del modelo, y los intervalos de predicción que deben interpretarse con cautela. El objetivo de este estudio fue evaluar el grado en que la predicción de los intervalos de derivados de tasas de incidencia se puede esperar para cubrir el número real observada 10 años más tarde.

Métodos
Material

El material consta de nuevos casos de cáncer informaron de los registros de cáncer de Dinamarca, Finlandia, Islandia, Noruega y Suecia entre 1958 y 1997, y las cifras de población que abarca el período comprendido entre el mismo calendario de la central de las oficinas de estadística de estos países. Suecia tiene la mayor población, con 8,9 millones de habitantes, seguido de Dinamarca, Finlandia, Noruega e Islandia, con 5,3, 5,2, 4,5 y 0,3 millones, respectivamente. Los registros de cáncer nórdicos recibirá informes de los médicos, hospitales, laboratorios patológica y citológica y (excepto en Suecia), los certificados de defunción [6]. Obligatoria la presentación de informes y la información procedente de múltiples fuentes de garantizar casi al 100% la integridad de todos los registros de cáncer [7].

El cuadro 1 se enumeran los tipos de cáncer incluidos en el estudio. Descripciones detalladas de los tipos de tumores en cada sitio que se incluyen se dio por Engeland et al. [5]. Como eran pocos los casos de cáncer de labio y laringe entre las mujeres y de la mama entre los hombres, estos cánceres se incluyeron en los otros sitios'.

Los datos se tabularon de cinco años en los grupos de edad (0-4, 5-9, ..., 80-84, ≥ 85), y de cinco años de calendario períodos (1958-62, 1963-67, ..., 1993 -97). Dado que hay 20 tipos de cáncer para cada sexo y cinco países en el estudio, teníamos 200 combinaciones diferentes de la que se pueden realizar predicciones.

Modelo estadístico

La edad-período-cohorte modelo (APC) [8], ha sido ampliamente utilizado para predecir la incidencia de cáncer y la mortalidad [9 - 13]. Este modelo de regresión de Poisson se basa en las tablas con cinco años y grupos de edad de cinco años los períodos de calendario. Cohortes de nacimiento se construyeron sintéticamente restando la edad del período. El modelo puede ser escrito como

R ap = exp (a + D p p + P + C c),

Pa donde R es la tasa de incidencia en el grupo de edad a en el calendario período p, D es el parámetro común de la deriva [14], a es un componente de la edad para grupo de edad a, P p es la no lineal período componente de período y p C C es la no lineal cohorte componente de cohorte c, c = p - una. Se utilizó un modelo ligeramente modificada [5], la sustitución de un poder para el enlace de registro enlace:

R ap = (A a D + p p + P + C c) 5,

Con el fin de descender el crecimiento exponencial en el modelo multiplicativo. Un estudio empírico de estos dos modelos mostraron que el modelo de poder que se dio predicciones más cerca de las tasas observadas [2]. Para algunos tipos de cáncer para los que sólo hubo unos pocos casos en Islandia, un modelo sin componente de la cohorte fue utilizado; ver Engeland et al. [5] para más detalles y en los límites inferiores de los grupos de edad para cada sitio incluido en todos los países.

Para garantizar un ajuste razonable de cada conjunto de datos al modelo, el número de períodos de cinco años en los que las predicciones deben basarse en fue elegido. En primer lugar, un modelo incluyendo los últimos seis periodos de 5 años (1958-1987) se ajustó. Si el modelo fue rechazado por una prueba de bondad de ajuste (5%), incluyendo un modelo de los últimos cinco períodos fue equipada. Si este modelo también fue rechazada, sólo los cuatro últimos períodos se utilizaron.

Futuro efectos no lineales de cohorte y periodo, se supone que ser igual a la última efecto estimado en el modelo, y las predicciones fueron hechas por la proyección de la deriva. El número de casos de cáncer se predijo multiplicando las tasas previsto por la persona-años en situación de riesgo en un determinado grupo de edad y período de tiempo.

Intervalos de predicción, la cobertura y el nivel de discrepancia ratio

En un artículo sobre la incidencia de cáncer de precisión de las predicciones, Hakulinen y Dyba [3] derivados de predicción de los intervalos de Poisson distribuido variables. A raíz de su papel, y mucho , Donde a es el grupo de edad, f es el futuro calendario período en el que las predicciones son que se hizo (f = 8, que corresponde al período 1993-97), R af es la tasa de incidencia en el grupo de edad a en f período, y K af af n y son el correspondiente número de casos y de personas-año, respectivamente. Además, deja que el número esperado de casos, E (k af), se define como λ = n af af (a + D P + P f + C c) 5, y dejar que Y . La diferencia de la futura número de casos, var (k f), puede escribirse como var (k f) = var ( ) Σ 2 + E ( ). El primer componente, var ( ), Refleja la incertidumbre en la estimación de los parámetros en el modelo. El segundo componente, σ 2 E ( ), Refleja la variación aleatoria del futuro número de casos de una distribución de Poisson variable, que permite la variación extra-Poisson, es decir, σ 2 mide el grado de sobre-dispersión.

Un estimador de la varianza del futuro número de casos se pueden encontrar por medio de Taylor ampliación de funciones no lineales (ver fórmulas en el apéndice). Un 95% intervalo de predicción para el futuro número de casos de cáncer, k f, puede ser calculada a partir de una hipótesis de la normalidad:

Donde f k se estimó por .

Sobre la base de un máximo de seis periodos de 5 años entre 1958 y 1987, la predicción de los intervalos de los números de casos en el período 1993-97 se calcularon para las 200 combinaciones de 20 sitios para cada sexo en cada uno de los cinco países. El nivel de cobertura se define como la proporción de los intervalos de predicción que se refiere al número de casos observados en 1993-97.

El nivel de cobertura sólo indica si el número de casos observados fue en el interior del intervalo de predicción o no. Información adicional puede ser obtenida mirando a lo lejos fuera del intervalo de las observaciones caída. Discrepancias ratio se define como la distancia absoluta entre predicho y observado varios casos, medido en la mitad intervalo de predicción anchuras:

Donde Y f k se predijo y el número de casos observados, respectivamente, y Es la distancia entre el número previsto de casos y el límite del intervalo de predicción. La Figura 1 ilustra la discrepancia ratio. Cuando la discrepancia ratio es mayor que 1, que mide cuánto más amplio intervalo de la predicción que había que cubrir el número de casos observados. En la Figura 1, el número de casos observados es de aproximadamente dos veces más lejos de la cantidad prevista en comparación con el límite inferior del intervalo de predicción, lo que da un ratio de 2 de discrepancia.

La prueba exacta de Fisher se utilizó para evaluar las diferencias entre los sitios, los países y cuartiles de número de casos. Un modelo de regresión binomial se utilizó para estudiar el efecto de país y la frecuencia simultáneamente.

Resultados

Se calcularon los intervalos de predicción a partir de los datos hasta 1987 para las 200 combinaciones de sexo, lugar y país. Después de observar el número de casos 10 años después, en el período 1993-97, 104 (52%) de los números observados fueron cubiertos por la predicción de los intervalos. Los niveles de cobertura de sitios específicos varían del 20% al 90%, pero sólo cinco o diez intervalos se calcularon para cada sitio y la diferencia entre los sitios no fue estadísticamente significativa (Tabla 1].

Los niveles de cobertura de los cinco países nórdicos muy variado. Para el país con la menor población, Islandia, el nivel de cobertura fue del 88%, que es relativamente cerca del nivel nominal del 95%. Los niveles de Dinamarca, Finlandia y Noruega fueron alrededor de un 50%, mientras que la de Suecia, el país más poblado, fue sólo del 25%. Cuando los 200 diferentes predicciones se ordenarán de acuerdo con el número anual de casos en el período 1983-87 (frecuencia), el corte-offs de los cuatro cuartiles fueron 70, 230 y 555. Subdividir las predicciones de acuerdo a estos cuartos, en el nivel de cobertura disminuyó notablemente con el número anual de casos, siendo el 84% para el primer cuartil y el 52%, 46% y 26% para los próximos tres, respectivamente (Cuadro 1].

El cuadro 2 muestra las asociaciones entre los países y el nivel de cobertura como odds-ratio (OR), donde las probabilidades de cubrir el número de casos observados con la predicción de los intervalos en cada país se calculó en relación con las probabilidades en Dinamarca. El crudo números reflejan el patrón visto en la Tabla 1, la posibilidad de que el número de casos observados están dentro del intervalo de predicción similares en Dinamarca, Finlandia y Noruega, Islandia y superior en inferior en Suecia. En el modelo de regresión binomial el logaritmo del número anual de casos en 1983-87 fue utilizado en lugar de la frecuencia propia o de los cuartiles de los números. La razón de esto fue que el ajuste al modelo fue peor cuando la frecuencia variable se ha introducido de forma lineal en lugar de en una escala log-lineales. Además, la introducción de la variable en cuatro categorías en lugar de como una variable continua no seguir mejorando el modelo. El OR para el logaritmo de la frecuencia es 0,52, lo que indica que un aumento de una unidad en la escala de registro de la frecuencia de la reducción de la oportunidad de cubrir el número de casos observados en aproximadamente un 50%. Cuando el país y la frecuencia son mutuamente ajustados para múltiples binomio en un análisis de regresión, el efecto de país disminuyó y se convirtió no significativa, mientras que el efecto de la frecuencia se mantuvo casi sin cambios. En el análisis univariado, el OR para Islandia relativo a Dinamarca fue 8,5 (95% intervalo de confianza (IC): 2,8 - 26), que se redujo a 1,7 (95% IC: 0,4 - 7,6) en el análisis ajustado. El nivel de cobertura de Suecia sigue siendo inferior, con OR = 0,49 (95% IC: 0,2 - 1,3) de Suecia relativa a Dinamarca.

La distribución de la discrepancia coeficiente de cada país se traza en la figura 2. Para Islandia, la mayor parte de la razón de la discrepancia por debajo de 1, que corresponde a un nivel de cobertura del 88%. De los 12% con un ratio de mayor discrepancia, ninguno fue más del 50% fuera del intervalo de predicción. En Finlandia y Noruega, observó el número de casos descendió hasta el árbol veces más lejos de la comparación con el número previsto de los límites de los intervalos de predicción, mientras que en Dinamarca y Suecia fueron algunas predicciones 5-6 veces fuera de los intervalos.

Discusión

Los niveles de cobertura en los cinco países nórdicos difieren principalmente en función de la cantidad de casos que sirvió de base para las predicciones. En Islandia, donde en general hay pocos casos, el nivel de cobertura del 95% calculado a partir de los intervalos de predicción fue de 88%, mientras que en los demás países nórdicos, que había mucho más casos, es de sólo 25-53%. El problema asociado con la interpretación de los intervalos de predicción se ilustra en la Figura 3, donde observó la normalización de la edad (Mundial estándar [15]], las tasas de incidencia de cáncer de pulmón en las mujeres en Islandia y Dinamarca se enfrenta a la predijo tasas, con un 95% Intervalos de predicción. Aunque la diferencia entre las tasas observada y predijo fue menor en Dinamarca que en Islandia, el amplio intervalo de predicción para Islandia significa que la tasa observada en 1993-97 estaba incluido en el intervalo construido para Islandia, pero el intervalo más estrecho de Dinamarca no se refiere a La tasa observada para ese país.

Un modelo estadístico es sólo una simplificación de la verdad subyacente asociaciones entre las variables. La conclusión de que el nivel de cobertura es inversamente proporcional al tamaño de la muestra se puede explicar considerando la diferencia entre el modelo (simplificado) y verdadera (compleja) relación entre la tasa de cáncer y la exposición de las variables edad, periodo y cohortes. Cuando el tamaño de la muestra aumenta, las desviaciones entre el modelo y la verdadera relación de dominar, y no se convierta en un exceso problema. Es útil distinguir entre los cálculos de los intervalos de predicción de los valores observados en el rango de valores de las variables explicativas (interpolación), y fuera de la gama (extrapolación). La falta de cobertura problema es aún mayor para las extrapolaciones, porque también relevo en el supuesto de continuación de las tendencias actuales. Otra diferencia entre interpolación y extrapolación es que cuando aumenta el tamaño de la muestra, la posibilidad de mejorar el modelo de aumentos. Esto entonces no reducir el problema de la cobertura de interpolaciones, mediante la reducción de la distancia entre el modelo y la verdadera relación entre las variables. Extrapolaciones, por otra parte, consisten en la realización de predicciones de los valores de las covariables fuera del rango de valores observados. Por lo tanto, tenemos que hacer suposiciones que no pueden ser evaluados de los datos observados y el problema con la no cobertura de extrapolaciones no son necesariamente reducidos por mejoras en el modelo.

Podría argumentarse que un bajo nivel de cobertura indica que el modelo no es adecuado, en lugar de que el cálculo de los intervalos de predication es de por sí engañoso. Con la posible excepción de los de tabaco y el cáncer de pulmón, algunas asociaciones son lo suficientemente fuertes como para ser el modelo directamente. En lugar de ello, utiliza el calendario período y cohorte de nacimiento como variables proxy de los cambios en los factores de riesgo subyacentes en el modelo. Møller et al. [2] encontró que el método utilizado en este estudio realizado bastante bien en comparación con otros métodos actualmente en uso para la predicción de la incidencia de cáncer, y que todos los métodos evaluados perdido el número de casos observados por 10-15% en promedio durante 10 años las predicciones . Métodos de predicción, por lo tanto, podría ser mejorado para aumentar el nivel general de la cobertura, a pesar de que sería razonable esperar que el modelo correcto, o cerca de ella, puede ser especificado para todos los tipos de cáncer. Mientras que las predicciones se basan en algún tipo de extrapolación a partir de un modelo estadístico, la cobertura a nivel general, disminución en función del tamaño de la muestra. El problema es que en el momento en que la predicción se calculan intervalos, de la adecuación del modelo con respecto a la extrapolación hacia el futuro por lo general no se puede evaluar. Intervalos de predicción por lo tanto, puede inducir a error, en caso de que se interpretan como el rango probable de valores para el número de casos que se esperaba.

El número de casos a partir de la cual las predicciones para los distintos tipos de cáncer se hicieron muy variado. Cánceres en algunos sitios son muy comunes, como los de próstata, pulmón y mama, mientras que otros se producen con menor frecuencia. Debido a que los niveles de cobertura varían con frecuencia, también han esperado a que varían según el sitio. Las diferencias no fueron, sin embargo, estadísticamente significativa, probablemente debido al pequeño número de intervalos de predicción calculado para cada sitio.

Una muestra de tamaño relativamente grande se asoció con un estrecho intervalo de predicción, como se ha visto para el cáncer de pulmón entre las mujeres en Dinamarca (Figura 3]. La predicción de los intervalos se basan en la teoría asintótica, que puede resultar en una subestimación de la varianza. Bootstrapping es un método adecuado para la investigación de este problema [16]. Hemos construido un 95% intervalo de predicción por bootstrapping los datos por cáncer de pulmón entre las mujeres en Dinamarca, en el supuesto de que cada celda seguido una distribución binomial en el que la tasa de incidencia y el número de años-persona en situación de riesgo se utilizaron como probabilidad de éxito y el número de Ensayos, respectivamente. Estamos de nuevo la muestra de los datos 1000 veces, el cálculo de la predicción mundo de la tasa de incidencia cada vez. El 95% intervalo de arranque, calculado por la selección de los percentiles 2,5 y 97,5 de las predicciones de 1000, fue 32,7 - 36,7, que está bastante cerca de la asíntota de intervalo 32.6-36.8. Esto indica que la asíntota intervalos calculados en este estudio describir la incertidumbre en el número previsto de casos así, un modelo especificado correctamente.

Población de las previsiones son necesarias para predecir el número de casos de cáncer. En este trabajo, se supone que estos números eran conocidos, pero en realidad constituye una fuente de incertidumbre. Población de las previsiones son extrapolaciones, basándose en hipótesis sobre futuros patrones de migración, las tasas de natalidad y mortalidad. Si nuestras proyecciones para 1993-97 se había calculado en las previsiones de población de 1987, los niveles de cobertura probablemente habría sido aún menor.

La mayoría de las diferencias en el nivel de cobertura entre los cinco países desaparecieron cuando el número de casos fue controlado. El resto de la diferencia no fue significativa, pero la probabilidad de cubrir las tasas de predicción con intervalos de Suecia sigue siendo inferior después de los ajustes de tamaño de la muestra. Møller et al. [2] mostró que las predicciones de Suecia fueron más diferente de la observada en el número de casos 1993-97 distintos de los de los otros países, medida como la media del valor absoluto de la diferencia relativa entre la predicción y el número de casos observados. Esto explica el menor nivel de cobertura de Suecia, y se indica que las tendencias actuales en 1987, seguido en menor medida, en Suecia que en los otros países.

Engeland y compañeros de trabajo [5] se muestran renuentes a la predicción, con sus intervalos de las predicciones de la incidencia de cáncer en los países nórdicos. Una opinión similar fue expresada tanto con respecto a una actualización de las predicciones de los países nórdicos [17], y una predicción de la incidencia de cáncer en Nueva Gales del Sur, Australia [18]. Sin embargo, hay algunos casos en que la predicción de los intervalos pueden ser de valor. En el cáncer de vigilancia, la inclusión de intervalos de predicción en una rutina de comparación de las tasas observadas con las últimas tasas de predecir las tendencias de las anteriores, puede ayudar a identificar los cambios en las tasas más allá de la variación aleatoria. Los posibles motivos de la discrepancia entre las tasas observadas y predijo puede entonces ser estudiada, incluidos los cambios en los factores de riesgo, los métodos de diagnóstico o de las intervenciones, como programas de detección. En Finlandia, los valores previstos con intervalos de predicción para 1980 se calcularon sobre la base de tasas hasta 1968 y en comparación con el número de casos observados en 1980 [19]. Predicción intervalos de 33, 22 (67%) que abarca los valores observados, y los autores examinaron las posibles causas de los cánceres en que la predicción de los intervalos de no cubrir el número de casos observados. Predicción intervalos también puede utilizarse para identificar predicciones muy inciertos. Por ejemplo, 26 de sexo masculino de los casos de cáncer de labio se predijo en Islandia en el período 1993-97, y el 95% intervalo de predicción fue 6-46 casos.

Conclusión

No recomendamos el uso de la predicción de los intervalos de las predicciones, cuando se utilizan para fines administrativos, como la planificación de las cantidades apropiadas de los recursos para el diagnóstico, tratamiento y rehabilitación, como los intervalos pueden dar una falsa impresión de la precisión de las predicciones. Cuando las predicciones se basan en un mayor número de casos, la incertidumbre en la estimación de los parámetros del modelo y la variación al azar el futuro de las tasas de descenso. Incluso relativamente pequeñas diferencias en los supuestos que pueden dar lugar a tasas observadas en el futuro que están fuera del rango probable de valores indicados en la predicción del intervalo.

Apéndice

Un 95% intervalo de predicción para el futuro número de casos de cáncer, k f, se puede calcular sobre la base de una hipótesis de la normalidad: F k se puede ser estimado por . La diferencia de k se puede escribir f , Y Y Se puede estimar por la expansión de Taylor de funciones no lineales:

Además, el parámetro de exceso de dispersión, σ 2, se puede estimar a partir de la relación entre la desviación residual del modelo y el número correspondiente de los grados de libertad [20], y Puede ser estimado por . Se utilizó el paquete estadístico R en los cálculos, y las varianzas y covarianzas de las estimaciones de los parámetros en el modelo se encuentra en la estructura de covarianza de la glm-objeto.

Conflicto de intereses

Los autores declaran que no tienen intereses en conflicto.

Contribuciones de los autores

BM diseñó el estudio sobre la base de conversaciones con HWF y TH. BM y HWF recogidos y analizados los datos. BM redactó el manuscrito inicial. Todos los autores contribuyeron y aprobado el manuscrito final.

Historia previa a la publicación

La historia previa a la publicación de este documento puede accederse en:

Agradecimientos

Los autores desean agradecer a Petter Laake de valiosos comentarios sobre el artículo. El proyecto cuenta con el apoyo de la Unión Nórdica de Cáncer.