Population Health Metrics, 2006; 4: 10-10 (más artículos en esta revista)

La coherencia y precisión de los códigos de diagnóstico de cáncer generados por el registro automatizado: la comparación con el registro manual

BioMed Central
Giovanna Tagliabue (biomol@istitutotumori.mi.it) [1], Anna Maghini (biomol@istitutotumori.mi.it) [1], Sabrina Fabiano (biomol@istitutotumori.mi.it) [1], Andrea Tittarelli (biomol @ istitutotumori.mi.it) [1], Emanuela Frassoldi (biomol@istitutotumori.mi.it) [1], Enrica Costa (biomol@istitutotumori.mi.it) [1], Silvia Nobile (biomol@istitutotumori.mi.it ) [1], Tiziana Codazzi (biomol@istitutotumori.mi.it) [1], Paolo Crosignani (biomol@istitutotumori.mi.it) [1], Roberto Tessandori (r.tessandori @ asl.sondrio.it) [2 ], Paolo Contiero (biomol@istitutotumori.mi.it) [1]
[1] Registro Poblacional de Cáncer de División, Istituto Nazionale per lo Studio e la Cura dei Tumori, Via Venezian 1, 20133 Milán, Italia
[2] de la provincia de Sondrio Autoridad Sanitaria, Via Stelvio 35 bis, 23100, Sondrio, Italia

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0], que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que la obra original es debidamente citados.

Resumen
Fondo

Procedimientos automatizados son cada vez más utilizada en los registros de cáncer, y es importante que los datos obtenidos son para el control sistemático de la coherencia y la precisión. Se evaluó un procedimiento automatizado para los registros de cáncer, aprobada por el Registro Poblacional de Cáncer de Lombardía en 1997, comparando automáticamente generados por los códigos diagnósticos con los producidos manualmente más de un año (1997).

Métodos

La genera automáticamente los casos de cáncer son producidos por los algoritmos de registro abierto. Para el registro manual, el personal capacitado consultó la historia clínica, patología informes y certificados de defunción. El código de seguridad social, el presente y el comprobado en ambas bases de datos en todos los casos, se utilizarán para hacer coincidir los archivos en el manual y automática de bases de datos. Los casos de cáncer generados por los dos métodos se compararon mediante la revisión manual.

Resultados

El procedimiento automatizado genera 5027 casos: 2959 (59%) fueron aceptadas automáticamente y 2068 (41%) se marcarán para la comprobación manual. Entre los casos aceptados automáticamente, las discrepancias en los temas de datos (apellido, nombre, sexo y fecha de nacimiento) constituyen el 8,5% de los casos, y discrepancias en los tres primeros dígitos de la CIE-9 código constituye el 1,6%. Entre los casos marcados, los cánceres del tracto genital femenino, sistema hematopoyético, metastásico y estados morbosos mal definidos los sitios, orofaringe y predominaron. Las razones son habituales el uso de genéricos vs específicos códigos, la presencia de múltiples primarios, y el uso de extranodal vs nodal códigos para los linfomas. El porcentaje de casos aceptados automáticamente osciló entre el 83% de mama y cáncer de tiroides y el 13% de metástasis y estados morbosos mal definidos los sitios de cáncer.

Conclusión

Dado que el 59% de los casos fueron aceptados automáticamente y contiene un número relativamente reducido, en su mayoría triviales discrepancias, el procedimiento automático es eficiente para la generación de rutina caso de corte de manera efectiva la carga de trabajo necesaria para la comprobación de rutina caso de esta cantidad. Entre los casos no aceptados automáticamente, las discrepancias se debieron principalmente a las variaciones en la codificación de la práctica.

Fondo

Los datos facilitados por los registros de cáncer son vitales para la vigilancia de la salud pública, la planificación de los servicios de salud, la evaluación del impacto de las intervenciones en la incidencia de cáncer y la supervivencia, la auditoría clínica, epidemiológica y de investigación. También proporcionan información útil para la promoción de la salud y el consejo genético. Para cumplir estas funciones de manera adecuada, los datos producidos por los registros de cáncer debe ser de alta calidad [1]. Incompleta e inexacta de registro de datos pueden introducir graves prejuicios a las estimaciones de supervivencia del cáncer [2, 3] y las tasas de incidencia de cáncer [4 - 6].

Los avances en la tecnología de la información han influido en todos los aspectos de la asistencia sanitaria. En el ámbito de los registros de cáncer, transferencia electrónica de datos reduce los errores de transcripción, reduce la necesidad de extracción manual de datos, promete reducir el tiempo necesario para publicar y analizar datos, y es por lo general más rentable que los métodos manuales tradicionales. Se ha convertido así en lo posible para generar la incidencia de cáncer de forma automática los datos transferidos electrónicamente los datos mediante los programas de ordenador, con más ahorro de tiempo y mano de obra. Es importante, sin embargo, para comprobar la exactitud y la coherencia de forma automática los datos producidos.

En el presente estudio se han validado registro automatizado en comparación con el registro manual de todo un año de incidencia. La primera ventaja de este método de comparación es que se evalúa todo el procedimiento de registro automatizado, incluida la fuente de adquisición, registro y vinculación algoritmo función. Cada uno de estos procedimientos pueden estar asociados con las inexactitudes que influyen en la precisión global del proceso automatizado. La segunda ventaja del método es que evita el sesgo de muestreo debido caso (o volver a la abstracción), ya que considera que prácticamente todos los casos incidentes en el año.

En 1997, el Registro Poblacional de Cáncer de Lombardía (LCR), provincia de Varese, al norte de Italia, presentó un procedimiento automatizado computarizado (Open Registry) para generar la incidencia de cáncer de los datos transferidos electrónicamente los archivos fuente. En el presente estudio, examinar la coherencia y la exactitud de los datos generados automáticamente en comparación con el generado manualmente la incidencia de cáncer de datos para la misma población Varese en 1997.

Métodos
Manual de registro

Fuentes de los datos para el registro manual se historias clínicas, informes de patología y los certificados de defunción. El personal capacitado consultó la historia clínica y patología informes en los archivos de los hospitales y los laboratorios de patología de la provincia de Varese y en algunos institutos de provincias vecinas, la abstracción de datos en caso de las formas. Impreso certificados de defunción llegó directamente de la autoridad sanitaria local.

Los temas se resumieron los datos demográficos, localización tumoral, fecha de diagnóstico, la naturaleza de la confirmación del diagnóstico y tipo de tumor según la Clasificación Internacional de Enfermedades (CIE-9, la OMS de 1975, para topografía) y la Clasificación Internacional de Enfermedades para Oncología (OIPC - 2, la OMS 1990, por la morfología). Siempre que sea posible, el certificado de defunción sólo (ACA) fueron validados por la localización de historias clínicas y los informes de patología. Los registros fueron controlados rutinariamente por la coherencia de personal médico.

El LCR es tumor a base de: múltiples primarios que ocurren en un paciente se registran por separado si difieren morfológicamente (OIPC-2) o se producen en diferentes sitios anatómicos (tercer dígito de la CIE-9 código del sitio). En 1976-1997, 84% de los casos fueron verificados microscópicamente. El porcentaje de casos DCO es, por término medio el 2% de los nuevos casos de cáncer registrados en cualquier año [9 - 11]. Estos indicadores sugieren que la LCR los datos son de calidad aceptable.

Inscripción automática

Las fuentes de datos son archivos de alta hospitalaria y los certificados de defunción (que contiene tanto la CIE-9 códigos) y patología informes, que contienen códigos SNOMED (versión 2, 1979) [12]. Estos registros fueron diseñados, y se recogen, para fines distintos de los registros de cáncer. Archivos electrónicos que contengan dichos datos son enviados periódicamente a la LCR. El registro abierto el software se traduce códigos SNOMED a la CIE-9 (1975) de los códigos mediante un sistema de traducción desarrollado in-house y se incorporan en el Registro de software abierto. Abrir enlaces Registro entonces las actas de las fuentes de archivos para agregar información de la persona. Esto se hace utilizando deterministas y los métodos probabilísticos [13]. Por último la consistencia de los datos se realizan los controles, una vez más por ad-hoc dentro de rutinas de registro abierto.

La incidencia datos son generados por el registro abierto de algoritmos que actúan en la CIE-9 códigos ahora presentes en cada caso en cada uno de los ficheros fuente. La estrategia implementada por los algoritmos es elegir el mejor código de los que podrían estar disponibles para cada caso. La incidencia de datos se generan en tres pasos:

La comparación de datos

Se encontró que 2959 (59%) generan de forma automática los casos de cáncer fueron aceptadas por el registro abierto, porque la CIE-9 códigos fueron concordantes de todas las fuentes de datos, mientras que 2068 (41%) se marcarán para la verificación manual como los códigos no son concordantes, o porque había un código único incidente. Hemos llevado a cabo en ambas comparaciones automáticamente los casos aceptados (primer nivel de comparación) y en los casos marcado para la comprobación manual (segundo nivel de comparación).

El objetivo del primer nivel de comparación fue determinar el grado de acuerdo entre el automático y manual elaborado códigos de sitio, y, por ende, proporcionar una evaluación de la calidad de la generación automatizada caso.

El segundo nivel de comparación se llevó a cabo para determinar las razones por las cuales los casos no pueden ser generados automáticamente: esto se ha traducido en comparación manual de la enfermedad o más códigos de cada caso marcado con el código producidos manualmente. El código de seguridad social, el presente y el comprobado en ambas bases de datos en todos los casos, se utilizarán para hacer coincidir los archivos en el manual y automática de bases de datos.

Resultados
Primer nivel de comparación
Segundo nivel de comparación

El segundo nivel de comparación se llevó a cabo en el 2068 los casos de pabellón de registro abierto que requieren control manual. El porcentaje de casos aceptados automáticamente variado con cáncer in situ (Tabla 3]. Entre común de tumores malignos, el cáncer orofaríngeo (códigos 140-149), los cánceres de tiroides no las glándulas endocrinas (código 194) y los cánceres de órganos genitales femeninos (códigos 179-184) se caracterizaron por una alta proporción que requiere la comprobación manual. Entre los cánceres raros, los del ojo (código 190), el peritoneo y el cáncer abdominal, y también mal definidos, metastásico y cáncer de sitio no especificado (códigos 158-159, 195-199, respectivamente) tenían una alta proporción que requiere la comprobación manual. Cerca del 50% de cáncer pleural (código 163), hueso y tejidos blandos cánceres (códigos 170 y 171), piel melanoma (código 172), y linfoma (códigos 200-202) fueron aceptadas automáticamente.

Por el contrario, las mujeres el cáncer de mama (código 174) y cáncer de tiroides (código 193) se caracterizaron por una alta tasa de aceptación automática, con sólo el 17% de los casos que requieren control.

El cuadro 4 se indican los problemas encontrados en los casos de pabellón. Casi la mitad de los casos de melanoma (código 172) había un sólo código fuente y por esta razón fueron automáticamente marcado para la comprobación manual. Había una única fuente de datos también para el 48,8% de los casos de leucemia marcado (códigos 204-208) y el 43% de los 14 peritoneal, abdominal retroperitoneal y los cánceres (códigos 158 y 159).

Una de las razones más comunes para marcar es que los códigos difiere entre los distintos registros fuente. Los códigos pueden diferir aún con referencia a sitios en un solo sistema de órganos (ejemplos: los códigos 153 y 159 cánceres del tracto digestivo; los códigos 200 y 208 cánceres del sistema hematopoyético), o podría implicar diferentes órganos y sistemas (por ejemplo: código 200 hematopoyética sistema digestivo y 151 órganos; código 170 huesos y código 162 de órganos respiratorios).

La presencia de distintos códigos se refieren a un único órgano del sistema no se suele indicar una gran discrepancia. Por ejemplo, muchos casos de cáncer orofaríngeo tenía dos o más códigos (por lo general 145 y 146), indicando las regiones adyacentes dentro de la cavidad oral. Entre los discrepantes linfomas, muchos se debieron a la codificación en un sitio extraganglionar (por ejemplo, estómago, testículos o las amígdalas; los códigos 151, 186 y 146, respectivamente) y no como un linfoma maligno (códigos 200-202). (Tabla 4]

Cuando discrepante códigos se refiere a distintos órganos y sistemas, los más comúnmente involucrados códigos fueron: tumores malignos y de otros sitios mal definidas (código 195), metástasis (códigos 196-198), sitio no especificado (código 199) y los tumores malignos del aparato genital femenino (códigos 179-184).

Por ejemplo, el código 199 suele ir acompañada código 155 (primario del hígado), pero tras la confirmación histológica, el más correcto código 197 (enfermedad del hígado metastásico) sustituyó los códigos 155 y 199 en los siguientes registros (datos no presentados).

Discusión

Aunque la necesidad del control de la calidad de los datos del registro de cáncer es reconocida [14], existen pocos datos sobre la calidad del tratamiento automatizado de los procedimientos de registro de cáncer. Las evaluaciones de precisión utilizando principalmente métodos automatizados están disponibles para el Condado de Arhus, Dinamarca [7]; Veneto [8] y Ontario, Canadá [7]. El enfoque en Arhus Condado fue comparar el tratamiento automático de datos con los recogidos a mano por el danés Registro Nacional de Cáncer. Detalles de la comparación de sitio no están disponibles. El enfoque en Ontario fue de nuevo el resumen de datos. Para el Condado de Arhus informó nivel de precisión fue del 98,6% para todos los sitios de cáncer, y Ontario para el acuerdo entre manual y asistida por ordenador diagnóstico fue de 93,3%. Ambas cifras están estrechamente comparable a nuestro 98,4%.

En un recientemente publicado comparación entre manual y genera automáticamente los datos de todos los sitios de cáncer en el Registro de Cáncer de Venecia (Italia) [8] concordancia fue de 93,3%. Este registro fue la primera en Europa para el uso de un procedimiento automático para la generación de la incidencia de cáncer, y es tranquilizador que nuestro nivel de concordancia fue similar al obtenido por este enfoque innovador. El veneciano estudio utilizó una nueva técnica de la abstracción. A pesar de volver a la abstracción es un excelente método para verificar la exactitud de los registros de cáncer comprobar de forma rutinaria, en parte porque requiere recursos limitados, no es ideal para evaluar la recopilación de datos nuevos. Creemos que un método que analiza la incidencia de un determinado período de tiempo es más apropiado. Se consideraron todo un año de la incidencia que brinda la oportunidad de evaluar la eficacia del procedimiento automatizado para el cáncer de sitios raros.

Primer nivel de análisis
Segundo nivel de análisis
Conclusión

En conclusión, el método automatizado de los registros de cáncer introducido recientemente para el LCR se ha demostrado que producen datos de buena calidad en comparación con el método manual. Dado que el 59% de los casos fueron aceptados automáticamente y contiene un número relativamente reducido y la mayoría de trivial discrepancias, el procedimiento automático es eficiente para la generación de rutina caso de corte de manera efectiva la carga de trabajo exigida por esta cantidad. Dado que los registros de cáncer seguirá funcionando en los presupuestos restringidos, es importante que tanto la inscripción como posible tratamiento se realiza automáticamente sin comprometer la calidad de datos, con lo que libera recursos humanos para los más apremiantes problemas de acortar el desfase entre la adquisición de datos y la publicación de los análisis. Es probable que la viabilidad y la eficiencia de registro automatizado mejorará en el futuro la atención de la salud como fuente de datos cada vez más disponibles en formato electrónico.

Conflicto de intereses

Los autores declaran que no tienen intereses en conflicto.

Autores de las contribuciones

G. Tagliabue concebido del estudio, participaron en su diseño, coordinación y análisis, verificado diagnósticos clínicos y standardisations, y redactó el manuscrito.

P. Contiero concebido del estudio, participaron en su diseño, coordinación y análisis, prevista la recogida de datos y registro de los vínculos, y ayudó a redactar el manuscrito.

A. Maghini, A. Tittarelli, S. Fabiano y T. Codazzi realizó automatizado de adquisición de datos y la normalización, y ejecutado el expediente de vínculos.

E. Frassoldi, E. Costa y S. Nobile resumieron la información clínica de historias clínicas.

R. Tessandori y P. Crosignani críticamente evaluado el diseño del estudio y los métodos de análisis.

Todos los autores leído y aprobado el manuscrito final.

Agradecimientos

La LCR está financiado por la Región de Lombardía. Los autores están en deuda con Don Ward por su ayuda con el Inglés y la lectura crítica del manuscrito.