Emerging Themes in Epidemiology, 2006; 3: 5-5 (más artículos en esta revista)

Counterfactuals y criterios de causalidad, y nada más (o menos) que el sentido común científico

BioMed Central
Carl V Phillips (carl.v.phillips @ ualberta.ca) [1], Karen J Goodman (karen.goodman @ ualberta.ca) [1]
[1] Universidad de Alberta Escuela de Salud Pública, Edmonton, Canadá
[2] Departamento de Medicina, Facultad de Medicina y Odontología de la Universidad de Alberta, Edmonton, Canadá

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen

Dos mitos persistentes en la epidemiología de que se puede utilizar una lista de los "criterios de causalidad" para proporcionar un enfoque algorítmico para inferir la causalidad, y que un moderno "modelo contrafactual" puede ayudar en el mismo empeño. Creemos que estos no son ni criterios, ni un modelo, sino que las listas de consideraciones y formalizations causal de la de la definición de la causalidad, sin embargo, son herramientas útiles para la promoción del pensamiento científico. Ellos nos en el camino al sentido común de la investigación científica, incluida la prueba de hipótesis (realmente poner a prueba, no sólo el cálculo de las estadísticas simplista), en respuesta a la Duhem-Quine problema, y evitar muchos errores comunes. Austin Bradford Hill famosos consideraciones son a la vez más-interpretado por aquellos que los utilizan como criterios y apreciada por menores de los que despedir como defectuoso. Del mismo modo, formalizations de counterfactuals están insuficientemente apreciado como lecciones básicas en el pensamiento científico. La necesidad de la experiencia científica en el sentido común es grande en la epidemiología, que se enseña en gran medida como una disciplina de ingeniería y practica fundamentalmente como tareas técnicas, lo que hace a la atención de los principios fundamentales de la investigación científica sumamente raros.

Antecedentes

Una interesante mito persistente en la epidemiología es que Austin Bradford Hill, el comité de preparación del original de los Estados Unidos Cirujano General en su informe sobre el hábito de fumar, Mervyn Susser, o de otros autores nos han proporcionado una serie de criterios para la identificación de las relaciones causa-efecto. Esta noción es muy robusta, dado que estas listas claramente no cumplen los criterios habituales de las definiciones, lo que implica algún tipo de norma o prueba. Aun cuando los autores que invocar los "criterios de Bradford Hill" ceder ante el regaño de varios autores (entre los que nos incluimos [1]], y diligentemente Hill uso de la palabra - "consideraciones" - en lugar de "criterios", que todavía parecen ser En la búsqueda de criterios difícil de alcanzar.

Una mitología a entrar en boga, más recientemente, es que hay un "modelo contrafactual" que nos pueden ayudar a reconocer y entender mejor la causalidad en epidemiología. Así como los criterios de causalidad no son criterios, la presentación oficial de counterfactuals no cumple con la definición de modelo, que puede ser pensada como un esquema o representación que captura parte de la esencia de un sistema más complicado de una manera que conduce a propiedades emergentes.

En estas páginas, Höfler [2] tuvo en el objetivo de tratar de entender mejor las consideraciones Hill [3] por la invocación de una modelo contrafactual. Como era de suponer de lo anterior, no consideramos que se trata de un logro prometedor. Creemos que las consideraciones de causalidad y la de la conceptualización son a la vez útiles, pero no de forma que apoyen al igual que un análisis de Höfler. No obstante, Höfler proporciona lo que es posiblemente la mejor frase de una evaluación del concepto de criterios de causalidad, y muy bien (aunque quizás inadvertidamente) ayuda a sostener el caso de que las consideraciones de causalidad y counterfactuals son, más que cualquier otra cosa, guía en el camino de la común Sentido.

Análisis
No criterios

"Criterios" que a veces se define demasiado amplia para incluir todo lo que puede querer pensar en la hora de tomar una decisión (es decir, como sinónimo de "consideraciones"). Pero la mayoría de las definiciones incluyen una referencia a una prueba, base para la sentencia, o condición (y de cualquier persona tratando de "aplicar" una serie de criterios para tomar una decisión debe tener una definición en la mente). Es evidente que las consideraciones de causalidad no cumple con estos criterios más estrictos de las definiciones. No existe un método para determinar si la forma o bien cada examen se cumple (por ejemplo, los investigadores parecen capaces de concoct algunos biológicos historia, para explicar todas las asociaciones en sus datos; lo absurdo tengo que hacerlo antes no hay verosimilitud biológica?), Por no hablar de la forma en que sería cualquiera de esos resultados agregados de las consideraciones individuales en una decisión definitiva acerca de la causa y el efecto. Este tiende a ser oscurecida cuando los comentaristas de los principales críticas son que las condiciones propuestas no son ni necesarios ni suficientes, con vistas al hecho de que las principales no están realizando bien definidas las condiciones (y por lo tanto no se puede ni necesario ni suficiente, ni pueden ser no - Necesario o no suficiente).

Con esto en mente, es instructivo considerar las implicaciones de los autores proporcionando ejemplos mundanos causal de las condiciones se cumplan, como prueba de que las condiciones ya sea informativa o engañosa, o de los intentos del Höfler como para mejorar la aplicación de los criterios. Esos autores tienen claramente en cuenta algunos estándar para juzgar si se cumple una condición, y si es una relación causal. La última evaluación debe ser independiente de los criterios (ya que se pretende validar la utilidad de los criterios) y, lo que es más importante, es de suponer que pretende ser algo que la mayoría de los lectores se acordará. Esto sugiere una presunción de sentido común compartido. Poole [4, 5], inspirado por Thomas Kuhn [6, 7], sugiere que en lugar de criterios, consideraciones causales son "valores" que los científicos puedan celebrar diferentes a los distintos grados. Los valores son las bases para hacer mundano conclusiones, pero tienden a carecer de los sistemas de puntuación y otros elementos de los algoritmos, y cualquier reclamo sobre la base de éstas están sujetas a la interpretación y control. De hecho, la evidencia empírica y experimental Poole cita deja claro que los epidemiólogos de la interpretación de las consideraciones varían sustancialmente [8 - 14]. Pero los debates entre los científicos acerca de los valores que son legítimas sugerir la sensación de que debe haber compartido algunos científicos el sentido común, en lugar de la persistencia de la heterogeneidad de los valores.

Ni Hill ni ningún otro de la lista puede codificar el sentido común, pero puede presentar algunas de ellas y, por tanto, servir de punto de partida. Esto es muy útil ya que el sentido común es poco común y, por tanto, preocupante en la necesidad de cualquier ayuda que puedan obtener. Para los investigadores que no consideran, por ejemplo, la coherencia entre los estudios o la coherencia con los conocimientos anteriores en su evaluación de la causalidad, y declarar con orgullo que "nuestra investigación es el primero en mostrar que la exposición enfermedad D E causas, en contra de numerosos resultados anteriores", ; Hill en la lección de sentido común tiene valor inmediato. Asistirá a la Colina o de los demás consideraciones causal alentaría a nadie escrito, "nuestro estudio es el primero en mostrar X. ..", a seguir con ello -, ya que casi siempre se deben - con, "... para X es probablemente No es cierto. "

Por supuesto, el sentido común es más útil en casos sencillos, mientras que el modelado (por ejemplo, el dibujo de diagramas de vías causales) se vuelve más crítica, ya que se convierte en un sistema más complejo. Höfler, observa que "el valor heurístico de Hill consideraciones del converge a cero ya que la complejidad de un sistema de causalidad y de la incertidumbre sobre la verdadera causal sistema de aumento" [2]. Esta puede ser la definitiva observación acerca de los criterios de causalidad / consideraciones. Para lanzar la paráfrasis más sencillo, las listas de causalidad consideraciones son bastante buenas reglas de pulgar cuando el sistema que se está evaluando es simple, pero en los casos en que una evaluación de la causalidad exige más de sentido común, estas listas no van a ser terriblemente útil. Höfler sigue para tratar de mejorar en la Colina de la lista para que sea más útil en casos complicados, pero nosotros pensamos en lo cierto la primera vez: en un complicado sistema de la lista sólo puede servir como una herramienta para la enseñanza científica sentido común, y no importa La forma en que se trate de la vestimenta, que no puede servir a modo de lista, algoritmo o método.

No es un modelo

El uso del término "modelo" en el párrafo anterior pone de manifiesto su sentido. Diagramas causales tomar como insumos algunos de los elementos conocidos o postulado de un sistema mundano de las causas y los efectos y schematize ellos de una manera que los nuevos conocimientos (es decir, más allá de los aportes propios) se puede extraer. En este sentido, una pequeña escala en tres dimensiones versión de un avión es un modelo (porque, por ejemplo, podemos ponerla en un túnel de viento y aprender algo acerca de la real avión que no sabíamos cuando hicimos el modelo), pero Una fotografía del avión no es un modelo (por lo menos no en cualquier forma obvia). Ni es la expresión "más pesados que el aire, de ala fija, autopropulsados de los vehículos de vuelo" de un modelo. La frase es informativo acerca de los aviones, pero de una manera diferente de un modelo: es la definición de aviones. Tenemos que tener esa frase (o alguna variante) en la mente antes de que siquiera tiene sentido hablar de aviones, por no hablar de modelo. Podría ser útil remitirse a la definición si, durante una evaluación de los aviones, que de alguna manera perdió contacto con la clase de cosas que estamos hablando. Pero la definición no es un modelo que no ofrece un método para extraer toda la información que no es simplemente una aportación a la misma, como la forma en la evaluación de aeronavegabilidad es un avión. En efecto, por sí misma no puede ayudarnos a determinar si un objeto realmente hace el corte (por ejemplo, de que realmente puede volar).

En ese espíritu, lo que muchos autores, incluidos Höfler, equivocadamente llamada la "contrafactual modelo de la causalidad" puede ser considerado una definición, no un modelo. Existe una extensa literatura filosófica sobre lo que el verbo "causa", (incluso cuando está implícito en muchos otros verbos o frases como "aumentos", "conduce a", y "protege contra" [15]] . Estas discusiones incluyen definiciones alternativas, así como los argumentos de que la palabra en realidad no tiene dientes de definición. Pero en la práctica cotidiana mundo de la epidemiología (un campo definimos en sentido amplio para incluir empírica y experimental de la investigación sobre las enfermedades y los riesgos relacionados con la salud con personas como unidad de análisis), se atrevería a decir que la mayoría de todos los que usa el lenguaje es causal implícita Invocando la de la definición ", pero para la E, D no se produzcan o no se habría producido, pero en vista de que E / habría" (que se describe con más detalle y con más lógica simbólica por Höfler y muchos otros autores, véase en particular Maldonado y Groenlandia "Estimación de los efectos de causalidad" [16]]. No podemos pensar en el uso de la palabra "causa" en la epidemiología (en la investigación y sus implicaciones políticas, con exclusión de los debates puramente filosófica) en el que el autor parece haber otra cosa en mente.

Esto no significa que la atención cuidadosa a la definición es inútil. Maldonado, uno de los principales propulsores y profesor de epidemiología en la definición formal contrafactual y sus consecuencias (y que se refiere a la "contrafactual", "concepto", o "definición", pero no "modelo"), ha señalado De las ayudas que nosotros, entre otras cosas, especificando preguntas epidemiológica, la evaluación de las estadísticas que son auténticas medidas de efecto, el diseño de los estudios, y la definición de la confusión. Gran parte de esto, sin embargo, es posiblemente el sentido común científico (véase la discusión más abajo), no de los "valores" tipo, pero en forma de primer o segundo orden lógico inferencias que los científicos deben comprender intuitivamente. Pero, de nuevo, desde el sentido común puede ser lamentablemente poco común, la formalizations por Maldonado y otros son valiosos.

Invocando counterfactuals en la búsqueda de mejores criterios de causalidad

Por lo tanto, de acuerdo con la evaluación que Höfler Hill tenido un contrafactual concepto - definición, no modelo - de la causalidad en la mente (consciente o inconscientemente) cuando dio su famoso (y de los menores de apreciado [1]] [3] hablar, y no sólo porque De algunos específicos frase que él utiliza, sino porque es difícil imaginar cualquier otra cosa que pudiera haber tenido en mente. Aunque Höfler argumenta que "contrafactual causalidad [presumiblemente el sentido de la de la definición de la causalidad] ... Sólo se convirtió en norma en la epidemiología de la década de 1980 "[2], parece muy poco probable que los epidemiólogos (o economistas o estadísticos, para los que prefieren los caracterizaciones de Hill) había alguna otra definición en cuenta que antes. Al igual que Newton "descubrir" la gravedad, los que se formalizó la definición de la causalidad en la filosofía, la estadística matemática, ciencias aplicadas y lo hizo en un contexto en el que la mayoría de la gente ya captado la idea básica y hecho uso de él (para hacer inferencias científicas o para Lejos de mantener flotando en el espacio).

Con la de la mera prestación de concepto a la definición, una colina que comparten con la mayoría de nosotros, no parece probable que pueda enseñarnos mucho acerca de nuevo a la lista Hill. En efecto, no parece que Höfler determina que los dientes en la noción de counterfactuals.

Höfler comienza con el análisis de la fuerza de asociación condición, que es particularmente buena heurística cuando un sistema es simple (por ejemplo, un grande, bien diseñado ensayo aleatorio con resultados que son fáciles de medir poco después de la intervención). Pero la fuerza de la asociación es mucho menos definitivo cuando confusión y otros errores añadir complejidad a nuestra evaluación. Höfler se refiere a la incertidumbre de que los resultados del estudio de errores, preguntando "¿el intervalo de estimación para cuentas que debidamente no sólo al azar, pero también errores sistemáticos ... para permitir la conclusión deseada ...?" añadir", de alta incertidumbre acerca de Sesgo de los parámetros que exige más grandes asociaciones modesto incertidumbre hace. "Eso es, o no es una asociación fuerte es una cuestión de contexto.

Existen métodos de análisis que se están desarrollando para poner a algunos números de ese contexto, y agradecemos la atención y animar a la cuantificación epidemiológica de la incertidumbre de los errores distintos de muestreo aleatorio, una línea de pensamiento en la epidemiología de que uno de nosotros ayudó a lanzar [17] ( Véase la nota 1). Pero a pesar de que esta línea de pensamiento surgió de la labor de Maldonado sobre los contrastes de causalidad (una línea de pensamiento que traza proximately a Groenlandia y Robins [19], y que también huellas a Rubin, Neyman, Hume, y otros pensadores) tenemos que Höfler decir que la evaluación parece que no tienen nada que ver con counterfactuals. Se apoya principalmente su tesis de que los complicados sistemas de desafiar simples reglas empíricas. Esto se ajusta a lo que hemos argumentado anteriormente: la incertidumbre acerca de las hipótesis de entrada (por ejemplo, la hipótesis de que la medición es correcta y está controlada por la confusión) es casi siempre ignorado en los resultados epidemiológicos, y de las personas (incluidos los expertos) han demostrado ser muy mala en Cuantificación de la posible magnitud del error matemático sin ayudas [17, 18, 20, 21]. Höfler intenta mejorar a la más simple declaración de la fuerza de asociación consideración, pero nada de lo que se prevé más operationalizable, dejándonos de nuevo con los valores o el sentido común.

Höfler estructuras de su análisis en torno a "qué sucede si" las preguntas, llamándolos counterfactuals, pero esta no se manifiesta formalmente en representación de la tracción de la de la definición o el ejercicio de sus implicaciones. Por ejemplo, después de observar que el criterio de coherencia sufre porque diferentes estudios de las diferentes poblaciones se espera para producir resultados incoherentes, Höfler preguntas incluidas, "Si la causal efecto varía según los estudios," (presumiblemente realmente sentido si variaron a lo largo de la Diferentes poblaciones de estudio, la exposición definiciones, etc que están implícitamente definidas por los estudios) "esperar para observar diferentes asociaciones ...?" Se trata de una valiosa lección sobre la coherencia, en sustitución de la hobgoblin tonto de la coherencia con la sistemática de la predicción Incoherencia. Este se utiliza cuando, por ejemplo, los autores les resulta tranquilizador que la asociación con una exposición es más fuerte para los cánceres histológicamente confirmados de lo que lo es para una alternativa (presumiblemente ruidosos) definición del estado de la enfermedad. Desde que se espera ver una asociación más fuerte (más probable que no) cuando hay menos (independiente, no diferenciado) error de medición, esta contradicción podría hacernos más cómodo con una conclusión causal. Sin embargo, el papel de counterfactuals en esta lección, más allá de la implícita definición de la causalidad, no está claro.

Parece que cualquier valor Höfler en el análisis no radica en counterfactuals, pero en hypotheticals - es decir, a priori hipótesis acerca de lo que los datos muestran que si una determinada hipótesis fuera verdad. Quizás esto pone un punto fino en el "sentido común", su sustitución por el pensamiento científico sistemático de la epidemiología que necesita mucho más de lo que necesita mejorarse causal listas de comprobación. Nuestro ejemplo, que las diferentes definiciones de la enfermedad debe dar lugar a asociaciones incompatibles (de forma predecible), introduce una hipótesis comprobables. Höfler presenta otro en el marco del criterio de especificidad, el endeudamiento ejemplo [22] de que el uso de cascos, si se reduce el daño y no solamente de un proxy para una tendencia a no actuar con más cuidado, en caso de que una reducción de las lesiones de la cabeza, pero no otro organismo Partes. Ambos ejemplos son útiles y, a pesar de obligar inmediatamente cuando se presenta, puede ser un paso más allá de la simple sentido común. Es evidente que hay valor en la enseñanza de la salud a los investigadores a pensar más acerca de la propuesta y las pruebas de hipótesis (en el auténtico sentido que se mencionan a continuación). Conversaciones sobre probatorio pistas (por ejemplo, listas de las consideraciones de causalidad) proporcionan un buen punto de partida para la enseñanza de esas lecciones. De hecho, hay razones para creer que esto era lo que Hill estaba tratando de hacer cuando él dio su charla.

Problemas resultado cuando la gente Hill error tratar de la experiencia de ser el malo de la rama de la filosofía, la interpretación de las normas como de lógica mundana en lugar de la filosofía de la ciencia y la ética de la toma de decisiones [1]. Höfler (citando Rothman y Groenlandia [[23], p.27]) observa que una condición - que la causa debe preceder efecto - es "la única condición sine qua non para un contrafactual efecto" (véase la nota 2). Aunque el temporal de pedido es una condición necesaria de acuerdo a la física que entendemos, o incluso de simple semántica (la condición se deriva directamente de algunos fraseos de la definición de la causa), ello no hacer este examen más o menos útil que otras como una lección de Sentido común. Lecciones tales como, "si un medido tendencia al alza en las tasas de cáncer conduce (en lugar de los retrasos) mide el aumento en la exposición que usted piensa que está causando él, usted está probablemente equivocado acerca de su conclusión causal", no son fundamentalmente diferentes de otros El sentido común de las aplicaciones Hill consideraciones.

La necesidad de que las enseñanzas en el sentido común

¿Por qué los investigadores de salud, aparentemente mucho más que los de otros ámbitos, se aferran a las normas para la evaluación de la causalidad, hasta el punto de que tenemos varias de esas listas, así como una literatura secundaria que trata de evaluar y mejorar las normas? ¿Por qué, como se sugiere por Kaufman y Poole [5], ¿Susser [24] proporcionará cinco estrategias para la evaluación de la causalidad - estrategias para la realización de pruebas de hipótesis junto a su lista de los criterios de causalidad -, pero responden a un mayor interés en la lista por criterios posteriormente centrarse en la lista Y de-haciendo hincapié en las estrategias de los demás? Parte de la respuesta podría encontrarse en la atención a los datos de observación (desde bien diseñado intervenciones más sencillo proporcionar apoyo a las reivindicaciones de causalidad, por lo menos para algunos tipos de investigación). Sin embargo, esta no puede ser toda la historia, desde la física y la biología (por no hablar de la economía) a menudo se basan en la observación sola.

Probablemente es más importante, el deseo de encontrar respuestas a un sinnúmero de diferentes políticas, ciencias sociales, biológicas y crea el deseo de estudiar algo de una vez (en una población determinada, en un momento, con particular definición de variables), declarar una respuesta, y avanzar . Esto no ofrece mucha oportunidad de comprobar las hipótesis. Se alienta a los investigadores de salud simplista para realizar los cálculos estadísticos que se describen en el lenguaje de la hipótesis de las pruebas, y este error de comprobación de una realidad mundana hipótesis. Se desalienta la verdadera hipótesis de las pruebas, a lo largo de las líneas de, "Si hemos observado una verdadera relación de causalidad, entonces nosotros también esperamos ver .... Vamos a hacer más investigaciones para comprobar que antes de informar sobre nuestros resultados. "Sin duda esperamos que estas pruebas de la ciencia antes de que otro declarado, por ejemplo, el descubrimiento de la fusión en frío o de que el libre mercado sin trabas hacer mejor la vida de las personas (mal ejemplo, tal vez - la palabra Les excepciones que hacen hincapié en el valor de la norma).

Epidemiología ve pocos estudios destinados a socavar las ambigüedades derivadas de la Duhem-Quine problema (que, más o menos, es el dilema de que cualquier estudio utilizado para probar una reclamación es a la vez muchas pruebas de hipótesis auxiliares acerca de la metodología de estudio - por ejemplo, que la Se utilizaron medidas de derecho, los instrumentos hagan lo que se supone que - y por lo tanto no podemos estar seguros de que el resultado observado informa a la hipótesis causal de interés). Los estudios raramente se repite con la mejora (o incluso diferentes) instrumentos (ver nota 3). Estudios de validación se llevó a cabo de vez en cuando, muy a menudo la búsqueda de sustanciales error de medición, pero los resultados casi nunca son incorporados en el análisis primario. Incluso fácil análisis que no requieren mayor trabajo de campo, tales como la evaluación de si un efecto estimación depende en gran medida de la particular forma funcional utilizada en el análisis cuantitativo (es decir, las hipótesis del modelo estadístico, cutpoints para la categorización de las variables, etc) rara vez son denunciados.

Del mismo modo, los nuevos estudios sobre un tema de hecho casi nunca repetir resultado, no tomar el simple paso de la utilización de un modelo previamente definido en otro conjunto de datos. En lugar de ello, el uso especial de un nuevo modelo, asegurando que muchas cosas varían demasiado de una sola vez para que seamos capaces de distinguir resultado de nuestro interés por parte de la hipótesis auxiliares. (Los epidemiólogos pueden encontrar este punto más familiar en el contexto de meta-análisis, donde a menudo los investigadores cuidadoso descubre que hay muchas más dimensiones de la variación entre los métodos de estudio que existen estudios.) Reclamaciones de la causalidad en este contexto son más bien tensas, independientemente de los modelos , Criterios, o ecuaciones que podríamos tener.

Y lo que es peor es que existe no sólo la negligencia de hacer buena ciencia, pero los actuales intentos de subvertir. No sólo no hay intento de llevar a cabo los análisis y suplentes informe que prueba la solidez de un modelo estadístico y utilizar las conclusiones de esos ensayos para hacer frente a la incertidumbre, pero en muchos casos, muchos cálculos estadísticos se realizan y la que se informó de que se elija porque es Una de las demás (es decir, porque muestra un dramático resultado), lo que hace más probable que sea un artefacto de auxiliares falsas hipótesis sobre el modelo [25]. Por lo tanto, los investigadores no sólo dejar de probar la causal más que sacar conclusiones sobre la base de sus datos, pero sus conclusiones son a menudo causal ni siquiera el apoyo de sus datos (ya que la mayoría de los cálculos usando los datos que se producen menos extrema resultados de los que se informó). Este enfoque de sentido común viola las normas de la investigación científica, incluida Hill-a menudo pasan por alto la consideración de preámbulo, que los datos deben mostrar una asociación, en primer lugar. Lamentablemente, esta subversión no es terriblemente sorprendente cuando el deseo de obtener un resultado interesante no es moderado por preocupación por replicablility y coherencia (es muy escasa la posibilidad de que cualquier persona que en realidad nunca intento repetir resultado, la salud y los investigadores muestran una lamentable tendencia a citar Un resultado de las demás, como prueba de una asociación, independientemente de la cantidad de otros estudios encontraron una asociación nula), o por verdadera formación científica que imparte una ética sobre lo que constituye una buena ciencia.

El deseo de sustituir lo que es aparentemente una lista de verificación de criterios de análisis científico real y el pensamiento parece reflejar la práctica de las ciencias de la salud y no la naturaleza de los datos epidemiológicos. Así como la mayoría de las clases de ciencias de la salud ética legalista ofrecen listas de control, en vez de un análisis serio de ética, la mayoría de la epidemiología pedagogía ofrece un conjunto de herramientas, sin mucho pensamiento científico. No hay nada intrínsecamente malo en la formación de las personas a ser ingenieros - calificado de complicada usuarios herramientas que pueden adaptarse a determinadas aplicaciones prácticas. El campo de la epidemiología es en gran parte creado por los miembros de un campo de la ingeniería, los médicos (que, dicho sea de paso, constituyen la mayor parte de la colina original de la audiencia, un poco de contexto diciéndole que suele ser pasado por alto), con el sabio consejo de diversas ciencias (Hill refleja el enfoque de su Antecedentes como economista).

Epidemiológica de formación es casi siempre destinadas a crear los ingenieros, los profesionales que producen resultados tangibles, pero que se dedican poca atención a las preguntas acerca de la naturaleza de la investigación científica o la verdad. Además, las ciencias de la salud la práctica está dominada por los que carecen incluso de conocimientos adecuados epidemiológicos en la ingeniería, sino que tienden a la memorización de aplicación particular y el uso de técnicas de off-the-shelf software que no entiendo muy bien - un patrón que describe los técnicos, ingenieros o no Científicos. Uno podría tener la tentación de contrarrestar que la mayoría de los profesionales de cada ciencia pasan la mayor parte de su tiempo a la realización de tareas técnicas. Pero la educación y las expectativas de los científicos en la mayoría de los campos son plenamente el entendimiento de los modelos y métodos que utilizan y tratar de avanzar en la búsqueda de los métodos de investigación, los que funcionan mecánicamente conceptual o físico herramientas que no puede explicar y que no han sido capaces de crear desde Cero no son generalmente llamados "doctor" y que no dominan la producción científica de otros campos. Esto es especialmente cierto en las ciencias que son los inmaduros moderna como la investigación en salud (véase nota 4).

En este contexto, la salud "ciencia" tiende a evitar el desprecio e incluso el pensamiento científico: Hay poco interés en rigor desafiante conclusiones antes de expresar comodidad con ellos. Iniciar vigoroso debate aprendido o lo que sugiere que los investigadores deben ser necesarias para la defensa de sus reivindicaciones contra la crítica es a menudo considerado impolite o incluso hostil. Búsqueda de mejores métodos de la investigación y el análisis, a pesar de la forma terriblemente son nuestros métodos primitivos, se considera una actividad secundaria y no esotérica el alma de la ciencia. Los resultados de los estudios publicados se citan como si fueran definitivos, sin una adecuada respecto a la calidad de la investigación, aun cuando hay razones para dudar. Métodos de investigación en las secciones informes no ofrecen siquiera remotamente suficiente detalle como para entender lo que se hizo. Conjuntos de datos son rara vez analizados de nuevo, no importa cuán importante de las consecuencias. Y por encima de estos problemas (o quizás debido a ellas), el rápido proceso de examen por homólogos es tratado como si - en lugar de un crisol de mayor estudio y debate - determina la veracidad de una reclamación.

Epidemiología de la educación rara vez es diseñada para producir los científicos. En nuestra experiencia, si dos profesores presentes conflictivos puntos de vista sobre la metodología adecuada, los estudiantes suelen reaccionar con malestar, o incluso la hostilidad, insistiendo en que alguien acaba de decirles lo que es correcto para que puedan utilizar y siga adelante. De lo que hemos visto, la mayoría de la formación en epidemiología indulges (o incluso ayuda a crear) esta mentalidad, la restauración a los estudiantes que están claramente en ciernes técnicos, y no los científicos. Los estudiantes por lo general se les enseña a utilizar computacional negro-cajas y describir los resultados con la memorización de idiomas. Algunos de ellos quieren ser científicos, y tratar de participar en el análisis y la investigación científica, sino que se enseña (o incluso obligadas) a ajustarse a los modos dominantes de la práctica que hace difícil. Un estudiante que un típico programa de maestría en epidemiología será un competente ingeniero, sino que han aprendido muy poco sobre la naturaleza de la investigación científica.

Para estar seguros, los ingenieros podría considerarse la piedra angular de la modernidad y de los técnicos, sin duda, producir más total cotidiana de los beneficios y no de los científicos, por lo que este no es un pronunciamiento sobre el valor comparativo. Pero sí explicar por qué el pensamiento científico necesita un impulso en el campo. Nos sorprendería que incluso 1/1000th de la persona-el tiempo pasado haciendo epidemiología está dedicado a un análisis crítico.

Conclusión

Es en este contexto, un campo de la investigación científica que está dominado por los no científicos, que la experiencia científica en el sentido común tiene un valor inmenso. Cuatro años antes de "Estimación de los efectos de causalidad", se publicó, Maldonado presentó un seminario sobre la utilidad de formalizar counterfactuals, y después de que uno de nosotros (CVP), a la nueva epidemiología en el momento, preguntó: "¿qué parte de que se me No se supone que ya lo sabe? "En retrospectiva, la cuestión claramente perdió el punto: Al igual que Hill's contemplaciones, la formalización de counterfactuals no es un nuevo descubrimiento o incluso una nueva lección, sino más bien de una articulación de un concepto que merece más atención (o Básicos de la conciencia) que se obtiene en la investigación en salud. De hecho, insistió en la necesidad de un análisis más detallado de lo que es "conocido" en el campo (en el sentido de haber sido dicho hace tiempo, de alguna manera), pero parece que recordar demasiado poca frecuencia, como una de las principales razones para el inicio Una nueva revista [26, 27]. Como todo maestro sabe, pasar tiempo contemplando las lecciones anteriores es por lo general mucho más valiosa que la introducción de una nueva idea de cada minuto de cada conferencia.

La atención a una definición formal de la causalidad y de una lista de pistas que pueden ayudarnos a sacar conclusiones sobre la causalidad puede ser valiosa. Dicha atención puede ayudar a promover la activa lleva a pensar que el sentido común científico. Mientras el mensaje se interpreta como la necesidad de contemplar e investigar antes de sacar conclusiones científicas, estas lecciones son valiosas. Pero cuando degenerar en negro-caja de algoritmos, esto permite a los investigadores de salud para evitar el trabajo intelectual de los científicos.

Nota 1

Nos parece lamentable que Höfler utilizado el término "análisis de sensibilidad Monte Carlo", para describir algunos métodos de cuantificación de la incertidumbre. Phillips ha señalado que este es un nombre inapropiado ya que los métodos difieren fundamentalmente de análisis de sensibilidad y "Monte Carlo" confunde la herramienta de cálculo con el análisis [18].

Nota 2

Cabe mencionar que la temporalidad es también una condición perfecta para contrafactual de evitar definiciones de la causalidad como "patrones predecibles de un evento tras otro", lo que sugiere una vez más que nada se aprende sobre la causal invocando consideraciones counterfactuals.

Nota 3

Ironically, as we were writing this paper, one of us attended a workshop on getting health research grants from the Canadian government; part of the advice was that the exposure-disease relationship being studied needs to be novel. The message was that checking the robustness of previous results was such a low priority that it would not attract this funding.

Endnote 4

To add concreteness to the point about conceptual machinery, consider how many of those who are considered scientists in epidemiology ever learned how to calculate the statistics they report without depending on a black-box software package or, for that matter, how many can even define confounding, let alone explain why their mathematical model was the best choice or calculate the impact of measurement error. In a science that is profoundly still under development, we would expect that scientists would be educated and conversant in the entire process of inquiry so that they could contribute to the development. Epidemiology is clearly immature and under development: most epidemiologic research in history has been done within the lifetimes, often even the professional lifetimes, of current researchers, and the list of known glaring failures of the methods is long.

Conflicto de intereses

The authors have previously written on related topics and have an incentive to support their previously published points of view. Their views are influenced by a high level of frustration with current scientific standards in health research. CVP was trained largely as an economist, and his praise for Hill somewhat reflects a shared disciplinary outlook.