Epidemiologic perspectives & innovations : EP+I, 2005; 2: 9-9 (más artículos en esta revista)

Un sencillo enfoque de los Robins de Breslow-Groenlandia estimador de la varianza

BioMed Central
Paul Silcocks (paul.silcocks @ nottingham.ac.uk) [1]
[1] Trent Investigación y Desarrollo de Unidades de Apoyo, Medical School, Queen's Medical Centre, Nottingham, NG7 2UH Reino Unido

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen

El Mantel-Haenszel estimación de la odds ratio (y su logaritmo) estratificado en estudios caso control aceptable en general carece de una estimación de la varianza durante muchos años. El Robins-Breslow-Groenlandia estimación se ha reunido esta necesidad, estándar de los libros de texto, pero todavía no ofrecen una explicación de cómo se obtiene. Este artículo ofrece una derivación accesible que demuestra el vínculo entre el Robins-Breslow-Groenlandia y la estimación familiar Woolf estimación de la varianza de los log odds ratio, y que fácilmente podría ser incluido en los cursos de máster de nivel en epidemiología. Las relaciones con el incondicional y estimaciones de máxima verosimilitud condicional también se examinan.

Introducción

El Mantel-Haenszel (MH) para estimar la odds ratio combinada a través de varios cuadros de 2 × 2, ψ MH, se propuso en 1959 [1]. Más de veinte años después, la falta de una estimación robusta para su diferencia aún se está observado [2] y, sin embargo, sólo unos años después, Robins, Breslow y Groenlandia presentó su ahora generalmente aceptados estimador de la varianza [3] para el registro de Mantel-Haenszel Odds-ratio (señalados con la RBG estimación). Esta sustituirá la estimación de los límites de confianza sobre la base de la prueba insatisfactoria basada en el procedimiento de Miettinen o el Zoológico tipo computacionalmente intensivas límites que hasta entonces habían sido utilizados.

Si bien un útil examen de los métodos Mantel-Haenszel se ha publicado, entre ellos algunos aspectos de la evolución histórica hacia la RBG estimador [4], el oficial de derivaciones por Robins, Breslow y Groenlandia [3], y Phillips y Holanda [5] no son, en La opinión de este autor, fácil de entender. El ex omite pasos en el argumento, mientras que la última se dirige a los poderes factorial descendente. Posiblemente, no es de extrañar que incluso los libros de texto moderno [6, 7] se limitan a declarar el Jardín Botánico fórmula sin que se derivan.

Si bien existen otros estimadores de varianza, algunas son especiales, como la aplicación de la fórmula de estudio de cohortes de casos y controles a los datos sugeridos por Clayton y Hills [8], sólo se aplican a los grandes estratos pocos casos [9] o están estrechamente relacionadas con RBG el estimador [10]. Una excepción es bastante diferente de la fórmula Sato [11], pero este procedimiento da a los límites de confianza directamente en el odds-ratio escala.

Es la intención de este artículo a presentar una derivación informal de la RBG estimador como una extensión de la conocida fórmula de la varianza Woolf [12], y que podría fácilmente ser incluidos en los libros de texto estándar de la epidemiología o la bioestadística. Voy a describir esta desde la perspectiva de un estudio de casos y controles.

Análisis
¿Cómo funciona la estimación de Mantel-Haenszel surgir?

Considera una estratificado estudio de casos y controles para que el i ª k independiente de los cuadros es la siguiente:

Descuidar constantes, la probabilidad incondicional para el i ª mesa es la siguiente:

Donde i ª en la tabla θ i = probabilidad de exposición en un caso y si ø i = probabilidad de exposición en caso de un control.

La estimación de máxima verosimilitud (MLE) para ø i está dada por b i / (b i + d i), y si queremos volver a parameterise θ i como ψ ψ ø ø i / [ψ ψ ø ø i + (1 - ø i)], donde Ψ es la odds ratio (supone común a todas las tablas), la contribución a la probabilidad general de registro realizados por términos de ψ es:

Σ a i ln (ø ψ ψ ø i / [ψ ψ ø ø i + (1 - ø i)]) c + i ln (1 / [ψ ψ ø ø i + (1 - ø i)]).

Diferenciación con respecto a ψ e igualando a cero, y la reordenación de (observando que una i + c = n i 1i 1i)

Obtenemos:

Σ a i ln (ø ψ ψ ø i / [ψ ψ ø ø i + (1 - ø i)]) c + i ln (1 / [ψ ψ ø ø i + (1 - ø i)]).

Es decir, Σ (a i - n 1i 1i ψ ψ ø ø i / [ψ ψ ø ø i + (1 - ø i)]) = 0

Es decir, Σ ([ψ ψ un ø a i i i + a - a i ø i - n 1i 1i ψ ψ ø ø i] / [ψ ψ ø ø i + (1 - ø i)]) = 0.

Esto debe resolverse numéricamente para obtener el MLE para ψ, pero si los denominadores no varían demasiado a través de los cuadros que simplemente tienen que resolver:

Σ [ψ ψ un ø a i i i + a - a i ø i - n 1i 1i ψ ψ ø ø i] = 0

Es decir, Σ [ψ (a i - n 1i 1i) ø i + i (1 - ø i)] = 0

O, Σ a i (1 - ø i) = Σ ψ (n 1i 1i - a i) i ø

Dando, Σ a i (1 - ø i) = ψ Σ (n 1i 1i - a i) i ø

Y puesto que, ψ i = b i / (b i + d i) i = b / n 0i 0i

Esto puede ser utilizado como primera aproximación para encontrar el MLE (si sólo hay una mesa entonces ψ es la incondicional MLE = ad / bc). Ahora estratificado en estudios de casos y controles con una relación constante, r, de los controles a los casos, el número total de sujetos en cada estrato viene dado por n i = n 0i 0i (1 + r), de modo 0i 0i n = n i / (1 + r). Una constante r se logrará mediante el diseño si hay concordancia zapata, de otro - como con un post-análisis estratificado - esto será sólo aproximadamente cierto. El término (1 + r) puede ser cancelado y nos deja con:

El estimador de MH es, pues, una primera aproximación a la MLE incondicional en el caso de grandes estratos con un control constante: en todo caso ratio estratos. Sin embargo, el estimador MH coincide con la realidad condicionada por la MLE pares coincide con el diseño, como se señala, por ejemplo en la página 164 de Breslow & Day [2].

La sensibilidad a la variación en el ø i de la constancia y el control: proporción de casos no es alta, como lo demuestran los datos en la Tabla 1. En este sentido cabría esperar, ya que durante los más escasos (por ejemplo, par-acompañados) el control de los datos: caso ratio será constante, y mientras el entonces ø i han máxima diferencia - que sólo el 0 y el 1, la estimación coincide con MH El condicional MLE. Por el contrario, para el control de grandes estratos: caso ratio varía, pero la diferencia de la i ø será menor y la estimación MH entonces la aproximación de las incondicional MLE.

Derivado de la diferencia de la estimación de Mantel-Haenszel

Considerar de nuevo el i 2 × 2 ª mesa, de dar las frecuencias en cada celda:

Por razón de posibilidades , Que se calcula para un único cuadro de la cruz-producto proporción a i i d / b i c i, la aplicación del método delta da Woolf logit basado en la fórmula [8]:

Con n i i = a + b + c i i i + d y,

El delta es un método ampliamente utilizado en el procedimiento de las estadísticas cuando se necesita una aproximación de la varianza de una función de una variable cuya variación es conocida. En este caso la variable diferencia se conoce con una proporción p, y la función es la logística. El método básico delta fórmula es: var (y)(dy / dx) 2 var (x) a partir de la cual, si y = logit (p = ln [p / (1 - p)],

Var (y) ≈ (1 / p + 1 / (1 - p)) 2 p (1 - p) / n

= (1 / p + 1 / (1 - p)) 1 / n

= (1 / a + 1 / b)

Si p = a / n y n = a + b.

Aquí tenemos dos independientes proporciones (la proporción de casos y controles expuestos) y la fórmula de Woolf se obtiene mediante la estimación de las varianzas de las distintas logits y agregarlo.

Por tal k 2 × 2 mesas, cada uno representando un estrato separado, la de Mantel-Haenszel estimación combinada de la odds ratio ψ común está dado por:

Ψ MH, por lo tanto, es una media ponderada de los estrato-odds ratios. Los pesos aproximados de la inversa de la varianza de cada I si el verdadero valor de ψ = 1. Tenga en cuenta que parte del supuesto de una odds ratio no es necesaria para la prueba de Mantel-Haenszel.

Para calcular la varianza, además de la aproximación que participan en la aplicación de la regla delta, una hipótesis que también se hace cada estrato específico odds ratio se aproxima bastante a la de Mantel-Haenszel estimación combinada para permitir lo que se refiere como un i i d / b I c i a ser sustituido por ψ MH.

Hemos procedido mediante la obtención de una aproximación que evita ceros a la izquierda en la fórmula para var [ln ( )]. La motivación para esto puede verse comparando los pesos de ψ MH - que no se vean afectadas por la supresión de ceros a la izquierda, excepto para esos estratos - que, en caso de la Woolf se utilizaron las diferencias, el resultado sería indefinido si las células con ceros a la izquierda se presente.

Tomando como constante el peso,

Suponiendo una odds ratio ψ, que se estima por ψ MH, este puede ser escrito como:

Camino a una fórmula sugerida por Hauck [9]:

Como ya se ha mencionado, un problema con esta fórmula es que no se si las células entradas cero. Sin embargo podemos avanzar por re-escribir la fórmula como:

Sobre la sustitución de 1 / MH para ψ (b i c i / a i d i):

Ahora, si las filas de la tabla de 2 × 2 son intercambiados, la diferencia sigue siendo el mismo. Sin embargo, un argumento similar al que lleva a la anterior:

(Tenga en cuenta que la nueva razón de posibilidades Formado por el intercambio de filas es solo 1 / ψ MH.) "La" diferencia, V, de ln MH) es, por tanto, a ser la media de las dos estimaciones [13] de la siguiente manera:

Let R = Σ (a i d i / n i) y S = Σ (b i c i / n i). Sobre la sustitución de diferencia en las dos fórmulas:

Luego, divida la parte superior e inferior de S 2 y mueva el Plazo fuera de los corchetes para obtener:

Que es EQ. 9 en Phillips y Holanda [5].

Si ahora poner

P i = (a i + d i) / n i y i = Q (b + c i i) / n con i R i = a i d i / n i y S i = b i c i / n i

Entonces

Que en la multiplicación de los soportes, y observando que la reordenación de R / S = ψ MH, da:

Esta es la fórmula RBG!

Cuando hay un solo estrato, lo que reduce a (1 / a + 1 / b + 1 / c + 1 / d), que es la conocida fórmula de la base logística de Woolf y que los enfoques 0 como el tamaño de la muestra aumenta, asumiendo un verdadero finito Odds ratio. Es evidente que el Jardín Botánico es una estimación de la varianza finita suma de los estimadores tales RBG estimación también planteamiento 0, para las grandes estratos.

La RBG estimador se obtuvo por encima de la hipótesis de que el estrato específico odds ratio estimaciones podría ser sustituido por el liberal valor común, a su vez estimados por ψ MH; ambos supuestos son razonables con grandes muestras por estrato. Sin embargo, el éxito de la RBG fórmula se deriva de su ser aplicable también a la escasez de datos de casos.

Para ver esto, corresponde examinar un caso de control de pares de estudio. Las letras mayúsculas denotan la frecuencia de casos y controles pares.

En un estudio de este tipo cada estrato tiene sólo dos observaciones. En el cuadro se puede descomponer en cuatro tipos de "incomparable" de acuerdo a la tabla de la categoría de exposición del caso y el control, la frecuencia de cada tipo está dada por la frecuencia de los pares de casos y controles:

Sólo el B dichas tablas con i = d i = 1 y la C dichas tablas con b = c i i = 1 contribuir a la estimación de la odds ratio. Tenga en cuenta que estos son disjuntos series de cuadros.

En estas circunstancias: ψ MH = B / C, que coincide con el condicional y MLE:

A) el plazo medio de la RBG fórmula desaparece porque si b i c i = 1 entonces (a i + d i) = 0, y si un d i i = 1 entonces (b i i + c) = 0

B) R = Σ a i d i / n i = B / 2 & S = Σ b i c i / n i = C / 2

C) Hay B términos en los que un d i i (a i + d i) = 2 C en el que los términos b i c i (b + c i i) = 2

Dando:

V = B / B 2 + C / C 2 = 1 / B + 1 / C

Esta no es sólo la conocida fórmula de la base logística para la varianza de los log odds ratio para acompañada pares, pero también está la diferencia de la estimación de máxima verosimilitud condicional. Esto es asintóticamente coherente de la propiedades generales de un MLE (y es fácil ver que a medida que el número de tablas de los aumentos, V → 0).

En otras palabras, la fórmula de RBG, aunque aquí deriva sin asumir validez en el caso escasos, de hecho, poseen esta propiedad.

El cuadro 1 muestra cómo de cerca la estimación de máxima verosimilitud condicional, estimación de máxima verosimilitud incondicional, y MH estimación de acuerdo, a pesar de los diferentes ø i y control: caso ratio.

Conclusión

El Mantel-Haenszel estimación de la odds ratio se aproxima a la estimación de máxima verosimilitud para los grandes, y algunos estratos coincide con la estimación de máxima verosimilitud condicional de los escasos datos (coincide con pares).

El Jardín Botánico es el estimador de la fórmula de elección de la diferencia de la de Mantel-Haenszel log-odds-ratio, ya que se aplica tanto en los grandes estratos de unos caso y en la escasez de muchos estratos caso (como en el análisis coincide con pares), cuando la diferencia RBG Estimación de hecho coincide con el de máxima verosimilitud condicional estimación de la varianza.

Por otra parte, la RBG reduce a la fórmula familiar de formularios estándar para un solo estrato y acompañados por pares.

Derivación formal de la RBG fórmula es difícil, pero informal, el acceso es posible derivación que se ha hecho mención, que utiliza nada más avanzada que el delta método para lograr una diferencia.

Conflicto de intereses

Los autores declaran que no tienen intereses en conflicto.