Caracterización de la arquitectura de la genómica humana cromosoma 17q y la evaluación de los diferentes métodos para la definición de bloques de haplotipos
Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.
La selección de marcadores en estudios de asociación pueden ser informados a través de la utilización de bloques de haplotipos. Los informes recientes han determinado la estructura genómica de cromosómicas a través de los segmentos de bloques de haplotipos diferentes definiciones sobre la base de vínculos desequilibrio (LD) medidas o criterios de diversidad de haplotipos. La relativa aplicabilidad de los distintos bloque de definiciones para estudios de asociación, sin embargo, sigue siendo poco clara. Se compararon diferentes definiciones en el bloque de 6,1 Mb del cromosoma 17q en 189 individuos sanos no relacionados. Uso de 137 polimorfismos de nucleótido único (SNP), con un tiempo medio de espaciamiento de 15,5 kb, construido de bloques de haplotipos mapas publicados utilizando métodos y otros métodos que hemos desarrollado. Haplotipo etiquetado SNPs (htSNPs) se identificaron para cada ruta.
Los bloques fueron encontrados a ser más breves y la cobertura de la región limita con métodos basados en LD medidas, en comparación con el método basado en la diversidad de haplotipos. Aunque la distribución de los bloques fue muy variable, el número de SNPs que se debían a máquina con el fin de captar el máximo número de haplotipos fue coherente.
Por el marcador de espaciamiento de los utilizados en este estudio, la elección de la definición de bloque no es importante cuando se utiliza como pantalla inicial de la región para identificar htSNPs. Sin embargo, la elección de la definición de bloque tiene consecuencias para la interpretación de los resultados de estudios de asociación.
Los avances recientes en el genotipado de alto rendimiento tecnologías se han dado cuenta de la posibilidad de realizar a gran escala, de alta resolución en estudios de genética humana de enfermedades complejas. Polimorfismos de nucleótido único (SNP) se han convertido en los marcadores de elección, debido a su frecuencia, la simple dinámica mutacional y el hecho de que se presten para ello, llamando automatizado alelo [1, 2]. El número de SNPs alelo con frecuencias más altas que el 10% se ha estimado superior a 5000000 [3]. Exhaustiva del genoma a escala estudios de asociación, por lo tanto, llegar a costos prohibitivos y ultra-requieren tecnologías de alto rendimiento. SNP completa selección de las regiones o genes de interés es ineficiente e innecesario, ya que la información de redundancia puede surgir de vinculación desequilibrio (LD). Una estrategia común en el complejo de estudios de asociación de enfermedades es la selección de genotipos y de un subconjunto de SNPs, supone que en LD con los polimorfismos no probado. En el pasado, la asociación de diseño de los estudios no han seleccionado los marcadores sobre una base científica sólida, debido a la limitada comprensión de los patrones de LD. Lograr una mejor comprensión de la LD proyecto del genoma humano puede facilitar la enfermedad de cartografía genética, como conjuntos de la no redundante SNPs pueden emplearse para el diseño de estrategias rentables [4 - 6]. SNP mapas utilizados por los actuales estudios genéticos concentrando en regiones cromosómicas cubren un amplio espectro de marcadores espaciamiento de los intervalos, que van desde ~ 50 kb [7, 8] a 15-20 kb [9, 10] a los mapas de alta resolución de aproximadamente 1 SNP cada kb [11, 12].
Patrones de LD a través del genoma ha demostrado que son variables y encontró que una de las propiedades de cada uno de los regiones cromosómicas más que una simple función monotónica de la distancia física entre los marcadores [6, 9, 13 - 15]. Regiones de la baja diversidad de haplotipos intercalados por regiones de baja LD (denominados bloques de haplotipos) empíricamente se han identificado y propuesto para constituir una característica omnipresente del genoma [16 - 18]. Su presencia ha suscitado la financiación de los proyectos Mapa Haplotipo, conducentes a la generación de un índice de todo el genoma de los bloques común. Caracterización de los bloques de haplotipos pueden ofrecer estudios de asociación con un acceso directo a las regiones cromosómicas de detección de la presencia de variantes de la enfermedad a través de la identificación de los haplotipos el etiquetado SNPs (htSNPs), y puede, además, la ayuda en la interpretación de los resultados de las primeras exploraciones a través del conocimiento de la arquitectura genética subyacente [5, 19 - 22].
Los posibles beneficios de la utilización de bloques de haplotipos podrá, sin embargo, ser impugnados por preocupaciones en cuanto a su coherencia y, por lo tanto, de aplicación a diferentes poblaciones, la pérdida de información mediante el examen de la variación común y la elección arbitraria de la definición de bloque [23]. Diferentes estudios de investigación de la estructura de bloques de haplotipos han utilizado diferentes definiciones sobre la base de diversos criterios subjetivos. Bloque de definición métodos se pueden clasificar en tres categorías: los que se basan en medidas de LD [16, 24], los que se basan en la diversidad de haplotipos [11, 25, 26] y los que la combinación de ambos enfoques [9, 27]. Métodos basados en medidas LD definir los bloques en general, como las regiones en la que todos los coeficientes pairwise LD superen un umbral subjetivo. Métodos basados en la diversidad de haplotipos en general, definir los bloques como las regiones en las que un pequeño número arbitrario de los haplotipos de las cuentas predefinidas para un porcentaje de la variación observada. La búsqueda de consenso es que la densa marcador mapas, más grande el tamaño de las muestras y el uso común de las variantes más corto dar lugar a bloques [23, 24]. Sin embargo, el grado de diferencia en la estructura de bloque, a la que diferentes haplotipos bloque de definiciones y los umbrales pueden dar lugar a, sigue siendo poco clara. El tamaño y número de bloques podría haber generado un impacto en el análisis de los estudios de asociación y podría, por lo tanto, influir en el diseño de estrategias de mapeo fino para identificar las variantes que causan enfermedades.
En el presente estudio, abordar estas cuestiones mediante la aplicación de diferentes criterios de definición de bloques de haplotipos a 137 SNPs, con el fin de describir la arquitectura genética de una región de 6,1 Mb 17q en un conjunto de 189 individuos sanos no relacionados. El empleo de métodos basados en medidas tanto de LD y la diversidad de haplotipos, evaluar sus méritos y limitaciones, dada nuestra mediana marcador espaciamiento de los 15,5 kb. Comparando las estructuras generadas en bloque, que valorar la utilidad y aplicabilidad de los distintos métodos en estudios de asociación genética compleja de enfermedades humanas.
ADN de una cohorte de 189 sana, que no guardan relación, el Reino Unido las personas de ascendencia Europea se estudió. Los individuos fueron reclutados de práctica general o fueron donantes de sangre. La colección fue aprobado por el comité de ética regional.
Ciento treinta y siete SNPs dispersa en 6,1 Mb humanos de la región cromosómica 17q se examinaron. En la actualidad la investigación de estos marcadores, como parte de un estudio de mapeo fino para la identificación de genes de susceptibilidad artritis reumatoide. SNPs fueron seleccionados de la base de datos de SNP Consortium [28] se extienden a la región en intervalos igualmente espaciados. El mapa de SNP marcadores éxito genotipo se construyó sobre la base de noviembre de 2002 Congelación del Proyecto de Secuenciación del Genoma Humano, disponible a través de la UCSC Genoma navegador [29].
Detalles metodológicos están disponibles a petición de los autores y SNP IDs se pueden encontrar en el archivo adicional 1 [ver archivo adicional 1]. En pocas palabras, se SNPs genotipo utilizando el primer método de extensión ™ SNaPshot (Applied Biosystems, CA, EE.UU.) a través del uso de un ABI Prism 3100 DNA Analyzer y software de análisis GeneScan ® (Applied Biosystems, CA, EE.UU.), o la discriminación alélica 5 ' Nucleasa ensayo (TaqMan ®, Applied Biosystems, CA, EE.UU.) a través del uso de una plataforma ABI Prism 7700 (Applied Biosystems, CA, EE.UU.). Todas las llamadas SNP genotipo verificado de forma independiente por dos personas.
Salida de Hardy Weinberg inicialmente se evaluaron para cada SNP. Ninguno de los SNPs se encontraron desviarse de equilibrio de Hardy-Weinberg significativamente. Haplotipos se infiere entonces usando la expectativa de maximización (EM) algoritmo, ya sea a través de la HelixTree ™ (Golden Helix, Inc, Montana, EE.UU.) o el snphap (David Clayton, Cambridge, UK) paquetes de software. Convergencia del algoritmo fue verificada por repetir el proceso de estimación de haplotipos 3 veces, asegurando que los resultados fueron idénticos generados.
El uso de los genotipos SNP, la medida de LD pairwise D ", se calculó. Como los valores de D 'puede ser sobreestimado con frecuencias de los alelos raros [20], el LD coeficiente de correlación r 2, además, se calcula para todos los pares de SNPs. Observado D 'y los valores de r 2 fueron ordenados de acuerdo a la distancia entre los pares correspondientes marcador. Atletismo promedio D 'y los valores de r 2 ventanas correderas de 2 consecutivos observaciones fueron estimados y dibujado.
Haplotipo bloque de definiciones se aplican al total conjunto de 137 SNP, así como al conjunto de SNPs alelo con frecuencias superiores a 0,2 por separado, con el fin de evaluar los efectos de la variante de la frecuencia de estructura de bloque.
Definición 1: La definición de bloque basado en el método D 'medida de LD, empleado por Gabriel et al. 2002 [16], se aplicó a la SNP genotipo de datos a través de la HaploView paquete de software (MJ Daly y Barrett JC, Whitehead Institute, MA, EE.UU.). En resumen, un bloque se define como una región en la que menos del 5% de los pares tenían un SNP D 'alta confianza vinculada a menos de 0,9. Además, los bloques que consta de 2 SNPs podría abarcar hasta 20 kb y bloques de 3 o 4 SNPs podría abarcar hasta 30 kb. Los bloques no se permitió a la superposición.
Definición 2: a; Un método simplificado definición de bloque, también sobre la base de medidas de LD, se utilizó. Un haplotipo bloque se define como una región en la que más del 95% de todos los pairwise r 2 LD correlación valores superaron 0,4. La misma longitud de bloque como en las limitaciones Definición 1 se impusieron, pero una menos rígida umbral trabajó durante el fin de evaluar el rigor. Los bloques se permite a los overlap.b; Por el subconjunto de SNPs comunes, un nuevo método, basado en D ", valores que tienden a exagerar las frecuencias de los alelos raros, también fue ocupada. Un haplotipo bloque se define como una región en la que más del 95% de todos los pairwise D 'valores superaron 0,4. Los bloques se permitió que se superponen.
Definición 3: El bloque de definición método propuesto por Wang et al. 2002 [24] se aplica a la base de datos. En resumen, un bloque se define como una región en la que, para todos los posibles pares de marcadores, menos de cuatro gametos se observaron (D '= 1). Los bloques se permitió que se superponen.
Definición 4: Un bloque de definición método basado en la diversidad de haplotipos se desarrolló. Para un conjunto de n SNPs, el número máximo de los haplotipos observados en ausencia de la mutación recurrente y / o de la recombinación es n +1. Por lo tanto, un bloque de haplotipos se definió como una región compuesta de SNPs n, n +1 en la que los haplotipos podría representar al menos el 95% de la variación observada. Tomando cada SNP como una semilla, se ampliaron o bloques contratados para encontrar el óptimo de la ventana. Bloques de haplotipos se permitió que se superponen.
Definición 5: una nueva definición de bloque método basado en LD medidas, tal como se aplica en la HaploView paquete de software (MJ Daly y Barrett JC, Whitehead Institute, MA, EE.UU.), entre otros. Un haplotipo bloque se define como una región en la que todos los pairwise D 'valores superaron 0,8. Los bloques no se permitió a la superposición.
El número mínimo de SNPs que capturar el máximo número de haplotipos (htSNPs) [30] se determinará, para cada bloque resultante de cada método de definición. El programa htSNP2 (David Clayton, Cambridge, Reino Unido), plasmados en el Stata y el paquete de software HaploView (MJ Daly y Barrett JC, Whitehead Institute, MA, EE.UU.), haciendo uso de la EM algoritmo, se emplearon para identificar htSNPs. La medida de correlación r 2, el cálculo de la capacidad de predecir las frecuencias en una serie de loci usando sólo el subconjunto de htSNPs, se fijó a las estrictas umbral de 0,95 para el htSNP2 programa. Bueno, se observó la correspondencia entre los dos métodos. HtSNPs, además, se identifica con un conjunto htSNP2 r 2 umbral de 0,80, con el fin de comprobar la coherencia en virtud de diversos grados de rigor.
Menores frecuencias de los alelos de los 137 SNPs estudiados varió de 0,06 a 0,5 (Figura 1a], con una frecuencia media de 0,29. La observación de que 100 (73%) de los SNPs fueron comunes (frecuencias superiores a 0,2) podría explicarse por el sesgo determinación, como todos los SNPs se seleccionaron de las bases de datos a disposición del público [31]. Inter-SNP distancias variaron de 55 pb a 951 kb (mediana espaciamiento de 15,5 kb). El marcador mapa figura 4 lagunas de más de 200 kb (Figura 1b]. El trazado de la media móvil de r 2 exhiben una correlación negativa entre la LD y la distancia física, con cierta variabilidad observada distante SNPs para exhibir pruebas de asociación (figura 2a]. La media móvil de D 'demuestra la extrema variabilidad en la distribución de la LD y su decaimiento con la distancia, un artefacto derivados de los bajos alelo frecuencias (figura 2b].
Para caracterizar y comparar los patrones de bloque, 5 bloques de haplotipos diferentes definiciones se aplican a los datos SNP genotipo. El mismo conjunto de parámetros que reflejan en la estructura subyacente de bloque se determinará, para cada método (Tabla 1]. Por lo tanto, a fin de obtener una comprensión de la manera en que cada definición retrata la arquitectura genética de la región, el número de bloques de haplotipos derivados, y la duración media SNP contenido de los bloques, así como la proporción de marcadores de secuencia y cubierta por bloques fueron evaluados. El proceso se repitió para el subconjunto de común sólo SNPs (Tabla 2]. En general, los métodos basados en medidas LD (Definiciones 1, 2, 3 y 5) resultó en un menor número, los bloques más cortos, mientras que el haplotipo método basado en la diversidad (Definición 4) proporcionó una mayor cobertura global de la región (Figura 3]. Aunque el mapa de densidad sparser fue en el grupo de común SNPs (mediana espaciamiento de 1 SNP / 29,5 kb), la inclusión de marcadores con menores frecuencias de los alelos menos del 0,2 parecía tener un efecto abrumador de la mayoría de las definiciones y, en general, dio lugar a la reducción de la cobertura De la secuencia de examen.
La figura 4 muestra el número total de marcadores que son necesarias para captar la mayor variación en esta región cromosómica, tal como se deriva de cada una de las definiciones, para el total del grupo de SNP y para el subconjunto de SNPs comunes. Para calcular este parámetro, el número de htSNPs definidas para cada bloque de haplotipos fue agregado al número de SNPs que no fueron incluidos en bloques. Genotipo de una proporción similar de marcadores que parecía ser necesario a través de las diferentes definiciones para todas las marcas (90,5% a 96,4%) y para el común de SNPs (88% a 97%) a las estrictas medidas de correlación r 2 umbral de 0,95. La observación de que la gran mayoría de los SNPs necesarios para ser mecanografiadas, a fin de captar la mayor parte de la variación cromosómica se confirmó cuando el r 2 umbral se redujo a 0,80.
Recientemente, numerosos grupos han estudiado la presencia y la distribución de bloques de haplotipos en el genoma humano, cada uno de ellos y proponer la utilización de distintos métodos de definición de bloque. Cada estudio ha examinado SNPs de los diferentes números, dispersos en las regiones cromosómicas de tamaño diferente, en distintas alelo menor frecuencia y espaciamiento de mapa, haciendo uso de distintos tamaños de las muestras [9, 11, 16, 25, 27]. El diseño de este estudio refleja un escenario realista, en la que una región de varios MB ha sido implicado en la susceptibilidad humana a un complejo de la enfermedad y se están perfeccionando a través de la cartografía LD. La determinación de SNPs a través de bases de datos a disposición del público, además, representa prácticamente a favor de los procesos de selección, dando lugar a una bien reconocida tendencia a polimorfismos comunes y conducen a, en este caso, una mediana marcador espaciamiento de los 15,5 kb (equivalente a la utilizada por Dawson et al . 2002 [9]]. Esta densidad SNP se espera que se dé lugar a los bloques de haplotipos aparentemente más largo en comparación con los mapas más densas, como el HapMap. La selección de los individuos no relacionados está en consonancia con la tendencia actual hacia basados en la población, en vez de basadas en la familia, los estudios y la pragmática tamaño de la muestra de 378 cromosomas permite eficaz en silico haplotipo inferencia.
El alcance y la variabilidad inter-marcador de LD en este estudio corrobora los últimos resultados de la distribución de irregularidad [6, 9, 13 - 15]. La observación de que LD no de manera uniforme, con la decadencia física distancia ejemplo de la necesidad de que la estructura de bloques de haplotipos determinación. La evidencia de desequilibrio se ha detectado entre los SNP en la medida de lo 1,7 Mb aparte, que se extiende mucho más lejos que se indicó anteriormente a través de la simulación [32]. El discrepante LD patrones derivados de distintas LD medidas ponen de relieve la necesidad de cautela en la interpretación y comparación de estudios, especialmente al usar D ", para las que existe un sesgo al alza con tamaños de muestra pequeños y frecuencias de los alelos raros.
Haplotipo definición de bloque métodos empleados en este estudio se han basado tanto en medidas de LD y de la diversidad de haplotipos, y que se aplican para el mismo conjunto de datos, lo que permite la comparación directa de sus resultados. Definiciones 1 [16] y 3 [24] se han propuesto en los últimos estudios de la estructura de bloque en humanos regiones genómicas. Definición 2, sobre la base de medidas de LD, se desarrolló como una modificación simplificada de la Definición 1 [16] para dar cabida a menos estrictos los umbrales y criterios. Definición 5 se utilizó para reflejar la estructura de bloque sobre la base de criterios de fijación de un umbral elevado de D ', pero no hay limitaciones de longitud. Además, un novedoso método basado en la diversidad se desarrolló (Definición 4), que no impone límites estrictos bloque e incorpora el concepto de los eventos de recombinación y mutación recurrente, para disminuir los factores conocidos entre LD marcador.
Todos los métodos de pruebas previstas para un bloque similar a la organización de la variación genética en la región cromosómica objeto de la investigación en 17q, que se caracteriza por marcadas diferencias entre las distintas definiciones, de acuerdo con observaciones anteriores [33, 34]. En general, el haplotipo método basado en la diversidad (Definición 4) dio una cobertura más completa de la secuencia, lo que resulta en un mayor número de bloques con un largo promedio de tamaño físico, en comparación con las definiciones sobre la base de medidas de LD. Estos resultados están de acuerdo con un reciente estudio, comparando el desempeño de un LD-basado con un haplotipo basada en la definición de bloques [34]. Estas diferencias en la caracterización de la arquitectura subyacente genéticos de una región podría tener consecuencias en la interpretación de los estudios de asociación y el diseño de estrategias posteriores. La inclusión de una proporción mayor de la región en bloques maximiza las posibilidades de que una asociación significativa observada a través de un primer análisis se engloba dentro de un bloque de haplotipos, por lo tanto, delinear el intervalo en el que más intentos de cartografía multa puede ser enfocado. Localización de un resultado positivo fuera de los límites definidos de los bloques sería necesario más intensivo de genotipos esfuerzos orientados a la región circundante. Aunque la ampliación de la cobertura de una secuencia de intervalo puede ser útil, que puede ser artificial, derivadas de las deficiencias metodológicas, lo que llevaría a una falsa representación de la estructura genómica subyacente. Aunque el nuevo desarrollo Definición 4 (n +1 método) provocado el incremento de la cobertura de secuencia, la falta de cualquier LD limitaciones en esta definición podría conducir a una detección falsamente inflada de corto bloques de haplotipos en los casos de SNPs con raras menor alelo frecuencias. De los métodos basados en LD, Definición 5 (D 'alto umbral método) proporcionó la cobertura más alta de la secuencia estudiada, aunque aproximadamente el 74% de la región no se dividen en bloques. La incoherencia observada entre los métodos ilustra la subjetividad de la definición de bloques de haplotipos y concluyente impide la caracterización de la región de la estructura de bloque.
Asignación de bloques de haplotipos se encontró a cambiar no sólo debido a las diferencias entre el método, sino también como resultado de la alteración de los parámetros dentro de un mismo conjunto de criterios de definición. Estas observaciones corroboran los resultados anteriores [34]. Aplicación de los mismos métodos para el subconjunto de SNPs común condujo a una reducción general en la proporción de la secuencia cubiertos. Aunque el marcador fue sparser el espaciamiento y el número de polimorfismos examinado más pequeñas, de alta frecuencia menor alelo tenido un efecto abrumador sobre haplotipo tamaño de bloque, en general, resultando en bloques más cortos. Definición 1 [16] Sin embargo, parece ser robusto a los cambios, ofreciendo, por tanto, un posible mecanismo para lograr la coherencia en la estructura de bloque SNP entre diferentes subgrupos de frecuencias de los alelos. Entre LD basados en definiciones, uso de la D ", en vez de r 2 tradujo en la generación de un mayor número de bloques de haplotipos y en un aumento de la cobertura de la región. Del mismo modo que cuando se aplica al total conjunto de marcadores, el recién introducido Definición 4 (n +1 método) que se produce la más alta cobertura de secuencia cuando se examina en el subconjunto de SNPs comunes únicamente, aunque una proporción relativamente infrecuente de SNP en pares bajos LD podría tener Sido falsamente agruparse bajo la denominación de los bloques.
Comparación de los diferentes bloques de haplotipos en las definiciones que caracterizan la organización genómica de la región cromosómica 17q humanos reveló diferencias considerables en los métodos y podría, por lo tanto, aumentan las preocupaciones sobre la idoneidad de los enfoques ad hoc para la identificación de crudo bloque de la estructura, así como la validez de La noción de bloques de haplotipos como una característica genómica. Sin embargo, observó la superposición de SNPs que abarca dentro de los bloques en todas las definiciones utilizadas, indica la existencia de un subyacente genéticos arquitectura capturados por todos los métodos. Concordancia entre todas las definiciones, además, se exhibió en el cálculo del subconjunto de SNPs necesarias para encapsular la gran mayoría de la variación genética en la región. Selección de método de definición de bloque parece ser irrelevante cuando genotipo una muestra subconjunto de todos los marcadores con el fin de identificar haplotipos etiquetado SNPs. En este estudio, el porcentaje de los marcadores que se deben a máquina es muy alta (más del 90%), lo que indica que el marcador de mapa de densidad empleada no era adecuado para conseguir un importante coste-eficacia a través de la caracterización htSNP. Tranquilizadora, como todos los métodos sugeridos a escribir el mismo número de marcadores, que probablemente también tienen igualdad de posibilidades de detectar una posible asociación debido a LD. Las diferencias, sin embargo, podría surgir en la interpretación de los resultados y el desarrollo de estrategias de seguimiento.
La propuesta de aprovechamiento de los bloques de haplotipos para informar a los diseños estratégicos en estudios de asociación genética constituye un paso adelante, en lugar de una panacea, para el campo de la genética humana compleja enfermedad. En un estudio realista de diseño, la elección del método de definición de bloque puede ser consecuencia de en el diseño e interpretación de asociación genética escanea. Además, la inclusión de SNPs con raras menor alelo parece convolutiva frecuencias, en vez de aclarar, en la estructura genómica. Dada la densidad de marcador de 15,5 kb, todo un genoma de exploración por asociación requeriría aproximadamente 100000 SNPs que se genotipo. Los resultados de este estudio indican que tal espaciamiento no serían adecuados para la caracterización de la arquitectura genómica con suficiente detalle a través de un enfoque de definición de bloques de haplotipos. Otras cuestiones inherentes a la caracterización y utilización de la estructura cromosómica subyacente bloque es necesario abordar en los dos conjuntos de datos reales y simulados, con el fin de aclarar la configuración de bloques de haplotipos en el que puede resultar útil.
EZ participó en el diseño del estudio, llevado a cabo los análisis estadísticos y redactó el manuscrito. AB participó en el diseño del estudio y los esfuerzos coordinados de genotipos. SE DW y llevó a cabo el genotipo SNP. JW WO y participó en el diseño del estudio. SJ participó en el diseño del estudio y la coordinación y ayudó a redactar el manuscrito. Todos los autores leído y aprobado el manuscrito final.
Agradecemos a Golden Helix Inc, para hacer que el HelixTree ™ paquete de software disponible para nosotros y para Neil Shephard por su valioso asesoramiento. Este trabajo recibió el apoyo de los fondos del MRC y arco, Reino Unido.