BMC Microbiology, 2005; 5: 33-33 (más artículos en esta revista)

Conservación de la variabilidad y el virus de la hepatitis B en el núcleo de proteínas

BioMed Central
Benjamin M Cadena (b.chain @ ucl.ac.uk) [1], Richard Myers (r.myers @ ucl.ac.uk) [2]
[1] Departamento de Inmunología y Patología Molecular, University College London, 46 Cleveland St, Londres, Reino Unido W1T 4JF
[2] Departamento de infección, de la Universidad College de Londres, 46 Cleveland St, Londres, W1T 4JF, UK

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen
Antecedentes

Proteína núcleo de la hepatitis B (HBVc) ha sido ampliamente estudiado desde el punto de vista estructural y el punto de vista inmunológico, pero la secuencia de las fuerzas evolutivas de conducción son fundamentales dentro de la variación no del todo comprendidas.

Resultados

En este estudio, la variación observada en HBVc secuencia de las proteínas se ha examinado en una colección de un gran número de secuencias de proteínas HBVc secuencia de los repositorios públicos. Un alineamiento de las secuencias de varios cientos se llevó a cabo, y se usa para analizar la distribución de los polimorfismos a lo largo de la HBVc. Polimorfismos fueron encontrados en 44 de los 185 puestos de aminoácidos analizados y se agruparon fundamentalmente en las partes de HBVc que forman la superficie exterior de la espiga y la cápside intacta. La relación entre la diversidad y la HBVc VHB genotipo fue examinado. La posición de la variable de aminoácidos a lo largo de la secuencia se examinó en términos de las limitaciones estructurales de la cápside y dotación de reunión, y también en términos de reconocimiento inmunológico de las células T y B.

Conclusión

Más de las tres cuartas partes de los aminoácidos dentro de la secuencia HBVc no son polimórficos, y la variación se centra en unos pocos aminoácidos. Análisis filogenético indica que las fuerzas básicas de proteínas específicas de limitar su diversidad en el contexto global de la evolución del genoma del VHB. Como consecuencia de ello, la proteína básica no es un predictor fiable del virus de genotipo. Los requisitos estructurales de la cápside asamblea tienden a desempeñar un papel importante en la limitación de la diversidad. El análisis filogenético sugiere además que inmunológicos selección no juega un papel importante en la conducción HBVc diversidad.

Antecedentes

Las presiones evolutivas que han llevado el virus de la hepatitis B (VHB) la variación Todavía no se entiende. Utilizando todo el genotipo HBV secuencia, esta variabilidad puede ser útil clasificar en al menos ocho familias (genotipos), con una distribución geográfica característica (revisado en [1]]. Por otra parte, las cepas de VHB se pueden clasificar serológicamente sobre la base de anticuerpos para el antígeno de superficie (subtipos). Estas dos clasificaciones se correlacionan en términos generales, aunque algunos subtipos aparecen en más de un genotipo. El alcance de la diversidad genética refleja la historia evolutiva del virus y la tasa de mutación, así como las fuerzas de la selección de genes específicos. Varios modelos de evolución del VHB se han propuesto (revisado en [2, 3]], pero los parámetros fundamentales, como la tasa de transmisión entre o de la tasa de mutación de nucleótidos (el reloj molecular) siguen sin resolver [3]. No obstante, en general se supone que la aparición de las familias VHB puede reflejar la adaptación a la genotipo prevalente humanos de la población de acogida [4].

El curso clínico de la infección por VHB es muy variable. Infecciones agudas en los adultos suelen ser efectivamente controlada, pero en ocasiones, dar lugar a una hepatitis fulminante y la muerte. En una proporción de los individuos sin embargo, la infección crónica da lugar a la replicación viral, que puede ocasionar graves daños en el hígado o carcinoma hepatocelular. Anfitrión factores, como el estado inmune claramente desempeñar un papel importante en determinar el resultado clínico. Por ejemplo, la transmisión perinatal conduce a un máximo de 90% carriership crónica, mientras que la cifra es de menos del 10% para los adultos. Sin embargo, la patogenicidad también se ha vinculado con el virus de genotipo y de diferentes mecanismos que se han propuesto para esta observación [5, 6]. Secuencia de cambios que se producen en el curso de la infección (longitudinal de la diversidad) también han sido ampliamente documentados. Un ejemplo común es la introducción de un codón de parada en la región precore lo que se traduce en downregulation de la secreción de una forma soluble de la proteína del VHB básico (HBVe) cuya función aún no está claro [7, 8]. Curiosamente, la downregulation de la secreción HBVe a menudo se asocia con la aparición de anti-HBVe anticuerpos en el suero, lo que sugiere la propia proteína puede inducir a algún tipo de tolerancia inmunológica [7, 9].

El papel de la inmunidad adaptativa, tanto en la determinación del curso de la infección por VHB y VHB evolución en la conducción es de especial interés. Aunque pre-existentes de anticuerpos a la proteína de superficie del VHB (HBVs) (por ejemplo, en individuos vacunados) claramente proporciona una sólida protección, a este antígeno anticuerpo en la infección natural es un evento tardío, por lo general después de un control efectivo de viremia. En contraste, los anticuerpos a VHB básico (HBVc), aunque esta proteína está a cargo de los virus, se produce a principios de la infección en casi todas las personas infectadas, con independencia de su capacidad de controlar la replicación viral [10]. T helper y citotóxicos respuestas a varias proteínas del VHB también se han detectado, y la presencia de una mayor frecuencia de VHB CTL específicos en el hígado se asocia con la capacidad de controlar la viremia [11]. Como era de predecir las respuestas CTL no se limitan a las proteínas estructurales, pero no reconocen varias proteínas virales estructurales. Virus de células T específicas de la respuesta inmune son más fáciles de detectar en las personas que de manera efectiva el control de la replicación viral. En las personas con infección crónica, estas respuestas son a menudo mucho más difíciles de detectar, lo que sugiere que el estado crónico se asocia con el establecimiento de alguna forma de tolerancia inmunológica [12].

HBVc antígeno es una pequeña proteína, cuya estructura tridimensional ha sido determinado por cristalografía de rayos X [13], y cuya inmunogenicidad tanto en términos de anticuerpos y respuestas de células T no se ha estudiado ampliamente en los dos ratón y el hombre. Por lo tanto, representa un punto de partida ideal para la realización de estudios encaminados a antígeno relativas a la estructura de la respuesta inmune. De hecho estudios longitudinales sobre pequeños grupos de individuos con infección por el VHB han sugerido que la variación es más común en las células B y epítopes de células T helper, lo que sugiere un posible mecanismo de escape inmune impulsada [14]. Como base para la futura exploración funcional que hemos documentado HBVc variación en detalle. En este estudio hemos recogido varios cientos de secuencias de proteínas HBVc de bases de datos públicas, y se han vuelto a examinar la variación en relación con la estructura, la inmunogenicidad y genotipo.

Resultados y discusión

742 secuencias de la proteína HBVc fueron recuperados de la base de datos NCBI proteína después de algún manual de curación de muy corta secuencia de fragmentos. La proteína madura HBVc secuencias 1-185 (sin incluir la región precore) fueron alineados y el número de polimorfismos encontrados en cada posición (que se define como aminoácidos aparecen en más de 1% de las secuencias en cada sitio) está determinado (véase el archivo adicional 1]. Una trama de la serie de variantes en cada posición se muestra en el gráfico 1 bis y de las principales características estructurales, incluidos los cuatro hélices alfa, la prolina ricos bucle, y la C-terminal brazo [13] de la proteína se muestran en el gráfico 1b. Más de las tres cuartas partes (141/185) de las posiciones son completamente invariante. Variación agrupadas en ciertas regiones de la proteína, con 18 variables de los 45 aminoácidos encontrados en las posiciones 59-100.

Variación en la secuencia de la proteína básica puede reflejar la variación genotípica entre las cepas de VHB impulsada por la deriva o de otros factores desconocidos ( "hitchhiking"). Por otra parte, las presiones de selección específicos pueden actuar en forma independiente HBVc diversidad de conducción. Con el fin de abordar esta cuestión, la relación entre la variación HBVc y VHB genotipo fue explorado. Uso de texto de consulta de la base de datos, un subgrupo de 402 secuencias fueron seleccionadas que se había asignado el genotipo AD (estos son los más frecuentes dentro de los genotipos asignados este conjunto) mediante el análisis de toda la secuencia del genoma o secuencias fuera de la región central. Estas proteínas básicas 402 secuencias de aminoácidos que se suman y se comparan entre sí y con el consenso general de secuencia utilizando Protdist, un programa que usa el Phylip Jones-Taylor-Thornton modelo [15]. La distribución de las distancias entre cada secuencia y el consenso se trazan para cada genotipo viral, tal como figura en la base de datos de registro (fig 2]. La distancia de distribución de perfiles de los diferentes genotipos se superponen en gran medida, lo que sugiere que no hay correlación entre la distancia desde el consenso y el genotipo.

En un enfoque alternativo, la relación entre todas las diferentes secuencias básicas se determinó a través de Fitch-Margoliash análisis de mínimos cuadrados, y dibujan como un árbol unrooted (fig 3]. Los diferentes genotipos de virus son cada color. Aunque algunos grandes agrupaciones de genotipos se puso de manifiesto, una cantidad significativa de la "mezcla" puede ser observado. Cualitativos similares resultados se obtuvieron al filogenia fue determinado por vecinos Participar análisis (utilizando el programa Phylip Vecino) o por parsimonia (utilizando ProtPars programa Phylip).

Este fenómeno fue analizado con más detalle en un subconjunto de 40 longitud completa secuencias de la proteína básica seleccionados de diversas secciones del árbol se ilustra en el gráfico 3 (véase el cuadro 1]. La relación filogenética entre estos cuarenta secuencias se analizó una vez más, utilizando vecino-Participar (a menos intenso método de cálculo) la incorporación de un pliegue de arranque replicar 1000 con el fin de validar el árbol de topología. Los resultados de este análisis se muestran en el gráfico 4 bis. En este subconjunto más pequeño, los genotipos AyD están razonablemente bien resuelto, pero los genotipos B, y C son ampliamente desordenadas. Un ejemplo de esto es ilustrado por dos secuencias idénticas (1 y 40 en el gráfico 4] derivados de los genotipos ByC respectivamente. Las secuencias de ADN correspondientes a cada uno de estos cuarenta secuencias de la proteína fueron obtenidos a partir de GenBank, y analizarse con la misma bootstrapped vecinos-Participar procedimiento. El árbol obtenido se muestra en el gráfico 4 ter. Como se esperaba, el arranque, en general, los valores son más altos para el árbol de ADN (desde tres veces más secuencia de la información se está analizando). Las secuencias de ADN son algo más eficiente en la clasificación de B y C como agrupación independiente. En particular, las dos secuencias de proteínas idénticas (1 y 40 en el gráfico) están bien separados y correctamente clasificada por el ADN filogenia. En general, sin embargo, sigue siendo significativa por errores de clasificación, lo que refleja ya sea incorrecta genotipo, la recombinación entre cepas virales [16, 17], o simplemente la discriminación basada en la insuficiencia de estas secuencias virales relativamente corto.

Tomados en conjunto, estos datos sugirieron las fuerzas que impulsan la evolución de las centrales fueron parcialmente independiente de las fuerzas que impulsan la diversificación evolutiva de la cantidad total de genotipo.

Las presiones evolutivas en la diversidad de secuencias se analizaron con más detalle el análisis de sinónimos (S) / (N) nonsynonymous nucleotide variación dentro de las 40 secuencias virales se muestra en el Cuadro 1. El patrón de distribución de sinónimo / nonsynonymous las tasas de mutación se muestra en el gráfico 5 bis. La proteína es una evidencia fuerte de la purificación de selección en toda la secuencia, con dN / dS ratios (utilizando una ventana deslizante de 36 pares de bases), principalmente por debajo de 0,1, La aparente dS tasa no fue homogéneo a lo largo de la longitud del gen. La brusca disminución de la tasa de sustitución de alrededor de 110 posición más probable es que refleja el inicio de la superposición de abrir el marco de lectura de la polimerasa, y esta área es, por tanto, excluidos de un análisis más detallado. La identificación de sitio específico positivo o neutral de selección que operan dentro de un ámbito general de la purificación de la selección ha recibido una atención considerable [18 - 21], y una serie de metodologías han sido adoptadas. Se aplicaron análisis de máxima likelyhood como realiza utilizando Bayes método empírico de Bayes en el paquete de software PAML [22] y la comparación de una serie de modelos específicos de cada sitio, la selección de distribución [18]. La mejor probabilidad valor se obtuvo utilizando el modelo 8 (ver Métodos), que incluye un subconjunto de selección positiva. Las probabilidades para el posterior positivo (ω = 1.38) las clases se trazan en el gráfico 5 ter. Curiosamente, sólo una posición mostraron una probabilidad de> 90 de ser seleccionados positivamente, y dos más 50% de probabilidad. En contraste 133 de 140 codones mostraron una probabilidad de> 90% de los negativos de selección purificadora. Por lo tanto, parece ser muy limitada cantidad de selección positiva en el núcleo secuencia VHB.

La secuencia de información adicional en el archivo 1 / fig 1 Se ha racionalizado en la estructura tridimensional de la cápside obtenidos de la base de datos de Brookhaven. Como se pone de manifiesto en el gráfico 6, la variación en la secuencia se concentra en los picos en la superficie exterior de la capsids. Todos los aminoácidos con tres o más variantes se encuentran en la superficie exterior de la cápside (fig 6b panel superior), mientras que la superficie interna de la cápsida lumen son relativamente conservadas (fig 6b, panel inferior).

Un detallado estudio de la alanina mutagénesis se ha realizado cartografía de los aminoácidos esenciales para la debida formación de la cápsida, y / o necesarios para la envolvente de tipo virus y formación [23]. Mutación de los 24 aminoácidos se encontró para bloquear la formación de la cápsida, virión formación o ambos. La posición de estas mutaciones en la estructura 3D se muestra en el gráfico 7. La posición de este conjunto de mutaciones es bastante amplia distribución en la estructura, lo que sugiere múltiples interacciones esenciales son absolutamente necesarios, ya sea para una correcta cápside asamblea, o para dotación y montaje virión. Sin embargo, curiosamente, todos menos uno de estos 24 aminoácidos se consideran invariantes en el conjunto de datos analizados en este estudio. La única excepción se observó en la posición 129, donde el cambio de prolina a alanina se encontró para bloquear tanto la formación de la cápsida y virión. Ambos threonine glutamina y se encuentran en una proporción de las secuencias del virus en esta posición, y además mutagénesis será necesaria para aclarar las limitaciones impuestas por los requisitos de formación de tipo virus en la secuencia en esta posición particular. Así, los requisitos estructurales del virión asamblea parecen imponer una significativa moderación en HBVc diversidad. Sin embargo, en varias posiciones, que se encontraron a tolerar alanina mutagénesis en términos de la cápside / virión asamblea fueron, sin embargo, invariable en el conjunto de secuencias se examinan aquí. El alto grado de conservación en HBVc, por lo tanto, probablemente refleja las múltiples funciones de esta proteína, incluido el control de la orientación intracelular [5], pregenome / DNA polimerasa embalaje, el desmontaje y la cápside viral maduración.

Presión por el sistema inmune del huésped es un candidato obvio conducción variación en la secuencia de la proteína de HBVc. Células citotóxicas CD8 se cree que desempeñan un papel clave en el control de la replicación del virus durante la infección por el VHB [24, 25]. Varios epítopos de células T CD8 se han caracterizado en detalle (por ejemplo, [26 - 28]] por el uso de clones de células T y las líneas, o por elución de HLA [29]. Algunas de las secuencias se muestran en el gráfico 7, junto con la conocida variante de secuencias en el conjunto de datos analizados en este estudio. Aunque varios de los epítopos son de la más conservada de la región interior de la cápsula, dos de los epítopos demostrar un polimorfismo (fig 8]. Curiosamente, un trabajo previo, no encontramos ninguna evidencia de aparición de mutaciones en los principales epítopes CD8 durante infección crónica por VHB [30].

Las pruebas que implican a las células T CD4 de control de la infección por el VHB sigue siendo mucho menos claro. Además, aunque las regiones que contienen epítopos CD4 se han descrito, muchos de los epítopos no están muy bien caracterizados. Una putativo "inmuno" epitopo de células T CD4 (aminoácidos 50-69) contiene un número variable de aminoácidos (fig 9a], y, de hecho, los cambios en su secuencia que se han relacionado directamente a los cambios en la respuesta de células T in vivo [31 ]. Un segundo epítopo (básicos región 147-156) identificado como un importante objetivo en HLADR13 personas también ha sido examinado en detalle [32]. Curiosamente este epítopo muestra también una variación considerable (fig 9a], incluyendo una mutación en la posición 151 demostrado ser esencial para el reconocimiento de células T. El epítopo también se extiende por la región de una inserción de dos aminoácidos que se encuentra exclusivamente en el genotipo de los virus A. Además inventario detallado de las células T CD4 reconocimiento de los sitios, en relación con la secuencia natural de variación sería parecen ser un área de gran interés.

Por último, ha sido considerable la información acumulada en la interacción de los anticuerpos a VHB capsids. Como se muestra en el gráfico 9 ter [10] definió las principales especificidades de anticuerpos se encuentran en el exterior de la estructura de la cápsula, especialmente en la punta de los picos y en los enlaces entre los picos adyacentes. De hecho, estas regiones contienen la mayor parte de la secuencia HBVc variación, aunque la variable más aminoácidos propios no han sido identificados como contactos conocidos de anticuerpos [33]. Sin embargo, la contribución de los anticuerpos anti-HBVc a la protección sigue siendo poco claro, sobre todo después de la cápside en viriones intactos es de suponer que en gran medida a salvo de anticuerpos por el VHB sobre.

Conclusión

Este estudio hace uso de la gran cantidad de secuencias HBVc ahora disponible en bases de datos públicas para caracterizar las variaciones en la secuencia HBVc. Una limitación de este enfoque es que la detallada información clínica asociadas a la infección no está disponible, y, en particular, no es posible examinar la variabilidad en el contexto de la longitudinal curso de una infección por VHB. Esto es probable que sea un factor importante ya que las mutaciones son a menudo encontrados a surgir a finales de la infección, asociado con una variedad de resultados clínicos (por ejemplo, [34, 35]]. Además algunas de las secuencias disponibles han sido verificados por su capacidad de hacer competentes virus infeccioso, y algunas secuencias pueden ser, por tanto no funcionales de proteínas. Sin embargo, a pesar de estas limitaciones, los datos disponibles no permiten algunas conclusiones generales.

En general, HBVc contiene una gran proporción de aminoácidos invariante, y una fuerte representación de las más de sinónimo o no sinónimo casi todas las mutaciones en el codón. Ambas características sugieren la presencia de una fuerte limitación de las fuerzas de orden en la diversidad. Virión asamblea es probable que proporcionen una de las principales que limitan la fuerza [23]. Como se informó anteriormente (por ejemplo [14]] secuencia de la diversidad parece estar agrupadas, y se asigna fundamentalmente a la espiga y la superficie externa de la cápside. Estas posiciones pueden permitir una mayor flexibilidad en términos de montaje virión.

Una importante consecuencia de la fuerte purificador de selección es que es una secuencia de proteínas pobre predictor de genotipo para este gen. Secuencia de ADN que refleja principalmente sinónimo mutaciones, es un mejor discriminador, en particular en la solución de los genotipos B, y C. A más largo análisis de secuencias, sin embargo, es claramente necesario para obtener información confiable del genotipo.

El papel putativo de selección inmune en la conducción VHB básico diversidad es mucho más claro. Las pruebas directas positivo para la selección, al menos mediante el análisis presentado aquí, sólo identifica a un solo aminoácido (posición 74 en la punta de la espiga viral) como muestra para las pruebas de selección positiva de la diversidad. Sin embargo, es evidente que varios polimórficos posiciones dentro de los límites de T o de células B epítopos. Por lo tanto, mientras que el efecto global de selección inmune VHB secuencia en la diversidad puede ser pequeño, secuencia de la diversidad puede tener un efecto significativo en la respuesta inmune a nivel individual. El análisis de los datos dados en este documento ayudará a informar a un nuevo análisis de la VHB-respuesta inmune específica. La combinación de anticuerpos y de células T con reconocimiento de los estudios de mutagénesis dirigida HBVc debe determinar con más precisión la relación entre estructura, la inmunidad y la patogenicidad.

Métodos

Humanos HBVc secuencias fueron recuperados de la base de datos NCBI secuencia de la proteína [36], lo que limita la búsqueda a organismo = Virus de la hepatitis B y la búsqueda de proteínas básicas. Adicional clasificación en genotipos AD se hizo utilizando la herramienta de búsqueda de texto para buscar "genotipo X". Una proporción de votos fueron verificados por la inspección manual.

Los primeros 780 hits fueron alineados utilizando el programa EMMA sobre EMBOSS (una versión de Clustal) (ver [37], utilizando la matriz de similitud BLOSUM 62. La alineación se perfeccionó por la inspección manual utilizando la secuencia Bioedit editor, y muy poco o mal alineados Secuencias eliminado. La frecuencia de los aminoácidos en cada posición se determinó utilizando el programa EMBOSS PROFECÍA. Observó La matriz se convirtió en el polimorfismo de frecuencia mediante el establecimiento de un límite del 1% de frecuencia en cada posición.

Un árbol filogenético de las secuencias de HBVc fue creado usando el programa Phylip Kitsch [38]], que utiliza una Fitch-Margoliash criterio sobre la base de una matriz de distancia obtenida mediante la Phylip programa Protdist. El árbol se muestra mediante Treeview [39], copiado en Adobe Illustrator y codificadas por colores de acuerdo con el genotipo. Debido a que este método es extremadamente intensivo del procesador (la mejor árbol es analizado en cada iteración) no fue posible de arranque. Los análisis de los mismos datos se realiza también mediante el análisis de vecinos más cercanos (usando el programa Phylip Vecino) y la parsimonia usando EMBOSS (loc cit) EPROTPARS programa. Aunque los detalles de los árboles varía entre los métodos cualitativos conclusión general fue la misma. Con el fin de validar las conclusiones de la filogenia, 40 secuencias (que se muestra en la Tabla 1] elegido manualmente para cubrir las principales ramas de los árboles se muestra en el gráfico 3 se reanalysed utilizando el vecino más cercano con la opción de arranque (1000 bootstraps), de ClustalW [40 ]. El árbol de consenso se trazan en conjunto Treeview y de color en Illustrator. El mismo análisis se realizó sobre una alineación de las secuencias de ADN correspondientes a cada secuencia de la proteína.

El análisis de sinónimo / nonsynonymous tasas de mutaciones se llevó a cabo inicialmente utilizando el programa DNASP3.0 [41] (utilizando el Nei / Gojobori algoritmo), con una base de 36 pares de deslizamiento ventana desplazado por 9 nucleótidos. Un análisis más detallado de cada uno de los codones se llevó a cabo usando el programa PAML versión 3.14 (usando máxima verosimilitud Empirical Bayes inferencia de Bayes, como se describe en [20]]. El análisis se llevó a cabo utilizando una variedad de modelos de selección, pero la salida representados en el gráfico 5 modelo utilizado 8 [22]. Los modelos asumen que la presión de selección (medido como ω) que funcionan en cada codón puede caer dentro de una gama de diferentes clases. 8 asume un modelo de distribución de los valores negativos de selección (todos los cuales ω <1), o una clase de selección positiva con ω = 1,38. Este modelo se encontró a dar la mejor estimación de la probabilidad. El programa calcula entonces el posterior probabilidad (p-valor) que cada codón dentro de una secuencia está dentro de una clase en particular.

La estructura cristalina de HBVc fue recuperado como un pdb archivo de la base de datos de Brookhaven, y se muestra de color y utilizando RasMol software (versión 2.7.1.1 para Windows). Figuras 6 y 7 muestran la estructura de cuatro monómeros idénticos, para ilustrar las espigas y su interacción, en tanto que los higos 8 y 9 muestran un monómero para mayor claridad.

Abreviaturas

VHB Virus de la hepatitis B, hepatitis B, la proteína básica HBVc; superficie de la Hepatitis B proteína HBVs

Contribuciones de los autores

RM siempre bioinformática apoyo y la experiencia, y llevó a cabo el análisis filogenético muestra en el gráfico 4. BMC inició el proyecto y fue responsable de los textos, y el análisis de datos y se muestra en las otras cifras.

Material suplementario
Archivo Adicional 1
Aminoácidos polimorfismos HBVc a lo largo de la secuencia. El cuadro que contiene todos los aminoácidos polimórficas encontradas en cada posición a lo largo de las 742 secuencias analizadas VHB.
Agradecimientos

Agradezco mucho debate útil con muchos colegas en la UCL, en particular a Paul Kellam para ayudar con la bioinformática, a Ziheng Yang inicial para ayudar a la creación de PAML y Richard Tedder, Antonio Bertoletti, Mala Maini y Nikolai Naoumov de asesoramiento sobre el VHB . Agradezco al Dr Volker Bruss (Universidad de Goettingen) por su ayuda y asesoramiento. También estoy muy agradecido al personal en el Reino Unido HGMP Centro de recursos para una gran cantidad de ayuda y la paciencia con el correr diversos programas de bioinformática.