Virology Journal, 2005; 2: 20-20 (más artículos en esta revista)

CODEHOP mediada por PCR - Una poderosa técnica para la identificación y caracterización de los genomas virales

BioMed Central
Timothy M Rose (trose@u.washington.edu) [1]
[1] Departamento de Pathobiology, Box 357238, de la Escuela de Salud Pública y Medicina Comunitaria de la Universidad de Washington, Seattle, WA 98195, EE.UU.

Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.

Resumen

Consenso-Degenerate Híbrido Oligonucleotide Primer (CODEHOP) PCR primers derivados de la secuencia de aminoácidos que son motivos muy conservadas entre los miembros de una familia de proteínas han demostrado ser muy eficaces en la identificación y caracterización de los miembros de la familia alejadas. En este sentido, el uso de la CODEHOP estrategia para identificar nuevos virus y obtener información para la secuencia filogenética caracterización, la determinación de la estructura genética y el análisis del genoma se revisa. Además de este estudio se describen las técnicas para la identificación de los miembros de la familia herpesvirus de los virus de ADN, la misma metodología y el enfoque es aplicable a otras familias de virus.

Introducción

Sólo una fracción muy pequeña de la gran mayoría de las especies virales que pertenecen a las diferentes familias de virus se han identificado y caracterizado hasta la fecha. La mayoría de estas especies virales no se encuentran en los organismos de acogida que no han sido blanco de la biomedicina, la investigación de plantas o animales. Sin embargo, los últimos informes han señalado un aumento en la incidencia de enfermedades virales, no sólo en humanos, sino también en los animales y las plantas también. Si bien algunos de este aumento puede reflejar más eficaces técnicas de vigilancia, los brotes de enfermedades causadas por nuevas especies de las infecciones cruzadas y / o la recombinación del virus de los acontecimientos posteriores se han producido [1]. Por lo tanto, el desarrollo de instrumentos para la detección de virus, la caracterización de sus genomas y el estudio de su evolución, se convierte en importante, no sólo para el estudio de base científica, sino también para la protección de la salud pública y el bienestar de la planta Y de la fauna que nos rodea.

Hemos desarrollado una nueva tecnología para identificar y caracterizar alejadas secuencias genéticas basadas en el consenso de degenerar híbrido oligonucleótidos (CODEHOPs) [2]. CODEHOPs están diseñados secuencia de aminoácidos de los motivos que son altamente conservados dentro de los miembros de una familia de genes, y son utilizados en la amplificación de PCR para identificar los miembros de la familia relacionados con el desconocido. Hemos desarrollado e implementado un programa de computadora que es accesible a través de la WWW para facilitar el diseño de CODEHOPs de un conjunto de secuencias de proteínas relacionadas con el [3]. Este sitio está vinculado con el bloque de secuencias de alineación múltiples Maker sitio [4] en el servidor WWW BLOQUES [5] alojado en el Fred Hutchinson Cancer Research Center, Seattle, WA.

Hemos utilizado la técnica de CODEHOP desarrollar nuevos ensayos para la detección viral de las especies hasta ahora desconocidas por motivos de orientación secuencia estable dentro de la casa que son los genes evolutivamente conservados entre los diferentes miembros de familias de virus. Usando CODEHOPs derivados de motivos conservados dentro de retrovirales transcriptasas inversa, hemos previamente identifed una diversa familia de elementos retrovirales en el genoma humano [2], así como una novela retrovirus endógeno porcino [6], y un nuevo retrovirus en Talapoin monos [7 ]. También hemos desarrollado ensayos para detectar desconocido herpesviruses conservado por motivos de orientación dentro de herpesvirus ADN polimerasas. Con este enfoque, hemos identificado hasta ahora desconocidas catorce secuencias de la DNA polimerasa de los miembros de la alfa, beta y gamma subfamilias de herpesviruses [8], y han descubierto tres homólogos del sarcoma de Kaposi asociado-herpesvirus en macacos [9, 10]. También hemos utilizado la CODEHOP técnica para clonar y caracterizar toda la polimerasa de ADN de genes de estos nuevos virus [10] y para obtener secuencias de las regiones más grandes de genomas virales que contienen múltiples genes, la diferencia de la orientación locus B, de macacos rhadinoviruses [11]. La secuencia de la información obtenida a partir de la amplificación de fragmentos de genes y genomas de estos estudios ha permitido la caracterización filogenética informativo de la nueva especie viral, y ha proporcionado información esencial acerca de la estructura genética y genética contenido de estos genomas virales desconocidos.

En esta revisión, la CODEHOP metodología y su utilización en la identificación y caracterización de nuevos genomas virales utilizando la familia de herpesvirus como ejemplo se describe. Publicado CODEHOP ensayos que hemos utilizado anteriormente para identificar nuevas herpesviruses se discuten y los últimos ensayos de refinado y su utilidad son proporcionados. El uso de la CODEHOP metodología para el análisis de las grandes regiones de los genomas virales se presenta junto con la aplicación general de esta tecnología para la identificación viral de las especies y sus genes en otros virus de la familia. Por último, el software y un sitio web que hemos desarrollado para obtener CODEHOP PCR primers de bloques alineados de multiplicar secuencias de la proteína se describen.

Metodología CODEHOP
General CODEHOP diseño y la estrategia de PCR

CODEHOPs se derivan de muy conservadas motivos secuencia de aminoácidos presentes en múltiples alineaciones de las proteínas relacionadas con el gen de una determinada familia. Cada CODEHOP consiste en un conjunto de los cebos que cada cartilla contiene una de las posibles secuencias de codificación a través de un 3-4 motivo de aminoácidos en el extremo 3 '(degenerar básicos) (Figura 1A] [2]. Cada cartilla contiene también una secuencia más larga derivados de un consenso de la posible codificación de las secuencias 5 'a los principales motivos (abrazadera de consenso). Así, cada cartilla tiene un diferente 3 'de la secuencia de codificación de aminoácidos motivo de la misma y 5' secuencia consenso. Hibridación de la 3 'degenerar núcleo con el ADN diana plantilla está estabilizado por los 5' abrazadera de consenso durante la primera reacción de amplificación de PCR (Figura 1B]. Hibridación de los primers de PCR a los productos durante su posterior amplificación de los ciclos está impulsado por la interacción a través de los 5 'consenso abrazadera.

Conservadas aminoácidos motivos utilizados para CODEHOP diseño se identifican con la alineación de las proteínas relacionadas con el gen de una determinada familia mediante programas de ordenador, tales como la alineación de Clustal W múltiples programa [12]. 3-4 óptima bloques contienen aminoácidos muy conservadas con restricciones de codón multiplicidad de la que el 3 'degenerar básico se deriva, la presencia de serines, arginines y leucines no son favorecidos por la presencia de seis posibles codones para cada aminoácido. Además, el óptimo de los bloques contienen 5 o más aminoácidos conservada de las que el 5 'abrazadera de consenso se deriva. Estos bloques de secuencias de aminoácidos conservados deberían estar situados en una estrecha proximidad suficiente para permitir la amplificación de PCR eficiente entre bloques aún distante lo suficiente como para flanco de una región importante de la información secuencial.

Hemos desarrollado software basado en la web para predecir CODEHOP PCR primers conservadas de los bloques de secuencias de aminoácidos [2, 13]. Múltiples secuencias de las proteínas relacionadas con la familia de genes están orientados a la Block Maker programa [4] en el servidor WWW BLOCKs [5] que produce un conjunto de bloques de secuencias conservadas obtenida de una secuencia múltiples alineación. La secuencia de bloques de salida está vinculada directamente a la CODEHOP diseño de software [3], que predice resultados y posibles CODEHOP PCR primers. Las diferentes CODEHOP PCR primers discutido en esta revisión fueron diseñados ya sea manualmente o con el CODEHOP software, y se enumeran en el cuadro 1.

CODEHOP mediante amplificación por PCR, el producto de la clonación y análisis de secuencias

CODEHOP mediante amplificación por PCR se ha realizado utilizando toque clásico y hacia abajo con un hot-start inicio [2]. Más recientemente, el gradiente térmico mediante amplificación por PCR se ha utilizado para determinar empíricamente recocido óptimas condiciones para la amplificación y la piscina de primers [11]. Diferentes buffers, concentraciones de sal, y las enzimas se han empleado con éxito distintos debido a diferencias en la plantilla de la DNA y de la preparación de la naturaleza desconocida orientados secuencia. PCR productos son o bien secuenciados directamente o TA-después de la clonación.

En esta revisión, las secuencias se compararon mediante análisis BLAST [14] y múltiples alineación utilizando Clustal W [12]. El análisis filogenético de las secuencias de multiplicar alineados se realizó a través de proteínas distancia y vecino a participar en el análisis aplicado en el análisis de Phylip paquete [15]. Bootstrap También se realizó el análisis con 100 repeticiones y un árbol filogenético consenso se determinó. Para el análisis filogenético, posiciones en la alineación que contiene múltiples deficiencias debido a inserciones o deleciones en la secuencia de bloques se eliminaron.

El "TGV-IYG" CODEHOP ensayo para la detección de novela herpesviruses

El Herpesviridae fue elegido como un objetivo virus de la familia para desarrollar ensayos para detectar y caracterizar nuevos miembros viral. Todos los miembros de la familia herpesvirus contienen una ADN polimerasa dentro de su genoma, que es altamente conservadas a través de los diferentes miembros de la familia. Múltiples alineación de los diferentes herpesvirus polimerasa reveló bloques de secuencias conservadas aminoácidos correspondientes a muchos de los motivos funcionalmente importante [16], véase la figura 2A. Hemos desarrollado y perfeccionado estrategias utilizando PCR CODEHOP PCR primers derivados de estos bloques de secuencias conservadas novela herpesviruses para detectar y caracterizar sus genomas.

Al principio, nos manualmente diseñado un conjunto de nested PCR primers de cuatro de los bloques de la polimerasa de ADN conservadas (negro como se indica en la Figura 2A cajas) que podrían utilizarse para identificar nuevas polimerasas virales y detectar la existencia de hasta ahora desconocidas o no herpesviruses [8] . Los cebos, "TGV", "IYG", "DFA" y "KG1" (Tabla 1], y de multiplicar los bloques alineados secuencias de los primers que se obtuvieron se muestran en los gráficos 3, 4, 5, 6, respectivamente (cartas en el primer nombre se refieren a los aminoácidos conservados en la secuencia motivo). Aunque estos cebos fueron alternativamente a que se hace referencia como "consenso" o primers "degenerar" primers dentro de la publicación original, todos excepto DFA fueron diseñados utilizando CODEHOP general de la estrategia [2]. En el "TGV-IYG" herpesvirus ensayo, el "DFA" primer sentido se utilizó en un principio con la amplificación de PCR "KG1" anti-sentido cartilla (Figura 2B]. Un ejemplo adicional de sentido "ILK" ubicado aguas abajo de la "DFA" motivo también fue añadido a la primera reacción de amplificación [8]. El producto de esta amplificación se utilizó como plantilla anidada en una reacción de amplificación utilizando el "TGV" y el primer sentido "IYG" anti-sentido cartilla (Figura 2B]. Esta última fue producto de PCR para obtener la secuencia ~ 165-180 pb de la región de la polimerasa de ADN de genes ubicados entre los dos motivos "TGV" y "IYG". La distancia entre los dos motivos fue variable entre especies virales debido a la secuencia de pequeñas inserciones o deleciones.

Hemos demostrado la utilidad de este primer CODEHOP PCR estrategia mediante la identificación y characterizing14 previamente desconocido secuencias de la DNA polimerasa de los miembros de la alfa, beta y gamma subfamilias de herpesviruses [8]. Desde esta publicación original, más de 21 adicionales "TGV-IYG" de las secuencias de DNA polimerasa herpesviruses anteriormente no han sido obtenidos por otros investigadores usando este primer CODEHOP estrategia (véase adicionales Archivo 1; "TGV-IYG" ensayo). En algunos casos, mediante amplificación por PCR se realizó con modificados deoxyinosine-sustituidos primers [17].

La comparación de las secuencias de aminoácidos codificados dentro de la "TGV-IYG" filogenética región ha permitido la comparación de los diferentes herpesvirus especie de la que se obtuvieron estas secuencias. La figura 7 se muestra un árbol filogenético que se desprende del análisis de las secuencias obtenidas de 34 especies diferentes herpesvirus identificados con el "TGV-IYG" CODEHOP estrategia y las correspondientes secuencias de seis representante humanos herpesviruses. Aunque el número de aminoácidos comparaciones dentro de la región es limitada, es decir,. Sólo 53 aminoácidos, la asignación preliminar de muchas de las especies de herpesvirus en uno de los tres subfamilias herpesvirus ha sido posible (Figura 7 y adicionales Archivo 1). Los valores de los análisis de arranque utilizando 100 réplicas se indican para cada rama. Si bien algunos puntos de la sucursal no estaban bien definidos, debido a la cantidad limitada de datos de la secuencia, como se indica por boostrap valores de menos de 50, muchas agrupaciones fueron bien recibidas. El análisis muestra claramente la agrupación de diferentes especies virales relacionadas evolutivamente de los ejércitos. Esto es coherente con estudios anteriores que han demostrado amplia cospeciation viral de las especies y sus linajes de acogida [18].

Parámetros para el perfeccionamiento de la "TVG-IYG" ensayo
Limitar la degeneración de aumentar la sensibilidad

Si bien el "TVG-IYG" herpesvirus ensayo demostró la capacidad de detectar dispares herpesvirus especies de alto título de virus en cultivos in vitro, la detección de la limitación de las cantidades de virus en las muestras de tejidos in vivo era problemática. Esto fue especialmente cierto en las secciones obtenidas de formol-fijo, tejidos embebidos en parafina de los bloques que contiene pequeñas cantidades de ADN degradado. La degeneración del primer grupo, es decir,. El número de los diferentes cebos necesarios para codificar todas las posibilidades para el codón especifica bloque de aminoácidos conservados, desempeña un papel directo en la sensibilidad de la amplificación de PCR. Considerando que muy cebadores degenerados que consiste en grupos de cientos o miles de cebos con diferentes secuencias de ADN puede permitir la amplificación de ADN presentes en las plantillas de alto número de copia, tal como se encuentra en las reservas del virus en cultivo, tienen menos éxito en el amplificador de bajo número de copias de ADN encontrado en las plantillas Infectados por el virus de los tejidos in vivo, sobre todo en el tejido fijado en formol e. A medida que la degeneración aumenta, la concentración de la cartilla o cartillas que participarán en la deseada reacción de amplificación disminuye y puede convertirse en subóptima. Por el contrario, la gran exceso de primers no participan en la amplificación del gen puede causar dirigidos no específicos de la amplificación, que pueden, a su vez, inhibir o máscara de la amplificación de la meta deseada.

Como se indica en la Tabla 1, la degeneración de los primers utilizados en la "TVG-IYG" ensayo osciló entre el 48-1024. Este nivel de degeneración fue impulsado por el número de nucleótidos de las posibilidades de codificación orientada aminoácidos en cada posición, así como por el número de posiciones de aminoácidos que se pueden degenerar. Figura 5A muestra la DFA / DFAS / QAHN secuencia de bloques producidos por Block Maker de múltiples alineaciones, de 11 secuencias diferentes herpesvirus polimerasa. Figura 5C muestra el consenso aminoácidos en cada posición, según lo determinado por la CODEHOP algoritmo, que están en caja y con negrita los suplentes aminoácidos colocados encima. El primer manual original derivados de este motivo, "DFA" es, de hecho, completamente degenerada, con múltiples codones previstas para cada aminoácido, excepto el último de prolina (P) de residuos, con un rendimiento de un grupo de 512 diferentes primers [8] . Debido a que el rendimiento de este primer constantemente fue subóptima en las muestras con la limitación de plantilla, la estructura general y la degeneración de la cartilla fue alterado por el diseño de un PCR primers "DFASA" de la misma secuencia motivo CODEHOP utilizando la metodología. Esta cartilla tiene un 11 pb 5 'consenso y una región 3' degenerar núcleo que contiene múltiples codones a los 5 aminoácidos en las posiciones resultantes de un conjunto de 256 diferentes primers (Figura 5C]. El "DFASA" primero se utilizó con éxito para amplificar extremadamente baja cantidad de ADN viral en un fondo de ADN genómico de parafina-incrustados tejido fijado en formol e en el descubrimiento de los macacos homólogo del sarcoma de Kaposi asociado-herpesvirus, llamado herpesvirus fibromatosis retroperitoneal ( RFHV) [9]. Las estimaciones de número de copias del virus utilizando PCR cuantitativa en tiempo real se indica un nivel de RFHV ADN en el que se dispone de muestras de 1/100-1/1000 una única copia de genes celulares (observaciones no publicadas). El "DFASA" cartilla ha sido utilizado con éxito para identificar una serie de novela-alfa, beta-gammaherpesviruses y en una amplia variedad de organismos de acogida (véase adicionales Archivo 1: "DFASA-GDTD1B ensayo").

Debido a la presencia de un muy conservadas leucina (L) en el bloque de la posición 7 en el "DFAS" motivo (Figura 5], que aumentó significativamente la degeneración de la piscina con el primer de sus seis posibles codones, otros CODEHOP fue diseñado a partir de la " ; QAHN "motivo inmediatamente aguas abajo de" DFAS "para reducir todavía más la degeneración. El "QAHNA" tuvo un primer 5'consensus región de 11 pb y un 3 'degenerar núcleo que contiene múltiples codones a las 4 de las posiciones resultantes de aminoácidos en una piscina de 48 diferentes primers (Figura 5C]. Este CODEHOP ha sido utilizado con éxito para identificar varios primates rhadinoviruses relacionadas con HVSK en muestras de tejido con la limitación de cantidad de ADN viral [10, 19], véase también el adicional de archivos 1.

Primer prejuicio y la especificidad

Los primers desarrollados para el "TGV-IYG" ensayo fueron diseñados para amplificar fragmentos de la polimerasa herpesviruses de los tres subfamilias basado en motivos conservados dentro de la secuencias conocidas. Sin embargo, son muy pocos los motivos son absolutamente secuencia conservada entre los más divergentes herpesviruses. Por ejemplo, el bagre ictalurid herpesvirus (VIH) carecían de la "KGV" de la que el motivo inicial de "KGV" cartilla se deriva (Figura 6]. Además, numerosas diferencias secuencia estuvieron presentes en el VIH dentro de la ADN polimerasa DFAS / QAHN que fue motivo de otro modo muy conservadas en otras especies herpesvirus (residuos de relieve en la Fig. 5B]. Debido a estas diferencias, el VIH secuencia fue excluido de la cartilla diseño de la "DFA", "DFASA" y "QAHNA" PCR primers. Como se muestra en la Figura 5C, la "DFA" y "DFASA" primers han desajustes con el VIH en la secuencia de alanina (A) y leucina (L) codones (Bloque de las posiciones 5 y 7, respectivamente; Figura 5B] y el " ; QAHNA "primer codón desajustes en tres posiciones (Bloque posiciones 13-15; Figura 5B], todo ello en el 3 'degenerar núcleos. La figura 8 muestra la presencia de nucleótidos desajustes con el VIH en toda la secuencia de los primers diferentes (negro resaltando). Así, la falta de la "KGV" y motivo de las diferencias en la secuencia "DFA" primer fuertemente sesgado el "TGV-IYG" ensayo contra el VIH-como secuencias de herpesvirus. Con el fin de identificar VIH-como herpesviruses, nuevos primers tendría que incorporar estas diferencias secuencia.

El "DFA" y "DFASA" primer piscinas fueron originalmente diseñados utilizando sólo la alanina (A) en el codón bloque en la posición 5 "DFAS" motivo y no incluye la glutamina (Q) codón que se encuentra en posición de la Motivo en HHV6 y HHV7, "DFQS" (resaltado, Figura 5A, B]. La falta de adaptación de nucleótidos de la región se muestran en la figura 8. Si bien el "DFA" y "DFASA" primers están sesgados por el diseño en contra de HHV6 y HHV7, que se han utilizado con éxito para detectar betaherpesviruses relacionadas con HHV6 y HHV7 [8]. Esto sugiere que los desfases de 13-14 nucleótidos del extremo 3 'del primer tipo, no tienen grandes efectos en la utilidad de las cartillas, sobre todo cuando viral no es la limitación de plantilla.

Más importante sesgo contra HHV6-y HHV7-como herpesviruses estuvo presente en el "TGV" primer empleados conjuntamente con el "IYG" cartilla en la reacción de PCR anidado secundaria en el "TGV-IYG" de ensayo (ver Figura 2B] . El "TGV" contiene el primer parcial valina (V), el codón "GT", en su extremo 3 '(Bloque posición 11; Figura 3C]. Desde ambos HHV6 y HHV7 contener alanina (A) (= codón GCN) en esta posición (de relieve en la Fig. 3A, B), el "TGV" primer desajuste que en la 3 'terminal de nucleótidos con ambos HHV6-y-como HHV7 Secuencias. Este desfase se produce en el extremo 3 'de la "TGV" primer tipo y se prevé que mermen de forma significativa la polimerasa extensión. Para eliminar este sesgo, el "TGV" cartilla fue rediseñado como el "VYGA" la eliminación de la cartilla 3 'terminal "GT" de la valina y el codón terminal degenerar posición de la glicina (G) codón. El "TGV" cartilla figura un nuevo sesgo en contra de la amplificación de secuencias como HHV6-debido al uso de sólo la fenilalanina (F) codones (TTY) (Bloque posición 8) en una posición de codificación valina (V), en tanto HHV6 y HHV7 (Resaltado en la figura 3A y 3B]. Para eliminar este sesgo, "VYGA" fue diseñado para incluir tanto la valina (V) y (F) codones en esta posición. El total de la degeneración "TGV" y "VYGA" primer piscinas seguía siendo el mismo, con 256 diferentes cebos, debido a la pérdida de la posición en el codón degenerar la glicina, la posición 10 en bloque "TGV", y la ganancia de Degenerar el codón posiciones en la valina, bloque en la posición 8 "VYGA".

La posterior clonación y análisis de secuencias de ADN polimerasas nuevo herpesvirus de la rhadinoviruses, rhadinovirus rhesus (RRV) y alcelaphine herpesvirus 1 (AlHV1) [20, 21], puso de manifiesto la falta de adaptación con los "IYG" cartilla de la "TVG-IYG" ; Herpesvirus ensayo. El "IYG" cartilla (cartilla de orientación opuesta) incluye los codones (ATH) para isoleucina (I) en su extremo 3 '(Bloque posición 1; Figura 4C]. Ambos RRV AH1 y contener una valina (V), el codón (GTN) en esta posición (resaltada en la figura 4A]. Así, "IYG" está sesgado contra RRV-o como AH1-como rhadinoviruses TC debido a un desajuste en el extremo 3 'del primer. Para eliminar este sesgo, la "IYG" cartilla fue rediseñado como "GDTD1B" para eliminar la isoleucina en la posición 3 'degenerar básico (Figura 4C], y, además, la duración de los 5' consenso pinza se incrementó.

Disminución del tamaño de los productos de amplificación

Porque típicas muestras de tejidos especialmente parafina-incrustados tejido fijado en formol e degradadas contienen ADN con tamaños promedio de cerca de 300-500 pb de longitud, decidimos disminuir el tamaño del producto de amplificación máxima de los herpesvirus ensayo. El primer producto de amplificación de la "TGV-IYG" de ensayo (DFA-KG1) ~ 800 pb (Figura 2B]. Para reducir el tamaño inicial de productos de amplificación, una hemi-nested PCR ensayo en el que se desarrolló el nuevo diseño abajo contra el primer sentido "GDTD1B" orientados a los altamente conservadas "YGDT" motivo se utilizó en las primarias de amplificación de PCR con el nuevo río arriba Cartilla "DFASA". Esta amplificación rendimientos de aproximadamente 500 bp PCR producto (Figura 2B]. Este primer producto de PCR se utiliza como plantilla en una secundaria de amplificación de PCR anidado utilizando la cartilla "VYGA" abajo con el primer anti-sentido "GDTD1B". Esta amplificación de PCR se obtiene un producto de aproximadamente 200 bp (ver Figura 2B]. Estas modificaciones producen cerca de los productos de amplificación del tamaño medio de ADN degradado presente en el tejido fijado.

El "DFASA/QAHNA-GDTD1B" herpesvirus ensayo: un perfeccionamiento del "TGV-IYG" ensayo

Hemos desarrollado un refinado herpesvirus ensayo utilizando la ADN polimerasa optimizado CODEHOP PCR primers, mencionado más arriba. Este ensayo fue diseñado para usar sólo tres CODEHOPs hemi-en un ensayo de PCR anidada en la que "DFASA" y "GDTD1B" se utilizan en una primera amplificación de PCR (Figura 2B]. El producto de amplificación de la que se utiliza como plantilla en una secundaria de amplificación con "VYGA" y el sentido original de lucha contra la cartilla "GDTD1B". Una variación de este ensayo utiliza la "QAHNA" en lugar de "DFASA". Así, la amplificación de secuencias de la polimerasa novela requiere la conservación de sólo tres motivos, en lugar de cinco en el original "TGV-IYG" ensayo. El uso de estos ensayos, hemos identificado tres homólogos de la novela recién caracteriza herpesvirus humano, HVSK, en dos especies de macacos [9] (véase el cuadro 1, RFHVMn, RFHVMm y MneRV2). El análisis filogenético de las secuencias moleculares obtenidos de estos estudios proporcionaron pruebas sólidas de la existencia de diferentes linajes de γ2 rhadinoviruses relacionadas con HVSK, llamado rhadinovirus-1 (RV1) y rhadinovirus-2 (RV2) (Figura 9] [10]. Estudios posteriores por otros utilizando este ensayo, han identificado la presencia de miembros adicionales de estos dos linajes en otros primates del Viejo Mundo, incluyendo monos verdes africanos [19], mandrills [22], los chimpancés [23, 24] y [24] gorilas ( Véase el Archivo Adicional 1). Estos datos predice la existencia de otro herpesvirus humano estrechamente relacionado con HVSK pertenecientes a la RV-2 linaje de rhadinoviruses [10].

La utilidad de la "DFASA/QAHNA-GDTD1B" ensayos se ha demostrado por estos y otros estudios en los que más de 19 de la novela herpesviruses alfa, beta y gamma subfamilias de una gran variedad de especies huésped se han identificado y caracterizado molecularmente utilizando CODEHOPs (Cuadros 2 y 3]. La comparación de las secuencias de aminoácidos codificados entre el "DFAS" y "IYG / GDTD" motivos ha permitido la comparación filogenética de los diferentes herpesvirus especie de la que se obtuvieron estas secuencias. Figura 9 muestra un árbol filogenético que se desprende del análisis de las secuencias obtenidas de la "DFA-IYG", y "DFASA/QAHNA-GDTD1B" y los correspondientes ensayos de las secuencias de seis representante humanos herpesviruses. Múltiples secuencia de alineaciones de las secuencias virales se realizaron y las posiciones que contiene lagunas se eliminaron, dejando 142 puestos de aminoácidos para la comparación. Estas secuencias fueron analizados utilizando proteínas distancias y vecino a participar en el análisis aplicado en el análisis de Phylip paquete [15]. Como se indica en la figura 9, la mayoría de las diferentes especies virales pueden ser inequívocamente incluido en cualquiera de los tres herpesvirus subfamilias según lo indicado por el alto de arranque resultados obtenidos para la mayor parte de la rama puntos. Sin embargo, el posicionamiento de la sucursal de puntos para ciertos viral especies no pueden ser determinados con base en confiable secuencia de la información disponible. Esta incertidumbre se ha visto en el análisis similar de especies específicas herpesvirus utilizando conjuntos de datos mucho mayor [18]. Los resultados obtenidos utilizando los 142 aminoácidos comparaciones confirmó y amplió las relaciones phylogenic predicho por la "TVG-IYG" resultados derivados de sólo 53 aminoácidos comparaciones. Además, la relaciones filogenéticas predicha por los diferentes CODEHOP ensayos han sido posteriormente confirmado cuando secuencia sustancialmente más información se obtuvo de la nueva especie viral, ver [10, 11]. Las relaciones filogenéticas muestra en la Figura 9 son coherentes con las conclusiones que amplia cospeciation viral de las especies y sus linajes de acogida se ha producido durante la evolución [18]. La gran variedad de especies diferentes herpesvirus identificados con la orientación CODEHOPs ensayos de la polimerasa de ADN de genes, como se muestra en las figuras 7 y 9, indican la amplia aplicabilidad de la CODEHOPs ensayos para detectar herpesviruses provenientes de diferentes linajes de acogida.

El "SLYP1A-GDTD1B" herpesvirus ensayo: un ensayo general de detección de herpesvirus

Hemos diseñado adicional primers del DFAS / QAHN secuencia motivo CODEHOP utilizando la estrategia de desarrollar más ensayos para detectar nuevos herpesviruses. El primer "SLYP1A" es uno de esos cartilla diseñada para eliminar el sesgo en el 3 'degenerar núcleo de "DFA" y "DFASA" primers contra HHV6 y HHV7, se ha descrito anteriormente. El "SLYP1A" se superpone el primer "DFA" y "DFASA" primers y se extiende más abajo en una región muy buen estado de conservación a través de las diferentes especies incluidas herpesvirus HHV6 y HHV7 (Bloque posiciones 8-12; Figura 5C] [10] . Ejemplo de diseño a través de esta región se basa en las similitudes en las dos primeras posiciones de los codones de isoleucina (I) - (ATA, ATC, ATT) y metionina (M) - (ATG). Estos dos aminoácidos se conservan en dos posiciones dentro de este bloque de secuencia de las especies en todos los herpesvirus, incluyendo VIH (Bloque posiciones 11,12; Figura 5], y ofrecer el penúltimo y el último 3 'codones de la cartilla. Asimismo, el primer SLYP1A fue diseñado con un solo codón de los dos tipos utilizados para la serina (S) - (AGY) para minimizar la degeneración en el 3 'degenerar básico (Bloque posición 10; Figura 5C]. Serina en esta posición (posición del bloque 10; Figura 8] está codificado por AGY-tipo en todos los codones herpesvirus especies, a excepción de CMV-como herpesviruses que utilizan TCN-tipo codones y EHV2 que contiene un codón de threonine. Una segunda relacionados ejemplo, SLYP2A también fue diseñado de esta región con una secuencia idéntica, salvo que el otro serina codones (TCN) se utilizaron en la tercera posición. Aunque este ejemplo es objetivo de CMV-como secuencias, hemos logrado HVSK amplificado que contiene un codón AGT (resultados no publicados).

Hemos utilizado anteriormente "SLYP1A" y "GDTD1B" para identificar un nuevo herpesvirus relacionadas con RRV, llamado Macaca nemestrina rhadinovirus-2 (MneRV2) en el bazo tejido [10]. Estamos posteriormente utilizó este ensayo para la detección de herpesviruses en linfomas de dos macacos rhesus, L758 y 881, de la Tulane Centro de Investigación Regional de Primates. ADN fue proporcionado amablemente por LS Levy. Fuerte productos PCR se obtuvieron en la enseñanza primaria y reacciones de amplificación fueron clonados y secuenciados. El linfoma de rhesus 881 clones dado que contiene una única secuencia que fue muy relacionadas con EBV humanos. Desde el linfoma de rhesus L758, que obtuvo dos VEB-como secuencias, que es idéntica a la primera secuencia de linfoma y la otra, que contenía 10 nucleótidos diferencias entre el fragmento de 475 pb (98% identidad). El análisis de los aminoácidos codificados 3 reveló diferencias de aminoácidos (98% identidad) entre los dos rhesus VEB-como secuencias (MmuLCV1 y MmuLCV2) (Figura 10]. Estas secuencias agrupadas estrechamente con EBV humanos en la rama de la γ1 árbol filogenético muestra en la Figura 9. La identificación de ADN polimerasas de dos tipos de VEB-como lymphocryptoviruses corrobora informes anteriores de la existencia de dos estrechamente relacionados lymphocryptoviruses en macacos rhesus [25] identificado por la comparación de secuencias de diferentes genes EBNA-2. Esto es similar a la situación en la que dos seres humanos diferentes especies VEB, EBV1 y EBV2 han sido identificadas [26].

CODEHOP Uso de la estrategia para determinar la secuencia completa de los genes virales novela

El CODEHOP ensayos descritos anteriormente dirigida restringida región de un gen y sólo limitada, la información secuencial. También hemos utilizado CODEHOPs para obtener la secuencia completa de determinados genes y determinar los genes de acompañamiento en el desconocido genoma viral. Para obtener la secuencia completa de la DNA polimerasa de los genes recientemente identificados herpesvirus especies de macacos, RFHVMn y RFHVMm, hemos diseñado CODEHOP PCR primers adicionales conserva secuencia de bloques dentro de la DNA polimerasa (Figura 11 y Tabla 4]. El nuevo ADN polimerasa-PCR primers CODEHOP derivados ", CVNVA" y "YFDKB" se utiliza en conjunción con primers específicos de genes derivados de dentro de la secuencia de la PCR original CODEHOP producto "DFASA-GDTD1B para obtener la superposición de los productos a través de la PCR Mayoría de la polimerasa de ADN de genes [10]. En todos los gammaherpesviruses, la polimerasa de ADN de genes (ORF 9) está flanqueado por aguas arriba ORF 8, la glicoproteína B, el más altamente conservadas en la glucoproteína herpesviruses y abajo por ORF 10, un gen conservado en el gammaherpesviruses con función desconocida (Figura 11]. CODEHOPs fueron diseñados conserva secuencia de los bloques presentes en ORF 8 - "FREYA" y "GGMA" y en el ORF 10 "GDWE2B" (Tabla 4]. Mediante una combinación de genes primers específicos obtenidos a partir de la secuencia de ADN obtenido por encima de la polimerasa y la nueva CODEHOPs derivados de las regiones de acompañamiento, la superposición de los productos que abarcan la PCR de 331 bp genes de la glicoproteína B, 3039 bp de la ADN polimerasa los genes, y 27 pb de la ORF 10 gen homólogo fueron obtenidos para RFHVMn y RFHVMm [10].

Uso de la estrategia para caracterizar CODEHOP regiones genómicas novela dentro de los genomas virales

A menudo, el orden lineal de los genes dentro de los genomas de los virus relacionados se mantiene. Así, el espaciamiento y la orientación de los genes específicos se puede predecir en los genomas de los virus relacionados con la novela. CODEHOP PCR primers se puede utilizar para obtener las secuencias de los genes se conserva dentro de una perspectiva centrada en que el flanco región genómica. Gene-PCR primers específicos derivados de estas secuencias pueden utilizarse en el largo alcance de PCR para obtener la secuencia genómica de toda la región entre los genes de acompañamiento. Hemos utilizado este método para clonar y caracterizar una parte de la divergencia de locus B del genoma de los macacos rhadinovirus, RFHVMn [11]. Divergentes locus B fue identificado en HVSK y otros rhadinoviruses y contiene una serie de virus homólogos de los genes celulares que han sido capturados durante el virus de la evolución [27]. Parte de la divergencia de locus B, de HVSK se extiende aguas arriba de la ORF 9 DNA polimerasa viral a un gen homólogo de la thymidylate sintasa (TS) gen situado aproximadamente 4 kb de distancia (Figura 12A]. TS es un celular y un gen funcional pseudogen no está presente en los seres humanos. Viral TS homólogos están bien conservados y se encuentran en varios herpesvirus especies, incluyendo HVSK, VZV, EHV2, HVS y AtHV3. Para caracterizar el locus B putativo divergentes entre la ADN polimerasa y TS RFHVMn de genes, centrado en la TS gen de amplificación de PCR utilizando el enfoque CODEHOP.

Dos bloques conservados de aminoácidos dentro de la familia de genes que contienen TS 10 y 11 aminoácidos idénticos fueron elegidos como candidatos para CODEHOP diseño. Los 10 aminoácidos "RHFG" motivo aguas arriba (Fig. 13] es totalmente conservado entre las secuencias virales, la humana y la secuencia humana TS pseudogen. Los 11 aminoácidos "DMGL" abajo motivo (Fig. 13], mientras que se conserva por completo entre las secuencias virales y humanos no está presente en el celular TS pseudogen (datos no presentados). Desde los dos motivos en el celular TS gen están separados unos de otros por un gran intrón, CODEHOP mediante amplificación por PCR de ADN que contiene una mezcla de ADN viral y celular sólo debe producir un virus específicos de ~ 280 pb producto PCR (Fig. 12B].

El diseño de la "DMGLB" CODEHOP conservadas de la "DMGL" motivo se muestra en la Figura 14. Esta cartilla fue diseñado antes de que el programa fue CODEHOP predicción disponibles. RFHVMn porque está estrechamente relacionado con el gammaherpesvirus, HVSK, el "DMGLB" CODEHOP fue sesgada hacia gammaherpesviruses, en particular-como HVSK herpesviruses, con el fin de orientar la RFHV genomas. En la Figura 14, la codificación de las secuencias de nucleótidos "DMGL" motivo de la TS genes de HVSK, HVS y EHV2 se multiplican alineado con la secuencia de aminoácidos codificados. Porque "DMGL" fue el motivo de abajo, el "DMGLB" CODEHOP fue diseñado para ser antisentido, sin embargo, la secuencia complementaria de la cartilla se muestra para identificar los codones (Figura 14]. Así, el núcleo de la degenerar CODEHOP abarca los codones para el ácido aspártico (D), metionina (M), glicina (G), y leucina (L), de los motivos, y está indicado en las minúsculas en la Figura 14B. El degenerar ofrece todas las posibilidades básicas de los codones de estos cuatro aminoácidos conservados y, por lo tanto no tiene ningún sesgo. Sin embargo, los nucleótidos dentro de la región de consenso, que se muestra en la capital de las letras, se elijan en cada codón condiciones de ser similar a la secuencia de HVSK (resaltada en la Figura 14A], con lo que el primer sesgar hacia HVSK-como secuencias.

El TS orientados CODEHOPs "DMGLB" y "RHFGA" (véase cuadro 5] se utilizaron en la reacción de amplificación de PCR con el ADN aislado de fibromatosis retroperitoneal (RF) de un tumor de tejidos de cerdos macacos de cola, Macaca nemestrina, tal y como se describe anteriormente [10 ]. Un producto de la PCR predice tamaño (280 pb) y se obtuvo clonado y secuenciado, véase la Fig. 12B. La secuencia fue de 68% idéntica a la secuencia HVSK TS y el 64% idéntica a la secuencia de TS RRV, una más alejadas gammaherpesvirus. TS-Un ejemplo concreto, TSR1LR, se derivan de esta secuencia y una ADN polimerasa específica ejemplo, PolF1LR, fueron escogidos para amplificar la región entre la ADN polimerasa y de los genes TS RFHV (Cuadro 5 y Figura 12B]. De largo alcance mediante amplificación por PCR produjo un producto de PCR ~ 4,1 kb que fue secuenciado. El orden y la secuencia lineal de 5 nuevos genes presentes en la diversidad de la región B RFHVMn virus se obtuvo (Figura 12C]. Aunque RFHV B de la región carecían de un homólogo de HVSK ORF 11, homólogos de todos los demás HVSK genes en esta región estaban presentes y en el mismo orden en el genoma [10].

CODEHOP mediada por PCR - un enfoque general para identificar nuevos genes virales

En las secciones anteriores de esta revisión y la CODEHOP ensayos de PCR primers que hemos utilizado para la identificación y caracterización de nuevos genes y genomas herpesvirus han sido discutidos en detalle. Sin embargo, CODEHOP mediada por PCR se puede utilizar también para orientar conservados genes de otros virus de la familia. Un diagrama de flujo general que detalla las medidas concretas que participan en la CODEHOP procedimiento para identificar nuevos genes virales se muestra en la Figura 15. Este procedimiento se basa en la predicción CODEHOP software que hemos desarrollado anteriormente, y accesibles a través de Internet como parte de la base de datos BLOQUES [2]. Un ejemplo de este procedimiento se ofrece a continuación cuando CODEHOP PCR primers dirigidos a la "DMGL" motivo de herpesvirus TS genes (introducido más arriba) han sido diseñados utilizando el software basado en la web.

Usando el software basado en la Web para diseñar CODEHOP PCR primers conservadas a un gen viral

Las secuencias de aminoácidos de los genes de cinco TS herpesviruses se obtuvieron utilizando BLAST análisis de la base de datos NCBI proteína con la secuencia como HVSK TS sonda. El TS secuencias de HVSK, VZV, EHV2, HVS y AtHV3 (Figura 16] se presentaron como aporte a ClustalW [28] y un alineamiento múltiple se obtuvo. Como se muestra en la figura 13, de varias regiones muy conservadas las secuencias están presentes en la secuencia TS alineación, y las posiciones de la "RHFG" y "DMGL" motivos dirigidos se indican más arriba. Con el fin de predecir CODEHOP PCR primers, de las secuencias de los genes TS se proporcionaron como insumo para el BlockMaker programa de la base de datos de bloques [4] y una serie de bloques de secuencias conservadas fueron identificados (por ejemplo, Gibbs bloques, la figura 17]. Alternativamente, la ClustalW alineación, en sí, se podría prestar, como aporte a la "alineación de procesador múltiple" de la base de datos de los bloques [29]. Con el fin de comparar un ordenador con el predicho CODEHOP manualmente derivados CODEHOP (DMGLB), el TS Block_E que contiene la "DMGL" motivo (Figura 17] fue directamente a la entrada de CODEHOP programa [3] utilizando todos los valores por defecto, salvo que el consenso Región fue alargada por el aumento de la temperatura de ajuste en el valor predeterminado de 60 ° Ca 70 ° C Los primers previsto desde el complemento de Block_E fueron examinados con el fin de obtener un primer capítulo de los complementos que se pueden utilizar en conjunción con el primer RHFGA TS aguas arriba, se ha descrito anteriormente. El primer tipo de orientación subrayó la "DMGL" motivo se ha elegido y llamado DMGLXB (Figura 18] y se comparó con el manual diseñado DMGLB ejemplo en la figura 14. Considerando que "DMGLB" fue deliberadamente sesgados por el uso de secuencias de HVSK en el 5 'pinza consenso, la "DMGLXB" es "imparcial" en el diseño con el 5' consenso derivado de la secuencia de uso más frecuente codones en el genoma humano. La secuencia DMGLXB se examinó el potencial para detener bucle estructuras que puedan comprometer la función de la cartilla. Como se muestra en la figura 14, un putativo tallo-bucle estructura se identificó que se indica mediante el subrayado nucleótidos en la Figura 14B y 14C. Para desestabilizar esta estructura, la prolina en el codón "DMGLGVP" motivo se cambió desde el ordenador predijo "CCC", el codón de uso más frecuente en los seres humanos, a la "evaluación común", otro codón común de la humanidad, como se muestra en la Figura 14 . Esto arrojó una CODEHOP revisado, llamado "DMGLX1B" (que se muestra como la secuencia complementaria en las Figuras 14B y 14C], en la que el tallo-bucle estructura fue desestabilizado por la sustitución de una A de la C de relieve en la figura 14C. El primer DMGLX1B antisentido podría ser utilizado en combinación con el primer RHFGA sentido desconocido para amplificar los genes TS.

Otros ejemplos de CODEHOP PCR primers diseñados desde múltiples alineaciones de los herpesvirus DNA polimerasa usando las secuencias basadas en la Web CODEHOP software se muestra en las figuras 3, 4, 5, 6. El primer VYG1A diseñado a partir de la conserva VYG motivo muestra en la Figura 3 se ajusta a la original diseñada manualmente "TGV" y "VYGA" primers. La computadora-predice "YGDTB" diseñados desde el primer conservadas GDTD motivo está alineado con el original "IYG" y "GDTD1B" primers (Figura 4]. En la predicción de este ejemplo, la secuencia de bloques conservados identificados por BlockMaker secuencias de la muestra en la figura 4A, cursó sólo desde el aminoácido 1 - 10, que era el límite de la secuencia conservada bloque determinado por BlockMaker. El software CODEHOP indicó la necesidad de añadir los nucleótidos adicionales a los 5 'finales de la "YGDTB" cartilla para obtener la longitud mínima para el 5' consenso región de la cartilla. Como tal, las secuencias de aminoácidos de las posiciones de bloque 11-13 se obtuvieron manualmente y en comparación con el fin de obtener los ocho nucleótidos de la terminal "YGDTB" (overlined en la Figura 4C].

Conclusión

En esta revisión, la utilidad de CODEHOP mediada por PCR para la identificación de nuevos virus y la caracterización de nuevos genes y genomas virales regiones se presenta. Si bien el objetivo de este estudio fue el de la familia herpesvirus, virus de otras familias pueden ser fácilmente dirigidos utilizando métodos análogos. Hemos desarrollado con éxito anteriormente CODEHOP ensayos dirigidos a los genes de la transcriptasa inversa de los retrovirus y lentiviruses [2, 6]. Recientemente, el CODEHOP estrategia se ha utilizado para desarrollar nuevos ensayos para detectar el virus del papiloma orientación muy conservadas proteína L1 [30]. Con la CODEHOP estrategia, la secuencia de datos moleculares pueden ser fácilmente obtenidos de las filogenias completa de virus y búsqueda de las vías de evolución. Además, la comparación de múltiples representantes de las proteínas homólogas viral puede ser de importancia para la comprensión de la estructura y función de proteínas y proporcionó detalles sobre las relaciones virus-huésped.

Lista de las abreviaturas

CODEHOP, el consenso de degenerar oligonucleótido primer híbrido; PCR, reacción en cadena de polimerasa; RFHV, fibromatosis retroperitoneal herpesvirus; HVSK, sarcoma de Kaposi asociado-herpesvirus.

Conflicto de intereses

Los autores declaran que no tienen intereses en conflicto.

Contribuciones de los autores

Diseño, la concepción y la preparación del manuscrito (TMR).

Agradecimientos

El autor desea dar las gracias a Emily Schultz, Greg Bruce, Lin Bennet, Brian Raden, Jon Ryan, y Kurt Strand por su ayuda en el desarrollo de la estrategia CODEHOP PCR, Jorja y Steve Henikoff, del Fred Hutchinson Cancer Research Center, de la creación Y el mantenimiento de la CODEHOP de software y sitios web, y Jeannette Stahli asesoramiento para la edición.