Comparativo de la secuencia de cartografía de base y la estructura basada en dominios de la proteína
Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons License (http://creativecommons.org/licenses/by/2.0], que permite el uso irrestricto, la distribución y reproducción en cualquier medio, siempre que la obra original sea debidamente citada.
Proteína dominios han sido durante mucho tiempo un concepto mal definido en la biología. Ellos son generalmente descritos como unidades autónomas plegable con independencia funcional y evolutivo. Ambos basados en la estructura y secuencia de dominio basado en las definiciones han sido ampliamente utilizados. Pero si este tipo de modelos por sí solo puede capturar todas las características esenciales de los dominios es todavía una cuestión abierta.
Aquí nos brindan una idea de hacia definiciones de dominio a través de la cartografía comparativo de dos bases de datos de dominio de la clasificación, basada en una secuencia (Pfam), y la otra estructura de base (SCOP). Una cartografía de puntuación está definido para indicar la importancia de la cartografía, y las propiedades de la cartografía de las matrices se estudian.
Los resultados de los mapas muestran un acuerdo general entre las dos bases de datos, así como numerosas e interesantes áreas de desacuerdo. En los casos de desacuerdo, las funcionales y las características de la evolución de los dominios son examinados para determinar que la definición de dominio es biológicamente más informativo.
El concepto de dominios de la proteína ha ganado cada vez más interés por parte de la comunidad de investigación de biología por su importancia en la clasificación de proteínas [1], la asignación de funciones de proteínas [2], y la ingeniería de proteínas [3]. Proteína dominios son generalmente considerados como fragmentos de proteínas de estructuras comunes que pueden independientemente veces [4] o tienen sus propias funciones [5]. También han sido tratados como unidades evolutivo [6]. Proteína dominios de la función como bloques de construcción de proteínas y son frecuentemente a fin de formar diferentes proteínas [5], con lo que un alto redundancia en las estructuras de las proteínas. Actualmente, unos pocos miles de dominios de la proteína se han identificado un total mucho menor que el número de proteínas. Clasificación de las proteínas sobre la base de sus dominios constituyente es, por tanto, uno de los más eficaces y eficientes métodos para organizar los datos de proteínas tanto por las estructuras y por las relaciones evolutivas. Sin embargo, dicha clasificación exige la identificación de dominio de la composición de proteínas, que no es en absoluto una tarea fácil. El reto radica en la ambigüedad de las definiciones de dominio, así como la falta estructural de información útil acerca de la mayoría de las proteínas.
Dos tipos de métodos han sido ampliamente utilizados para asignar dominios: uno basado en las tres dimensiones (3D) de estructuras de las proteínas y otro basado en secuencias de proteínas. Estructura definir enfoques basados fundamentalmente de los dominios de la compacidad y la conservación de las proteínas estructurales de las regiones, por lo general se describe como globulares módulos. La anotación de dominio se logra mejor a través de un experto de la inspección visual de la proteína en tres dimensiones de estructuras. Actualmente, el Protein Data Bank (PDB) [7], la principal proteína estructural de base de datos, contiene 26610 estructuras de proteínas. Una serie de la estructura de base de dominio de las bases de datos tales como clasificación SCOP (Clasificación Estructural de Proteínas) [1], FSSP (Familias de proteínas estructuralmente similares) [8], y CATH (Clase Arquitectura topológico Homología) [9] se construyen utilizando el disponible Estructuras de proteínas para que las proteínas pueden ser fácilmente analizó la presencia de los dominios. Entre ellas, la SCOP comisariada base de datos manualmente y es considerada como la más fiable de dominio de la clasificación. Sin embargo, esta clasificación cubre sólo alrededor del 2-3% de las proteínas secuenciadas. En este momento, el suizo-Prot + TrEMBL [10] junto secuencia de las bases de datos contienen más de 1,5 millones de entradas. La brecha entre el número de secuencia de proteínas y la de proteínas con determinado experimentalmente en 3D de estructuras aún está en aumento, lo que ha limitado el desarrollo de la estructura basada en la proteína de clasificación de las bases de datos. Aunque el 58% de las secuencias pueden ser modelados usando el modelado comparativo [11], la exactitud de tales modelos comparativos disminuye drásticamente por debajo del 30% de identidad de secuencia de corte. Una alternativa esquema de clasificación asigna a los dominios de las proteínas sólo por la secuencia de la información. Secuencia de base de dominio de las bases de datos construidas con este esquema de clasificación incluyen Pfam [12], ProDom [13] y de InterPro [14]. Estas bases de datos definir los dominios basados en la similitud de secuencia implícitas y relaciones evolutivas. En este manuscrito nos centramos en la base de datos Pfam dominio en el que las fronteras son asignadas manualmente por expertos.
Dado que los dominios son estructuralmente y evolutivamente unidades independientes, podemos preguntarnos si bien una estructura de base o secuencia basada en la clasificación por sí sola es suficiente y que tan bien están de acuerdo. Un estudio comparó la estructura basada en tres clasificaciones: SCOP, CATH y FSSP [15], y llegó a la conclusión de que la mayoría de sus clasificaciones de acuerdo. Dos secuencia de las bases de datos de dominio se basa también en comparación [16] y de las discrepancias entre las dos bases de datos se atribuyeron a sus diferentes filosofías. En este trabajo, nos esforzamos por mejorar las definiciones de dominio a través de la correspondencia entre el examen de la secuencia de base y la estructura de dominios basada en dominios, utilizando el dominio de las definiciones en la SCOP en calidad de representante de la estructura y las de los dominios Pfam como representante de la secuencia de los dominios. Elofsson y Sonnhammer [17] compararon la SCOP Pfam y bases de datos en 1999. De acuerdo con su comparación, el 70% de la SCOP de dominio de las familias y el 57% de las familias tienen Pfam homólogos de las otras bases de datos. Sin embargo, desde entonces, tanto las bases de datos han aumentado de tamaño y de diversas revisiones y actualizaciones se han hecho. Por ejemplo, el dominio de la representación en Pfam se revisó a la modelo discontinuo dominios [12]. Por lo tanto, ahora es oportuno e importante volver a examinar este tema y comparar los dos tipos de dominios bajo el nuevo valor. Además, el objetivo de esta comparación es, en cierta medida, diferente de lo que había Elofsson y Sonnhammer. Aparte de examinar la medida en que la superposición de dos bases de datos, nos centramos más en sus diferencias. Cuando incongruencias en las definiciones de dominio se produce, se propone determinar qué definición de dominio es biológicamente más significativa por la inspección de la evolución de los dominios.
Estamos mapa SCOP directamente a los dominios Pfam dominios basados en sus correspondientes ubicaciones en las secuencias de sus miembros. El enfoque asigna una puntuación de la cartografía a la par de dominios en virtud de la comparación cuantitativa de la calidad de representar el partido.
El mapeo revela una moderada Pfam acuerdo entre las familias y las familias de dominio de la SCOP. Cinco tipos de relaciones entre las dos clasificaciones se indican claramente en los resultados de los mapas y que, por lo tanto, ponerlos en cinco categorías. Análisis estadístico de los datos y casos individuales se ofrecen para cada categoría de la cartografía. En el caso de desacuerdo en la clasificación de dominio, información de los últimos literatura, conocida como dominio de las funciones, se utiliza como validación externa. También proponemos examinar la historia evolutiva de cada dominio, cuando se produce desacuerdo.
El SCOP [1] es la base de datos manualmente comisariada por expertos. No todas las órdenes de proteínas con estructuras conocidas, en función de su evolución y de las relaciones estructurales. La base de datos adopta una organización jerárquica: los dominios se agrupan en familias, entonces superfamilies, pliegues y de las clases en el nivel más alto de la jerarquía.
Pfam [12] contiene ocultos de Markov modelo basado en perfiles (HMM-perfiles), de muchas de las proteínas sobre la base de múltiples dominios secuencia de alineaciones. Si bien la construcción de los perfiles-HMM es semi-automático, aporta los conocimientos de los expertos en la agrupación de las proteínas, la alineación de secuencias de proteínas, y el control de calidad de los perfiles-HMM. Aunque Pfam es subclassified por «tipo» en el año 2002 como 'la familia', 'dominio', 'repetir' y 'motivo', la organización se considera generalmente que es plana. Estamos, por lo tanto, no distinguen los subtipos en esta comparación.
Pfam La base de datos contiene dos partes: una es la sección llamada comisariada Pfam-A, y el otro se genera automáticamente suplemento llamado Pfam-B que representa a las pequeñas familias PRODOM tomado de la base de datos que no se superponen con Pfam-A. En este estudio, sólo Pfam-A las familias se asignan a la SCOP dominio familias.
Todas las secuencias de la proteína APP, en base a AP SEQRES registros, con menos del 95% de identidad a los demás fueron descargados de la ASTRAL Compendio [18, 19]. Este conjunto de datos contiene 8259 cadenas de proteínas. Pfam 14,0 fue descargado de http://pfam.wustl.edu/. Sólo Pfam-A las familias se utilizaron para la comparación. Esta versión contiene 7459 Pfam-A las familias y los correspondientes perfiles-HMM. El HMMER paquete, la versión 2.3.2, se utilizó para comparar secuencias de la proteína APP a Pfam-A-HMM perfiles. El Pfam 'de confianza de corte' se utiliza para determinar si un dominio de Pfam coincide con una cadena de AP. El SCOP dominio definiciones eran de la SCOP parsable archivos de la versión 1,65. Debido a que la SCOP parsable archivos se basan en la AP ATOM actas, el ATOM registros fueron asignadas a AP SEQRES registros, utilizando la cartografía facilitada por la RAF ASTRAL antes de la comparación.
Proponemos el mapa Pfam-A las familias a la SCOP dominio familias sobre la base de sus lugares de miembro secuencias. Pfam-A cada familia o SCOP dominio familia es tratada como un conjunto de secuencias de proteínas miembro. Un mapeo entre un familiar y un Pfam SCOP dominio de la familia se define como sigue: (1) que tienen al menos un miembro de secuencia de proteínas en común, (2) su ubicación en la superposición de secuencias de la proteína común, y (3) su puntuación es la cartografía Mayor que el umbral predefinido m. Para cada secuencia de la proteína APP, la comparación se hizo para las superposiciones y diferencias en el SCOP de dominio de las familias y la Pfam familias. El proceso de mapeo se ilustra con la Figura 1.
Idealmente, si un dominio SCOP Pfam familia y una familia son definidos en el mismo lugar en el mismo conjunto de cadenas de proteínas, entonces el mapa exactamente los unos a los otros. Sin embargo, en la mayoría de los casos, la cartografía no es exacta, es decir, que sólo en parte se superponen a los distintos miembros de proteínas o secuencias de las secuencias de sus miembros no son todas iguales. Con el fin de medir el grado de superposición, una cartografía de puntaje es asignado a cada par de la SCOP de dominio de las familias y Pfam familias. Intuitivamente, si el SCOP de dominio de la familia y la Pfam miembros de la familia tienen más en común y sus correspondientes proteínas secuencia de los segmentos se superponen más, entonces es más probable que deben correlacionarse con los demás. Sin embargo, esta cartografía de los criterios favorece a los dominios cuyas frecuencias son altas. Desde que usamos sólo las cadenas de la proteína APP en la cartografía comparativa, este conjunto de datos pueden estar sesgados hacia los intereses de las proteínas a los biólogos o cuyas estructuras son más fáciles de resolver. Para ambos modelos de dominio, se observa un poder de dominio de la ley de distribución de frecuencias, donde algunos dominios se produce en un gran número de secuencias de proteínas y muchos dominios se producen en muy pocas secuencias de la proteína. Para tener en cuenta las frecuencias de dominios, la cartografía está normalizado por la puntuación media de la frecuencia de los dos dominios en virtud de la comparación. Let s i denota el i-ésimo dominio de la proteína en la SCOP y la f j j-ésimo dominio de la proteína en Pfam. La cartografía Resultado M (s i, j f) se define como
Donde P representa el conjunto de cadenas de la proteína APP con tanto dominio y dominio s i f j p k es el kth kth proteína cadena en el conjunto; superposición (
La cartografía de las puntuaciones de todos los SCOP y Pfam dominio pares forman una matriz M. La matriz de representación de la cartografía tiene algunas buenas propiedades. En primer lugar considerar la cartografía de la SCOP dominio s i Pfam posible a todos los dominios. Nos fijamos en la i-ésima fila de M. El número de nonzeros,
Tenga en cuenta que el número de nonzeros,
Siguiente considerar el levantamiento de mapas de dominio de Pfam f j a todos los posibles dominios de la SCOP. Echemos un vistazo a los j-ésima columna de M. El número de nonzeros,
El umbral m se utiliza de nuevo para reducir la cartografía insignificante.
Un total de 2081 familias Pfam y 2512 SCOP dominio familias están definidas en el conjunto de 8259 las cadenas de la proteína APP. El promedio lengthes de Pfam familias y SCOP dominios son 96 y 174 los residuos, respectivamente. El umbral m para trazar el mapa de resultados se ha establecido que se empíricamente 0,01 a la cartografía de incluir la mayor cantidad posible de aquí, porque incluso una pequeña parte de la superposición puede ser informativa.
De los resultados de los mapas, 2008 (80%) SCOP dominio superposición familias con al menos un Pfam familia, y estas familias dominio SCOP corresponden a 2075 (99,7%) de la Pfam familias. En promedio, cada SCOP dominio mapas a 1,3 Pfam familias, y cada uno de Pfam dominio mapas a 1,0 SCOP familias. Este resultado es esperado, porque son los dominios Pfam general de 16% más corta que la SCOP dominios. Las longitudes de dominios de la proteína en la SCOP se enfrenta a los de la correspondiente Pfam familias en la Figura 3. Una quinta parte (504) de la SCOP de dominio de las familias no tienen Pfam homólogo, mientras que sólo seis (0,03%) Pfam familias no están asignadas a la SCOP dominio de las familias (Tabla 1]. Más análisis revela que todos los segmentos de la secuencia correspondiente a la unmapped Pfam familias representan regiones de los residuos que estaban ausentes en las estructuras de la AP. Es decir, todas las familias con Pfam conocido AP estructuras mapeadas en al menos un dominio de la SCOP familia. No está claro por qué el 20% de la SCOP de dominio de las familias no se corresponden con ninguna Pfam familia. Una posible explicación es que la hay muy pocos ejemplos de los que la SCOP de dominio a las familias a construir perfiles-HMM para Pfam familias.
Varios tipos de secuencia de la estructura de dominio de las relaciones emerge durante los años de estudio, incluyendo:
• Una familia SCOP dominio mapas exactamente a un Pfam familia, en que el SCOP de dominio de la familia y la familia se superponen con Pfam y sólo entre sí. Sin embargo, las secuencias de sus miembros y sus coberturas en cada secuencia puede variar ligeramente.
• Una familia SCOP dominio mapas a Pfam muchas familias, en donde cada uno de los miembros de la secuencia, la cobertura de la SCOP de dominio de la familia corresponde a la suma de los correspondientes Pfam familias.
• Muchas familias SCOP dominio mapa Pfam a una familia, donde cada uno de los miembros de la secuencia, la cobertura de la familia Pfam corresponde a la suma de los correspondientes SCOP dominio familias.
• Una familia SCOP dominio mapas a Pfam conjuntos de las familias, donde el SCOP de dominio de la familia corresponde a una Pfam familia en cada uno de los miembros de secuencia, pero a diferentes familias en diferentes Pfam miembro secuencias.
• Fija de la SCOP de dominio a familias de ruta Pfam una familia, donde la familia Pfam SCOP corresponde a un dominio de la familia en cada uno de los miembros de secuencia, pero a diferentes familias de dominio de la SCOP en diferentes secuencias miembro.
Ejemplos de cada tipo se incluyen en la Tabla 2. Se presenta a continuación un análisis detallado de nuestros resultados.
La base de datos Pfam emplea una organización plana, con un 'Tipo' anotación asigna a cada familia. La anotación es, en cierta medida, similares a los niveles de organización jerárquica en la SCOP. Clanes se han introducido en Pfam para reflejar la evolución de la relación entre las diferentes familias. Cada clan contiene dos o más Pfam familias que han surgido a partir de un único origen evolutivo. Sin embargo, Pfam liberación 14,0 contiene sólo 15 clanes que cubre menos de 100 familias Pfam. Con nuestros resultados de los mapas comparativos, la SCOP jerarquía puede utilizarse para ayudar a generar los clanes Pfam. Por ejemplo, cuando uno SCOP dominio de la familia está asignada a Pfam conjuntos de las familias, una fuerte conexión / relación entre los dominios Pfam puede ser implícita. Un clan puede inferirse de los Pfam familias. Por lo tanto, nuestros resultados en comparación con la existente Pfam clanes. Tabla 4 enumera los miembros de las familias existentes en Pfam clanes y sus correspondientes dominios de la SCOP. Sólo la lista de 10 en lugar de 15, porque la mayoría de los otros cinco contienen Pfam familias no se utiliza en la comparación. Como se puede verse en el cuadro, los miembros de un clan por lo general corresponden a una familia o un SCOP SCOP superfamilia. Por lo tanto, creemos que los resultados de la cartografía comparativa podría ser útil en la construcción de Pfam clanes.
Los dominios son considerados evolutivamente unidades independientes, la evolución y la historia de cada dominio se espera que sea característico. Similar dominio evolutivo historias pueden indicar las relaciones entre los dominios. Por lo tanto, proponer el uso de correlación en la evolución de dominio para validar las definiciones de dominio de Pfam y SCOP, en el caso de desacuerdo.
Tan et. Al haber diseñado una herramienta para calcular las similitudes entre las proteínas de la historia evolutiva [23]. Este enfoque puede ser ligeramente modificada para adaptarse a nuestras necesidades para determinar las semejanzas entre los dominios de la historia evolutiva. Se define la correlación evolutiva entre dos dominios como el promedio de correlación entre parejas de secuencias de sus miembros. La correlación entre dos segmentos de la secuencia se define como el coeficiente de correlación de Pearson de la distancia evolutiva matrices de las dos secuencias. Se calcula utilizando los siguientes pasos. En primer lugar, Blastp se usa para encontrar las secuencias de la proteína ortólogos en dos series de los genomas; bacterias y eucariotas. El conjunto de datos contiene bacterias las proteínas de los genomas de dieciocho especies: ADP1 Acinetobacter sp, Fusobacterium nucleatum, Nitrosomonas europaea, Vibrio parahaemolyticus, Bacillus anthracis Ames, Geobacter sulfurreducens, Pyrococcus abyssi, Xylella fastidiosa, Campylobacter jejuni, Helicobacter hepaticus, Rickettsia conorii, Yersinia pestis KIM, Deinococcus radiodurans, Lactococcus lactis, Streptococcus pyogenes, Escherichia coli K12, Methanosarcina mazei, y Thermotoga maritima. Eucaryotic El conjunto de datos contiene secuencias de proteínas del genoma de nueve especies, incluida la Arabidopsis thaliana, Encephalitozoon cuniculi, Plasmodium falciparum, Caenorhabditis elegans, el Homo sapiens, Rattus norvegicus, Drosophila melanogaster, Mus musculus, y Saccharomyces cerevisiae.
En segundo lugar, para cada especie, la ortólogos secuencia de la proteína con la más alta E-valor es seleccionado (en caso de un importante existe). En tercer lugar, ClustalW que se utiliza para alinear estas secuencias. En cuarto lugar, el coeficiente de correlación de Pearson de las matrices de la cartografía se calcula con la ecuación 3, que representa la correlación entre la correspondiente secuencia de par.
Donde N es el número de especies en las que las secuencias se recuperaron ortólogos, S y P N × N son matrices de distancia ClustalW adaptación de la secuencia de los segmentos en la SCOP Pfam dominio de las familias y las familias, respectivamente. La correlación entre dos dominios se expresó como:
Donde abs (x) da el valor absoluto de x, y N i y j son N el número de miembros de las secuencias para dominios i y j, respectivamente.
Esta correlación mide la relación de los dos dominios. Su valor va de 0 a 1, donde 1 significa 100% de similitud en los dos dominios' evolutivo historias y 0 significa que no hay similitud. Ahora tenemos que determinar el umbral más bajo de lo que indica la correlación co-evolución. Aleatoriamente seleccionar dos Pfam familias y calcular su correlación. Del mismo modo, el azar correlación entre dos dominios de la SCOP se calcula. Las distribuciones de las correlaciones se muestran en la Figura 11.
Cuando varias familias Pfam se asignarán a un dominio de la SCOP, se computa la evolución de la correlación de estas familias Pfam. La correlación puede sugerir Pfam si esas familias deberían ser fusionados o no. Si dos dominios residir en el mismo conjunto de secuencias en las proximidades inmediatas y comparten el mismo conjunto de características de la evolución, entonces proponemos los dominios deben ser considerados como co-evolucionado y tratados como un único dominio más grande. Así, las definiciones de dominio puede depender de la relación evolutiva historias.
En este artículo se examina la comparativa de la estructura de la cartografía de base a la secuencia de los dominios basados en los dominios con el fin de abordar la cuestión de cómo cada uno de estos modelos individual capta la evolución, las características estructurales y funcionales de proteínas dominios. El propósito último de nuestra cartografía comparativa es dar una idea de las definiciones de dominio de la proteína.
El uso de las definiciones de dominio de la SCOP y Pfam, estudiamos los dos tipos de definiciones de dominio de unos a otros utilizando información de la ubicación de su dominio en cada instancia. Cartografía resultados ponen de manifiesto un acuerdo general entre los dos tipos de dominio de las definiciones. Para analizar más el problema, presentamos varias subcategorías (uno / muchos SCOP dominio a uno / muchos Pfam dominio, y viceversa), y ofrecer estudios detallados de la cartografía, usando ejemplos de cada categoría.
En la subcategoría de uno a la SCOP / Pfam de una cartografía, la cartografía a menudo no es perfecto: los dos dominios se superponen sólo parcialmente. El análisis demuestra que alrededor de un 62% de los casos de uno-a-uno de acuerdo sobre el 90% o más de su cobertura. Las diferencias son por lo general en el dominio de las fronteras. Este resultado sugiere que la historia evolutiva de la región cartografiada unmapped frente a la región puede ser examinada para ver la forma en que esas porciones son unmapped evolutivamente relacionados con la región asignada.
En muchos casos, un dominio de la SCOP familia está asignada a una serie de repeticiones de un Pfam familia. Estas familias Pfam, como LRR, tienen más probabilidades de dominio de los componentes sin las propiedades estructurales de los dominios. Por lo tanto, le sugerimos Pfam eliminar esas familias. Los resultados de los mapas también puede ser utilizado para inferir la clasificación a la SCOP dominio de las familias que no pertenecen a la verdadera clases (las clases de más de 7). Por ejemplo, en los casos en que un conjunto de la SCOP dominios son asignados a una familia Pfam, estructurales y funcionales se sugieren relaciones entre el conjunto de la SCOP dominios. Esta información puede ser útil para la asignación de dominios a la SCOP cierto SCOP clases. Por otra parte, la base de datos Pfam emplea una organización plana y no indica la relación entre las familias Pfam. Aunque Pfam presentó clanes para reflejar la relación entre las diferentes familias, los clanes de las necesidades de fomento de las aportaciones de los expertos y como consecuencia de ello, sólo el 15 clanes en Pfam liberación 14,0. Nuestra comparación de los resultados de los mapas con los clanes Pfam mostraron que los miembros de un clan por lo general corresponden a una familia o un SCOP SCOP superfamilia.
Por lo tanto, la comparativa resultados de los mapas se pueden utilizar para ayudar a generar los clanes Pfam. Tal vez lo más interesante, agudo varios desacuerdos entre SCOP dominio Pfam familias y las familias se han descubierto y estudiado con cierto detalle. Además de los exámenes de dominio de las familias mediante el análisis filogenético sería beneficiosa. Hemos propuesto la utilización de evolución de correlación entre dominios para medir la aptitud de dominio de la clasificación. Es evidente que más estudios sobre estas diferencias son necesarias y futuras pueden ser objeto de investigación en este ámbito.
SSR concebido y coordinado el estudio. YZ participado en el diseño del estudio, aplicando los métodos de cartografía de la comparativa, realizada los datos y los análisis estadísticos, así como el manuscrito redactado. SSR, CMM, CD y participó en el diseño experimental, y editado en el proyecto final del manuscrito. Todos los autores leído y aprobado el manuscrito.
Este trabajo fue financiado en parte por subvenciones de los EE.UU. Departamento de Energía, la Oficina de Investigación Biológica y la Oficina de Energía de la Oficina del Laboratorio de Políticas y de Infraestructura, a través de un LBNL LDRD, en virtud del contrato N º DE-AC03-76SF00098. CMM fue apoyado por el NIH subvención 1-P50-GM62412. Damos las gracias a Hui Xiong Xiaofeng Él y útil para los debates.