Conserved Domain Database

A Conserved Domain Database ou CDD (Base de datos de Dominios Conservados) é unha base de datos de modelos de aliñamentos de secuencias múltiples ben anotados e modelos de busca en bases de datos derivados, de dominios proteicos antigos evolutivamente e proteínas completas.^[1] Entre os contidos da CDD están os modelos de dominios curados manualmente do NCBI e modelos de dominios importados de varias bases de datos de fontes externas (Pfam, SMART, COG, PRK, TIGRFAMs). É característico dos dominios curados polo NCBI que usen información de estruturas en 3D para definir explicitamente as fronteiras entre dominios, aliñar bloques, emendar detalles de aliñamentos, e proporcionar unha panorámica das relacións entre secuencia, estrutura e función. Os modelos curados manualmente están organizados xerarquicamente cando describen familias de dominios que están claramente relacionados por teren un antepasado común. Para que os datos non sexan redundantes, a CDD agrupa os modelos de dominios procedentes de varias fontes en superfamilias.

A CDD forma parte do NCBI.

Obxectivos editar

Os dominios poden considerarse como as unidades estruturais ou funcionais dunha proteína. Estas dúas clasificacións (estrutural e funcional) coinciden bastante a miúdo, e o que se descobre independentemente como unha unidade de pregamento dunha cadea polipeptídica, ten tamén unha función específica. Con frecuencia os dominios identifícanse como unidades recorrentes de secuencia ou estrutura, que poden existir en varios contextos. Na evolución molecular ditos dominios puideron ter sido utilizados como bloques de construción de proteínas, e puideron terse combinado de diferentes maneiras para modular a función da proteína. A CDD define os dominios conservados como unidades recorrentes na evolución molecular, cuxa extensión pode determinarse pola análise de secuencias e estruturas.

O obxectivo do proxecto de curación de dominios conservados do NCBI é proporcionar unha base de datos útil aos usuarios aos que lles interesa investigar como os patróns de conservación e diverxencia de residuos nunha familia se relacionan coas propiedades funcionais, e proporcionar ligazóns útiles para unha información máis detallada que poida axudar a comprender as relacións entre secuencias, estruturas e funcións. Para facelo, CDD Curators fornece os seguintes tipos de información para suplementar e enriquecer os aliñamentos de múltiples secuencias tradicionais que forman a base dos modelos de dominios: estruturas tridimensionais e motivos centrais conservados, características e sitios conservados, organización filoxenética, e ligazóns a fontes de literatura electrónica.

Consulta da base de datos editar

A colección de datos forma parte tamén do sistema de recuperación e consulta Entrez do NCBI, con ligzóns cruzadas con outros numerosos recursos. A CDD proporciona unha anotación de pegadas dactilares de dominios e sitios funcionais conservados nas secuencias proteicas. Pode obterse unha anotación de dominios precalculada para secuencias de proteínas rastrexadas polo sistema Entrez do NCBI, e a colección de modelos da CDD pode ser consultada para buscar novas secuencias de proteínas por medio do servizo CD-Search^[2] ou en Batch CD-Seach^[3], que permite a computación e descarga de anotcións de grandes conxuntos de consultas de proteínas.

Notas editar

↑ Marchler-Bauer, A.; Zheng, C.; Chitsaz, F.; Derbyshire, M. K.; Geer, L. Y.; Geer, R. C.; Gonzales, N. R.; Gwadz, M.; Hurwitz, D. I.; Lanczycki, C. J.; Lu, F.; Lu, S.; Marchler, G. H.; Song, J. S.; Thanki, N.; Yamashita, R. A.; Zhang, D.; Bryant, S. H. (2012). "CDD: Conserved domains and protein three-dimensional structure". Nucleic Acids Research 41 (Database issue): D348–D352. PMC 3531192. PMID 23197659. doi:10.1093/nar/gks1243.
↑ "the CD-Search service". United States National Center for Biotechnology Information.
↑ "the Batch CD-Search". United States National Center for Biotechnology Information.

Véxase tamén editar

Ligazóns externas editar

"Conserved Domains Database (CDD) and Resource Group". United States National Center for Biotechnology Information.

[CDD_reference-1] Marchler-Bauer, A.; Zheng, C.; Chitsaz, F.; Derbyshire, M. K.; Geer, L. Y.; Geer, R. C.; Gonzales, N. R.; Gwadz, M.; Hurwitz, D. I.; Lanczycki, C. J.; Lu, F.; Lu, S.; Marchler, G. H.; Song, J. S.; Thanki, N.; Yamashita, R. A.; Zhang, D.; Bryant, S. H. (2012). "CDD: Conserved domains and protein three-dimensional structure". Nucleic Acids Research 41 (Database issue): D348–D352. PMC 3531192. PMID 23197659. doi:10.1093/nar/gks1243.

[2] "the CD-Search service". United States National Center for Biotechnology Information.

[3] "the Batch CD-Search". United States National Center for Biotechnology Information.

[1]

[2]

[3]