InterPro: Diferenzas entre revisións

Contido eliminado Contido engadido
Miguelferig (conversa | contribucións)
Sen resumo de edición
Miguelferig (conversa | contribucións)
Liña 56:
As sinaturas de InterPro proceden de 11 "bases de datos membros", que son as que se indican a continuación:
 
;[[CATH-Gene3D]] : Describe familias proteicas e arquitecturas de dominios en xenomas completos. As familias completas están formadas usando un algoritmo de agrupamento de Markov, seguido dun agrupamento de multi-ligazón segundo a identidade de secuencia. O mapado de estruturas preditas e dominios de secuencias é realizado usando bibliotecas de modelos de Markov ocultos que representan dominios [[CATH]] e [[Pfam]]. Proporciónase unha anotación funcional para proteínas procedente de múltiples fontes. A predición e análise funcional de arquitecturas de dominios está dispoñible na páxina web de Gene3D.
;[[HAMAP]] : Son as siglas de ''High-quality Automated and Manual Annotation of microbial Proteomes'' (Anotación Manual e Automatizada de Alta calidade de Proteomas microbianos). Os perfís HAMAP son creados manualmente por revisores expertos e identifican proteínas que forman parte de familias ou subfamilias proteicas ben conservadas codificadas en [[bacterias]], [[arqueas]], e [[plastidio]]s (é dicir, [[cloroplasto]]s, [[cianela]]s, [[apicoplasto]]s, plastidios non fotosintéticos).
;[[PANTHER]] : É unha gran colección de familias proteicas que foron subdivididas en subfamilias relacionadas funcionalmente, usando expertos humanos. Estas subfamilias modelizan a diverxencia de funcións específicas en familias proteicas, o que permite unha asociación máis precisa coa súa función (con funcións moleculares revisadas por persoas e clasificacións de procesos biolóxicos e diagramas de vías), e tamén a inferencia dos aminoácidos que son importantes para a especificidade funcional. Constrúense modelos de Markov ocultos (HMMs) para cada familia e subfamilia para clasificar secuencias de proteínas adicionais.
;[[Pfam]] : É unha gran colección de [[aliñamento de secuencias múltiples|aliñamentos de secuencias múltiples]] e modelos de Markov ocultos que abranguen moitos dominios proteicos comúns e familias proteicas.
;[[PIRSF]] : O sistema de clasificación de proteínas é unha rede con moitos niveis de diversidade de secuencia de superfamilias e subfamilias que reflicte as relacións [[evolución|evolutivas]] de proteínas de lonxitude completa e dominios. A unidade de clasificación PIRSF primaria é a familia homeomórfica, cuxos membros son tanto [[homoloxía (bioloxía)|homólogos]] (que evolucionaron a partir dun antepasado común) coma homeomórficas (que comparten unha similaridade de secuencia de lonxitude completa e unha arquitectura de dominio común).
;[[PRINTS]] : É un compendio de "pegadas dactilares" (''fingerprints'') de proteínas. Unha "pegada dactilar" é un grupo de motivos conservados usados para caracterizar unha familia proteica; o seu poder diagnóstico é refinado por un escaneado iterativo de UniProt. Usualmente os motivos non se solapan, senón que están separados ao longo da secuencia, aínda que poden tamén estar contiguos no espazo tridimensional. Estas "pegadas dactilares" poden codificar [[pregamento de proteínas|pregamentos de proteínas]] e funcionalidades de xeito máis flexible e potente do que se pode con motivos únicos, e a súa gran potencia de diagnóstico deriva do contexto mutuo ofrecido polos motivos veciños.
;ProDom : Base de datos de dominios proteicos que consta dunha compilación automática de dominios homólogos. As versións actuais de ProDom constrúense usando un procedemento novo baseado en buscas PSI-BLAST recursivas.