Revisión como estaba o 2 de outubro de 2015 ás 10:29 editar Miguelferig (conversa \| contribucións) 241.924 edicións →‎Bases de datos incluídas en InterPro ← Edición máis vella		Revisión como estaba o 2 de outubro de 2015 ás 10:46 editar desfacer Miguelferig (conversa \| contribucións) 241.924 edicións →‎Bases de datos incluídas en InterPro Edición máis nova →
Liña 57: As sinaturas de InterPro proceden de 11 "bases de datos membros", que son as que se indican a continuación: ;CATH-Gene3D : ~~describe~~Describe familias proteicas e arquitecturas de dominios en xenomas completos. As familias completas están formadas usando un algoritmo de agrupamento de Markov, seguido dun agrupamento de multi-ligazón segundo a identidade de secuencia. O mapado de estruturas preditas e dominios de secuencias é realizado usando bibliotecas de modelos de Markov ocultos que representan dominios [[CATH]] e [[Pfam]]. Proporciónase unha anotación funcional para proteínas procedente de múltiples fontes. A predición e análise funcional de arquitecturas de dominios está dispoñible na páxina web de Gene3D. ;HAMAP : ~~son~~Son as siglas de ''High-quality Automated and Manual Annotation of microbial Proteomes'' (Anotación Manual e Automatizada de Alta calidade de Proteomas microbianos). Os perfís HAMAP son creados manualmente por revisores expertos e identifican proteínas que forman parte de familias ou subfamilias proteicas ben conservadas codificadas en [[bacterias]], [[arqueas]], e [[plastidio]]s (é dicir, [[cloroplasto]]s, [[cianela]]s, [[apicoplasto]]s, plastidios non fotosintéticos). ;[[PANTHER]] : éÉ unha gran colección de familias proteicas que foron subdivididas en subfamilias relacionadas funcionalmente, usando expertos humanos. Estas subfamilias modelizan a diverxencia de funcións específicas en familias proteicas, o que permite unha asociación máis precisa coa súa función (con funcións moleculares revisadas por persoas e clasificacións de procesos biolóxicos e diagramas de vías), e tamén a inferencia dos aminoácidos que son importantes para a especificidade funcional. Constrúense modelos de Markov ocultos (HMMs) para cada familia e subfamilia para clasificar secuencias de proteínas adicionais. ;[[Pfam]] : éÉ unha gran colección de [[aliñamento de secuencias múltiples\|aliñamentos de secuencias múltiples]] e modelos de Markov ocultos que abranguen moitos dominios proteicos comúns e familias proteicas. ;PIRSF : O sistema de clasificación de proteínas é unha rede con moitos niveis de diversidade de secuencia de superfamilias e subfamilias que reflicte as relacións [èvolución\|evolutivas]] de proteínas de lonxitude completa e dominios. A unidade de clasificación PIRSF primaria é a familia homeomórfica, cuxos membros son tanto [[homoloxía (bioloxía)\|homólogos]] (que evolucionaron a partir dun antepasado común) coma homeomórficas (que comparten unha similaridade de secuencia de lonxitude completa e unha arquitectura de dominio común). ;PIRSF : protein classification system is a network with multiple levels of sequence diversity from superfamilies to subfamilies that reflects the evolutionary relationship of full-length proteins and domains. The primary PIRSF classification unit is the homeomorphic family, whose members are both homologous (evolved from a common ancestor) and homeomorphic (sharing full-length sequence similarity and a common domain architecture). ;[[PRINTS]] : É un compendio de "pegadas dactilares" (''fingerprints'') de proteínas. Unha "pegada dactilar" é un grupo de motivos conservados usados para caracterizar unha familia proteica; o seu poder diagnóstico é refinado por un escaneado iterativo de UniProt. Usualmente os motivos non se solapan, senón que están separados ao longo da secuencia, aínda que poden tamén ser contiguos no espazo tridimensional. Estas ''pegadas dactilares" poden codificar [[pregamento de proteínas\|pregamentos de proteínas]] e funcionalidades de xeito máis flexible e potente do que se pode con motivos únicos, e a súa potencia de diagnóstico deriva do contexto mutuo permitidos por veciños motivos. ;[[PRINTS]] : is a compendium of protein fingerprints. A fingerprint is a group of conserved motifs used to characterise a protein family; its diagnostic power is refined by iterative scanning of UniProt. Usually the motifs do not overlap, but are separated along a sequence, though they may be contiguous in 3D-space. Fingerprints can encode protein folds and functionalities more flexibly and powerfully than can single motifs, their full diagnostic potency deriving from the mutual context afforded by motif neighbours. ;ProDom : domain database consists of an automatic compilation of homologous domains. Current versions of ProDom are built using a novel procedure based on recursive PSI-BLAST searches. ;[[PROSITE]] : is a database of protein families and domains. It consists of biologically significant sites, patterns and profiles that help to reliably identify to which known protein family (if any) a new sequence belongs.

InterPro: Diferenzas entre revisións