Pfam: Diferenzas entre revisións

Contido eliminado Contido engadido
Miguelferig (conversa | contribucións)
Miguelferig (conversa | contribucións)
Liña 65:
Case o 80% das secuencias de proteínas contidas na [[UniProt Knowledgebase]] teñen polo menos unha correspondencia en Pfam.<ref name="PuntaCoggill2011">{{cite journal|last1=Punta|first1=M.|last2=Coggill|first2=P. C.|last3=Eberhardt|first3=R. Y.|last4=Mistry|first4=J.|last5=Tate|first5=J.|last6=Boursnell|first6=C.|last7=Pang|first7=N.|last8=Forslund|first8=K.|last9=Ceric|first9=G.|title=The Pfam protein families database|journal=Nucleic Acids Research|volume=40|issue=D1|year=2011|pages=D290–D301|issn=0305-1048|doi=10.1093/nar/gkr1065|pmid=22127870|pmc=3245129}}</ref> Esta cifra denomínase cobertura de secuencias.
 
A base de dartos Pfam contén información sobre [[dominioproteicodominio proteico|dominios proteicos]] e [[familia proteica|familias proteicas]]. Pfam-A é a porción revisada manualmente da base de datos que contén unhas 16.000 entradas. Para cada entrada almacénase un [[aliñamento de secuencias múltiple|aliñamento de secuencias de proteínas]] e un [[modelo de Markov oculto]]. Estes modelosde Markov ocultos poden utilizarse para procurar información nas bases de datos de secuencias co paquete [[HMMER]] escrito por Sean Eddy.
 
Como as entradas en Pfam-A non cobren todas as proteínas coñecidas, proporciónase ademais un suplemento xerado automaticamente chamado Pfam-B, o cal contén un gran número de pequenas familias derivadas de agrupamentos producidos por un [[algoritmo]] chamado ADDA.<ref name="pmid15608174">{{Cite journal