A CATH Protein Structure Classification (Clasificación da Estrutura das Proteínas CATH) é unha clasificación de dominios proteicos xerárquica e semiautomática publicada en 1997 por Christine Orengo, Janet Thornton e os seus colegas.[1] CATH comparte moitas características xerais co seu principal rival na clasificación de proteínas, que é SCOP, porén ten tamén áreas nas cales os detalles da clasificación difiren bastante.

Xerarquía editar

O nome CATH é un acrónimo dos catro principais niveis na clasificación: Clase, Arquitectura, Topoloxía, Homoloxía (das superfamilias).

Estes catro niveis principais da xerarquía descríbense como segue:
# Nivel Descrición
1 Clase o contido de estrutura secundaria global do dominio. (Equivalente á clase da clasificación SCOP)
2 Arquitectura alta semellanza estrutural pero sen evidencias de homoloxía. (Equivalente ao pregamento de SCOP)
3 Topoloxía agrupación a grande escala de topoloxías que comparten características estruturais particulares
4 Superfamilia Homóloga indica unha relación evolutiva demostrable. (Equivalente ás superfamilias de SCOP)

CATH define catro clases: principalmente alfa, principalmengte beta, alfa e beta, poucas estruturas secundarias.

Para comprender mellor o sistema de clasificación CATH é útil coñecer como se constrúen: gran parte deste traballo faise por métodos automáticos, pero tamén hai importantes elementos manuais que se aplican na clasificación.

O primeiro paso é separar as proteínas en dominios. É difícil facer unha definición inequívoca de dominio e esta é unha área na que CATH e SCOP se diferencian.

Os dominios son distribuídos automaticamente en clases e agrupados baseándose na semellanza das secuencias. Estes grupos forman o nivel H da clasificación. O nivel de topoloxía está formado por comparacións estruturais de grupos homólogos. Finalmente, o nivel de Arquitectura asígnase manualmente.

A clasificación do nivel Clase faise baseándose neses 4 criterios:

  1. contido de estrutura secundaria;
  2. contactos de estrutura secundaria;
  3. puntuación (score) de alternancia de estrutura secundaria; e
  4. porcentaxe de febras paralelas.

Poden atoparse máis detalles deste proceso e da comparación entre SCOP, CATH e FSSP en: Hadley & Jones, 1999[2] e en Day et al., 2003.[3]

Exemplo editar

Notas editar

  1. Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM (1997). "CATH--a hierarchic classification of protein domain structures". Structure 5 (8): 1093–1108. PMID 9309224. doi:10.1016/S0969-2126(97)00260-8. 
  2. Hadley C, Jones DT (1999). "A systematic comparison of protein structure classifications: SCOP, CATH and FSSP". Structure 7 (9): 1099–1112. PMID 10508779. doi:10.1016/S0969-2126(99)80177-4. 
  3. Day R, Beck DA, Armen RS, Daggett V (2003). "A consensus view of fold space: Combining SCOP, CATH, and the Dali Domain Dictionary". Protein Sci. 12 (10): 2150–2160. PMC 2366924. PMID 14500873. doi:10.1110/ps.0306803. 

Véxase tamén editar

Outros artigos editar

  • SCOP (outro sistema de clasificación de proteinas)
  • FSSP (outro sistema de clasificación de proteinas)

Ligazóns externas editar