Superfamilia de proteínas

Unha superfamilia de proteínas, na clasificación das proteínas, é o grupo máis grande (clado) de proteínas do que se pode inferir que teñen un antepasado común (ver homoloxía). Xeralmente a existencia desta ascendencia común está baseada no seu aliñamento estrutural[1] e semellanza do seu mecanismo de acción aínda que non se observa semellanza de secuencia evidente.[2] As superfamilias conteñen normalmente varias familias de proteínas, constituídas por proteínas que mostran unha semellanza de secuencia. O termo clan de proteínas úsase tamén comunmente para as superfamilias de proteases baseándose no sistema de clasificación de proteases MEROPS.[2]

Identificación editar

 
Arriba, conservción da estrutura secundaria de 80 membros do clan PA (superfamilia). H indica hélice α, E indica folla β, L indicates bucle. Abaixo, conservación de secuencia do mesmo aliñamento. As frechas indican resíduos de tríade catalítica. Aliñados baseándose na estrutura por DALI.
 
Homoloxía estrutural na superfamilia PA (clan PA). O dobre barril beta que caracteriza esta superfamilia está salientado en vermello. Móstranse estruturas representativas de varias familias pertencentes á superfamilia PA. Nótese que algunhas proteínas mostran estruturas parcialmente modificadas. A quimotripsina (1gg6), protease TEV (1lvm), calicivirina (1wqs), protease do virus do Nilo Occidental (1fp7), toxina exfoliatina (1exf), protease HtrA (1l1j), activador do plasminóxeno do veleno de serpe (1bqy), protease do cloroplasto (4fln) e protease do virus da arterite viral equina (1mbm).

Homoloxía de secuencia editar

Artigo principal: Homoloxía de secuencia.

Os membros dunha superfamilia xeralmente non mostran homoloxía de secuencias detectable. Normalmente é imposible aliñalas debido á gran frecuencia que presentan de insercións e delecións. No clan PA das proteases, por exemplo, non hai ningún residuo simple conservado na superfamilia, nin sequera na tríade catalítica. Inversamente, as familias que constitúen unha superfamilia están definidas polo aliñamento de secuencias dos seus membros; por exemplo a familia da protease C04 pertencente ao clan PA.

Homoloxía estrutural editar

Artigo principal: Aliñamento estrutural.

A estrutura das proteínas está moito máis conservada evolutivamente que a secuencia (como tamén se pode exemplificar co clan PA das proteases). Hai moi poucos residuos que mostren conservación da secuencia de aminoácidos; porén, hai elementos estruturais secundarios que están altamente consevados como tamén os motivos estruturais terciarios que forman. Os programas de aliñamento estrutural como DALI poden utilizar a estrutura en 3D dunha proteína de interese para atopar proteínas que teñan pregamentos similares. Comparando as estruturas en 3D poden identificarse exemplos de parentescos evolutivos que non se descobren coa comparación de secuencias.

Semellanza no mecanismo de acción editar

Artigo principal: Mecanismo encimático.

O mecanismo catalítico de encimas pertencentes a unha superfamilia está normalmente conservado, aínda que a especificidade de substrato pode ser significativamente diferente. Os residuos catalíticos tamén tenden a aparecer na mesma orde na secuencia da proteína. De novo, o clan PA das proteases pode servir de exemplo. Mesmo en familias dunha superfamilia que utilizan distintos nucleófilos, todas realizan unha catálise nucleofílica covalente sobre as proteínas, péptidos ou aminoácidos por medio dun mecanismo encimático similar.

Importancia evolutiva editar

As superfamilias de proteínas representan os límites actuais da nosa capacidade de identificar antepasados comúns moleculares.[3] Son o grupo evolutivo meirande baseado en probas directas que é posible establecer actualmente. Están, por tanto, entre os eventos evolutivos máis antigos que se poden estudar hoxe. Algunhas superfamilias teñen membros en todos os reinos de seres vivos, o que indica que o último antepasado común desa superfamilia era o último antepasado común universal de todos os seres vivos (LUCA).[4]

Os membros dunha superfamilia poden atoparse en diferentes especies, e a proteína ancestral é a forma da proteína que existía na especie ancestral (ortoloxía). Inversamente, ditas proteínas poden encontrarse na mesma especie, pero evolucionaron a partir dunha soa proteína cuxo xene foi duplicado no xenoma (paraloxía).

Exemplos editar

  • Superfamilia Ras. Os seus membros comparte un domino G catalítico común de folla beta de seis febras rodeada de 5 hélices alfa.[16]

Recursos sobre superfamilias de proteínas editar

Varias bases de datos biolóxicas documentan as superfamilias proteícas e pregamentos proteicos; por exemplo:

  • Pfam - Base de datos de familias proteicas de aliñamentos e de HMMs
  • PROSITE - Base de datos de dominios de proteínas, familias e sitios funcionais
  • PIRSF - SuperFamily Classification System
  • PASS2 - Protein Alignment as Structural Superfamilies v2
  • SUPERFAMILY - Libraría de HMMs que representa superfamilias e bases de datos de anotacións (superfamilias e familias) para todos os organismos completamente secuenciados
  • SCOP e CATH - Clasificacións de estruturas de proteínas en superfamilias, familias e dominios

Igualmente, hai algoritmos que buscan no PDB proteínas con homoloxia estrutural cunha estrutura diana dada; por exemplo:

  • DALI - Aliñamento estrutural baseado nun método de matriz de aliñamento de distancia.

Notas editar

  1. Holm, L; Rosenström, P (July 2010). "Dali server: conservation mapping in 3D.". Nucleic Acids Research 38 (Web Server issue): W545–9. PMID 20457744. doi:10.1093/nar/gkq366. 
  2. 2,0 2,1 2,2 Rawlings, ND; Barrett, AJ; Bateman, A (January 2012). "MEROPS: the database of proteolytic enzymes, their substrates and inhibitors.". Nucleic Acids Research 40 (Database issue): D343–50. PMC 3245014. PMID 22086950. doi:10.1093/nar/gkr987. 
  3. Shakhnovich, BE; Deeds, E; Delisi, C; Shakhnovich, E (March 2005). "Protein structure and evolutionary history determine sequence space topology.". Genome Research 15 (3): 385–92. PMID 15741509. doi:10.1101/gr.3133605. 
  4. Ranea, JA; Sillero, A; Thornton, JM; Orengo, CA (October 2006). "Protein superfamily evolution and the last universal common ancestor (LUCA).". Journal of molecular evolution 63 (4): 513–25. PMID 17021929. doi:10.1007/s00239-005-0289-7. 
  5. Bazan, JF; Fletterick, RJ (November 1988). "Viral cysteine proteases are homologous to the trypsin-like family of serine proteases: structural and functional implications.". Proceedings of the National Academy of Sciences of the United States of America 85 (21): 7872–6. PMC 282299. PMID 3186696. doi:10.1073/pnas.85.21.7872. 
  6. Carr PD, Ollis DL (2009). "Alpha/beta hydrolase fold: an update". Protein Pept. Lett. 16 (10): 1137–48. PMID 19508187. 
  7. Nardini M, Dijkstra BW (December 1999). "Alpha/beta hydrolase fold enzymes: the family keeps growing". Curr. Opin. Struct. Biol. 9 (6): 732–7. PMID 10607665. doi:10.1016/S0959-440X(99)00037-8. 
  8. Nagano, N; Orengo, CA; Thornton, JM (Aug 30, 2002). "One fold with many functions: the evolutionary relationships between TIM barrel families based on their sequences, structures and functions.". Journal of Molecular Biology 321 (5): 741–65. PMID 12206759. doi:10.1016/s0022-2836(02)00649-6. 
  9. Farber, G (1993). "An α/β-barrel full of evolutionary trouble". Current Opinion in Structural Biology 3 (3): 409–412. doi:10.1016/S0959-440X(05)80114-9. 
  10. "SCOP". Arquivado dende o orixinal o 29 de xullo de 2014. Consultado o 28 May 2014. 
  11. Mohamed, MF; Hollfelder, F (Jan 2013). "Efficient, crosswise catalytic promiscuity among enzymes that catalyze phosphoryl transfer.". Biochimica et Biophysica Acta 1834 (1): 417–24. PMID 22885024. doi:10.1016/j.bbapap.2012.07.015. 
  12. Bork P, Holm L, Sander C (September 1994). "The immunoglobulin fold. Structural classification, sequence patterns and common core". J. Mol. Biol. 242 (4): 309–20. PMID 7932691. doi:10.1006/jmbi.1994.1582. 
  13. Brümmendorf T, Rathjen FG (1995). "Cell adhesion molecules 1: immunoglobulin superfamily". Protein Profile 2 (9): 963–1108. PMID 8574878. 
  14. Branden, Carl; Tooze, John (1999). Introduction to protein structure (2nd ed.). New York: Garland Pub. ISBN 978-0815323051. 
  15. Bolognesi, M; Onesti, S; Gatti, G; Coda, A; Ascenzi, P; Brunori, M (1989). "Aplysia limacina myoglobin. Crystallographic analysis at 1.6 a resolution". Journal of molecular biology 205 (3): 529–44. PMID 2926816. 
  16. Vetter IR, Wittinghofer A (November 2001). "The guanine nucleotide-binding switch in three dimensions". Science 294 (5545): 1299–304. PMID 11701921. doi:10.1126/science.1062023. 

Véxase tamén editar

Outros artigos editar