SUPERFAMILY (base de datos)

base de datos de proteínas e xenomas

SUPERFAMILY é unha base de datos de notación estrutural e funcional de todas as proteínas e xenomas.[1][2][3][4][5][6][7] SUPERFAMILY clasifica secuencias de aminoácidos en dominios estruturais coñecidos, especialmente en superfamilias SCOP.[8][9] As superfamilias son grupos de proteínas que presentan evidencias estuturais que apoian que teñen un antepasado evolutivo común pero poden non ter unha homoloxía de secuencias detectable.

Anotacións en SUPERFAMILY

editar

A anotación en SUPERFAMILY está baseada nun conxunto de modelos de Markov ocultos, que representan dominios proteicos estruturais a nivel de superfamilia SCOP.[10] Nunha superfamilia están agrupados dominios estruturais que teñen relacións evolutivas. A anotación realízase ao escanear secuencias de proteínas a partir de xenomas completamente secuenciados con respecto a modelos de Markov ocultos.

Para cada proteína pódese facer o seguinte:

  • Introducir secuencias para a súa clasificación SCOP.
  • Ver detalles da organización dos dominios, aliñamentos de secuencias e secuencias de proteínas.

Para cada xenoma pódese facer o seguinte:

  • Examinar os asignamentos de superfamilias, árbores filoxenéticas, listas e redes de organización de dominios.
  • Comprobar superfamilias super-representadas ou sub-representadas nun xenoma.

Para cada superfamilia pódese facer o seguinte:

Todas as anotacións, modelos e a vertedura da base de datos están dispoñibles gratuitamente para que as poida descargar calquera.

  1. Wilson, D.; Pethica, R.; Zhou, Y.; Talbot, C.; Vogel, C.; Madera, M.; Chothia, C.; Gough, J. (2009). "SUPERFAMILY--sophisticated comparative genomics, data mining, visualization and phylogeny". Nucleic Acids Research 37 (Database issue): D380–D386. doi:10.1093/nar/gkn762. PMC 2686452. PMID 19036790.
  2. Wilson, D.; Madera, M.; Vogel, C.; Chothia, C.; Gough, J. (2007). "The SUPERFAMILY database in 2007: Families and functions". Nucleic Acids Research 35 (Database issue): D308–D313. PMC 1669749. PMID 17098927. doi:10.1093/nar/gkl910. 
  3. Gough, J. (2002). "The SUPERFAMILY database in structural genomics". Acta crystallographica. Section D, Biological crystallography 58 (Pt 11): 1897–1900. PMID 12393919. doi:10.1107/s0907444902015160. 
  4. Gough, J.; Chothia, C. (2002). "SUPERFAMILY: HMMs representing all proteins of known structure. SCOP sequence searches, alignments and genome assignments". Nucleic Acids Research 30 (1): 268–272. PMC 99153. PMID 11752312. doi:10.1093/nar/30.1.268. 
  5. 5,0 5,1 De Lima Morais, D. A.; Fang, H.; Rackham, O. J. L.; Wilson, D.; Pethica, R.; Chothia, C.; Gough, J. (2010). "SUPERFAMILY 1.75 including a domain-centric gene ontology method". Nucleic Acids Research 39 (Database issue): D427–D434. PMC 3013712. PMID 21062816. doi:10.1093/nar/gkq1130. 
  6. Oates, M. E.; Stahlhacke, J; Vavoulis, D. V.; Smithers, B; Rackham, O. J.; Sardar, A. J.; Zaucha, J; Thurlby, N; Fang, H; Gough, J (2015). "The SUPERFAMILY 1.75 database in 2014: A doubling of data". Nucleic Acids Research 43 (Database issue): D227–33. PMID 25414345. doi:10.1093/nar/gku1041. 
  7. Hubbard, T. J.; Ailey, B.; Brenner, S. E.; Murzin, A. G.; Chothia, C. (1999). "SCOP: A Structural Classification of Proteins database". Nucleic Acids Research 27 (1): 254–256. PMC 148149. PMID 9847194. doi:10.1093/nar/27.1.254. 
  8. Lo Conte, L.; Ailey, B.; Hubbard, T. J.; Brenner, S. E.; Murzin, A. G.; Chothia, C. (2000). "SCOP: A Structural Classification of Proteins database". Nucleic Acids Research 28 (1): 257–259. PMC 102479. PMID 10592240. doi:10.1093/nar/28.1.257. 
  9. Gough, J.; Karplus, K.; Hughey, R.; Chothia, C. (2001). "Assignment of homology to genome sequences using a library of hidden Markov models that represent all proteins of known structure1". Journal of Molecular Biology 313 (4): 903–919. PMID 11697912. doi:10.1006/jmbi.2001.5080. 
  10. Botstein, D.; Cherry, J. M.; Ashburner, M.; Ball, C. A.; Blake, J. A.; Butler, H.; Davis, A. P.; Dolinski, K.; Dwight, S. S.; Eppig, J. T.; Harris, M. A.; Hill, D. P.; Issel-Tarver, L.; Kasarskis, A.; Lewis, S.; Matese, J. C.; Richardson, J. E.; Ringwald, M.; Rubin, G. M.; Sherlock, G. (2000). "Gene ontology: Tool for the unification of biology. The Gene Ontology Consortium". Nature Genetics 25 (1): 25–29. PMC 3037419. PMID 10802651. doi:10.1038/75556.