SUPERFAMILY (base de datos)
SUPERFAMILY é unha base de datos de notación estrutural e funcional de todas as proteínas e xenomas.[1][2][3][4][5][6][7] SUPERFAMILY clasifica secuencias de aminoácidos en dominios estruturais coñecidos, especialmente en superfamilias SCOP.[8][9] As superfamilias son grupos de proteínas que presentan evidencias estuturais que apoian que teñen un antepasado evolutivo común pero poden non ter unha homoloxía de secuencias detectable.
Anotacións en SUPERFAMILY
editarA anotación en SUPERFAMILY está baseada nun conxunto de modelos de Markov ocultos, que representan dominios proteicos estruturais a nivel de superfamilia SCOP.[10] Nunha superfamilia están agrupados dominios estruturais que teñen relacións evolutivas. A anotación realízase ao escanear secuencias de proteínas a partir de xenomas completamente secuenciados con respecto a modelos de Markov ocultos.
Para cada proteína pódese facer o seguinte:
- Introducir secuencias para a súa clasificación SCOP.
- Ver detalles da organización dos dominios, aliñamentos de secuencias e secuencias de proteínas.
Para cada xenoma pódese facer o seguinte:
- Examinar os asignamentos de superfamilias, árbores filoxenéticas, listas e redes de organización de dominios.
- Comprobar superfamilias super-representadas ou sub-representadas nun xenoma.
Para cada superfamilia pódese facer o seguinte:
- Inspeccionar a clasificación SCOP, anotacións funcionais, anotación de Gene Ontology,[5][11] resumos de InterPro e asignacións de xenoma.
- Explorar a distribución taxonómica dunha superfamilia a través da árbore da vida.
Todas as anotacións, modelos e a vertedura da base de datos están dispoñibles gratuitamente para que as poida descargar calquera.
Notas
editar- ↑ Wilson, D.; Pethica, R.; Zhou, Y.; Talbot, C.; Vogel, C.; Madera, M.; Chothia, C.; Gough, J. (2009). "SUPERFAMILY--sophisticated comparative genomics, data mining, visualization and phylogeny". Nucleic Acids Research 37 (Database issue): D380–D386. doi:10.1093/nar/gkn762. PMC 2686452. PMID 19036790.
- ↑ Wilson, D.; Madera, M.; Vogel, C.; Chothia, C.; Gough, J. (2007). "The SUPERFAMILY database in 2007: Families and functions". Nucleic Acids Research 35 (Database issue): D308–D313. PMC 1669749. PMID 17098927. doi:10.1093/nar/gkl910.
- ↑ Gough, J. (2002). "The SUPERFAMILY database in structural genomics". Acta crystallographica. Section D, Biological crystallography 58 (Pt 11): 1897–1900. PMID 12393919. doi:10.1107/s0907444902015160.
- ↑ Gough, J.; Chothia, C. (2002). "SUPERFAMILY: HMMs representing all proteins of known structure. SCOP sequence searches, alignments and genome assignments". Nucleic Acids Research 30 (1): 268–272. PMC 99153. PMID 11752312. doi:10.1093/nar/30.1.268.
- ↑ 5,0 5,1 De Lima Morais, D. A.; Fang, H.; Rackham, O. J. L.; Wilson, D.; Pethica, R.; Chothia, C.; Gough, J. (2010). "SUPERFAMILY 1.75 including a domain-centric gene ontology method". Nucleic Acids Research 39 (Database issue): D427–D434. PMC 3013712. PMID 21062816. doi:10.1093/nar/gkq1130.
- ↑
- ↑ Oates, M. E.; Stahlhacke, J; Vavoulis, D. V.; Smithers, B; Rackham, O. J.; Sardar, A. J.; Zaucha, J; Thurlby, N; Fang, H; Gough, J (2015). "The SUPERFAMILY 1.75 database in 2014: A doubling of data". Nucleic Acids Research 43 (Database issue): D227–33. PMID 25414345. doi:10.1093/nar/gku1041.
- ↑ Hubbard, T. J.; Ailey, B.; Brenner, S. E.; Murzin, A. G.; Chothia, C. (1999). "SCOP: A Structural Classification of Proteins database". Nucleic Acids Research 27 (1): 254–256. PMC 148149. PMID 9847194. doi:10.1093/nar/27.1.254.
- ↑ Lo Conte, L.; Ailey, B.; Hubbard, T. J.; Brenner, S. E.; Murzin, A. G.; Chothia, C. (2000). "SCOP: A Structural Classification of Proteins database". Nucleic Acids Research 28 (1): 257–259. PMC 102479. PMID 10592240. doi:10.1093/nar/28.1.257.
- ↑ Gough, J.; Karplus, K.; Hughey, R.; Chothia, C. (2001). "Assignment of homology to genome sequences using a library of hidden Markov models that represent all proteins of known structure1". Journal of Molecular Biology 313 (4): 903–919. PMID 11697912. doi:10.1006/jmbi.2001.5080.
- ↑ Botstein, D.; Cherry, J. M.; Ashburner, M.; Ball, C. A.; Blake, J. A.; Butler, H.; Davis, A. P.; Dolinski, K.; Dwight, S. S.; Eppig, J. T.; Harris, M. A.; Hill, D. P.; Issel-Tarver, L.; Kasarskis, A.; Lewis, S.; Matese, J. C.; Richardson, J. E.; Ringwald, M.; Rubin, G. M.; Sherlock, G. (2000). "Gene ontology: Tool for the unification of biology. The Gene Ontology Consortium". Nature Genetics 25 (1): 25–29. PMC 3037419. PMID 10802651. doi:10.1038/75556.