HomoloGene: Diferenzas entre revisións

Contido eliminado Contido engadido
Miguelferig (conversa | contribucións)
Sen resumo de edición
m →‎top: Arranxos varios
Liña 1:
'''HomoloGene'''é unha ferramenta do [[Centro Nacional para a Información Biotecnolóxica]] (NCBI) que é utilizada como sistema de detección automática de [[Homoloxía (bioloxía)|homólogos]] (similitude atribuible á descendencia dun [[antepasado común]]) entre os [[xene]]s anotados de varios [[xenoma]]s [[Eukarya|eucariotas]] completamente secuenciados.<ref>{{cita libro |nome=Peter D. |apelidos=Vize |capítulo=Internet tools for cell and developmental biologists |apelidos-editor=Sansom |nome-editor=Clare |nome-editor2=Robert M. |apelidos-editor2=Horton |título=The Internet for Molecular Biologists: A Practical Approach|ano=2004|editorial=[[Oxford University Press]] |páxinas=249 |idioma=inglés |isbn=978-01-9963-888-8}}</ref><ref name=pevsner>{{cita libro |nome=Jonathan |apelidos=Pevsner |título=Bioinformatics and Functional Genomics |ano=2009 |editorial=John Wiley & Sons |páxinas=951 |idioma=inglés |isbn=978-04-7008-585-1}}</ref><ref name=bio>{{cita libro |nome=Andreas D. |nome2=B. F. Francis |apelidos=Baxevanis |apelidos2=Ouellette |título=Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins |ano=2004 |editorial=John Wiley & Sons |páxinas=488 |idioma=inglés |isbn=978-04-7146-101-2}}</ref>
 
O procesamento que fai HomoloGene consiste na análise de [[proteína]]s dos organismos con entrada. As [[homoloxía de secuencias|secuencias]] compaáranse por medio de [http://www.ncbi.nlm.nih.gov/BLAST/Blast.cgi?CMD=Web&LAYOUT=TwoWindows&AUTO_FORMAT=Semiauto&ALIGNMENTS=250&ALIGNMENT_VIEW=Pairwise&CDD_SEARCH=on&CLIENT=web&DATABASE=nr&DESCRIPTIONS=500&ENTREZ_QUERY=%28none%29&EXPECT=10&FILTER=L&FORMAT_OBJECT=Alignment&FORMAT_TYPE=HTML&I_THRESH=0.005&MATRIX_NAME=BLOSUM62&NCBI_GI=on&PAGE=Proteins&PROGRAM=blastp&SERVICE=plain&SET_DEFAULTS.x=41&SET_DEFAULTS.y=5&SHOW_OVERVIEW=on&END_OF_HTTPGET=Yes&SHOW_LINKOUT=yes&GET_SEQUENCE=yes%7Cblastp blastp], despois emparéllanse e agrúpanse utilizando unha árbore taxonómica construída a partir da similitude de secuencias, na que os organismos máis estreitamente relacionados se emparellan primeiro e logo engádense os seguintes á árbore. As aliñacións de proteínas asígnanse ás súas [[secuencia de ADN|secuencias de ADN]] correspondentes; logo, as distancias métricas tales como as de [[Modelo de Jukes & Cantor (1969)|Jukes & Cantor (1969)]] ou a [[taxa Ka/Ks]] tamén se poden calcular.<ref name=pevsner/>
 
As secuencias emparéllanse utilizando un [[algoritmo]] [[heurístico]] para maximizar a puntuación global nunha coincidencia bipartita (véxase ''[[grafo bipartito completo]]''), máis que a nivel local. E logo,calcúlase a significación estatística de cada parella. En cada posición realízanse puntos de corte e establécense valores de Ks para evitar falsos [[ortólogo]]s cando sexan agrupados; ademais, os [[parálogo]]s son identificados pola busca de secuencias entre as especies máis relacionadas.<ref name=zebrafish>{{cita libro |nome=Lynn M. |apelidos=Schriml |nome2=Judy |apelidos2=Sprague |título=The Zebrafish: Genetics, Genomics, and Informatics |capítulo=Data Mining the Zebrafish Genome |ano=2004 |editorial=Academic Press |páxinas=686 |idioma=inglés |isbn=978-01-2564-172-2 |nome-editor=H. William |apelidos-editor=Detrich |nome-editor2=Monte |apelidos-editor2=Westerfield |nome-editor2=Leonard I. |apelidos-editor3=Zon}}</ref>
 
== Organismos con entrada ==