Secuencia consenso

En bioloxía molecular e bioinformática, unha secuencia consenso é unha secuencia de nucleótidos ou aminoácidos que se encontra en ácidos nucleicos ou proteínas, que indica a orde calculada dos residuos de nucleótidos ou aminoácidos máis frecuentes que se encontran en cada posición nun aliñamento de secuencias. Representa os resultados dun aliñamento de secuencia múltiple na cal as secuencias relacionadas se comparan unhas con outras e calcúlanse as secuencias motivo similares. Dita información é importante cando se consideran encimas dependentes de secuencia como as ARN polimerases.^[1]

Análise de secuencia

O desenvolvemento de software para o recoñecemento de patróns é un dos principais campos da xenética, bioloxía molecular, e bioinformática. Os motivos de secuencia específicos poden funcionar como secuencias reguladoras que controlan a biosíntese, ou como secuencias sinal que dirixen unha molécula a un sitio específico da célula ou regulan a súa maduración. Como a función regulatoria destas secuencias é importante, pénsase que se conservan ao longo de grandes períodos de tempo na evolución. Nalgúns casos, o parentesco evolutivo pode estimarse pola cantidade que haxa destes sitios de conservación.

Notación

Os motivos de secuencia conservados denomínanse secuencias consenso e mostran que residuos están conservados e cales son variables. Consideremos o seguinte exemplo de secuencia de ADN:

A[CT]N{A}YR

Nesta notación, A significa que sempre se encontra unha A (adenina) nesta posición; [CT] indica que pode ser C (citosina) ou T (timina); N significa calquera base; e {A} indica que é calquera base excepto A. Y representa calquera pirimidina, e R indica calquera purina.

Un logo de secuencia que mostra as bases máis conservadas arredor do codón de iniciación eucariótico obtido a partir dos ARNms dos xenes humanos.

Neste exemplo, a notación [CT] no dá ningunha indicación da frecuencia relativa da aparición de C ou T nesa posición. Un método alternativo de representar unha secuencia consenso é utilizar un logo de secuencia, que é unha representación gráfica da secuencia consenso, na cal o tamaño de cada símbolo está relacionado coa frecuencia coa que un determinado nucleótido (ou aminoácido) aparece en determinada posición. Nos logos de secuencia canto máis conservado está o residuo, máis grande é o símbolo con que se debuxa ese residuo, e canto menos frecuente, menor é o tamaño do símbolo. Os logos de secuencia poden xerarse utilizando WebLogo, ou Gestalt Workbench, unha ferramenta de visualización dispoñible para o público de Gustavo Glusman no Institute for Systems Biology.^[2]

Importancia biolóxica

Un sitio de unión de proteínas, representado por unha secuencia consenso, pode ser unha secuencia curta de nucleótidos, que se encontra repetida varias veces no xenoma e pénsase que desempeña a mesma función nas súas distintas localizacións. Por exemplo, moitos factores de transcrición recoñecen patróns particulares nos promotores dos xenes que regulan. Do mesmo modo, os encimas de restrición xeralmente teñen secuencias consenso palindrómicas, que normalmente coinciden co sitio onde estes encimas cortan o ADN. Os transposóns actúan en grande medida do mesmo xeito na súa identificación das secuencias diana para a transposición. Finalmente os sitios de empalme (secuencias que rodean os límites exón-intrón, para o splicing) poden ser consideradas tamén secuencias consenso.

Así, unha secuencia consenso é un modelo para un sitio de unión ao ADN suposto: obtense alineando todos os exemplos coñecidos dun certo sitio de recoñecemento e definidos como a secuencia idealizada que representa a base que é predominante en cada posición. Todos os exemplos reais non deberían diferir do consenso en máis dunhas poucas substitucións, pero contar as faltas de coincidencias deste modo pode levar a inconsistencias.^[2]

As mutacións que permiten que un nucleótido mutado no centro (core) da secuencia dun promotor se pareza máis á secuencia consenso denomínanse mutacións up (á alza). Este tipo de mutacións xeralmente fan que o promotor se faga máis forte, é dicir, que a ARN polimerase se una máis estreitamente ao ADN que ten que transcribir e a transcrición é regulada á alza. Polo contrario, as mutacións que destrúen nucleótidos conservados na secuencia consenso denomínanse mutacións down (á baixa). Estes tipos de mutación regulan á baixa a transcrición, xa que a ARN polimerase xa non pode unirse tan estreitamente ao centro da secuencia promotora.

Notas

↑ Pierce, Benjamin A. 2002. Genetics: A Conceptual Approach. 1st ed. New York: W.H. Freeman and Co.
↑ ^2,0 ^2,1 Schneider TD (2002). "Consensus Sequence Zen". Appl Bioinformatics 1 (3): 111–119. PMC 1852464. PMID 15130839.

Véxase tamén

Outros artigos

[1] Pierce, Benjamin A. 2002. Genetics: A Conceptual Approach. 1st ed. New York: W.H. Freeman and Co.

[Schneider2002-2] 2,0 ^2,1 Schneider TD (2002). "Consensus Sequence Zen". Appl Bioinformatics 1 (3): 111–119. PMC 1852464. PMID 15130839.

[1]

[2]