Estrutura secundaria das proteínas

En bioquímica e bioloxía estrutural enténdese por estrutura secundaria das proteínas a forma xeral tridimensional de segmentos locais das proteínas (o concepto de estrutura secundaria aplícase tamén a outros biopolímeros como os ácidos nucleicos, ADN/ARN). Non describe as posicións de átomos específicos no espazo tridimensional, o cal se considera estrutura terciaria. As estruturas secundarias máis comúns das proteínas son a hélice alfa e a folla beta.

Estrutura primaria das proteínasEstrutura secundaria das proteínasEstrutura terciaria das proteínasEstrutura cuaternaria das proteínas
A imaxe contén ligazóns clicables
A imaxe contén ligazóns clicables
Diagrama interactivo da estrutura das proteínas, que usa como exemplo o PCNA. (PDB 1AXC)
Representación da estrutura tridimensional da proteína mioglobina. As hélices alfa móstranse en cor, e o enrolamento aleatorio en branco, non hai partes en folla beta. Esta proteína foi a primeira na que se resolveu a estrutura por cristalografía de raios X grazas aos traballos de Max Perutz e Sir John Cowdery Kendrew en 1958, que lles supuxeron gañar o Premio Nobel de Química en 1962.

A estrutura secundaria pode definirse formalmente polos enlaces de hidróxeno do biopolímero, como se observa nunha estrutura de resolución atómica. No caso das proteínas, a estrutura secundaria defínese polos patróns de enlaces de hidróxeno entre os grupos amino e carboxilo da cadea de aminoácidos. Os patróns de enlaces de hidróxeno poden estar significativamente distorsionados, o que fai que sexa difícil a determinación automática da estrutura secundaria.

A estrutura secundaria pode definirse tamén baseándose nos patróns regulares nos ángulos diedros da cadea nunha determinada rexión do gráfico de Ramachandran; así, un segmento de residuos de aminoácidos abonda con que teña determinados ángulos para poder ser considerado como unha hélice, sen importar se ten os enlaces de hidróxeno correctos. A estrutura secundaria poden proporcionala tamén os cristalógrafos en bancos de datos como PDB.

A estrutura secundaria aproximada dunha proteína pode obterse por espectroscopía. por exemplo, pode dicirse "está proteína é nun 40% unha hélice α e nun 20% unha folla β". Para as proteínas un método común de determinación é o dicroísmo circular do ultravioleta distante (170-250 nm). Un dobre mínimo pronunciado a 208 e 222 nm indica que é unha hélice α, mentres que un só mínimo a λ 204 nm ou 217 nm indica un enrolamento aleatorio ou estrutura en folla β, respectivamente. Un método menos común é a espectroscopía de raios infravermellos, que detecta diferenzas nas oscilacións de enlace dos grupos amida debido aos enlaces de hidróxeno. Finalmente, os contidos dos distintos tipos de estrutura secundaria poden estimarse con exactitude utilizando os desprazamentos químicos dun espectro de resonancia magnética nuclear (NMR) non asignado.

O concepto de estrutura secundaria foi introducida por Kaj Ulrik Linderstrøm-Lang en Stanford en 1952.

Tipos editar

 
Enlaces de hidróxeno (puntos amarelos) que estabilizan unha hélice alfa.
 
Folla beta antiparalela.

A estrutura secundaria das proteínas pode describirse polo patrón dos seus enlaces de hidróxeno do esqueleto da cadea de aminoácidos da proteína. As estruturas secundarias máis comúns son a hélice alfa e a folla beta. Outras hélices, como as hélices 310 e a hélice π, calcúlase que teñen patróns de enlaces de hidróxeno enerxeticamente favorables, pero raramente se observan nas proteínas naturais agás nos extremos das hélices α debido a un empaquetamento desfavorable do esqueleto da cadea peptídica no centro da hélice. Outras estruturas estendidas como a hélice de poliprolina e a folla alfa son raras en proteínas no estado nativo pero a miúdo hipotetízase que son importantes intermediarios no pregamento de proteínas. Os elementos estruturais secundarios máis "regulares" están enlazados por xiros apertados ou laxos, e bucles flexibles. O enrolamento aleatorio non é unha verdadeira estrutura secundaria, senón que é o tipo de conformación que indica a ausencia dunha estrutura secundaria regular.

Os distintos aminoácidos difiren na súa capacidade de formar os diversos elementos da estrutura secundaria. A prolina e a glicina considérase que "rompen as hélices" porque distorsionan a regularidade da conformación do esqueleto da hélice α, pero ambos os dous teñen a capacidade de orixinar conformacións infrecuentes e atópanse xeralmente nos xiros da estrutura. Os aminoácidos que prefiren adoptar conformacións en hélice alfa nas proteínas son: metionina, alanina, leucina, glutamato e lisina ("MALEK" no código dunha letra dos símbolos dos aminoácidos). Polo contrario, os aminoácidos aromáticos grandes (triptófano, tirosina e fenilalanina) e os aminoácidos ramificados   (isoleucina, valina, e treonina) prefiren adoptar conformacións en folla beta. Non obstante, estas preferencias non son fortes dabondo como para permitir o uso dun método fiable de predicir a estrutura secundaria contando só coa secuencia de aminoácidos.

Hai varios métodos para definir a estrutura secundaria das proteínas (por exemplo DEFINE,[1] DSSP,[2] STRIDE,[3] SST[4]).

Características estruturais das tres formas principais de hélices proteicas[5]
Atributo xeométrico hélice α hélice 310 hélice π
Residuos por volta 3,6 3,0 4,4
Traslación por residuo 1,5 Å 2,0 Å 1,1 Å
Raio da hélice 2,3 Å 1,9 Å 2,8 Å
Pendente (pitch) 5,4 Å 6,0 Å 4,8 Å

Hélice alfa editar

Artigo principal: Hélice alfa.

Na conformación en hélice alfa típica a cadea de aminoácidos xira en espiral dextroxira (xira á dereita) e en cada paso de rosca hai 3,6 aminoácidos. A hélice está estabilizada pola formación de enlaces de hidróxeno entre os aminoácidos; cada residuo de aminoácidos establece dous destes enlaces, un co cuarto aminoácido superior na hélice e outro co cuarto aminoácido inferior. En cada enlace peptídico fórmase un grupo C=O e un grupo NH, e son estes grupos os que establecen os enlaces de hidróxeno cos grupos dos aminoácidos que están encima e debaixo na hélice (sempre entre o O dun C=O e o H dun NH). Os grupos R dos aminoácidos están pola parte de fóra da hélice e non interveñen nos enlaces que a estabilizan.

Algunhas proteínas estableces hélices diferentes a estas, como o coláxeno, que forma unha hélice máis estirada e levoxira (xira á esquerda) e contén moita prolina.

Folla beta editar

Artigo principal: Folla beta.

Na conformación beta asócianse cadeas de aminoácidos paralelas, que poden ser cadeas distintas ou tramos paralelos dunha mesma cadea. Establécense pontes de hidróxeno similares aos da hélice alfa entre os grupos C=O e NH do enlace peptídico das cadeas enfrontadas. As cadeas forman planos en zigzag e os grupos R están por riba ou por debaixo dos planos. As cadeas poden discorrer de forma paralela (empezan polo mesmo extremo, o N-terminal) ou antiparalela (por onde empeza unha acaba a outra).

O código DSSP editar

 
Distribución obtida dun pdb_select dataset non redundante (marzo 2006). Estrutura secundaria asignada por DSSP; 8 estados conformacionais reducidos a 3 estados: H=HGI, E=EB, C=STC. Son visibles mesturas de distribucións gaussianas, resultantes tamén da redución de estados DSSP.

O Dicionario de Estruturas Secundarias das Proteínas ou DSSP utilízase comunmente para describir as estruturas secundarias das proteínas usando códigos dunha letra. A estrutura secundaria asígnase baseándose nos patróns de enlaces de hidróxeno como os propostos inicialmente por Pauling et al. en 1951 (antes todas es estruturas das proteínas tiñan que ser determinadas experimentalmente). Hai oito tipos de estrutura secundaria definidos no DSSP, que son:

  • G = hélice de 3 xiros (hélice 310). Lonxitude mínima 3 residuos.
  • H = hélice de 4 xiros (hélice α). Lonxitude mínima 4 residuos.
  • I = hélice de 5 xiros (hélice π). Lonxitude mínima 5 residuos.
  • T = xiro con enlaces de hidróxeno (3, 4 ou 5 xiros)
  • E = cadeas estendidas en conformación en folla β paralela ou antiparalela. Lonxitude mínima 2 residuos.
  • B = residuo nunha ponte β illada (formación de enlace de hidróxeno de folla β dun só par).
  • S = dobramento ou curva (bend) (a única non baseada en enlaces de hidróxeno).
  • C = enrolamento (coil) (residuos que non están en ningunha das conformacións anteriores).

Os 'enrolamentos' son a miúdo codificados como ' ' (espazo), C ou '-' (hifen). As hélices (G,H e I) e as conformacións en folla necesitan ter unha lonxitude razoable. Isto significa que dous residuos adxacentes da estrutura primaria deben formar o mesmo patrón de enlaces de hidróxeno. Se o patrón de enlaces de hidróxeno da hélice ou folla é demasiado curto desígnanse como T ou B, respectivamente. Existen outras proteínas don categorías asignadas de estrutura secundaria (xiros bruscos, biucles omega etc.), pero utilízanse menos frecuentemente.

Definición de enlaces de hidróxeno do DSSP editar

A estrutura secundaria defínese polos seus enlaces de hidróxeno, polo que é importante facer unha definición exacta de ponte de hidróxeno para as estruturas secundarias. A definición estándar de enlace ou ponte de hidróxeno é a do DSSP, que é un modelo puramente electrostático. Asigna cargas de   ao carbono do carbonilo e ao oxíxeno, respectivamente, e cargas de   ao nitróxeno da amida e ao hidróxeno, respectivamente. A enerxía electrostática é

 

Segundo o DSSP, existe un enlace de hidróxeno se e só se   é de menos de -0,5 kcal/mol. Aínda que a fórmula do DSSP é unha aproximación relativamente burda da enerxía do enlace de hidróxeno física, é xeralmente aceptada como unha ferramenta de traballo para definir as estruturas secundarias.

Predición de estruturas secundarias de proteínas editar

Tratar de precidir a estrutura terciaria das proteínas só coa súa secuencia de aminoácidos é un problema moi complicado, pero utilizar as definicións máis simples de estrutra secundaria é máis practicable e foi o obxecto de investigacións desde hai tempo.

Aínda que o código de oito estados do DSSP é xa unha simplificación da variación continua dos patróns de enlaces de hidróxeno presenten nunha proteína a maioría dos métodos de predición de estruturas secundarias simplifícano aínda máis a só tres estados dominantes: hélice, folla e enrolamento. A forma en que se fai a conversión de 8 a 3 estados varía segundo o método. Os primeiros métodos que se utilizaron para a predición de estruturas secundarias estaban baseados na propensión a formar hélices ou follas de cada aminoácido, ás veces acompañado de regras para estimar a enerxía libre de formar os elementos de estrutura secundaria. Tales métodos tiñan xeralmente unha exactitude de ~60% ao predicir cal dos tres estados (hélice/folla/enrolamento) adoptaba un residuo. Un incremento en precisión significativo (a case ~80%) supuxo o aproveitar os aliñamentos de secuencias múltiples; saber a distribución completa de aminoácidos que se produce nunha posición (e na súa veciñanza, a tipicamente ~7 residuos a cada lado) ao longo da evolución proporciona unha imaxe mellor das tendencias estruturais preto de cada posición. Por exemplo, unha proteína dada podería ter unha glicina nunha determinada posición, o cal por si mesmo podería suxerir que hai un enrolamento aleatorio alí. Porén, o aliñamento de secuencias múltiples podería revelar que aparecen nesa posición (e nas posicións próximas) aminoácidos que favorecen a formación dunha hélice no 95% das proteínas homólogas que abranguen case mil millóns de anos de evolución. Ademais, ao examinar a hidrofobicidade media nesa posición e nas adxacentes, a presenza do mesmo aliñamento podería tamén suxerir un patrón de accesibilidade ao solvente dos residuos concordante cunha hélice α. Tomados en conxunto, estes factores suxerirían que a glicina da proteína orixinal adopta unha estruitura en hélice α, en vez dun enrolamento aleatorio. Utilízanse varios tipos de métodos para combinar todos os datos dispoñibles para formar unha predición de 3 posibles estados, como as redes neurais, modelos de Markov agochados e máquinas de vector de apoio. Os métodos de predición modernos tamén proporcionan unha valoración da confianza das súas predicións en cada posición.

Os métodos de predición da estrutura secundaria están continuamente avaliándose por comparación, por exemplo, no experimento EVA. Despois de ~270 semanas de proba, considérse que os métodos máis exactos actualmente son PSIPRED, SAM, PORTER, PROF Arquivado 27 de novembro de 2020 en Wayback Machine. e SABLE. A principal área para mellorar os métodos parece ser a predición de cadeas β; residuos preditos con bastante certeza como cadeas β é probable que realmente o sexan, pero os métodos son propensos a pasar por alto algúns segmentos de cadea β (falsos negativos).

A predición exacta de estruturas secundarias é un elemento fundamental na predición de estruturas terciarias en todos os casos excepto nos máis simples (modelado de homoloxías). Por exemplo, un patrón predito con seguridade de seis elementos de estrutura secundaria βαββαβ é a sinatura dun pregamento de ferredoxina.

Aliñamento editar

As estruturas secundarias de proteínas e ácidos nucleicos poden utilizarse como axuda para facer aliñamentos de secuencias múltiples (co grao de homoloxía que se atope poden facerse análises filoxenéticas). Estes aliñamentos poden facerse con máis precisión pola inclusión de información da estrutura secundaria ademais da simple información da secuencia. Ás veces, grazas ás súas estruturas secundarias, poden atoparse relacións distantes entre proteínas con estruturas primarias que non se poden aliñar.

Notas editar

  1. Richards F. M., Kundrot C. E. (1988). "Identification of structural motifs from protein coordinate data: secondary structure and first-level supersecondary structure". Proteins 3 (2): 71–84. PMID 3399495. doi:10.1002/prot.340030202. 
  2. Kabsch W., Sander C. (1983). "Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features". Biopolymers 22 (12): 2577–2637. PMID 6667333. doi:10.1002/bip.360221211. [1]
  3. Frishman D., Argos P. (1995). "Knowledge-based protein secondary structure assignment". Proteins 23 (4): 566–579. PMID 8749853. doi:10.1002/prot.340230412. 
  4. Konagurthu A. S., Lesk A. M., Allison L. (2012). "Minimum Message Length inference of secondary structure from protein coordinate data". Bioinformatics 28 (12): i97–i105. PMC 3371855. PMID 22689785. doi:10.1093/bioinformatics/bts223. [SST http://lcb.infotech.monash.edu.au/sstweb]
  5. Steven Bottomley (2004). "Interactive Protein Structure Tutorial". Arquivado dende o orixinal o 19 de decembro de 2010. Consultado o 9 de xaneiro de 2011. 

Véxase tamén editar

Bibliografía editar

  • C Branden e J Tooze (1999). Introduction to Protein Structure 2a edición. Garland Publishing: Nova York, NY.
  • M. Zuker "Computer prediction of RNA structure", Methods in Enzymology, 180:262-88 (1989). (Documento clásico de algoritmos de programación dinámicos para predicir estruturas secundarias do ARN).
  • L. Pauling e R.B Corey. Configurations of polypeptide chains with favored orientations of the polypeptide around single bonds: Two pleated sheets. Proc. Natl. Acad. Sci. Wash., 37:729-740 (1951). (O artigo orixinal da conformación en folla beta).
  • L. Pauling, R.B. Corey e H.R. Branson. Two hydrogen-bonded helical configurations of the polypeptide chain. Proc. Natl. Acad. Sci. Wash., 37:205-211 (1951). (conformacións en hélices alfa e pi).

Outros artigos editar

Ligazóns externas editar