Un cóntigo[1] ou contig (termo que se derivou en lingua inglesa de contiguous, 'contiguo') é un conxunto de segmentos de ADN solapados que xuntos representan unha rexión consenso do ADN.[2] Nos proxectos de secuenciación shotgun de xenomas completos "de abaixo a arriba", os cóntigos son datos de secuencias solapadas (lecturas);[3] en proxectos de secuenciación shotgun xerárquica "de arriba a abaixo", os cóntigos son os clons solapados que forman un mapa físico do xenoma que se utilizan para guiar a secuenciación e a ensamblaxe de secuencias.[4] Por tanto, cóntigo (contig) pode referirse tanto ao solapamento dunha secuencia de ADN coma ao solapamento de segmentos físicos (fragmentos) contidos en clons, dependendo do contexto.

Cóntigo de secuencia editar

Un cóntigo de secuencia é unha secuencia continua (non contigua) resultante da reensamblaxe dos pequenos fragmentos de ADN xerados por estratexias de secuenciación de abaixo a arriba. Este significado de cóntigo é consistente coa definición orixinal que lles deu Rodger Staden (1979).[5] A estratexia de secuenciación do ADN de abaixo a arriba implica romper o ADN xenómico en numerosos pequenos fragmentos, a secuenciación deses fragmentos, a súa reensamblaxe en cóntigos e finalmente a do xenoma completo, polo que se empeza cos fragmentos e se acaba co xenoma completo (de aí o seu nome de secuenciación "de abaixo a arriba" ou "bottom-up"). Como a tecnoloxía actual só permite a secuenciación directa de fragmentos relativamente curtos de ADN (de 300 a 1000 nucleótidos), o ADN xenómico debe ser fragmentado en pequenos fragmentos antes de empezar a secuenciar.[6] Nos proxectos de secuenciación de abaixo a arriba, o ADN amplificado é roto ao azar en fragmentos do tamaño axeitado para a secuenciación. As lecturas de secuencias obtidas seguidamente, que son os datos que conteñen as secuencias dos pequenos fragmentos, almacénanse nunha base de datos. O software de ensamblaxe[6] busca despois nesta base de datos pares de lecturas que se solapan. Ensamblar as lecturas deses pares (incluíndo, por suposto, só unha copia da secuencia idéntica) produce unha lectura contigua máis longa (cóntigo) do ADN secuenciado. Ao repetir este proceso moitas veces, ao primeiro cos pares de bases curtas de lecturas iniciais, pero despois utilizando pares cada vez máis longos que resultan da ensamblaxe dos anteriores, pode determinarse a secuencia de ADN dun cromosoma completo.

Hoxe, é común usar a tecnoloxía de secuenciación de extremos apareados (paired-end sequencing), na que se secuencian ambos os extremos de fragmentos de ADN máis longos de tamaño consistente (sempre igual). Aquí, cóntigo segue referíndose a calquera tramo de datos de secuencia contiguo creado por solapamento de lecturas. Como os fragmentos son de lonxitude coñecida, a distancia entre as dúas lecturas dos extremos de cada fragmento tamén se coñece.[7] Isto dá información adicional sobre a orientación de cóntigos construídos a partir desas lecturas e permite a súa ensamblaxe en estadais (scaffolds).

 
As lecturas solapadas de secuenciación de extremos apareados forman cóntigos; os cóntigos e ocos de lonxitude coñecida forman estadais.

Os estadais consisten en cóntigos solapados separados por ocos de lonxitude coñecida. As novas restricións en canto ás orientacións dos cóntigos permiten a localización de secuencias altamente repetitivas no xenoma. Se unha lectura dun extremo ten unha secuencia repetitiva, con tal de que o seu par compañeiro estea localizado nun cóntigo, pode coñecerse a súa localización.[7] Os ocos restantes entre os cóntigos no estadal poden despois secuenciarse por diversos métodos, incluíndo a amplificación por PCR seguida de secuenciación (para os ocos máis pequenos) e métodos de clonación de cromosoma artificial bacteriano (BAC) seguidos de secuenciación de ocos maiores.[3]

Cóntigos en cromosomas artificiais bacterianos (BAC) editar

Os cóntigos poden referirse tamén a clons solapados que forman un mapa físico dun cromosoma cando se usa a estratexia de secuenciación de arriba a abaixo (top-down) ou xerárquica.[2] Neste método de secuenciación, faise un mapado xénico de baixa resolución antes de secuenciar para proporcionar un armazón para guiar a ensamblaxe posterior das lecturas de secuencia do xenoma. Este mapa identifica as posicións relativas e o solapamento dos clons usados para a secuenciación. Os conxuntos de clons solapados que forman un tramo continuo de ADN denomínanse cóntigos; o mínimo número de clons que forman un cóntigo que cobre o cromosoma completo comprende o camiño que se utiliza para a secuenciación. Unha vez que se selecciona este camiño, os seus cromosomas artificiais bacterianos (BACs) compoñentes son rotos en fragmentos máis pequenos e secuenciados. Por tanto, os cóntigos proporcionan o armazón para a secuenciación xerárquica.[4] A ensamblaxe dun mapa de cóntigos implica varios pasos. Primeiro, o ADN é roto en fragmentos máis grandes (de 50 a 200kb), que son clonados en BACs ou PACs para formar unha biblioteca de BACs. Como estes clons deben cubrir o cromosoma (ou xenoma) completo, é teoricamente posible ensamblar un cóntigo de BACs que cobre o cromosoma completo.[2] A realidade, porén, non sempre é ideal. A miúdo permanecen ocos e con frecuencia o primeiro resultado é un estadal (que consta de cóntigos e de ocos) que cobre a rexión do mapa.[2] Os ocos entre os cóntigos poden ser pechados por varios métodos que se indican máis abaixo.

Construción de cóntigos en cromosomas artificiais bacterianos editar

Os cóntigos de BACs constrúense aliñando rexións de BACs de solapamento coñecido por medio de diversos métodos. Unha estratexia común é usar un mapado do contido de STSs (sequence-tagged sites) para detectar sitios únicos no ADN que son comúns entre BACs. O grao de solapamento é estimado, grosso modo, polo número de marcadores STS que hai en común entre os dous clons, e se hai máis marcadores en común significa un maior solapamento.[3] Como esta estratexia proporciona só unha estimación pouco exacta do solapamento, adoita a utilizarse unha análise de fragmentos de dixestión de restrición, que proporcionan unha medida máis precisa do solapamento dos clons.[3] Nesta estratexia, os clons son tratados cun ou dous encimas de restrición e os fragmentos resultantes son separados por electroforese en xel. Se son dous clons, probablemente terán sitios de restrición en común, e compartirán varios fragmentos.[4] Como o número de fragmentos en común e a lonxitue destes fragmentos é coñecido (a lonxitude xúlgase por comparación cun tamaño estándar), o grao de solapamento pode deducirse cun alto grao de precisión.

Ocos entre cóntigos editar

A miúdo persisten ocos despois de facer unha construción de cóntigos de BACs inicial. Estes ocos aparecen se a biblioteca de BACs examinada ten unha baixa complexidade, o que significa que non contén un alto número de STSs ou sitios de restrición, ou se certas rexións son menos estables en hóspedes de clonación e, por esa razón, fosen infrarrepresentadas na biblioteca.[2] Se permanecen os ocos entre cóntigos despois de realizado o mapado de puntos de referencia de STS e a pegada dactilar de restrición, pode utilizarse para pechar eses ocos a secuenciación de extremos de cóntigos. Esta estratexia de secuenciación de extremos crea esencialmente un novo STS co cal facer un exame dos outros cóntigos. Alternativamente, a secuencia final dun cóntigo pode utilizarse como cebador para o método do Primer walking ao longo do oco.[3]

Notas editar

  1. Seminario de Terminoloxía da Real Academia Galega. Jaime Gómez Márquez (coordinador), Ana María Viñas Díaz (coordinadora), Manuel González González (coordinador) (2010). Xunta de Galicia, ed. Dicionario de Bioloxía. p. 52. ISBN 978-84-453-4973-1. 
  2. 2,0 2,1 2,2 2,3 2,4 Gregory, S. Contig Assembly. Encyclopedia of Life Sciences, 2005.
  3. 3,0 3,1 3,2 3,3 3,4 Gibson, Greg; Muse, Spencer V. (2009). A Primer of Genome Science (3rd ed.). Sinauer Associates. p. 84. ISBN 978-0-878-93236-8. 
  4. 4,0 4,1 4,2 Dear, P. H. Genome Mapping. Encyclopedia of Life Sciences, 2005. doi 10.1038/npg.els.0005353.
  5. Staden R (1979). "A strategy of DNA sequencing employing computer programs". Nucleic Acids Research 7: 2601–2610. PMC 327874. PMID 461197. doi:10.1093/nar/6.7.2601. 
  6. 6,0 6,1 Dunham, I. Genome Sequencing. Encyclopedia of Life Sciences, 2005.
  7. 7,0 7,1 Fullwood MJ, Wei C, Liu ET, et al. (2009). "Next-generation DNA sequencing of paired-end tags (PET) for transcriptome and genome analyses". Genome Research 19 (4): 521–532. PMID 19339662. doi:10.1101/gr.074906.107. 

Véxase tamén editar

Outros artigos editar

Ligazóns externas editar