Secuenciación de escopeta: Diferenzas entre revisións

Contido eliminado Contido engadido
Recuperando 1 fontes e etiquetando 0 como mortas. #IABot (v2.0beta10ehf1)
m Arranxos varios, replaced: {{cite web → {{Cita web (3), {{cite journal → {{Cita publicación periódica (17)
Liña 1:
En [[xenética]], a '''secuenciación ''de escopeta''''' ou '''secuenciación ''shotgun''''' é un método utilizado para [[secuenciación do ADN|secuenciar]] febras de [[ADN]] longas. Denomínase así por analoxía co padrón de disparo case aleatorio e de rápida expansión dunha [[escopeta]].
 
O [[secuenciación de Sanger|método de terminación da cadea]] de [[secuenciación de ADN]] tradicional ("secuenciación de Sanger") só pode utilizarse para febras de ADN curtas de 100 a 1 000 [[par de bases|pares de bases]]. Debido a este límite de tamaño, as secuencias máis longas poden ser divididas en fragmentos máis pequenos que se poidan secuenciar separadamente, e estas secuencias son despois [[ensamblaxe de secuencias|ensambladas]] para dar a secuencia completa.
 
Hai dous métodos principais para este proceso de fragmentación e secuenciación. O ''[[primer walking]]'' (ou "chromosome walking") progresa ao longo do anaco enteiro de febra, anaco por anaco, mentres que a secuenciación de escopeta é un proceso máis rápido pero máis complexo, que usa fragmentos ao chou.
 
Na secuenciación de escopeta,<ref name="Staden">{{citeCita journalpublicación periódica
| last = Staden
| first = R
Liña 16:
| pmid = 461197
| doi = 10.1093/nar/6.7.2601
| pmc = 327874}}</ref><ref>{{citeCita journalpublicación periódica
| last = Anderson
| first = S
Liña 53:
Neste exemplo extremadamente simplificado, ningunha das lecturas cobre a lonxitude total da secuencia orixinal, pero as catro lecturas poden ensamblarse na secuencia orixinal usando o solapamento dos seus extremos para alinealas e ordenalas. En realidade, este proceso usa enormes cantidades de información que están inzadas de ambigüidades e erros de secuenciación. A ensamblaxe de [[xenoma]]s complexos é ademais complicada pola grande abundancia de [[Secuencias repetidas (ADN)|secuencias repetitivas]], o que significa que as lecturas curtas proceden de partes completamente diferentes da secuencia.
 
Cómpre utilizar moitas lecturas solapantes para cada segmento do ADN orixinal para superar estas dificultades e ensamblar con exactitude a secuencia. Por exemplo, para completar o [[Proxecto Xenoma Humano]], a maioría do [[xenoma humano]] foi secuenciado a unha ''cobertura'' de 12X ou maior; é dicir, cada base da secuencia final estaba presente como media en 12 lecturas diferentes. Incluso así, os métodos correntes non conseguiran en 2004 illar ou ensamblar secuencias fiables para o aproximadamente o 1% do xenoma humano ([[Eucromatina|eucromático]]).<ref name=HGS2004>{{citeCita journalpublicación periódica|last1=Human Genome Sequencing Consortium|first1=International|title=Finishing the euchromatic sequence of the human genome|journal=Nature|date=21 October 2004|volume=431|issue=7011|pages=931–945|doi=10.1038/nature03001|pmid=15496913|bibcode=2004Natur.431..931H}}</ref>
 
== Secuenciación de escopeta de xenoma completo ==
Liña 59:
=== Historia ===
 
A secuenciación de escopeta de xenoma completo de pequenos xenomas (de 4&nbsp;000 a 7&nbsp;000 pares de bases) foi suxerida por primeira vez en 1979.<ref name="Staden" /> O primeiro xenoma secuenciado por secuenciación de escopeta foi o do [[virus do mosaico da coliflor]], publicado en 1981.<ref>{{CiteCita journalpublicación periódica|last=Gardner|first=Richard C.|last2=Howarth|first2=Alan J.|last3=Hahn|first3=Peter|last4=Brown-Luedi|first4=Marianne|last5=Shepherd|first5=Robert J.|last6=Messing|first6=Joachim|date=1981-06-25|title=The complete nucleotide sequence of an infectious clone of cauliflower mosaic virus by M13mp7 shotgun sequencing|url=http://nar.oxfordjournals.org/content/9/12/2871|journal=Nucleic Acids Research|language=en|volume=9|issue=12|pages=2871–2888|doi=10.1093/nar/9.12.2871|issn=0305-1048|pmid=6269062|pmc=326899}}</ref><ref>{{CiteCita journalpublicación periódica|last=Doctrow|first=Brian|date=2016-07-19|title=Profile of Joachim Messing|url=http://www.pnas.org/content/113/29/7935|journal=Proceedings of the National Academy of Sciences|language=en|volume=113|issue=29|pages=7935–7937|doi=10.1073/pnas.1608857113|issn=0027-8424|pmid=27382176|pmc=4961156}}</ref>
 
=== Secuenciación de extremos apareados ===
Liña 65:
Unha aplicación máis ampla da técnica beneficiouse da [[teoría de secuenciación do ADN|secuenciación de extremos apareados]], coñecida coloquialmente como ''secuenciación de escopeta de dobre canón''. A medida que os proxectos de secuenciación empezaron a tratar con secuencias de ADN máis longas e complicadas, moitos grupos empezaron a decatarse de que podía obterse información útil secuenciando ambos os extremos dun fragmento de ADN. Aínda que secuenciar ambos os extremos do mesmo fragmento e facer un seguimento dos datos apareados era máis laborioso que secuenciar un só extremo de dous fragmentos distintos, o coñecemento de que as dúas secuencias estaban orientadas en direccións opostas e eran de aproximadamente a lonxitude dun fragmento era valioso para reconstruír a secuencia do fragmento diana orixinal.
 
'''Historia'''. A primeira descrición publicada do uso de extremos apareados é do ano 1990<ref>{{citeCita journalpublicación periódica
| last = Edwards
| first = A
Liña 75:
| pages = 41–47
| date = 1991
| doi = 10.1016/S1046-2023(05)80162-8 }}</ref> e formaba parte da secuenciación do [[locus]] [[Hipoxantina-guanina fosforribosiltransferase|HGPRT]] humano, aínda que o uso de extremos apareados estaba limitado a pechar ocos (na secuencia) despois da aplicación da estratexia tradicional de escopeta. A primeira descrición teórica dunha estratexia de secuenciación apareada pura, asumindo fragmentos de lonxitude constante, fíxose en 1991.<ref>{{citeCita journalpublicación periódica
| last = Edwards
| first = A
Liña 87:
| doi = 10.1016/0888-7543(90)90493-E
| issue = 4 }}
</ref> Nesa época, había un consenso na comunidade de investigadores de que a lonxitude de fragmento óptimo para a secuenciación de extremos apareados sería de tres veces a lonxitude da lectura de secuencia. En 1995 Roach et al.<ref>{{citeCita journalpublicación periódica
| last = Roach
| first = JC
Liña 100:
| pmid = 7601461
| doi = 10.1016/0888-7543(95)80219-C
| issue = 2 }}</ref> introduciron a innovación de usar fragmentos de varios tamaños e demostraron que unha estratexia de secuenciación de extremos apareados pura sería posible en dianas grandes. A estratexia foi adoptada seguidamente por [[The Institute for Genomic Research]] (TIGR) para secuenciar o xenoma da bacteria ''[[Haemophilus influenzae]]'' en 1995,<ref>{{citeCita journalpublicación periódica
| last = Fleischmann
| first = RD
Liña 110:
| date = 1995
| pmid = 7542800
| doi = 10.1126/science.7542800 |bibcode = 1995Sci...269..496F |display-authors=etal}}</ref> e despois por [[Celera Genomics]] para secuenciar o xenoma da mosca do vinagre ''[[Drosophila melanogaster]]'' en 2000,<ref>{{citeCita journalpublicación periódica
| last = Adams
| first = MD
Liña 133:
=== Pros e contras ===
 
Os que propoñen esta estratexia argumentan que é posible secuenciar o [[xenoma]] completo dunha vez usando grandes conxuntos de secuenciadores, o que fai o proceso total sexa moito máis eficiente que as estratexias máis tradicionais. Os detractores argumentan que, aínda que a técnica secuencia rapidamente grandes rexións do ADN, a súa capacidade de ligar correctamente estas rexións é dubidosa, especialmente para xenomas con rexións repetitivas. A medida que os programas de ensmblaxe de secuencias sexan máis sofisticados e o poder de computaión se faga máis barato, será posible superar esta limitación.<ref>{{citeCita journalpublicación periódica |last1=Kenner, Richardson et al |title=Shotgun sequencing: Review of progress in sequence assembly developments |journal=Methods in Biomolecular Research |date=2010 |volume=38 |issue=4 |pages=1022–1035}}</ref>
 
=== Cobertura ===
A [[cobertura (xenética)|cobertura]] (profundidade de lectura ou profundidade) é o número medio delecturas que representan un determinado [[nucleótido]] na secuencias reconstruída. Pode calcularse a partir da lonxitude do xenoma orixinal (''G''), o número de lecturas (''N''), e a lonxitude media das lecturas (''L'') como <math>N\times L/G</math>. Por exemplo, un xenoma hipotético de 2&nbsp;000 pares de bases reconstruído a partir de 8 lecturas cunha lonxitude media de 500 nucleótidos terá unha redundancia de 2x. Este prámetro tamén permite estimar outras cantidades, como a porcentaxe do xenoma cuberto polas lecturas (ás veces tamén chamada cobertura). É moi interesante que haxa unha alta cobertura na secuenciación de escopeta porque pode superar os erros na ''chamada de bases'' (ou ''[[base calling]]'', a asignación de nucleobases a picos do [[cromatograma]]) e de ensamblaxe. A [[teoría de secuenciación do ADN]] trata das relacións estes estas cantidades.
 
Ás veces faise unha distinción entre a ''cobertura da secuencia'' e a ''cobertura física''. A cobertura da secuencia é o número medio de veces que se le unha base (como se describiu antes). A cobertura física é o número medio de veces que se le unha base ou é abranguida por lecturas de pares apareados.<ref name="MeyersonFig1">{{CiteCita journalpublicación periódica | last1 = Meyerson | first1 = M. | last2 = Gabriel | first2 = S. | last3 = Getz | first3 = G. | doi = 10.1038/nrg2841 | title = Advances in understanding cancer genomes through second-generation sequencing | journal = Nature Reviews Genetics | volume = 11 | issue = 10 | pages = 685–696 | year = 2010 | pmid = 20847746| pmc = }}</ref>
 
== Secuenciación de escopeta xerárquica ==
Liña 148:
 
O xenoma amplificado é primeiramente fragmentado en anacos máis grandes (de 50-200kb) e clonado nun hóspede bacteriano usando [[cromosoma artificial bacteriano|BACs]] ou [[cromosoma artificial derivado de P1|PACs]]. Como se fragmentaron múltiples copias de xenomas de forma aleatoria, os fragmentos contidos neses clons teñen extremos diferentes, e con suficiente cobertura (ver sección máis arriba) é teoricamente posible atopar un '''armazón''' de [[Cóntigo#Cóntigos de cromosomas artificiais bacterianos|cóntigos de BAC]] que cobre o xenoma enteiro. Esta armazón denomínase '''camiño de baldosas''' (''tilling path''). Unha vez que se encontra un camiño de baldosas, os BACs que forman este camiño son fragmentados ao chou en pequenos fragmentos e poden secuenciarse usando o método de escopeta a escala menor.
[[Ficheiro:Tiling path.png|miniatura|Un cóntigo BAC que cobre a área xenómica enteira de interese constitúe o camiño de baldosas.]]
 
Aínda que as secuencias completas de cóntigos de BACs non se coñecen, as orientacións relativas entre eles si se saben. Hai varios métodos para deducir esta orde e seleccionar os BACs que constitúen o camiño de baldosas. A estratexia xeral supón identificar as posicións de clons unha en relación doutra e despois seleccionar o menor número de clons necesarios para formar un armazón contiguo que cubra toda a área de interese. A orde dos clons dedúcese determinando o modo no cal se solapan.<ref name="genome map">Dear, P. H. ''Genome Mapping''. Encyclopedia of Life Sciences, 2005. {{doi|10.1038/npg.els.0005353}}.</ref> Os clons que se solapan poden ser identificados de varias maneiras. Pode hibridarse unha pequena sonda etiquetada radioactivamente ou quimicamente que contén un [[sitio etiquetado por secuencia]] (STS ou ''sequence-tagged site'') nunha micromatriz sobre a cal se imprimen os clons.<ref name="genome map" /> Deste modo, identifícanse todos os clons que conteñen un secuencia determinada no xenoma. O extremo dun destes clons pode despois ser secuenciado para render unha nova sonda e o repetirse o proceso nun método chamado [[chromosome walking]].
Liña 157:
 
== Secuenciación de seguinte xeración ==
A secuenciación de escopeta clásica estaba baseada no método de secuenciación de Sanger e esta foi a técnica máis avanzada para a secuenciación de xenomas aproximadamente durante o período 1995–2005. A estratexia de escopeta ou ''shotgun'' aínda se aplica hoxe en día; porén, faise usando outras tecnoloxías de secuenciación, chamadas [[secuenciación do ADN#Métodos de seguinte xeración|secuenciación de seguinte xeración]]. Estas tecnoloxías producen lecturas máis curtas (de aproximadamente 25–500 pares de bases), pero moitos milleiros ou millóns de lecturas nun tempo relativamente curto (da orde dun día).<ref>{{citeCita journalpublicación periódica
| last = Karl
| first = V
Liña 168:
| pmid = 19246620
| doi = 10.1373/clinchem.2008.112789 |display-authors=etal}}</ref>
Isto ten como resultado unha alta cobertura, pero o proceso de ensamblaxe require un uso máis intensivo da computación. Estas tecnoloxías son moi superiores á secuenciación de Sanger debido ao alto volume de datos e o tempo relativamente curto que se tarda en secuenciar un xenoma completo.<ref>{{citeCita journalpublicación periódica
| last = Metzker
| first = Michael L.
Liña 183:
== Secuenciación de escopeta metaxenómica ==
 
Para determinar a especie/cepa do organismo do cal procede o ADN examinado, é dabondo ter lecturas de 400-500 pares de bases con tal que o seu xenoma sexa xa coñecido, usando por exemplo un software de clasificación taxonómica [[K-mer|baseado en k-mer]]. Con millóns de lecturas de secuenciación de seguinte xeración de mostras ambientais, é posible ter unha visión completa de calquera [[microbioma]] complexo formado por miles de especies, como a [[flora intestinal]]. As vantaxes sobre a [[secuenciación de amplicón]] de [[ARNr de 16S]] son: non está limitada a bacterias; pode facer unha clasificación ao nivel de cepas, mentres que a secuenciación de amplicón só o fai a nivel de xénero; e a posibilidade de extraer [[xene]]s completos e especificar as súas funcións como parte do metaxenoma.<ref>{{citeCita journalpublicación periódica
| last1 = Roumpeka
| first1 = Despoina D.
Liña 196:
| doi = 10.3389/fgene.2017.00023
}}</ref>
A sensibilidade da secuenciación metaxenómica faina unha elección atractiva para o uso clínico.<ref>{{citeCita journalpublicación periódica
| last1 = Gu
| first1 = Wei
Liña 209:
| doi = 10.1146/annurev-pathmechdis-012418-012751
}}</ref>
Porén, enfatiza o problema da contaminación da mostra ou a canle de secuenciación.<ref>{{citeCita journalpublicación periódica
| last1 = Thoendel
| first1 = Matthew
Liña 233:
=== Bibliografía ===
{{Refempeza}}
*{{citeCita web | title=Shotgun sequencing comes of age | work=The Scientist | url=http://www.the-scientist.com/news/20021231/06 | accessdate=31 de decembro de 2002}}
*{{citeCita web | title=Shotgun sequencing finds nanoorganisms - Probe of acid mine drainage turns up unsuspected virus-sized Archaea
| work=SpaceRef.com| url=http://www.spaceref.com/news/viewpr.html?pid=21532
| accessdate=23 de decembro de 2006}}
*{{citeCita web | title=Genomic shotgun sequencing | work=biology science | url=http://www.cd-genomics.com/gene/shotgun.htm | accessdate=11 de abril de 2009 | urlarquivo=https://www.webcitation.org/6HK9AmtxZ?url=http://www.cd-genomics.com/gene/shotgun.htm | dataarquivo=12 de xuño de 2013 | urlmorta=si }}
{{Reftermina}}