Proxecto HapMap Internacional

O Proxecto HapMap Internacional (en inglés International HapMap Project) foi unha organización que tiña como obxectivo desenvolver un mapa dos haplotipos (HapMap) do xenoma humano para describir os padróns comúns da variabilidade xenética humana. O HapMap utilízase para encontrar as variantes xenéticas que afectan á saúde, enfermidades e respostas a fármacos e factores ambientais. A información producida polo proxecto púxose á libre disposición dos investigadores.

Proxecto HapMap Internacional
Tipopáxina web e banco de dados biológicos
Na rede
http://hapmap.ncbi.nlm.nih.gov/
editar datos en Wikidata ]

Este proxecto é unha colaboración entre científicos de centros académicos, grupos de investigación sen ánimo de lucro e compañías privadas do Canadá, a China (incluíndo Hong Kong), o Xapón, Nixeria, o Reino Unido e os Estados Unidos. Iniciouse oficialmente cunha xuntanza do 27 ao 29 de outubro de 2002 e esperábase que duraría tres anos. Comprende dúas fases; os datos completos obtidos na fase I publicáronse o 27 de outubro de 2005.[1] A análise do conxunto de datos da fase II publicouse en outubro de 2007.[2] O conxunto de datos da fase III publicouse na primavera de 2009 e os resultados finais presentáronse en setembro de 2010.[3]

Introdución

editar

A diferenza das enfermidades mendelianas raras, as combinacións de diferentes xenes e o ambiente xoga un papel no desenvolvemento e progresión de doenzas comúns (como diabetes, cancro, ataque ao corazón, apoplexía, depresión e asma), ou na resposta individual a axentes farmacolóxicos.[4] Para encontrar os factores xenéticos implicados nestas doenzas, pode, en principio, facerse un estudo de asociación de xenoma completo (GWAS): obter a secuencia xenética completa de varios individuos, algúns coa enfermidade e outros sen ela, e despois buscar as diferenzas entre os dous conxuntos de xenomas. Daquela esta estratexia non era viable porque o custo da secuenciación de xenomas completos era aínda moi alta. O proxecto HapMap propuxo seguir un atallo.

Aínda que dúas persoas calquera non relacionadas comparten o 99,5% da súa secuencia de ADN, os seus xenomas difiren en localizacións de nucleótidos específicas. Ditos sitios coñécense domo polimorfismos dun só nucleótido (SNPs), e cada unha das posibles formas dos xenes resultantes denomínase alelo.[5] O proxecto HapMap céntrase soamente nos SNPs comúns, é dicir, aqueles nos que cada alelo aparece en polo menos o 1% da poboación.

Cada persoa ten dúas copias de todos os cromosomas, excepto os cromosomas sexuais nos homes. Para cada SNP, a combinación de alelos dunha persoa denomínase xenotipo. A xenotipificación é descubrir cal é o xenotipo que ten unha persoa nun sitio do xenoma determinado. O proxecto HapMap elixiu unha mostra de 269 individuos e seleccionou varios millóns de SNPs ben definidos, xenotipificou os individuos para eses SNPs e publicou os resultados.[6]

Os alelos dos SNPs que están próximos nun determinado cromosoma están correlacionados. Concretamente, se se coñece o alelo dun SNP dun determinado individuo, a miúdo poden predicirse os alelos de SNPs próximos, un proceso coñecido como imputación de xenotipo.[7] Isto débese a que cada SNP orixinouse na historia evolutiva como unha soa mutación puntual e foi despois transmitido no cromosoma rodeado doutras mutacións puntuais anteriores. Os SNPs que están separados por unha gran distancia no cromosoma non están tipicamente moi ben correlacionados, porque hai recombinación xenética en cada xeración que mestura as secuencias alélicas dos dous cromosomas homólogos. Unha secuencia de alelos consecutivos nun determinado cromosoma coñécese como haplotipo.[8]

Para encontrar os factores xenéticos implicados nunha determinada doenza, pode facerse o seguinte: primeiro identifícase unha certa rexión de interese no xenoma, posiblemente por estudos de herdanza anteriores. Nesta rexión localízase un conxunto de SNPs etiqueta (tag SNPs) dos datos de HapMap; estes SNPs están moi ben correlacionados con todos os outros SNPs da rexión. Usándoos, a imputación de xenotipo pode servir para determinar (imputar) os outros SNPs e así o haplotipo completo con alta fiabilidade. Seguidamente, determínase o xenotipo destes SNPs etiqueta en varos individuos, algúns coa enfermidade e outros sen ela. Comparando os dous grupos determínanse as localizacións probables e os haplotipos que están implicados na enfermidade.

Mostras utilizadas

editar

Xeralmente os haplotipos compártense entre poboacións, pero a súa frecuencia pode variar amplamente. Seleccionáronse catro poboacións para a súa inclusión no HapMap: 30 tríos formados por adultos e ambos os pais yorubas de Ibadan, Nixeria (YRI), 30 tríos de residentes en Utah con devanceiros do norte e oeste de Europa (CEU), 44 individuos xaponeses non relacionados de Tokio (JPT) e 45 individuos non relacionados da etnia chinesa han de Beijing, China (CHB). Aínda que os haplotipos obtidos destas poboacións deberían ser útiles para estudar moitas outras poboacións, os estudos paralelos están actualmetne examinando a utilidade de incluír poboacións adicionais no proxecto.

Todas as mostras foron recollidas por medio dun proceso de participación da comunidade cos apropiados consentimentos informados. O proceso de participación da comunidade deseñouse para identificar e intentar responder a preocupacións culturalmente específicas e dar ás comunidades participación no consentimento informado e proceso de recollida de mostras.[9]

En fase III ensambláronse 11 grupos de ascendencia globais: ASW (de ascendencia africana no suroeste dos Estados Unidos); CEU (residentes de Utah con ascendencia do norte e oeste de Europa da colección CEPH); CHB (chineses han de Beijing, China); CHD (chineses na cidade de Denver, Colorado); GIH (indios gujarati de Houston, Texas); JPT (xaponeses de Tokio, Xapón); LWK (luhyas de Webuye, Kenya); MEX (de ascendencia mexicana nos Ánxeles, California); MKK (masais de Kinyawa, Kenya); TSI (toscanos de Italia); YRI (yorubas de Ibadan, Nixeria).[10]

Fase ID Lugar Poboación Detalles
I/II CEU   Residentes de Utah con ascendencia do norte e oeste de Europa da colección CEPH Detalle
I/II CHB   Chineses han de Beijing, China Detalle
I/II JPT   Xaponeses de Tokio, Xapón Detalle
I/II YRI   Yorubas de Ibadan, Nixeria Detalle
III ASW   Descendentes de africanos do suroeste dos Estados Unidos Detalle
III CHD   Descendentes de chineses de Denver, Colorado, EUA Detalle
III GIH   Descendentes de indios gujaratis de Houston, Texas, EUA Detalle
III LWK   Luhyas de Webuye, Kenya Detalle
III MKK   Masais de Kinyawa, Kenya Detalle
III MXL   Descendentes de mexicanos dos Ánxeles, California, EUA Detalle
III TSI   Toscanos de Italia Detalle

Tamén se crearon tres paneis combinados, que facilitaban unha mellor identificación de SNPs en grupos fóra das nove mostras homoxéneas: CEU+TSI (panel combinado de residentes de Utah de ascendencia do norte e oeste de Europa da colección CEPH e toscanos de Italia); JPT+CHB (panel combinado de xaponeses de Tokio e chineses han de Beijing) e JPT+CHB+CHD (panel combinado de xaponeses de Tokio, chineses han de Beijing e chineses de Denver, Colorado). CEU+TSI, por exemplo, é un modelo mellor dos individuos do Reino Unido que CEU só.[10]

Estratexia científica

editar

Na década de 1990 era caro secuenciar xenomas completos de pacientes. Así que os National Institutes of Health (NIH) dos Estados Unidos abrazaron a idea de tomar un "atallo", que era centrarse xusto nos sitios do xenoma onde moita xente ten unha unidade do ADN variante. A teoría que está detrás deste atallo era que, como as principais enfermidades son comúns, tamén o serían as variantes xenéticas que as causan. A selección natural mantén o xenoma humano libre de variantes que danen a saúde antes de que os nenos crezan; esta teoría sostense, pero falla coas variantes que golpean en etapas posteriores da vida, o que permite a estas variantes ser bastante comúns. Por iso en 2002 os NIH empezaron un proxecto de 138 millóns de dólares chamado HapMap para catalogar as variantes comúns nos xenomas europeos, do leste de Asia e africanos.[11]

Na fase I xenotipificouse un SNP común cada 5.000 bases. En conxunto, xenotipificáronse máis dun millón de SNPs. Este traballo levouse a cabo en 10 centros usando cinco tecnoloxías de xenotipificación diferentes. A calidade era avaliada usando mostras duplicadas ou relacionadas e facendo periodicamente comprobacións de calidade onde os centros tiñan que xenotificaar conxuntos comúns de SNPs.

O equipo canadense estaba dirixido por Thomas J. Hudson da Universidade McGill de Montreal e traballou nos cromosomas 2 e e 4p. O equipo chinés liderado por Huanming Yang en Beijing e Shanghai e por Lap-Chee Tsui en Hong Kong dedicouse aos cromosomas 3, 8p e 21. O equipo xaponés dirixido por Yusuke Nakamura da Universidade de Tokio enfocouse sobre os cromosomas 5, 11, 14, 15, 16, 17 e 19. O equipo británico foi dirixido por David R. Bentley do Instituto Sanger e centrouse nos cromosomas 1, 6, 10, 13 e 20. Nos Estados Unidos interviñeron catro centros de xenotipificación: un equipo baixo a dirección de Mark Chee e Arnold Oliphant de Illumina Inc. en San Diego (estudando os cromosomas 8q, 9, 18q, 22 e X), un equipo encabezado por David Altshuler e Mark Daly do Instituto Broad de Cambridge, Massachusetts (estudou os cromosomas 4q, 7q, 18p, Y e o ADN mitocondrial), un equipo liderado por Richard Gibbs do Baylor College of Medicine de Houston, Texas (dedicouse ao cromosoma 12) e un equipo dirixido por Pui-Yan Kwok da Universidade de California, San Francisco (estudou o cromosoma 7p).

Para obter suficientes SNPs para crear o HapMap, o Consorcio financiou un gran proxecto de resecuenciación para descubrir millóns de SNPs adicionais. Estes foron enviados á base de datos pública dbSNP. Como resultado, en agosto de 2006, a base de datos incluía máis de dez millóns de SNPs e máis do 40% deles sabíase que eran polimórficos. En comparación, ao inicio do proxecto, identificáranse menos de 3 millóns de SNPs e non máis do 10% deles se sabía que fosen polimórficos.

Durante a fase II, xenotipificáronse máis de dous millóns de SNPs adicionais no xenoma por David R. Cox, Kelly A. Frazer e outros en Perlegen Sciences e 500.000 pola compañía Affymetrix.

Acceso aos datos

editar

Todos os datos xerados polo proxecto, incluíndo as frecuencias de SNP, xenotipos e haplotipos, foron situados en dominio público e están dispoñibles para descargarse.[12] Este sitio web tamén contén un buscador de xenomas que permite encontrar SNPs en calquera rexión de interese, as súas frecuencias alélicas e a súa asociación con SNPs próximos. Tamén se proporciona unha ferramenta que pode determinar SNPs etiqueta para unha rexión de interese dada. A estes datos pode tamén accederse directamente desde o programa amplamente usado Haploview.

Publicacións

editar
  1. Altshuler, David; Donnelly, Peter; The International HapMap Consortium (outubro de 2005). "A haplotype map of the human genome". Nature (en inglés) 437 (7063): 1299–1320. Bibcode:2005Natur.437.1299T. ISSN 1476-4687. PMC 1880871. PMID 16255080. doi:10.1038/nature04226. 
  2. Frazer, Kelly A.; Ballinger, Dennis G.; Cox, David R.; Hinds, David A.; Stuve, Laura L.; Gibbs, Richard A.; Belmont, John W.; Boudreau, Andrew; Hardenbol, Paul; Leal, Suzanne M.; Pasternak, Shiran (outubro de 2007). "A second generation human haplotype map of over 3.1 million SNPs". Nature (en inglés) 449 (7164): 851–861. Bibcode:2007Natur.449..851F. ISSN 1476-4687. PMC 2689609. PMID 17943122. doi:10.1038/nature06258. hdl:2027.42/62863. 
  3. Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Dermitzakis, Emmanouil; Schaffner, Stephen F.; Yu, Fuli; Peltonen, Leena; Dermitzakis, Emmanouil (setembro de 2010). "Integrating common and rare genetic variation in diverse human populations". Nature (en inglés) 467 (7311): 52–58. Bibcode:2010Natur.467...52T. ISSN 1476-4687. PMC 3173859. PMID 20811451. doi:10.1038/nature09298. 
  4. Crouch, Daniel J. M.; Bodmer, Walter F. (11 de agosto de 2020). "Polygenic inheritance, GWAS, polygenic risk scores, and the search for functional variants". Proceedings of the National Academy of Sciences 117 (32): 18924–18933. PMC 7431089. PMID 32753378. doi:10.1073/pnas.2005634117. 
  5. "Allele". Genome.gov (en inglés). National Human Genome Research Institute. 
  6. The International HapMap Consortium (decembro de 2003). "The International HapMap Project". Nature 426 (6968): 789–796. PMID 14685227. doi:10.1038/nature02168. hdl:2027.42/62838. 
  7. Deng, Tianyu; Zhang, Pengfei; Garrick, Dorian; Gao, Huijiang; Wang, Lixian; Zhao, Fuping (2022). "Comparison of Genotype Imputation for SNP Array and Low-Coverage Whole-Genome Sequencing Data". Frontiers in Genetics 12: 704118. PMC 8762119. PMID 35046990. doi:10.3389/fgene.2021.704118. 
  8. "Haplotype". Genome.gov (en inglés). National Human Genome Research Institute. Consultado o 25 de xuño de 2022. 
  9. Rotimi, Charles; Leppert, Mark; Matsuda, Ichiro; Zeng, Changqing; Zhang, Houcan; Adebamowo, Clement; Ajayi, Ike; Aniagwu, Toyin; Dixon, Missy; Fukushima, Yoshimitsu; Macer, Darryl (2007). "Community Engagement and Informed Consent in the International HapMap Project". Public Health Genomics (en english) 10 (3): 186–198. ISSN 1662-4246. PMID 17575464. doi:10.1159/000101761. 
  10. 10,0 10,1 International HapMap consortium et al. (2010). Integrating common and rare genetic variation in diverse human populations. Nature, 467, 52-8. doi
  11. Naidoo N, Pawitan Y, Soong R, Cooper DN, Ku CS (outubro de 2011). "Human genetics and genomics a decade after the release of the draft sequence of the human genome". Human Genomics 5 (6): 577–622. PMC 3525251. PMID 22155605. doi:10.1186/1479-7364-5-6-577. 
  12. Thorisson, Gudmundur A.; Smith, Albert V.; Krishnan, Lalitha; Stein, Lincoln D. (2005-11-01). "The International HapMap Project Web site". Genome Research (en inglés) 15 (11): 1592–1593. ISSN 1088-9051. PMC 1310647. PMID 16251469. doi:10.1101/gr.4413105. 

Véxase tamén

editar

Outros artigos

editar

Ligazóns externas

editar