Após mais de uma década desde seu início em 1990, e com o envolvimento de diversos centros de pesquisa ao redor do mundo, em 2003 foi concluído o Projeto Genoma Humano (Human Genome Project, HGP), que teve como objetivo sequenciar as bases que formam o genoma humano.
Com esse esforço conjunto inicial dos cientistas, cerca de 90% do genoma foi sequenciado, e a sequência referência, que representa uma coleção com o genoma de várias pessoas, foi disponibilizada para que todos pudessem consultar. O genoma de referência resultado do Projeto Genoma Humano foi e continua sendo útil para diversas pesquisas.
Entenda no post o que é um genoma de referência, qual sua importância para os exames genéticos e algumas perspectivas relacionadas.
O que é um genoma de referência
Um dos principais objetivos do Projeto Genoma Humano foi disponibilizar uma sequência que pudesse ser usada como referência para montagem de genomas, estudo de variantes, alinhamento de sequências, anotação de genes, entre outras análises.
Um genoma de referência é uma sequência reconhecidamente usada como um modelo, um padrão à qual são feitas as comparações das sequências de DNA obtidas pelos pesquisadores em seus estudos.
Mas apenas uma sequência não consegue representar a variação observada entre diferentes indivíduos. Para estabelecer um genoma de referência, são identificadas as sequências de DNA mais comumente observadas para cada trecho entre vários genomas individuais. Com base nisso, é montada uma única sequência híbrida sintética, que representa um conjunto de sequências de DNA de várias pessoas, e não apenas de um único indivíduo. Vale a pena ressaltar que os genomas de referência humano são haplóides, ou seja, representam apenas uma cópia de cada cromossomo.
O genoma de referência é uma sequência que nunca será observada por completo no genoma de um indivíduo em particular.
O genoma de referência permite pesquisar por variantes genéticas, identificando diferenças entre os organismos que podem estar relacionadas à ancestralidade, traços físicos ou predisposição de desenvolver doenças.
Qual a importância do genoma de referência para os exames genéticos de diagnóstico?
No contexto dos exames genéticos, a comparação da sequência de DNA de um indivíduo com o genoma de referência permite identificar variantes e avaliar a sua classificação, de acordo com o Colégio Americano de Genética Médica e Genômica (ACMG). O médico geneticista responsável pela análise do resultado do exame genético precisa buscar na literatura e nos bancos de dados genéticos uma possível associação entre a(s) variante(s) e o quadro clínico de um paciente.
Dessa forma, um genoma de referência é um requisito para uma análise precisa, reprodutível, padronizada e que permita identificar variantes em um exame genético.
A diversidade genética humana cabe em um genoma de referência?
O avanço das tecnologias de sequenciamento de DNA tem permitido que, diariamente, inúmeras sequências genômicas sejam obtidas e disponibilizadas em bancos de dados diversos.
Na teoria, qualquer genoma poderia ser usado como referência, mas melhores resultados de análises são obtidos quando se utiliza um genoma de referência que é representativo do maior número de indivíduos que se deseja estudar.
Quando foi lançado pela primeira vez, em 2003, o genoma de referência humano era baseado em um número pequeno de pessoas e todas de ascendência europeia. Essa foi uma questão limitante, pois populações de outras ancestralidades com diferenças significativas dessa sequência de referência poderiam não ser corretamente avaliadas.
Assim, esforços foram feitos para que a coleção de genomas usados para a montagem do genoma de referência incluísse variações representativas que são observadas nos genomas de indivíduos pertencentes a diferentes populações.
Um dos projetos que tem como objetivo disponibilizar sequências de DNA de diversas populações humanas é o Projeto de Diversidade do Genoma Humano (em inglês, Human Genome Diversity Project), que recentemente divulgou as análises de dados genéticos de 54 populações ao redor do mundo, o que aumenta significativamente o conhecimento da diversidade genética humana.
Ainda nesse contexto, algumas pesquisas reforçam que melhores resultados seriam conseguidos com genomas de referência específicos de cada população, principalmente no caso de populações miscigenadas. A falta de representação dessas populações no genoma de referência pode levar à desigualdade nos estudos clínicos, já que a identificação de variantes importantes pode estar enviesada. Por exemplo, pesquisadores podem suspeitar que uma certa variação genética está associada a uma doença quando ela é extremamente rara nos bancos de dados. Esta suspeita pode ser descartada se, ao analisar genomas diversos, for constatado que a variação é comum em outras populações.
O genoma de referência versão 38
Desde o início dos anos 2000, sucessivas versões do genoma de referência foram lançadas. A cada versão são feitas mudanças que melhoram a sua qualidade, graças ao avanço das tecnologias de sequenciamento, e também incluem dados de populações sub-representadas.
A versão mais recente, que é usada pela Mendelics em seus exames genéticos, é a versão 38. Oficialmente chamada GRCh38 (do inglês, Genome Reference Consortium Human Build 38) mas também referida como Hg38 (do inglês, human genome build 38), essa versão inclui melhorias na representação de trechos do DNA que nas versões anteriores não eram bem contemplados, como os centrômeros (porções centrais dos cromossomos que são importantes para a divisão celular).
Além disso, foram feitos avanços para aumentar a representação dos chamados haplótipos alternativos, que são sequências alternativas de referência para loci específicos que podem variar consideravelmente entre as populações. Isso permite um aumento no poder de detecção e análise de variações no DNA de indivíduos de diferentes populações.
Por fim, a tecnologia também continuará tendo papel importante na composição de um genoma de referência, principalmente com o avanço das tecnologias de sequenciamento que permitem gerar sequências longas (long reads) e ultra longas (ultra-long reads), permitindo um entendimento mais completo do genoma humano.
Em março de 2022, cientistas do Consórcio Telomere-to-Telomere (em português, telômero-a-telômero) anunciaram o sequenciamento completo do genoma humano com o uso dessas tecnologias. Os cromossomos foram sequenciados de ponta-a-ponta. |
Em seus exames, a Mendelics usa as melhores ferramentas e análises para tornar o diagnóstico genético rápido, preciso e acessível. Quer saber mais sobre os exames da Mendelics? Deixe sua pergunta nos comentários abaixo ou entre em contato com a nossa equipe pelo telefone (11) 5096-6001 ou através do nosso site.
Revisão |
O que é genoma de referência?
Um genoma de referência é uma sequência reconhecidamente usada como um modelo, um padrão à qual são feitas as comparações das sequências de DNA obtidas pelos pesquisadores em seus estudos. Como um genoma de referência é estabelecido? Para estabelecer um genoma de referência, são identificadas as sequências de DNA mais comumente observadas para cada trecho entre vários genomas individuais. Com base nisso, é montada uma única sequência híbrida sintética, que representa um conjunto de sequências de DNA de várias pessoas, e não apenas de um único indivíduo. Quais são os principais genomas de referência usados? Desde o início dos anos 2000, sucessivas versões do genoma de referência foram lançadas. A versão mais recente atualmente é chamada GRCh38 (também referida como Hg38) e inclui melhorias na representação de trechos do DNA que nas versões anteriores não eram bem contemplados, como os centrômeros. Além disso, foram feitos avanços para aumentar a representação dos chamados haplótipos alternativos. |
Referências
- Human Genome Reference Sequence. Genome.gov. Accessed July 26, 2022.
- Ballouz S, Dobin A, Gillis JA. Is it time to change the reference genome? Genome Biology. 2019;20(1).
- Kaye AM, Wasserman WW. The genome atlas: navigating a new era of reference genomes. Trends in Genetics. 2021;37(9):807-818.
- Li H, Dawood M, Khayat MM, et al. Exome variant discrepancies due to reference-genome differences. American Journal of Human Genetics. 2021;108(7):1239-1250.
- Sherman RM, Forman J, Antonescu V, et al. Assembly of a pan-genome from deep sequencing of 910 humans of African descent. Nature Genetics. 2018;51(1):30-35.
- Genome Reference Consortium.
- Lek M, Mardis ER. Envisioning the next human genome reference. Disease Models & Mechanisms. 2021;14(12).
- Van Der Auwera GA, D O’Connor B. Genomics in the Cloud: Using Docker, GATK, and WDL in Terra. O’Reilly Media; 2020
- Bergström A, McCarthy SA, Hui R, et al. Insights into human genetic variation and population history from 929 diverse genomes. Science. 2020;367(6484).
Deixe um comentário