Glossário de genética III

Glossário de genética III

Entenda termos importantes sobre alterações genéticas

Na terceira edição do Glossário de Genética, descrevemos os principais termos utilizados quando falamos sobre alterações no nosso genoma.

Quer saber mais? Leia as edições I e II do nosso Glossário para conhecer os principais termos em genética, genômica e técnicas de sequenciamento.

 

Mutação

A palavra “mutação” é amplamente usada para comunicar qualquer diferença entre a sequência de bases no genoma individual que está sendo sequenciado e a sequência mantida em um genoma de referência. 

Contudo, também é comumente interpretada como sinônimo de uma alteração que ‘causa uma doença’, por isso, tem uma conotação historicamente negativa. 

Temos entre 4 a 5 milhões de “mutações” em nosso DNA. Porém, a maioria dessas alterações não estão associadas a doenças, e podem estar ligadas a outras características (exemplo: cor do olho). 

Após a popularização dos estudos genômicos e o maior conhecimento do genoma humano, o uso da palavra “mutação”, passou a ser evitada e substituída pelo termo neutro ‘variante’.

 

Variante

Qualquer diferença entre a sequência do genoma individual que está sendo sequenciado em relação a um genoma de referência. 

As variantes podem ser classificadas com base no seu impacto clínico ou o tipo de alteração que causam na sequência do DNA.

As classificações clínicas refletem a probabilidade da variante causar uma doença. São 5 categorias

  1. Patogênica,
  2. Provavelmente patogênica,
  3. Benigna,
  4. Provavelmente benigna e,
  5. Significado incerto. 

Quanto ao tipo de alteração, temos as seguintes categorias:

 

Variantes de base única (Single Nucleotide Variant, SNV)

As variações de nucleotídeo ou base única (SNV) são alterações de um único par de bases. Envolvem a substituição de um par de base na sequência do DNA, o que pode ter diferentes consequências sobre a proteína codificada.

 

Indels

São inserções ou deleções de uma, ou mais bases na sequência do DNA. Esses tipos de alterações, quando ocorrem dentro de éxons, podem ter diferentes consequências sobre a proteína codificada, incluindo a adição ou exclusão de aminoácidos, ou mesmo a mudança da matriz de leitura do código genético e inclusão de um sinal de parada prematuro da formação da proteína, ou ainda o alongamento dela.

 

Variantes estruturais (Structural Variation, SV)

Variantes estruturais (SV) compreendem uma ampla classe de alterações genômicas, normalmente definidas como alterações de 50 pares de bases ou mais, incluindo deleções, duplicações, inserções, inversões e translocações.

O tamanho da SV não necessariamente está ligado ao seu efeito no funcionamento do organismo. 

Grandes pedaços de cromossomos podem ser movidos de um ponto para o outro (translocações) ou invertidos (inversão), sem efeitos negativos aparentes. Por outro lado, deleções ou adições de múltiplas bases dentro de um gene podem resultar em uma proteína não funcional, com graves consequências para o funcionamento do organismo. 

 

Variações do Número de Cópias (Copy Number Variation, CNV)

As variantes de número de cópias (CNV) são um tipo de SV em que trechos do DNA variam em seu número de cópias (normalmente temos duas cópias, uma paterna e uma materna).

As CNVs podem incluir um ou vários genes, fazendo com que um indivíduo tenha quatro cópias de um gene, em vez das duas habituais, outra pessoa tenha três e outra pessoa cinco.

As CNVs podem resultar em níveis mais elevados ou diminuídos de proteínas sendo produzidas, podendo ou não causar doenças.

Já foi demonstrado que alguns genes e regiões do genoma possuem CNVs sem impacto funcional. Por outro lado, CNVs em genes atuantes no desenvolvimento neuropsicomotor, podem aumentar o risco para distúrbios do neurodesenvolvimento, por exemplo.

 

Alterações Cromossômicas

As alterações (ou anomalias) cromossômicas são variações no número ou na estrutura (forma ou tamanho) dos cromossomos.

O genoma humano é constituído de 46 cromossomos: 2 conjuntos de 22 cromossomos homólogos autossômicos e 2 cromossomos sexuais, X e Y. As alterações cromossômicas numéricas são aquelas que, de alguma forma, afetam esse número.

O número normal do conjunto total de cromossomos (44 autossomos + 2 cromossomos sexuais) é chamado de euploidia

Se todo o conjunto total aumenta é considerado uma poliploidia (triploidia – 69 cromossomos, tetraploidia – 92 cromossomos). 

Se o número de algum cromossomo específico é alterado, chamamos de aneuploidias (ex.: trissomia do cromossomo 21, conhecido como Síndrome de Down).

As alterações cromossômicas estruturais são variações que alteram a estrutura do cromossomo e incluem: deleções, duplicações, inversões, translocações, cromossomo em anel e isocromossomos. 

Mesmo que a estrutura e organização dos cromossomos esteja alterada, se a quantidade de material genético estiver preservada, a alteração é chamada de balanceada ou equilibrada. Se houver partes cromossômicas adicionais ou a menos é chamada de desequilibrada, ou desbalanceada.

 

Além das classificações das variantes, outros termos também são muito frequentes:

Variante de novo

Variante de novo, também chamada de “mutação nova” é uma variante que surgiu em um indivíduo pela primeira vez e não é herdada de um dos pais.

Podem ser causadas por acaso, por falhas no processo de replicação do DNA durante a divisão celular e formação dos gametas, por reparo de erros no processamento do DNA ou devido a eventos mutagênicos, como exposição à radiação e produtos químicos específicos. Como em todas as variantes, as variantes de novo podem ter consequências funcionais e causar doenças. 

 

Variabilidade genética/genômica

A variabilidade genética é todo o conjunto de diferenças entre as sequências de DNA (genoma) dos indivíduos.

O genoma humano possui três bilhões de pares de bases em sua sequência. Sendo que 99.5% dessa sequência é comum entre indivíduos, e os 0.5% restantes faz com que nenhum ser humano seja igual ao outro.

A variabilidade genética é uma parte muito importante da vida. É esse conjunto de variações que permite que os organismos se adaptem a diferentes ambientes e situações adversas, sendo essencial para a sobrevivência das espécies. 

Determinadas variações genéticas podem ser a causa direta de doenças raras (como a Atrofia Muscular Espinhal, AME), podem resultar em uma maior ou menor predisposição para o desenvolvimento de doenças comuns (como diabetes e hipertensão), mas também podem resultar em vantagens adaptativas, ou ainda podem não ter qualquer consequência na saúde. 

 


Quer entender mais sobre termos importantes na genética e genômica? Leia também a primeira e a segunda parte do nosso glossário.

Glossário de genética II

Glossário de genética II

Entenda termos importantes em genética e genômica 

 

Genética

Genética é o estudo dos genes e como eles são herdados.

Os termos genética e genômica são frequentemente usados de forma intercambiável. A genética é o estudo dos genes, enquanto a genômica é o estudo de todo o DNA necessário para construir um organismo, incluindo os genes. 

 

Genômica 

É o estudo dos genomas de humanos e todos os organismos vivos.

Este termo também é usado quando se fala de técnicas relacionadas ao laboratório de biologia molecular e à bioinformática. 

O estudo da genômica em humanos concentra-se em áreas do genoma associadas à saúde e à doença. A genômica está impactando a medicina em vários aspectos, incluindo a predição de risco, prevenção, diagnóstico, manejo, prognóstico e até o tratamento de doenças raras, câncer, doenças infecciosas, entre outras. Além disso, também é essencial para o desenvolvimento de novas terapias direcionadas, como no caso do tratamento da Fibrose Cística e da Atrofia Muscular Espinhal. 

 

Bioinformática

É a aplicação da ciência da computação e tecnologia da informação para solucionar problemas biológicos, por exemplo, algoritmos (conjunto de instruções e regras) de análise de dados genômicos, e gerenciamento e armazenamento de dados.

A interpretação dos dados é uma parte importante do processo de análise genômica, desde a coleta de uma amostra do paciente até a entrega dos resultados. A bioinformática é crucial para a interpretação desses dados.

Conheça o Abracadabra, o software de análise de dados genômicos da Mendelics.

 

Sequenciamento

Técnica utilizada em laboratórios para determinar a ordem exata dos pares de bases do DNA em uma ou múltiplas regiões de interesse, ou até mesmo no genoma completo.

O sequenciamento refere-se a todos os métodos de sequenciamento, incluindo o Sanger e o sequenciamento de Nova Geração (NGS). O método usado dependerá do contexto clínico – às vezes pode ser necessário sequenciar todo o genoma de um indivíduo, enquanto em outros momentos, uma pequena região ou apenas um gene é suficiente.

 

Sequenciamento Sanger 

O sequenciamento de Sanger foi uma revolução nas tecnologias de sequenciamento quando foi descrito, por Frederick Sanger, em 1977 e foi usado no Projeto Genoma Humano para sequenciar pela primeira vez o genoma humano completo.

O método de Sanger é considerado uma tecnologia de “primeira geração”, e é mais utilizada no sequenciamento de fragmentos de DNA de até 1000 pares de bases.

Embora os métodos da nova geração sejam mais baratos e rápidos, o sequenciamento Sanger ainda é usado em algumas situações, como para confirmar a presença de algumas mutações já conhecidas.

 

Sequenciamento de Nova Geração (Next Generation Sequencing, NGS)

 

É o termo usado para descrever as técnicas modernas de sequenciamento de DNA de alto rendimento que surgiram depois do sequenciamento Sanger. Também pode ser chamado de Sequenciamento Massivo em Paralelo (Massively parallel sequencing) ou Sequenciamento de Próxima Geração.

O sequenciamento Sanger foi um grande avanço na tecnologia de sequenciamento, porém o NGS permite resultados precisos de maneira mais rápida e muito mais econômica.

Enquanto o Sanger sequencia os fragmentos de DNA individualmente, o NGS é uma técnica de sequenciamento em larga escala, no qual milhões e até bilhões de fragmentos são sequenciados simultaneamente em uma única corrida

O NGS também possibilita sequenciar centenas de amostras em uma única corrida.  As inovações técnicas do NGS também permitiram reduzir os custos do sequenciamento, que vêm decrescendo significativamente nos últimos 18 anos. 

 

Sequenciamento do genoma completo (Whole Genome Sequencing, WGS)

É o sequenciamento de quase todo o genoma, incluindo éxons, íntrons e regiões intergênicas. Pode incluir o genoma mitocondrial ou não.

Por sequenciar todo o DNA, o WGS é mais caro e requer mais capacidade de processamento e armazenamento dos dados gerados. Por isso, é mais utilizado no contexto de pesquisas científicas, no estudo de genomas populacionais ou na busca de alterações que causam doenças ainda sem causa elucidada, por exemplo.

 

Sequenciamento do exoma completo (SCE ou Whole Exome Sequencing, WES)

 

É o sequenciamento de todos os éxons (regiões codificantes dos genes) do genoma, e que representa cerca de 2% deste. O conjunto de todos os éxons do genoma é chamado de exoma, por isso, o SCE é popularmente chamado de ‘exoma‘.

O SCE é uma ferramenta poderosa para diagnosticar milhares de doenças genéticas. É indicado para pacientes com doença genética já suspeitada clinicamente (exemplo: síndromes genéticas específicas, beta-talassemia), para pacientes com quadros clínicos de causa desconhecida e que podem ter origem genética (exemplo: deficiência intelectual) e também pode ser solicitado quando há suspeita de doença que pode ser causada por um entre muitos genes diferentes e para a qual não exista outro exame genético mais apropriado.

 

Sequenciamento de painel de genes

Um exame genético que utiliza o NGS para sequenciar um grupo de genes associados ao desenvolvimento de uma condição/doença ou à uma coleção de sintomas clínicos sob investigação. Por exemplo, o Painel de doenças tratáveis ou Painel de Epilepsias.

Identificar uma variante responsável pela doença/condição pode ser um processo extremamente demorado. O painel de genes pode ser útil para focar a análise genética naqueles genes que já estão associados à condição suspeita ou às manifestações apresentadas pelo paciente, reduzindo o tempo e vieses nas análises.

O tamanho do painel pode variar, de poucos genes a mais de 100 genes.

 


Quer entender mais sobre termos importantes na genética e genômica, leia também a primeira parte do nosso glossário aqui.

Glossário de genética

Glossário de genética

Termos que você precisa saber em genética e genômica 

 

Ácido desoxirribonucleico (DNA)

A molécula química que contém ou ‘codifica’ informações genéticas. O DNA é composto de quatro bases químicas diferentes conhecidas como ‘A’ (adenina), ‘C’ (citosina), ‘G’ (guanina) e ‘T’ (timina).

As informações contidas no DNA incluem todas as informações necessárias para a formação, crescimento e manutenção de um indivíduo – seja humano, outro animal, planta, bactéria ou fungo. Alterações no DNA de um organismo podem ter um impacto significativo em seu fenótipo.

 

Bases 

Componentes do DNA ou RNA. No DNA, existem quatro bases químicas: adenina (A), guanina (G), timina (T) e citosina (C). No RNA, as bases são idênticas, exceto a timina, que é substituída pelo uracil (U).

A ordem das bases em um gene determina a ordem dos aminoácidos em uma proteína. Alterações nas bases podem resultar em alterações nos aminoácidos e na estrutura ou função da proteína produzida pelo gene. Isso pode resultar em alterações no indivíduo, como diferenças na cor dos cabelos ou dos olhos, ou no desenvolvimento de doenças.

 

Nucleotídeo

Moléculas que servem como blocos de construção de DNA e RNA. Os nucleotídeos consistem em uma base nitrogenada – adenina, citosina, guanina ou timina (uracil no RNA), açúcar (desoxirribose no DNA, ribose no RNA) e um grupo fosfato.

Cada trinca de três nucleotídeos nas seções de codificação de proteínas do genoma codifica um aminoácido. Alterações na sequência nucleotídica podem afetar o aminoácido codificado e alterar a forma e a função da proteína resultante.

Quando se diz que o DNA consiste em 3 bilhões de bases ou que uma única alteração de uma base do DNA de uma pessoa é a causa de uma doença, esta é uma referência à base nitrogenada dentro de cada nucleotídeo.

 

Códon

Uma sequência de três bases no DNA ou RNA que contém as instruções para a colocação de um aminoácido específico na produção de uma proteína.

Alterações nas bases dentro de um códon podem ter uma variedade de efeitos no aminoácido e proteína resultante. 

Frequentemente não há efeito nenhum, pois nosso código genético é redundante, isto é, a maioria dos aminoácidos pode ser codificada por mais de um códon diferente. Por exemplo, ambos os códons GGT e GGC codificam o aminoácido glicina, portanto, a alteração do DNA não afetará o aminoácido codificado ou a proteína produzida. 

Outras alterações no códon podem afetar o aminoácido resultante, por exemplo, GGT alterado para GAT altera o aminoácido glicina para o aspartato. Isso pode ou não resultar em efeitos significativos no organismo, mas é possível que essa pequena alteração possa ter um grande efeito funcional. Outras mudanças podem inserir ou excluir bases que podem afetar vários códons ao mesmo tempo, em geral, impactando significativamente a proteína final.

 

Aminoácido

Blocos químicos de construção dos quais as proteínas são feitas. Existem 20 tipos diferentes de aminoácidos que podem ser combinados de várias formas para produzir muitas proteínas diferentes no nosso organismo.

A ordem dos aminoácidos em uma proteína afeta sua estrutura e função. Essa ordem é codificada pelo DNA no gene correspondente. Algumas alterações na sequência de DNA podem alterar o aminoácido codificado e, portanto, a proteína final.

Ao identificar uma alteração no DNA, é possível inferir se isso irá alterar o aminoácido codificado e se poderá ou não ter um impacto funcional. Esta informação pode ser usada para estabelecer a causa de uma doença e se um tratamento específico é apropriado.

 

Gene

Um segmento de DNA, com uma sequência específica da nucleotídeos, na qual está codificada a informação para formação de um polipeptídeo específico. Ou seja, a sequência de DNA que contém as instruções biológicas para a produção de uma cadeia polipeptídica, geralmente uma proteína ou componente específico de uma proteína.

Os genes são essenciais para todas as funções do organismo. Alterações nos genes podem levar a falha no funcionamento ou não-formação das proteínas codificadas.

A maioria das alterações no DNA funcionais identificadas no genoma estão dentro dos genes. A maioria das doenças raras é causada por variações nos genes.

 

Éxon

Seções dentro dos genes que possuem as sequências de codificação das proteínas e que, portanto, serão incluídas no mRNA (RNA mensageiro) final processado. 

Os éxons contêm informações que resultam diretamente na ordem final dos aminoácidos dentro da proteína. Os íntrons estão intercalados entre os éxons e são removidos durante o processamento do RNA mensageiro, em um processo conhecido como splicing. Alterações na sequência do éxon podem resultar em alterações na sequência de aminoácidos e na proteína resultante.

 

Íntron

Seções dos genes, que não codificam aminoácidos, e que são removidas do RNA mensageiro, antes da tradução em uma proteína

Os íntrons podem conter informações importantes que ajudam a regular a produção das proteínas e outros processos moleculares, mas não codificam aminoácidos. Eles são removidos durante o processamento do RNA mensageiro, em um processo conhecido como splicing. Alterações em sequências específicas do íntron podem resultar em erros de splicing, afetando a proteína final, ou então podem ter impacto na regulação gênica. 

 

Polipeptídeos 

Uma cadeia de aminoácidos.

Os genes codificam cadeias de aminoácidos chamados polipeptídeos. Uma proteína pode ser constituída de um único polipeptídeo ou vários polipeptídeos. Alterações em um polipeptídeo podem afetar a estrutura e a função da proteína. Compreender como as alterações afetam a proteína final pode ser importante para entender como as variações genômicas resultam em uma doença ou condição específica e podem ajudar no desenvolvimento de tratamentos.

 

Proteína

Molécula grande composta por uma ou mais cadeias de aminoácidos, cuja sequência é determinada pelo DNA. O corpo humano tem mais de 100.000 proteínas diferentes, realizando muitas funções diferentes.

As proteínas são essenciais para as células e, portanto, para todo o nosso organismo, funcionar corretamente. Em muitos casos, é uma falha em uma proteína que contribui para a progressão de uma doença ou condição.

 

Genoma

O material genético completo de um organismo, incluindo as regiões gênicas que fornecem as instruções para a produção de proteínas (2% do genoma) e as sequências não codificadoras (98% do genoma).

O sequenciamento de genoma, ou de partes do genoma, está se tornando parte dos cuidados de saúde de rotina para auxiliar na prevenção, diagnóstico e tratamento de doenças.

 

Cromossomos

Pacotes de DNA firmemente empacotados juntamente a proteínas associadas. Quase todas as células humanas têm um conjunto de 46 cromossomos, divididos em 23 pares, sendo que 22 pares são autossômicos, e o 23º par são os cromossomos sexuais (X ou Y).

Os cromossomos contêm quase todo o DNA em uma célula humana, com exceção do DNA encontrado nas mitocôndrias. Alterações nos cromossomos podem levar a uma variedade de condições. As maiores alterações são aneuploidias, onde há uma cópia adicional ou uma cópia faltante de um dos cromossomos, como visto na síndrome de Down (trissomia do 21), síndrome de Edward (trissomia 18) e síndrome de Patau (trissomia 13).

Há também mudanças nas quais partes dos cromossomos estão ausentes, duplicadas ou movidas de um cromossomo para outro. O complemento de cromossomos de um organismo pode ser visualizado através de um cariótipo.