Capítulo 3 Polimorfismo Genéticos e Marcadores Moleculares


Uma pequena região gênica controla as mudanças de cor na cabeça dos tentilhões de Gould (_Erythrura gouldiae_). Ilustrado em Des Murs ([1849](https://www.biodiversitylibrary.org/item/109479#page/9/mode/1up)).

Figura 3.1: Uma pequena região gênica controla as mudanças de cor na cabeça dos tentilhões de Gould (Erythrura gouldiae). Ilustrado em Des Murs (1849).


Toomey et al. 2018. doi: 10.1098/rspb.2018.1788

Kim et al. 2019. doi: 10.1038/s41467-019-09806-6


3.1 Mutações \(\times\) Polimorfismos

Uma mutação é uma variante nova, tendo aparecido recentemente na linhagem germinativa.

Uma variante é dita mutante quando direta e abertamente causa uma doença e/ou reduz a aptidão.

Um polimorfismo é uma variante ancestral em uma população, herdada intacta dos parentais.

Uma variante é dita polimórfica quando não causa doença, é neutra, ou influência levemente características quantitativas.

Uma mutação em uma população pode se tornar um polimorfismo em outra se conferir uma vantagem seletiva e aumentar em freqüência.

Arbitrariamente, mutações e polimorfismos são definidos com base nas suas frequêcnias em uma população, onde:

\[{Mutação} < 1 \%\]


\[{Polimorfismo} > 1 \%\]


A Genética mendeliana aborda associações entre Fenótipo e Genótipo, estando restrita a um pequeno número de espécies modelo. Nesta somente um número reduzido de características estão disponíveis para análise por meio de polimoefismos genéticos, que comumente estão associadas à características recessivas deletérias.

A Genética molecular envolve a análise direta da informação genética, e pode abranger todas as espécies. Nesta está disponível um número enorme de marcadores moleculares, permitindo a análise de regiões expressas e não expressas do genoma.

Polimorfismos genéticos – A ocorrência em uma população (ou entre populações) de várias formas fenotípicas associadas a alelos de um gene ou homólogos de um cromossomo.

Marcadores moleculares – Todo e qualquer fenótipo molecular oriundo de um gene expresso (RNA ou proteína) ou de um segmento de DNA que corresponde a regiões codificantes ou não de um genoma.


As informações genéticas usadas em estudos populacionais podem ser obtidas a partir de polimorfismos genéticos e marcadores moleculares.

Figura 3.2: As informações genéticas usadas em estudos populacionais podem ser obtidas a partir de polimorfismos genéticos e marcadores moleculares.


3.2 Dinâmica evolutiva e ecológica dos polimorfismos


Ao longo das geraçoes (tempo), variantes genéticas podem surgir (I) e desaparecer (III), enquanto sao (IV) ou não (II) estruturadas / influenciadas pelos ambientes (espaço).

Figura 3.3: Ao longo das geraçoes (tempo), variantes genéticas podem surgir (I) e desaparecer (III), enquanto sao (IV) ou não (II) estruturadas / influenciadas pelos ambientes (espaço).


I. Surgimento de novas variantes genéticas (Mutação).

  1. Variantes restritas geograficamente se dispersam ao longo dos ambientes (fluxo gênico).

  2. Perda de variantes genéticas (deriva / seleção).

  3. Organização da variação ao longo de um gradiente ambiental / geográfico (seleção).

3.3 Evolução dos polimorfismos em diferentes escalas

Na microevolução, marcadores moleculares dizem respeito a variantes genéticas encontradas em populações de uma mesma espécie, sendo utilizadas em genética de populações.

Na macroevolução, esses marcadores correspodem a regiões gênicas homólogas (ortólogas) de diferentes espécies, que acúmulam mutações ao longo do tempo, e podem ser utilizados em filogenética.


Anagênese – Evolução dentro de um ramo evolutivo.

Cladogênese – Evolução entre ramos evolutivos.


As mudanças evolutivas ao longo das gerações (anagênese) em relação ao processo de diversificação (cladogênese).

Figura 3.4: As mudanças evolutivas ao longo das gerações (anagênese) em relação ao processo de diversificação (cladogênese).


A evolução de sequências de DNA, e dos produtos por elas codificados, é produto dos padrões e taxas de mudança ao longo do tempo evolutivo.

Assim, diferentes questões podem e devem ser abordadas por diferentes marcadores moleculares.

Estudos multi-loci evidenciam conflitos e corroboram congruências entre as histórias evolutivas das diferentes regiões gênicas.

Diferentes marcadores 'contam' diferentes histórias evolutivas, que nem sempre estão de acordo com o processo de diversificação.

Figura 3.5: Diferentes marcadores ‘contam’ diferentes histórias evolutivas, que nem sempre estão de acordo com o processo de diversificação.


3.4 Padrões de herança

A localização genômica de uma região gênica pode determinar diferentes padrões de herança.

  • Herança biparental – genes co-dominantes (contribuição de ambos os sexos) em regiões gênicas nucleares autossômicas e pseudo-autossômicas; essas regiões sofrem recombinação na meiose.

  • Herança uniparental – genes dominantes (contribuiçao de somente um dos sexos) em regiões gênicas nucleares no cromossomo Y (herança patrilinear) e extra-nucleares no DNA mitocondrial (herança matrilinear); essas regiões não sofrem recombinação.


Os padrões de herança biparental e uniparental em regiões gênicas autossômicas (nuclear) e mitocondriais (extra-nuclear).

Figura 3.6: Os padrões de herança biparental e uniparental em regiões gênicas autossômicas (nuclear) e mitocondriais (extra-nuclear).


3.5 Taxas de mutação

A função ou estrutura de uma região gênica pode determinar diferentes taxas de mutação.

  • Regiões funcionais ou codificantes – baicas taxas mutacionais pois sofrem uma pressão de seleção (positivas ou negativas) dependente da importância da função para a célula/organismo.

  • Regiões não-funcionais ou não-codificantes – apresentam acúmulo de mutações devido às baixas pressões seletivas (neutras).

  • Regiões de repetição in tandem – evolução por derrapagem (slippage) da replicacão; mutações dinâmicas a cada ciclo replicativo.


As taxas de mutação em genes codificantes de proteínas estão relacionadas à função desses genes devido a diferentes pressões de seleção.

Figura 3.7: As taxas de mutação em genes codificantes de proteínas estão relacionadas à função desses genes devido a diferentes pressões de seleção.


3.6 Marcadores moleculares

A seguir são apresentados os principais marcadores utilizados em genética de populações.

A popularidade desses marcadores ao longo dos anos está diretamente relacionado a relação custo-benefício das metodologias de análise associadas. Com o desenvolvimento de novas metodologias ocorre o barateamento dos custos de análise de última geração, capazes de analisar múltiplos marcadores ao mesmo tempo, e gerar estudos mais compreensivos.


Popularidade ao longo dos anos de diferentes marcadores moleculares na genética de populações desde o surgimento da biologia molecular, no século XX, até o início do século XXI. Ver Schlötterer ([2004](https://doi.org/10.1038/nrg1249)) e Seeb et al. ([2011](https://doi.org/10.1111/j.1755-0998.2010.02979.x))

Figura 3.8: Popularidade ao longo dos anos de diferentes marcadores moleculares na genética de populações desde o surgimento da biologia molecular, no século XX, até o início do século XXI. Ver Schlötterer (2004) e Seeb et al. (2011)


3.6.1 Aloenzimas

A análise de aloenzimas (ou alozimas) baseia-se na migração diferencial em eletroforese de enzimas com cargas e tamanhos diferentes devido as modificações subjacentes nas sequências de bases desses genes.

Esses marcadores geralmente envolvem enzimas que desempenham funções muito básicas, podendo ser encontradas em quase todas as formas de vida, sendo asism um método de análise universal.

A detecção da variação genética se baseia na revelação por coloração histoquímica, a partir da qual podem ser visualizadas bandas correspondentes aos fenótipos bioquímicos dessas enzimas.

Como marcadores moleculares, as aloenzimas são co-dominantes.

Os polimorfismos ocorrem necessariamente em regiões codificantes, podendo ser neutros ou com efeitos positivos ou negativos no fenótipo do indivíduo.


Esquema da eletroforese de marcadores de aloenzimas monoméricas e diméricas e seus genótipos associados. Isoenzimas estão identificadas por cores diferentes. Ver Wendt et al ([2009](https://doi.org/10.1590/S1516-89132009000600016)).

Figura 3.9: Esquema da eletroforese de marcadores de aloenzimas monoméricas e diméricas e seus genótipos associados. Isoenzimas estão identificadas por cores diferentes. Ver Wendt et al (2009).


Vantagens Desvantagens
Barato Requer material fresco ou congelado
Protocolos universais Alguns loci apresentam proteínas instáveis
Número limitado de marcadores disponíveis
Potencialmente alvos diretos de seleção (fenótipo bioquímico)


3.6.2 RFLP

Polimorfismos de Tamanho de Fragmento de Restrição

Polimorfismos detectados gerados por digestão enzimática com endonucleases de DNA genômico ou amplificado por PCR.

Como marcadores moleculares, são tipicamente neutros e podem ser co-dominantes ou dominantes.

Diferentes endonucleases apresentam sítios de ligação e corte do DNA diferentes.

Análise direta de mutações nos sítios de reconhecimento de endonucleases por meio de mudanças no tamanho dos fragmentos gerados em padrões eletroforéticos


Polimorfismos de tamanho de fragmentos de restrição (RFLPs). Na esquerda, o mecanismo de clivagem da enzima de Restrição _Eco_RI. Na direita, a digestão _in silico_ do gene 16S do DNA ribossomal de um fitoplasma do subgrupo 16SrII-C usando diferentes enzimas de restrição (PM, marcador de peso molecular).

Figura 3.10: Polimorfismos de tamanho de fragmentos de restrição (RFLPs). Na esquerda, o mecanismo de clivagem da enzima de Restrição _Eco_RI. Na direita, a digestão in silico do gene 16S do DNA ribossomal de um fitoplasma do subgrupo 16SrII-C usando diferentes enzimas de restrição (PM, marcador de peso molecular).


Vantagens Desvantagens
Barato Baixa reprodutibilidade
Grande número de informações que podem ser refinadas posteriormente Majoritariamente dominante
Análise, automação e comparações entre estudos difíceis


3.6.3 Sequência de nucleotídeos

Cada posição da sequência pode ser informacional.

As sequências de DNA são marcadores tipicamente neutros e dominantes, que podem ser utilizados para análises populacionais e filogenéticas.

Estas podem definir alelos ou haplótipos, e as posições podem ser usadas para tabular caractéres, onde cada nucleotídeo corresponde a um estado de caráter.


Sequência de nucleotídeos de DNA alinhados entre sete indivíduos.

Figura 3.11: Sequência de nucleotídeos de DNA alinhados entre sete indivíduos.


Vantagens Desvantagens
Maior nível possível de resolução Muito caro
Não-tendenciado
Facilidade de comparaÇão entre estudos e formação de bancos de dados


3.6.4 SNPs

Polimorfismos de nucleotídeo único ou Polimorfismos de um único nucleotídeo

Representam uma variação de um único par de base em uma região gênica específica, mas alguns autores consideram substituições de poucos nucleotídeos ou mesmo inserções e deleções como SNPs.

Como marcadores moleculares, são co-dominantes.

Estes polimorfismos podem ou não ocorrer em regiões codificantes, podendo ser neutros ou com efeitos positivos ou negativos no fenótipo do indivíduo.

SNPs são ditos causativos quando alteram a quantidade ou a função de proteínas por ocorrerem em regiões regulatórias e codificantes, ou podem estar ligados a estas, sem efeito no fenótipo.

SNPs são muito numerosos no genoma (ca. 1:300 pb em humanos). Estima-se que 90% da variação genética intraespecífica se deva a estes polimorfismos e que cada indivíduo apresente um arranjo genômico único em relação a eles.


Polimorfismos de nucleotídeo único em uma região do DNA e sua frequência em uma população.

Figura 3.12: Polimorfismos de nucleotídeo único em uma região do DNA e sua frequência em uma população.


Vantagens Desvantagens
Baixa taxa de mutação Substancial heterogeidade nas taxas de evolutivas
Abundância Desenvolvimento caro
Fácil caracterização Podem estar tendenciados
Novas abordagens de análise em constante desenvolvimento Baixo nível de informação; dependente do número de loci
Facilidade de comparaÇão entre estudos e formação de bancos de dados


3.6.5 Microssatelites

Repetições de Sequências Simples (SSRs) ou Repetições Curtas em Série (STR)

São regiões gênicas polimórficas que consistem de unidades de sequências curtas de DNA de 2-6 pb repetidas in tandem.

Como marcadores moleculares, são co-dominantes e geralmente neutros.

As frequências de um lócus microssatélite com \(n\) repetições geralmente apresentam uma alta variância (evolução por mutações dinâmicas; slippage da replicação) e um forte caráter populacional.


Por exemplo, a sequência:

\[\underline{TCCCAAGCTCTTC}CTCTTCCCTAGATCAAT \\ ACAGACAGAAGACAGGTG\color{red}{GATAGATAGATA \\ GATAGATAGATAGATAGATAGATAGATAGA \\ TAGATA}TCATTGAAAGACAAAACAGAGATG \\ GATGATAGATACATGCT\underline{TACAGATGCACAC}\]

tem \(12\) repetições do tetranucleotídeo de DNA \(\color{red}{GATA}\), ou \(\left( {GATA} \right)_{12}\).


A depender do número de nucleotídeos na unidade de repetição, os microssatélites são formados por repetições de:

\({Dinucleotídeo} \rightarrow \left( {CA} \right)_{n}\)

\({Trinucleotídeo} \rightarrow \left( {GCC} \right)_{n}\)

\({Tetranucleotídeo} \rightarrow \left( {AATG} \right)_{n}\)

\({Pentanucleotídeo} \rightarrow \left( {AGAAA} \right)_{n}\)

\({Hexanucleotídeo} \rightarrow \left( {AGTACA} \right)_{n}\)


A análise multi-loci de microssatélites permite inferências em nível individual (fingerprinting) e possui aplicações como marcadores para estudos de parentesco e populacionais.


Os microssatélites evoluem sobretudo por mutações de derrapagem da replicação (esquerda), o que promove a instabilidade do número de repetições nessas regiões (direita).

Figura 3.13: Os microssatélites evoluem sobretudo por mutações de derrapagem da replicação (esquerda), o que promove a instabilidade do número de repetições nessas regiões (direita).



Vantagens Desvantagens
Altamente informativo Alta taxa de mutação
Baixo nível de tendenciamento Comportamento mutacional complexo
Novas abordagens de análise em constante desenvolvimento Pouco abundantes
Facilidade de comparaÇão entre estudos e formação de bancos de dados Automação e comparações entre estudos difíceis


3.7 Tipo de dados


Comparação entre os principais marcadores moleculares tradicionalmente usados em genética de populações.

Figura 3.14: Comparação entre os principais marcadores moleculares tradicionalmente usados em genética de populações.


3.8 Bancos de dados públicos

NCBI - GenBank

https://www.ncbi.nlm.nih.gov/genbank/


SNP Database

https://www.ncbi.nlm.nih.gov/projects/SNP/


Barcode of Life Data Systems

http://www.boldsystems.org/


1000 Genomes Project

http://www.internationalgenome.org/

3.9 Exercícios

3.9.1 Exercício 1 - Genotipagem por PCR-RFLP

Um polimorfismo do gene DNMT3B foi genotipado por análise de PCR-RFLP (Moura et al., 2018), de modo que um fragmento de 380 pares de bases (pb) contendo a região polimórfica (C/T) foi amplificado e digeridos com uma enzima de restrição XmaJI, que reconhece e cliva a sequência contendo o polimorfismo T (rs2424913), produzindo dois fragmentos de 207 pb e 173 pb.


Visualização dos padrões de digestão com XmaJI dos produtos amplificados do gene DNMT3B a partir da amostra de sangue de 10 indivíduos (#1-10). Padrão de de peso molecular (PM).

(#fig:DNMT3B_PCR-RFLP)Visualização dos padrões de digestão com XmaJI dos produtos amplificados do gene DNMT3B a partir da amostra de sangue de 10 indivíduos (#1-10). Padrão de de peso molecular (PM).


Em relação ao polimorfismo, responda:

  • Quais são os alelos?

  • Quais são os genótipos?

  • Quantos genótipos de cada tipo são observados dentre os indivíduos?

3.9.2 Genotipagem por sequenciamento de DNA

MicroRNAs (miRNAs) são uma classe de RNAs endógenos, pequenos e não codificantes que são inicialmente transcritos do DNA genômico para transcritos primários longos e então são clivados em RNAs precursores em forma de grampo de cabelo. O SNP rs895819 está localizado na alça do pré-miRNA MIR23AHG, abrangendo uma transição de nucleotídeo T>C. Produtos de PCR do SNP com diferentes genótipos foram selecionados e verificados por sequenciamento direto de DNA (Shi et al., 2012).

Eletroferogramas do sequenciamento de DNA de três amostras diferentes (A-C) do polimorfismo da região gênica MIR23AHG.

Figura 3.15: Eletroferogramas do sequenciamento de DNA de três amostras diferentes (A-C) do polimorfismo da região gênica MIR23AHG.

  • Qual é a sequência de nucleotídeos na amostra:

    • A?

    • B?

    • C?

    • Qual é o genôtipo de cada amostra?