Capítulo 4 Variação e Diversidade Genética
)](figs/Liguus_fasciatus_Hillis.png)
Figura 4.1: A distribuição de alelos e a baixa diversidade genética no caramujo da Flórida (Liguus fasciatus) apóia a visão de uma única espécie parcialmente autofecundante que se diversificou na Flórida após um único evento fundador. Ver Hillis et al (1991)
4.1 Genética mendeliana \(\times\) Genética de populações
A genética mendeliana estuda o comportamento de um ou mais loci gênicos em cruzamentos simples.
Nesta, dois parentais intercruzantes contribuem cada com um alelo por locus, e Os resultados esperados são proporções mendelianas das características fenotípicas.
Figura 4.2: Exemplos de proporções mendelianas em características co-dominantes (1:2:1) e dominantes (3:1).
Por outro lado, a genética de populações visa estudar o comportamento de um ou mais loci gênicos em múltiplos cruzamentos, i. e., em proporções populacionais.
Para tal, as informações genéticas do pool gênico de um ou mais demes constituindo unidades panmíticas são analisados a partir de amostras populacionais.
pool gênico – (Unidade genética) Todos os alelos em um ou mais loci gênicos.
deme – (Unidade ecológica ou demográfica) Grupo de indivíduos em uma dada área geográfica.
unidade panmítica – (Unidade reprodutiva) Grupo de indivíduos intercruzantes ao acaso.
amostra – (Unidade estatística) Subconjunto de tamanho \(n\) de uma população de tamanho \(N\), a partir do qual parâmatros são estimados, e inferências são feitas.
4.2 Frequências genotípicas
Considere um locus autossômico diplóide com dois alelos \(A\) e \(a\), sem dominância.
Em uma população \(N\), deixe ser o número de indivíduos dos genótipos \(AA = x\), \(Aa = y\) e \(aa = z\), de forma que:
\[x + y + z = N\]
Logo, as frequências genotípicas observadas na população serão:
- para os homozigotos dominates (\(AA\)):
\[f_{Obs}(AA) = \frac{x}{N}\]
- para os heterozigotos (\(Aa\)):
\[f_{Obs}(Aa) = \frac{y}{N}\]
- e para os homozigotos recessivos (\(aa\)):
\[f_{Obs}(aa) = \frac{z}{N}\]
4.3 Frequências alélicas
As frequências alélicas (ou gênicas) podem ser definidas como:
\[\begin{equation} f(A) = p = \frac{2x + y}{2N} = f(AA) + ½f(Aa) \tag{4.1} \end{equation}\]
e
\[\begin{equation} f(a) = q = \frac{2z + y}{2N} = f(aa) + ½f(Aa) \tag{4.2} \end{equation}\]
De forma que,
\[\begin{equation} p + q = 1 \tag{4.3} \end{equation}\]
As frequências \(p\) e \(q\) são convenções, intercambiáveis em relação aos alelos \(A\) e \(a\).
Contudo, \(q\) é geralmente usado para alelos recessivos, mutantes, raros ou desvantajosos.
Dominante e recessivo – propriedades fenotípicas.
Selvagem e mutante – propriedades ontológicas.
Comum e raro – propriedades estatísticas.
Vantajoso e desvantajoso – propriedades evolutivas.
4.4 Generalização das frequências genotípicas e alélicas
Considere um locus autossômico diplóide com \(i\) alelos, sem dominância.
As frequências genotípicas observadas são:
\[f_{Obs}(A_1A_1) = \frac{N_{A_1A_1}}{N}\]
\[f_{Obs}(A_1A_2) = \frac{N_{A_1A_2}}{N}\]
\[...\]
\[f_{Obs}(A_1A_i) = \frac{N_{A_1A_i}}{N}\]
\[...\]
\[f_{Obs}(A_iA_i) = \frac{N_{A_iA_i}}{N}\]
As frequências alélicas serão:
\[f(A_1) = a_1 = f(A_1A_1) + ½ f(A_1A_2) + … + ½ f(A_1A_i)\]
\[f(A_2) = a_2 = f(A_2A_2) + ½ f(A_1A_2) + … + ½ f(A_2A_i)\]
\[...\]
\[f(A_i) = a_i = f(A_iA_i) + ½ f(A_1A_i) + … + ½ f(A_iA_i)\] De forma que:
\[a_1 \ + a_2 \ + \ ... \ + \ a_i = 1\]
4.5 Heterozigoside
A heterozigosidade (ou heterozigose) observada (\(H_{Obs}\)) de uma população é a freqüência de heterozigotos em um dado locus gênico.
Dada as definições de frequências genotípicas e alélicas, para um lócus bialélico, temos que:
\[H_{Obs} = \frac{y}{N} = f(Aa) = 1 – f(AA) – f(aa)\]
Esta estimativa é muito útil para avaliarmos a diversidade genética de uma população natural, uma vez que uma alta heterozigosidade quase sempre está relacionada a uma alta variabilidade genética, e vice-versa.
A heterozigosidade observada (\(H_{Obs}\)) é geralmente contrastada com a expectativa da heterozigosidade dado o princípio de Hardy-Weinberg.
Essa heterozigosidade esperada (\(H_{Esp}\)) pelo princípio de Hardy-Weinberg pode ser interpretada como a probabilidade de que um indivíduo seja heterozigoto para um determinado locus gênico (ver Modelando o princípio de Hardy-Weinberg{Modelando o princípio de Hardy-Weinberg})
Sendo,
\[H_{Esp} = 2pq = 1 – p^2 – q^2\]
Quando \(H_{Obs} \neq H_{Esp}\), forças evolutivas podem estar atuando nas populações.
4.6 Diversidade gênética

Figura 4.3: O milho (Zea mays) foi domesticado pela primeira vez por povos indígenas no sul do México há cerca de 10.000 anos e espalhado para as Américas. A maioria desses grãos tradicionais corre o risco de ser perdido e esquecido. Uma parcela significativa de diversidade no milho é devida à recombinação genética.
Matsuoka et al. 2002. doi: 10.1073/pnas.052125199
Vigouroux et al. 2003. doi: 10.1093/molbev/msg156
Piperno 2011. doi: 10.1086/659998
Na linguagem comum, a variabilidade genética e a diversidade genética são erroneamente consideradas sinônimos entre si.
A variabilidade genética é a variação nos alelos dos genes ou nas sequências de DNA no pool gênico de uma espécie ou população. Isso se expressa em termos de formas alternativas no fenótipo.
A Diversidade genética, por outro lado, é um termo amplo que abrange toda a variabilidade que ocorre entre os diferentes genótipos relacionados a uma única espécie ou entre espécies.
Como definido por Swingland (2013), diversidade genética é a variação de características hereditárias presentes em uma população da mesma espécie; podendo essa variação se expressar na forma de alterações na morfologia, anatomia, comportamento fisiológico ou características bioquímicas.
A diversidade genética pode ser medida contando o número de genes diferentes em um pool gênico. Por sua vez, a variação genética só pode ocorrer e não pode ser medida, podendo ser considerada como unidade básica da diversidade genética.
Figura 4.4: Exemplo de dois conjuntos com diferentes níveis de variação e diversidade. Quando há variação nos elementos (\(A\), \(B\), \(C\) e \(D\)), o conjunto (\(X\) e \(Y\)) é mais diverso
Alguns autores consideram a diversidade genética (\(D\)) de um locus como a heterozigosidade esperada (H_{Esp}) daquele lócus, i. e., a proporção de genótipos heterozigotos dada a expectativa do princípio de Hardy-Weinberg.
Nesse sentido, a diversidade genética é composta de dois parâmetros:
o número de alelos na população, e
a abundância (ou uniformidade) dos alelos.
4.6.1 Exemplo
Se uma população consiste em um excesso de homozigotos para diferentes alelos, isso leva a uma baixa heterozigose observada, mas não afeta a heterozigose esperada.
População 2 | População 2 |
---|---|
\(P_1 = \left\{ AA, BB, CC, DD \right\}\) | \(P_2 = \left\{ AB, AB, AB, AB \right\}\) |
\(f(A) = f(B) = f(C) = f(D) = 0.25\) | \(f(A) = f(B) = 0.50\) |
\(H_{Obs} = 0.00\) | \(H_{Obs} = 1.00\) |
\(H_{Esp} = 1 – 4(0.25)^2 = 0.75\) | \(H_{Esp} = 1 – 2(0.5)^2 = 0.50\) |
Assim, se uma população apresenta um excesso de homozigotos para diferentes alelos, isso leva a uma baixa heterozigosidade observada, mas não afeta a heterozigose esperada.
4.7 Determinantes da diversidade genética
4.7.1 Extratégias reprodutivas
).](https://media.springernature.com/full/springer-static/image/art%3A10.1038%2Fnrg.2016.58/MediaObjects/41576_2016_Article_BFnrg201658_Fig1_HTML.jpg)
Figura 4.5: Animais estrategistas r são mais polimórficos do que estrategistas K. A correlação negativa apresentada no gráfico reflete uma compensação entre a quantidade e o tamanho da prole. Ver Ellegreen & Galtier (2016).
Uma forte correlação foi relatada entre diversidade genética e características da história de vida das espécies, como massa corporal, longevidade e, surpreendentemente, estratégia reprodutiva.
Espécies altamente fecundas que liberam um grande número de ovos pequenos no ambiente (por exemplo, mexilhões, ouriços e minhocas; os chamados r-estrategistas) são muito mais polimórficos do que espécies que produzem um pequeno número de descendentes relativamente grandes e fornecem cuidados parentais (por exemplo, pinguins, cupins e cavalos-marinhos; chamados K-estrategistas)
Rominguier et al. (2014). doi: 10.1038/nature13685
4.7.2 Ligação gênica
).](https://media.springernature.com/lw685/springer-static/image/art%3A10.1038%2Fnrg.2016.58/MediaObjects/41576_2016_Article_BFnrg201658_Fig3_HTML.jpg)
Figura 4.6: Efeito da seleção ligada na diversidade genética (nucleotídica) em torno dos genes ou outros elementos funcionais. As linhas contínuas indicam a variação local no nível de diversidade nucleotídica, e as linhas tracejadas indicam a diversidade média em toda a região em questão. Ver Ellegreen & Galtier (2016).
Em regiões com uma alta densidade de alvos de seleção (a), a seleção ligada é generalizada e reduz significativamente a diversidade em comparação com regiões com uma densidade mais baixa de alvos de seleção (b). Quando a taxa de recombinação é alta (c), o efeito da seleção ligada torna-se menos prevalente, permitindo a manutenção de altos níveis de diversidade naquela região.
Ambos os aspectos contribuem para a heterogeneidade dentro do genoma ao gerar vales de diversidade reduzida nas proximidades dos loci selecionados.
Cutter & Payseur (2013). doi: 10.1038/nrg3425
4.8 Medidas de Diversidade em loci diplóides
4.8.1 Nível de polimorfismo
Nível de polimorfismo (\(P\))
\[\begin{equation} P = \frac{n_p}{K} \tag{4.4} \end{equation}\]
Onde, \(n_p\) é o número de loci gênicos polimórficos observados, e \(K\) é o número total de loci gênicos examinados.
Exemplo,
Loc 1 | Loc 2 | Loc 3 | Loc 4 | Loc 5 | Loc 6 | Loc 7 | Loc 8 | |
---|---|---|---|---|---|---|---|---|
Ind 1 | AA | CC | CG | AA | TG | AG | TT | AA |
Ind 2 | AA | CC | CG | AA | CG | AG | TT | AA |
Ind 3 | AT | CC | GG | AA | CG | GG | TT | AA |
Ind 4 | AT | CC | GG | AA | GG | AA | TT | AC |
Ind 5 | TT | CC | CG | AA | CT | AA | TT | AC |
Poli | Mono | Poli | Mono | Poli | Poli | Mono | Poli |
\[P = \frac{5}{8} = 0.625\]
4.8.2 Riqueza alélica
Riqueza alélica (\(A\)) é o número de alelos polimórficos observados em um locus gênico.
Exemplo,
Loc 1 | Loc 2 | Loc 3 | Loc 4 | Loc 5 | Loc 6 | Loc 7 | Loc 8 | |
---|---|---|---|---|---|---|---|---|
Ind 1 | AA | CC | CG | AA | TG | AG | TT | AA |
Ind 2 | AA | CC | CG | AA | CG | AG | TT | AA |
Ind 3 | AT | CC | GG | AA | CG | GG | TT | AA |
Ind 4 | AT | CC | GG | AA | GG | AA | TT | AC |
Ind 5 | TT | CC | CG | AA | CT | AA | TT | AC |
\(A\) | 2 | 1 | 2 | 1 | 3 | 2 | 1 | 2 |
4.8.3 Número médio de alelos
Número médio de alelos por locus (\(\bar{A}\))
\[\begin{equation} \bar{A} = \frac{ \sum_{i=1}^{i} {A_i} }{K} \tag{4.5} \end{equation}\]
Onde, \(A_i\) é o número de alelos polimórficos observados no \(i\)-nésimo locus gênico, e \(k\) é o número de loci gênicos examinados.
Exemplo,
Loc 1 | Loc 2 | Loc 3 | Loc 4 | Loc 5 | Loc 6 | Loc 7 | Loc 8 | |
---|---|---|---|---|---|---|---|---|
Ind 1 | AA | CC | CG | AA | TG | AG | TT | AA |
Ind 2 | AA | CC | CG | AA | CG | AG | TT | AA |
Ind 3 | AT | CC | GG | AA | CG | GG | TT | AA |
Ind 4 | AT | CC | GG | AA | GG | AA | TT | AC |
Ind 5 | TT | CC | CG | AA | CT | AA | TT | AC |
\(A\) | 2 | 1 | 2 | 1 | 3 | 2 | 1 | 2 |
\[\bar{A} = \frac{2+1+2+1+3+2+1+2}{8} = \frac{14}{8} = 1.75\]
4.8.4 Número efetivo de alelos
O número efetivo de alelos (\(A_e\)) é O número de alelos igualmente frequentes que seriam necessários para atingir a mesma heterozigosidade esperada na população estudada, de forma que:
\[\begin{equation} A_e = \frac{1}{1-H_{Esp}} = \frac{1}{\sum {p_i^2}} \tag{4.6} \end{equation}\]
Onde, \(p_i\) é a frequência do \(i\)-nésimo alelo em um locus gênico.
Exemplo,
Loc 1 | Loc 2 | Loc 3 | Loc 4 | Loc 5 | Loc 6 | Loc 7 | Loc 8 | |
---|---|---|---|---|---|---|---|---|
Ind 1 | AA | CC | CG | AA | TG | AG | TT | AA |
Ind 2 | AA | CC | CG | AA | CG | AG | TT | AA |
Ind 3 | AT | CC | GG | AA | CG | GG | TT | AA |
Ind 4 | AT | CC | GG | AA | GG | AA | TT | AC |
Ind 5 | TT | CC | CG | AA | CT | AA | TT | AC |
\(f(\color{green}{A})\) | 0.60 | – | – | 1.00 | – | 0.60 | – | 0.80 |
\(f(\color{red}{T})\) | 0.40 | – | – | – | 0.20 | – | 1.00 | – |
\(f(\color{blue}{C})\) | – | 1.00 | 0.30 | – | 0.30 | – | – | 0.20 |
\(f(\color{goldenrod}{G})\) | – | – | 0.70 | – | 0.50 | 0.40 | – | – |
\(H_{Esp}\) | 0.48 | 0.00 | 0.42 | 0.00 | 0.62 | 0.48 | 0.00 | 0.32 |
\(A_{e}\) | 1.92 | 1.00 | 1.72 | 1.00 | 2.63 | 1.92 | 1.00 | 1.47 |
4.9 Medidas de Diversidade em loci haplóides
4.9.1 Número de haplótipos
Número de haplótipos (\(h\)) é o número de haplótipos diferentes observados.
Exemplo,
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ind 1 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 2 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 3 | A | T | C | C | G | G | A | A | C | G | G | G | T | T | A | A | G | T | ||
Ind 4 | A | T | C | C | G | G | A | A | G | G | A | A | T | T | A | C | A | T | ||
Ind 5 | A | T | C | C | G | G | A | A | G | G | A | A | T | T | A | C | A | T |
Desta forma, temos:
Haplótipo X – Haplótipo observado nos indivíduos 1 e 2;
Haplótipo Y – Haplótipo observado no indivíduo 3; e
Haplótipo Z – Haplótipo observado nos indivíduos 4 e 5;
E assim,
\[h = 3\]
4.9.2 Número de sítios segregantes
Número de sítios segregantes (\(S\)) é o número de sítios observados que apresentam variação (polimórficos).
Exemplo,
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ind 1 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 2 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 3 | A | T | C | C | G | G | A | A | C | G | G | G | T | T | A | A | G | T | ||
Ind 4 | A | T | C | C | G | G | A | A | G | G | A | A | T | T | A | C | A | T | ||
Ind 5 | A | T | C | C | G | G | A | A | G | G | A | A | T | T | A | C | A | T | ||
\(S\) | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 |
E assim,
\[S = 8\]
4.9.3 Número de sítios invariáveis
Número de sítios invariáveis (\(I\)) é o número de sítios observados que não apresentam variação (constantes).
Exemplo,
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ind 1 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 2 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 3 | A | T | C | C | G | G | A | A | C | G | G | G | T | T | A | A | G | T | ||
Ind 4 | A | T | C | C | G | G | A | A | G | G | A | A | T | T | A | C | A | T | ||
Ind 5 | A | T | C | C | G | G | A | A | G | G | A | A | T | T | A | C | A | T | ||
\(I\) | 1 | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 0 | 1 | 0 | 0 | 1 | 1 | 1 | 0 | 0 | 0 |
E assim,
\[I = 10\]
4.9.4 Número total de mutações
Número total de mutações (\(\eta\); \({Eta}\)}) (Fu & Li 1993), também referido como o número mínimo de mutações (Tajima 1996), é definido como:
\[\begin{equation} \eta = \sum_i^m s_i \tag{4.7} \end{equation}\]
Onde, \(s_i\) é o número de diferentes nucleotídeos no \(i\)-nésimo sítio menos um.
Exemplo,
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ind 1 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 2 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 3 | A | T | C | C | G | G | A | A | C | G | G | G | T | T | A | A | G | T | ||
Ind 4 | A | T | C | C | G | G | A | A | G | G | A | A | T | T | A | C | A | T | ||
Ind 5 | A | T | C | C | G | G | A | A | G | G | A | A | T | T | A | C | A | T | ||
\(s\) | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 2 | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 |
E assim,
\[\eta = 10\]
4.9.5 Diversidade haplotípica
Diversidade haplotípica (\(Hd\)) representa a probabilidade de que dois indivíduos amostrados aleatoriamente apresentam haplótipos diferentes, de forma que:
\[\begin{equation} Hd = \frac{N}{N-1} \left( 1 - \sum{p_i^2} \right) \tag{4.8} \end{equation}\]
Onde, \(N\) é o tamanho da amostra, e \(p_i\) é a frequência do \(i\)-nésimo haplótipo.
Exemplo,
Dados os haplótipos observados no exemplo anterior, temos que:
Hap X | Hap Y | Hap z | |
---|---|---|---|
Ind 1 | \(\checkmark\) | – | – |
Ind 2 | \(\checkmark\) | – | – |
Ind 3 | – | \(\checkmark\) | – |
Ind 4 | – | – | \(\checkmark\) |
Ind 5 | – | – | \(\checkmark\) |
\(p\) | 0.4 | 0.2 | 0.4 |
E assim,
\[Hd = \frac{5}{4-1} \left( 1 - 0.4^2 + 0.2^2 + 0.4^2 \right) = 1.25 \cdot 0.64 = 0.8\]
Observe que a probabilidade de um par de indivíduos amostrados aleatoriamente na população apresentar uma dada combinação haplotípica é dada pela matrix:
Hap X | Hap Y | Hap z | |
---|---|---|---|
Hap X | \(\color{red}{p_X^2}\) | \(p_Xp_Y\) | \(p_Xp_Z\) |
Hap Y | \(p_Xp_Y\) | \(\color{red}{p_Y^2}\) | \(p_Yp_Z\) |
Hap Z | \(p_Xp_Z\) | \(p_Yp_Z\) | \(\color{red}{p_Z^2}\) |
Assim, as chances de dois indivíduos quaisquer apresentarem:
Haplótipos iguais \(\rightarrow\) \(\color{red}{p_X^2 + p_Y^2 + p_Z^2}\); e
Haplótipos diferentes \(\rightarrow\) \(2p_Xp_Y + 2p_Xp_Z + 2p_Yp_Z = 1 - \left( \color{red}{p_X^2 + p_Y^2 + p_Z^2} \right)\).
4.9.6 Número médio de diferenças nucleotídicas
Número médio de diferenças nucleotídicas (k) (Tajima 1983) é definido como:
\[\begin{equation} k = \frac { \sum_{i<j}^{} k_{ij} } { \binom{n}{2} } \tag{4.9} \end{equation}\]
Onde, \(k_{ij}\) é o número de nucleotídeos diferentes entre as \(i\)-nésima e \(j\)-nésima sequência de nucleotídeos, e \(n\) é o número de sequências sendo comparadas.
Exemplo,
Dadas as \(n=5\) sequências do exemplo anterior, as comparações par-a-par entre elas serão:
Ind 1 | Ind 2 | Ind 3 | Ind 4 | Ind 5 | |
---|---|---|---|---|---|
Ind 1 | – | ||||
Ind 2 | \(k_{12}\) | – | |||
Ind 3 | \(k_{13}\) | \(k_{23}\) | – | ||
Ind 4 | \(k_{14}\) | \(k_{24}\) | \(k_{34}\) | – | |
Ind 5 | \(k_{15}\) | \(k_{25}\) | \(k_{35}\) | \(k_{45}\) | – |
De forma que o número total de comparações será:
\[\binom{5}{2}=10\]
Assim, tomemos como exemplo a comparação entre as sequências dos indivíduos 2 e 3.
Onde,
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ind 2 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 3 | A | T | C | C | G | G | A | A | C | G | G | G | T | T | A | A | G | T | ||
\(k\) | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 1 |
Logo,
\[k_{23} = 6\]
Desta forma, as diferenças de nucleotídeos entre os pares de sequências serão:
Ind 1 | Ind 2 | Ind 3 | Ind 4 | Ind 5 | |
---|---|---|---|---|---|
Ind 1 | – | ||||
Ind 2 | 0 | – | |||
Ind 3 | 6 | 6 | – | ||
Ind 4 | 6 | 6 | 5 | – | |
Ind 5 | 6 | 6 | 5 | 0 | – |
E assim
\[k = \frac{\left( 0+6+6+6+6+6+6+5+5+0 \right)}{10}=4.6\]
4.9.7 Diversidade nucleotídica
Diversidade nucleotídica (\(\pi\); \(Pi\)) ou número médio de substituições por sítio de nucleotídeo, é definida como:
\[\begin{equation} \pi = \frac { \sum_{i<j}^{} \pi_{ij} } { \binom{n}{2} } \tag{4.10} \end{equation}\]
Onde, \(\pi_{ij}\) é a proporção de nucleotídeos diferentes entre as \(i\)-nésima e \(j\)-nésima sequência de nucleotídeos, e \(n\) é o número de sequências sendo comparadas.
A diversidade nucleotídica pode ser estimada a partir do número médio de diferenças nucleotídicas (\(k\)) de forma que:
\[ \pi = \frac {k} {L} \]
Onde, \(L\) é o tamanho do haplótipo em pares de bases.
Exemplo,
Dadas as \(n=5\) sequências do exemplo anterior, as comparações par-a-par entre elas serão:
Ind 1 | Ind 2 | Ind 3 | Ind 4 | Ind 5 | |
---|---|---|---|---|---|
Ind 1 | – | ||||
Ind 2 | \(\pi_{12}\) | – | |||
Ind 3 | \(\pi_{13}\) | \(\pi_{23}\) | – | ||
Ind 4 | \(\pi_{14}\) | \(\pi_{24}\) | \(\pi_{34}\) | – | |
Ind 5 | \(\pi_{15}\) | \(\pi_{25}\) | \(\pi_{35}\) | \(\pi_{45}\) | – |
De forma que o número total de comparações será:
\[\binom{5}{2}=10\]
Assim, tomemos como exemplo a comparação entre as sequências dos indivíduos 2 e 3.
Onde,
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ind 2 | A | A | C | C | C | G | A | A | T | G | A | G | T | T | A | A | A | A | ||
Ind 3 | A | T | C | C | G | G | A | A | C | G | G | G | T | T | A | A | G | T | ||
\(\pi\) | 0 | \(\frac{1}{18}\) | 0 | 0 | \(\frac{1}{18}\) | 0 | 0 | 0 | \(\frac{1}{18}\) | 0 | \(\frac{1}{18}\) | 0 | 0 | 0 | 0 | 0 | \(\frac{1}{18}\) | \(\frac{1}{18}\) |
Logo,
\[\pi_{23} = \frac {6}{18} = 0.333\]
Desta forma, as diferenças de nucleotídeos entre os pares de sequências serão:
Ind 1 | Ind 2 | Ind 3 | Ind 4 | Ind 5 | |
---|---|---|---|---|---|
Ind 1 | – | ||||
Ind 2 | 0 | – | |||
Ind 3 | 0.333 | 0.333 | – | ||
Ind 4 | 0.333 | 0.333 | 0.277 | – | |
Ind 5 | 0.333 | 0.333 | 0.277 | 0 | – |
E assim
\[\pi = \frac{\left( 0+0.333+0.333+0.333+0.333+0.333+0.333+0.277+0.277+0 \right)}{10} \approx 0.255\]
4.10 Exercícios
4.10.1 Exercício 1 - Frequências gênicas e genotípicas
O gene \(CCR5\) codifica um membro da família de receptores de beta quimiocina. Esta proteína é expressa por células T e macrófagos, e é conhecida por ser um importante co-receptor para vírus macrófagos-trópicos, incluindo HIV, para entrar nas células hospedeiras. Alelos defeituosos deste gene, como o alelo \(\Delta 32\) que porta uma deleção, foram associados à resistência à infecção pelo HIV-1, em contraste com alelos selvagens (\(wt\)) funcionais (Solloch et al., 2017).
\(wt/wt\) | \(wt/\)Δ32 | Δ32\(/\)Δ32 | |
---|---|---|---|
Argentina | 96 | 20 | 1 |
Brasil | 510 | 58 | 2 |
Chile | 81 | 21 | 2 |
Colômbia | 215 | 20 | 2 |
Equador | 77 | 6 | 0 |
Peru | 176 | 18 | 0 |
Venezuela | 56 | 6 | 0 |
Preencha a tabela abaixo com os valores das frequências genotípicas observadas e das frequências alélicas (\(p\) e \(q\)) nas populações estudadas.
População | \(f(wt/wt)\) | \(f(wt/\Delta32)\) | \(f(\Delta32/\Delta32)\) | \(p = f(wt)\) | \(q = f(\Delta32)\) |
---|---|---|---|---|---|
Argentina | |||||
Brasil | |||||
Chile | |||||
Colômbia | |||||
Equador | |||||
Peru | |||||
Venezuela |
4.10.2 Exercício 2 - Haplótipos mitocondriais

Figura 4.7: Colônia do gastrópode vermetídeo Petaloconchus varians.
A comparação de uma região de 636 pares de bases (pb) do gene citocromo c oxidase, subunidade 1 do DNA mitocondrial (cox1) do gastrópode vermetídeo formador de recifes Petaloconchus varians, entre indivíduos (IND) de duas populações da Venezuela (VEN) e do Rio de Janeiro (RIO), produziu a seguinte matriz de dados de sequência de nucleotídeos (Breves et al., 2022):
IND | POP | 21 | 54 | 109 | 162 | 204 | 222 | 228 | 264 | 276 | 324 | 336 | 342 | 390 | 427 | 465 | 477 | 489 | 492 | 499 | 522 | 525 | 552 | 556 | 585 | 630 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
01 | VEN | G | A | T | A | T | A | A | T | T | C | T | T | T | C | A | A | A | G | C | T | T | C | T | A | T |
02 | VEN | . | . | . | . | . | . | . | . | C | . | . | . | C | . | . | . | . | . | . | . | C | . | . | . | . |
03 | VEN | . | . | . | G | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
04 | VEN | . | T | . | . | . | . | G | . | . | . | . | C | . | . | . | . | . | . | T | . | . | T | C | G | . |
05 | VEN | . | T | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | T | C | G | . |
06 | RIO | . | T | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | T | C | G | . |
07 | RIO | . | T | C | . | . | . | . | . | . | . | . | . | . | . | G | . | G | . | . | . | . | T | . | G | . |
08 | RIO | . | T | . | . | . | . | . | A | . | T | . | . | . | . | . | . | . | . | . | . | . | . | . | . | A |
09 | RIO | A | T | . | . | C | T | . | . | . | . | . | . | . | . | . | C | . | . | . | . | . | . | . | G | . |
10 | RIO | . | T | . | . | . | . | . | . | . | . | C | . | . | T | . | . | . | A | . | C | . | T | C | G | . |
Preencha a tabela abaixo com os valores de:
População | \(h\) | \(Hd\) | \(S\) | \(I\) | \(η\) | \(k\) | \(\pi\) |
---|---|---|---|---|---|---|---|
Venezuela | |||||||
Rio de Janeiro | |||||||
Total |