Capítulo 4 Variação e Diversidade Genética

4.1 Genética mendeliana $\times$ Genética de populações

A genética mendeliana estuda o comportamento de um ou mais loci gênicos em cruzamentos simples.

Nesta, dois parentais intercruzantes contribuem cada com um alelo por locus, e Os resultados esperados são proporções mendelianas das características fenotípicas.

Figura 4.2: Exemplos de proporções mendelianas em características co-dominantes (1:2:1) e dominantes (3:1).

Por outro lado, a genética de populações visa estudar o comportamento de um ou mais loci gênicos em múltiplos cruzamentos, i. e., em proporções populacionais.

Para tal, as informações genéticas do pool gênico de um ou mais demes constituindo unidades panmíticas são analisados a partir de amostras populacionais.

pool gênico – (Unidade genética) Todos os alelos em um ou mais loci gênicos.

deme – (Unidade ecológica ou demográfica) Grupo de indivíduos em uma dada área geográfica.

unidade panmítica – (Unidade reprodutiva) Grupo de indivíduos intercruzantes ao acaso.

amostra – (Unidade estatística) Subconjunto de tamanho $n$ de uma população de tamanho $N$, a partir do qual parâmatros são estimados, e inferências são feitas.

4.2 Frequências genotípicas

Considere um locus autossômico diplóide com dois alelos $A$ e $a$, sem dominância.

Em uma população $N$, deixe ser o número de indivíduos dos genótipos $AA = x$, $Aa = y$ e $aa = z$, de forma que:

\[x + y + z = N\]

Logo, as frequências genotípicas observadas na população serão:

para os homozigotos dominates ($AA$):

\[f_{Obs}(AA) = \frac{x}{N}\]

para os heterozigotos ($Aa$):

\[f_{Obs}(Aa) = \frac{y}{N}\]

e para os homozigotos recessivos ($aa$):

\[f_{Obs}(aa) = \frac{z}{N}\]

4.3 Frequências alélicas

As frequências alélicas (ou gênicas) podem ser definidas como:

\[\begin{equation} f(A) = p = \frac{2x + y}{2N} = f(AA) + ½f(Aa) \tag{4.1} \end{equation}\]

e

\[\begin{equation} f(a) = q = \frac{2z + y}{2N} = f(aa) + ½f(Aa) \tag{4.2} \end{equation}\]

De forma que,

\[\begin{equation} p + q = 1 \tag{4.3} \end{equation}\]

As frequências $p$ e $q$ são convenções, intercambiáveis em relação aos alelos $A$ e $a$.

Contudo, $q$ é geralmente usado para alelos recessivos, mutantes, raros ou desvantajosos.

Dominante e recessivo – propriedades fenotípicas.

Selvagem e mutante – propriedades ontológicas.

Comum e raro – propriedades estatísticas.

Vantajoso e desvantajoso – propriedades evolutivas.

4.4 Generalização das frequências genotípicas e alélicas

Considere um locus autossômico diplóide com $i$ alelos, sem dominância.

As frequências genotípicas observadas são:

\[f_{Obs}(A_1A_1) = \frac{N_{A_1A_1}}{N}\]

\[f_{Obs}(A_1A_2) = \frac{N_{A_1A_2}}{N}\]

\[...\]

\[f_{Obs}(A_1A_i) = \frac{N_{A_1A_i}}{N}\]

\[...\]

\[f_{Obs}(A_iA_i) = \frac{N_{A_iA_i}}{N}\]

As frequências alélicas serão:

\[f(A_1) = a_1 = f(A_1A_1) + ½ f(A_1A_2) + … + ½ f(A_1A_i)\]

\[f(A_2) = a_2 = f(A_2A_2) + ½ f(A_1A_2) + … + ½ f(A_2A_i)\]

\[...\]

\[f(A_i) = a_i = f(A_iA_i) + ½ f(A_1A_i) + … + ½ f(A_iA_i)\] De forma que:

\[a_1 \ + a_2 \ + \ ... \ + \ a_i = 1\]

4.5 Heterozigoside

A heterozigosidade (ou heterozigose) observada ($H_{Obs}$) de uma população é a freqüência de heterozigotos em um dado locus gênico.

Dada as definições de frequências genotípicas e alélicas, para um lócus bialélico, temos que:

\[H_{Obs} = \frac{y}{N} = f(Aa) = 1 – f(AA) – f(aa)\]

Esta estimativa é muito útil para avaliarmos a diversidade genética de uma população natural, uma vez que uma alta heterozigosidade quase sempre está relacionada a uma alta variabilidade genética, e vice-versa.

A heterozigosidade observada ($H_{Obs}$) é geralmente contrastada com a expectativa da heterozigosidade dado o princípio de Hardy-Weinberg.

Essa heterozigosidade esperada ($H_{Esp}$) pelo princípio de Hardy-Weinberg pode ser interpretada como a probabilidade de que um indivíduo seja heterozigoto para um determinado locus gênico (ver Modelando o princípio de Hardy-Weinberg{Modelando o princípio de Hardy-Weinberg})

Sendo,

\[H_{Esp} = 2pq = 1 – p^2 – q^2\]

Quando $H_{Obs} \neq H_{Esp}$, forças evolutivas podem estar atuando nas populações.

4.6 Diversidade gênética

O milho (_Zea mays_) foi domesticado pela primeira vez por povos indígenas no sul do México há cerca de 10.000 anos e espalhado para as Américas. A maioria desses grãos tradicionais corre o risco de ser perdido e esquecido. Uma parcela significativa de diversidade no milho é devida à recombinação genética.

Figura 4.3: O milho (Zea mays) foi domesticado pela primeira vez por povos indígenas no sul do México há cerca de 10.000 anos e espalhado para as Américas. A maioria desses grãos tradicionais corre o risco de ser perdido e esquecido. Uma parcela significativa de diversidade no milho é devida à recombinação genética.

Matsuoka et al. 2002. doi: 10.1073/pnas.052125199

Vigouroux et al. 2003. doi: 10.1093/molbev/msg156

Piperno 2011. doi: 10.1086/659998

Na linguagem comum, a variabilidade genética e a diversidade genética são erroneamente consideradas sinônimos entre si.

A variabilidade genética é a variação nos alelos dos genes ou nas sequências de DNA no pool gênico de uma espécie ou população. Isso se expressa em termos de formas alternativas no fenótipo.

A Diversidade genética, por outro lado, é um termo amplo que abrange toda a variabilidade que ocorre entre os diferentes genótipos relacionados a uma única espécie ou entre espécies.

Como definido por Swingland (2013), diversidade genética é a variação de características hereditárias presentes em uma população da mesma espécie; podendo essa variação se expressar na forma de alterações na morfologia, anatomia, comportamento fisiológico ou características bioquímicas.

A diversidade genética pode ser medida contando o número de genes diferentes em um pool gênico. Por sua vez, a variação genética só pode ocorrer e não pode ser medida, podendo ser considerada como unidade básica da diversidade genética.

Exemplo de dois conjuntos com diferentes níveis de variação e diversidade. Quando há variação nos elementos ($A$, $B$, $C$ e $D$), o conjunto ($X$ e $Y$) é mais diverso

Figura 4.4: Exemplo de dois conjuntos com diferentes níveis de variação e diversidade. Quando há variação nos elementos ($A$, $B$, $C$ e $D$), o conjunto ($X$ e $Y$) é mais diverso

Alguns autores consideram a diversidade genética ($D$) de um locus como a heterozigosidade esperada (H_{Esp}) daquele lócus, i. e., a proporção de genótipos heterozigotos dada a expectativa do princípio de Hardy-Weinberg.

Nesse sentido, a diversidade genética é composta de dois parâmetros:

o número de alelos na população, e
a abundância (ou uniformidade) dos alelos.

4.6.1 Exemplo

Se uma população consiste em um excesso de homozigotos para diferentes alelos, isso leva a uma baixa heterozigose observada, mas não afeta a heterozigose esperada.

População 2	População 2
$P_1 = \left\{ AA, BB, CC, DD \right\}$	$P_2 = \left\{ AB, AB, AB, AB \right\}$
$f(A) = f(B) = f(C) = f(D) = 0.25$	$f(A) = f(B) = 0.50$
$H_{Obs} = 0.00$	$H_{Obs} = 1.00$
$H_{Esp} = 1 – 4(0.25)^2 = 0.75$	$H_{Esp} = 1 – 2(0.5)^2 = 0.50$

Assim, se uma população apresenta um excesso de homozigotos para diferentes alelos, isso leva a uma baixa heterozigosidade observada, mas não afeta a heterozigose esperada.

4.7 Determinantes da diversidade genética

4.7.1 Extratégias reprodutivas

Animais estrategistas r são mais polimórficos do que estrategistas K. A correlação negativa apresentada no gráfico reflete uma compensação entre a quantidade e o tamanho da prole. Ver Ellegreen & Galtier ([2016](https://doi.org/10.1038/nrg.2016.58)).

Figura 4.5: Animais estrategistas r são mais polimórficos do que estrategistas K. A correlação negativa apresentada no gráfico reflete uma compensação entre a quantidade e o tamanho da prole. Ver Ellegreen & Galtier (2016).

Uma forte correlação foi relatada entre diversidade genética e características da história de vida das espécies, como massa corporal, longevidade e, surpreendentemente, estratégia reprodutiva.

Espécies altamente fecundas que liberam um grande número de ovos pequenos no ambiente (por exemplo, mexilhões, ouriços e minhocas; os chamados r-estrategistas) são muito mais polimórficos do que espécies que produzem um pequeno número de descendentes relativamente grandes e fornecem cuidados parentais (por exemplo, pinguins, cupins e cavalos-marinhos; chamados K-estrategistas)

Rominguier et al. (2014). doi: 10.1038/nature13685

4.7.2 Ligação gênica

Efeito da seleção ligada na diversidade genética (nucleotídica) em torno dos genes ou outros elementos funcionais. As linhas contínuas indicam a variação local no nível de diversidade nucleotídica, e as linhas tracejadas indicam a diversidade média em toda a região em questão. Ver Ellegreen & Galtier ([2016](https://doi.org/10.1038/nrg.2016.58)).

Figura 4.6: Efeito da seleção ligada na diversidade genética (nucleotídica) em torno dos genes ou outros elementos funcionais. As linhas contínuas indicam a variação local no nível de diversidade nucleotídica, e as linhas tracejadas indicam a diversidade média em toda a região em questão. Ver Ellegreen & Galtier (2016).

Em regiões com uma alta densidade de alvos de seleção (a), a seleção ligada é generalizada e reduz significativamente a diversidade em comparação com regiões com uma densidade mais baixa de alvos de seleção (b). Quando a taxa de recombinação é alta (c), o efeito da seleção ligada torna-se menos prevalente, permitindo a manutenção de altos níveis de diversidade naquela região.

Ambos os aspectos contribuem para a heterogeneidade dentro do genoma ao gerar vales de diversidade reduzida nas proximidades dos loci selecionados.

Cutter & Payseur (2013). doi: 10.1038/nrg3425

4.8 Medidas de Diversidade em loci diplóides

4.8.1 Nível de polimorfismo

Nível de polimorfismo ($P$)

\[\begin{equation} P = \frac{n_p}{K} \tag{4.4} \end{equation}\]

Onde, $n_p$ é o número de loci gênicos polimórficos observados, e $K$ é o número total de loci gênicos examinados.

Exemplo,

	Loc 1	Loc 2	Loc 3	Loc 4	Loc 5	Loc 6	Loc 7	Loc 8
Ind 1	AA	CC	CG	AA	TG	AG	TT	AA
Ind 2	AA	CC	CG	AA	CG	AG	TT	AA
Ind 3	AT	CC	GG	AA	CG	GG	TT	AA
Ind 4	AT	CC	GG	AA	GG	AA	TT	AC
Ind 5	TT	CC	CG	AA	CT	AA	TT	AC

	Poli	Mono	Poli	Mono	Poli	Poli	Mono	Poli

\[P = \frac{5}{8} = 0.625\]

4.8.2 Riqueza alélica

Riqueza alélica ($A$) é o número de alelos polimórficos observados em um locus gênico.

Exemplo,

	Loc 1	Loc 2	Loc 3	Loc 4	Loc 5	Loc 6	Loc 7	Loc 8
Ind 1	AA	CC	CG	AA	TG	AG	TT	AA
Ind 2	AA	CC	CG	AA	CG	AG	TT	AA
Ind 3	AT	CC	GG	AA	CG	GG	TT	AA
Ind 4	AT	CC	GG	AA	GG	AA	TT	AC
Ind 5	TT	CC	CG	AA	CT	AA	TT	AC

$A$	2	1	2	1	3	2	1	2

4.8.3 Número médio de alelos

Número médio de alelos por locus ($\bar{A}$)

\[\begin{equation} \bar{A} = \frac{ \sum_{i=1}^{i} {A_i} }{K} \tag{4.5} \end{equation}\]

Onde, $A_i$ é o número de alelos polimórficos observados no $i$-nésimo locus gênico, e $k$ é o número de loci gênicos examinados.

Exemplo,

	Loc 1	Loc 2	Loc 3	Loc 4	Loc 5	Loc 6	Loc 7	Loc 8
Ind 1	AA	CC	CG	AA	TG	AG	TT	AA
Ind 2	AA	CC	CG	AA	CG	AG	TT	AA
Ind 3	AT	CC	GG	AA	CG	GG	TT	AA
Ind 4	AT	CC	GG	AA	GG	AA	TT	AC
Ind 5	TT	CC	CG	AA	CT	AA	TT	AC

$A$	2	1	2	1	3	2	1	2

\[\bar{A} = \frac{2+1+2+1+3+2+1+2}{8} = \frac{14}{8} = 1.75\]

4.8.4 Número efetivo de alelos

O número efetivo de alelos ($A_e$) é O número de alelos igualmente frequentes que seriam necessários para atingir a mesma heterozigosidade esperada na população estudada, de forma que:

\[\begin{equation} A_e = \frac{1}{1-H_{Esp}} = \frac{1}{\sum {p_i^2}} \tag{4.6} \end{equation}\]

Onde, $p_i$ é a frequência do $i$-nésimo alelo em um locus gênico.

Exemplo,

	Loc 1	Loc 2	Loc 3	Loc 4	Loc 5	Loc 6	Loc 7	Loc 8
Ind 1	AA	CC	CG	AA	TG	AG	TT	AA
Ind 2	AA	CC	CG	AA	CG	AG	TT	AA
Ind 3	AT	CC	GG	AA	CG	GG	TT	AA
Ind 4	AT	CC	GG	AA	GG	AA	TT	AC
Ind 5	TT	CC	CG	AA	CT	AA	TT	AC

$f(\color{green}{A})$	0.60	–	–	1.00	–	0.60	–	0.80
$f(\color{red}{T})$	0.40	–	–	–	0.20	–	1.00	–
$f(\color{blue}{C})$	–	1.00	0.30	–	0.30	–	–	0.20
$f(\color{goldenrod}{G})$	–	–	0.70	–	0.50	0.40	–	–
$H_{Esp}$	0.48	0.00	0.42	0.00	0.62	0.48	0.00	0.32
$A_{e}$	1.92	1.00	1.72	1.00	2.63	1.92	1.00	1.47

4.9 Medidas de Diversidade em loci haplóides

4.9.1 Número de haplótipos

Número de haplótipos ($h$) é o número de haplótipos diferentes observados.

Exemplo,

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18
Ind 1	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 2	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 3	A	T	C	C	G	G	A	A	C	G	G	G	T	T	A	A	G	T
Ind 4	A	T	C	C	G	G	A	A	G	G	A	A	T	T	A	C	A	T
Ind 5	A	T	C	C	G	G	A	A	G	G	A	A	T	T	A	C	A	T

Desta forma, temos:

Haplótipo X – Haplótipo observado nos indivíduos 1 e 2;
Haplótipo Y – Haplótipo observado no indivíduo 3; e
Haplótipo Z – Haplótipo observado nos indivíduos 4 e 5;

E assim,

\[h = 3\]

4.9.2 Número de sítios segregantes

Número de sítios segregantes ($S$) é o número de sítios observados que apresentam variação (polimórficos).

Exemplo,

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18
Ind 1	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 2	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 3	A	T	C	C	G	G	A	A	C	G	G	G	T	T	A	A	G	T
Ind 4	A	T	C	C	G	G	A	A	G	G	A	A	T	T	A	C	A	T
Ind 5	A	T	C	C	G	G	A	A	G	G	A	A	T	T	A	C	A	T
$S$	0	1	0	0	1	0	0	0	1	0	1	1	0	0	0	1	1	1

E assim,

\[S = 8\]

4.9.3 Número de sítios invariáveis

Número de sítios invariáveis ($I$) é o número de sítios observados que não apresentam variação (constantes).

Exemplo,

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18
Ind 1	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 2	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 3	A	T	C	C	G	G	A	A	C	G	G	G	T	T	A	A	G	T
Ind 4	A	T	C	C	G	G	A	A	G	G	A	A	T	T	A	C	A	T
Ind 5	A	T	C	C	G	G	A	A	G	G	A	A	T	T	A	C	A	T
$I$	1	0	1	1	0	1	1	1	0	1	0	0	1	1	1	0	0	0

E assim,

\[I = 10\]

4.9.4 Número total de mutações

Número total de mutações ($\eta$; ${Eta}$}) (Fu & Li 1993), também referido como o número mínimo de mutações (Tajima 1996), é definido como:

\[\begin{equation} \eta = \sum_i^m s_i \tag{4.7} \end{equation}\]

Onde, $s_i$ é o número de diferentes nucleotídeos no $i$-nésimo sítio menos um.

Exemplo,

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18
Ind 1	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 2	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 3	A	T	C	C	G	G	A	A	C	G	G	G	T	T	A	A	G	T
Ind 4	A	T	C	C	G	G	A	A	G	G	A	A	T	T	A	C	A	T
Ind 5	A	T	C	C	G	G	A	A	G	G	A	A	T	T	A	C	A	T

$s$	0	1	0	0	1	0	0	0	2	0	1	1	0	0	0	1	1	1

E assim,

\[\eta = 10\]

4.9.5 Diversidade haplotípica

Diversidade haplotípica ($Hd$) representa a probabilidade de que dois indivíduos amostrados aleatoriamente apresentam haplótipos diferentes, de forma que:

\[\begin{equation} Hd = \frac{N}{N-1} \left( 1 - \sum{p_i^2} \right) \tag{4.8} \end{equation}\]

Onde, $N$ é o tamanho da amostra, e $p_i$ é a frequência do $i$-nésimo haplótipo.

Exemplo,

Dados os haplótipos observados no exemplo anterior, temos que:

	Hap X	Hap Y	Hap z
Ind 1	$\checkmark$	–	–
Ind 2	$\checkmark$	–	–
Ind 3	–	$\checkmark$	–
Ind 4	–	–	$\checkmark$
Ind 5	–	–	$\checkmark$

$p$	0.4	0.2	0.4

E assim,

\[Hd = \frac{5}{4-1} \left( 1 - 0.4^2 + 0.2^2 + 0.4^2 \right) = 1.25 \cdot 0.64 = 0.8\]

Observe que a probabilidade de um par de indivíduos amostrados aleatoriamente na população apresentar uma dada combinação haplotípica é dada pela matrix:

	Hap X	Hap Y	Hap z
Hap X	$\color{red}{p_X^2}$	$p_Xp_Y$	$p_Xp_Z$
Hap Y	$p_Xp_Y$	$\color{red}{p_Y^2}$	$p_Yp_Z$
Hap Z	$p_Xp_Z$	$p_Yp_Z$	$\color{red}{p_Z^2}$

Assim, as chances de dois indivíduos quaisquer apresentarem:

Haplótipos iguais $\rightarrow$ $\color{red}{p_X^2 + p_Y^2 + p_Z^2}$; e
Haplótipos diferentes $\rightarrow$ $2p_Xp_Y + 2p_Xp_Z + 2p_Yp_Z = 1 - \left( \color{red}{p_X^2 + p_Y^2 + p_Z^2} \right)$.

4.9.6 Número médio de diferenças nucleotídicas

Número médio de diferenças nucleotídicas (k) (Tajima 1983) é definido como:

\[\begin{equation} k = \frac { \sum_{i<j}^{} k_{ij} } { \binom{n}{2} } \tag{4.9} \end{equation}\]

Onde, $k_{ij}$ é o número de nucleotídeos diferentes entre as $i$-nésima e $j$-nésima sequência de nucleotídeos, e $n$ é o número de sequências sendo comparadas.

Exemplo,

Dadas as $n=5$ sequências do exemplo anterior, as comparações par-a-par entre elas serão:

	Ind 1	Ind 2	Ind 3	Ind 4	Ind 5
Ind 1	–
Ind 2	$k_{12}$	–
Ind 3	$k_{13}$	$k_{23}$	–
Ind 4	$k_{14}$	$k_{24}$	$k_{34}$	–
Ind 5	$k_{15}$	$k_{25}$	$k_{35}$	$k_{45}$	–

De forma que o número total de comparações será:

\[\binom{5}{2}=10\]

Assim, tomemos como exemplo a comparação entre as sequências dos indivíduos 2 e 3.

Onde,

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18
Ind 2	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 3	A	T	C	C	G	G	A	A	C	G	G	G	T	T	A	A	G	T

$k$	0	1	0	0	1	0	0	0	1	0	1	0	0	0	0	0	1	1

Logo,

\[k_{23} = 6\]

Desta forma, as diferenças de nucleotídeos entre os pares de sequências serão:

	Ind 1	Ind 2	Ind 3	Ind 4	Ind 5
Ind 1	–
Ind 2	0	–
Ind 3	6	6	–
Ind 4	6	6	5	–
Ind 5	6	6	5	0	–

E assim

\[k = \frac{\left( 0+6+6+6+6+6+6+5+5+0 \right)}{10}=4.6\]

4.9.7 Diversidade nucleotídica

Diversidade nucleotídica ($\pi$; $Pi$) ou número médio de substituições por sítio de nucleotídeo, é definida como:

\[\begin{equation} \pi = \frac { \sum_{i<j}^{} \pi_{ij} } { \binom{n}{2} } \tag{4.10} \end{equation}\]

Onde, $\pi_{ij}$ é a proporção de nucleotídeos diferentes entre as $i$-nésima e $j$-nésima sequência de nucleotídeos, e $n$ é o número de sequências sendo comparadas.

A diversidade nucleotídica pode ser estimada a partir do número médio de diferenças nucleotídicas ($k$) de forma que:

\[ \pi = \frac {k} {L} \]

Onde, $L$ é o tamanho do haplótipo em pares de bases.

Exemplo,

Dadas as $n=5$ sequências do exemplo anterior, as comparações par-a-par entre elas serão:

	Ind 1	Ind 2	Ind 3	Ind 4	Ind 5
Ind 1	–
Ind 2	$\pi_{12}$	–
Ind 3	$\pi_{13}$	$\pi_{23}$	–
Ind 4	$\pi_{14}$	$\pi_{24}$	$\pi_{34}$	–
Ind 5	$\pi_{15}$	$\pi_{25}$	$\pi_{35}$	$\pi_{45}$	–

De forma que o número total de comparações será:

\[\binom{5}{2}=10\]

Assim, tomemos como exemplo a comparação entre as sequências dos indivíduos 2 e 3.

Onde,

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18
Ind 2	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 3	A	T	C	C	G	G	A	A	C	G	G	G	T	T	A	A	G	T

$\pi$	0	$\frac{1}{18}$	0	0	$\frac{1}{18}$	0	0	0	$\frac{1}{18}$	0	$\frac{1}{18}$	0	0	0	0	0	$\frac{1}{18}$	$\frac{1}{18}$

Logo,

\[\pi_{23} = \frac {6}{18} = 0.333\]

Desta forma, as diferenças de nucleotídeos entre os pares de sequências serão:

	Ind 1	Ind 2	Ind 3	Ind 4	Ind 5
Ind 1	–
Ind 2	0	–
Ind 3	0.333	0.333	–
Ind 4	0.333	0.333	0.277	–
Ind 5	0.333	0.333	0.277	0	–

E assim

\[\pi = \frac{\left( 0+0.333+0.333+0.333+0.333+0.333+0.333+0.277+0.277+0 \right)}{10} \approx 0.255\]

4.10 Exercícios

4.10.1 Exercício 1 - Frequências gênicas e genotípicas

O gene $CCR5$ codifica um membro da família de receptores de beta quimiocina. Esta proteína é expressa por células T e macrófagos, e é conhecida por ser um importante co-receptor para vírus macrófagos-trópicos, incluindo HIV, para entrar nas células hospedeiras. Alelos defeituosos deste gene, como o alelo $\Delta 32$ que porta uma deleção, foram associados à resistência à infecção pelo HIV-1, em contraste com alelos selvagens ($wt$) funcionais (Solloch et al., 2017).

Tabela 4.1: Número de indivíduos dos genótipos envolvendo alelos selvagem ($wt$) e mutante (Δ32) do gene $CCR5$ em países da América do Sul
	$wt/wt$	$wt/$Δ32	Δ32$/$Δ32
Argentina	96	20	1
Brasil	510	58	2
Chile	81	21	2
Colômbia	215	20	2
Equador	77	6	0
Peru	176	18	0
Venezuela	56	6	0

Preencha a tabela abaixo com os valores das frequências genotípicas observadas e das frequências alélicas ($p$ e $q$) nas populações estudadas.

População	$f(wt/wt)$	$f(wt/\Delta32)$	$f(\Delta32/\Delta32)$	$p = f(wt)$	$q = f(\Delta32)$
Argentina
Brasil
Chile
Colômbia
Equador
Peru
Venezuela

4.10.2 Exercício 2 - Haplótipos mitocondriais

Figura 4.7: Colônia do gastrópode vermetídeo Petaloconchus varians.

A comparação de uma região de 636 pares de bases (pb) do gene citocromo c oxidase, subunidade 1 do DNA mitocondrial (cox1) do gastrópode vermetídeo formador de recifes Petaloconchus varians, entre indivíduos (IND) de duas populações da Venezuela (VEN) e do Rio de Janeiro (RIO), produziu a seguinte matriz de dados de sequência de nucleotídeos (Breves et al., 2022):

IND	POP	21	54	109	162	204	222	228	264	276	324	336	342	390	427	465	477	489	492	499	522	525	552	556	585	630
01	VEN	G	A	T	A	T	A	A	T	T	C	T	T	T	C	A	A	A	G	C	T	T	C	T	A	T
02	VEN	.	.	.	.	.	.	.	.	C	.	.	.	C	.	.	.	.	.	.	.	C	.	.	.	.
03	VEN	.	.	.	G	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.
04	VEN	.	T	.	.	.	.	G	.	.	.	.	C	.	.	.	.	.	.	T	.	.	T	C	G	.
05	VEN	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	T	C	G	.
06	RIO	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	T	C	G	.
07	RIO	.	T	C	.	.	.	.	.	.	.	.	.	.	.	G	.	G	.	.	.	.	T	.	G	.
08	RIO	.	T	.	.	.	.	.	A	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	A
09	RIO	A	T	.	.	C	T	.	.	.	.	.	.	.	.	.	C	.	.	.	.	.	.	.	G	.
10	RIO	.	T	.	.	.	.	.	.	.	.	C	.	.	T	.	.	.	A	.	C	.	T	C	G	.

Preencha a tabela abaixo com os valores de:

População	$h$	$Hd$	$S$	$I$	$η$	$k$	$\pi$
Venezuela
Rio de Janeiro
Total

População 2	População 2
\(P_1 = \left\{ AA, BB, CC, DD \right\}\)	\(P_2 = \left\{ AB, AB, AB, AB \right\}\)
\(f(A) = f(B) = f(C) = f(D) = 0.25\)	\(f(A) = f(B) = 0.50\)
\(H_{Obs} = 0.00\)	\(H_{Obs} = 1.00\)
\(H_{Esp} = 1 – 4(0.25)^2 = 0.75\)	\(H_{Esp} = 1 – 2(0.5)^2 = 0.50\)

	Hap X	Hap Y	Hap z
Hap X	\(\color{red}{p_X^2}\)	\(p_Xp_Y\)	\(p_Xp_Z\)
Hap Y	\(p_Xp_Y\)	\(\color{red}{p_Y^2}\)	\(p_Yp_Z\)
Hap Z	\(p_Xp_Z\)	\(p_Yp_Z\)	\(\color{red}{p_Z^2}\)

População	\(h\)	\(Hd\)	\(S\)	\(I\)	\(η\)	\(k\)	\(\pi\)
Venezuela
Rio de Janeiro
Total

	Hap X	Hap Y	Hap z
Ind 1	\(\checkmark\)	–	–
Ind 2	\(\checkmark\)	–	–
Ind 3	–	\(\checkmark\)	–
Ind 4	–	–	\(\checkmark\)
Ind 5	–	–	\(\checkmark\)

\(p\)	0.4	0.2	0.4

	Ind 1	Ind 2	Ind 3	Ind 4	Ind 5
Ind 1	–
Ind 2	\(k_{12}\)	–
Ind 3	\(k_{13}\)	\(k_{23}\)	–
Ind 4	\(k_{14}\)	\(k_{24}\)	\(k_{34}\)	–
Ind 5	\(k_{15}\)	\(k_{25}\)	\(k_{35}\)	\(k_{45}\)	–

	Ind 1	Ind 2	Ind 3	Ind 4	Ind 5
Ind 1	–
Ind 2	\(\pi_{12}\)	–
Ind 3	\(\pi_{13}\)	\(\pi_{23}\)	–
Ind 4	\(\pi_{14}\)	\(\pi_{24}\)	\(\pi_{34}\)	–
Ind 5	\(\pi_{15}\)	\(\pi_{25}\)	\(\pi_{35}\)	\(\pi_{45}\)	–

IND	POP	21	54	109	162	204	222	228	264	276	324	336	342	390	427	465	477	489	492	499	522	525	552	556	585	630
01	VEN	G	A	T	A	T	A	A	T	T	C	T	T	T	C	A	A	A	G	C	T	T	C	T	A	T
02	VEN	.	.	.	.	.	.	.	.	C	.	.	.	C	.	.	.	.	.	.	.	C	.	.	.	.
03	VEN	.	.	.	G	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.
04	VEN	.	T	.	.	.	.	G	.	.	.	.	C	.	.	.	.	.	.	T	.	.	T	C	G	.
05	VEN	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	T	C	G	.
06	RIO	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	T	C	G	.
07	RIO	.	T	C	.	.	.	.	.	.	.	.	.	.	.	G	.	G	.	.	.	.	T	.	G	.
08	RIO	.	T	.	.	.	.	.	A	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	A
09	RIO	A	T	.	.	C	T	.	.	.	.	.	.	.	.	.	C	.	.	.	.	.	.	.	G	.
10	RIO	.	T	.	.	.	.	.	.	.	.	C	.	.	T	.	.	.	A	.	C	.	T	C	G	.

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18
Ind 2	A	A	C	C	C	G	A	A	T	G	A	G	T	T	A	A	A	A
Ind 3	A	T	C	C	G	G	A	A	C	G	G	G	T	T	A	A	G	T

\(\pi\)	0	\(\frac{1}{18}\)	0	0	\(\frac{1}{18}\)	0	0	0	\(\frac{1}{18}\)	0	\(\frac{1}{18}\)	0	0	0	0	0	\(\frac{1}{18}\)	\(\frac{1}{18}\)

IND	POP	21	54	109	162	204	222	228	264	276	324	336	342	390	427	465	477	489	492	499	522	525	552	556	585	630
01	VEN	G	A	T	A	T	A	A	T	T	C	T	T	T	C	A	A	A	G	C	T	T	C	T	A	T
02	VEN	.	.	.	.	.	.	.	.	C	.	.	.	C	.	.	.	.	.	.	.	C	.	.	.	.
03	VEN	.	.	.	G	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.
04	VEN	.	T	.	.	.	.	G	.	.	.	.	C	.	.	.	.	.	.	T	.	.	T	C	G	.
05	VEN	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	T	C	G	.
06	RIO	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	T	C	G	.
07	RIO	.	T	C	.	.	.	.	.	.	.	.	.	.	.	G	.	G	.	.	.	.	T	.	G	.
08	RIO	.	T	.	.	.	.	.	A	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	A
09	RIO	A	T	.	.	C	T	.	.	.	.	.	.	.	.	.	C	.	.	.	.	.	.	.	G	.
10	RIO	.	T	.	.	.	.	.	.	.	.	C	.	.	T	.	.	.	A	.	C	.	T	C	G	.

4.1 Genética mendeliana \(\times\) Genética de populações

4.2 Frequências genotípicas

4.3 Frequências alélicas

4.4 Generalização das frequências genotípicas e alélicas

4.5 Heterozigoside

4.6 Diversidade gênética

4.6.1 Exemplo

4.7 Determinantes da diversidade genética

4.7.1 Extratégias reprodutivas

4.7.2 Ligação gênica

4.8 Medidas de Diversidade em loci diplóides

4.8.1 Nível de polimorfismo

4.8.2 Riqueza alélica

4.8.3 Número médio de alelos

4.8.4 Número efetivo de alelos

4.9 Medidas de Diversidade em loci haplóides

4.9.1 Número de haplótipos

4.9.2 Número de sítios segregantes

4.9.3 Número de sítios invariáveis

4.9.4 Número total de mutações

4.9.5 Diversidade haplotípica

4.9.6 Número médio de diferenças nucleotídicas

4.9.7 Diversidade nucleotídica

4.10 Exercícios

4.10.1 Exercício 1 - Frequências gênicas e genotípicas

4.10.2 Exercício 2 - Haplótipos mitocondriais

IND	POP	21	54	109	162	204	222	228	264	276	324	336	342	390	427	465	477	489	492	499	522	525	552	556	585	630
01	VEN	G	A	T	A	T	A	A	T	T	C	T	T	T	C	A	A	A	G	C	T	T	C	T	A	T
02	VEN	.	.	.	.	.	.	.	.	C	.	.	.	C	.	.	.	.	.	.	.	C	.	.	.	.
03	VEN	.	.	.	G	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.
04	VEN	.	T	.	.	.	.	G	.	.	.	.	C	.	.	.	.	.	.	T	.	.	T	C	G	.
05	VEN	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	T	C	G	.
06	RIO	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	.	T	C	G	.
07	RIO	.	T	C	.	.	.	.	.	.	.	.	.	.	.	G	.	G	.	.	.	.	T	.	G	.
08	RIO	.	T	.	.	.	.	.	A	.	T	.	.	.	.	.	.	.	.	.	.	.	.	.	.	A
09	RIO	A	T	.	.	C	T	.	.	.	.	.	.	.	.	.	C	.	.	.	.	.	.	.	G	.
10	RIO	.	T	.	.	.	.	.	.	.	.	C	.	.	T	.	.	.	A	.	C	.	T	C	G	.