1 Theta (\( \theta \))
群体遗传学中,在中性 Wright-Fisher 模型 (neutral Wright-Fisher model) 下,尺度参数为
\( \theta = 4N\mu \)
为每世代平均突变数的两倍。其中,\( N \) 为有效群体大小 (effective population size),\( \mu \) 为每世代个体突变率 (Klein et al. 1999)。
2 Watterson's estimator
Watterson GA (1975) Theoretical Population Biology 7:256-276
Carlson CS, et al. (2005) Genome Res 15:1553-1565
\( \theta = \frac{S}{ \sum_{i=1}^{n-1} \frac{1}{n} } \)
其中,\( S \) 为分离位点 (segregating site) 数目,\( n \) 为个体数。
2.1 计算
vcftools --vcf geno.vcf --SNPdensity 100000
\( \theta_w = \frac{SNP\_COUNT}{\sum \frac{1}{1} + \frac{1}{2} + ... + \frac{1}{n-1}} \)
3 Nucleotide diversity
Nei M, Li WH (1979) PNAS 76:5269-5273
Carlson CS, et al. (2005) Genome Res 15:1553-1565
\( \pi = \sum_{ij} x_i x_j \pi_{ij} \)
其中,\( x_i \) 为第 \( i \) 个序列的频率,\( π_{ij} \) 为第 \( i \) 个序列和第 \( j \) 个序列间核苷酸差异数目 (the number of nucleotide differences)。
3.1 计算
vcftools --vcf geno.vcf --site-pi vcftools --vcf geno.vcf --window-pi 100000 --window-pi-step 25000