第二章 氨基酸序列的进化演变

1、导读

分子进化的重要原理如基因进化的重复进化(gene duplication)、分子钟等(moleculer clock)都是通过研究氨基酸序列发现的。

这里之所以先介绍氨基酸进化的原因:

1)比DNA序列更加保守

2)蛋白质编码基因的DNA序列的对位排列分析上,需要氨基酸序列矫正

3)氨基酸的进化演变模型比DNA序列简单的多

本章的重要目的:介绍两个氨基酸序列间进化距离(evolutionary distance)的统计方法。

研究进化距离的意义:

1)对研究蛋白质进化非常重要

2)可用来构建系统树并估计分歧时间

在氨基酸序列方面,通常以氨基酸替代数来测定距离,但不同假设下存在不同的测度。

2、氨基酸的差异和不同氨基酸的比例

2.1)最简单的测度

两个序列间氨基酸个数差异(nd)。如果所有的氨基酸的个数相同(n),上述差异数就可以用来比较不同序列间的分歧程度。当多重序列比对时候,经常会含有插入缺失,这种情况下计算nd需要去掉插入缺失(间隔,indels),否则不同序列对间相比较时候计算出来的nd没有意义。nd:number of amino acid differences

2.2)p距离

两个序列间差异氨基酸所占的比例.即使n随着不同序列而变化,但比例值(p)依旧可以用于比较分歧程度,该距离为p距离(p为proportion的缩写)。公式为:

假设所有的氨基酸位点都是以相同的概率替代,则nd遵循二项式分布,因此其方差为:

n=140,nd位于对角线上,p值位于对角线下。可以看出,物种关系远时,p值大;物种关系近时,p值小。说明:随着物种分歧时间增大,氨基酸替代数目也增加。但是p并不严格与分歧时间(t)成比列。 下面将给出解释。

3、 泊松校正和τ距离

猜你喜欢

转载自www.cnblogs.com/djx571/p/9892747.html