HOMER | MEME | 转录因子的靶基因预测

Finding Enriched Motifs in Genomic Regions (findMotifsGenome.pl)

在指定区域做motif enrichment,大大降低了假阳性。

MEME也可以做,但是设定更加复杂。

转录因子的表达具有高度的组织特异性,而且已知的TF只有1000多个,基因有30000多个,所以一个TF的靶基因可能有几百个,而且具有高度的时空组织特异性。

实验的方法就不说了,可靠、成本高、耗费劳力。

以下只说高通量数据的预测方法。

最简单的预测就是基于基因表达,co-expressed就是可能的靶基因,预测软件一大把。

问题很多,首先理解假设:

1. TF的线性变化引起target gene的线性变化,他们线性相关;

2. TF的调控是sparse的,

问题:

1. 有人说这根本就不是线性的,TF的yes or no,决定target gene的表达;

2. 不是线性相关,存在shift,先后的shift是普遍存在的;

3. co-expression是无法得出target关系的;

所以,现在大家都开始结合motif enrichment了,TF的靶向作用是靠motif与基因组DNA结合来执行的。

但是我们不知道结合位点,所以大部分的富集都默认选择了10kb的flanking region,motif很短,随机比对会带来很多假阳性。

现在,大家有open chromatin的数据了,知道了候选的结合区域,我们就可以更有效的预测了,这就是HOMER的预测功能。

最终,open chromatin还是不准,因为DNA有三维结构,distal regulation是普遍存在的。

猜你喜欢

转载自www.cnblogs.com/leezx/p/10623293.html