软件简介
MCScanX工具集对MCScan算法进行了调整,用于检测共线性和同线性区域,还增加了可视化和下游分析。。MCscanX有三个核心工具,以及12个下游分析工具。
软件安装
进入官网http://chibba.pgml.uga.edu/mcscan2/#tm,下载安装
1 unzip MCscanX.zip 2 cd MCScanX 3 make
软件使用
-
所需要文件
两个或多个物种的gff文件,蛋白序列(** 该软件最多能做5个物种的共线性)
-
第一步:构建索引,进行blastp比对
注意!这里是找at和vv两个基因组组内和组间的共线性,因为想同时知道物种内和物种间的共线性,所以在blast之前把at和vv的基因组facat到一起,既做database,又做query,如果只想知道
组间的共线性,那么就任取一个基因组为database,另一个做query
注意! 如果一个基因有多个转录本,只选择注释中的第一条
1 ## 合并 2 cat at.fa vv.fa >>all.fa 3 4 ## 建库 5 makeblastdb -in all.fa -dbtype prot -out index/all -parse_seqids 6 7 ## 比对 8 blastp -query all.fa -db index/all -out all.blast -evalue 1e-5 -num_threads 10 -outfmt 6 -num_alignments 5
-
第二步:构建gff文件
注意:all.gff, all.blastp 前缀需要一样,并且在同一文件夹下
1 sp# gene starting_position ending_position
根据物种的gff3文件利用awk 快速得到MCscanX要求的gff文件
-
第三步:MCScanX寻找共线性区块
1 MCScanX ./all
-
结果文件
输出文件分为两个:
第一个是at_rice.collinearity, 记录着共线性区块(collinear blocks)