线粒体|GetOrganelle组装软件

GetOrganelle

https://github.com/Kinggerm/GetOrganelle

GetOrganelle是中国科学院昆明植物研究所金建军和郁文彬两位老师共同开发的质体组装软件,论文发表在Genome Biology。

GetOrganelle的核心流程包括:
1)通过“种子”序列获得部分目标相关reads;
2)延伸reads获得所有目标相关reads;
3)对reads进行从头组装得到组装图形;
4)过滤组装图形;
5)识别细胞器组分并自动导出所有可能的细胞器基因组结构。
在这里插入图片描述
安装

1.使用conda安装,先创建一个环境。

conda create -n getorganelle

2.激活环境,并安装软件。

conda activate getorganelle
conda install getorganelle

3.安装完成后,需要下载参考序列库。

get_organelle_config.py --add embplant_pt,embplant_mt

可以通过查看帮助文档来查询软件具体参数的用法。
在这里插入图片描述

-1 双端测序的R1
-2 双端测序的R2
-o 结果文件
-F 数据库
-s 参考序列
-t 线程数
-R 最大的一个扩充循环的数,一般默认15
-k kmer的一个参数

4.基本用法。

#植物的2G左右的数据,组装叶绿体基因组用命令

get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o plastome_output -R 15 -k 21,45,65,85,105 -F embplant_pt

#更快的方法

get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o plastome_output --fast -k 21,65,105 -w 0.68 -F embplant_pt

#组装植物线粒体基因组

get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o mitochondria_output -R 50 -k 21,45,65,85,105 -P 1000000 -F embplant_mt

#组装植物核核糖体DNA片段

get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o nr_output -R 10 -k 35,85,115 -F embplant_nr

#组装真菌线粒体

get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -R 10 -k 21,45,65,85,105 -F fungus_mt -o fungus_mt_out

#组装真菌的核糖体

get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -R 10 -k 21,45,65,85,105 -F fungus_nr -o fungus_nr_out

#组装动物线粒体

get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -R 10 -k 21,45,65,85,105 -F animal_mt -o animal_mt_out

得到的文件是有complete就代表拼接是成环了。

end

猜你喜欢

转载自blog.csdn.net/weifanbio/article/details/121120926