NCBI SRA数据库使用详解----学习笔记
其他
2020-03-10 16:41:13
阅读次数: 0
- SRA(Sequence ReadArchive)数据库是用于存储二代测序的原始数据,包括454,Illumina,SOLiD,lonTorrent, Helicos和CompleteGenomics。除了原始序列数据外,SRA现在也存在raw reads在参考基因的比对信息。
- 根据SRA数据产生的特点,将SRA数据分为四类:
- studies--研究课题
- experiments--实验设计
- runs--测序结果集
- samples--样品信息
- SRA中数据结构的层次关系:studies->experiments->samples->runs
- 一个study可能包含多个experiment
- experiment包含了sample、DNA source、测序平台、数据处理等信息。
- 一个experiment可能包含一个或者多个runs
- runs表示测序仪运行所产生的reads
- SRA数据库用不同的前缀加以区分:
- ERP或者SRP表示studies
- SRS表示samples
- SRX表示experiments
- SRR表示runs
- BioSample数据库包含实验测定中使用的生物来源材料的描述。BioSample的序号以SAMN开头,然后会与SRA数据库中的SRS序列号相对应。
发布了273 篇原创文章 ·
获赞 16 ·
访问量 2万+
转载自blog.csdn.net/wxw060709/article/details/103700157