4.初始化RNASeqMetrics对象
主要代码
metrics.prepareOptionsFromCommandLine(cl);
主要任务为将输入参数注入RNASeqMetrics对象,同时新建输出目录(根据 -o参数)。
根据 gtf 生成 refGene.txt文件
如果 rRNA 参数没有 则生成 rRNA_intervals.txt文件
SAMPLE_FILE 属性 为 bam文件
TRANSCRIPT_MODEL 为 gtf文件
REF_GENOME 为 fasta文件
5.读入分析文件
主要代码
private void prepareFiles()
读入bam文件
this.bams = MetricSample.readInSamples(this.SAMPLE_FILE, this.OUT_DIR);
looking for contig names in reference fai file--读入 fai文件,即fasta 的 索引
ArrayList contigs = getOrderedContigsFAI(REF_GENOME);
载入 gtf 文件 transcripts 为 副本list
TranscriptList transcripts = TranscriptList.loadGTF(TRANSCRIPT_GTF, transcriptTypeField);
根据 副本list 和 fasta索引 数据contigs 生成 refGene.txt文件 的数据.
按照 configs 顺序 列出副本
生成
Transcript.transcriptsToRefGeneFile(contigs, transcripts, refGeneFile);
其中 rna type的 写入 rRNA_intervals.txt
transcripts.toRRNAIntervalList(rRNAIntervalFile);