关于RNA-SeQC.jar包的源码分析2

4.初始化RNASeqMetrics对象

    主要代码

        metrics.prepareOptionsFromCommandLine(cl);

  

    主要任务为将输入参数注入RNASeqMetrics对象,同时新建输出目录(根据 -o参数)。

    根据 gtf 生成 refGene.txt文件

    如果 rRNA 参数没有 则生成 rRNA_intervals.txt文件

   SAMPLE_FILE 属性 为 bam文件

   TRANSCRIPT_MODEL  为 gtf文件

   REF_GENOME   为  fasta文件

 5.读入分析文件

    主要代码

   private void prepareFiles()

   

   读入bam文件

      

 this.bams = MetricSample.readInSamples(this.SAMPLE_FILE, this.OUT_DIR);

      looking for contig names in reference fai file--读入 fai文件,即fasta 的 索引

     

ArrayList contigs = getOrderedContigsFAI(REF_GENOME);

   

     载入 gtf 文件  transcripts 为 副本list

   

   TranscriptList transcripts = TranscriptList.loadGTF(TRANSCRIPT_GTF, transcriptTypeField);

   根据 副本list 和 fasta索引 数据contigs  生成 refGene.txt文件 的数据.

   按照 configs 顺序 列出副本

生成
Transcript.transcriptsToRefGeneFile(contigs, transcripts, refGeneFile);

    其中 rna type的 写入 rRNA_intervals.txt

  

   transcripts.toRRNAIntervalList(rRNAIntervalFile);

猜你喜欢

转载自219.iteye.com/blog/2193375