读取affy表达谱芯片数据的方法
Affymetrix表达谱芯片数据读取的方法分3种:
1、使用affy包读取。(HGU95/HGU133芯片)
2、使用oligo包读取。(Whole Transcriptome 芯片/ NimbleGen 芯片/ SNP芯片等)
3、使用simpleaffy包读取。(HGU95/HGU133芯片)
说明
1 使用 affy 包读取
1 justRMA
有just.rma
和justRMA
两种函数可供使用。justRMA
整合了读取数据和rma算法处理两个步骤,可以直接读取数据生成ExpressionSet
,不产生AffyBatch
。代码如下:
just.rma(filenames)
justRMA(filenames, widget = F)
just.rma
必须给出要读取的CEL文件的文件名(可以为list
),justRMA
在不输入任何参数的时候表示读取工作目录下所有的CEL文件。若输入justRMA(widget=T)
,则表示手动选择要读取的CEL文件。推荐输入包含路径的文件名(list.celfiles(full.name = T)
的返回值)。
2 read.affybatch
有read.affybatch
和ReadAffy
两种函数可供选择,均读取CEL文件转换成AffyBatch对象,CEL文件无论是否压缩均可读取。代码如下:
read.affybatch(filenames)
ReadAffy(filenames, widget=F,celfile.path)
read.affybatch
必须给出要读取的CEL文件的文件名(可以为list
)且不能更改读取路径,读取路径固定为工作路径。ReadAffy
在不输入任何参数的时候表示读取工作路径下所有的CEL文件。若输入ReadAffy(widget=T)
,则表示手动选择要读取的CEL文件。
2 使用 oligo 包读取
read.celfiles
read.celfiles(filename)
读取CEL文件的时候推荐输入包含路径的文件名。即使用上一步代码list.celfiles(celpath, full.name = T)
的返回值。无论CEL文件是否被压缩均可读取。
3 使用 simpleaffy 包读取
read.affy
使用simpleaffy包读取CEL文件需要额外提供一个描述实验分组信息(即phenoData)的covdec文件。该文件与CEL文件放在同一目录下。要求covdec文件第一列无列名,含有要读取CEL文件名,剩下的列表示实验因子。代码如下:
read.affy(covdesc = "covdesc",path=".", ...)