Python pandas 染色体 SNP 位点提取 并排序

import pandas as pd
from pandas import DataFrame as df

f = open('C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\1177genetype_hapmapcp1_18_01.txt')
d0 = pd.read_table(f, sep = "\t") #header 默认为第一行
d0.shape  #展示数据框的  行数和列数,如果数据为1,则对sep重新设置进行调节
d01 = d0[d0.chrom == 1]  #,提取1号染色体上的所有位点,染色体1 不可加‘’,以为已经为字符串型,等同于d02 = d0[d0.iloc[:,2] == 1]
print(d01)
d01.head()
d02 = d01.sort_values(by= 'pos')    #按照POS排序
d02.head(20)
d02.shape           #查看数据的  行数、列数
d02.to_csv("C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\chrom1.csv")

猜你喜欢

转载自blog.csdn.net/qq_40256654/article/details/84595026