需求:有一个很大的文件想要每隔一定的行数,抽取出一行。经常应用于将文件拆成训练集和开发集。
awk '{if (NR%1333 == 0) print $0; }' train.all > valid.en
awk '{if (NR%1333 != 0) print $0; }' train.all > train.en
注:这里是每隔1333行就抽取一条数据作为valid.en文件的内容,可以根据需要进行修改。
需求:有一个很大的文件想要每隔一定的行数,抽取出一行。经常应用于将文件拆成训练集和开发集。
awk '{if (NR%1333 == 0) print $0; }' train.all > valid.en
awk '{if (NR%1333 != 0) print $0; }' train.all > train.en
注:这里是每隔1333行就抽取一条数据作为valid.en文件的内容,可以根据需要进行修改。