假如有这样一个需求,生成8个字段,每个字段可指定范围,模拟这样的数据,代码很简单
import numpy as np
import pandas as pd
lenth=2000
size=8
#定义每个字段的范围
dic={}
dic['min1']=1#字段1的最小值
dic['max1']=20#字段1的最大值
dic['min2']=1
dic['max2']=20
dic['min3']=1
dic['max3']=20
dic['min4']=1
dic['max4']=20
dic['min5']=1
dic['max5']=20
dic['min6']=1
dic['max6']=20
dic['min7']=1
dic['max7']=20
dic['min8']=1
dic['max8']=20
ls=[]
#随机生成数据
for i in range(size):
_min,_max=dic['min'+str(i+1)],dic['max'+str(i+1)]
if i==0:ls=[np.random.randint(_min,_max,lenth).tolist()]
else:ls.append(np.random.randint(_min,_max,lenth).tolist())
arrays=np.array(ls).transpose(1,0)
df=pd.DataFrame(arrays)#将array转成DataFrame
print(df.head())
df.columns=['A','B','C','D','E','F','G','H',]#对列进行重命名
print(df.head())
这个指定的范围全为正整数。运行结果如下:
0 1 2 3 4 5 6 7
0 3 2 19 6 12 7 5 18
1 3 14 5 18 15 17 4 12
2 15 14 4 12 8 2 17 11
3 13 5 5 16 3 13 1 14
4 7 9 11 10 9 12 11 7
A B C D E F G H
0 3 2 19 6 12 7 5 18
1 3 14 5 18 15 17 4 12
2 15 14 4 12 8 2 17 11
3 13 5 5 16 3 13 1 14
4 7 9 11 10 9 12 11 7