python/numpy随机选取训练集/测试集索引

在训练模型中, 往往需要对数据集进行处理,从数据集中随机选取部分数据作为训练集,而另一部分数据作为测试集,一个常用的方法是随机选取索引,下面介绍两种从0~n中随机选取x个不重复索引的方法。
注意下述两种方法选出来的都是整数。

方法一、用python的random

import random
def getRandomIndex(n, x):
	# 索引范围为[0, n), 随机选x个不重复
    index = random.sample(range(n), x)
    return index

方法二、用numpy.random.choice

def getRandomIndex(n, x):
	# 索引范围为[0, n),随机选x个不重复,注意replace=False才是不重复,replace=True则有可能重复
    index = np.random.choice(np.arange(n), size=x, replace=False)
    return index
发布了234 篇原创文章 · 获赞 311 · 访问量 94万+

猜你喜欢

转载自blog.csdn.net/qq_32623363/article/details/104180152