sklearn数据集随机切分（train_test_split） - 代码天地

sklearn数据集随机切分（train_test_split）

其他 2018-10-30 21:42:53 阅读次数: 0

版权声明：本文为博主 http://blog.csdn.net/churximi 原创文章，未经允许不得转载，谢谢。 https://blog.csdn.net/churximi/article/details/61415254

sklearn学习

给定数据集X和类别标签y，将数据集按一定比例随机切分为训练集和测试集。

代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
功能：数据集按比例切分为训练集和测试集
时间：2017年3月11日 12:48:57
"""

# from sklearn.cross_validation import train_test_split
from sklearn.model_selection import train_test_split  # 更新

# 生成200个句子，前100个和后100个类别分别对应1和2
X = [[u"这是", u"第1个", u"测试"]] * 100 + [[u"这是", u"第2个", u"测试"]] * 100
y = [1] * 100 + [2] * 100

# 随机抽取20%的测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
print len(X_train), len(X_test)

# 查看句子和标签是否仍然对应
for i in range(len(X_test)):
    print "".join(X_test[i]), y_test[i]

if __name__ == "__main__":
    pass

实验结果

切分后的训练集和测试集标签仍然一一对应。

这里写图片描述

更新

2017年08月26日
由于sklearn更新，代码应改为：
from sklearn.model_selection import train_test_split

猜你喜欢

转载自blog.csdn.net/churximi/article/details/61415254

sklearn数据集随机切分（train_test_split）

train_test_split数据切分

sklearn的train_test_split

sklearn——train_test_split 随机划分训练集和测试集

sklearn中train_test_split详解（数据集划分为训练集与测试集）

scikit-learn用train_test_split随机划分数据集和训练集

sklearn学习：train_test_split

关于sklearn中train_test_split

sklearn的train_test_split函数

Sklearn的train_test_split用法

Sklearn train_test_split参数详解

train_test_split

纯随机采样(train_test_split)和分层采样(StratifiedShuffleSplit)| sklearn库实现

【自用】 sklearn 用 train_test_split 简单划分训练和测试集

sklearn的train_test_split的random_state

机器学习sklearn中的train_test_split()函数

sklearn的train_test_split函数的random_state

deep_learning_Function_sklearn的train_test_split()

1)sklearn学习之train_test_split

sklearn中train_test_split()函数用法

sklearn.model_selection中train_test_split的坑

08_sklearn数据集，数据集划分train_test_split，sklearn.datasets及其api，sklearn分类数据集，sklearn回归数据集，转换器与预估器

from sklearn.cross_validation import train_test_split，train_test_split下出现红色波浪线

train_test_split函数

关于train_test_split

笔记——Train_test_split

train_test_split 分割测试集训练集

数据集划分——train_test_split函数使用说明

Sklearn-train_test_split随机划分训练集和测试集

sklearn.model_selection.train_test_split随机划分训练集和测试集

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)