cross_validation.train_test_split - 代码天地

cross_validation.train_test_split

编程语言 2018-05-24 05:02:26 阅读次数: 4

在机器学习中，该函数可按照用户设定的比例，随机将样本集合划分为训练集和测试集，并返回划分好的训练集和测试集数据。

语法

X_train,X_test, y_train, y_test =cross_validation.train_test_split(X,y,test_size, random_state)

1

参数说明

Code	Text
X	待划分的样本特征集合
y	待划分的样本标签
test_size	若在0~1之间，为测试集样本数目与原始样本数目之比；若为整数，则是测试集样本的数目。
random_state	随机数种子
X_train	划分出的训练集数据（返回值）
X_test	划分出的测试集数据（返回值）
y_train	划分出的训练集标签（返回值）
y_test	划分出的测试集标签（返回值）

代码示例
输入：

import numpy as np
from sklearn.model_selection import train_test_split

#创建一个数据集X和相应的标签y,X中样本数目为100
X, y = np.arange(200).reshape((100, 2)), range(100)

#用train_test_split函数划分出训练集和测试集，测试集占比0.33
X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.33, random_state=42)

#打印出原始样本集、训练集和测试集的数目
print("The length of original data X is:", X.shape[0])
print("The length of train Data is:", X_train.shape[0])
print("The length of test Data is:", X_test.shape[0])

1
2
3
4
5
6
7
8
9
10
11
12
13
14

输出：

The length of original data X is: 100
The length of train Data is: 67
The length of test Data is: 33

猜你喜欢

转载自blog.csdn.net/qq_30868235/article/details/80369686

cross_validation.train_test_split

Python笔记——cross_validation模块、train_test_split

sklearn.cross_validation.train_test_split用法

from sklearn.cross_validation import train_test_split，train_test_split下出现红色波浪线

sklearn中从sklearn.cross_validation 导入 train_test_split报错No module named ‘sklearn.cross_validation‘

Python sklearn.cross_validation.train_test_split及混淆矩阵实现

机器学习中 from sklearn.cross_validation import train_test_split出错

导入train_test_split时，ModuleNotFoundError: No module named 'sklearn.cross_validation'

导入train_test_split时，ModuleNotFoundError: No module named 'sklearn.cross_validation'

from sklearn.cross_validation import train_test_split 报错

Train, Validation and Test Sets

train_test_split

sklearn的train_test_split

train_test_split函数

关于train_test_split

笔记——Train_test_split

sklearn之Cross-validation、GridSearchCV，以及训练集（train）、测试集（test）、验证集（validate）的辨析

sklearn中的train_test_split（数据分割）、preprocessing（归一化）、cross_val_score（交叉验证）

Train/Test/Validation Set Splitting in Sklearn

sklearn学习：train_test_split

train_test_split----random_state

关于sklearn中train_test_split

sklearn的train_test_split函数

python中的train_test_split方法

sklearn.model_selection.train_test_split

Sklearn的train_test_split用法

train_test_split 参数详解

python中train_test_split()

train_test_split用法总结

Sklearn train_test_split参数详解

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)