Day 1 Preprocessing data - 代码天地

Day 1 Preprocessing data

其他 2019-01-22 20:34:33 阅读次数: 0

https://github.com/MLEveryday/100-Days-Of-ML-Code/blob/master/Code/Day%201_Data_Preprocessing.md

data set:

Country	Age	Salary	Purchased
France	44	72000	No
Spain	27	48000	Yes
Germany	30	54000	No
Spain	38	61000	No
Germany	40		Yes
France	35	58000	Yes
Spain		52000	No
France	48	79000	Yes
Germany	50	83000	No
France	37	67000	Yes

code:

import numpy as np
import pandas as pd
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

path = 'C:/Users/liky/Desktop/100-Days-Of-ML-Code-master/datasets/Data.csv'
dataset = pd.read_csv(path)
X = dataset.iloc[ : , :-1].values
Y = dataset.iloc[ : , 3].values

# 处理丢失数据
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X[ : , 1:3])
X[ : , 1:3] = imputer.transform(X[ : , 1:3])


# 解析分类数据
labelencoder_X = LabelEncoder()
X[ : , 0] = labelencoder_X.fit_transform(X[ : , 0])


# 创建虚拟变量
onehotencoder = OneHotEncoder(categorical_features = [0])
X = onehotencoder.fit_transform(X).toarray()
labelencoder_Y = LabelEncoder()
Y = labelencoder_Y.fit_transform(Y)


# 拆分数据集为训练集合和测试集合
X_train, X_test, Y_train, Y_test = train_test_split( X , Y , test_size = 0.2, random_state = 0)


# 特征量化
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform(X_test)

猜你喜欢

转载自blog.csdn.net/li_k_y/article/details/86496450

Day 1 Preprocessing data

Day 1_Data PreProcessing

Day1--Data Preprocessing

data preprocessing ——time series clip

Preprocessing data数据预处理

【hackerrank】-Day 1: Data Types

Data Analysis Day1

data-sklearn数据预处理 Preprocessing

机器学习-数据预处理(Data Preprocessing)

Maltab-机器学习-Importing and Preprocessing Data

Transformers数据预处理：Preprocessing data

preprocessing

C1W1-07_preprocessing

04_day1_data降维

sklearn库学习笔记1——preprocessing库

[Machine Learning with Python] My First Data Preprocessing Pipeline with Titanic Dataset

Top 5 Open Source Tools for Data Preprocessing in AI an

Big-data:Hadoop背景及集群部署（day1）

05_data降维 of 特征工程【day1】

Sklearn用户手册学习笔记 -- Transformers for data preprocessing

13_Loading and Preprocessing Data from multiple CSV with TensorFlow_custom training loop_TFRecord

【DeepLearning 文本分类实战】IMDB Data Preprocessing数据预处理

13_Loading & Preprocessing Data with TF 3_TF Datasets_images[index, ...,0]_plt images_profiling data

FXC Preprocessing

The sklearn preprocessing

使用preprocessing将一些变化幅度较大的特征化到[-1,1]之内。

电商项目day10-1(Spring-data-Solr入门demo)

ROOT(a Data analysis Framework)-Note4: iSTEP day1

数据治理-数据质量管理-Data governance Day1

Prediction(1)Data Collection

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)