深度学习|泰坦尼克号生还数据处理 - 代码天地

深度学习|泰坦尼克号生还数据处理

其他 2019-02-18 21:01:46 阅读次数: 0

之前我们用过传统的机器学习算法预测过泰坦尼克号数据的生还情况，这次我们使用神经网络算法来进行建模。

数据处理

数据情况

这里的数据来源与kaggle上的数据，读者可以自行进行下载，我们通过pandas读取，首先看看数据的基本情况。

import numpy as np
import pandas as pd

data = pd.read_csv('titanic.csv')
data.head()

我们使用的字段有下面几个：

Survived：是否生还
Pclass：船舱等级
Sex：性别
Age：年龄
SibSp：手足和配偶在船上的数量
Parch：双亲和手足在船上的数量
Fare：费用
Embarked：登船港口

我们把这些字段筛选出来。

缺失值处理

首先，我们看看数据的缺失情况。

data.isnull().sum()

这里有两个字段有缺失值，age我们用平均值，embarked我们用最多的值进行填充。

age_mean = data['Age'].mean()
data['Age'] = data['Age'].fillna(age_mean)
data['Embarked'] = data['Embarked'].fillna('S')

性别和embarked

性别需要换成0和1
embarked进行哑变量

data['Sex']= data['Sex'].map({'female':0, 'male': 1}).astype(int)

data = pd.get_dummies(data=data,columns=['Embarked'])

划分数据集

接着我们按0.8划分数据集。

X = data.iloc[:,1:]
Y = data.iloc[:,0]
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=33)

标准化

最后我们把数据进行标准化，这样数据我们就处理完了。

from sklearn import preprocessing
scale = preprocessing.MinMaxScaler()
X_train = scale.fit_transform(X_train)
X_test = scale.transform(X_test)

猜你喜欢

转载自blog.csdn.net/weixin_34122604/article/details/87596683

深度学习|泰坦尼克号生还数据处理

泰坦尼克号生还预测

机器学习 - 泰坦尼克号预测生还

泰坦尼克号生还分析数据

Keras学习（四）-泰坦尼克号幸存数据处理

深度学习实现案例一：预测泰坦尼克号上旅客生还概率

机器学习泰坦尼克号乘客生还情况 ——数据集无法获取解决

泰坦尼克号生存预测（一）-- 数据处理

泰坦尼克号任务-数据处理和可视化

python 分析泰坦尼克号生还率

泰坦尼克号预测生还案例的分析（一）

预测泰坦尼克号乘客生还率

Python学习-泰坦尼克号

【机器学习】泰坦尼克号 -3 -数据清洗

机器学习项目 - 泰坦尼克号乘客生还率

机器学习——逻辑回归案例——泰坦尼克号乘客生还

【机器学习】随机森林预测泰坦尼克号生还概率

数据挖掘竞赛kaggle初战——泰坦尼克号生还预测

案例：使用seaborn分析泰坦尼克号生还者数据

Python机器学习入门1.8《使用集成模型预测泰坦尼克号乘客的生还情况预测》

Python机器学习入门1.7《使用决策树模型预测泰坦尼克号乘客的生还情况》

量化投资学习笔记23——支持向量机:实操，泰坦尼克号乘客生还机会预测

从泰坦尼克项目中，学习数据处理

泰坦尼克号预测学习总结

机器学习之泰坦尼克号遇难预测

泰坦尼克号船员获救学习记录

机器学习实战泰坦尼克号生存预测

用数据分析看泰坦尼克号

泰坦尼克号-数据挖掘项目实战

【数据挖掘】Kaggle泰坦尼克号分类与预测

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)