import pandas as pd #数据分析 import numpy as np #科学计算 from pandas import Series,DataFrame data_train = pd.read_csv("/Users/Hanxiaoyang/Titanic_data/Train.csv") data_train
https://blog.csdn.net/bbbeoy/article/details/73274931
逻辑回归应用之Kaggle泰坦尼克之灾 (点击查看)
http://link.zhihu.com/?target=http%3A//blog.csdn.net/han_xiaoyang/article/details/49797143
泰坦尼克号问题之背景
-
就是那个大家都熟悉的『Jack and Rose』的故事,豪华游艇倒了,大家都惊恐逃生,可是救生艇的数量有限,无法人人都有,副船长发话了『lady and kid first!』,所以是否获救其实并非随机,而是基于一些背景有rank先后的。
-
训练和测试数据是一些乘客的个人信息以及存活状况,要尝试根据它生成合适的模型并预测其他人的存活状况。
这个项目里有2个文件可以供我们分析,train.csv和test.csv,分别存着官方给的训练和测试数据。
1212