【机器学习课程-华盛顿大学】：1 案例研究 1.3 分类（2）亚马逊产品评价分类 - 代码天地

【机器学习课程-华盛顿大学】：1 案例研究 1.3 分类（2）亚马逊产品评价分类

其他 2018-06-30 04:35:58 阅读次数: 2

1、导入库和数据

import graphlab
graphlab.set_runtime_config('GRAPHLAB_DEFAULT_NUM_PYLAMBDA_WORKERS', 4)

products = graphlab.SFrame('amazon_baby.gl/')
products.head()

2、建立word_count矢量

products['word_count'] = graphlab.text_analytics.count_words(products['review'])
products.head()

3、检查最受欢迎商品之一的Giraffe评价

giraffe_reviews = products[products['name'] == 'Vulli Sophie the Giraffe Teether']

4、将评价分为positive和negtive

# ignore all 3* reviews
products = products[products['rating'] != 3]
# positive sentiment = 4* or 5* reviews
products['sentiment'] = products['rating'] >=4
products.head()

5、切分数据集、训练、评估模型

train_data,test_data = products.random_split(.8, seed=0)
sentiment_model = graphlab.logistic_classifier.create(train_data,
                                                     target='sentiment',
                                                     features=['word_count'],
                                                     validation_set=test_data)
sentiment_model.evaluate(test_data, metric='roc_curve')

6、根据模型预测Giraffe商品

giraffe_reviews['predicted_sentiment'] = sentiment_model.predict(giraffe_reviews, output_type='probability')
giraffe_reviews.head()

7、测试

要查看word_count中，最常用词的排序，使用如下代码：

products['word_count'].show()

the and to i a it this is for my of

猜你喜欢

转载自blog.csdn.net/weixin_41770169/article/details/80801121

【机器学习课程-华盛顿大学】：1 案例研究 1.3 分类（2）亚马逊产品评价分类

【机器学习课程-华盛顿大学】：1 案例研究 1.3 分类（1）概念描述

【机器学习课程-华盛顿大学】：1 案例研究 1.2 回归（2）房价预测实战

【机器学习课程-华盛顿大学】：1 案例研究 1.5 推荐系统（2）音乐推荐系统

【机器学习课程-华盛顿大学】：1 案例研究 1.4 聚类（2）wikipedia文章聚类

【机器学习课程-华盛顿大学】：1 案例研究 1.6 深度学习（2）深度学习特征作为输入训练逻辑回归分类

【机器学习课程-华盛顿大学】：1 案例研究 1.1 课程简介

【机器学习课程-华盛顿大学】：1 案例研究 1.6 深度学习（1）概念描述

【机器学习课程-华盛顿大学】：1 案例研究 1.5 推荐系统（1）概念描述

【机器学习课程-华盛顿大学】：1 案例研究 1.4 聚类（1）概念描述

【机器学习课程-华盛顿大学】：1 案例研究 1.2 回归（1）房价预测描述

【机器学习课程-华盛顿大学】：3 分类 3.5 boosting

【机器学习课程-华盛顿大学】：2 回归 2.3 性能评估（1）

【机器学习课程-华盛顿大学】：2 回归 2.5 Lasso Regression

【机器学习课程-华盛顿大学】：2 回归 2.6 总结

【机器学习课程-华盛顿大学】：3 分类 3.4(2) 决策树处理丢失数据

【机器学习课程-华盛顿大学】：3 分类 3.2 逻辑回归分类器过拟合

【机器学习课程-华盛顿大学】：3 分类 3.2 逻辑回归分类器

【机器学习课程-华盛顿大学】：3 分类 3.4 决策树过拟合

【机器学习课程-华盛顿大学】：3 分类 3.3 决策树decision tree

【机器学习课程-华盛顿大学】：3 分类 3.1 课程内容介绍、线性分类器、逻辑分类器

【机器学习课程-华盛顿大学】：2 回归 2.3 性能评估（2）

【机器学习课程-华盛顿大学】：2 回归 2.6 非参数化：最近邻和核回归

【机器学习课程-华盛顿大学】：2 回归 2.4 岭回归Ridge Regression

【机器学习课程-华盛顿大学】：2 回归 2.2 多元线性回归

【机器学习课程-华盛顿大学】：2 回归 2.1 线性回归模型

【机器学习课程-华盛顿大学】：3 分类 3.6 评估分类器：召回率和准确率

1.3 区块链分类

商品评价判别，文本分类——学习笔记

【机器学习课程-华盛顿大学】：4 聚类和检索 4.4 MoG混合高斯模型编程测试（2）

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)