把训练好的GBDT模型放到spark streaming上运行，并可以实时的处理流过来的数据 - 代码天地

把训练好的GBDT模型放到spark streaming上运行，并可以实时的处理流过来的数据

其他 2020-03-26 08:59:02 阅读次数: 0

from pyspark.mllib.regression import LabeledPoint
from pyspark.mllib.feature import HashingTF
from pyspark.mllib.tree import GradientBoostedTrees, GradientBoostedTreesModel
from pyspark import SparkConf,SparkContext
from pyspark.streaming import StreamingContext
from pyspark.mllib.regression import LinearRegressionWithSGD
import numpy as np
import pandas as pd
from sklearn.externals import joblib

import warnings
warnings.filterwarnings("ignore")
# 加载
clf = joblib.load('/home/ouguangji/PycharmProjects/test1/qgfenxi/model/train_model_result.m')

p_data = pd.read_csv('/home/ouguangji/PycharmProjects/test1/qgfenxi/model/data1.csv')
x = p_data.drop(['y','x1'],axis=1).values
y = p_data[['y']].values
pp_data = []
for i in range(len(x)):
    pp_data.append(LabeledPoint(*(y[i]), list(x[i])))
conf = SparkConf().setAppName('spark-streaming-gbdt').setMaster('local[8]')
sc = SparkContext(conf=conf)
ssc = StreamingContext(sc, 1)
lines = ssc.textFileStream('file:///home/ouguangji/桌面/1')
counts = lines.flatMap(lambda line: line.split("\n")).map(lambda line: line.split(","))
counts = counts.map(lambda line: clf.predict(np.asarray(list(map(float, list(line)))).reshape(1,19)))
# flatMap(lambda line:line.split('\n'))
counts.pprint()

ssc.start()
ssc.awaitTermination()





# a = [0.783,0.22,0.017,3,1,2.02,0,0,0,0,0,0,0,0,0,0,2,5,5]
# print(*(clf.predict(np.array(a).reshape(1,19))))

夏天的风€&^_^

发布了65 篇原创文章 · 获赞 29 · 访问量 6512

私信关注

猜你喜欢

转载自blog.csdn.net/qq_41617848/article/details/103248334

把训练好的GBDT模型放到spark streaming上运行，并可以实时的处理流过来的数据

cpu上训练的模型放到gpu上继续训练

Spark Streaming实时处理Kafka数据

TensorFlow实现人脸识别(5)-------利用训练好的模型实时进行人脸检测

将训练好的Pytorch模型修改为可以在Android部署的样式

Tensorflow用别人训练好的模型进行图像分类（可运行）

(Ubuntu)Tensorflow object detection API——（2）运行已经训练好的模型

python_torch_加载数据集_构建模型_构建训练循环_保存和调用训练好的模型

将TensorFlow训练好的模型迁移到Android APP上（TensorFlowLite）

TensorFlowLite：将TensorFlow训练好的模型迁移到Android APP上

DL开源框架Caffe | 用训练好的模型对数据进行预测

Tensorflow如何保存、读取model （即利用训练好的模型测试新数据的准确度）

PaddlePaddle在使用训练好的模型预测句子时出现数据类型的错误

pytorch在cpu上加载预先训练好的GPU模型以及GPU上加载CPU上训练的Model

Tensorflow学习教程------利用卷积神经网络对mnist数据集进行分类_利用训练好的模型进行分类

yolov3的pytorch版本保存自定义数据集训练好的权重，并载入自己的模型

opencv进阶-基于coco数据集训练好的模型，修改类别显示代码，实现自定义检测物体

Spark Streaming: 实时流式数据处理机制(1)

保存训练好的模型并调用

python保存训练好的模型

3.3 使用训练好的模型

使用训练好的模型参数

tensorflow保存训练好的模型

调用训练好的detectron模型

pytorch保存训练好的模型

MXNET下载训练好的模型

TensorFlow迁移学习: 使用ImageNet训练好的inception v3模型tensorflow_inception_graph.pb训练flowers数据集

Spark3大数据实时处理-Streaming+Structured Streaming 实战

深度学习模型训练好后使用time.time()测试处理每一帧速度（时间）和模型推理速度（时间）

Spark Streaming（上）--实时流计算Spark Streaming原理介绍

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)