商业大数据线性回归实验:北京二手房房价实验步骤(上)
-
实验要求
(1)使用北京二手房房价.csv文件,创建一个工作流。
(2) 用北京二手房房价.csv文件中的数据生成单位面积房价直方图、内部因素的单位面积房价箱线图、各城区的单位面积房价箱线图以及公共交通资源(地铁)、学区资源与单位面积房价的关系箱线图。
(3)工作流命名为:BeijingHousePrice -
创建工作流

(1)主菜单:File→New
(2)在向导中选择New KNIME Workflow,再选择“Next”

(3)输入工作流的名称:BeijingHousePrice,选择“Finish”

(4)在Explorer中,新建的工作流“BeijingHousePrice”已经可见。
 -
在工作流中添加节点
(1)在Node Repository的搜索栏中搜索“csv reader”并将其拖入工作流编辑器窗口中,命名为“读入csv数据”


(2)对该节点进行设置
在工作流编辑器窗口中双击该节点图标,在工作区中输入文件名

然后“Apply”

(3)此时节点并未读取,显示黄灯。
 -
添加直方图节点
(1)在Node Repository的搜索栏中搜索“histogram(local)”并将其拖入工作流编辑器窗口中,命名为“单位面积房价直方图”

连接CSV Reader节点和Histogram(local)节点

(2)配置筛选器

完成后点击“OK”

(3)查看直方图可视化结果
右键“单位面积房价直方图”→Execute and Open Views