Edata敏捷挖掘工具操作指引
一、登入系统
谷歌浏览器输入网址http://10.150.88.64:16060/Edata进入Edata登陆页面。
输入用户名密码,点击“登陆”,进入首页。
点击【数据管理】,进入敏捷挖掘模块。
- 新建数据源
【数据管理】>>【新建关系数据源】
说明:在左侧数据源目录(位置:【数据源】>>【知识竞赛】)上右键新建关系数据源;
不要使用点击图标的方式,因为图标是默认在根目录建立数据源,会提示没有权限。
2.编辑数据源
1,选择驱动类型为MySQL,系统自动配置如下:
2,编辑连接字符串:
需要将<servername>修改为IP:端口,<database>修改为相应数据库名;
3,填入用户名,密码;
4,点击【测试连接】,提示“测试通过”,表示配置成功,点击【保存】。
说明
数据源节点的配置可以参考截图,竞赛人员只需修改数据库名,用户名,密码。
3. 数据源管理
在刚建好的数据源上右键【数据库管理】,界面如下。
将【可用数据库资源】下的表移到【已选数据库资源】,点击【保存】。
【大数据工具】>>【新建原生SQL查询】,在弹出的数据源选择窗口中选择数据源(位置:【数据源】>>【知识竞赛】>>【知识竞赛源数据库】),进入SQL编辑界面如下:
在SQL文本区输入相应SQL语句,点击工具栏的图标,弹出输出数据界面如下:
点击左上角按钮即可输出数据。
关闭弹窗,点击工具栏图标进行保存。
点击【大数据工具】>>【敏捷挖掘】,进入敏捷挖掘模块。
四、 新建工作流
点击【文件】>>【新建工作流】,在弹窗中填入“工作流名”,选择“工作流存放位置”
五、配置数据源
点击【节点库】>>【数据源】,左键单击【SmartDI】节点不放,拖到工作流区域,双击节点,进行配置,如下图所示。
竞赛按目录【数据源】>>【知识竞赛】>>【知识竞赛源数据库】选择库表。
说明
每个节点有三种状态:
表示节点配置有误,此时工作流无法正常执行;
表示节点配置正常,可以执行工作流;
表示节点已有缓存,可以通过在节点上右键查看数据;
可视化节点存在缓存时,无法执行,若需要重新执行,可通过修改改节点之前的节点,或者在该节点上右键“清除缓存”
双击节点或在节点上右键选择【配置】。
选择相应表,点击【确定】,看到节点的状态变为,表示节点数据源配置完成。
也可以点击【仪表盘】,选择第三步创建的sql查询,拖拽至编辑区,点击右键预览按钮,预览数据,将sql的分析结果,作为工作流的输入,进一步做分析。
六、数据分析
略
七、结果数据导出
打开【节点库】>>【数据导出】目录,拖一个【数据库】节点到工作区,将要导出的数据对应的节点连接到该节点。配置数据库连接信息。配置同数据源。
配置说明:
如果表已存在
覆盖:删除原表,重新建表,插入数据
追加:直接插入数据
禁止:不允许导数据
配置完成后点击【应用】,如果消息栏没有错误提示表示配置正确,点击【确定】,该节点的状态变为。此时就可以执行工作流导出分析结果到对应的数据库了。
八、导出为CSV格式文件
- 创建数据集
方式一
该方式操作简单,但最多只能导出20000条数据。
工作流最后一个节点连接一个【表】节点,在【表】节点右键选择【执行并打开视图】
工作流将自动弹出结果数据列表窗口
点击右下角【发布】
操作步骤
- 位置选择“我的空间”;
- 输入名称;
- 是否发布任务不进行勾选
- 点击【确定】
- 回到首页>>大数据工具>>我的空间,可以看到刚刚发布的原生SQL查询“数据集1”
方式二
该方式操作较为复杂,但可以导出全量数据。
配置数据源
创建数据集
2. 导出CSV
打开创建好的数据集,点击工具栏的图标,弹出输出数据界面,点击“导出”>>“CSV”,如下
在弹出的窗口中,导出查询结果选择“全部”
点击【确定】,即可将分析结果数据导出为CSV格式文件。