实战详解使用IDE开发Spark程序 - 代码天地

实战详解使用IDE开发Spark程序

其他 2018-05-10 14:06:11 阅读次数: 1

1、打开Scala IDE for Eclipse的官网，官网地址：http://scala-ide.org/

2、点击Download IDE。

3、下载对应的版本。

4、scala-SDK-4.3.0-vfinal-2.11-win32.win32.x86_64.zip为例，解压缩。

5、双击打开eclipse.exe。

6、选择一个工作目录，然后点击OK。

7、在打开的窗口中，File -> New -> Scala Project。

8、写好Project name，点击Next。

9、点击Finish。

10、修改JRE System Library。

11、右击JRE System Library -> Build Path -> Configure Build Path...。

12、点击JRE System Library -> Edit。

13、选择Alternate JRE -> Installed JREs...。

14、点击Add...。

15、选择Standard VM，点击Next。

16、点击Directory...，选择本地文件安装JDK的安装目录，点击Finish。

17、选择刚才加入的JDK，点击OK。

18、下拉列表里选择刚才加入的JDK，点击Finish。

19、点击OK。

20、设置Scala library container。

21、项目上有右击 -> Properties。

22、打开的窗口点击Scala Compiler。

23、Use Project Settings打钩，打开Scala Installation下拉列表，选择Latest 2.10 bundle(dynamic)，点击OK。

24、点击OK。

25、下载spark-1.6.0-bin-hadoop2.6.tgz，解压spark-1.6.0-bin-hadoop2.6.tgz，解压以后目录如下：

26、添加Spark的jar依赖，项目右击 -> Build Path -> Configure Build Path...。

27、点击Libraries -> Add External JARs...。

28、选择lib目录下的spark-assembly-1.6.0-hadoop2.6.0.jar文件，点击打开。

29、点击OK。

30、项目里创建包，右击src -> New -> Package。

31、填写好Name，点击Finish。

32、创建Scala Object，右击com.dt.spark -> New -> Scala Object。

33、填写好Name，点击Finish。

34、开始编写WordCount，写Title。

35、添加main方法。

36、创建SparkConf对象，图里的第1步。

37、创建SparkContext对象，图里的第2步。

38、读取本地文件，图里的第3步

39、将每一行的字符串拆分成单个的单词，图里的第4.1步。

40、在单词拆分的基础上对每个单词实例计数为1，也就是word => (word, 1)，图里4.2步。

41、每个单词实例计数为1的基础之上统计每个单词在文件中出现的总次数，图里4.3步。

42、打印计算结果，图里的第5步。

43、关闭SparkContext，图里的第6步。

44、运行项目，右击WorkCount.scala文件 -> Run As -> Scala Application。

45、看见这样的结果，就代表成功了。

猜你喜欢

转载自www.cnblogs.com/frankdeng/p/9019206.html

实战详解使用IDE开发Spark程序

实战详解 IntelliJ IDEA下的Spark程序开发

SVD 详解与 spark实战

spark sortBy sortByKey实战详解

java开发实战视频详解

Flutter完整开发实战详解

第8课：使用ide开发spark程序

使用MyCat分库实战详解

spark 窗口函数(Window)实战详解

小程序开发实战（7）：Button组件详解

Android网络开发技术实战详解

wxPython 开发实战之 Font 详解

Node.Js开发实战详解

Python实战之logging模块使用详解

Python实战之unittest使用详解

Flutter完整开发实战详解(十六、详解自定义布局实战)

Conflux 开发教程 | 使用 IDE 在 Conflux 开发 DApp 的实战操作指南

Spark的DataFrame和Schema详解和实战案例Demo

深入掌握Git与实战开发2018（Git应用开发详解）

Spark应用程序开发参数调优深入剖析-Spark商业调优实战

第58课：使用Java和Scala在IDE中开发DataFrame实战

程序猿必知必会-MySQL 8.0详解与实战完整

Ajax+PHP程序设计实战详解

程序猿必知必会-MySQL 8.0详解与实战

4 springMVC详解（项目实战1-入门程序）

Android底层开发技术实战详解——内核、移植和驱动

Flex+PHP RIA应用开发实战详解

实战开发中springmvc常用注解标签详解

vue开发实战2.0.1——vue配置文件详解

Flutter完整开发实战详解(三、打包与填坑篇)

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)