相对于0.5.0, 新版本的主要改进如下:
- 提供了一种新的部署方式,原先在部署运行时有本地模式和依赖于mesos的分布式模式两种,现在不依赖于mesos这种分布式集群管理框架也可以分布式运行了;
- 提供了一套JAVA API,可以使用java直接编写spark计算任务了,对于那些不想学写scala的是一种福音;但是相对的,任务代码要繁复一些了。不知道神码时候可以为c++程序员考虑下出个spark pipes
- 文档方面的完善,完善了 quick start guide, 部署,配置等文档
- 性能的提升,貌似要支持实时数据的处理了