云中巨象——作为一种服务的Hadoop

Ashish在开始谈论时说到,现在数据的性质,包括海里的交互数据,都是非结构化的。而不仅仅是我们长期以来传统应用程序里处理数据结构化数据。

分析的性质也发生了改变。Ashish谈到了分析值从描述性向规范性分析的发展。

  • 描述性分析(发生了什么?)
  • 诊断性分析(为什么发生?)
  • 预测性分析(将会发生什么?)
  • 规范性分析(我们怎样才会让它发生?)

云提供很多好处,如按需和弹性扩展架构,高可扩展的对象存储和处理,和自适应的基础设施。使用云大数据平台提供更快的生产时间、敏捷和基础设施的灵活性以及显著降低成本。

Virtual Private Cloud (VPC)提供隔离访问计算和存储,以及提供安全实践。VPC的安全性包括云存储中的数据和网络数据,以及基于访问计算和存储的角色加密选项。

现代数据处理平台包括多个处理引擎,可以处理各种案例,如下面列举出:

  • 复杂批次处理SQL,Hive
  • 数据科学,Spark
  • 简单交互SQL查询,Presto
  • 批量数据清洗(ETL),Map Reduce

Ashish 还谈论了基于云平台的大数据参考架构,包括多租户数据访问、引擎统一、云计算服务和可移植性服务等。他总结报告说,Hadoop作为一种服务提供在大数据架构决策时是一个吸引人眼球的选择。

下面关于Hadoop的文章您也可能喜欢,不妨看看:

查看英文原文Elephant in the Cloud - Hadoop as a Service

猜你喜欢

转载自www.linuxidc.com/Linux/2016-05/131407.htm