摘要:去年9月份,谷歌为Hadoop和Spark推出了Cloud Dataproc服务的beta版本,如今半年过去了,Cloud Dataproc服务已完成测试,现在可以被广泛使用。

谷歌在今年2月22日宣布,他们的Cloud Dataproc服务——一个全面的管理工具,基于Hadoop和Spark的开源大数据软件,现在可以被广泛使用。

这些服务支持MapReduce 引擎服务,用Pig平台编写的程序以及Hive数据仓库软件。该服务首先在去年9月份进行了测试,而且谷歌已经加强了该工具。

谷歌产品经理James Malone在博客中写道:

在测试中,Cloud Dataproc 添加了几个重要的特性包括性能调优,VM元数据和标签,以及集群版本管理等。 这个工具补充了一个专为批处理和流处理而设计的Google Cloud Dataflow的单独服务。该服务的基础技术已进入Apache孵化项目。

现在,谷歌Cloud Dataproc可供任何人使用,每个虚拟处理器一小时仅需要一美分。谷歌云已经具备了和AWS、Microsoft Azure和 IBM 公有云一较高下的能力,这三大厂商都已经拥有大数据服务。

与此同时也有其他创业公司提供Hadoop as a service。但这个服务区别在于Cloud Dataproc可以和谷歌其他的云服务无缝对接,例如Google Colud Storage、Google Cloud Bigtable和BigQuery。

转载于:https://www.cnblogs.com/dihc/p/5229001.html

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐