摘要:去年9月份,谷歌为Hadoop和Spark推出了Cloud Dataproc服务的beta版本,如今半年过去了,Cloud Dataproc服务已完成测试,现在可以被广泛使用。
谷歌在今年2月22日宣布,他们的Cloud Dataproc服务——一个全面的管理工具,基于Hadoop和Spark的开源大数据软件,现在可以被广泛使用。
这些服务支持MapReduce 引擎服务,用Pig平台编写的程序以及Hive数据仓库软件。该服务首先在去年9月份进行了测试,而且谷歌已经加强了该工具。
谷歌产品经理James Malone在博客中写道:
在测试中,Cloud Dataproc 添加了几个重要的特性包括性能调优,VM元数据和标签,以及集群版本管理等。 这个工具补充了一个专为批处理和流处理而设计的Google Cloud Dataflow的单独服务。该服务的基础技术已进入Apache孵化项目。
现在,谷歌Cloud Dataproc可供任何人使用,每个虚拟处理器一小时仅需要一美分。谷歌云已经具备了和AWS、Microsoft Azure和 IBM 公有云一较高下的能力,这三大厂商都已经拥有大数据服务。
与此同时也有其他创业公司提供Hadoop as a service。但这个服务区别在于Cloud Dataproc可以和谷歌其他的云服务无缝对接,例如Google Colud Storage、Google Cloud Bigtable和BigQuery。
所有评论(0)