大数据平台如何选择?这是一个很头疼的问题。现如今是信息时代,每家公司的系统的数据量也越来越大,那么大数据平台如何选择呢?数据仓库还是用传统的数据库呢?“大数据平台如何选择”是不是要在数据仓库和数据库直接做个选择呢?

大数据平台如何选择?其实不是说一定要在数据仓库和数据库之间做个选择。首先我们来说一下,BW是什么?BW全称是Business Warehouse,定位于数据存储,主要用来构建数据仓库,包括ETL数据抽取、数据存储、和部分报表展现功能。那么大数据平台如何选择,我们是不是应该选择BW数据仓库,放弃数据库呢?

数据仓库(Data Warehouse)是指面向主题的,一致的,不同时间的,稳定的数据集合,用于支持经营管理中的决策支持过程。从广义上讲数据仓库是指存储大量历史数据的数据库。每一个记录代表特殊时间点上的一个数据。它是一种把收集的各种数据转变成有商业价值的信息技术,并把收集的信息体现在报告中。包括收集数据,过滤数据,存储数据,之后把数据应用于分析、报告等应用程序。

数据仓库建设是一个工程,是一个过程,而不是一种可以购买的产品。企业数据处理方式是以联机事务处理形式信息,并利用信息进行决策;在信息应用过程中管理信息。

数据仓库组成部分:数据市场,关系型数据库,数据源,数据准备,种服务工具。 

这里我们可以看出,在“大数据平台如何选择”的问题上,数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。数据仓库与数据库的主要区别在于:

(1)数据库是面向事务的设计,数据仓库是面向主题设计的。

(2)数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

(3)数据库设计是尽量避免冗余,数据仓库在设计是有意引入冗余。

(4)数据库是为捕获数据而设计,数据仓库是为分析数据而设计。

简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的。 “大数据平台如何选择”对于数据仓库还是数据库而言是不同的概念,也是不冲突的概念,数据库是属于数据仓库的一部分,也是核心的部分,所以在“大数据平台如何选择”的问题上,数据仓库和数据库不是对立项。

BW数据仓库是要基于数据库的,他们的区别我们刚才已经说过,在如今的大数据背景,我们在“大数据平台如何选择”的问题上,应该根据实际的业务需求,从数据库中建立对应的数据仓库来满足我们的需要。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐