Db96c7efd23680ceb025949a04553360
数据库与数据仓库之旅

随着关系数据库理论的提出,诞生了一系列经典的RDBMS,如Oracle,MySQL,SQL Server等。这些RDBMS被成功推向市场,并为社会信息化的发展做出的重大贡献。

然而随着海量数据的不断剧增,大数据行业的迅速发展,数据仓库的构建和架设也变得越来越重要了

那么数据库和数据仓库到底有什么区别,作为一个业务开发和大数据或者数据仓库开发,应该以一个怎样的视角去看待两者并应用到实际工作中去,本文主要从理论出发,站在一个折中的视角认知一下两者。

本质区别

那么到底数据库和数据仓库本质区别是什么呢?

  • 数据库 Database (Mysql)主要用于事务处理,
  • 数据仓库 Datawarehouse (Hive)主要用于数据分析。
数据仓库与数据库的主要区别在于:
  • (1)数据库是面向事务的设计,数据仓库是面向主题设计的。
  • (2)数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。
  • (3)数据库设计是尽量避免冗余,数据仓库在设计是有意引入冗余。
  • (4)数据库是为捕获数据而设计,数据仓库是为分析数据而设计。

以下概念源自网络

数据库:

是一种逻辑概念,用来存放数据的仓库。通过数据库软件来实现。数据库由很多表组成,表是二维的,一张表里可以有很多字段。字段一字排开,对应的数据就一行一行写入表中。数据库的表,在于能够用二维表现多维关系。目前市面上流行的数据库都是二维数据库。如:Oracle、DB2、MySQL、Sybase、MS SQL Server等。

数据仓库:

是数据库概念的升级。从逻辑上理解,数据库和数据仓库没有区别,都是通过数据库软件实现的存放数据的地方,只不过从数据量来说,数据仓库要比数据库更庞大得多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。

主要特点

用途上的不同决定了这两种架构的特点不同。

数据库(Database)的特点是:
  • 相对复杂的表格结构,存储结构相对紧致,少冗余数据。
top Created with Sketch.