level 9
一.数据仓库与数据库系统设计的不同点
20世纪90年代初,美国著名信息工程科学家w.H.Inmon提出了数据仓库的概念:“数据仓库是面向主题的、集成的、不可更新的且随时间不断变化的数据**,是用来支持管理人员的决策的。”这些特点说明了数据仓库从数据组织到面向的数据处理都跟数据库有较大区别,因此在进行数据仓库系统设计时,不能够照搬原来传统的数据库系统开发方法,需要寻找一个适于数据仓库设计的方法。
数据仓库系统设计与数据库系统设计的不同主要表现在以下几个方面:
(1)面向的处理类型不同。操作型数据库系统的设计方式是面向应用的,数据仓库的系统设计则是面向分析的。
(2)面向的需求不同。数据库系统设计有一组较确定的应用需求。而在数据仓库环境下,数据的分析处理的需求灵活,没有固定的模式,因而在进行数据仓库系统设计时,很难获得对用户需求的确切了解。这就决定了我们不可能从用户需求出发来进行数据仓库的设计。
(3)系统设计的目标不同。事务处理的响应时间是数据库系统设计的一个主要目标;而数据仓库系统设计主要目标是保证数据的四个基本特征。
(4)两者的数据来源或系统的输入不同。操作型环境的数据的输入通常来自于组织外部,设计操作型数据库就是设计如何通过与外部交互实现数据输入、存储、查询更新、可靠与正确等操作。而数据仓库的数据主要来自业已存在的系统内部,设计数据仓库就是要设计如何从现存的数据源中得到完整一致的数据,如何将所得数据进行转换、重组、综合,如何有效地提高数据分析的效率与准确性等等。
通过以上分析,确定数据仓库的开发必须具有以下几个基本特点:
(1)方法必须灵活。数据仓库设计师必须能在没有详细定义系统内每个画面和数据元素的情况下进行数据仓库的开发。
(2)开发过程必须是迅速而准确的。
(3)数据仓库的开发应基于数据驱动的特点。
数据仓库系统的原始需求不明确,且不断变化与增加,开发者最初并不能确切了解到用户的明确而详细的需求,用户所能提供的无非是需求的大的方向以及部分需求,更不能较准确地预见到以后的需求。因此,采用螺旋法来进行数据仓库的开发是比较合适的。
2. 基于数据驱动的螺旋式开发方法
基于数据驱动的螺旋式开发方法是将数据驱动的思想与螺旋式开发方法结合起来的一种开发方法。基于数据驱动方法的主要特点是:
(1)利用以前已经建立的数据库进行数据仓库的建设。要尽量利用已存在的数据和代码,而不是从头开始。这是数据驱动思想的出发点。
(2)基于数据驱动的方法不再是面向应用,而是面向主题。
数据仓库的设计是从已有的数据库系统出发,按照分析领域的要求对数据及数据之间的联系重新考察,以组织数据仓库中的主题。
基于数据驱动的螺旋式数据仓库开发过程是一个经过不断循环、反馈而使系统不断增长与完善的过程,其细化的流程图如图1所示。
2011年03月15日 09点03分