◣ 1.3 数据仓库的产生原因
事务处理环境不适宜决策支持系统(Decision Support System,简称DSS)应用的主要原因可以从以下5个方面来分析。
1.3.1 数据囚笼现象
一个人们常议论的问题是:已经有了数据库系统在处理我们的日常业务,为什么还要数据仓库?
可是,要用当前数据作为管理的决策支持,数据库系统能够胜任吗?
许多企业或组织机构在管理运作中,已经积累了大量的数据,包括业务运作、客户、产品和人员等。但是这些数据却被埋藏在计算机系统中未加以或难以利用,尤其是那些对于管理决策者有着重要意义的数据分析,没有被加以分析,就不能发挥其应有的作用和潜力。
如果企业或组织没有能力及时获得有价值的信息,就很难在今天这样迅速变化的环境中保持其竞争力。也就是说,存在着所谓的数据丰富、而信息贫乏的数据囚笼现象。
由于已经对计算机设备、数据库系统等进行了可观的投资,却对已产生的大量有价值的数据没有充分加以利用,这就是一个巨大的浪费。一些高级决策管理者曾不无感慨地说:“我们在计算机系统上花了很多钱,它却不能回答我们的问题!”
1.3.2 信息孤岛现象
另一个问题是:很多部门都已经在使用计算机和数据库,为什么还要数据仓库?
可是,用当前系统进行组织机构、全企业、全行业的综合管理和宏观调控,能够得到决策支持吗?当前常规系统是否相互之间完全兼容和集成呢?
事实上,旧系统往往是在过去不同的时期被不同的开发者开发的,这些系统通常是根据某些特定的要求制作的,并且分布于不同的系统平台上,同时信息又可能被各个有不同体制的部门分别维护管理,如某企业制造、销售、供销和财务的数据,常常分布在不同的互不兼容的数据库系统中,各系统之间的数据很难进行交换。
从总体管理需求的角度来讲,数据应该在整个企业范围内共享。数据应在整个企业或组织机构范围内以协调一致的方式来收集、整理、分析。但是传统的管理信息系统往往被所属部门隔绝,这就成为全面共享企业信息资源的障碍。因此,各部门要有效地进行信息交换非常困难。对管理决策者来讲,很难得到一个基于对大量数据进行运算后得出的有关企业运作的总体图景,也就是说在传统的操作型数据库系统上,要对整个企业或行业进行综合分析基本上是无能为力的。
1.3.3 相互矛盾的信息流
维持一个集成的并能够协调一致的信息流、资金流和物流是企业管理的一个重要课题。从理想的角度来说,信息流应当如实地反映资金流和物流的变化,但是实际上往往事与愿违。在传统的操作型数据库中,由于其分散性和不兼容性,再加上不同部门各自有不同的体制,使得这种集成很难达到,即理论和实际之间存在着很大的差距。这种分散的、不兼容的系统提供给我们的信息往往是不一致的,甚至是相互矛盾的。
1.3.4 集成的解决办法
数据仓库技术的出现,使得我们能够利用那些早已存放在操作型数据库里的数据。数据仓库技术旨在解决当前信息系统的两大问题:集成与分析。那些在事务处理系统中使用过的数据,经过一系列转换和升华,能够在数据仓库中获得新的用途。
● 数据仓库技术可以利用数据提取—转换—加载技术从许多不同的数据源中获取并收集数据,同时将其组成一个集成的、具有一致性的信息存储系统;
● 它采用一系列技术将数据转化为有价值的信息、知识、商务智能;
● 它采用先进的联机分析技术产生并向许多终端用户快速递交分析结果;
● 它为经营与管理决策提供了单一的、集成的视图;
● 与互联网技术相结合,数据仓库为人们提供了更为广阔的营运模式;
● 对于历史信息与当前信息,数据仓库能够使这些相当有价值的知识信息保留于系统的中央存储系统中,为再次开发系统从而获取新的知识信息储备提供支持。
因此,真正发掘数据的价值,对于管理来说是非常重要的。
在商业运营中进行监测管理,对今天的企业或组织的成功甚至生存都是至关重要的。作为企业的经营者和管理者,需要直接得到有关企业的准确数据分析、趋势分析,这些信息包含提高市场占有率、客户管理和营运效率方面的关键和诀窍。通过数据仓库能够将数据演变为有深远意义的决策支持信息。商业智能依托于数据仓库平台,为用户提供了一个企业运行框架,能够将主要的企业运行指标具体化,通过对这些指标的监测,能对其当前现状做出评估,并帮助企业做出相应的决策。
企业管理中的数据流、资金流、物流必须通过集成才能实现协调一致。认识到运用各种技术来研究数据给企业带来的好处和竞争优势,能够识别客户的发展趋势、发展方式,并发现竞争者还未认识到的隐含的关系和商机,管理者就可以运用这些信息和商机来引导企业走向成功,从而在竞争中占尽先机。
1.3.5 动力和动机
市场经济竞争关系的加剧和信息系统需求的发展促使人们要搞信息系统集成和分析,并实现对管理决策的支持。下面从信息系统、技术、应用、市场等几个方面归纳数据仓库的发展动向。
● 市场经济的强大竞争压力;
● 企业资源规划;
● 数据共享与集成;
● 提供广泛信息服务的需要,如不同部门、企业、行业、地区等;
● 企业兼并所造成信息系统的不一致性;
● 即刻准确实时的快速分析与预测;
● 客户关系管理;
● 政府管理向决策支持系统发展,商务智能的应用;
● 解决政府管理中的宏观决策、宏观调控、应变性和效率,减少官僚主义和低效能问题;
● 灾害应急;
● 连锁供应管理,集成供应与客户;
● 潜在有价值的数据并没有被认识和利用,没有真正挖掘数据潜力;
● 统一标准、统一管理是政府部门管理中利用重组的方法,实行和制定标准化;
● 简化流程,提高效率,减少错误;
● 分布式或分散数据库的相关分析;
● 分析数据以节约成本;
● 在商业运作出现危机时能够很快找到需要的信息;
● 历史性数据提供经验教训的自学习能力;
● 操作型事务处理数据库的卸载、安全与隔离。
总之,数据仓库产生的原因可归结为5个基本因素:
● 事务处理和分析处理的性能;
● 数据集成的需要;
● 数据动态集成的需要;
● 历史数据的利用;
● 数据综合的需要。