1.1 数据库系统的基本概念
1.1.1 数据管理与数据处理
数据(Data)是描述事物的符号记录,是数据库中存储的基本对象。数据在大多数人头脑中的第一个反应就是数字。其实数字只是一种简单的数据,是对数据传统、狭义的理解。从广义上理解,数据的种类很多,文字、图形、图像、声音、语言、学生的档案记录、货物的运输情况等都是数据,即
数据 = 量化特征描述 + 非量化特征描述
例如,对天气预报中的温度的高低可以进行量化表示,而“刮风”、“下雨”等特征则需要用文字或图形符号进行描述,它们都是数据,只是数据类型不同而已。自然界的任何事物都可以通过记录的形式进行描述。
(1) 人:(王一,男,21,1988,吉林)
(2) 学生:(王一,男,21,1988,吉林,计算机系,计算机应用专业)
数据形式本身并不能完全表达其内容,需要经过数据语义解释。数据与其语义是不可分的。例如:
(1) (王一,78) 可以赋予它一定的语义,它表示王一的期末考试平均成绩为78分。如果不了解其语义,则无法对其进行解释,甚至解释为王一的年龄为78。
(2) 99:8179,7954,521舅舅:不要吃酒,吃酒误事,我爱你
(3) 1×1 = 1一成不变
(4) 10002= 100×100×100千方百计
(5) 7/8七上八下
(6) 7÷2不三不四
1.1.2 数据库
数据库(Database, DB)是存放数据的仓库。只不过这个仓库位于计算机存储设备上,而且数据是按一定的格式存放的。数据是描述自然界事物特征的符号,而且能够被计算机处理。对数据进行存储的目的是为了从大量的数据中发现有价值的数据,这些有价值的数据就是“信息”。
数据库是长期存储在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并为各种用户所共享,数据库本身不是独立存在的,它是组成数据库系统的一部分,在实际应用中,人们面对的是数据库系统(Database System, DBS)。
1.1.3 数据库管理系统
数据库管理系统(Database Management System, DBMS)是一个系统软件,是数据库系统的一个重要组成部分,位于用户与操作系统之间。它的任务是科学地组织和存储数据,高效地获取和维护数据。DBMS负责对数据库的建立、运用和维护进行统一管理和控制,使用户能方便地定义数据和操纵数据,并能够保证数据的安全性、完整性,在多个用户同时使用数据库时进行并发控制,在发生故障后对系统进行恢复。它的主要功能有如下几个:
(1) 数据定义。
(2) 数据操纵。
(3) 数据库运行管理。
(4) 数据组织、存储和管理。
(5) 数据库建立和维护。
(6) 数据通信接口。
1.1.4 数据库系统
数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统(及开发工具)、应用系统、数据库管理员和用户构成。其中数据库管理员(Database Administrator, DBA)是负责数据库的建立、使用和维护等工作的专门人员。
1.数据库的基本特征
数据库是相互关联的数据的集合。数据库中的数据不是孤立的,数据和数据之间是相互关联的,也就是说,在数据库中不仅要能够表示数据本身,还要能够表示数据与数据之间的关系。
数据库有以下几个基本特征。
(1) 数据库具有较高的数据独立性。
(2) 数据库用综合的方法组织数据,保证尽可能高的访问效率。
(3) 数据库具有较小的数据冗余,可供多个用户共享。
(4) 数据库具有安全控制机制,能够保证数据的安全、可靠。
(5) 数据允许多用户共享,数据库能有效、及时地处理数据,并能保证数据的一致性和完整性。
2.数据管理技术的发展
如同其他科学技术的发展一样,数据管理技术也有一个发展的历程,大体上经历了3个阶段。
(1) 人工管理阶段(20世纪50年代中期以前)。这一阶段计算机主要用于科学计算。硬件中的外存只有卡片、纸带、磁带,没有磁盘等直接存取设备。软件只有汇编语言,没有操作系统和管理数据的软件。数据处理的方式基本上是批处理。
人工管理数据具有以下特点。
① 数据不保存。
② 应用程序管理数据。
③ 数据不共享。
④ 数据不具有独立性。
(2) 文件系统阶段(20世纪50年代后期至60年代中后期)。计算机不仅用于科学计算,而且还逐渐扩大到非计算领域,如用于管理。硬件方面:已经有磁盘、磁鼓等直接存取存储设备,磁盘已经成为联机应用的主要存储设备。软件方面:有了操作系统和高级语言,而且还有了专门的数据管理软件,也就是文件管理系统(或操作系统的文件管理部分),处理方式不仅有了文件批处理,而且能够进行联机实时处理。
文件系统管理数据的优点有如下3个。
① 数据可以长期保存。
② 有专门的软件即文件系统用于管理数据。
③ 文件的形式多样化。
文件系统管理数据的缺点也有如下3个。
① 数据共享性差,冗余度大。
② 数据独立性差。
③ 数据联系弱。文件与文件之间是独立的,文件之间的联系必须通过程序来构造,可见,文件是一个不具有弹性的、无结构的数据集合,不能反映现实世界事务之间的内在联系。
文件管理系统示例如图1-1所示。
图1-1 文件管理系统示例
(3) 数据库系统阶段(20世纪60年代后期以来)。20世纪60年代后期,在硬件方面出现了大容量的磁盘,价格下降,在软件方面出现了数据库管理系统。在数据库系统阶段使用数据库技术来管理数据。它克服了文件系统的不足,并增加了许多新功能。在这一阶段,数据由数据库管理系统统一控制,数据不再面向某个应用而是面向整个系统,因此数据可以被多个用户、多个应用共享。
数据库系统的特点如下。
① 数据结构化,这是数据库与文件系统的根本区别。
② 由DBMS提供统一的管理控制功能(安全性、完整性、并发控制、数据库恢复)。
③ 数据的共享性好。
④ 数据的独立性高。
⑤ 可控数据冗余度低。
数据库管理系统示例如图1-2所示。
图1-2 数据库管理系统示例