1.3.1 数据的定义
什么是数据呢?在这里我们使用百度词典给出的定义。数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。它不仅指狭义上的数字,还可以是具有一定意义的文字/字母/数字符号的组合、图形、图像、视频、音频等,也是对客观事物的属性、数量、位置及其相互关系的抽象表示。例如,“0、1、2…”“阴、雨、下降、气温”“学生的档案记录、货物的运输情况”等都是数据。数据经过加工后就成为信息。
在计算机科学中,数据是指所有能输入计算机并被计算机程序处理的符号介质的总称,是用于输入计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称。
笔者更愿意使用“数据”这个概念,不太愿意使用“信息”这个概念,特别是在讨论安全的时候,用“数据安全”比用“信息安全”更加明确,原因如下。
●信息这一概念从诞生之日起就没有大家都认可的定义。信息论的鼻祖——香农(Claude Elwood Shannon,1916年4月30日—2001年2月26日,也有一些著作中把他的名字翻译为仙农或者山农)是美国数学家。1948年,香农发表了《通信的数学理论》这篇文章,提出了信息熵的概念,并创建了信息论。这篇文章奠定了香农“信息论之父”的地位。在这篇文章中,香农对信息的定义是:“负熵”就是“不确定性的减少”。“熵”本来是个热力学概念,表明系统中要素的无序程度,要素越杂乱,熵就越大,不确定性也越大。后来,有一些学者认为,香农给出的不是信息的概念,而是“信息量”的概念。再后来,还有一些学者给出过信息的定义,比如控制论的提出者维纳[全名为诺伯特·维纳(Norbert Wiener),1894年11月26日—1964年3月18日,美国应用数学家,在电子工程方面贡献良多,也是随机过程和噪声信号处理的先驱]指出:信息是什么?信息既不是能源,也不是物质。实际上,他提出了信息、物质、能源是自然与人类社会的三大要素。我国信息论专家钟义信也给出过定义。本书不讨论信息论,只是要说明信息还没有一个被普遍接受的定义。
●无论信息的定义有多少种,“减少不确定性”是信息的基本属性,也就是说,对信息的接收者来说,信息一定是他原来未知的,对他来说已知的就不是信息。在计算机和网络中传输、处理与存储的许多数据都是我们已知的,从这个意义来说,它们就不是信息。不过,信息和数据之间是有密切关系的。数据是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。信息是数据的内涵,信息加载于数据之上,对数据做出具有含义的解释。数据和信息是不可分离的,信息依赖数据来表达,数据则生动、具体地表达出信息。数据是符号,是物理性的;信息是对数据进行加工处理之后得到的,并能对决策产生影响,它是逻辑性和观念性的。数据是信息的表现形式,信息是数据有意义的表示。总之,数据是信息的表达载体,信息是数据的内涵,二者之间是形与质的关系。数据本身没有意义,只有对实体操作产生影响时,数据才成为信息。