大数据素质读本
上QQ阅读APP看书,第一时间看更新

第一节 计算机技术的发展概况

正身处信息化社会的你,一定对美国硅谷(Silicon Valley)早有耳闻。它位于美国加利福尼亚州北部、旧金山湾区南部,是高科技产业云集的美国加州圣塔克拉拉谷(Santa Clara Valley)的别称。它最早是研究和生产以硅为基础的半导体芯片的地方,因此而得名。硅谷是当今电子工业和计算机业的王国,尽管美国和世界其他高新技术区都在不断发展壮大,但硅谷仍然是高科技创新和发展的开创者。硅谷以高新技术的中小公司群为基础,同时还汇聚了谷歌、Facebook、惠普、英特尔、苹果、思科、英伟达、甲骨文和特斯拉等大型公司,融科学、技术、生产为一体。类似地,中国的硅谷在深圳,印度的硅谷在班加罗尔。硅谷为什么要以元素周期表中原子序数为14的“硅”元素命名,读完本节的内容,你便可知晓缘由。

一、电子管诞生,第一代通用计算机问世

世界上第一台通用计算机“ENIAC(电子数字积分计算机)”于1946年2月14日在美国宾夕法尼亚大学诞生,美国国防部用它来进行弹道计算,如图1-1(a)所示。它是一个庞然大物,用了约18000个电子管,占地约170平方米,重约30吨,耗电功率约150千瓦,每秒钟可进行5000次加法运算,这种数量级的运算速度在现在看来微不足道,但在当时是破天荒的。ENIAC以电子管作为元器件,所以又被称为电子管计算机,是通用计算机的第一代。

电子数字积分计算机采用的逻辑元件[1]是电子管[见图1-1(b),于1904年问世]。一个电子管的高度约7厘米,寿命一般为1000~3000小时。电子管的总体特点是体积大、耗电量大、易发热,不能长时间工作。它的特性直接导致电子数字积分计算机具有体积大、耗电量大、寿命短、可靠性低和成本高等缺点,因此,人们转而寻找性能更好的逻辑元件进行替换。

015-01

图1-1 电子数字积分计算机(ENIAC)实景图和电子管样例

二、晶体管诞生,第二代电子计算机问世

在电子管问世43年后(1947年),新的逻辑元件—晶体管诞生。晶体管不仅能实现电子管的功能,还具有尺寸小、重量轻、寿命长、效率高、发热少和功耗低等优点。晶体管按使用的半导体材料分为硅材料晶体管和锗材料晶体管。1954年,美国贝尔实验室成功研制第一台使用晶体管作为逻辑元件的计算机,取名“催迪克”(TRADIC,见图1-2),它使用了约800个晶体管。使用晶体管后,电子线路的结构大大改观,计算机体积减小,寿命大大延长,价格降低。晶体管计算机还增加了浮点运算功能,计算机的计算能力实现了一次质的飞跃,为计算机的广泛应用创造了条件,并且制造高速电子计算机更为容易。至此,人类进入第二代电子计算机时代。

015-02

图1-2 晶体管计算机(TRADIC)

三、集成电路高速发展

显然,占用面积大、无法移动是以上电子计算机最直观和突出的问题,如何把这些电子元件和连线集成在一小块载体上是研究者们面临的新问题。在1958年,集成电路技术(Integrated Circuit Technology)出现,利用这种技术可以制作微型化的电子器件或部件(见图1-3)。集成电路是采用一定的工艺,把一个电路中所需的晶体管、电阻、电容、电感等元件及布线互连在一起,集成在一小块或几小块半导体芯片或介质基片上,然后封装在一个管壳内,成为具有所需电路功能的微型结构,所有元器件在结构上已组成一个整体。集成电路技术的出现,使电子元器件向着微小型化、低功耗、智能化和高可靠性方面迈进了一大步。

016-01

图1-3 集成电路发展示意图

目前,集成电路已经在各行各业中发挥着非常重要的作用,是现代信息化社会的基石。集成电路的含义也已经远远超过其刚诞生时的定义范围。硅集成电路是主流,就是把实现某种功能的电路所需的各种元器件都组织在一块硅片上,这也是高科技产业云集的美国加州圣塔克拉拉谷别称“硅谷”的由来。在集成电路技术发展历程中,英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出了经典的摩尔定律。定律内容为:当价格不变时,集成电路上可容纳的元器件数目,每隔18~24个月就会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的计算机性能,将每隔18~24个月翻一倍以上。这一定律揭示了信息技术进步的速度。

四、计算机硬件飞速发展

随着技术的发展,计算机硬件每时每刻都在发生着变革,每年硬件行业都会有一些新的产品出现或一些无用的产品被淘汰,而计算性能和存储性能都在不断增强。

1. 个人计算机硬件

个人计算机(Personal Computer,PC)由硬件系统和软件系统组成,是一种能独立运行,完成特定功能的设备。这里只阐述硬件的变革,如图1-4所示。

017-01

图1-4 个人计算机整机的变迁

1971年,美国计算机终端公司(Computer Terminal Corporation,CTC)推出的Datapoint 2200个人计算机,将庞大体积的计算机变成了桌上计算机,是最早期的个人计算机之一,它的所有组件(如键盘、显示器和主机[2])都集成在一个硬壳里。1981年,IBM推出IBM 150个人计算机,配备英特尔8088微处理器,装载微软MS-DOS操作系统,已将显示器和键盘从整机中独立出来,形成独立的配件,便于装卸和维护。1983年,第一款具有图形用户界面的个人计算机苹果Lisa诞生。1989年,第一台笔记本电脑康柏LTE上市。后来,个人计算机的输入/输出设备更加多样化,并且不断地推陈出新。常见的输入/输出设备有显示器、打印机、音箱、键盘、鼠标和扫描仪等。其中,显示器从阴极射线管显示器(CRT)发展到液晶显示器(LCD),变革最为深刻,它使个人计算机朝着一体机和触摸一体机迅速发展。一体机整合度高,它把主机、音箱、摄像头、麦克风等整合到显示器后,只需外接键盘、鼠标、电源和网络线,具有空间小和接线较少等优点。触摸一体机是将触摸屏、液晶显示器、主机及一体机外壳进行完美的组合,最终通过一根电源线就可以实现触控操作的机器。如今,在机场、高铁站、酒店、银行、学校等一些人群密集的地方,我们都不难看到触摸一体机,它不但能帮助企业提升企业形象和弘扬企业文化,更能给人们带来便利,满足公众需求。

2. 服务器硬件

当人们使用微信聊天时,远方的微信平台需要提供计算服务,提供这样的计算服务或者存储服务的设备就是服务器(Server)。服务器需要响应服务请求,并进行处理。因此,一般来说,服务器应具备承担服务和保障服务的能力。服务器的构成和个人计算机架构类似,但是由于需要提供高可靠的服务,在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高,制作工艺的要求也较高,如图1-5所示。在网络环境下,按照提供的服务类型不同,服务器分为文件服务器、数据库服务器、应用程序服务器和Web服务器等。

018-01

图1-5 服务器

按照外观和安装方式的不同,服务器分为机架式、塔式、刀片式等。机架式服务器可以安装在19英寸宽的工业标准机柜上,将其设计为机架式的目的是在有限的空间内可以安装更多的服务器。机架式服务器有1U、2U、4U、6U、8U等多种规格,其机箱宽度都是相同的,U代表机架式服务器的机箱高度(1U=1.75英寸)。

3. 中央处理器

中央处理器(Central Processing Unit,CPU)是个人计算机或者服务器的核心部件,被人们称为计算机的心脏,是一块超大规模的集成电路,位于主机内。它的功能主要是解释计算机指令及处理计算机软件中的数据。世界顶级的中央处理器生产公司有美国的英特尔(Intel)、AMD,以及中国台湾的威盛(VIA),它们的代表性芯片样例如图1-6(a)所示。英特尔公司是世界上最大的CPU及相关芯片制造商,80%左右的计算机都使用了英特尔公司生产的CPU。除了英特尔公司外,最有挑战性的就是AMD公司,它打破了英特尔公司一支独秀的局面。现阶段,英特尔公司具有代表性的一款处理器是Intel酷睿i9 7980XE,拥有18个核心,主频为2.6GHz。处理器主频的提升,意味着单位时间内处理数据能力的增强,核心数量越多,单位时间内处理器所能处理的数据和任务数就越多。

自2006年国务院实施“核高基”[3]规划以来,我国相继诞生一系列具有代表性的处理器芯片,它们分别是中国科学院计算所自主研发的龙芯系列、江南计算机研究所自主研发的申威系列和中国国防科技大学自主研制的飞腾系列,如图1-6(b)所示。2016年6月20日,在法兰克福世界超算大会上,国际TOP 500组织发布的榜单显示,我国“神威·太湖之光”超级计算机系统安装有40960个中国自主研发的“申威26010”众核处理器,该众核处理器采用64位自主申威指令系统,峰值性能为12.5亿亿次/秒,持续性能为9.3亿亿次/秒,荣登榜单之首,不仅速度比第二名“天河二号”快出近两倍,其效率也提高了3倍。

019-01

图1-6 中央处理器实体样例

处理器是信息化社会最为核心的组件,是计算机的心脏,是各强国必争的战略高地之一(之二便是后续阐述的操作系统,没有之三)。从总体上来看,我国的处理器技术取得了一定的成就,但是要研发出世界级的处理器,还有很长的路要走。

4. 内存储器

内存储器也被称为内存,是计算机中重要的部件之一,它是CPU与外部设备进行沟通的桥梁(见图1-7),用于暂时存放CPU需要的运算数据,以及与硬盘等外部存储器交换数据。计算机在运行过程中,CPU会把需要运算的数据调到内存中进行运算,当运算完成后,CPU再将结果传送到内存。

020-01

图1-7 个人计算机/笔记本电脑/服务器内存实体样例及发展历程

图1-7展示了内存的发展历程。最早的内存被集成在主机内的主板[4]之上,内存容量大小为256KB。为了提升内存的性能,后来将内存从主板上独立出来,形成独立的实体,俗称内存条,容量大小为512KB。现阶段主流的单条内存容量大小为4GB/8GB/16GB,服务器版的单条内存容量高达32GB/64GB/128GB,但是价格较为昂贵。

计算机中所有正在运行的程序和数据都从外存调入内存,因此内存的性能对计算机的影响非常大,一个重要的性能参数就是容量大小。内存容量越大,存储程序或数据的空间就越大,便于大文件或者大批量数据的处理,减少了内存和外存的交换次数,提高了计算效率。

5. 外存储器

外存储器是除计算机内存及CPU缓存以外的存储器,此类存储器一般在断电后仍然能保存数据。外存储器有磁带、软盘、硬盘、光盘和U盘(USB闪存盘)等,它们的实体样例如图1-8所示。

021-01

图1-8 个人计算机/笔记本电脑/服务器外存储器实体样例

早期的外存储器是磁带和软盘。磁带通常是在塑料薄膜带基上涂覆一层颗粒状磁性材料,或蒸发沉积一层磁性氧化物或合金薄膜制作而成。软盘也采用了类似磁带的装置,将圆形的磁性盘片装在一个方形的密封盒子里,这样做的目的是防止磁盘表面划伤,导致数据丢失。软盘大小为3.5英寸,存储容量仅为1.44MB。有了软盘之后,人们使用计算机就方便多了,不但可以把数据处理结果存放在软盘中,还可以把很多输入到计算机中的数据存储到软盘中,这样数据就可以反复使用,避免了重复劳动。但是人们慢慢发现,要存储到软盘上的数据内容越来越多时,众多的数据内容存储在一起,很不方便。直到2000年左右,中国朗科公司发明了第一个U盘,软盘才渐渐地淡出了人们的视线。早期PC为软盘装配的两个软盘驱动器(盘符分别是“A:”和“B:”)也随之消失,为了保留历史痕迹,DOS、Windows等操作系统为硬盘分配的盘符始终从“C:”开始。U盘是一种使用USB接口,无须物理驱动器的微型高容量移动存储产品,通过USB接口与计算机连接,实现即插即用。它小巧便于携带、存储容量大、价格便宜、性能可靠,已成为可移动外存储器的主流设备。

现阶段主流的外存储器容量已相当庞大,单块硬盘已做到12TB,单块移动硬盘已做到5TB,大拇指大小的一个U盘已做到2TB,单块固态硬盘已做到4TB,一张光盘已做到100GB,一款硬盘存储服务器可以扩展容量至600TB。固态硬盘用固态电子存储芯片阵列制作而成,启动快,没有电机加速旋转过程,不用磁头,快速随机读取,读延迟极小。但是固态硬盘价格昂贵,因此计算机主机中的外存常将硬盘和固态硬盘组合起来使用。存储数据用得最多的还是机械硬盘,机械硬盘的两个重要参数是容量和转速。

6. 计算机其他硬件设备

就单台计算机而言,计算机主机中的核心组件就是上面阐述的CPU、内存和外存。除此之外,计算机还有显卡、声卡、网卡及输入/输出设备(I/O设备),它们也会直接影响计算机的整体性能。

说到显卡,就不得不提及装载在显卡上的图形处理器GPU,它是显卡的“心脏”(与CPU类似),是专门为执行复杂的数学和几何计算而设计、做图形图像运算工作的微处理器,最快速GPU集成的晶体管数甚至超过普通CPU。现在,英伟达(NVIDIA)是世界上最大的独立显卡芯片生产销售商。针对网卡,以太网可选择的速率已有10Mbit/s、100Mbit/s和1000Mbit/s,甚至10Gbit/s等多种传输速率。

在输入/输出设备(如键盘、鼠标、打印机、扫描仪、音箱、摄像头等)中,除了显示器数据接口以外,大部分输入/输出设备的数据接口采用USB接口,即插即用,方便用户的连接使用。

7. 计算机硬件朝巨型化和微型化方向发展

巨型化的代表是超级计算机,能够执行一般个人计算机无法处理的大批量资料与高速计算。其基本组成组件与个人计算机无太大差异,但规格与性能则强大许多,是一种超大型电子计算机。它具有很强的计算和数据处理能力,主要特点表现为计算速度快和存储容量大,配有多种外部和外围设备,以及丰富的、高性能的软件系统,多用于国家高科技领域和尖端技术研究,如天气预报、演算核弹爆炸过程等,是一个国家科研实力的体现,对国家安全、经济和社会发展具有举足轻重的意义。中国“天河二号”超级计算机在全球超级计算机500强榜单上实现“五连冠”,2016年、2017年被中国的“神威·太湖之光”超级计算机所取代。“神威·太湖之光”超级计算机的速度比第二名“天河二号”快出近两倍。神威·太湖之光超级计算机安装了40960块中国自主研发的“申威26010”众核处理器,该众核处理器采用64位自主申威指令系统,峰值性能为12.5亿亿次/秒,持续性能为9.3亿亿次/秒,其外观如图1-9所示。2018年,英伟达和IBM公司共同设计的超级计算机Summit的运算速度是我国“神威·太湖之光”的近2倍,并且还加入了人工智能技术,让美国重新夺回了“世界最强大超算”的桂冠。

022-01

图1-9 神威·太湖之光超级计算机

在微型化方面,代表设备有树莓派—只有信用卡大小的微型计算机,其系统基于Linux,如图1-10所示。随着Windows 10 IoT的发布,树莓派也可以安装Windows操作系统。其外表“娇小”,内“芯”却很强大,视频、音频等功能通通皆有,可谓是“麻雀虽小,五脏俱全”。若将微型计算机装载在汽车上,它不但可以控制汽车内的各种设备(如音箱等),还可以与GPS连接,使汽车越来越智能。

023-01

图1-10 微型计算机

五、计算机软件层出不穷

计算机软件是计算机系统中的程序及其文档。程序是计算任务的处理对象和处理规则的描述,文档是为了便于人们了解程序所需的阐明性资料。程序必须装入计算机内部才能工作,文档一般是给人看的,不一定装入计算机。计算机软件总体分为系统软件和应用软件两大类:系统软件是各类操作系统,如Windows、Linux和UNIX等,还包括操作系统的补丁程序及硬件驱动程序;应用软件种类较多,如工具软件、游戏软件和管理软件等。

1. 系统软件

操作系统(Operating System,OS)是管理、控制计算机硬件与软件资源的计算机程序,是直接运行在“裸机”[5]上的最基本的系统软件,任何其他软件都必须在操作系统的支持下才能运行。按照应用领域的不同,操作系统分为桌面操作系统、服务器操作系统、嵌入式操作系统。嵌入式操作系统(Embedded Operating System)是用在嵌入式系统的操作系统。这里重点介绍桌面操作系统、服务器操作系统。

(1)桌面操作系统

桌面操作系统主要用于个人计算机,主要分为三大阵营—Windows、Mac OS与Linux。其中,Windows和Mac OS分别为微软公司和苹果公司开发的操作系统。而Linux为类UNIX操作系统,其发行版有Ubuntu、Fedora、Red Hat和CentOS等。

美国微软公司的视窗(Windows)操作系统发展历程如图1-11所示,Windows操作系统在亚洲是最为流行的系列操作系统。微软公司最早期的操作系统是MS-DOS(磁盘操作系统),是个人计算机上的一类操作系统。从1981年到1995年的15年间,MS-DOS系统在IBM PC兼容机市场中都占有举足轻重的地位。微软公司从1983年宣布开始研制Windows,1985年和1987年分别推出Windows 1.03版和Windows 2.0版,直到1995年推出轰动业界的Windows 95,其各个版本的发展历程如图1-11所示。纵观Windows操作系统的发展史,Windows XP是最为经典的一套操作系统,从2001年10月25日推出,到2014年4月8日正式宣布“退休”,整整服役13年,这在IT行业极为少见。现阶段,微软公司的主打产品是Windows 10(于2015年7月29日正式发布,共7个版本)。它有两个显著的特点:一是用户使用免费;二是能兼容世界上所有的智能设备。

024-01

图1-11 微软公司操作系统发展历程

(2)服务器操作系统

服务器操作系统一般指安装在大型计算机上的操作系统,如Web服务器、应用服务器和数据库服务器等,但也可以安装在个人计算机中。相比桌面操作系统,服务器操作系统具有性能稳定、文件和网络管理效率高、安全性及可协调性高等优点。服务器操作系统主要分为四大流派—Windows Server、Netware、UNIX、Linux,常见的版本如图1-12所示。

025-01

图1-12 常见服务器操作系统产品

在服务器操作系统的四大系列中,由于UNIX系统结构不合理、NetWare系统不够人性化,大部分企业往往在Windows Server系统、Linux系统两种服务器系统中做取舍。通常建议中小型企业使用Windows Server系统,其简单易用,对操作和维护人员要求门槛很低,市面上有很多很好的教材;建议专业人士或是大型企业、对服务器有特殊要求的使用者使用Linux系统,其系统内核稳定,不过对操作和维护人员的要求高。

国产操作系统多为以Linux 为基础二次开发的操作系统,代表有红旗Linux、深度Linux和中标麒麟等。从2014年4月8日起,美国微软公司停止对Windows XP SP3操作系统提供服务支持,这引起了社会、广大用户的广泛关注和对信息安全的担忧。我国工业和信息化部(以下简称工信部)对此表示,将继续加大力度,支持国产操作系统的研发和应用,并希望用户使用国产操作系统。但是,和国产处理器一样,国产操作系统也有很长的路要走。

2. 应用软件

应用软件(Application Software)是专门为实现某一应用目的而编制的软件系统,常用的应用软件有字处理软件、表处理软件、统计分析软件、数据库管理系统、计算机辅助软件、实时控制与处理软件,以及其他应用于国民经济各行业的应用程序。应用软件又可分为专用软件与通用软件。

(1)专用软件指专为某些单位和行业开发的软件,是用户为解决特定的具体问题而开发的,其使用范围限定在某些特定的单位和行业。例如,火车站或汽车站的票务管理系统、人事管理部门的人力资源管理系统、财务部门的财务管理系统和高校的教务管理系统等。图1-13所示为专用软件示例。

026-01

图1-13 专用软件示例

票务管理系统“铁路12306”是中国铁路客户服务中心的重要窗口,集成全路客货运输信息,为社会和铁路客户提供客货运输业务和公共信息查询服务,可供用户查询列车时刻表、票价、列车正晚点、车票余票、售票代售点、货物运价、车辆技术参数及有关客货运规章。用友人力资源管理系统致力于为企业提供优秀和最适用的战略人力资本管理解决方案,覆盖信息化服务、咨询、人力资本云服务等业务功能。金蝶财务管理系统集供应链管理、财务管理、人力资源管理、客户关系管理、办公自动化、商业分析、移动商务、集成接口及行业插件等业务管理组件为一体,建立企业人、财、物、产、供、销等科学完整的管理体系。青果高校教务管理系统是集师资管理、学籍管理、教学计划管理、排课管理、选课管理、考试管理、成绩管理和评教管理等为一体的教务管理平台。

(2)通用软件是为实现某种特殊功能而经过精心设计的、结构严密的独立系统,是一套满足同类通用的许多用户需要的软件。通用软件适应信息社会各个领域的应用需求,每一领域的应用具有许多共同的属性和要求,具有普遍性。例如,办公软件、社交软件、电商软件和支付软件等,如图1-14所示。图中所列举的每类软件已经成为人们工作和生活的一个部分,并且悄然地改变着人们的工作、学习和生活方式。当然,应用软件还有很多,这里不再一一列举。

027-01

图1-14 通用软件示例

综上所述,第一代电子计算机的逻辑元件—电子管被晶体管替代后,集成电路得到迅猛发展,计算机的硬件性能以每隔18~24个月就提升一倍的速度增长。计算机的软件性能也日新月异,频繁更新换代。计算机软硬件性能的迅速提高,为人们迫切需要的高性能并发计算和海量数据的存储打下了坚实的基础。应用软件的出色表现,从本质上改变了我们的工作、学习和生活方式,让社会变得更为高效。