奇点临近
上QQ阅读APP看书,第一时间看更新

第2章 技术进化理论:加速回归定律

你能向后看得越久,就能向前看得越远。

——温斯顿·丘吉尔

20亿年前,我们的祖先是微生物;5亿年前,是鱼类;一亿年前,是类似于哺乳动物的生物;1000万年前,是类人猿;100万年前,原始人类经过苦苦探索后驯服了火。我们演化进程的典型特征是把握变化,如今变化的节奏正在加快。

——卡尔·萨根

我们唯一的任务是制造出比我们更聪明的东西,除此之外都不是由我们考虑的问题……世界上本没有绝对的难题,只有相对于一定智力水平的难题。若智力水平向上提升了一点,一些原来不能解决的难题就变得容易了;如果智力水平提升了一大步,所有的问题就都能被解决。

——埃里泽·余德努维奇,凝视奇点,1996

“未来不可预测”是一种常见的经常重复的论调……但是……这个观点是错误的,而且是严重的错误。

——约翰·斯玛特1.John Smart对于'Understanding Evolutionary Development:A Challenge for Futurists'一文的总结发表于World Futurist Society年会上。华盛顿,2004年8月3日。

技术的不断加速是加速回归定律的内涵和必然结果,这个定律描述了进化节奏的加快,以及进化过程中产物的指数增长。这些产物包括计算的信息承载技术,其加速度实质上已经超过了摩尔定律做出的预测。奇点是加速回归定律的必然结果,所以我们研究这一进化过程的本质属性非常重要。

秩序的本质。第1章描绘的几张图证明了范式迁移的加速度(范式迁移是指完成任务的方法和智能处理的过程发生了重要改变,例如书写语言和计算机。)这些图表描绘了从宇宙大爆炸到互联网发明时期,生物和技术进化两方面的过程,它们已经被15个思想家和相关的著作视为关键的事件。我们可以看到这些事件呈现出一种明显的指数增长趋势:关键事件正以日益加快的节奏发生着。

思想家们关于构成“关键事件”的标准不尽相同,但是他们做出选择所依据的原则值得深思。一些评论员认为,在生物和技术的历史中,真正跨时代的进步涉及复杂度的增加2.在Theodore Modis看来,进化中新纪元的标志性事件代表着复杂度的增加,详见Theodore Modis的'Forecasting the Growth of Complexity and Change',《Technological Forecasting and Social Change》69.4(2002),网址为http://ourworld.compuserve.com/homepages/tmodis/Ted-WEB.htm。。尽管复杂度确实随着生物和技术进化不断增加,但我并不认为这个观点是完全正确的。首先我们要重新审视复杂度的定义。

毫不奇怪,复杂度的概念是复杂的。复杂度的其中一个定义如下:表达一个过程所需要的最少信息量。比如设计一个系统(例如,一个计算机程序或者一个计算机辅助设计文件),这个系统可以由一个100万比特大小的数据文件来描述,我们就可以说这个设计的复杂度为100万比特。但是如果这100万比特的信息本质上是由某种形式的1000比特重复了1000次构成的,我们就能够通过这100个比特来表达整个设计,从而将文件的大小减少大约1000倍。

最流行的数据压缩技术使用了类似的剔除冗余信息的方法3.压缩文件涉及数据传输(如互联网上传播的音乐和文本)和数据存储两方面内容。文件越小,其传输时间越短,存储空间越小。信息论之父、数学家Claude Shannon在他的论文'A Mathematical Theory of Communication',《The Bell System Technical Journal》27(1948年7月~10月)中对数据压缩进行了如下定义:数据压缩是有可能的,因为数据中存在冗余,并且数据中的关键特征有融合在一起的可能性,例如音频文件中的无声状态可以由一个表示无声持续时间的值所代替,文本文件中的字母组合在压缩文件中可以被编码识别符所代替。如Shannon所解释的,冗余可以通过无损压缩的方式去除,这意味着压缩不会使信息丢失。无损压缩有一个限制,Shannon称为熵速率(压缩会增加数据的“熵”,其中实际的信息量反比于预先定义的数据结构)。数据压缩将消除数据冗余,而无损压缩在消除数据冗余的同时不会损失任何数据(这意味着原来精确的数据将被保留)。而有损压缩可以用于图形文件或流媒体的音频、视频文件,虽然它会导致信息的丢失,但通常情况下用户是不会觉察到的。大多数的数据压缩技术都会使用一种编码,可将源文件中的基本单元(或符号)与编码表映射。例如,文本文件中的所有空格都可以被一个单独代码和空格的数目所代替。压缩算法通过建立这种映射关系,并使用编码表建立一个新的文件。经过压缩的文件将小于原始文件,并且易于传输和存储。以下是关于无损压缩的技术类别:●游程压缩,该算法使用一个代码表示重复的符号,并用一个数值表示符号重复的次数(例如:Pack-Bits和PCX)。●最小冗余编码或简单熵编码,该编码方式以概率为基础,使用频繁的符号的编码长度最短(例如:霍夫曼编码和算术编码)。●字典编码器,该编码器使用动态更新的符号字典来表示模式(例如:Lempel-Ziv、Lempel-Ziv-Welch和DEFLATE)。●块排序压缩,该算法用重新组织字符的方法代替编码表,而游程压缩通常用于严重重复的字符串(例如:Burrows-Wheeler变换)。●局部映射预测,该算法通过使用原文件中的字符集来预测文件中将会出现的下一个字符。,但用这种方式压缩数据文件,无法知道是否还有更好的压缩方法。例如,假设需要压缩的文件是π(3.141592……),其精确度达到100万位。大部分数据压缩程序无法识别这个序列,完全不能进行压缩,因为π的二进制表达序列随机性很强,难以测试出重复的序列。

但是,如果我们能够确定该文件(或文件的一部分)实质上代表π,我们就可以很容易地将它(或它的一部分)表达得非常简洁,即“π,精度为100万比特”。由于我们不能确定信息序列是否有更加紧凑的表达方式,故任何压缩形式都只能作为信息复杂度的上界,摩尔德·盖尔曼沿着这个思路来定义复杂度。他的定义是:一组信息的“算法信息量”为“能使普通计算机输出位串并可以停止的最短的程序长度”4.Murray Gell-Mann,'What Is Complexity?',发表于《Complexity》,(New York:John Wiley and Sons,1995)。

但是摩尔德·盖尔曼的定义并不完整。如果一个文件包含随机信息,它就不能被压缩。实质上,观察是确定一个数列是否真正随机的重要标准。但是,如果将任何随机序列设定为特殊的符号,那么这个信息就可以用简单的指令来表示,比如该指令为“该位置存放了随机的数字序列”。随机序列(无论是10比特或10亿比特)不能代表复杂度,因为它们都可以用一个简单的指令来表示。这也是随机序列和不可预知序列的区别。

为了进一步了解复杂度的性质,我们来看岩石复杂度的例子。我们需要用大量的信息描绘岩石中每个原子的属性(确切位置、角动量、旋转、速度等)。1公斤(2.2磅)岩石有1025个原子(关于原子,我们将在第3章详细论述),可容纳1027次方比特的信息。这个数量是一个人的遗传信息(没有经过压缩)的1016[1]。在大部分情况下,这些信息是随机的,并没有因果关系,故只须通过形状和质地来描述岩石,如此信息就会少很多。因此,认为普通岩石的复杂度远远低于人的复杂度是合理的——尽管在理论上岩石包含着巨大的信息量6.当然,人由数量巨大的粒子构成,如果考虑到所有粒子的属性,其所包含的信息量与等重量的石头差不多。就石头而言,其信息量并不需要像人类那样描述其状态。另外人类与石头相比需要更多的信息以描述其特征。

复杂度的另一个定义是描述一个系统或进程的信息量的最小值,其中这个信息量得是有意义的、非随机的、不可预测的。

在盖尔曼的概念中,一个100万位的随机字符串的算法信息量(AIC)大约为100万位。我在这个概念的基础上进行修改,就是用一个简单指令“放置随机位”来代替每一个随机串。

然而,这还不充分。另一个问题是“任意数据”是字符串(比如电话本里的姓名和电话号码,辐射水平或温度的定期检测结果)。这些数据并不是随机的,数据压缩只能在很小的程度上压缩它们。而且它们并不代表我们通常理解的复杂度,而仅仅是数据。所以我们需要用另一个简单指令表示“放置任意数据序列”。

总结一下我提出的测量信息复杂度的方法,首先是信息的算法信息量(AIC)(盖尔曼的定义)。在一组随机串中用一个简单指令来代替每个随机串,同样用一个简单指令来替代每一段任意数据串。这样的复杂度测量方法与我们的直觉相符。

公正地说,进化过程中的每一次转化(例如生物和技术对它的改进)、每一次进步,都会使上文定义的复杂度增加。例如,DNA的进化能造就更复杂的生物体,这种生物体的生物进程信息可以被DNA分子灵活地存储、控制。寒武纪生命大爆炸形成了稳定的动物形态,进而进化过程便集中在更复杂的大脑发育上。在科技方面,计算机的发明提供了一个存储人类文明,并处理越来越复杂的信息的手段。互联网的广泛连接带来了更大的复杂度。

但是,“增加复杂度”并不是进化过程的最终目的或终极产物。进化带来了更好的结果,而更高的复杂度并不是必要的。有时候,简单的反而更好。所以,我们要考虑另一个概念:秩序。秩序并不是无序的反义词。如果无序代表事件的任意序列,无序的反义词应该是“非任意序列”。信息是进程中一组有意义的数据序列,例如生物体的DNA代码和电脑程序的比特信息。另一方面,“噪音”是一个随机序列,它既不可预测,也不携带信息。但信息也是不可预测的。如果我们能够根据过去的数据来预测未来的数据,那么未来的数据就不是信息了。因此,信息和噪音都可以压缩(以几乎一样的序列存储)。我们来看一种可预测的交替模式(如0101010……),它是有序的,但除了前两位数以外,剩下的都不是信息。

因此,仅仅有序并不能构成秩序,秩序还要求蕴含信息。秩序是具有某种目的的信息。测量秩序,也就是测量信息与特定目的的适应度。生命的进化过程的目的就是活下来。算法(解决难题的电脑程序)的演化(比如飞机引擎的设计)的目的就是最优化引擎性能、效率或其他标准7.请见第5章的注释175关于基因算法的描述。。测量秩序比测量复杂度更难。文中已经给出了复杂度的测量方法。对于秩序,我们需要根据具体情形调整测量标准:在设计进化算法时,程序员要提供一种测量标准(称为效用函数);在技术发展的过程中,我们可以将经济价值作为测量标准。

仅仅拥有更多的信息并不能带来更好的适应度。有时,深层的秩序(更贴近目的)在复杂度上会有所精简而不是增加。例如,将明显不同的想法综合阐述成一个更广泛、更连贯的新理论,这个新理论不复杂,但是更贴近目的。事实上,“寻求更简单的理论”是科学的驱动力(诚如爱因斯坦所说:“使每件事尽可能简单,而不是简单一点”)。

原始人类大拇指轴点的改变便是诠释这个概念的一个重要实例,这是人类进化中的关键一步,它使得人类对周围物体能做出更精确的操作8.人类、黑猩猩、大猩猩、红毛猩猩是人科动物的科学分类(人总科)。在500万~700万年前,人类由巨猿演化而来。人科中的人类还包含已经灭绝的物种(如H.erectus)以及现代人(H.sapiens)。黑猩猩的手指比人类手指长,但没有人类手指那么直,其大拇指较短,缺乏力量而且不便于移动。黑猩猩可以使用棍子抽打,但无法紧握棍子。它们无法用力捏住物体,因为它们的大拇指无法与其他手指重叠以达到紧握物体的目的。现代人类的拇指较长,其他手指能够沿着中心轴旋转,所以人的拇指尖端可以接触到其他手指的尖端,该特性称为完全相对性。人类特有的这些属性使其能够准确并且有力地握住物体。甚至人类的祖先(例如,科学家在埃塞俄比亚发现距今300万年前的更新纪灵长动物,称为露西)能够以更快的速度和更好的准确性投掷石块。从那以后,科学家们断定人类的手在投掷和摔打等方面持续改进(同时还伴随着人类其他器官的改进),这使得人类明显优于其他相似大小和重量的动物。详情请见:Richard Young的'Evolution of the Human Hand:The Role of Throwing and Clubbing',《Journal of Anatomy》202(2003):165-74和Frank Wilson,《The Hand:How Its Use Shapes the Brain,Language,and Human Culture》(New York:Pantheon,1998)。。像黑猩猩这样的灵长目动物也能够抓住物体,但不能有力地紧握物体,也不能很好地写或者操控工具。大拇指轴点的改变并没有增加动物的复杂度,却增加了秩序。进化表明,一般情况下秩序程度越高,相应的复杂度也越高9.圣菲研究所是研究复杂性和紧急系统相关技术和概念的先驱。Stuart Kauffman是其中研究范式混沌和复杂性的一位主要研发人员。Kauffman在《At Home in the Universe:The Search for the Laws of Self-Organization and Complexity》(Oxford:Oxford University Press,1995)一文中阐述道:“秩序的力量在于混沌的边缘。”在《Evolution of Complexity by Means of Natural Selection》(Princeton:Princeton University Press,1988)一书中,John Tyler Bonner提出了以下几个问题:“受精卵是如何变为一个完美的成人?”“一个细菌如何经历了数百万年的时间进化为一只大象?”John Holland是圣菲研究所另一位主要的思想家,主要研究方向为复杂性的新兴领域。他的《Hidden Order:How Adaptation Builds Complexity》(Reading,Mass.:Addison-Wesley,1996)一书收录了1994年他在圣菲研究所发表的一系列研究报告。另见John H.Holland的《Emergence:From Chaos to Order》(Reading,Mass.:Addison-Wesley,1998)和Mitchell Waldrop的《Complexity:The Emerging Science at the Edge of Order and Chaos》(New York:Simon&Schuster,1992)。

因此,改进解决问题的方法,就要增强秩序性。复杂度通常会增加,但有时也会减少。现在我们把目光投向如何定义问题。事实上,进化算法(通常说的生物进化和技术进化)的关键是定义问题(包括效用函数)。在生物进化过程中,生存始终是全局性问题。在特殊的生态环境中,最重要的进化转向一些具体的能力,比如说某些物种在极端环境下的生存能力和伪装自己迷惑天敌的能力。生物进化正走向类人型机器人,其进化目标为提升在思维上超越对手的能力,以及提升相应的操纵环境的能力。

从表面上看,加速回归定律,这方面似乎违背了热力学第二定律,即在一个熵(封闭系统中的随机性)不是减少而是增加10.热力学第二定律解释了为什么不存在一个完美的动力机,它可以利用燃料燃烧产生的全部能量来工作:一些热量不可避免地散发到环境中。自然中相同的原理认为热量可以从热的平底锅向冷空气中传递,而其逆过程无效。该定律还假定封闭(孤立)系统随着时间的迁移将变得越来越无序,也就是说将从有序变为无序。例如,冰片中的分子只有有限的几种排布方式。所以一杯冰片的熵值要小于一杯水的熵值。水与冰相比拥有更多的分子排布方式,更大的自由度带来了更高的熵。多样性是另外一种思考熵的方法。一种状态所能实现的方法越多,其多样性就越高。因此,一堆混乱的砖头与整齐堆砌的砖头相比,前者拥有更高的多样性(和更高的熵值)。,这个方面违背了热力学第二定律。但加速回报定律涉及的进化,并不是在一个封闭的系统中。它发生在一个混沌的环境中,并依赖其中的无序产生了多样性的选择。从这些选择开始,进化过程不断否定自己的选择,创造出更合适的秩序。即使是一场危机,如周期性的大型小行星撞地球,尽管暂时增加了混乱,但最终还是很大程度上增加了生物进化的秩序。

总的来说,进化增加秩序,但可能不增加复杂性(通常情况是增加的)。其主要原因是生命形式的进化和科技的加速是建立在增加其秩序、用更加复杂的方式来记录和操作信息的基础上。进化的革新将促进更快的进化。以生命形式进化为例,最明显的例子就是脱氧核糖核酸(DNA),它为生命的设计提供了一个记录的和受保护的转录,为进化提供了基础。以技术进化为例,人类不断改进的记录信息的方法,促进了科技的发展。第一台计算机是在纸上设计并由手工组装而成的。现在是用电脑来设计的,而下一代电脑的设计细节也由电脑来完成,然后由完全自动化的工厂来生产,人为干预很少。

技术以指数级的速度扩充其能力,创新者也寻求成倍改进的能力。创新是乘法而不是加法。技术进步与进化过程一致,建立在其自身的基础上。技术将继续加速发展,并将在第五纪元11.Max More明确地表达了如下观点:先进的技术通过融合和杂交的方式使得加速进程变得更快。参见Max More的'Track 7 Tech Vectors to Take Advantage of Technological Acceleration',《ManyWorlds》,2003年8月1日。完全控制自己的前进步伐。

总结加速回报定律的原则,主要有以下几点:

●进化运用了正反馈:由进化过程的某个阶段所产生的更好方法来创造下一个阶段。如第1章所描述的,每个阶段的进化都建立在上一个阶段产物的基础上,因而发展得更快。进化间接地起作用:进化产生人类,人类发明技术,技术再利用不断发展的技术来创造下一代技术。在奇点时代,人和技术将没有区别。这并不是像我们现在想的那样,人变成了机器,而是因为机器的能力可以媲美甚至超过人类。技术就像进化了的人类拇指。进化(秩序的增加)基于这样一种思维过程,该过程的速度是光速,而不是缓慢的电化学反应速度。每一阶段的进化都吸收了上一阶段的成果,所以一个进化的速度至少在一段时间内呈指数增长。随着时间流逝,嵌入到进化过程中的信息的秩序性(对信息与目的的适应度的测量)随之增加。

●进化过程不是一个封闭的系统;它在一个更大的系统内引起混乱,从而增加选择的多样性。因为进化以其本身持续增长的秩序为基础,所以进化过程中的秩序也呈指数增长。

●上述观察的关联性源于进化过程的“回报”(比如速度、效率、功耗和进程的综合力量)总是呈指数增长。正如摩尔定律:新一代的电脑芯片与前一代相比(现在大约每两年就要出一代),原来的单位成本可以用来生产现在两倍的组件,处理速度也大大提升(因为每个电子元件内部通信以及和其他元件通信的距离变短了)了。正如下文所述,在性能和性价比等方面,除了计算机产业,其他信息技术领域(包括人类知识)同样以指数速度发展。另外需要指出的是,信息技术有巨大的包容性,随着时代的发展,它最终将包括经济活动和文化事业的方方面面。

●在另一个正反馈循环中,一个进化的效果越好,(例如,计算的容量和功耗越大)就会为进程的进一步发展配置越多的资源。这将导致第二个层次的指数增长,即指数增长率本身也呈指数级增长。如《摩尔定律:第五范式》第67页所示,20世纪初,人们用了3年来使计算性能翻倍,在20世纪中叶只用了两年,现在只需要一年。不仅每一个芯片在相同单位成本下,其能力逐年翻倍,芯片产量也呈指数增长。于是几十年来,计算机研发预算也在显著增长。

●生物进化就是这样一个演变过程。事实上,这是典型的进化过程。因为它发生在一个完全开放的系统中(不是人为的限制于某个进化算法),多个层次的系统演变在同一个时间进行。不仅物种基因的信息越来越有秩序,整体系统的进化过程也是如此。例如,染色体的数目和染色体上的基因序列,随着时间更替而演变。再比如,演变过程会产生一些方法来防止遗传信息存在过大的缺陷(不过少量突变是允许的,因为它为进化的不断改进提供了有益的机制)。达到这个目标的主要手段是重复配对染色体上的基因信息,这样可以保证,即使一个染色体的基因被损坏,其相对应的染色体上的基因还是正确和有效的。即使是没有配对的男性Y染色体也通过重复自己来备份12.更多信息请另见如下参考资料:J.J.Emerson等的,'Extensive Gene Traffic on the Mammalian X Chromosome',《Science》303.5657(2004年1月23日):537-40,http://www3.uta.edu/faculty/betran/science2004.pdf,Nicholas Wade的'Y Chromosome Depends on Itself to Survive',《New York Times》,2003年6月19日,以及Bruce T.Lahn和David C.Page的'Four Evolutionary Strata on the Human X Chromosome',《Science》286.5441(1999年10月29日):964-67,网址为http://inside.wi.mit.edu/page/Site/Page%20PDFs/Lahn_and_Page_strata_1999.pdf。人们将女性的第二个X染色体关闭称为X失活,而基因只能通过一个X染色体来表达。研究表明来自父亲的X染色体会在一些细胞中关闭,而来自母亲的染色体会在另外一些细胞中关闭。。大约只有2%的基因信息是蛋白质13.关于人类基因工程请见'Insights Learned from the Sequence',网址为http://www.ornl.gov/sci/techresources/Human_Genome/project/journals/insights.html。尽管人类基因组已经被测序,但大多数基因代码不能为(蛋白质合成)指定遗传密码(成为垃圾DNA),所以研究者仍然在争论人类DNA中的30亿个碱基对包含多少基因。尽管人类基因工程认为基因的数量超过10万对,但当前的研究表明基因的数量不到3万对。请见How Many Genes Are in the Human Genome?“http://www.ornl.gov/sci/techresources/Human_Genome/faq/genenumber.shtml)和Elizabeth Pennisi,”A Low Number Wins the GeneSweep Pool,《Science》300.5625(2003年6月6日):1484。。而其他遗传信息用于具体控制蛋白质编码与基因制造蛋白质的时间和方式。生物也以一定概率的基因突变完成进化。

●技术进化同样遵循以上的进化过程。事实上,第一个能够创造技术的物种的出现,造就了新的技术进化。技术进化既是生物进化的产物,又是生物进化的延续。在人类数十万年的进化过程中,早期创造的技术(如车轮、火、石器)从发明到广泛应用大约需要数万年。500年前,一个产品(如印刷机)从发明到广泛应用,大约需要一个世纪。今天,一个产品(例如移动电话和万维网)从发明到广泛使用,只需要短短几年的时间。

●一个具体的范式(解决问题的方法或途径,例如,在计算机集成电路中使用晶体管来制作功能强大的计算机)在应用传播中将成指数增长,直到它的潜力耗尽。这时,范式将发生迁移,从而在全局上保证指数增长的继续。

范式的生命周期。每个范式的发展都分为三个阶段:1)缓慢增长阶段(指数增长的早期阶段);2)快速增长阶段(随后的,爆炸性的指数增长期),就像图2-1中的S形曲线图显示的一样;3)趋于平缓的成熟阶段。

图 2-1

这三个阶段的进展如字母S一样延伸。该S形曲线图显示了当前的指数趋势是如何由级联的S形曲线组成的。每个后继的S形曲线比前一个S形曲线更快(花更少的时间,如X轴所示)和更高(性能更高,如Y轴所示),如图2-1和图2-2所示。

图 2-2

S形曲线是典型的生物增长曲线:复制一个相对固定的复杂的系统(例如某一个物种),需要具有竞争优势并争夺有限的资源。这是经常发生的,例如,当一个新物种在一个舒适的环境中生长时,它的数量在一定时间内会成指数增长,直至稳定下来。进化过程中的整体指数增长(无论分子、生物、文化、技术)将取代任何在特定范式下的增长极限(一个特定的S形曲线),这是每个连续范式日益增长的能力和发展效率的必然结果。因此,一个渐进的指数增长过程会跨越多个S形曲线。这种现象最典型的例子是下文讨论的5种计算模式。在图表上可以看到整个演化过程,该模式与第1章介绍的范式迁移的加速都说明了连续的S形曲线。每一个关键的事件(如书写或印刷),都代表着一种新范式和新的S形曲线。

间断平衡(PE)进化论用来描述相对静止后迅速变化的进化过程14.Niles Eldredge和后来的Stephen Jay Gould于1972年提出了该理论(N.Eldredge和S.J.Gould的'Punctuated Equilibria:An Alternative to Phyletic Gradualism',发表于《Models in Paleobiology》(San Francisco:Freeman,Cooper)。从那时起,该话题便引起了古生物学家和进化生物学家的争论,尽管该理论逐渐地获得了认可。根据该理论,物种在数百万年的进化过程中是相对稳定的。停滞后紧接着伴随着更迭的爆发,那将导致新物种的出现和旧物种的灭绝(Elisabeth Vrba称其为“颠覆性脉冲”)。它将影响着整个生态系统和很多不相关的物种。Eldredge和Gould提出一种需要新视角的模式:“无视和停滞是最具束缚性的一种偏见(不可避免地被认为是进化的缺失),它被认为是非主题的。很奇怪将所有古生物中最普通的现象当做是显著而极具吸引力的。”参见S.J.Gould和N.Eldredge的'Punctuated Equilibrium Comes of Age',《Nature》366(1993年11月18日):223-27。参见K.Sneppen等的'Evolution As a Self-Organized Critical Phenomenon',《Proceedings of the National Academy of Sciences》92.11(1995年5月23日):5209-13;Elisabeth S.Vrba的'Environment and Evolution:Alternative Causes of the Temporal Distribution of Evolutionary Events',《South African Journal of Science》81(1985):229-36。。事实上,纪元-事件图上的关键事件确实与复兴时期秩序(以及复杂度)的指数增长相符,随后当每个范式趋于渐近线时(由于能力的限制),增长速度放缓。所以PE确实提供了一个更好的进化模型。

但是这些正以飞速发展的间断平衡关键技术,并不能产生瞬间的飞跃,例如,DNA的出现为进化的高速发展(但不是瞬间的飞跃)创造了有利条件,它可以改进有机体的设计并增加生物体的复杂度。在最近的技术发展中,计算机的发明引发了另一个信息复杂度的增长高潮,而且这个高潮仍在持续,它帮助人类更好地掌控人机文明。当我们通过计算将宇宙中的物质和能量利用到极致后,下一个发展的高潮就会到来。关于物质方面的限制,我们将在第6章15.诚如我将在第6章所讨论的,如果光速并非信息向遥远宇宙传输的一个基本限制,那么智能和计算将持续地以指数的方式传播,直到支撑计算向整个宇宙传播的物质和能量达到饱和。介绍。

在范型生命周期的成熟阶段,下一阶段的范式迁移就开始聚集能力。在技术方面,人们把大量的研究经费都投向下一范式的创造,这些已经在当前广泛研究的三维分子计算机中得到了验证——尽管在10年内,我们仍要使用平面晶体管集成电路。

一般说来,随着时间的推进,一种模式渐渐趋向于价格一半格式性能图的渐近线时,下一个技术范式就已经开始在特殊平台上起作用,例如,20世纪50年代,工程师减少了真空管的使用,从而为计算机提供了更好的性价比;1960年左右,晶体管得到广泛应用占据了便携式收音机的市场,随后又取代了计算机中的真空管。

支撑进化过程中指数增长的资源是相对无限的,这些资源内在的秩序也在不断增长(正如我之前提出的,进化过程中的产物的秩序也将增长),进化的每个时期都为下一个时期提供了更强大的工具。以生物进化为例,DNA的出现将进化推进到了一个新的层次。再举一个更近的例子,计算机辅助设计工具的出现,促进了下一代计算机的飞速发展。

另一些支撑秩序指数增长的资源来自混沌的环境,这种环境是进化过程中各种发展环境的混合,可以提供更加多样性的选择。这种混沌提供了多样性的变异,它是一个渐进过程,从而可以发现更强大、更有效的解决方案。在生物进化过程中,有性繁殖通过基因混合与匹配促进了物种的多样性。与无性繁殖相比,有性繁殖本身就是一个渐进的创新过程,它促使生物加快适应整个进程,并提供了遗传的多样性组合(多样性也来源于基因突变和不断变化的环境)。在技术发展中,人类智慧与多变的市场条件的结合,使得技术不断地变革创新。

分形设计。生物系统中关于信息内容的一个关键问题是,信息容纳相对较少的基组,是如何制造复杂的类人系统的。一种理解是把生物的设计看成“概率分形”,在一种确定分形中,单一的设计元素(成为发起人)被多个元素(连在一起成为发生器)所替代。分形扩张在第二次迭代时,发生器中的每个元素都成为一个发起者,并与发生器的元素进行替换(缩小到更小的范围成为第二代发起者)。这个过程重复若干次,发生器中新形成的元素成为一个发起者,并且被一个新的发生器替代。每个新的分形扩张明显增强了复杂度,但不再需要额外的设计信息。一个概率分形增加了不确定的元素。一个确定的分形总是呈现相同的外形,而概率分形每次变化都不一样,即使都有类似的特点。在概率分形中,每一个发生器被应用的概率都小于1。这种方式使设计具有了一个更有机的外观。在图形程序中使用概率分形,从而产生了现实般的山、云、海岸、叶子等画面效果,以及其他有机的画面。概率分形的一个关键方面是使这一阶段的复杂度增加(包括与设计信息有关的各种细节)。生物使用了同样的原则。基因提供设计信息,但一个生物体的细节要远大于遗传的设计信息。

一些学者不能理解像大脑一样的生物系统中的大量细节,例如,精确地设计每个神经元中每个微结构的确切构成,以及他们通过系统完成功能的准确方式。为了理解一个像大脑这样的生物系统是如何工作的,我们需要理解设计原则,然而该原则的信息量比产生于迭代的、极其琐碎的基因结构的信息量要少得多。整个人类基因组只有8亿比特的信息,经过压缩后,有效信息量大约只有3000万比特到1亿比特。人类基因组的信息量还不到一个完整进化的人脑中,神经元间连接信息和神经传递介质模式信息的一亿分之一。

下面来看加速回归定律是怎样适用于我们在第1章讨论的纪元的。由氨基酸组合而成的蛋白质和由核酸组成的RNA链,共同建立起了生物学的基本模式,RNA链(其后是DNA)的自我复制(即第二纪元)为记录进化的结果提供数字化方法,后来,理性思考与物种进化(第三纪元)相结合,引起了从生物到技术的范式转化(第四纪元)。即将到来的主要范式迁移将由生物思想向生物和非生物的相结合的混合思想转变(第五纪元),其中包括源于生物大脑逆向工程的“生物启发”的处理。

如果我们审视这些纪元,可以发现它们只是不断加速进程的一部分。生命形式进化的第一步(原始细胞、DNA)花费了几十亿年,然后进化才开始加快。在寒武纪生物大爆发时期,重大的模式转变需要数百万年到一千万年。后来,经历了数百万年的时间,类人生物产生;而后只经历了几万年,现代人类就产生了。随着能够创造技术的物种的出现,通过DNA引导蛋白质合成,使得进化以指数级的速度增长;后来的进化源于人类创造的技术。但是,这并不意味着生物(基因)进化的停止,而只是生物进化的速度不再代表整个系统“秩序”增加的速度(或计算的有效性和效率)16.生物进化持续地与人类相关联,但是像癌症和病毒等疾病通过进化对抗人类(癌细胞和病毒可以通过进化来对抗各种治疗措施,如化学药物和抗生素)。但是人类智能在与生物进化智能的斗争中能够以智取胜:在基础层面上攻击疾病,通过使用“鸡尾酒”策略,以正交(独立)的方法同时对抗疾病。

预见进化。生物进化、技术的发展增加了秩序和复杂度,从而导致了一系列的后果。以视力范围为例,早期生物可以使用化学梯度观察几毫米以内的活动。有视力的动物通过进化,能够看到几英里之外的活动。而随着望远镜的发明,人类可以看到数百万光年以外的其他星系。反之,如果使用显微镜,他们还可以看到细胞的结构。今天,通过不断发展的现代技术,人类的观察范围远至130亿光年外的距离,近到量子边缘的亚原子粒子。

再来看信息存储的例子。单细胞动物可以根据化学反应记住几秒以内的事件。有大脑的动物可以记住几天的事件。具有文明的灵长类动物可以将信息传承几代。早期的人类文明通过口述的历史,把数百年前的故事传承下来。随着文字的出现,这种传承可以延长至数千年。

范式迁移正在加速,诚如下面的例子:从19世纪末电话的发明到普及,大约用了半个世纪的时间(见图2-3和图2-4)17.Andrew Odlyzko的'Internet Pricing and the History of Communications',AT&T实验室研究,2001年2月8日经过修订,网址为http://www.dtc.umn.edu/~odlyzko/doc/history.communications1b.pdf.

图 2-3

图 2-4

相比之下,20世纪末,手机从发明到广泛应用只用了10年的时间18.Cellular Tele Communications and Internet Association,Semi-Annual Wireless Industry Survey,June 2004,http://www.ctia.orglresearch_statistics/index.cfm/AID/l0030

总的来说,我们看到在过去一个世纪里,通信技术的普及速度平稳增长19.电线、电话、收音机、电视、手机:FCC,网址为www.fcc.gov/Bureaus/Common_Carrier/Notices/2000/fc00057a.xls。Home Computers and Internet use:Eric C.Newburger,U.S.Census Bureau,'Home Computers and Internet Use in the United States:August 2000'(September 2001),http://www.census.gov/prod/2001pubs/secondTitle3-207.pdf。也可以参考'The Millennium Notebook',《Newsweek》,1998年4月13日,第14页。,如图2-5所示。

图 2-5

如第1章所述,采用新范式的速度与技术发展的速度大体上是一致的,目前的速度每10年翻一番。也就是说,新范式变更的周期是每十年缩短一半。按照这一速度,21世纪的技术进步将等价(如图2-1)于以往200个世纪的发展(以2000年的发展速度为准)20.以当前新的通信技术来衡量,现在范式迁移的速率每9年翻一番(大规模使用新发明——被美国四分之一的人口使用——的时间将减半)。请见注释21。21.图2-5显示了在过去的130年间,一项发明被25%的美国人口使用所需的时间。电话的普及用了35年的时间,收音机的普及用了31年的时间(减少了11%时间,或者说在两项发明间隔的21年间以每年0.58%的速度递减)。收音机与电视机这两项发明的时间间隔每年的递减速度为0.6%,电视机与PC这两项发明的时间间隔每年的递减速度为1.0%,PC与移动电话这两项发明的时间间隔每年的递减速度为2.6%,移动电话与互联网这两项发明的时间间隔每年的递减速度为7.4%。从1897年发明收音机到广泛普及用了31年的时间,而从1991年互联网的发明到其广泛普及仅用了7年的时间——在过去的94年里时间减少了77%,以平均每年1.6%的速度减少。由此可以推断在20世纪的这100年里发明广泛普及的时间减少了79%。当前的发明普及的递减速度为每年7.4%,故以当前的速度来说,发明广泛普及的时间减少79%所需的时间只需要20年。以此速度计算,范式迁移增倍(也就是说发明普及减半的时间)的时间只需要9年。在21世纪该速率将11次翻番,即该速度将达到当前的211倍,也就是2000年的2000倍。实际的增长速率将更快,因为当前的增长速率如20世纪那样,仍然稳定地增长。

技术的S形曲线在其生命周期中的表达

机器与人类一样,可以独特地、出色地、传神地演奏小提琴协奏曲或是推演欧几里得定理。

——格雷戈里·伏拉斯多兹

便捷的现代打印机,在近25年来,已经革命性地创建并改变了商业模式,工作在修道院小屋中的那个沉默的抄写员与它不可同日而语。

——美国《科学》,1905年

通信技术一直都在发展,只是与技术视野的扩大相比起来,变得没有那么重要而已。

——阿瑟·克拉克

我的办公桌上一直放着厚厚的一叠书,当没有思路、坐卧不宁或者需要一线灵感时,我便可以迅速翻阅它们。当拿起最近获得的书卷,我便会想到出版者的手艺:470页精心印制的书页被组织成以16页为单位的书页叠,所有这些书页叠都用白线缝在一起,并粘在了灰色的帆布上。金黄色的字母盖在坚硬的亚麻封皮上面,连接着签名,巧妙地凸起在封底上。这是一个几十年前就完善的技术。书籍是构成社会的一个重要组成部分,它反映并塑造了文化,很难想象没有书籍的生活会是什么样子。尽管如此,印刷书籍与任何其他技术一样,也终将退出历史舞台。

一项技术的生命周期

一项技术的生命周期可以分为7个不同阶段。

1)前导阶段。一项技术诞生的先决条件已经存在,梦想家可能会思索如何将这些要素相结合。然而,我们不认为梦想等同于发明,即便把这些想象记录下来。达·芬奇创作了令人信服的飞机汽车的图片,但我们不认为它这就是发明。

2)发明阶段。漫长的劳动孕育了发明,这是人类文化中最令人兴奋的部分,这阶段非常简短。在这个阶段,发明者用一种新的方式将好奇心、科学技能、决心和普遍的技巧相融合,把新的技术带入了生活。

3)发展阶段。在此期间发明被其拥有者(可能包括原始发明人)保护、支持。这个阶段往往比发明阶段更为重要,可能还涉及比发明本身更大的意义的额外创造。许多能工巧匠精心制造手动驾驶的汽车,但直到亨利·福特发明了汽车批量生产方法,汽车工业才蓬勃发展起来。

4)成熟阶段。尽管技术继续发展,但此时它已经拥有了自己的生命,并成为社会的固定组成部分。技术与生活交织在一起,使得很多人误认为这种技术将持续下去。在下一阶段,这种误解造成了有趣情景,可以称为虚假冒充阶段。

5)在这个阶段,新技术的出现使得旧技术黯然无光。新技术的爱好者过早地预测它的胜利。新技术提供了一些明显的好处,但它在功能和质量方面仍缺少关键要素。此时,新的技术不能动摇原有的秩序,而技术保守派则认为原有的技术将永远不会被替代。

6)陈腐的技术尽管取得了短暂的胜利,但很快另一项新技术将成功超越它。该技术进入了生命周期的晚年阶段,其原始目的和功能将都被新的、更具竞争力的技术替代。

7)在这个阶段占技术生命周期的5%到10%的时间,旧技术将退出历史的舞台——好比马车被汽车代替,古钢琴被黑胶唱片代替,书籍手工抄录被打印机代替。

19世纪中叶,出现了一些留声机的前身,例如里昂斯科特德维尔的声波记振仪,这个设备用印刷图案的方法来记录声音振动。1877年,托马斯·爱迪生结合所有的相关元素,发明了第一台能够记录并重现声音的设备。改进对留声机的商业化是非常必要的。1949年,留声机已经成为一种相当成熟的技术,此时,哥伦比亚公司引进了33转/分钟的长时演唱唱片,RCA公司推出了45转/分的磁盘。冒充者是盒式磁带,它于20世纪60年代出现并在20世纪70年代推广。早期爱好者预测,盒式磁带体积小并能够重新记录的优势将代替笨重且易损坏的录音设备。

尽管磁带具有这些好处,但它不能随机存取,而且音质容易失真。最终是由压缩光盘(CD)完成了对老式录音设备的致命打击。光盘具有随机存取能力,而且质量水平接近人类听觉系统,很快留声机便过时了。这个技术在爱迪生创造了130年后,就达到了高龄,退出了历史舞台。

来看钢琴这个例子,这是我一直亲自参与的技术领域。18世纪初,意大利乐器制造家克里斯多佛利苦思冥想后设计了一种乐器,演奏者可以触摸按键,并触摸强度利用的变化,来演奏音乐。这种乐器称为“温柔和响亮的古键琴”,但这个发明没有立即取得成功。经过一系列完善(包括斯坦的维也纳行动和聪佩的英式行动),终于制造出了卓越键盘乐器——钢琴。1825年,阿尔菲厄斯·巴布科克用铸铁架构来制造钢琴,钢琴的发展进入了成熟期,自那时起,钢琴只有细微的改进。冒充者是19世纪80年代初的电子钢琴。它提供更加强大的功能。相对于原声钢琴,电子声音变换提供了数十个乐器音色、定序器允许用户可以立刻播放整个管弦乐队的声音、自动伴奏、教授键盘使用技巧和其他功能。唯一的缺点是其音质逊于高质量的钢琴。

这一关键缺陷导致了第一代电子钢琴引起普遍争论,结论是钢琴将永不会被电子产品取代。但是,原声钢琴的“胜利”并不是永久的。电子钢琴在功能、价格、性能等方面的优势,使得其销售量已经超过了原声钢琴。许多观察家认为,电子钢琴的声音质量现在已经可以媲美甚至超过了原声钢琴。除了音乐会和奢侈的三角钢琴外(只是市场的一小部分),原声钢琴的销售量都在下降。

从羊皮卷到下载

那么,书籍的生命周期是什么呢?书籍的前身是美索不达米亚的泥板和埃及莎草纸卷轴。在公元前2世纪,埃及托勒密在亚历山大创造了规模巨大的图书馆,并且宣告纸莎草出口非法以阻止竞争。

古希腊统治者欧迈尼斯二世是怎么创造第一批书籍的呢?他使用山羊和绵羊的皮纸做成书页,把所有书页夹于木质封面之间,并通过缝制的方式固定。这项技术使欧迈尼斯的图书馆能够与亚历山大的图书馆相媲美。大约在同一时代,中国还创造了竹简书。

书籍的发展和成熟涉及了三大跨越。首先是印刷术,公元8世纪,中国人尝试用凸起的木头块大量印制书籍,从而扩大了读者范围,读者已经不局限于政府和宗教领袖。更有意义的是活字印刷,它最早出现在11世纪的中国和韩国,但亚洲文字的复杂性阻碍了这些早期的尝试取得完全的成功。15世纪,约翰内斯·古腾堡将活字印刷应用于相对简单的罗马字符集。1455年,他通过活字的方式印刷了圣经,这也是第一次大规模采用活字印刷技术。

虽然机械领域和印刷机电领域一直在改革发展,但是直到计算机排版的出现,书籍制作技术才有了质的飞跃,大约20年前,计算机排版彻底取代了活字印刷。印刷术现在被归为数字图像处理的一部分。

书籍制作技术进入成熟阶段。大约20年前,随着第一次电子图书浪潮的到来,冒充者出现了。与其他例子相同,这些冒充者在质量方面带来的巨大的益处。以CD-ROM或闪存为介质的电子书,具有强大的搜索和导航功能,内部存储量相当于数千册纸质书籍。人们可以通过强大的逻辑规则快速检索以网络、CD-ROM或DVD为存储介质的百科全书。只是对于我拥有的那33卷纸质汤姆·斯威夫特系列小说,这些功能无法实现。电子书籍可以提供动画并能回应用户的输入。阅读页面不一定严格有序,但用户可以凭借直觉去探索电子书中的内容。

与唱片和钢琴一样,这些第一代冒充者(现在仍然是)与纸质书籍相比最大的缺点是:缺少纸和油墨那样极佳的视觉效果。纸没有闪烁,然而普通计算机屏幕的刷新频率是60赫兹。这是灵长类动物的视觉系统进化适应的问题。我们只能在高分辨率下,看清可视范围内的一小部分。通过视网膜中心成像,这部分相当于距离眼睛22英寸远的图像被聚焦在一个只有一个字母大小的面积上。在中心小窝以外,分辨率很低但对亮度的变化非常敏感,这种能力使灵长类动物的祖先能够迅速检测天敌的攻击。视频图形阵列(VGA)不断闪烁的计算机屏幕被我们的眼睛检测到后,迫使眼睛不断运动视网膜中心小窝。这实质上是放慢了阅读速度。这就是为什么屏幕阅读没有纸质书籍阅读那么让人心灵愉悦。这个特殊的问题现在已由不闪烁的平板显示器解决了。

其他重要问题包括对比度和分辨率:优质书籍的墨和纸张对比度大约为120:1;普通屏幕的对比度只有墨和纸对比度的一半。书中的印刷和插图的分辨率约为每英寸600至1000点数(DPI),而计算机屏幕的分辨率大约只是书的1/10。

计算机设备的尺寸和重量正在接近书籍,但其重量仍要比一本平装书重。而且纸质书也不需要电池供电。

最重要的是现有的软件的问题,我指的是庞大书籍印刷制作基地。美国每年将有5万种新书出版,同时数百万种图书还在流行。虽然目前在扫描和数字印刷方面已经投入了巨大的力量,但仍然需要经历相当长的时间,电子数据库才能创造巨大的物质财富。最大的障碍在于出版商将纸质图书制成电子图书的犹豫,毕竟非法的文件共享曾经给传统的音乐录制业带来了毁灭性的打击。

很多突破这些限制的解决方法也随之出现。新的廉价的显示技术在对比度、分辨率、低闪烁等方面可以媲美优质纸文档。电子产品便携式的燃料电源被引进,这将给电子设备提供数百个小时的供电。便携式电子设备在尺寸与重量上可与一本书媲美。现在首要的问题将是找到可以安全使用电子信息的方法。这是各个方面都非常关注的基本性问题。一旦纳米技术为基础的制造业在20年内成为现实(包括物理产品在内),一切都将成为信息。

摩尔定律与超摩尔定律

埃涅阿克计算机配备了18000个真空管,重30吨;未来的计算机可能只有100个真空管,质量约为1.5吨。

——大众机械,1949年

计算机科学的研究范畴不仅仅是电脑,就像天文学的研究范畴不仅仅是望远镜。

——E.W.Dijkstra

在进一步思考奇点的含义前,让我们先研究各种服从于加速回报定律相关技术的广阔领域。摩尔定律是最著名的(也是被广为承认的)指数增长现象。在20世纪70年代中期,戈登·摩尔(集成电路的主要发明人、英特尔公司的董事长)指出,我们可以每24个月在集成电路上集成现在两倍的晶体管(在20世纪60年代中期,他曾预计12个月)。电子的传导距离随着减少,电路也将运行得更快,从而提高了整体计算能力。这些带来的结果是计算的性价比以指数增长,其翻倍的速度(12个月翻一番)远快于范式迁移的增长速度(10年翻一番)。信息技术在性价比、带宽、容量等方面的速度增长1倍的时间都是一年。

摩尔定律的主要动力是半导体元件尺寸的减少,减少的速度为每5.4年收缩一半(见图2-6)。由于芯片功能是双向的,这意味着每2.7年每平方毫米的元件数量将增加一倍22.数据来自1967年~1999年的Intel的数据,请见Gordon E.Moore的'Our Revolution',网址为http://www.siaonline.orgfdownloads/Moore.pdf。数据来自2000年~2016年International Technology Roadmap for Semiconductors(ITRS),该数据在2002年和2004年更新,网址为http://public.itrs.net/Files/2002Update/2002Update.pdf和http://www.itrs.net/Common/2004Update/2004_00_Overview.pdf。

图 2-6

图2-6展示了半导体工业发展路线图(选自半导体技术协会的国际半导体技术蓝图《参考系》,该图预测至2018年)。

每平方毫米DRAM(动态随机存取记忆体)的成本也已开始下降。每1美元生产DRAM比特数的倍增时间只需1.5年23.ITRS生产DRAM的花费表示每一bit信息花费的数据。1971年~2000年的数据来自VLSI Research年,2001年~2002的数据来自ITRS的2002年更新的表7a,第172页。2003年~2018年的数据来自ITRS的2004更新的表7a和7b,第20页和第21页。(见图2-7)。

图 2-7

晶体管方面也可以看到类似的趋势。1968年1美元可购买1个晶体管;2002年1美元可以购买大约1000万个晶体管。由于DRAM是一种专门的领域(有自己的创新),晶体管的平均价格减半的时间略长于DRAM,约1.6年(如图2-8)24.根据Intel和Dataquest的报告(2002年12月),参见Gordon E.Moore的'Our Revolution',网址为http://www.siaonline.org/downloads/Moore.pdf。

图 2-8

半导体性价比显著而平稳的加速,是通过改良生产过程中不同阶段、不同方面的工艺技术实现的。关键元件尺寸已小于100纳米(通常认为100纳米是应用纳米技术的极限)25.Randall Goodall、D.Fandel和H.Huffet的'Long-Term Productivity Mechanisms of the Semiconductor Industry',Ninth International Symposium on Silicon Materials Science and Technology,2002年5月12日~17日,Philadelphia,由the Electrochemical Society(ECS)和International Sematech赞助。

与格特鲁德·斯坦因诗中的“玫瑰”不同,“晶体管是晶体管是晶体管”并不适用于现实情形。事实上,晶体管不是一成不变的,在过去30年中,它们已经变得体积更小、价格更便宜、速度更快了(参见图2-10)——因为电子的传输路程更短了26.1976~1999的数据来自E.R.Berndt、E.R.Dulberger和N.J.Rappaport的Price and Quality of Desktop and Mobile Personal Computers:A Quarter Century of History,2000年7月17日,网址为http://www.nber.org/~confer/2000/si2000/berndt.pdf。2001~2016的数据来自ITRS的2002更新表4c:Performance and Package Chips:Frequency On-Chip Wiring Levels-Near-Term Years,第167页。

图 2-9

图 2-10

如果把晶体管成本的下降和晶体管间延时减少的趋势结合起来,我们会发现,只需要1.1年的时间晶体管周期的单位成本就会减半(见图2-11)27.请见注释26描述的时钟速度(周期时间)和注释24描述的晶体管代价。。晶体管周期的单位成本是一个能够准确地从整体上衡量性价比的指标,因为这个指标可以同时考虑到速度和容量。但是晶体管周期的单位成本没有考虑更高层次的技术革新(比如微处理器的设计)对计算性能的改进。

图 2-11

英特尔处理器中的晶体管数量每两年翻一番(见图2-12)。还有一些其他的因素也在改进整体性价比,比如时钟速度的提升、微处理器成本的下降以及处理器设计方法的创新28.在微处理器方面Intel的晶体管:Microprocessor Quick Reference Guide,Intel Research,网址为http://www.intel.com/pressroom/kits/quickrefyr.htm。也可以参见Silicon Research Areas,Intel Research,http://www.intel.comlresearch/silicon/mooreslaw.htm。

图 2-12

处理器的MIPS(每秒的指令执行数目)性能,每1.8年提升一倍(见图2-13)。而且,在这段时间内处理器的单位成本也在下降29.数据来源于Intel公司,请见:Gordon Moore的'No Exponential Is Forever……but We Can Delay 'Forever'',在International Solid State Circuits Conference(lSSCC)上发表,2003年2月10日,网址为ftp://download.intel.com/researchl silicon/Gordon_Moore_ISSCC_021003.pdf。

图 2-13

让我来回顾这40多年来对计算机产业的切身体会,比较一下我在学生时期(1960年前后)使用的MIT计算机和现在的笔记本电脑:1967年,我曾经使用过价值数百万美元的IBM 7094计算机,32K字节(36bit)的内存储器,处理器速度为1/4 MIPS。2004年,我使用的是一台价值2000美元的个人电脑,几个G的RAM,处理器速度为2000MIPS。MIT计算机的价格大约是个人电脑的一千倍左右,所以现在个人电脑的MIPS的单位成本是MIT计算机的800万分之一,如表2-1所示。

表2-1

现在我的计算机处理器的能力达到了2000MIPS,其处理成本不到1967年我使用的计算机的224分之一,也就是说性价比在37年间翻了24番,大约每18.5个月翻一番。相比之下,2004年我使用的计算机RAM的容量增长了近2000倍、磁盘存储大幅度增长、指令集也更高效。此外通信速度更快,软件功能更强,其他方面的性能也不断得到提升,所以在未来性能翻倍的时间将会越来越短。

尽管信息技术的成本大幅度降低,但需求增长的速度更快。比特的数量每1.1年翻一倍,比单位比特成本降低一半的时间(单位比特成本降低一半大约是1.5年30.Steve Cullen的'Semiconductor Industry Outlook',InStat/MDR,报告号:IN0401550SI,2004年4月,网址为http://www.instat.com/abstract.asp?id=68&SKU=IN0401550SI。)要快。半导体工业从1958年到2002年31.来自World Semiconductor Trade Statistics,网址为http://wsts.www5.kcom.at。,每年增长18个百分点。整个IT产业在GDP中的比重从1977年的4.2%,上升到了1998年32.来自Bureau of Economic Analysis,U.S.Department of Commerce,网址为http://www.bea.gov/bea/dn/home/gdp.htm.的8.2%,如图2-14所示。IT产业已经逐渐成为各种经济因素中的一股强大势力。同时IT产业也促进了很多其他制造业和服务业的快速发展,甚至包括生产桌椅板凳的制造业。各行各业的生产过程中计算机辅助设计、库存管理系统以及自动化生产系统等都得到广泛使用。

表2-2

图 2-14

摩尔定律:自我满足的预言?

许多观察家都认为摩尔定律是一条已经应验的预言:工业生产商期待在未来某个特定的时间组织相应的研发。这个产业的发展路线图是典型的实例34.来自International Technology Roadmap for Semiconductors,2002更新,International Sematech。。但是信息技术发展的指数趋势已经远远超出了摩尔定律的范畴。我们可以看到类似的发展趋势发生在每一个与信息技术相关的技术中。其中部分技术的性价比加速提高可能并不存在或者并不明显(具体解释见下文)。即便是计算本身,其性能增长的单位成本也已经远远超出了摩尔定律的预测。

第五范式35.'25 Years of Computer History',网址为http://www.compros.com/timeline.html;Linley Gwennap的'Birth of a Chip',《BYTE》(1996年12月),网址为http://www.byte.com/art/9612/sec6/art2.htm;'The CDC 6000 Series Computer',网址为http://www.moorecad.com/standardpascal/cdc6400.html;'A Chronology of Computer History',网址为http://www.cyberstreet.comlhcs/museum/chron.htm;Mark Brader的'A Chronology of Digital Computing Machines(to 1952)',网址为http://www.davros.org/misc/chronology.html;Karl Kempf的'Electronic Computers Within the Ordnance Corps',1961年11月,网址为http://ftp.arl.mil/~mike/comphist/61ordnance/index.html;Ken Polsson的'Chronology of Personal Computers',网址为http://www.islandnet.com/~kpolsson/comphist;'The History of Computing at Los Alamos',网址为http://bang.lanl.gov/video/sunedu/computer/comphist.html(requires password);the Machine Room,网址为http://www.machineroom.org;Mind Machine Web Museum,网址为http://www.userwww.sfsu.edu/~hl/mmm.html;Hans Moravec,computer data,网址为http://www.frc.ri.cmu.edu/~hpm/book97/ch3/processor.list;'PC Magazine Online:Fifteen Years of PC Magazine',网址为http://www.pcmag.com/article2/0,1759,23390,00.asp;Stan Augarten,《Bit by Bit:An Illustrated History of Computers》(New York:Ticknor and Fields,1984);International Association of Electrical and Electronics Engineers(IEEE),《Annals of the History of the Computer》9.2(1987):150-53和16.3(1994):20;Hans Moravec的《Mind Children:The Future of Robot and Human Intelligence》(Cambridge,Mass.:Harvard University Press,1988);Rene Moreau的《The Computer Comes of Age》(Cambridge,Mass.:MIT Press,1984)。

摩尔定律实际上并不是计算机系统领域的第一阶段。如果关注性价比(1000美元的成本创造的每秒钟执行的指令数),可以在下面49个著名的计算系统和20世纪计算机相关领域中发现这个阶段(见图2-15)。

图2-15表明,当集成电路发明之前,计算性价比以指数级的速度增长就有四个不同的范式——机电、继电器、真空管、离散晶体管。摩尔范式也并不是最后的范式。当摩尔定律到达的S形曲线末端(预计2020年前)后,三维分子计算将继续推动指数级的增长,这也将构成第六范式。

图 2-15

分形维度和大脑

注意,计算机系统第三维度的使用不是一个非此即彼的选择,而是二维和三维间的一种延续。在生物智能方面,人类大脑皮层相当的平,6个薄层被精巧地折叠在一起,这种结构可以大大增大其表面积。这种折叠的方式也可以使用第三维度。在“分形”系统(绘图更换或折叠规则迭代应用的系统)中,这种精密的折叠结构被认为构成了一部分的维度。从这一角度看,人类大脑皮层表面是一个错综复杂的二至三维结构。其他脑结构(如小脑)是三维的,但包含重复的结构,所以其本质上还是二维的。很可能我们未来的计算机系统将融合高度折叠的二维系统和充分的三维结构。

请注意,图2-15显示的是对数指数曲线,表明了两个层次的指数增长36.本章中的这幅图标示为“对数图”,但该图从技术的角度来说是半对数图,因为该图形在时间轴上是线性的,而另一个轴上是对数的。但是为了方便起见,我将这些图形称为“对数图”。。换言之,指数增长以指数增长的速度平稳无误地增长(对数图中的直线部分说明了指数增长;上扬的曲线显示其并不是简单的指数级的增长)。如图2-16所见,计算机的性价比在20世纪初翻一番需要三年的时间;20世纪中期翻一番需要两年的时间,而现在大约只需要一年的时间37.参见附录,该定律从数学的角度证明了计算能力(由单位花费每MIPS来衡量)为什么存在两个层次上的指数增长(指数增长速率本身也在以指数速度增长)。

汉斯·莫拉维克提供了类似的图表(见图2-16),它使用了一组不同的但是重叠的时间集合,描述计算机在不同时期(斜率的改变点)的发展趋势。从该图可以看出,斜率随着时间递进而增加,反映了指数增长的第二个层次38.Hans Moravec的'When Will Computer Hardware Match the Human Brain?'《Journal of Evolution and Technology》1(1998),网址为http://www.jetpress.org/volumel/Moravec.pdf。

图 2-16

如果由此来预测22世纪的计算机性能发展趋势,我们可以从图2-17中看到,超级计算机将在2010年前后达到与人类大脑相当的计算性能,在2020年前后,个人电脑的计算能力将媲美甚至超越人脑的水平。这仅是我们对人脑容量的保守估计(我们将在第3章讨论关于人脑运算速度的预测)39.请见注释35。

图 2-17

计算机指数发展是整个科技指数化发展的一个最典型的例子。我们可以从加速度增长的角度观察指数发展的趋势:我们用了90年的时间才达到第一个MIPS/千美元,而现在我们增加1个MIPS/千美元只需要5个小时40.人们用了90年的时间(1900年~1990年)才实现用1000美元创造1个MIPS的计算能力。现在每400天就可以使1000美元的MIPS数量翻番。因为当前的性价比是每1000美元2000 MIPS,所以现在我们以每天增加5 MIPS的速度改进性价比,或者说是以每5小时增加1个MIPS的速度。

图 2-18

IBM的蓝色基因/P超级计算机,预计计算能力达到100万千兆浮点运算(每秒10亿次浮点运算),或者说到2007年41.'IBM Details Blue Gene Super Computer',《CNET News》,2003年3月8日,网址为http://news.com.com/2100-1008_3-1000421.html。达到每秒1015次的计算能力。这已经达到了人脑计算能力的1/10——预计人脑的计算能力为每秒1016次计算(见第3章)。如果从这个指数曲线进行推断,计算机可以在下一个10年的初期达到每秒1016计算能力。

如上所述,摩尔定律只是局限地指出了晶体管的数量在确定尺寸的集成电路中的变化,有的时候甚至还只局限在晶体管的特征尺寸变化上。最适当的性价比测量标准是单位成本的计算速度,索引可以解释不同层面的“聪明”(创新或者称为技术的演变)。除了涉及集成电路的所有发明外,计算机设计的多个层次都有改进(例如流水线、并行处理、先行指令、指导和内存缓存等)。

人类大脑使用效率很低的电化学和数字控制来模拟计算过程。其中大量的计算都是在神经元间、以200次/秒的计算速度(在每个连接)展开的。这至少比现代的电路慢100万倍。但是大脑可以从三维的、极大并行化的组织中得到巨大的能量。有许多的wings方面的技术,通过该技术可以在三维上构建电路,我将在第3章讨论。

有人也许会问:支持计算过程的物质和能量是否存在固有的限制呢?这是一个重要的问题,但正如本书第3章论述的,直到21世纪末,我们都不会接近这些限制。重要的是要区分S形曲线(以具体的技术范式为典型特征)和持续指数级增长(以一个更广泛科技领域中的持续进化过程为典型特征)。具体的范例(如摩尔定律)最终将不会保持指数增长。但是,计算的增长将最终超越它构建的范式,始终保持指数增长的速度。

根据加速回归定律,范式迁移(也称为创新)可以将任何特定模式的S形曲线转变为持续的指数增长。当旧的范式接近它的内在极限时,一个新范式(如三维电路)将接替旧的模式,这种情形在计算的历史中已经发生了至少四次。例如类人猿,每个动物掌握工具制造和使用技巧都以S形学习曲线为特征,但曲线的末端会迅速停止;与之相反,人造技术从一开始,便以指数模式迅速增长,而且永不停止。

DNA序列、记忆、通信、因特网和小型化

文明的进步源于重要行为增加的数量,我们可以很自然地从事这些行为,而不需要经过思考。

——艾尔弗雷德·诺思·怀特海,1911年42.请见Alfred North Whitehead的《An Introduction to Mathematics》(London:Williams and Norgate,1911),与此同时,他还与Bertrand Russell共同创作了三卷《Principia Mathematica》。

与其原来的样子相比,事物未来的样子与它现在的样子更像。

——德怀特·艾森豪威尔

加速回归定律可应用于所有技术,尤其是进化过程。应用信息技术可以将该定律很准确地绘制出来,因为我们已经有了完善的定义标准(如每美元每秒钟的计算量、每克元件每秒钟的计算量)去衡量它们。加速回归定律中暗含着大量指数增长的例子,在各种不同的领域中我们都能找到,如电子、DNA测序、通信、大脑扫描、人脑的逆向工程、人类的知识领域以及技术小型化。技术小型化的趋势与纳米技术的出现直接相关。

未来的GNR(遗传学、纳米技术、机器人技术)时代(见第5章)不仅源于计算的指数增长,而且更多地来自于多种相互交织的技术进步的内部作用,以及它们彼此间的相互协作。指数增长曲线上的每一点都构建了全方位的技术,它们是人类创新与竞争的史诗。我们认为正是这些混沌过程的共同作用,导致了平稳可预测的指数增长趋势。这不是巧合,而是进化过程的本质特征。

人类基因组破译工程启动于1990年,有批判者指出,以当时的速度完成这项工程需要几千年的时间。但是,原计划需要15年的工程提前完工了——2003年43.该项目原计划花费15年的时间,“人类基因组计划比原计划提前两年半的时间,同时该项目的花费也比原计划的27亿美元低”。便完成了第一版测绘。破译成本也由1990年的每对染色体10美元降到了2004年的每对一便士,而且这个成本还在加速持续下降(见图2-19)44.人类基因组计划可参考:http://www.ornl.gov/sci/techresources/Human_Genome/project/privatesector.shtml;Stanford Genome Technology Center,http://sequence-www.stanford.edu/group/techdev/auto.html;National Human Genome Research Institute,http://www.genome.gov;Tabitha Powledge的'How Many Genomes Are Enough?'《Scientist》,2003年11月17日,http://www.biomedcentral.com/news/20031117/07。

图 2-19

科学家破译DNA序列的数据量呈平缓的指数增长(见图2-20)45.数据源自National Center for Biotechnology Information的'GenBank Statistics',2004年5月4日修订,网址为http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html。。一个具有代表性的例子是SARS病毒DNA序列的破译——从SARS病毒的发现到最终破译只用了31天,而HIV病毒DNA序列的破译则花费了多于15年的时间46.British Columbia Cancer Agency和The American Centers for Disease Control只用了31天的时间便破译了非典型性肺炎(SARS)的基因序列。两个中心测序对比表明该病毒中的2万9千个碱基对中只有10对不同。本项工作确认了SARS是一种冠状病毒。CDC的主管Julie Gerberding博士将本次测序工作称为“科学的成就已经远远超过历史发展水平”。参见K.Philipkoski的'SARS Gene Sequence Unveiled',《Wired News》,2003年4月15日,网址为http://www.wired.com/news/medtech/0,1286,58481.00.html?tw=wn_story_related。而HIV的测序工作始于20世纪80年代,HIV1和HIV2测序工作分别于2003年和2002年完成,National Center for Biotechnology Information,网址为http://www.ncbi.nlm.nih.gov/genomes/framik.cgi?db=genome&gi=12171;HIV的序列数据库由洛杉矶阿尔莫斯自然实验室维护,网址为http://www.hiv.lanl.gov/content/hivdb/HTML/outline.htm。

图 2-20

当然,电子存储方面我们在也可以看到指数级的增长(如RAM)。需要注意的是,图2-21中的指数增长经历了不同的技术范式:从真空管到离散晶体管,再由从离散晶体管到集成电路47.Mark Brader的'A Chronology of Digital Computing Machines(to 1952)',网址为http://www.davros.org/misc/chronology.html;Richard E.Matick的《Computer Storage Systems and Technology》(New York:John Wiley and Sons,1977);剑桥大学计算机实验室,EDSAC99,网址为http://www.cl.cam.ac.uk/UoCCL/misc/EDSAC99/statistics.html;Mary Bellis的'Inventors of the Modern Computer:The History of the UNIVACcomputer-J.Presper Eckert and John Mauchly',网址为http://inventors.about.com/library/weekly/aa062398.htm;'Initial Date of Operation of Computing Systems in the USA(1950~1958)',源于1968 OECD data,网址为http://members.iinet.net.au/~dgreen/timeline.html;Douglas Jones的'Frequently Asked Questions about the DEC PDP-8computer',网址为ftp://rtfrn.mit.edu/pub/usenet/alt.sys.pdp8/PDP-8_Frequently_Asked_Questions_%28posted_every_other_month%29;《Programmed Data Processor-1 Handbook》,Digital Equipment Corporation(1960~1963),网址为http://www.dbit.com/greeng3/pdfirstTitle/pdfirstTitle.html#INTRODUCTION;John Walker的'Typical UNIVAC 1108 Prices:1968',网址为http://www.fourmilab.ch/documents/univac/config1108.html;Jack Harper的'LISP 1.5 for the Univac 1100 Mainframe',网址为http://www.frobenius.com/univac.htm;Wikipedia的'Data General Nova',网址为http://www.answers.com/topic/datageneralnova;Darren Brewer的'Chronology of Personal Computers 1972~1974',网址为http://uk.geocities.com/magoos_universe/comfirstTitle972.htm;www.pricewatch.com;网址为http://www.jcnews.com/parse.cgi?news/pricewatch/raw/pw-010702;网址为http://www.jcnews.com/parse.cgi?news/pricewatch/raw/pw-020624;网址为http://www.pricewatch.com(11/17/04);网址为http://sharkyextreme.com/guidesIWMPG/article.php/10706_2227191_2;《Byte advertisements》,1975年9月~1998年3月;《PCcomputing advertisements》,1977年3月~2000年4月。

图 2-21

但是,磁存储(磁盘驱动器)的性价比的增长并不遵循摩尔定律(见图2-22)。这一指数趋势反映了一个磁性基板上的数据压缩量,而非集成电路中的晶体管数量,这是很多工程师和公司寻求解决的另一技术挑战48.Seagate的'Products',网址为http://www.seagate.com/cda/products/discsales/index;《Byte advertisements》,1977~1998;《PCcomputing advertisements》,1999年3月;Editors of Time-Life Books的《Understanding Computers:Memory and Storage》(New York:Warner Books,1990);'Historical Notes about the Cost of Hard Drive Storage Space',网址为http://www.alts.net/ns1625/winchest.html;'IBM 305 RAMACcomputer with Disk Drive',网址为http://www.cedmagic.com/history/ibm-305-ramac.html;John C.McCallum的'Disk Drive Prices(1955-2004)',网址为http://www.jcmit.com/diskprice.htm。

图 2-22

很多年来,通信技术(交流信息的方法,见图2-23)的指数增长甚至比计算的处理或存储方法更快,故而通信技术的暗示作用同样非常重要。这一领域的进展,不仅涉及集成电路中晶体管缩小方面的进步,还涉及纤维光学、光交换、电磁技术等诸多领域的加速进步49.James DeRose的《The Wireless Data Handbook》(St.Johnsbury,Vt.:Quantrum,1996);First Mile Wireless,网址为http://www.firstmilewireless.coml;J.B.Miles的'Wireless LANs,'《Government Computer News》18.28(1999年4月30日),http://www.gcn.com/vo118_no28/guide/514-1.html;《Wireless Week》(1997年4月14日),网址为http://www.wirelessweek.com/toc/4%2F14%2F1997;Office of Technology Assessment的'Wireless Technologies and the National Information Infrastructure',1995年9月,网址为http://infoventures.com/emf/federal/ota/ota95-tc.html;Signal Lake的'Broadband Wireless Network Economics Update',2003年1月14日,网址为http://www.signallake.com/publications/broadbandupdate.pdf;BridgeWave Communications communication,网址为http://www.bridgewave.com/050604.htm。

目前,我们正在通过无线通信方式,逐渐摆脱有线通信对我们的城市和日常生活的局限,无线通信正以每10到11个月翻一番的速度增长(见图2-23)。

图 2-23

图2-24和图2-25显示了基于主机(网络服务器)数量的互联网的整体增长。这两个图表分别用对数形式和线性形式绘制相同的数据。正如前文讨论过的,当技术进步呈指数增长时,我们却以为这个过程在线性域中经历。从大多数观察家的角度来看,直到20世纪90年代中期,这个领域什么也没有发生,而万维网和电子邮件似乎是突然出现。但是因特网在世界范围内的普及,早在20世纪80年代初,通过对因特网前身APPANET的指数增长趋势的检测,就可以预测到50,Internet Software Consortium(http://www.isc.org),ISC Domain Survey:Number of Internet Hosts,网址为http://www.isc.org/ds/host-count-history.html。

图 2-24

图2-25显示的是相同的数据在线性图中的刻画51.如上。

图 2-25

除了服务器外,互联网的实际数据流量每年都翻倍52.每年的12月,美国都市在互联网的主干网络上测试当年的平均流量。A.M.Odlyzko的'Internet Traffic Growth:Sources and Implications',《Optical Transmission Systems and Equipment for WDM NetworkingⅡ》,B.B.Dingel、W.Weiershausen、A.K.Dutta和K.-I.Sato等编辑,《Proc.SPIE》(The International Society for Optical Engineering)5247(2003):1-15,网址为http://www.dtc.umn.edu/~odlyzko/doc/oft.internet.growth.pdf;数据来源于2003~2004与A.M.Odlyzko的电子邮件沟通。,如图2-26所示。

图 2-26

为了适应这种指数增长,互联网骨干网的数据传输速度(图2-27所示,实际用于互联网的最快的骨干网通信信道)本身也呈指数级增长。请注意图2-27中的“互联网骨干网的带宽”,我们可以明显地看到连续的S形曲线:一个新的范式带来了加速增长;随着该范式的潜力用尽,增长趋于平缓;随后通过范式的迁移实现新的加速增长53.Dave Kristula的'The History of the Internet'(发表于1997年3月,2001年8月更新),网址为http://www.davesite.com/webstation/nethistory.shtml;Robert Zakon的'Hobbes' Internet Timeline v8.0',网址为http://www.zakon.org/robert/internet/timeline;《Converge Network Digest》,2002年12月5日,网址为http://www.convergedigest.com/Daily/daily.asp?vn=v9n229&fecha=December%2005,%202002;V.Cerf的'Cerfs Up',2004,网址为http://global.mci.com/de/resources/cerfs_up/。

图 2-27

另一个将对21世纪产生深远影响的趋势是,各类技术普遍朝着小型化方向发展。各类技术(包括电子和机械)关键部件的尺寸正在以指数速度缩小。目前,缩小技术以每10年缩小到原来尺寸1/4的速度发展。这种小型化趋势是由摩尔定律驱动的,但它同样反映了所有电子系统尺寸的发展趋势,例如磁存储。我们还可以看到机械设备尺寸的减少,图2-28说明了机械设备尺寸随时间的变化趋势。54.H.C.Nathanson等的'The Resonant Gate Transistor',《IEEE Transactions on Electron Devices》14.3(1967年3月):117-33;Larry J.Hornbeck的'128 x 128 Deformable Mirror Device',《IEEE Transactions on Electron Devices》30.5(1983年4月):539-43;J.Storrs Hall的'Nano Computers and Reversible Logic',《Nanotechnology》5(July 1994):157-67;V.V.Aristov等的'A New Approach to Fabrication of Nanostructures',《Nanotechnology》6(1995年4月):35-39;C.Montemagno等的'Constructing Biological Motor Powered Nanomechanical Devices',《Nanotechnology》10(1999):225-31,网址为http://www.foresight.org/Conferences/MNT6/Papers/Montemagno/;Celeste Biever的'Tiny 'Elevator' Most Complex Nanomachine Yet',《New-Scientist.com News Service》,2004年3月18日,网址为http://www.newscientist.com/article.ns?id=dn4794。

图 2-28

由于纳米技术的快速发展,各种不同技术的关键特征的尺寸正在接近于多纳米范围(少于100纳米,1纳米是1米的10亿分之一)。如图2-29所示55.ETC Group的'From Genomes to Atoms:The Big Down',第39页,网址为http://www.etcgroup.org/documents/TheBigDown.pdf。,纳米技术科学引用文献在过去的十年增长迅速。

图 2-29

在纳米技术的相关专利方面我们看到了相同的现象(见图2-30)56.同上。

图 2-30

正如我们将在第5章探讨的,随着基因技术在能力和性价比方面的指数增长,基因(或生物技术)革命给生物领域带来了信息革命,同样,纳米技术革命将为材料和机械系统提供快速增长的信息控制力。机器人(或强人工智能)革命涉及人类大脑的逆向工程,这意味着用信息的方式,并结合日益强大的计算平台的分析结果来理解人类智能。因而,所有这三种重叠的变革(遗传学、纳米技术和机器人),将主导21世纪上半叶信息革命的方方面面。

信息、秩序和进化:沃尔夫勒姆和弗雷德金对于元胞自动机的深刻见解

正如我在本章前面所描述的,信息技术的每个方面都在以指数级的速度增长。人类固有的对于奇点(正发生于人类历史之中)的期望,对人类的未来是非常重要的。我们可以在人类历史的每个阶段发现信息的存在。人类知识和艺术的每一种表达形式——科学抑或工程设计、文学、音乐、绘画、电影,都能表达为数字信息。

我们的大脑可以通过神经元放电的方式进行数字化的运转。大脑中神经元之间的连接可以通过数字化的方法来进行描述,甚至人脑的构造也是由一段令人称奇的微小的数字遗传密码所规定的57.虽然难以准确地确定基因所蕴含的内容,但是重复的碱基对数量显然远小于未经压缩的数量总和。下面提供了两种预测基因中压缩信息的方法,这两种方面均表明3000万~1亿字节的这一范围是很高的。1)就未压缩的数据而言,人类基因代码中包含了30亿个DNA梯阶,每个可用两bit信息编码(因为每个DNA碱基对有四种可能性)。这样算来,人类基因组共含有8亿字节未经压缩的信息。不能编码的DNA称为“垃圾DNA”,但现在已经可以清晰地认定它们在基因表达中扮演了重要角色。但是其编码效率很低,存在大量的冗余(例如'ALU'序列重复出现了很多次),压缩算法可以充分地利用这一特点而进行压缩。由于基因数据库中已经存储着大量的数据,所以基因数据压缩引起了大家的广泛兴趣。近来的研究表明,应用标准的压缩算法可以去除基因数据中90%的冗余信息(例如应用bitperfect算法),参见Hisahiko Sato等的'DNA Data Compression in the Post Genome Era',《Genome Informatics》12(2001):512-14,网址为http://www.jsbi.org/journal/GIW01/GIW01P130.pdf。这样我们就能够无损地将人类的基因信息压缩至8000万字节(这意味着我们能够完美地重新构建8亿字节未经压缩的基因组)。现在来考虑那些不用于蛋白质编码的98%的基因组。即便使用标准的压缩算法(使用字典的方法减少基因的冗余),不能编码的DNA经压缩后,其数据量将变得很低,这意味着我们可以使用一种算法通过较少的信息而达到相同的功能。由于我们正处于逆向工程基因组的早期阶段,所以不能坚定地认为在保证各项功能的同时减少基因中的数据量。所以我们现在使用3000万~1亿这一范围来表示基因组中信息的数据量。这一范围的上界表示只使用压缩算法而不是为简化算法。只有部分(尽管是大部分)信息用于构建大脑的设计。

事实上,所有的生物操作都是通过2比特的DNA碱基对的线性序列完成的,这些碱基对序列控制20种氨基酸的排列以生成蛋白质。分子通过离散的原子排布构成。碳原子在它的四个方向上都能与分子建立连接,故而非常适于创造多种三维结构,因此无论在生物中还是在技术中碳原子都非常重要。在原子内部,电子位于离散的能量层中;其他的原子内微粒(例如质子),则由不同数量的夸克组成。

尽管量子力学的公式在连续域和离散层都适用,但是我们知道连续层可以通过二进制数据2)另一个合理推断如下,尽管人类基因包含30亿碱基,但只有很小的一部分用于编码蛋白质。现在估计大概有2万6千个基因用于编码蛋白质。如果我们假设那些基因平均有3千个碱基对是有效数据,那么它们将等价于7800百万碱基。存储一个DNA碱基需要2bit,这意味着需要2000万字节空间存储所有的信息(7800万除以4)。在一个基因的蛋白质编码序列中,3个DNA碱基对中每个密码子翻译为一个氨基酸。所以共有43(64)种可能的密码子代码,每个均有3个DNA碱基对构成。但是其中只有20个使用了终止密码子(无效氨基酸)。剩余的密码子与21个有效密码子等效。而64中有效的组合需要6bit的存储空间,存储21种可能性需要4.4(log212)bit的信息,这样便节约了1.6bit的信息(约为27%),这样存储信息总量降为1500万字节。同时一些基于重复序列的标准压缩算法在这也是可用的,尽管用于蛋白质编码的DNA与垃圾DNA相比,其压缩量较小,但是数据总量仍能下降至1200万字节。但是我们需要加上可以控制基因表达的非编码DNA。虽然这部分DNA是由基因组构成的,但它的信息量较少,且拥有大量的信息冗余,估计同样需要1200万字节存储用于蛋白质编码的DNA,所以我们总共大约需要2400万字节存储表达人类基因。从这个视角来看,3千万~1亿字节的数据量的估计是比较高的。进行非常准确的描述。事实上,量子力学(从量子的字面意思去理解)是基于离散值的。

物理学家、数学家史蒂芬·沃尔夫勒姆提供了大量的证据证明,事物复杂度的逐渐增加来源于宇宙,宇宙是一个具有确定性的规则系统(该系统基于确定的规则并能够预测结果)。在他所著的《A New Kind of Science》一书中,沃尔夫勒姆综合地分析了一种称为“元胞自动机”的数学结构是如何描述自然界的方方面面的58.浮点数可以精确地表示连续的值。一个浮点数由两个比特序列构成。“指数”序列表示2的幂值,“基数”序列表示分数。增加基数序列中比特的数量,我们便可以增加准确性。。(元胞自动机是一种简单的计算机制,例如,它可以根据转化规则,依据临近细胞的颜色来改变每个细胞的颜色。)

在他看来,可以用元胞自动机去解释所有的信息过程,所以沃尔夫勒姆与信息相关的见地的若干关键问题有着密切的关系。沃尔夫勒姆还假设宇宙本身是一个巨大的具有元胞自动机特性的计算机。在他的假设中,显而易见的模拟现象(例如运动与时间)和物理学中的公式,都存在一种数字化的基础,我们可以根据一种简单的元胞自动机的转换,对物理学的理解进行建模。

其他一些人早先已经提出了这种可能性。理查德·费因曼从信息与物质和能量的关系方面思考这个问题。诺伯特·维纳在他1948年的《控制论》一书中曾经预言过一个根本性的变化:宇宙的基石不是能源,而是信息转换59.Stephen Wolfram的《A New Kind of Science》(Champaign,Ⅲ.:Wolfram Media,2002)。。关于“宇宙正在运行于一台数字计算机中”的假设可能是由在1967年康拉德·楚泽60.关于数字物理理论的早期工作也是由Frederick W.Kantor发表的,《Information Mechanics》(New York:John Wiley and Sons,1977)。Kantor的论文可以从以下链接找到:http://w3.execnet.com/kantor/pm00.htm(l997);http://w3.execnet.com/kantor/1b2p.htm(l989)和http://w3.execnet.com/kantor/ipoim.htm(l982).http://www.kx.com/listbox/k/msg05621.html.第一次提出来的。楚泽被公认为可编程计算机领域杰出的专家,从1935年到1941年间,他发明了可编程计算机。

另一个物理信息化理论的狂热支持者是爱德华·弗雷德金,他在20世纪80年代早期提出了一种“物理学新理论”,这一理论基于宇宙最终由软件组成这一思想。根据他的理论,现实不是由物质和能量组成的,而是由根据计算规则不断变化的比特数据构成的。

20世纪80年代,罗伯特·赖特援引弗雷德金的话:

“世上有三大哲学问题:什么是生命?什么是意识、思想和记忆?宇宙是如何运转的?……信息的观点涵盖了以上三者……我的意思是说复杂性的最基础层次应该是运行于物理空间的信息处理过程。在复杂性的更高层次,例如生命、DNA(生化机能),都是由数字化信息处理控制的。在另外一个层次上,思考的过程也是基本的信息处理……我可以在很多不同的领域找到支持该观点的证据……在我看来,这真是一种势不可挡的趋势。它像是我苦苦寻找的一只动物。我已经发现了它的足迹,发现了它的排泄物,发现了它咀嚼了一半的食物,发现了它的皮毛,还发现了很多其他关于它的踪迹。每个发现都符合一种动物的特征,但它却是一种未被前人发现的动物。人们会问:那个动物在哪里?我会回答,好吧,它就在那里,并且我知道它的各个方面。它不在我的身边,但是我就是知道它在那里……我所见到的是如此具有说服力,所以它不可能是我想象出来的东西61.Konrad Zuse的'Rechnender Raum',《Elektronische Datenverarbeitung》,1967。Konrad Zuse的由细胞组成的基于自动化的宇宙在2年后发表,《Rechnender Raum,Schriften zur Datenverarbeitung》(Braunschweig,Germany:Friedrich Vieweg&Sohn,1969)。英文翻译版:《Calculating Space》,MIT Technical Translation AZT-70-164-GEMIT,1970年2月。MIT Project MAC,Cambridge,MA 02139.PDF。。”

赖特就弗雷德金的数字化的物理学理论作了一些评论:

“弗雷德金提出了一种计算机程序的有趣特征,即它包括很多元胞自动机;查明这些元胞自动机将带来的后果是没有捷径的。事实上,基于传统数学的分析方法(包括不同的方程)与基于算法的计算方法有着根本的不同。你可以不用知道系统运行的中间过程,仅通过分析就能推算出这个系统未来的状态,但是这种方法对于元胞自动机却是失效的,你必须洞察整个发展轨迹,才能最终发现系统的最终状态:如果它不显露出自己的状态,就无法预测其最终状态。弗雷德金解释道:‘对于一些问题,我们没有办法预测它们的答案’。……弗雷德金相信宇宙是一个规则化的计算机,它正在被一些人或事物利用去解决一个问题。这听起来像是一个好消息和坏消息的笑话:好消息是我们的生活有了意义;坏消息是这个意义帮助远方的黑客将Pi的估算值精确到小数点后9位62.Edward Fredkin引自Robert Wright的'Did the Universe Just Happen?'《Atlantic Monthly》,1988年4月,网址为http://digitalphysics.org/Publications/Wri88a/html。。”

弗雷德金继续说明他的理论:尽管信息的存储和恢复需要消耗能量,但是我们能够任意减少在信息处理方面的能量消耗,并且这个极限没有下界63.同上。。这表明信息比物质和能量更适合作为现实世界的基础64.Fredkin的很多结果源于他对计算模型的研究,这些模型明确地表达了物理学的基本原则。参见Edward Fredkin和Tommaso Toffoli的经典文章:'Conservative Logic',《International Journal of Theoretical Physics》21.3-4(l982):219-53,网址为http://www.digitalphilosophy.org/download_documents/ConservativeLogic.pdf。与Fredkin的文章相似的内容还可以在Norman Margolus中找到,如'Physics and Computation,'Ph.D.thesis,MIT/LCS/TR-415,MIT Laboratory for Computer Science,1988。。在第3章,我将重新审视弗雷德金的这个理论,即信息处理所需的能量的减少将没有下限,因为它属于宇宙智能的终极力量。

沃尔夫勒姆将他的理论建立在了一个单一且统一的观点上。让沃尔夫勒姆感到兴奋的发现,是一个被称为元胞自动机110规则的简单规则及其行为。(还有一些其他有趣的自动机规则,不过110规则已经可以很好地说明这个问题了。)沃尔夫勒姆的大部分分析都是关于最简单的元胞自动机的,尤其是那些一维线性细胞,它们的颜色只有两种(黑色和白色),并且规则是基于与一个细胞直接相邻的两个细胞。每次一个细胞颜色的转变只依赖于它以前的颜色和它左右两边的细胞。因此,它一共有8种可能的信息输入情况(两种颜色的3种不同组合)。而规则控制着这8种不同的输入,最终得出一种颜色输出(黑色或者白色)。因此有28(256)种可能的规则适用于这样一个一维、两色、临近细胞的自动机。因为左右对称,256种规则中的128种与另外128种一一对应。又由于黑白的等价性,我们又能将其中的一半与另一半相对应,如此便只剩下64种规则。沃尔夫勒姆用图2-31说明了二维模式自动机的运转,在二维模式中,沿着y轴方向的每条线都代表下一代应用于线上每个细胞的规则。

大部分规则正在衰退,这意味着它们只能创造出没有意义的重复模式,例如单色细胞,或者棋盘上那种交错重复的色彩样式。沃尔夫勒姆把这些规则称为第一类自动机。另一些规则可以产生任意间隔的稳定条纹,他把这些规则称作第二类自动机。第三类自动机则更具研究意义,因为在这些规则中,可识别的特征(如三角形)以一种本质随机序列出现于作为结果的模式中。

然而,第四类自动机才令沃尔夫勒姆恍然大悟,并促使他投入十年的时间研究这一领域。110规则是第四类自动机的一个典范实例,该规则能够演绎出令人称奇的复杂模式,并且模式间并不重复。我们可以从模式中看到人工制品,例如各种不同角度的线条、三角形的聚合以及其他有趣的结构。但是这些结果模式既不是有规律的,也不是完全随机的;它看起来存在规律却又不能预知(见图2-31)。

图 2-31

为什么该规则如此的重要而有趣呢?请记住,我们先从一个最简单的起始点——黑色的单细胞来开始。该过程重复地应用了一种非常简单的规则65.在我于1990年创作的《The Age of Intelligent Machines》一书中,我讨论了Norbert Wiener和Ed Fredkin关于信息作为构建物理和其他现实层面内容的基础。通过计算变换的方式表达所有的物理现象的复杂度被认为是一个巨大的挑战,但是Fredkin持续地投入努力。在过去的10年间Wolfram在该领域做出了巨大的努力,但是交流仅限于物理界同样对该主题感兴趣的同仁。Wofram阐述了他的目标“并不是一个特殊的终极物理模型”,而是他对“物理的注释”(本质上说是一个极为重要的挑战),Wolfram描述“这样一个模型将会有他所相信的特征”(《A New Kind of Science》,网址为http://www.wolframscience.com/nksonline/page-1043c-text)。在《The Age of Intelligent Machines》一书中,我讨论过“现实的终极本质是模拟还是数字的问题”,并指出“随着我们对于自然过程和智能过程探究的深入,我们将会发现这一过程的本质通常是模拟信息和数字信息交替的过程”。为了说明该问题,我将讨论声音。在我们的大脑中,音乐可以用耳蜗中数字化的录制神经元来表示不同的频段。在空气和线路中,它又是一种模拟现象。声音在压缩的磁盘中以数字的形式表达,并通过数字电路解码。但是数字电路由带有阈值的晶体管组成,它们又是模拟的扬声器。作为扬声器,晶体管可以操作独立的电子,所以它们又可以被数字化地计算,在更深的层次上,电子从属于模拟的量子场。在更深层次上,Fredkin和Wolfram为这些联系方程提供了理论化的数字(计算的)基础。值得注意的是,一些人在建立物理的数字化理论方面取得了成功,我们将通过实现计算和细胞自动机的链接的方法来检验更深层的机制。也许那些使宇宙正常运行的细胞自动机是更基础的模拟现象,例如晶体管从属于一个阈值,使其完成数字化的操作。这样为物理建立数字化的基础将不会引起哲学上的争论,如现实的终极形态是数字的还是模拟的。尽管如此,建立一个可行的计算模型仍然是一个非凡的成就。那么这种事情发生的可能性有多大?我们可以轻易地建立一种已存在的证据以表明物理的数字化模型是可行的,因此连续方程经常被表达为离散值和离散变换的准确程度。毕竟这是计算的基础性原理。但是连续方程具有根本的复杂性,它将违反爱因斯坦关于事物的声明“尽可能简单,而不是简单一些”。现实的问题是,我们能否通过使用细胞自动机算法,以更精深的方法来表达基础关系。测试物理学的一种新理论在于是否有能力验证它的预测。需要至少有一种非常重要的方法来验证,这对于以细胞自动机为基础的理论极为重要,因为可预测性的降低是细胞自动机的一个基础性的特征。Wolfram将宇宙描述为一个巨大的网络节点。这些节点并不存在于“空间”中,而是存在于我们能够感知的另外一种空间,该空间是由贯穿网络节点的现象迁移创造的。人可以轻易地通过想象构建为任意所需粒度建立三维网络的方法,以构建用于表达“朴素”物理现象的网络。像“粒子”和“波”这样可以穿越空间的现象被“细胞滑翔”所表示,这是每个计算周期网络中的先进模式。“生活”(基于细胞自动机)游戏的爱好者将识别普通的滑翔机现象和多样性的模式,该模式可以平稳地穿越细胞自动机网络。光速是天文计算机的时钟速度,因为滑翔使得每个计算周期推进一个细胞。爱因斯坦的广义相对论将重力描述为空间本身的扰动,好像我们所处的三维世界是无法看到的四维空间的一种弯曲,它明确地代表着一种模式。我们可以想象四维网络代表着明显的空间弯曲,同样它也代表着三维空间的弯曲。网络在一些区域是密集的,这代表了时空弯曲的等价物。细胞自动机的概念解释熵(无序度)的增加是有效的(熵的概念蕴含于热力学第二定律中)。我们假设构建宇宙的细胞自动机规则是第四个规则(见正文)——另外宇宙事实上是一个没有活力的地方。Wolfram主要的观察结果是第四类细胞自动机的快速生产具有很显然的随机性(尽管它具有确定的过程),我们可以通过布朗运动观察到这种随机性,并且其蕴涵于第二定律中。狭义相对论更难理解。牛顿模型可以与细胞网络简单对应。但是牛顿模型不适用于狭义相对论。在牛顿世界中,如果一辆火车以80km/h的速度行驶,在并行的轨道上你驾驶的汽车以60km/h的速度行驶,那么火车将以20km/h远离你。但是在狭义相对论的世界中,如果你以3/4的光速离开地球,对于你来说,光似乎仍以全光速远离你。根据这种看似矛盾的观点,对于两个观察者来说,物体的尺寸和运行的主观时间都依赖于相对速度。这样空间与节点的明确对应将更加复杂。本质上每个观察者都需要它自己的网络。但在狭义相对论中,我们可以从本质上应用相同的变换:从“牛顿”网络到牛顿空间。但是很明显,在狭义相对论中应用这种方法已经无法达到更加简化的结果。细胞节点所代表的现实有利于理解量子力学中的一些现象。它可以解释量子现象中明显的随机性。例如粒子-反粒子对的突然的随机出现。我们可以在第四类细胞自动机中发现相同类型的随机。尽管是预先确定的,但是第四类细胞自动机是无法预测的(不同于运行细胞自动机),也是随机的。这并不是一种新的观点。它等价于量子力学公式中的“隐藏变量”,这说明了存在一些变量我们是不能访问的,而这些变量控制了我们所观测到的随机行为。量子力学中隐藏变量的概念与量子力学公式相矛盾。这一概念并不被量子物理学家所接受,因为这需要使用一种特殊的方法并进行大量的假设才能将其论证清楚。但这并不能作为反对这一概念的论据。宇宙的存在本身就需要通过一种非常精确的方式提出很多假设。但是我们正处在这个宇宙中。一个重要的问题是如何验证隐藏变量理论?如果基于细胞自动机类似的过程,隐藏的变量将是确定的,但也是不可预知的。我们需要找到一些其他方法来揭示这些隐藏变量。Wolfram的宇宙网络概念提供了一个潜在的观点以说明量子纠缠和波动函数衰竭现象。其中波动函数衰竭可以追溯粒子模糊不清的属性(如位置),可以从细胞网络的角度来解释现象与观察者之间的交互。作为观察者,我们生存于网络之中。我们从细胞力学中得知两个交互的实体之间不能发生改变,这便是波动函数衰竭的基础。Wolfram写道:“如果宇宙是一个网络,即便从空间上来说粒子之间距离很远,但彼此仍然被连接在一起。”这解释了近来关于非区域性行为的实验,非区域性行为涉及两个彼此相距很远的“量子纠缠”粒子。爱因斯坦称之为“超距作用”并否认了这个概念,但是近来的实验表明了这个概念的正确性。一些现象更适于用细胞自动机网络来解释。一些建议看起来是很有说服力的,但是Wolfram已经清晰地陈述了,事实上若将物理转变为连续的细胞自动机的系统是难以完成的。Wolfram在哲学方面拓展了他的讨论,他“解释”了以自由的现象作为决策是明确的,但又是无法预测的。如果不通过实际的操作过程,将没有办法预测细胞过程的结果,由于没有模拟器能够比宇宙本身运行得更快,所以也就没有办法预测人类的决策。所以即便我们的决策预先确定,但是仍然无法事先预知结果。尽管如此,这仍没有充分地阐明这个概念。就可预测性降低而言,这一观察可以作为大多数物理过程的结果——例如尘埃落地。因此该观点等价于人类关于随机落下的尘埃的自由意愿。当Wolfram声明人脑中处理过程“计算等价”于其他的过程(如流体动荡)时,他的这一观点便形成了。自然界中的一些现象(例如云、海岸线)以重复简单过程为特征,如细胞自动机和分形,但是智能的模式(如人脑)需要进化过程(或者逆向工程这一过程的结果)。智能是一种启发式进化的结果,在我看来,世界上最强大的力量终将超越自然的力量。总之,Wolfram宏伟的论述向人们描述了一幅极具吸引力而又被高估的不完整的画面。Wolfram加入了一个成长中的社区,该社区用于保存信息的模式,而非物质和能量,并认为信息是构建现实的基础。Wolfram增加了以下知识,即信息模式如何创造我们所经历的世界。我希望与Wolfram及其同事共同工作一段时间,使得我们能够为世界构建一个更稳固、更具普适性的视角。第四类细胞自动机的低预测性构成了一些生物系统复杂性的基础,同时代表了一种重要的生物范式(该范式可通过技术模拟)。它无法解释生物,但却仍然可以解释所有物理现象。如果Wolfram或其他人能够成功地以细胞自动机操作及其模式为方法来表达物理世界,那么Wolfram的这本书将实至名归。无论如何,我坚信本书是有关本体论的非常重要的一本书。66.规则110声明在如下提案件中细胞的颜色是白色的:1)该细胞先前的颜色是白色并且邻居细胞是全黑或全白的;2)该细胞先前的颜色是白色并且其邻居细胞一个是白色的一个是黑色的;其他情况下,细胞的颜色都是黑色的。。在这个重复而且确定的过程中,行为是重复且可预测的。这样会产生两种意想不到的结果。结果好像是随机的,但并不是纯随机的;纯随机本身是非常枯燥的。设计产生的过程中有一些可识别的、有意义的特征,所以这种模式具有一定的秩序和明显的智能。沃尔夫勒姆列举了一系列的图形实例,其中很多图形让人百看不厌。

沃尔夫勒姆重复阐述了他的观点:“以前总是认为构成一个复杂现象的基础机制本身必然是复杂的。但是我发现简单的程序同样可以产生巨大的复杂性,所以我原来的观点是错误的。67.Wolfram,《New Kind of Science》,第4页,网址为http://www.wolframscience.com/nksonline/page-4-text。

我确实发现110规则的行为如此令人着迷。此外,一个非常重要的事实是完全确定的过程能产生出完全不可预测的结果,因为它解释了,虽然这个世界以确定的规则为基础,但本质上这个世界是不可预知的68.请注意,量子力学的一些解释隐含地说明了世界并不基于明确的规则,并且对于内在的量子范畴的每一次交互都存在着一种内在的量子随机性。。然而,我一点都不奇怪为什么如此简单的一个起点经过确定的、简单的过程,能够产生不可预测的复杂结果。这些现象源于分形、混沌、复杂性理论和自组织系统(例如神经网络和马尔科夫模型),自组织系统从简单网络开始,最终将产生明显的智能行为。

在另一个层面,我们用大脑的例子来说明这个问题:初始大脑有压缩基因组中的3千万至1亿字节的信息,但大脑的最终复杂程度是初始状态的10亿倍[2]

一个确定的过程会产生明显随机结果,这一事实不足为奇。我们已经有了的随机数产生器(例如程序设计里面的随机函数),它可以利用确定的过程产生随机序列(可通过概率测试)。这些程序可以追溯到计算机软件的最初时期,例如第1版Fortran。尽管如此,沃尔夫勒姆确实为这些观察提出了完备的理论基础。

沃尔夫勒姆继续介绍了简单计算机制如何存在于自然界的不同方面,他还向我们证明了,这些简单的确定性机制能够制造我们看过和经历过的复杂事物。他举了很多的例子,例如动物身上好看的色彩,贝壳的形状和标记以及涡流的模式(空中烟雾的运动轨迹)。他认为计算是必要的、无处不在的。根据沃尔夫勒姆的理论,简单计算机制的重复性的应用是世界复杂性的真正源头。

在我看来,沃尔夫勒姆的观点只是部分正确的。我同意我们的周围都是计算,也同意我们看到的一些模式是由元胞自动机的等价物创造的。但是这里我要问一个关键性的问题:自动机产生的结果究竟有多复杂。

沃尔夫勒姆有效地回避了复杂性程度这个问题。我同意像棋盘这种衰退的模式毫无复杂度的说法。沃尔夫勒姆也承认单纯的随机现象并不代表复杂度,因为在完全不能预测的情况下,纯随机将可以被预测到。如果第四类自动机有意义的特征是既不重复也不是纯随机的,这一论点为真,那么我也同意这类自动机产生的结果会比其他类自动机产生的结果复杂。

然而,第四类自动机产生的复杂度也有一个明确的极限。在沃尔夫勒姆的书里列举的许多图片都是看起来十分相似的,尽管它们并不重复,但它们的不同之处都很细微。而且,它们既没有继续衍生出新的复杂度,也没有发展出新的特征类型。元胞自动机即便迭代无数次,其产生的图形的复杂度仍然保持与原来相同的水平。它们无法进化出昆虫、人类、肖邦序曲,也无法进化出比条纹或图中混杂在一起的三角形更加复杂的东西。

复杂度是一个连续统一体。这里我把“秩序”定义为“适合某种意义的信息”70.参见《The Age of Spiritual Machines:When Computers Exceed Human Intelligence》(New York:Viking,1999),第30~33页,该书的'Disdisorder'和'The Law of Increasing Entropy Versus the Growth of Order'内容中有详细讨论。。一个完全可预测的过程的秩序为0。单纯高层次的信息并不代表一定含有高层次的秩序。一本电话簿虽然有很多信息,但是这些信息秩序的层次很低。一个随机序列本质上是纯粹的信息,因为随机序列不可预测,但是它却没有秩序可言。第四类自动机的产物确实具有一定水平的秩序,与其他持久的模式相同,有其适用的场合。但是代表人类模式的秩序和复杂度都远远高于第四类自动机的产物。

人类需要完成高层次的需求:他们生存在一个充满挑战的生态中。人类世界中存在着极度复杂而又非常精妙的等级制度。沃尔夫勒姆认为任何混合了可认知的特征和不可预测元素的模式实际上都是等价的。但是他没有说明第四类自动机是如何增加它的复杂度的,更不用说像人一样复杂的模式。

这里缺失了重要的一环,即解释从元胞自动机的常规模式如何发展到具有较高层次智能的复杂的持续性结构。例如,第四类自动机不能解决有意义的问题,并且不论迭代多少次也无法接近问题的答案。沃尔夫勒姆把110规则当做是“宇宙计算机”71.通用计算机可以接受来自其他计算的输入,并模拟其他计算。模拟的速度会比较慢。来使用。然而,即使是宇宙计算机本身也必须利用软件来运行智能的程序。运行在宇宙计算机上的软件的复杂程度也是一个问题。

可能有人会指出第四类自动机的模式是由最简单的自动机(一维、两种颜色、两个相邻的规则)发展而来的。但如果我们增加维度会发生些什么呢,例如增加多重颜色,或者通过综合离散的元胞自动机产生连续的功能?沃尔夫勒姆极其认真地解释了这些问题:复杂自动机产生的结果与简单自动机产的结果本质上是一致的;我们最终通过非常有限的模式获得一定程度的意义。沃尔夫勒姆认为我们不需要用更复杂的规则去获得复杂的结果。但是我的观点与之相反,我们不能通过简单的规则或者进一步迭代的方法来增加结果的复杂度。所以元胞自动机只能有限地推动我们向前。

我们能通过简单的规则解决人工智能难题吗?

我们如何通过这些有趣的但受限的模式去获得那些复杂的事物(例如昆虫、肖邦的乐曲)呢?我们考虑的概念是与沃尔夫勒姆提出的元胞自动相冲突的——这就是进化,或者说一种进化算法,我们开始获得更令人激动、更智能的结果。沃尔夫勒姆称第四类自动机和进化算法“在计算上是等价”的,但是我认为这一命题只在硬件层次上是成立的。在软件层次上产生的模式是非常不一样的,而且复杂度和有用性的秩序也是不同的。

一个进化算法初始于随机的生成解决某种问题的方法,这个算法通过数字化的遗传密码进行解码。然后,在模拟的进化中我们令不同的进化算法之间相互竞争,较好的解决方案将会保留下来,并通过模拟有性繁殖的方式进行复制。在有性繁殖中,被创建的后代解决方案聚合了父母双方的遗传密码(编码解决方案)。我们也会引入一定比例的基因突变,这一过程中包含各种各样的高层次参数,如突变率、繁殖率等。这些参数都被形象地称作“上帝的参数”,设计进化算法的工程师的工作就是将参数设置为最优值。这一过程将在模拟的进化中运行数千代,该过程最后得到的解决方案的秩序,将明显地高于过程初始的解决方案。

进化(有时称作遗传)算法的结果将为复杂问题提供优雅、美丽并且智能的解决方法。我们已经开始利用进化算法进行艺术创作、设计人工生命模式,还用来完成一系列的实际任务,如设计喷气式飞机的引擎。基因算法属于狭义的人工智能方法——创造能够执行具体任务的系统也需要应用人类智能。

但是有些问题还是没有解决。尽管遗传算法对于解决某些特定问题是有效的工具,但是它们还是无法达到强人工智能的水平——强人工智能具有人类智能的特征:广博、深邃、精妙,在模式识别和指令语言方面具有超凡的能力。难道是我们运行遗传算法的时间长度不够吗?毕竟人类进化经历了数10亿年的时间。或许我们不能仅仅利用几天或者几周的时间来用计算机模拟这个进化过程。但事实上,即便用很久的时间去模拟这个过程也是行不通的,因为应用传统的遗传算法只能接近其性能的渐近线。

第三个层次(该层次能够以超出元胞自动机的处理能力生产明显的随机性,也能够以超出基因算法的能力生产聚焦的智能解决方案)在多个层面执行进化。传统的遗传算法只允许算法限制于解决一类很窄的问题上,并且遗传的方式也是单一的。遗传密码本身需要进化;遗传规则也需要进化。例如,自然不会停留在一个简单的染色体上。在自然进化的过程中,有很多层次是间接包含的关系,并且我们需要为进化准备一个复杂的环境,只有在这样的环境中进化才会发生。

构建强人工智能使我们有机会缩短进化过程所需的时间,例如,逆向工程人类大脑(正在进行中的研究项目)已经使进化过程获益。我们将在这些解决方案中应用进化算法,这与大脑解决问题的方式一样。例如,婴儿在子宫里的时候,其供养线路最初随机分布于染色体组的一些区域。最近的研究表明,这些基因区域与学习适应变化的能力相关,然而在婴儿降生后,这些功能的相关结构很少发生变化72.C.Geoffrey Woods的'Crossing the Midline',Science 304.5676(2004年6月4日):1455-56;Stephen Matthews的'Early Programming of the Hypothalamo-Pituitary-Adrenal Axis',Trends in Endocrinology and Metabolism 13.9(2002年11月1日):373-80;Justin Crowley和Lawrence Katz的'Early Development of Ocular Dominance Columns',Science 290.5495(2000年11月17日):1321-24;Anna Penn等的'Competition in the Retinogenicu1ate Patterning Driven by Spontaneous Activity',Science 279.5359(1998年3月27日):2108-12。

沃尔夫勒姆证明了一个有效的观点,即一些(事实上是大部分)计算的过程是不能被预测的。换句话说,我们在没有经历完整个过程时不能预测未来的状态,我同意他这个观点,只有能以更快的速度模拟这个过程,我们才能够提前知道答案。由于假定宇宙以最快的速度运转,那么将不存在缩短这个过程的方法。但是我们已经受益于数十亿年的进化了,进化极大地增加了自然界复杂度的秩序。得益于此,现在我们可以利用进化后的工具去逆向模拟生物进化的结果(最重要的是模拟人的大脑)。

的确,自然界的一些现象,仅仅是由于元胞自动机简单的计算机制,才具有某种程度的复杂性。那个在“帐篷—橄榄”状贝壳上有趣的三角形模式(沃尔夫勒姆经常提起的例子)或者复杂多样的雪花形状都是很好的例子。但是我不认为这是一个新的观察结果,因为我们经常认为雪花的设计源自一种简单的分子计算机的构建过程。虽然沃尔夫勒姆给我们提供了很多具有说服力的理论,去表达这些过程和它们的结果模式,但是生物的内涵要远多于第四类自动机。

沃尔夫勒姆另一个重要的发现是,他认为计算是一个简单的而且无处不在的现象。当然,我们都知道在这一个多世纪里,计算本质上是非常简单的:我们能够以最简单的信息处理为基础,构建任意的复杂程度。

例如,查尔斯·巴贝奇在19世纪后期制作的机械计算机(无法运行),它只提供了少量的运行代码,但其基本原理与现代计算机在很多方面(存储容量和速度)是相同的。巴贝奇发明的复杂度源于设计的细节,不过事实证明,仅仅利用他所掌握的技术是无法解决这个问题的。

图灵机是阿兰·图灵在1950年提出的关于通用计算机的理论概念,它只提供7种非常基本的命令,但可以组织执行任何可能的计算73.图灵机有7个命令:1)读取磁带,2)向左移动磁带,3)向右移动磁带,4)在磁带上写0,5)在磁带上写1,6)跳转到另外的命令,7)停止。。一个“通用图灵机”可以模拟任何在磁带上描述过的可能图灵机,这是信息通用性和简洁性的进一步证明74.书中最令人印象深刻的分析是,Wolfram认为只有两种状态5种可能颜色的图灵机是一种通用的图灵机。而40年来我们认为通用图灵机远比上述的复杂。另一个让人印象深刻的是Wolfram证明了110规则可以通过合适的软件用于通用计算。当然,如果没有合适的软件,那么通用计算是无法执行任务的。。在《智能机器时代》一书中,我展示了任何一个计算机怎样由一个适当数量的简单的装置构建,即“或非门”75.“非”门将两个输入变为一个输出。只有当输入A和B都是非时,输入才为真。。这虽然不是通用图灵计算机的准确描述,但却表明了,只需要提供一个适当的软件(这些软件包含了或非门的连接描述信息),任何计算都能够运行于一系列非常简单的装置(比110规则简单)上76.请见The Age of Intelligent Machines的'A nor B:The Basis of Intelligence?'(Cambridge,Mass.:MIT Press,1990),网址为http://www.KurzweilAl.net/meme/frame.html?m=12。

尽管我们需要额外的概念去描述一个为解决问题提供智能方法的进化的过程,但是沃尔夫勒姆论证了计算的普适性和简单性,为我们理解世界上信息的根本重要性做出了重要贡献。

莫利2004:你已经得到正在加速进化的机器了,那人类怎样了呢?

雷:你指的是生物意义上的人吧?

莫利2004:是的。

查尔斯·达尔文:据推测生物的进化是一个持续不断的过程,不是吗?

雷:好吧,生物进化在一段时间里,进化的非常缓慢,很难去准确地测量。我指的是间接的进化。结果是较老的范式(如生物进化)正在以原来的速度继续,其发展远比不上新的范式。动物的进化和人的进化一样复杂,也是经历了数万年才产生了一些值得注意、却很小的改变。人类的整个文明和技术的进化史也经历了这段时间。但是我们现在已经准备就绪,在几十年内超越脆弱而缓慢的生物进化。当前发展的速度是生物进化速度的1000至100万倍。

内德·路德:如果不是所有人都赞同这一点将会怎样?

雷:我不期望他们都立刻同意。承认这个事实是需要一个过程的。技术或者进化都存在一个前沿和后沿。在现在这个时代,仍然有人使用犁去耕地,但是这也不能阻碍手机、电信、互联网和生物技术的广泛使用。尽管如此,后沿终究会赶上来的。例如,亚洲的一些国家就没有经历工业时代,直接从原来的农业经济跨越到了信息经济77.United Nations Economic and Social Commission for Asia and the Pacific,'Regional Road Map Towards an Information Society in Asia and the Pacific,'ST/ESCAP/2283,http://www.unescap.org/publications/detail.asp?id=771;Economic and Social Commission for Western Asia,'Regional Profile of the Information Society in Western Asia,'October 8,2003,http://www.escwa.org.lb/information/publications/ictd/docs/ictd-03-11-e.pdf;John Enger,'Asia in the Global Information Economy:The Rise of Region-States,The Role of Tele Communications,'International Conference on Satellite and Cable Television in Chinese and Asian Regions,communication Arts Research Institute,Fu Ien Catholic University,June 4-6,1996.

内德:可能你说的是对的,但是数字鸿沟会越来越大。

雷:我知道人们会这样说,但是这怎么可能会变为现实呢?人类数量现在增长得非常缓慢。但是无论你采用什么方式统计,被数字技术联系起来的人的数量都在快速增长。世界上越来越多的人口开始使用电话通信技术和无线网络技术,所以数字鸿沟是正在消亡,而不是正在增长。

莫利2004:我依然觉得有或没有这一问题没有得到充分的重视,还有很多地方我们应该去做。

雷:确实是这样,但是最重要的,非人力控制的加速回归定律正沿着一个正确的方向前进。试考虑一个特殊行业里的技术:从担负不起和进展不顺利开始;后来变得不那么昂贵,也取得了一定的进展;下一步是产品变得廉价并且进展得非常顺利;最终,技术几乎是免费的,而且产生了巨大的效益。

不久以前,当你在电影中看到有人在使用移动电话的时候,那个人一定是一个位高权重的家伙,因为只有这样的人才能支付得起移动电话的高昂费用。还有一个辛酸的例子,那就是治疗AIDS的药物。以前,刚开始研制的时候,研究情况简直糟透了,并且每年在每个病人身上花费的钱大于一万美金。不过现在情况有所好转了,并且在贫穷的国家价格每年也都会下降好几百美元78.参见'The 3 by 5 Initiative',Fact Sheet 274,2003年12月,网址为http://www.who.int/mediacentre/factsheets/2003/fs274/en/print.html。。遗憾的是,关于艾滋病的治疗药物的研究还不能说是非常成功,也不能说是非常廉价。虽然世界已经开始对艾滋病采取了一些行动,但是艾滋病已经造成了很大的伤害,特别是在非洲地区。前沿和后沿之间的时间正在缩小。我估计当前这个前沿与后沿间的时间在10年左右。在未来的10年,这个时间将缩小为5年。

奇点是一项经济命令

理智的人总在适应这个世界,不理智的人总是试图让世界适应自己,然而世界的进步总是取决于那些不理智的人。

——乔治·伯纳德·肖《革命者格言》人与超人,1903年

世人莫不怀着一种与生俱来的欲望,要把支出超过收入,此乃一切进步的动力。

——英国作家萨缪尔·巴特勒,《Notebooks》,1912年

如果让我今天启程去到西海岸完成一个新事业,那么我将会选择生物技术和纳米技术。

——杰夫·贝索斯,亚马逊的CEO和创立者

获得80万亿美元——在限定时间内有效

仅仅阅读并理解本节的内容就可以拿到80万亿美元,有关完整的细节见下文。(的确,作家都会做些事情引起您的关注,但关于本声明我是认真的,但是我要做进一步解释,即你要仔细地阅读本段的第一句话。)

加速回归定律基本上是一种经济理论。现代经济理论和政策都是以过时的模式为基础的,这个模型强调能源成本、商品价格,并把在厂房和设备方面的投资作为关键驱动因素;而在很大程度上忽略计算容量、内存、带宽、技术的规模、知识产权、知识和其他日益重要的(和日益增加)推动经济增长的成分。

一个竞争市场的经济需要是推动科技向前发展和为加速回归定律提供燃料的首要动力。反过来,加速回报定律正在转变经济关系。经济需求与生物进化中的幸存者都是等价的。我们一直在向智能化、小型化的机器推进,这是无数的小进步带来的结果,每次小进步都有自己独特地调整经济的方式。那些能更准确地执行任务的机器的价值就增加了,这就是它们被制造的原因。有成千上万的项目,正以各种不同的方式,在各个方面推进加速回归定律的发展。

且不论短期的商业周期,“高科技”对于商界的支持(尤其是软件对商界的支持)增长巨大。1974年,我建立了光学字符识别(OCR)和语音合成公司(库兹威尔电脑产品),那时高科技风险交易在美国的交易总额不到30亿美元(1974年的美元价值)。即便在最近的高科技衰退期间(2000年~2003年),这个数字也几乎是那时的100倍。79.1998年的风险投资(101亿美元)中,76%用于技术投资。(PricewaterhouseCoopers news release,'Venture Capital Investments Rise 24 Percent and Set Record at $ 14.7 Billion,PricewaterhouseCoopers Finds,'February 16,1999),1999年风险投资(320亿美元)的90%用于技术公司(PricewaterhouseCoopers news release,'Venture Funding Explosion Continues:Annual and Quarterly Investment Records Smashed,According to PricewaterhouseCoopers Money Tree National Survey,'February 14,2000)。在高科技衰退的那段时间,风险投资有所下降,但是在2003年的第二季度,仅软件公司便获得了近10亿美元的投资。1974年美国制造行业的42家公司总共获得2640万美元的风险投资(相当于1992年8100万美元)。参见Samuel Kortum和Josh Lerner的'Assessing the Contribution of Venture Capital to Innovation' RAND Journal of Economics 31.4(2000年冬季):674-92,网址为http://econ.bu.edu/kortum/rje_Winter00_Kortum.pdf。如Paul Gompers和Josh Lerner所述,“风险投资从20世纪70年代开始迅速增加”Gompers和Lerner的The Venture Capital Cycle,(Cambridge,Mass.:MIT Press,1999)。请见Paul Gompers的'Venture Capital',Handbook of Corporate Finance:Empirical Corporate Finance,网址为http://mba.tuck.dartmouth.edu/pages/faculty/espen.eckbo/PDFs/Handbookpdf/CH11-VentureCapital.pdf。只有废除资本主义和经济竞争的所有环节才能阻止这一进展。

需重点指出的是,我们正在以指数级的速度向新的知识型经济迈进,而不是渐进的80.关于“新经济”技术源于对“旧经济”工业改造的说明请见Jonathan Rauch的'The New Old Economy:Oil,computers,and the Reinvention of the Earth',Atlantic Monthly,2001年1月3日。。当所谓的新经济并没有在一夜之间改变业务模型的时候,许多观察家很快就摒弃了本身就有缺陷的想法。知识统领经济还将需要几十年的时间,但那必然是一场深刻地变革。

我们在互联网和电信的繁荣与萧条交替循环中看到了相同的现象。以互联网和分布式电子通信为代表的根本性变革,促进了经济的繁荣。但是,当这些变革发生在现实的时间范围中时,超过两万亿美元的市场资本化为乌有。正如我下面所指出的,技术的实际进步与表面的繁荣或者萧条无关。

事实上,那些在经济学的课程上讲授的、用于美国联邦储备使用委员会设立的货币政策和政府机构制定经济政策、用于各种各样的经济预测的经济模型,从长期趋势来看都存在根本性的缺陷。这是因为它们是基于历史的“直观的线性”观点(假设改革的步伐将继续以目前的速率),而不是基于指数的历史观点。这些线性模型似乎在一段时间内有效的原因,与大多数人在开始的时候采用线性视角看待问题的原因相同:如果审视和经历一段简短的时期,指数增长趋势看起来与线性增长趋势相似,尤其是在指数增长早期。但是一旦达到增长曲线的转折点,指数增长将爆发,而线性模型将不起作用。

在我编写本书时,国家正在讨论改变社会保障的计划,这项计划将于2042年失效,那也是我预测的奇点到来的时间(见第3章)。这种经济政策审查通常需要很长时间。这些基于线性模型的关于寿命提高和经济增长的预测是非常错误的:一方面,寿命的延长会远远超过政府的预期;另一方面,那时人们在65岁时不会要求退休,因为他们有30岁的身体和大脑。最重要的是,GNR技术将使得经济的增长速度远超过现在预测的每年1.7%的增长速度。(以过去15年的经验来看,这一速度至少被低估了一半。)

以生产力增长为基础的指数增长正好处于爆发阶段的开端。美国通过技术提高生产力,其实际的国内生产总值已经以指数的速度在增长,如图2-32所示。81.U.S.Department of Commerce,Bureau of Economic Analysis(http://www.bea.doc.gov),请见以下网站,Table 1.1.6:http://www.bea.doc.gov/bealdn/nipaweb/SelectTable.asp?Selected=N。

图 2-32

一些评论家把GDP增长归因为人口的增长,但通过人均的方法我们也能看到相同的趋势(见图2-33)。82.U.S.Department of Commerce,Bureau of Economic Analysis,http://www.bea.doc.gov.1920-1999 data from:Population Estimates Program,Population Division,U.S.Census Bureau,'Historical National Population Estimates:July 1,1900 to July I,1999,'http://www.census.gov/popest/archivesl1990s/popdockest.txt;2000-2004 data from http://www.census.gov/popest/states/tables/NST-EST2004-01.pdf.

图 2-33

请注意,经济潜在的指数增长力量要远远强于经济周期性衰退。最重要的是,经济衰退(包括萧条)只是表示暂时地偏离基本曲线。甚至“大萧条”也只是根本模式增长大背景下的一个小插曲。在所有情况下,经济都将准确地在那些从未发生过衰退(或萧条)的地方终结。

世界经济在继续加快发展。2004年底世界银行公布的一份报告表明,2004年是历史上最繁荣的一年,全球经济以4%的速度增长83.'The Global Economy:From Recovery to Expansion,'Results from Global Economic Prospects 2005:Trade,Regionalism and Prosperity(World Bank,2004),http://globaloutlook.worldbank.org/globaloutlook/outside/globalgrowth.aspx;'World Bank:2004 Economic Growth Lifts Millions from Poverty,'Voice of America News,http://www.voanews.com/english/2004-11-17-voa41.cfrn.。此外,发展中国家的增长速度最高:超过6%。即使忽略中国与印度,发展中国的增长率也超过5%。东亚和太平洋地区,极端贫困人口从1990年的4.70亿下降到2001年的2.7亿,世界银行预计,2015前后,这一数字将低于2000万。其他地区的经济增长虽然不像发展中国家那么迅猛,但也以极快的速度增长。

生产率(每个工作者的经济产出)同样以指数级速度增长。这些统计数字是非常保守的,因为他们没有充分地反映产品在质量和功能方面的明显改进。“汽车还是汽车”是不符合事实的,事实上在汽车的安全性、可靠性和功能等方面,都有了巨大提升。当然,今天1000美元所造就的计算能力比10年前1000美元造就的计算能力要强大得多(超过1000倍)。还有许多其他的例子,药品的疗效越来越好,因为现在药品可以准确地修正疾病和老化的新陈代谢途径,同时最大限度地降低副作用(请注意,现在市场上大部分药品仍然反映的是旧的范式,第5章将论证这部分内容)。我们花5分钟在网上订购并收到送货上门的产品,其价值要高于我们自己亲自去购买的商品。量身定做的衣服的价值也要高于你在产品货架上找到的衣物。这种类型的改进发生在绝大多数产品中,但生产力的统计却无法反映这些改进。

使用生产力测量的统计方法,我们可以得出这样的结论:我们花1美元只会得到1美元的产品和服务。尽管事实上我们得到的更多(计算机是这个现象中很极端的例子,但它也是很普遍存在的)。据芝加哥大学皮特·科莱诺教授和美国罗切斯特大学的马克·比尔教授估测,随着技术的发展,现有货物的不变价值在过去的20年间以每年1.5%的速度增长84.Mark Bils and Peter Klenow,'The Acceleration in Variety Growth,'American Economic Review 91.2(May 2001):274-80,http://www.klenow.com/Acceleration.pdf.。但这仍然不能解释不断涌现的全新产品和产品类别(如手机、传呼机、掌上电脑、下载的歌曲和软件程序)。它也无法说明互联网迅猛增长的价值。很多免费资源包括在线百科全书、搜索引擎,都是获取人类知识的有效方法。我们将如何评估免费资源在可用性方面的价值呢?

美国劳动统计局(负责统计通货膨胀的机构)采用一种模型预测,产品质量以每年0.5%的速度增长85.请见注释84、86和87。。如果我们采用利莱诺和比尔的保守预测方法,它所反映都是对质量改进的低估,以及对通货膨胀的高估(至少高估了1个百分点),而且该模型无法解释新出现的产品类型。

尽管生产率统计方法存在很多缺陷,但是生产力现在实际上已经达到了指数增长曲线中陡峭的那部分。在1994年之前,劳动生产率以每年1.6%的速度增长,然后提高到每年2.4%,而现在的发展速度更加惊人。从1995年至1999年,制造业每小时产出量以每年4.4%的速度增长,耐用消费品的产量以每年6%的速度增长。而在2004年第一季度,经季节性调整后,商业方面产量的年增长速度为4.6%,而耐用消费品的年增长速度是5.9%86.U.S.Department of Labor,Bureau of Labor Statistics,2004年6月3日的新闻报道。可以从以下连接获得该报道:http://www.bls.gov/bls/productivity.htm。

审视上半个世纪单位小时劳动所创造价值的变化趋势,我们可以看到平稳的指数增长趋势(参见图2-34)。同样,这种趋势并没有说明信息技术(整体的性价比以每年翻一番的速度增长)87.Bureau of Labor Statistics,Major Sector Multifactor Productivity Index,Manufacturing Sector:Output per Hour All Persons(1996=100),http://data.bls.gov/PDQ/outside.jsp?survey=mp(Requires JavaScript:select'Manufacturing,''Output Per Hour All Persons,'and starting year 1949),or http://data.bls.gov/cgibin/srgate(use series 'MPU300001,''AllYears,'and Format 2).中每美元的价值已经被大大提升了。

图 2-34

通货紧缩——坏事吗

“直到1846年,我们国家仍然没有一件衣服是由缝制机器制造的;在那一年,第一台享有专利的缝纫机诞生。如今,成千上万的人穿着由机器缝制的衣服,每件都足以与克什米尔少女的衣服相媲美。”

——《Scientific American》,1853年

在我写这本书时,很多经济学家除考虑政治因素外,最担心的事情就要数通货紧缩了。从表面看来,将钱进一步投资似乎是一件好事。经济学家担心的是,如果消费者花更少的钱就可以买到他所需要的东西,经济就会紧缩(以美元来衡量)了。不过,这忽视了消费者永远无法满足的需求和欲望。半导体产业的收入每年“遭受”着40%~50%的通货紧缩,然而,事实上,在过去的半个世纪,它却以每年17%的速度增长88.George M.Scalise,Semiconductor Industry Association,in'Luncheon Address:The Industry Perspective on Semiconductors,'2004 Productivity and Cyclicality in Semiconductors:Trends,Implications,and Questions-Report of a Symposium(2004)(National Academies Press,2004),p.40,http://www.nap.edu/openbook/0309092744/html/index.html.。既然事实上经济正在快速扩张,这种通货紧缩的理论就不应该引起大家的担心。

20世纪90年代和21世纪初,我们已经见证了历史上最强大的通货紧缩,这解释了为什么我们现在没有注意到通货膨胀的速度。是的,历史性的低失业率、高资产价值、经济增长,还有通货膨胀等其他因素,这些都是事实。然而这些因素完全可以被信息技术(计算、存储、通信、生物技术、小型化技术)性价比的指数增长和科技进步的整体速度抵消。这些技术深刻地影响着所有行业,我们正在经历着大规模的“脱媒现象”,分布渠道构建于互联网和其他通信技术之上,运行和管理的效率也随之大幅提高。

随着信息产业对经济产生的影响越来越大,我们看到IT产业惊人的通货紧缩率产生的影响日益深远。20世纪30年代的大萧条主要归咎于消费者信心的崩溃和资金供应的瓦解;今天的通货膨胀是完全不同的现象,它是由生产力的迅速发展和信息技术的日益普及导致的。

本章所有的技术趋势图都显示了大规模的通货紧缩。受到这种效应影响的事例有很多,BP Amoco公司2000年寻找石油的每桶成本不到1美元,比1991年的花费少将近10美元。银行应用计算机处理一笔交易的费用只有1美分,而先前使用一名出纳员的成本则高于1美元。

需要着重指出的是,纳米技术的主要内涵是,它给硬件(或者说实际的产品)赋予了软件的经济价值。而软件价格通货紧缩的速度要快于硬件(见表2-3)。

表2-3 软件性价比的指数增长89.数据来自Kurzweil Applied Intelligence,现在是ScanSoft(formerly Kurzweil Computer Products)的子公司。

在这个商业世界中,我们可以非常强烈地感受到分布式智能通信的影响。20世纪90年代繁荣一时的电子化公司创造了巨大的价值,同时也造成了当时华尔街的动荡,这反映出一种有价值的观念:已经持续了几十年的商业模式,已经处于激烈变革的早期阶段。新模型以用户的个人通信为基础,它将改变每一种产业,并最终导致中间层,中间层是指将用户与产品和服务的最终来源相分离的层面巨大的“脱媒现象”。然而,所有的革命都有节奏,这一领域的投资与股市价值的扩大,已经超出了经济S形曲线增长的早期阶段。

信息技术的繁荣衰退周期严格来说是一种资本市场(股票价值)的现象。实际的B2B与B2C的统计数据表明,它们的发展趋势既不算繁荣也不是衰退(参见图2-35)。事实上B2C业务收入呈平稳增长的趋势:从1997年的18亿美元增长到2002年的700亿美元。B2B业务也类似:从1999年的560亿美元平稳增长到2002年的4820亿美元90.eMarketer,'E-Business in 2003:How the Internet Is Transforming Companies,Industries,and the Economya Review in Numbers,'February 2003;'US B2C E-Commerce to Top $90 Billion in 2003,'April 30,2003,http://www.emarketer.com/Article.aspx?1002207;and 'Worldwide B2B E-Commerce to Surpass $1 Trillion By Years End,'March 19,2003,http://www.emarketer.com/Article.aspx?1002125.,而到2004年这个数字已经接近1万亿美元。正如前面讨论的,我们没有看到在基础性技术的性价比方面,有关商业循环的任何证据。

图 2-35

拓展接近知识的机会也可以改变力量的关系。病人更愿意找那些熟悉他们身体状况和医疗条件的医生看病。消费者可以通过使用自动软件代理工具,迅速地找到功能和价格都最合适的产品(包括从烤箱、汽车、房子到银行理财、购买保险等一切产品)。网络服务(如eBay)以一种前所未有的方式,迅速建立了买者与卖者之间的联系。

消费者的愿望和需求(有时甚至连他们自己都不是很清楚)在商业关系中,正迅速地成为一种驱动力。例如,一个与服装卖家已经建立起良好关系的老顾客,已经不能满足于恰巧碰到悬挂在店里的适合自己的衣服。更进一步地,他们会将多种样式的衣服添加于他们身体的三维图像(基于详细的身体扫描技术)上,进而选择适合他们的材质与款式,最后根据选择量身定制衣服。

由于电子技术的强大支持,目前电子商务的缺点(例如,与产品直接交互的能力限制,以及用户难于学会使用菜单和表格进行交互)将逐步减少。在这个十年的后期,计算机就会作为截然不同的物理对象消失,显示器将为构建于我们的视野中的电子纺织品提供全浸式的可视化虚拟现实。因此,“去一个网站”将意味着进入一个虚拟现实环境(至少在视觉和听觉上是这样),在这个虚拟环境中,我们可以与产品和人员进行直接的交互,这种交互融合了真实与虚拟。虽然模拟的人达不到人类的水准(至少2009年无法达到),但它们作为销售代理、预约文员、研究助理是可以达到满意效果的。触觉接口使我们能够触摸到模拟的产品和人。很难说,即将到来的有着丰富交互界面的虚拟世界或许可能完全胜过现在的实实在在的世界。

虚拟现实的发展将对房地产行业产生重大影响。渐渐地,就不需要将员工聚集在办公室工作了。就我自己的公司而言,我们已经可以有效地组织地理上分离的团队,但在10年前,做到这一点是很困难的。在21世纪的第2个10年,全浸式的视觉听觉虚拟现实环境将无处不在,它将加速满足人们对生活地点和工作地点的愿望。一旦我们所有的感觉都完全沉浸在虚拟现实的环境中(在2020年后期将成为现实),真实的办事处将不复存在。房地产行业也将是虚拟的。

正如弗朗西斯·培根爵士所说:“知识就是力量。”另一个加快回归定律的衍生物是人类知识将以指数级的速度增长,其中也包括知识产权(见图2-36和图2-37)。

图 2-36

图 2-37

图2-37是图2-36右上部分的特写。

没有迹象表明经济衰退周期会立即消失。近来,美国经历了经济减速、技术行业不景气和经济逐步复苏的一系列过程。经济仍需承担历史上周期性衰退带来的阻力,如对资本密集型项目的过度投资和大量积压的库存。然而,由于信息的快速传播、网上采购方式的日益成熟、各行各业市场的日趋透明,这些无不减弱了衰退周期的不良影响,经济衰退对我们生活水平的直接影响也正在减小。发生在1991—1993年的小型的经济衰退就是这种情形,而更典型的情况是发生在20世纪初的经济衰退。从长远来看,经济增长将继续以指数级的速度增长。

此外,经济周期中的微小偏离并没有明显地影响创新和范式迁移的速度。图2-37中显示所有的技术都以指数级速度增长,而且不会因为近来经济的衰退而减缓增长的速度。市场接受度也不能证明市场的繁荣和衰退。经济的整体增长反映了财富和价值的全新形式和层次。以前这些新形势不存在或者并不构成经济的重要部分,例如基于纳米粒子的新型材料、遗传信息、知识产权、通信门户、网站、带宽、软件、数据库,以及许多其他科技类别。

整个信息技术行业在经济中的比重正在迅速地增加,同时它对其他行业的影响力也在增加,如图2-38所示91.IT经济分享能力的增倍时间为23年。U.S.Department of Commerce,Economics and Statistics Administration,'The Emerging Digital Economy',表2,网址为http://www.technology.gov/digeconomy/emerging.htm。

图 2-38

加速回归定律的另一个内涵是教育和学习的指数增长。在过去的120年里,我们对K-12教育(每名学生和不变的美元数)的投资增加了10倍。高校学生人数成百倍地增加。以前自动化增加了我们肌肉的力量,近来我们头脑的力量也在扩大。在过去的两个世纪,自动化减少了技能阶梯底部的工作机会,并且创造了技能阶梯顶部的工作机会。技术阶梯正在向上提升,因此我们在教育各个方面的投资均以指数级速度增长(见图2-39)92.美国教育支出增倍时间23年。National Center for Education Statistics,Digest of Education Statistics,2002,网址为http://nces.ed.gov/pubs2003/digest02/tables/dt030.asp。

图 2-39

哦,本章开始的那个“提议”,认为目前的股票价值是基于未来的期望的。鉴于(字面义)短视的线性的直觉增长观代表着普遍的观点,所以关于经济预期的普遍认识是非常保守的。由于股票价格便反映买卖双方的共识,价格反映了潜在的线性假设,即反映了大部分人对于未来经济增长的认知。但是,加速回归定律清晰地表明,增长速度将继续以指数级的速度增长,因为进步的速度会继续加快。

莫利2004:但还有一个问题,你说,如果我阅读和理解了本章的部分,我会得到8万亿美元。

雷:是的。根据我的模型,如果我们用指数增长观代替线性增长观,目前的股票价格将是原来的3倍93.The United Nations预测2000年全球资本市场总额为37万亿美元。United Nations,'Global Finance Profile',《Report of the High-Level Panel of Financing for Development》,2001年6月,网址为http://www.un.org/reports/financing/profile.htm。如果我们能够感知未来的增长速率将以每年2%的速率增加(与当前的预期相比),考虑到每年的折扣率(与当前对比)为6%,考虑到当前价值的增加源于仅仅20年来以复利和折扣来计算未来的增长,那么其价值将变为原来的3倍。随后的内容指出,这种分析并没有考虑折扣率的增加,该折扣率源于对未来增长的一种感知。。由于股票市场已有(保守)40万亿美元,故还有80万亿额外财富。

莫利2004:但你说我会得到那笔钱。

雷:不,我说“你们”会得到钱,这就是为什么我建议仔细阅读句子。那个英语单词“你”可以是单数,也可以是复数。我的意思是说“你们”。

莫利2004:嗯,这很烦人。你的意思是整个世界的所有人?但是,并非每个人都会读这本书。

雷:嗯,但是每个人都可能读。因此,如果大家阅读并理解了这本书,那么,经济预期将符合历史指数模型,从而股票价值将会增加。

莫利2004:你的意思是,如果每个人都能理解并表示同意。我指的是基于市场期望,对不对?

雷:好吧,这是我的假设。

莫利2004:那是你预期将要发生的?

雷:嗯,实际上并没有。再次戴上未来学家的帽子,我的预测是指数增长观将流行起来,但需要时间,越来越多的证据清晰地表明技术的指数增长本质以及它对经济的影响。在未来十年这将逐步发生,并将成为推动市场长期上升的强大动力。

乔治2048:我不知道,雷。你是正确的,信息技术的性价比正在以各种形式呈指数增长,并且还将继续增长。事实上,经济继续保持成倍地增长,而不仅仅是克服通货紧缩率。事实表明大众可以理解所有这些趋势,但现实并没有对你所描述的股市产生积极的影响。股票市场确实随着经济增长而增长,但现实中的高增长速度并没有增加股票的价格。

雷:你认为为什么会出现那种情况呢?

乔治2048:因为在你的等式中遗漏了一件因素。虽然人们意识到股票价格将快速增长,但同时也意识到了增长的折扣率(就当前的价值而言,我们需要考虑未来的折扣价值)。想想看,如果我们知道在将来的一段时期股票将显著增值,我们就会购买,因为我们预测到了它的未来收益。因此对未来真正价值的认知增加折扣率,将抵消我们对于未来价值的预期。

莫利2004:嗯,乔治,这也不是很正确。你说的话在逻辑上有道理,但心理现实是,对未来价值增加的积极影响确实比对增加折扣率的消极影响要大很多。因此,普遍接受技术的性价比和经济活动增长率都以指数速度增长,将大大推动实体市场,但考虑到乔治所描述的影响,将不会如“雷”所说的增加3倍。

莫利2004:好吧,我对我的问题表示道歉。我想我会持有少量已有的股份,而不去担心它们。

雷:你有什么投资?

莫利2004:让我们想想,有个基于自然语言的新的搜索引擎公司,并希望它能代替Google。我也投资了燃料电池的公司。此外,还有一个构建能够在血液中行进的传感器的公司。

雷:听起来像一个漂亮的高风险、高技术的投资组合。

莫利2004年:我不会称之为投资组合。我只是和你聊聊你所说的技术。

雷:好吧,但请记住,尽管通过加速回归定律预测的趋势将非常平稳,但这并不意味着我们能够预测哪些竞争者将获胜。

莫利2004:对,这就是为什么我一直在宣传我的投资。

[1].在不经压缩的情况下,人类的遗传代码总量接近60亿bit(大约1010)。理论上,一块1kg重的石头所包含的信息量为1027 bit,这是人类遗传代码的1017倍。请见第2章注释57关于基因组压缩的讨论。

[2].如注释57所论述的,未经压缩的人类基因组共含有60亿bit的信息(数量级为1010bit),而经过压缩的基因组共含有3000万~1亿字节的信息。当然其中的一些设计信息被应用于其他习惯。假设将所有的1亿字节信息用于设计大脑,那么保守地估计,染色体中用于设计人脑的信息量高达109bit。我们将讨论对于“个体神经连接层次上的人类记忆”的估计,其中包括成人大脑中“连接模式和神经质浓缩”的1018bit的信息。该数值是染色体中用于描述大脑设计所需信息的1亿倍(109)。这逐渐发生于大脑在与环境交互式时的自我组织。