第2章
反馈效率决定进化速度
不同的世界基于不同的HFL机制运转,有不同的进化速度。当人类本能的内部世界还停在石器时代,外部世界则在互联网和AI的反馈数据驱动下不断加速演化。两个系统的不同步是人类的健康、精神、社会等众多问题产生的根源之一。
来自外部世界的反馈
我们是如何认识外部世界的?物理学通过拓展观察范围而产生新的想象和假设,并通过实验和对实践的检验获得来自外部客观世界的反馈,同时以数学不断重新构建严谨的体系。基于人类感官能够直接获得的反馈信息,诞生了牛顿物理体系、平面几何;基于在太空的观察尺度上获得的反馈,诞生了爱因斯坦的相对论,这个物理框架和黎曼几何体系相对应;基于粒子加速器在微观量子尺度上的试验反馈,诞生了杨振宁物理体系、邱成桐几何。某种意义上,在特定的假设框架和反馈检验能力所能达到的范围内,你看到的是你能看到的世界。
在不同的假设框架下,人们会看到不同的世界。对于同样的人类健康问题,中医强调整体,西医强调解决问题,并且基于各自的假设形成不同的诊治循环体系。在不同的系统里假设不同且难以统一,但这并不影响各自产生的效果。从另一个角度来说,不同的HFL机制也在塑造不一样的世界和不一样的认知。
世界是一个复杂关系体。以某种角度来看,认知是模式的匹配,每个人都会以带有个人视角的框架去预判一个新事物。通常,我们通过事物之间的复杂关联关系来建立每个点在世界中的相对位置和意义,这是一个关系体模型。人脑、互联网和人工智能深度学习算法都是通过不同的网络结构和机制模拟外部世界的关系结构,并在反馈中不断提升拟合度。网络结构最大化连接的同时,也可以基于反馈形成最强的结构拟合能力。
在相互交织的互联网世界里,谷歌的网页抓取工具会从数千亿个网页中收集信息,并评估这些网页和不同关键词的关系。算法会分析数百种不同的因素,在内容的新鲜度和网页的使用体验之外,为了评估内容在相关主题方面的可信度和权威性,谷歌会寻找那些看起来在类似查询中受到大量用户青睐的网站,这会影响用户在搜索结果页上点击并跳转某网站的概率,并基于用户的点击行为调整网页和内容以及服务在相关搜索词下的相关性权重,我们简单称之为点击调权。借助用户的应用反馈,互联网的网络结构在更好地拟合分散的信息与不同搜索请求之间的关联关系网络。
智能在大规模反馈中的涌现。在AI算法方面,1986年,大卫·E.鲁梅尔哈特、杰弗里·E.辛顿、罗纳德·J.威廉姆斯联合发布了一篇关于通过反向传播误差学习表示的论文,迄今已在谷歌学术网站中累积获得8万多次访问,产生1万多篇引文。论文里面介绍了一种新的学习过程,即反向传播,用于类似神经元的单元网络。该过程反复调整网络中连接的权重,以最小化网络的实际输出向量与所需输出向量之间的差异,作为权重调整的结果,不属于输入或输出的内部“隐藏”单元代表任务域的重要特征,并且任务中的规律性通过这些单元的交互来捕获。创建有用的新特征的能力将反向传播与早期的、更简单的方法(例如感知器收敛过程)区分开来。杰弗里·E.辛顿后来也因反向传播等杰出贡献被行业称为“深度学习三巨头之一”。网络连接权重对样本数据的反馈,不断修正预测函数,以神经网络结构更好地拟合样本数据中潜在的统计学规律,这可以被认为是这一代AI算法能够解决越来越多实用性问题的根本来源。
在AI应用方面,有了智能,我们就可以在变化的世界和变化的需求之间,为人类灵活地建立确定性秩序提供方法,就像在外太空建立有引力地模拟地球生存空间稳态。而且,在一定的范式之下,我们越是建立熵减秩序,越是需要消耗更多的算力和数据。所以,我们需要用智能创造更大的价值来平衡这种成本,才能形成可持续的正反馈,这是AI在算法的第一层反馈之上需要解决的第二层反馈机制。
总体而言,反馈产生秩序,带来智能和熵减。我们构建的这些复杂系统都是来自简单反馈。找到简单的反馈机制,然后不断扩大网络规模,成就互联网。找到简单的反馈机制,然后利用算力的指数级加速和数据规模,成就AI。
来自内部世界的反馈
人类本能也是一套可靠的算法,它成功地解决了人类的生存和延续问题。这套算法采用了更加稳妥的从反馈中学习的方法,以生存为代价而非模拟环境,代价决定了这套算法是倾向于保守的。以20瓦上下的碳基算力为基础,以个体的环境数据为制约,以生育周期为代际循环,通过遗传共享,这种反馈进化机制和硅基智能的进化速度已经无法相提并论。外部世界与内部世界的不同步导致了众多问题,人类不得不发明更多平行系统来弥补在自然系统中进化的不足。
世界的两个节奏
我们所从事的商业可以分为两类,一类是基于对人类本能的理解和反馈,更多是在生活形态的演变中水平变化,并无垂直进步,这和人类本能的进化速度是同步的。另一类是对外部世界的反馈和认知,是由科学和技术推动的。就像微软将ChatGPT整合进众多产品,正在以数据驱动的方式让万事万物成为智能体,并接近进化速度的奇点。