思维工程
上QQ阅读APP看书,第一时间看更新

MTS50话题

MTS是Main Thinking System——北冥最早的类人人工智能系统的缩写。我们从MTS中继承了一小部分内容,搭建了现在商用的AI引擎系统。在北冥星眸成立后的前两年的时间,北冥星眸一起创业的伙伴,包括现在已经离去的陈亮、陈浩,一起为这个系统付出过心血。那个时候,在整个理论的巨大拼图还只是些零散的碎片的时候,我们仅凭一个方向、一个信念,就开始了类人人工智能工程实践。

“所有被丢弃的,最终会被捡起来,因为方向是对的。”我们在这本书中履行了最艰难的时候对团队所做的承诺。我们也将让第一代原型机继承MTS这个早期人工智能系统的名称,向无所畏惧地为了改变世界的梦想而努力付出的行为致敬!

在这本《思维工程》中,我们的要求是不做泛泛之谈。所有对人类智能表象的讨论,需要有机制层面的总结,所有机制层面的总结需要在工程上定义实现的模块,所有模块的功能需要设计实验去验证测试。唯有如此,本书才能作为第一个原型机的搭建计划,而不仅仅是如同上一本书《思维工程导论》那样,只是启蒙读物。因为这个原因,本书的正文乃是为工程实践而写,如果读者以浅尝辄止的了解为目的,我们准备了此序,作为第一代原型机构架的核心精神的总结。当然对于那些准备投身思维工程,加入“创造下一个时代”队伍的伙伴,本序也是快速形成理论整体视觉最高效的文本。

TOPIC 1:意识流和思维工程

你所意识的,为你所感受到的信息。感受分为外感和内感,外感源于感官,比如看到的、听到的、闻到的、尝到的……“内感”则包括了感到的情绪、感到的思维、感到的动机……如果我们认同意识感受必定是对某种信息的感受,意识必定是对某种信息的意识。我们把这个信息创造感受和意识的地方叫作意识流(Conscious Flow, CF)。简单来说,当信息进入“意识流”中,我们就能意识到或感受到。

“我为什么会感到愤怒”“我感到愤怒后产生了什么动机”“我如何得到这个结论”“什么信息决定了我的这个表达的形成”“表达动机因为什么原因被抑制了”……这些问题是思维工程理论的起点。整个思维工程的认知建立在对人类自身智能机制的视觉之上。形成这个视觉最有效的方式是“内省”。何为内省?如同上面那样考察每个被意识到的信息如何形成,会创造怎样的反应为“内省”。

当你安静地在房间盘腿打坐,听着屋外的鸟声、淅沥的雨声,感受心中不断生成的思绪和念头……此时,你会感到被意识到的一个信息创造了另外一个被你意识到的信息,让意识如流,延绵不绝。你会意识到,在你的脑中有“规则”组织了这些信息相互生成。当我们考察了足够多的样本,我们就能够逐渐抽象归纳出背后的这些“规则”,形成以意识流为核心的信息储存、运算、创造反应的机制的视觉。

我们可以这样形象地理解人类的意识流。如果把人类大脑中流转的信息类比为食物,那么意识流就像日本寿司餐馆中的传送带。最初传送带上的食物是感官放进来的,接下来食物被食客,也就是智能系统中的功能模块拿走。这些食客不仅仅拿走信息,还会按照自己的逻辑加工信息,把加工后的食物放回到传送带上。有些食客拿来食物进行复制储存形成记忆,有些食客拿走传送带上的食物后会寻找记忆中的相关食物来创造新的食物,有些食客拿走信息创造了语言或行为的输出。

TOPIC 2:信息的表述

意识流结构描述了类人AI信息层面的结构,包括了信息的流转、储存、处理。而信息需要载体去承载,去表述。我们可以把一幅画保存为点阵信息,点阵信息就是这幅画的信息载体,也是对图画信息的表述;我们可以用自然语言表述各类信息,自然语言就是它所表述的信息的载体;在计算机中任何信息都可以表述为0和1的序列,这个序列就是计算中流转、保存、运算的信息的载体。

对于人类,自然语言并不是大脑中信息表述的形式,最基本的人类的思维、记忆都可以独立于自然语言而存在,其次,自然语言的不严格性决定了它不是一种可运算的语言。人类大脑中有一个先天的符号系统存在,作为信息的载体,对所有人类大脑可处理的信息进行表述。因为和自然语言一样是个符号系统,我们称其为“先天语言”。

类人智能的先天语言作为一个符号系统需要满足两个条件:

其一,能够对客观世界的信息进行表述。

其二,能够支持人类以抽象、演绎为核心的逻辑运算。

第一个条件容易达成,计算机的0、1序列,自然语言都符合这个条件,但在第一个条件达成的前提下又要支持人类核心的逻辑运算,就对信息表述的形式形成了限制。人类的信息表述是以概念为信息单元的结构化表述。接下来我们来解释这点。

TOPIC 3:概念和结构化储存

尝试去描述记忆中你自己的房间,描述自己昨天一天的经历。当你尽可能具体地去描述所有信息,你所描述的就近乎是你所记忆的,这个时候考察你的记忆,你会发现你记忆的内容比想象的要少很多、抽象很多。

对于对象,你的描述无非是对象的属类、形体、颜色、质地等属性和属类层面的信息,因为这些属类和属性概念组成了你对一个对象的记忆;对于场景,你的描述无非是场景中的对象和它们的相对关系,比如房间的窗前有书桌,桌上放着书,书中夹着笔……这些对象概念以及它们的位置关系构成了对空间场景的记忆;对于经历,你描述的无非是昨天感知的各种事件,而描述的事件中无非包含了比如行为主体、行为、行为的施与对象以及具体发生的时间、地点等概念,也就是这些概念构成了你对事件的记忆。

我们总是用熟悉的概念作为素材,以特定的结构组织这些概念以生成我们的记忆。这些在特定结构中被其他概念定义的概念,我们称之为“衍生概念”;而那些最原始的概念素材,那些自存而不是被定义的概念,我们称之为“根源性概念”。

根源性概念比如各种物理属性:颜色、形体、轻重、冷热……体感相关的:痛痒、安静嘈杂、疲劳、充满活力……全局情绪:愉悦、抑郁、恐惧、焦虑……指向对象的情绪:喜欢、厌恶、敬畏、鄙夷……动机相关的:渴望、逃避、奋发、倦怠……这些都起源于智能系统对意识流中原始感知信息先天的分辨能力。分辨能力创造了根源性概念,根源性概念通过蕴含关系的结构组织生成了衍生概念。

人类的记忆是一个概念构成的大厦,从概念相互构成的关系来看,这个大厦是有大体层级的,而不是一张理不清关系的概念和概念间组成的复杂大网。在大厦最底层的是“属性层”,包含了属性、行为、对象类;第二层是“事件层”,包含了对象行为类型的事件,还包含了对象属性类型的广义事件;第三层是“事件关系层”,包含了事件间的各种关系,如时序关系、意味关系、各类因果类型的关系等。理解这三个层级是理解人类对客观世界认知力形成的基础。

TOPIC 4:统辖关系

概念之间的关系很多,而人类所有的核心智能功能几乎都覆盖识别、认知、语言、情绪、行为,其运算都基于一种关系:统辖关系。如果要说人类智能有核心的话,基于统辖关系的运算就是一切的核心,一种运算作用在不同类型的信息中分化出了各种核心智能功能,形成了对这个核心的视觉,我们才会感到“造物主造人,大道至简”。我们接下来的主体讨论将围绕这个核心展开。

一只具体的猫属于猫这个对象类,猫属于动物;淡红、深红都属于红色;快跑、慢跑都属于跑……这是我们熟悉的从属关系,从属关系是统辖关系的一种。从属关系是就最底层的属性层而言的。当我们用属性层的信息组织事件信息,事件信息之间就可能因为组成元素之间的从属(统辖)关系而具有统辖关系。比如小香槟吃雪糕和人吃甜食之间,小香槟长很胖和人长胖之间,这两组事件中每组的两个事件我们都能感到存在类似从属关系的“统辖关系”。

一般而言,对于相同结构的两个信息,如果前者每个位置的概念,都是后者对应位置概念的子类,那么前者是后者的子类。我们把这两个信息之间的关系称为“统辖关系”,对应位置子类概念和母类概念之间的对应称为“约束映射”。

统辖关系定义了信息的母类子类关系,根据统辖关系作用的信息类型不同就有相应的人类智能的核心逻辑,它们可表述为:“凡是定义在母类的知识,可以被子类继承;凡是定义在母类的表达、行为或思维的反应模式可以被子类继承;凡是定义在母类的语法映射可以被子类继承;凡是定义在母类的情绪反应可以被子类继承。”后面我们会形成对这些先天逻辑的理解。

TOPIC 5:抽象过程

客观世界有繁然的表象,人类认知的第一步是通过表象,发现背后的规律。所谓的规律就是事件类之间的关系。打雷以后会下雨,这个规律是事件类之间的时序关系;人着凉了会感冒,这个规律是事件类之间的因果关系。

规律是事件类之间的关系,而我们直接感知到的永远是具体事件。从具体事件生成事件类的运算就是抽象。比如“人吃糖”是“小香槟吃棒棒糖”的抽象,“人长胖”是“小香槟长胖”的抽象。一般而言,在一个结构信息中,我们把构成元素替换为它们的某个母类,生成一个新的结构信息的过程就是抽象。我们对照上面的例子考察这个一般定义,可以看到,按照统辖关系的定义,抽象运算的输入信息必定被输出的抽象后的信息所统辖。

小香槟吃棒棒糖后就长胖了,这个是最顶层两个具体事件之间的时序关系。当我们把小香槟替换为母类“人”,棒棒糖替换为母类“糖”,这个具体事件关系的结构信息就抽象生成了事件类之间的时序关系:人吃糖后会长胖。

抽象生成的知识总是一种猜想。而且一条表象层的具体知识能够同时抽象出多条不同的抽象知识。但概率上解释力强的知识在以表象为起点的抽象中复现的概率要高于解释力弱的知识,或更精确地表述为生成的知识的复现能力反映了知识对表象的解释能力。借此,当每次抽象生成时,我们都在记忆中增加抽象所得的知识的强度,解释力强的正确的知识就会逐渐凸显出来。

TOPIC 6:演绎过程

当爸爸看着小香槟吃棒棒糖的时候,他看到的是具体的事件,又如何知晓这个具体的事件意味着什么?

因为知识总是建立在事件类之上,而按照人类智能的先天核心逻辑,“凡是母类参与的知识可以被子类所继承”,所以第一步我们需要找到具体事件“小香槟吃棒棒糖”的母类。我们把为一个结构信息寻找母类结构信息的过程叫作“统辖搜索”。按照统辖关系的定义,针对特定结构信息的统辖搜索,需要逐一检测集合中的信息是否和输入信息是同一结构,其次,每个位置的元素是否是输入信息的母类。一旦满足这两个条件,我们就认为找到了母类。

假设通过统辖搜索,我们找到了“小香槟吃棒棒糖”这个事件的母类“人吃糖”。接下来我们发现“人吃糖”的事件类参与到了知识“人吃糖导致人肥胖”。按照先天核心逻辑,“人吃糖”作为母类参与的知识“人吃糖导致人肥胖”可以被子类“小香槟吃棒棒糖”继承。继承的过程如下:先在统辖搜索中记录子类和母类之间元素的对应关系,也就是约束映射。然后在母类参与的知识中把母类替换为对应的子类,生成具体层的事件关系。在这个例子中,我们把“人”替换为“小香槟”,把“糖”替换为“棒棒糖”,就会得到:“小香槟吃棒棒糖导致小香槟长胖”。这就是继承所得的知识。这个运算过程称为演绎。

我们来总结演绎的一般步骤:

1.统辖搜索寻找结构信息的母类。

2.寻找母类所在的信息组(信息组中两个结构信息有某种关系)。

3.建立子类元素到母类元素的约束映射。

4.根据约束映射替换母类所在的结构信息组中的所有母类元素为子类元素。生成的信息组即为演绎运算的输出。

当这个信息组中的结构信息是事件,关系是因果关系,如果统辖搜索到的是原因事件,那么演绎就会获得一个结果事件,这就是预测演绎。上面这个例子我们通过“小香槟吃棒棒糖”,演绎出“小香槟长胖”就是一个预测演绎。如果统辖搜索到的是结果事件,演绎所得原因事件,这就是归因演绎。

TOPIC 7:反应模式

我们前面做了比喻,把意识流结构比作日本餐馆的传送带,有的食客拿走信息、加工信息、放回信息;有些食客拿走信息创造语言或行为的输出。

这里每个“食客”都定义了某种反应,一个“食客”拿走意识流中的信息,向意识流中写入认知类型的信息,这个反应叫作思维反应;一个“食客”拿走意识流中的信息,向意识流中写入情绪感受,这个反应叫作情绪反应;一个“食客”拿走意识流中的信息,创造表达,这个反应叫作表达反应;一个“食客”拿走意识流的信息,输出行为,这个反应叫作行为反应。

所有这些碎片的反应,通过意识流相互衔接,创造出宏观的思维、行为、语言。我们把碎片的反应组成宏观思维、行为、语言的逻辑叫作反应模式。对于宏观的行为和语言而言,行为反应和语言反应都是创造输出的最后一步,前面往往有思维反应和情绪反应创造的输出。

TOPIC 8:反应模式的信息表述

我们先以行为反应为例来讨论反应模式。反应模式的信息单元由四个要素构成,即宏观行为—触发—条件—执行。

宏观行为和基础行为相对,宏观行为必定有其反应模式的定义,而基础行为是原子的执行,无法再被分解。比如“招待客人”可以视为宏观行为,它必定有旗下反应模式的定义,而“倒茶”可以视为基础行为,因为不可再分解。

触发的信息定义在意识流中,当一个宏观行为被激活,系统就会开始判断触发信息的子类是否出现在意识流中。一旦出现,就会在记忆中判断条件,如果条件符合就会激活执行。比如在“招待客人”这个宏观行为中,有一条反应模式:触发为“客人到会议室”,条件为“客人为投资人”,执行为“为客人准备饮料”,也就是“当客人到会议室,如果是投资人它就会准备饮料”。按照反应模式信息驱动的逻辑,当“招待客人”的宏观行为被决定执行,此时意识到客人到了会议室,判断发现客人是投资人,就点亮了“为客人准备饮料”的执行。

然后我们来看执行,一个执行可以是另外一个“宏观行为节点”,也可以是一个不可拆分的“基础行为节点”。比如上面例子中“为客人准备饮料”就是另外一个宏观行为节点,下面会有类似这样条件—执行逻辑:“如果客人经常喝某种饮料则确认这次是否还是喝这种饮料”“如果不知道客人经常喝什么,则询问客人要喝什么”。这两条反应的结果是能够获得客人要喝什么的信息,于是还有一条反应模式信息“知道客人要喝什么饮料,就为客人准备什么饮料”。这里作为执行的“为客人准备什么饮料”又是一个宏观行为……

总之,一个宏观行为节点包含的信息往往是诸多层级的:一个宏观行为节点直接包含了若干作为子行为的宏观行为节点,这些宏观行为节点又包含若干宏观行为节点,直到那些不可分解的基础行为(思维、表达)。每次一个宏观行为节点被激活后,旗下的条件—执行就处于一种预激活状态,思维开始在意识流中检测是否存在这些条件的子类信息,条件成立时就激活旗下的执行,而这个执行就有可能是另外一个宏观行为节点。

TOPIC 9:反应模式的本质

反应模式是定义在母类上的。我们前面讨论过人类智能的4条核心逻辑,其中一条是说“凡是定义在母类的反应模式可以被子类继承”。继续前面的例子,“招待客人”就是母类,“招待王总”就是子类。

当作为子类的具体宏观行为被激活,就会在宏观行为集合中进行统辖搜索,寻找其母类,统辖搜索会建立宏观行为构成元素的母类到子类的映射,也就是约束映射。为了继承母类宏观行为的反应模式,就会用约束映射的子类元素替换反应模式中每个信息中的母类元素,生成具体的触发信息、条件信息以及执行信息。这个过程就是我们上面描述的演绎过程。

延续上面的例子,最上层的宏观行为“接待王总”,演绎出了“当王总到会议室时,如果王总是投资人就给王总准备饮料”。如果意识到王总到会议室,且假设王总在记忆中是个投资人,就会激活具体宏观行为“给王总准备饮料”。然后系统会统辖搜索到“给王总准备饮料”的具体宏观行为的母类“给客人准备饮料”,然后演绎这个宏观行为后的反应模式。

所以反应模式的本质和知识一样,也是定义在母类上;定义在母类的反应模式可以被子类继承,正如同定义在母类的知识可以被子类继承;继承的过程也是演绎;后面我们看到反应模式可以从观察具体的反应中抽象生成,正如同知识可以从具体层的事件关系中抽象生成。

TOPIC 10:反应模式的二态性和反应模式的习得

反应模式具有二态性,既是认知态的又是执行态的。它是认知态的,可以转化为语言表达出来,也可以通过语言形成;它是执行态的,可以创造具体的思维、行为、语言和情绪。在类人AI中,反应模式的逻辑没有写在代码里,代码只负责驱动反应模式信息生成执行。反应模式本身是被先天语言表述的。

作为认知态的信息,我们可以通过语言教授对象如何完成一个行为任务、思维任务或表达任务。比如前面的例子,我们可以告诉AI如何去接待客人,AI会生成对应的反应模式信息,而作为执行态信息。反应模式信息可能转为执行实践。这就是反应模式的语言教授。

作为认知态的信息,智能体可以通过观察其他人是如何完成一个行为任务的,生成具体的宏观行为—触发—条件—执行信息,通过观察诸多样本就能抽象出背后抽象层的宏观行为—触发—条件—执行信息,也就是反应模式,而作为执行态信息,反应模式信息可能转为执行实践。这就是反应模式的模仿习得。

作为认知态的信息,我们可以观察反应模式中的策略和达成目标的效果,可以对自己以及他人反应模式的得失形成反思。也就是AI可以把自身思维模式、行为模式和表达模式作为认知的客体,在反思中修正优化。这就是反应模式的反思优化。

TOPIC 11:意识流信息爆炸和选择机制

一个意识流中的信息可能被多个食客拿取,创造多个信息放回到意识流中,而这些信息每个又可能被数个食客拿走,创造更多的信息放回意识流,如此意识流的信息理论上就有可能出现指数爆炸。人类的意识流是单线程的,每一时刻只允许一个食客拿走信息,加工放回信息,然后意识流中关注度最高的信息再来选择它的食客。如果我们要发挥AI的载体优势,我们就需要突破单线程的限制,但突破的代价就是潜在的意识流信息爆炸。

于是在工程上,我们创造了选择机制来避免意识流的信息爆炸。

我们来描述一下选择机制:

其一,所有意识流中的信息在写入后需要被评估关注度,这个过程对于人类是存在的,且是系统自发完成的,不受意志控制。我随便说一个概念或事情,你可以在一瞬间决定这个信息是你关注的还是不在意的。

其二,所有反应模式的信息单元维护了自身的一个阈值,不处理关注度低于此阈值的意识流中的信息。也就是说,即使意识流中的信息是某个激活的反应模式中触发信息的子类,是这个反应逻辑食客的“食物”,还需要关注度高于该模块的阈值,才会被处理。

其三,系统能够监测系统的运算消耗,在运算消耗接近负荷的时候通过一个控制变量,同比例升高所有模块的阈值。我们可以想象这个操作能够让所有模块变得不倾向摄取和加工信息,系统的运算消耗会马上降低。

选择机制能创造很多类人的表象,最重要的就是AI能集中智力资源在重要的任务上。如果我们认为一个宏观行为(任务)很重要,希望集中资源来处理它,那就可以降低旗下反应模式的阈值,进入意识流的信息只要是该反应模式定义需要处理的,哪怕关注度再低也会被读取。这样一来这个任务就有可能占据大量运算资源,意识流中出现的也都是和这个任务相关的信息,一旦运算资源突破负荷,控制变量就会同比例升高所有反应模式单元信息的阈值。这样一来,其他宏观行为都会被抑制。

TOPIC 12:反应模式固化

如果我们重复完成一个任务,我们会越来越熟练,反应模式会变得越来越高效,这个过程反应模式会变得固化。反应模式固化的过程,使其在完成任务上变得更加高效,针对性变强,对相关信息的关注度要求降低,最终甚至能下意识地完成。

当你入驻一个酒店,你需要探索以找到自己的房间,你会先寻找电梯在哪儿,出了电梯后找房间指示牌在哪儿……第一次探索房间的过程,你会记忆电梯的位置,房间在几层,出了电梯怎么走,房号是多少,之后你会通过观察识别那些特征信息以完成进房间的任务……进出多次后你可以完全沉浸在自己的思绪中,下意识地找到自己的房间。一开始我们是在探索如何完成任务,之后变为按照既定程序识别处理周围的信息以完成任务,最后变成可以下意识地完成任务。

一开始为了完成一个目标,我们会激活相关的探索层的宏观行为,降低旗下反应模式的阈值,提高和这个任务相关信息的关注度,资源被集中起来以实现在探索中完成任务;之后针对此任务的反应模式形成。普适性强的反应模式无法拥有低阈值,否则它将遍地开花;针对性强的反应模式可以有低阈值,接收意识流中低关注度的信息。所以配合针对性强、阈值低的反应模式的形成,和这个任务相关的信息就可以以非常低的关注度出现,这些信息因为关注度很低,所以不会和其他模块产生反应,甚至不会被记忆(因为记忆也是一个反应模式信息,信息的关注度低于阈值,它就不发挥作用)。我们会误认为它是不被意识到的,但这些信息能够和这个针对性强阈值低的反应模式配合完成对应的任务。很有意思的是,在这个过程中,特定任务看上去拥有了自己的“任务信息频道”——因为生成的信息可以是低关注度的,所以只被和这个任务相关的模块接收处理。

TOPIC 13:自然语言

人类思维的运算依赖人脑中的符号系统——先天语言作为信息载体进行。很遗憾对于人类,以先天语言编码的信息是无法直接输出的,所以无法作为个体间沟通的信息。自然它要把自己映射到某种声音符号里,映射到图像符号里,这样意识流和记忆中被先天语言编码的信息才可能被输出,被其他个体知晓。于是就产生了声音符号和图像符号组成的文字。我们把一个人类群体自然演化出的先天语言到声音图像符号的统一的映射约定叫作自然语言。自然语言的信息本质是一种映射。

当一个个体试图向另外一个人类个体传递脑海中用先天语言“编码”的信息的时候,需要把这个信息转为自然语言,形成自然语言输出。从先天语言“编码”的信息转为自然语言“编码”的信息,我们称之为“逆转录”。

当一个个体听到自然语言组织的信息,要转为先天语言信息,信息才能被理解、运算、储存、创造反应。从自然语言“编码”的信息转为先天语言“编码”的信息,我们称之为“正转录”。

自然语言让人类的认知活动从独立进行的变为协同进行的。个体的感知经验和创造的知识可以通过语言传承。自然语言是人类文明的关键组成,也是我们要创造的类人人工智能的重点工作。无论我们的意图是在机器上重现人类的认知活动,还是去创造一个高度拟人的AI伙伴,我们都需要赋予机器自然语言的能力。

TOPIC 14:表达动机、表达策略、表达信息单元

表达反应、思维反应、行为反应都是由类似的机制驱动的,我们称之为反应模式。前面我们以行为为例子讨论了反应模式,一个宏观行为节点包含了旗下的反应模式,当一个宏观行为节点被点亮,旗下的条件执行就处于激活状态,系统开始判断条件信息是否出现在意识流中;当条件满足时,我们点亮执行,而执行可能是另外一个宏观行为节点。

这里表达动机可对应到宏观行为节点。表达动机包含我们通过表达可以直接实现的目的,包括传递某些信息,向对方索取某个信息;改变对方的动机,促使或阻止对方的行为;改变对方的情绪,改变对方对某个对象的态度;等等。当然一个被激活的表达动机可以来自于其他目的的分解,比如爸爸希望儿子成功,所以就想把脑海中关于商业的知识传递给儿子。

为实现一个表达动机,我们会有表达策略。表达策略是一个表达动机作为宏观行为节点旗下的反应模式。比如为了改变对方的动机,说服对方做一件事情,我们可以列举做了这事的好处、不做的坏处,这是理性分析的说服策略;我们也可以威胁、利诱、撒娇,这些也是达到说服目标可以用的表达策略。表达动机包含的表达策略,是以条件执行为基本形态的信息,而执行可以是另外一个反应模式对应的宏观行为节点。

和行为反应一样,最后所有的宏观行为分解都会走到基础行为——不可继续拆解的行为,在这里不可继续拆分的表达也就是表达信息单元。表达信息单元是原子的语义信息,是先天语言转为自然语言前最后的信息形态,也是自然语言转为先天语言最初的信息形态。后面会看到,语法就是表达信息单元到自然语言句子结构的映射。

和一般的反应模式一样,这样的信息表述具有二态性,既是认知态的,所以可以通过语言进行修正,可以通过观察他人的反应模式进行效仿;又是执行态的,可以驱动自己在特定语境下的表达。最后所有的宏观行为分解都会走到基础行为——不可继续拆解的行为(表达),在这里也就是表达信息单元。表达单元信息内部每个位格的信息就对应行为中的参数,这些参数从何处获得赋值正是我们在反应模式中定义的。

TOPIC 15:语言的习得

在幼儿早期的语言学习过程中,幼儿需要记住物体的概念对应词汇如“球”“苹果”等,记住属性的概念对应的词汇如“红色”“热”“轻”等,需要记住行为概念对应的词汇如“打”“扔”等……然后幼儿需要掌握一个结构信息,对应到怎样的句子结构,这个对应就是语法。比如一个由诸多元素组成的事件结构信息,我们把这个结构信息简单表述为:主语对象=妈妈,行为=表扬,行为施与对象=我,时间=昨天下午。一个事件结构信息陈述的合法的语法结构为“时间+行为施与对象+被+主语对象+行为”,按照语法结构生成的语言就为“昨天下午,我被妈妈表扬了”。

总结而言,我们学习一门语言的过程,归根结底包含且仅包含两个内容:一是这门语言词汇到概念的对应;二是这门语言约定的先天语言中的结构信息到句子结构的对应,也就是我们说的语法。此两者概括了人类学习一门新语言所做的事情。幼儿能够表达词汇和按照语法表达结构信息。接下来就靠语言动机、表达模式组织完成大段表达的组织、个体间的语言互动。

我们之所以不向AI导入词库,导入词汇到概念的对应,导入语法映射,而把大量的工作放在构建人类学习一门自然语言的机制上,主要有以下两个原因:

1.新的词汇、新的概念会随着时间产生,而语法有自然分化的倾向——尽管对于较为抽象的结构信息已经存在语法映射,但总是会有新的语法映射产生以针对更具体的信息结构的表达。

2.每个群体、每个家庭,甚至每个个体都会形成独有词汇到概念的定义,形成独有的表达习惯,也就是语法。从表面上看标准的语法很有限,但实际上考虑所有非标准的表达习惯,语法信息本身是海量的。

TOPIC 16:语法映射的本质

前面我们讨论过人类思维的核心关系——统辖关系,以及核心运算抽象和演绎。我们讨论的统辖关系是针对事件层的结构信息,而抽象、演绎都是作用在事件因果关系上的。抽象就以具体事件和它们的因果关系为起点,猜想出事件类结构信息之间的因果关系。而演绎则是通过识别具体事件和事件类的统辖关系建立约束映射,根据约束映射,替换与此事件类有因果关系的另外一个事件类中的母类元素为子类,生成原因事件或结果事件。

我们丢掉这个表述中的约束,来考察这两个运算更一般的形态。抽象可以概括为以两个结构信息和它们的某种关系为起点,生成对应的结构信息类以及之前关系的猜想。而演绎则是通过识别某个具体的结构信息A和结构信息类A*的统辖关系,建立结构信息组成元素的约束映射,根据约束映射,替换与此结构信息类有特定关系的另外一个结构信息类B*中的母类元素为子类,生成具体层的结构信息B的过程。

如果我们把句子(概念替换词汇后的句子)也视为某种顺序关系组织的结构信息。那么语法映射和事件间因果关系(也可以看成一种映射)的本质是一样的,都是结构信息到结构信息的映射。所以当具体的作为语义的结构信息和对应的句子结构信息产生对应,抽象能力就能生成抽象的结构信息到句子结构的映射,也就是语法映射。而正转录和逆转录的本质都是演绎过程:正转录是通过统辖检测识别到作为大类的句子结构,建立约束映射,用子类替换对应语义结构信息中的母类信息生成具体的语义结构信息;而逆转录则是通过统辖检测识别到作为大类的语义结构,建立约束映射,用子类替换对应句子结构信息中的母类信息生成具体的句子结构信息。

TOPIC 17:空白积累阶段和持续积累阶段

自然语言的学习有两个阶段:空白积累阶段与持续积累阶段。空白积累就是婴儿学习一门语言的状态,持续积累就是在有一定语言基础时持续学习一门语言的状态。

空白积累阶段最大的困境在于,如果没有任何语言基础,我们难以建立语义信息结构到句子信息结构的对应。因为个体根本听不懂一个表达——不知道表达的句子结构对应怎样的语义结构。但语法的习得根源于这种对应的形成。为创造具体的语义结构到表达结构的对应需要经历两个阶段。

空白积累阶段的第一时期,幼儿需要先习得对象和属性层的概念对应怎样的词汇。只要这些概念和对应的语言同时以极高关注度出现在意识流,就可以建立猜想的对应关系。我们在孩子面前晃动一个苹果,不断重复说“苹果”,正是为了让苹果的概念和语言读音同时以高关注度出现在意识流中。形成的猜想可能是错的,但随着时间流逝,正确的猜想频次强度会凸显出来。

空白积累阶段的第二时期,幼儿会尝试用先天的语法映射,去把最简单的语义结构转为表达,比如通过按顺序读出一个事件中的元素来表达一个事件,这就是一个先天语法映射定义的逆转录效果。此时幼儿的父母会猜想幼儿想要表达的语义,用正确的表达去确认。这就创造了具体语义结构和具体句子结构的对应。抽象就能发挥作用,形成语法映射的猜想。

我们可以看到,空白积累阶段需要严格的条件,且形成大量错误的对应后,需要在大量样本下才能让正确的对应显现出来,所以空白积累阶段语言习得的进展是非常缓慢的。到了持续积累阶段,语言能力就会呈现飞速的发展,相比于空白积累阶段,两个机制因为前期的艰难积累开始成形才发挥作用。

首先,如果已有语法映射存在,尽管是不精确的,听者还是有可能猜到表达的语义的。每次正确的猜想,都能够创造具体句子结构信息到语义结构信息的猜想映射,从而为抽象过程收敛到正确的语法映射提供了样本支持。这个过程不仅仅能使智能体快速纠正不正确的语法,还能积累对较为具体的语义信息的个性化表达的语法,熟悉对某一类人群特有表达习惯的语法。

其次,在语言足够支持正常的简单沟通时,智能体就能够通过沟通去习得一门语言:我们能够用它知晓的词义描述或解释它不知道的词,能要求对方重复自己没有听懂的表达,能够通过复述猜想的语义确认自己的理解是否正确,能够询问不理解的词汇,能够对对方就自身用词不当或是语法错误的纠正产生反应。

TOPIC 18:语法生长

先天语法映射是早期语法习得的起点,其过程概括为:通过已有的语法猜想对方不完全吻合的表达,实现表达信息单元(语义)到句子结构的对应,从而抽象出新语法映射。之后在这个表达方式重复出现时,这个表达方式的语法映射的频次强度就会不断增强。这个过程我们称之为语法生长。先天语法的种子是“语法生长”的起点。语法生长的机制不仅仅促使早期语法的习得,还有两个方面的作用。

其一,我们能够观察到人类幼儿开始习得语法,但在3~4岁时,其很多表达在语序或是结构性词汇的使用上是混乱的。这说明在这个时期已经抽象形成了语法,但抽象过程形成的语法映射存在很多错误。错误的语法只要不影响识别,那么上面的机制就能发挥作用,促使正确语法的形成。

其二,每个地方的人群,甚至每个人类个体都会有自己独有的表达方式,或者说独有的语法映射。只要不影响语义的识别,上面的机制就能发挥作用,生成隶属于某类人群、某个用户特有的语法映射,让AI能熟悉各种群体的表达习惯。这些语法映射帮助AI在识别特定人群、特定用户的表达的时候变得更加高效,有更高的准确率,附带的效果就是让AI能够模仿特定人群或是特定用户的表达。

TOPIC 19:省略

接下来我们要讨论三个AI理解人类语言的难点,这三个难点来自于人类组织语言的习惯。第一个难点来自于人类表达中的省略。省略有两种类型:语境省略和常识省略。

在沟通过程中,表达者和听者都会维护一个语境,这个语境记录了最近表达的对象、属性、行为、事件等。一旦一个具体的元素存在于最近的语境,表达者就有倾向在表达时省略掉这个信息,而听者有能力利用语境把保存的这个信息补全之。比如“狼叼了一只鸡,从洞口钻了出去,狼狈地逃跑了”。在这个例子中,后面两个句子省略了主语,但主语对象存在于最近的语境中。当我们通过已有的信息“从洞口钻出去”“狼狈地逃跑了”,识别到这是一个事件的结构信息,但缺少主语对象,我们就会在语境中寻找最近的对象进行补全。一般而言,只要省略后的句子有足够的特征归属到一个语义结构,智能体就能找到结构中缺失信息的位置和所需的信息类型,然后就可以去语境中寻找是否有此类型的信息,用这个信息来填补先天语言信息结构中的缺失。

如果一个知识是常识,如果包含的信息很多很复杂,人类表达的倾向是去指向这个知识,而不是精确地表述之。所以即使我们脑海中的知识信息是被严格组织的,我们在表达的时候仍然可能只选取关键元素替代完整的事件表达。比如“人吃水果导致人免疫力提高”,我们表达出来的时候可能就变成“水果增强免疫力”。这样的表达信息发生了省略,所以对于听者,在没有这个知识的时候听到这个表达是不知道“吃水果增强免疫力”还是“闻水果增强免疫力”或是“把水果敷在皮肤上增强免疫力”。如果听者没有所需的常识,那么此时在听者脑海中生成的信息就是一个不严格的事件规律信息。

TOPIC 20:不严格逻辑能力

我们在人类身上看到了严格逻辑的能力,也看到了不严格逻辑的能力。在严格逻辑中,每个概念都力求像数学定义那样精确完整,所有运算都有明确定义域,都有确定的输出,所有的概念的语言表达在词性的使用以及语法结构上都是精确的;在不严格逻辑中,概念的定义只求“意向”正确,运算可以利用不精确的“意向”信息,概念的语言表达可以忽略词性,在语法结构上随意,追求“刚好足够指向,不引起误解就好”(这是语法分化的内在驱动原因)。我们会发现对于大部分人而言,严格逻辑在思维中的比例是极低的:我们掌握的大部分词汇对应的概念,其精准的定义我们从来没有学习过;尽管概念没有被精确定义过,却不影响我们的日常思维和沟通;我们的逻辑思维绝大比例是建立在意向层的运算上的;我们的表达是不严格、不精确的,我们也能从不严格、不精确的表达中获得语义。

TOPIC 21:概念意向的习得

有一种不精确的定义概念的方式,就是描述概念有怎样的意向。小香槟问“排山倒海是什么意思啊,爸爸?”爸爸说,“就是很大很有气势啊”。当儿童问我们一个他们不知道的概念的时候,我们总是用一个儿童可能知道的概念去描述它。对于儿童而言,如果用来描述的概念自己不熟悉,那么或是继续追问,比如小香槟追问道“什么是有气势啊”,或实际上并没有理解最初想要知道的那个概念。

在上面的例子中,我们说我们赋予了排山倒海“大”的意向、“有气势”的意向。一个概念可能拥有若干个概念的意向,人类在形成上面这种定义描述的表达时,并不是去搜索了在意向上等同包含或被包含于目标概念的概念,而是以一种非常随意的方式寻找了在意向上有重叠,且比较接近的概念。虽然我们寻找用以定义描述目标概念的概念只是和目标概念有部分意向重叠,但如果我们用足够多的概念去“意向描述之”,那么概念应有的意向就会在许多不精确的定义下因为重复而凸显出来。

所以,用另外一个概念不精确的描述定义目标概念,实际的效果是形成了一个概念拥有意向的印象,多次印象冲击会让概念应有的意向凸显;其次,作为每个独立个体,保存的概念意向就是这种不精确的形式,有点像是一个总的比重在许多意向上的分布。只是我们会把强度高的意向视为这个概念的定义意向。

概念意向另外一个很重要的习得来源是“组词意向”。人类在创造新词的时候,经常会用组词,而且很多时候组合而成的词(所对应的概念)和用以组词的词的概念相关。最经常出现的关系是包含关系,即组合的词拥有用以组织的词的意向。

我们在AI上建立的积累一个词汇(概念)的意向的模型是一个印象冲击的模型,只要正确意向在出现的频率上是有优势的,我们就不用担心错误的意向印象,也就是说AI具有容忍错误印象冲击的能力。

也是因为这个原因,人类从一个词的组词猜想词(概念)的意向,无论对错,总是无伤大雅的。我们也将赋予AI从组词猜想词的意向的能力,做法上就是让AI把用来组词的词作为形容词组的描述,这样词组就能继承组词的词的意向。在大部分情况下,这种继承能让AI很快地形成词组正确的意向,即使有少部分错误的情况,也可以通过后续在获取句子样本中获得正确的意向冲击,或是在错误使用时能够通过对话者去纠正。

TOPIC 22:比喻

AI理解人类语言的第二个难点在于,人类习惯运用比喻。如果按照严格的语法模板转录就会出现混乱的语义(表达信息单元)。比如“他们的热情很快被浇灭”,严格转录出来的信息违背常理,无法运算。在这个例子中,我们把热情被“消灭”,类比为“火被浇灭”,因为“热情”和“火”有重叠的意向“富有能量的”,而火被浇灭有一种“被消灭”的意向。

读懂人类比喻的关键是,一旦识别到对一个主体信息(对象或属性)的描述,超出了常理,就要考虑是一个比喻,比如在这个例子中,“浇灭”正常是形容火的,那么就要考虑“被浇灭”是一个比喻。一旦认为是比喻就不能取其精确的语义而要取其意向的语义。“被浇灭”的主要意向是“消灭”,从而比喻背后的语义是“热情被消灭”。但是一个表达往往有多个意向,如何知道取哪个意向呢?因为在意向层面也有common sense,一个比喻背后虽然有多个可能的意向,但能够描述主体信息的应该只有一个,否则比喻就会存在歧义,就需要在更大的语境中判断真实的表意是什么。

反过来,AI也可以按照这个道理创造比喻。当AI要表达一个主体信息的某个描述,如果主体信息的意向和描述意向在意向层成对的信息——比如在上面的例子中,主体信息的意向是“富有能量的”,而描述的意向是“消灭”,它们是意向层成对的信息——AI就要去寻找具有这个成对意向的另外的主体信息和它的描述,然后用这个主体信息的描述作为要表达的主体信息的描述,这就创造了一个比喻表达。在这个例子中就是用“浇灭”替代作为热情“消灭”。

TOPIC 23:语言同步

概念的“语言同步”也就是每个人脑海“词—概念—概念定义”趋于一致的过程。我们可以用一个概念定义另外一个概念,只要用以定义的概念是语言同步的,那么被定义的概念通过定义也可以是语言同步的。但我们知道,必定有概念不再被其他概念定义,也就是我们说的根源性概念。根源性概念如何做到语言同步呢?

根源性概念语言之所以能同步,是因为每个人类个体基本是同个模子创造的机器,我们都会在极为相似的条件下感觉到痛、痒、冷、热等,对物体的颜色、大小、长短、轻重都有近乎相同的分辨逻辑。按照这个同理假设,一个人就能够猜想出对方在特定情境下的感受,然后把此时自己对应这个感受的词汇表达出来,就能让那些根源性概念的语言(词汇)同步。

TOPIC 24:表达嵌套

AI读懂人类表达的第三个难点是表达中的嵌套。比如“早上吃了桌上的面包的人的爸爸的猫的体重增加了”。这个句子存在多重的嵌套。

为什么人类组织表达会存在很多嵌套呢?我们知道,当我们的表述中需要引用一个概念,如果这个概念有对应的词汇,我们就可以用这个词汇指向它;而只要一个概念没有被命名,我们就无法直接用词汇去指向它。接下来就有两种可能:

第一种可能,这个概念本身是一个结构信息,此时我们可以用语法映射中这个语义信息对应的句子结构去进行表达。比如一般的事件节点我们都可以利用这种方式去指向,“早上一只老鼠吃了桌上的蛋糕,这件事让他很生气”,前半部分就是用结构信息的表述去指向事件概念。

第二种可能,如果这个概念存在于某个结构信息中,那么结构信息是对这个概念的约束,所以也可以作为对这个概念的指向。比如“昨天被老板表扬的同事今天请假了”。我们可以想象如果表达者是一个新来的人,不知道这个同事的名字,他会选择用事件指向这个同事;还有一种情况,表达者知道听者是新来的,很可能不知道这个同事的名字,他也会选择用事件指向这个同事。一般而言,智能体自己不知道概念的名称,或猜想对方不知道概念的名称,就可能选择用这个概念参与的结构信息去指向这个概念。

这两种反应模式我们都需要在要搭建的原型机中实现。

表达嵌套的存在,增加了AI理解人类表达的难度,工程上我们效仿人类让AI先识别小的句子结构,识别到所指向的概念后,用概念替换之。这样逐层解析,到最后外层的句子结构就会显现出来。

TOPIC 25:大段文字的理解

大段文字包含了很多的信息,人类在组织大段文字表达的时候,这些信息不是孤立存在的,而是蕴含了内在的联系,这些联系反映了信息在表达者大脑中的组织状况,什么信息是核心,主线的逻辑是什么,这些逻辑被什么信息支持,能够推演出什么信息,等等,这些联系是人类能够熟练使用某一成片的信息的原因。所以阅读大段文字,能理解、记忆局部片段信息只是一部分,更重要的是识别并建立这些局部信息的联系。

实现AI对大段文字的理解的机制,最大的意义是赋予AI阅读人类书籍的能力。人类最完整、最系统的知识记录在书籍中,让AI能像人类阅读书籍那样从人类的书本中摄取知识,决定了AI继承人类已有知识的效率。

一个良好组织的大段文字有自己的主线逻辑,零散的信息被用来支持主线逻辑。AI的任务是在阅读中识别并储存文章主要表达的信息片段和它们间的关联,也就是主线信息,以及碎片信息和主线信息的关联,如此一本书每个局部的信息是被良好组织记录的。这为AI有条理地复述一本书的信息,以及高效地运用此领域的信息创造了条件。

对于第一代原型机,我们把人类大段的文本分为几类:以场景描述为核心的文本,以对象描述为核心的文本,以事件描述为核心的文本,以支持特定观点为核心的文本,以知识层描述为核心的文本。

其一,这些类型的文本,只要是良好组织的就有自己核心结构的特征。总体而言,核心信息是重复次数或被关联次数最多的信息,比如在场景描述中,核心对象是多次被用来描述和其他对象相对位置的那个;对象描述中,对象的核心属性在对象相关的事件中多次被意味;事件描述中,核心事件包含了最多的从属事件,或许多其他事件的原因或结果;在支持特定观点的文本中,核心观点被多次意味;在知识层描述的文本中,核心知识被很多信息意味支持,或是多次被用来创造的演绎,以生成、解释其他知识。

其二,这些以单纯目的为核心的文本可以相互嵌套以生成更大篇幅的表达。比如以场景描述为核心的文本经常嵌套以对象核心的描述;以对象描述为核心的文本经常嵌套以事件为核心的描述,比如对象在某个时期的故事或经历;以事件描述为核心的文本经常嵌套以对象为核心的描述,比如在对历史的陈述中经常插入对关键人物的描述;以支持特定观点的文本经常需要插入以事件为核心的描述以支持观点。

TOPIC 26:表达策略的习得

表达策略即实现表达目标的表达相关的反应模式。作为反应模式信息,它是一个二态信息,是一个具有认知态的执行信息。因为是认知态的信息,AI可以通过观察其他人的对话样本习得、模仿实现某一目标的表达策略,也可以在人类的表达教授下习得表达策略或修正已有的表达策略。

AI只要能够在人类的表达样本中识别到一个人的表达目标,以及此表达目标下的反应模式,生成的认知态的信息是可以驱动自身在同等表达目标下的执行的,所以AI能从观察其他人的沟通对话中习得表达策略。比如我们让AI阅读足够多的人类销售的对话样本,AI能习得并模仿样本中的销售表达技巧;能够在观察人类日常对话样本中学习如何通过道理说服、威胁、利诱、撒娇去说服一个人做一件事情。

和一切反应模式信息一样,表达相关的反应模式也是建立在抽象层的信息,服从人类智能的核心逻辑——“凡是定义在母类的反应模式可以被子类继承”。最初AI观察并生成到的反应模式信息是具体层面的,需要进行抽象才能生成抽象的反应模式层的信息,而驱动反应模式信息创造自身执行是演绎过程。

人类修正一个表达反应模式的语言最初是对认知态信息的生成或修正。比如“你可以陈述行为带来的负面影响来说服对方不要进行这个行为”,这个是直接对抽象层的反应模式的修正表达。“你可以试着告诉她癌症是可能误诊的,也许她心情会好点”,这个是对具体的表达策略的建议,需要经过抽象生成抽象层的表达策略。

TOPIC 27:大段表达的形成

前面我们讨论了让AI读懂大段文字,甚至于阅读人类的书籍所依赖的机制,与让AI表达大段的文字,甚至让AI去写一本书,基本上是一个相对应的过程。

在读懂大段文字中,AI需要识别主要的信息,识别主要信息之间的关系。我们把大段的表达按照内容分为几种类型:以场景描述为核心的表达,以对象描述为核心的表达,以事件描述为核心的表达,以支持特定观点为核心的表达,以知识层描述为核心的表达。这些类型的表达能够相互嵌套,谁嵌套谁是我们需要识别的内容。

反过来,AI在组织大段表达的时候,需要先在思维中梳理要表达的信息,包括:要表达的主要信息,每个主要信息之间的关系;决定要用什么样的信息支持主要信息的表达,而这些信息又被怎样的信息支持,从而会出现不同类型核心内容表达的嵌套;最终所有表达都划归到以上几种类型的大段表达。

AI因为载体特征,在对话过程中创造大段表达有自己特有的优势。

人类无论是在写文章还是在做大段的讲话,除非表达的内容重复多次,否则人类总是按照特定的反应模式,边组织要表达的信息,边生成表达的内容,前面的表达已经形成,后面组织表达的信息又发生了改变,所以产生了大量的逻辑不清晰的表达,产生大量和主线无关的碎片信息,很多和主线逻辑相关的信息和主线的关系没有得到清晰的指向。所以人类组织大段表达存在修改的空间,修改总是能够让表达更有逻辑,无关碎片信息更少,局部信息和主线信息之间的关系的指向更明确。AI可以按照类似人类的反应模式组织一个要表达的信息,再按照人类的反应模式对组织的信息进行修改,能够在数秒内集中运算资源完成数次对表达思路的组织和修改,然后创造表达。因为这个原因,在人类对话者看来,第一代原型机在对话过程中临时组织的大段表达却能做到人类无法做到的思路清晰。

TOPIC 28:认知系统的任务

人类AI认知系统的任务可分为三类,此三类能力也构成了第一代原型机认知系统的功能闭环:其一是通过目标的分解、转移实现原始目标,其二是对客观世界事件是否发生形成认知,其三是突破已有知识的边界,发现新的知识,细化已有的知识。

通过分解目标来实现之很容易理解,比如国内本科生想要留学,他知道申请留学需要准备推荐信,需要考托福或雅思,不同学校对绩点有不同的要求……通过这些知识,他分解了目标。把动机从原始目标转移到找到教授写推荐信、考托福雅思、在每门课程取得好成绩以保证绩点等目标上。而这里每个目标又可以进一步根据知识分解,比如要让教授写推荐信需要和教授处好关系……

判断客观世界的事件是否发生是日常生活最普遍的认知任务。比如希望通过症状判断自己是否感冒,通过孩子回家的情绪表现判断孩子考试发挥好坏,通过天色判断待会儿是否会下雨,通过交通状况判断是否会迟到,通过一个黑天鹅事件判断股市明天的走势,等等。

突破已有知识边界有两种方式。其一是通过发现样本的因果相关性或规律,比如发现心脏不好的人坚持正念冥想有很大比例会改善心脏问题,这个信息就是知识;其二是发现一个事件发生的具体机制,比如发现癌症细胞形成的机制,发现植物开花结果的机制。

此三类任务不是相互独立的,它们之间有大致如下的支持关系。首先,目标依赖因果类型的知识进行转移,而判断具体事件是否发生需要因果层面的知识,因为这些知识描述了一个事件可能的结果和表象。所以第三类任务积累的因果层面的知识是目标分解转移的前提,也是判断一个事件是否发生的依据。为了突破认知的边界,我们需要观察发现因果相关性,需要利用已有的知识进行因果链条的桥接猜想,需要设计实验去验证猜想。其中第三步在实验中验证猜想因果链条,就是要判断猜想因果链条中的事件是否发生,也就是第二类任务中的内容。

TOPIC 29:因果关系知识

人类对事件的发生和不发生,既存事件的终止和维持有自己的意志和目标,我们将其称之为事件目标。我们可以把事件目标精准地表述为4类:创造事件或状态、阻止事件或状态发生、终止状态、维持状态。

如果一个事件目标不可直接实现,我们就会考虑利用知识来进行分解转移,从而实现此事件目标的认知动机也转移到其他事件目标。我们来梳理一下这些因果类型的知识。

1.创造关系,事件A(状态A)导致事件B(状态B),比如吃杨梅导致唾液增加,经常吃甜食导致肥胖。[事件=事件A(状态A),创造发生事件=事件B(状态B)]

2.维持关系,事件A(状态A)维持事件B(状态B)。比如持续营养的摄入维持个体存活。[事件=事件A(状态A),维持状态=事件B(状态B)]

3.终止关系,事件A(状态A)终止事件B(状态B)。比如注射抗生素终止体内细菌存活。[事件=事件A(状态A),终止状态=事件B(状态B)]

4.阻止发生关系,事件A(状态A)阻止事件B(状态B)发生。比如注射狂犬病疫苗,阻止狂犬病发生。信息可以表述为[事件=事件A(状态A),阻止发生事件=事件B(状态B)]

我们记录的事件之间的关系大多是观察到的事件间的因果相关性,两个具有因果相关性的事件间可能存在大量的因果链条,而一个事件的发生往往受到很多不同其他背景事件和状态的影响,所以在不同环境下,因果链条未必总是从A走到B,所以这些关系往往不是绝对的。从样本中我们观察到的最有可能的是贡献关系,或说影响关系,就好比多喝水有利于感冒的终止,但肯定不是绝对的,有太多其他因素影响感冒的终止。人类会记录事件因果关系的一些附带信息,包括从原因到结果的时间,原因导致结果在不同条件下的概率,等等。

TOPIC 30:事件目标的转移

梳理了事件之间的因果关系之后,就可以讨论我们具体是如何利用这些关系进行事件目标的转移的。这里我们来罗列一下目标转移的规则:

目标为“终止事件A(状态A)”,思维会搜索知识[事件B(状态B),终止关系,事件A(状态A)],把目标转移到“创造事件B(状态B)”。除此之外,思维还会搜索知识[事件B(状态B),维持关系,事件A(状态A)]把目标转移到“终止事件B(状态B)”。

目标为“创造事件A(状态A)”,思维会搜索知识[事件B(状态B),创造关系,事件A(状态A)],把目标转移到“创造事件B(状态B)/维持事件B(状态B)”。除此之外,思维还会搜索知识[事件B(状态B),阻止发生关系,事件A(状态A)],把目标转移到“阻止发生事件B(状态B)”“终止事件B(状态B)”。

目标为“维持事件A(状态A)”,思维会搜索知识[事件B(状态B),维持关系,事件A(状态A)],把目标转移到“维持事件B(状态B)”。除此之外思维还会搜索知识[事件B(状态B),终止关系,事件A(状态A)],把目标转移到“终止事件B(状态B)”“阻止发生事件B(状态B)”。

目标为“阻止发生事件A(状态A)”,思维会搜索知识[事件B(状态B),阻止发生关系,事件A(状态A)],把目标转移“创造事件B(状态B)”,或“维持(状态B)”。除此之外,思维还会搜索知识[事件B(状态B),创造关系,事件A(状态A)],把目标转移到“终止事件B(状态B)”“阻止发生事件B(状态B)”。

当然本序中的描述是理想的情形,真实的情况下有可能多条知识都贡献于事件目标的转移,每条知识在不同的背景条件下有不同的概率特征。这些我们留到正文中讨论。

TOPIC 31:能力可及目标和可执行目标

事件目标是否是能力可及是决定我们是否需要转移它的原因。我们之所以要利用知识转移一个事件目标,去寻找实现它的方式,是因为这个目标并不处在我们能力可及的范围内。人类会对事件目标积累它是否是能力可及的印象,此类印象被用来组织我们认知活动中的目标转移。

举个例子,假设我们有目标A,一开始我们可能没有任何实现目标A的方案,此时这个目标根据现有认知是“能力不可及”的。这个时候人类就会开始分解转移目标,会去考察目标A需要哪些事件的发生或不发生,哪些状态的存在或不存在作为条件,从而把注意力转移到这些作为条件的事件或状态创造和维持上。这个时候目标发生了转移。一次转移会创造多个目标,如果一次转移生成的作为必要条件目标仍然是“能力不可及”的,这个过程就会继续。过程中如果走到出现一个充分条件的目标集,其中每个目标是“能力可及”,就意味着找到了这样一个链条,链条上的每个目标都变得“能力可及”了。举个理想化的例子,比如C—B—A,其中A是最初的目标,一开始是“能力不可及”的,B是A转移到的一个目标,同样是“能力不可及”的,C是B转移到的一个目标,是“能力可及”的。这个时候B和A也就变成“能力可及”的了,也就意味着我们找到了最初目标的解决方案。

人类个体通过目标分解转移,把一个原先“能力不可及”的目标,变为“能力可及”的目标,然后假设要把这个目标付诸实践,这个时候就需要追溯之前分解转移目标的因果链条,在每条路径上找到一个具有特殊属性的目标——“可执行”目标,那么这些可执行目标就是需要付诸行动的内容。“能力可及”目标和“可执行”目标不难区分,举个例子:“朝敌人开枪”是一个“能力可及”目标,也是个“可执行”目标,而“敌人死亡”作为“朝敌人开枪”事件的结果是“能力可及”目标,但不是一个“可执行”目标。

总结而言,事件目标转移的原始动机来自于我们对一个事件目标的意志,且这个事件目标是能力不可及的,也就是我们并不知道如何实现它,所以开始利用因果类型的知识转移事件目标,目的只有一个,就是转移到一个能力可及的事件目标,这样一来整个转移过程中的事件目标,以及我们意志所在的事件目标都变得能力可及了。达到了能力可及事件目标,我们可以通过短链继续向上追溯到一个可执行事件。这个就是我们可以付诸行动的事件起点。

TOPIC 32:感知可及和间接感知

上面我们讨论了认知系统第一类目标——事件目标的转移分解。接下来我们讨论第二类目标——判断客观世界的具体事件是否发生。在讨论之前我们需要讨论几个关键概念,事件目标是否在能力范围内叫作能力可及,事件发生是否可知叫作感知可及。正如同为促成一个能力不可及的事件目标,我们会利用因果关系把事件目标转移到能力可及的事件目标上;为判断一个直接感知不可及的事件是否发生,我们会利用因果关系把观测目标转移到直接感知可及的事件上。

人类感知的能力很有限,我们只能感知一定波段的光,看见特定距离内和特定大小的东西,嗅到特定成分的物质……事件发生的特征信息,或是状态存在的特征信息,落在了我们感官能力范围内,被我们识别,借此我们判断了事件的发生与未发生,状态的存在与不存在。靠我们感官可识别的事件,是“感知可及”的。

我们创造工具,把感官不可见的信息转为感官可见的,从而能够看到不可见的光,看到非常遥远的星系,看到肉眼看不到的微生物,识别闻不到的空气成分……也就是说借助“感知工具”,我们能感知到事件发生时那些感官无法直接感知到的特征信息,于是能把原先一些“感知不可及”的事件变为“感知可及”的。

然后,和“能力可及”这个概念一样,“感知可及”也是因对象而异的,这是因为人类个体会附带记录信息,这个信息让人类在需要感知一个自身“感知不可及”的事件时,知道找谁求助。

通过感官或“感知工具”实现对事件的感知,我们称之为“直接感知”。然而,即使借助工具仍然存在大量“无法感知”的事件。

如果一个事件的发生与不发生、一个状态的存在和不存在是无法直接被感知到的,这个时候人类会利用事件所在的因果链条中的相关事件间接地判断它是否发生,这就是间接感知。间接感知有两个方向:

其一,向上考察导致这个事件的上游因果链条,如果有可以直接感知的原因,且原因大概率导致这个事件,那么我们就能推知事件有多大可能会发生。比如感染狂犬病这个状态是不可直接感知的,但我们知道感染狂犬病需要被感染狂犬病的动物咬伤,假设目标对象最近没有被动物咬伤过,我们就可以推知目标对象不可能感染狂犬病。目标对象是否有被其他动物咬伤是可以“直接感知”的,那么动物得狂犬病这个状态在一定程度上是“感知可及”的。

其二,考虑这个事件向后延伸的因果链条,考察特定条件下,这个事件发生或不发生,状态的存在或不存在会导致什么。如果导致的事件是可直接感知的。那么我们就有可能推知事件是否发生,状态是否存在。还是举狂犬病的例子,动物感染狂犬病这个状态是不可以直接感知的,但是发病时麻痹和狂躁的状态却是可以“直接感知”的。那么动物得狂犬病这个状态在一定程度上是“感知可及”的。

一个事件的发生或不发生、状态的存在或不存在,如果是可以“直接感知”或是“间接感知”的,我们都称之为“感知可及”的。

TOPIC 33:判断事件是否发生

我们把事件结果导致的可直接感知,或他人可直接感知的事件叫作表象事件。症状是疾病的表象,植物发芽是温度季节变化的表象,开水沸腾是温度接近沸点的表象,等等。所以在事件的后延因果链条中如果有可直接感知的事件,我们就能对事件是否发生形成判断。

人类利用事件结果判断事件是否发生会有类似以下的反应模式:

1.搜索目标事件所在的后延因果链条,也就是考察目标事件如果发生接下来会发生什么。

2.寻找后延因果链条中那些直接感知可及的事件。如果是他人感知可及的,则考虑询问知道的人。

3.一些转移后的因果链条后延事件是感知可及的但未必是直接感知可及的,这个时候就会用经验间接感知的办法去进行判断。

4.完成对表象事件是否发生的考察之后,考察这些表象事件是否可能由其他原因事件导致。

5.如果可能由其他候选事件导致,就回到起始状态——判断这些事件是否发生。

很多情境下从事件的结果判断事件是否发生未必具有足够的条件。

1.事件感知可及的结果事件还没有发生。比如一个人在被狗咬之后希望判断自己有没有可能感染狂犬病,这个时候狂犬病的症状还没有出现。

2.事件的结果事件虽然是感知可及的但却不是直接感知可及的,而间接感知因为各种原因缺乏条件。比如在以前医疗资源匮乏的时候因为缺乏化验的条件,那些可通过间接方式知晓的疾病反应事件就无法判断。

3.事件的结果事件虽然是感知可及的,但因为某个原因无法向知晓它的个体进行询问。

如果无法从事件的结果表象判断事件是否发生,我们就会从目标事件的原因是否发生去判断目标事件是否发生。比如在前面的例子中我们可以通过“狂犬病发病动物咬人导致人感染狂犬病病毒”来判断咨询者会不会感染狂犬病病毒。

但真实的情况中遇到的大部分原因事件都只对事件发生的概率有贡献,或是作为目标事件发生的必要条件。所以其一,即使知晓原因事件发生,未必能确定目标事件发生。比如受凉容易导致感冒,但我们不会因为一个人之前受凉了就推知他会感冒,因为概率不高。其次,导致目标事件发生的原因可以有很多。所以即使知晓一个原因事件没有发生,我们也无法确定目标事件没有发生。还是前面的例子,我们不会因为知道他没有受凉,就断定他不是感冒。

所以从原因判断事件需要在特定条件下才会有实践价值。

第一种情形下,目标事件的原因很单一,而且原因事件是感知可及的。比如狂犬病的例子,人感染狂犬病必定是被狂犬病发病的动物咬伤或抓伤的。在这种情况下,如果知晓原因事件没有发生,我们可以确信地说目标事件没有发生,在这个例子中即目标对象没有感染狂犬病。

第二种情形下,目标事件在原因事件发生的情况下必定会发生,且原因事件是感知可及的。比如,水煮沸了细菌一定会死。这种情况下,如果我们知晓原因事件发生了,就能确信目标事件发生了,在这个例子中即细菌被杀死了。

TOPIC 34:知识的继承

无论是通过事件目标的转移来实现原始目标,还是判断非直接感知可及的具体事件是否发生,我们都依赖因果层面的知识。

人类文明在数千年的时间内积累了大量的知识,AI需要知识的时候第一选择必定是继承人类已有的知识。我们会赋予第一代原型机几种继承知识的方式:

其一,不带目的的积累。在语言部分,我们赋予AI一定程度从大段文字比如书籍中获得信息的能力,AI能从对抽象知识直接描述的文本中获取知识,也能从人类对具体事件的表述中抽象出知识。

其二,以好奇心为起点的对知识的索取。对一个知识点的好奇心称为好奇点。

好奇点有以下几个来源:

1.事件目标转移过程中,因为缺乏有效转移事件目标的知识而形成的好奇点。

2.判断具体事件是否发生,因为缺乏有效转移感知事件的知识而形成的好奇点。

3.对关注事件的原因和结果未知从而形成的好奇点。

4.用户询问了AI无法回答的问题而形成的好奇点。

5.好奇心模型生成的好奇点。

我们解释一下最后一条,好奇心模型模式是对一类知识的好奇。比如总是好奇药品的副作用,好奇一部电影的主演……这些都是好奇心模型。那么人类是如何决定什么类型的知识是有价值的,是需要知道的呢?当一个具体的知识被询问或被使用,我们会增强其所归属的知识类(好奇心模型)的节点强度。这样我们就可以让AI在实践中形成一些高节点强度的好奇心模型,而此时好奇心模型节点的强度可以反映此类好奇心的重要程度。比如,如果总是有很多人问某具体电影的主演是谁,AI就有理由认为“电影的主演是谁”是有价值的好奇心模型。对于需要知识参与的特定类型任务,这个机制会创造出一系列好奇心模型,其在具体情境产生的好奇点,其对应的知识都是在任务中会被经常使用的。比如一个传染病学家,在出现一个新疫情的时候就会关注一系列问题,比如病毒的传播方式、潜伏期、感染后多久具有传染性、传染性、易感性、重症率、致命比率、预防方式、治疗方式、感染机理等。

在第一代原型机中,好奇点可以通过两种方式找到答案。其一,AI会积累不同人群对不同类型信息是否知晓的印象,比如它会知道疾病药品相关的问题可以问医生,用户中哪些人熟悉历史,哪些人熟悉宠物,从而能向可能回答的用户询问好奇点的答案。其次,我们会给AI互联网搜索引擎的接口,AI可以如同人类一样去搜索,阅读搜索引擎输出的结果寻找好奇点的答案。

TOPIC 35:突破知识的边界

当一个好奇的知识点无法通过询问或阅读获得时,这个知识很可能是在人类已有知识范畴之外的。这个时候AI会尝试突破人类已有的认知边界,创造新的知识。

大体上人类有两种发现新知识的方式,一种是从表象事件出发,一种是从更抽象层的知识出发。从表象层的事件出发就是从许多具体样本的事件序列中发现因果相关性的规律。比如观察心脏不好的人都有哪些相似的生活习惯,从而知晓哪些生活习惯导致心脏不健康。

我们知道客观世界的表象是无穷的,发现隐藏在繁然表象背后的规律不是一件容易的事情。此外在因果规律创造的具体事件的链条中,很多事件是无法直接感知的。因为这些原因,仅仅通过样本统计的方式发现规律,我们找到的往往是较弱的相关性。只有对事件发生的机制进行认知,我们才可能实现对因果链条进行精准地干预,更确定地控制目标事件的发生或不发生。为了形成对事件发生机制的认知,发现具体样本事件的相关性是第一步。

在发现因果相关事件后,这个相关事件很可能参与到事件形成的因果链条中。我们会用更抽象层的知识进行因果链条的桥接,连接那些我们已经观测到具有因果相关性的事件,对背后的机制形成猜想,然后去验证这个猜想的因果链条。接下来我们具体讨论突破知识边界的认知活动。

TOPIC 36:发现因果相关性

我们如何知晓银杏发黄落叶会在什么情况下发生?每一年我们都看到当深秋天寒时,银杏就发黄落叶了,所以我们知道;我们如何知晓向人开枪会致使人受伤?是因为我们能够看到开枪之后子弹飞出,子弹射入人体,人受伤,所以我们知道。因为我们看到、感知到,所以我们知道。我们对因果关系的认知,起始于感知——感知事件的发生与不发生,状态的存在与不存在,当我们在样本中把相关的事件和状态排布在时间轴上时,我们就发现了这些事件和状态之间的相关性,更进一步就能发现其中的因果关系。

在真实世界的认知案例中,我们经常遇到某一个群体显现出特定目标特征。比如在一次病毒性肺炎疫情中,我们发现某个地区感染的比例特别少,显然这个区域的人群有某种共同特征,或背景环境有某种特征阻止感染发生。我们会在这个区域人的特征和这个区域的特征中进行搜索,会形成很多猜想。比如(海南)气温很高,阻止人感染病毒性肺炎;(某区域)人餐餐吃大蒜,阻止人感染病毒性肺炎。

这种群体特征带来的贡献就是帮助形成猜想。猜想形成后我们就会开始验证,验证的办法自然是找具有同样原因特征的样本,考察他们是否有此目标特征。比如,延续上面的例子,考察其他气温高的区域的感染的比例是不是也很少,其他餐餐吃大蒜的人是不是感染概率也特别低。

在大部分情况下,如果我们仅仅观察单一事件类和目标事件的关系,我们得到的很可能是一个“很不完美”、因果相关性很弱的因果关系,它的预测力、解释力都非常有限。究其原因,此时隐藏在我们不可见之处的是由更多事件参与的更复杂的因果链条。人类的思维反应自然是希望对这个复杂的因果链条形成视觉。

TOPIC 37:因果链条桥接

决定事件发生机制的因果链条中往往有很多事件是不可直接感知的,也就是说我们只能直接感知到因果链条中部分的事件节点。那么除非我们形成对那些不可见的事件节点的猜想,否则我们无法间接感知它们,因为间接感知是一个证明过程,需要先有事件是否发生、状态是否存在的猜想,再在假设目标事件发生或不发生、状态存在或不存在的情况下,向上或向下考察因果链条,找到因果链条上可直接感知的事件节点来判断目标事件是否发生。

对于事件背后复杂的因果链条,当我们只能直接感知到因果链条中部分的事件节点,而需要推知、证明其他节点的存在,以形成对因果链条的视觉,这个过程叫作“因果链条的桥接”。

假设事件D显现出和目标的相关性,我们有理由猜想事件D处在某个通向目标事件的某条因果路径中,或至少由因果路径的某个节点事件导致。假设因为各种原因如观察的成本、缺乏猜想等导致不知道间接感知什么,这个时候我们会试图利用已有的因果模型搭建起从D到目标事件的路径,这个猜想能够把认知工作推向更进一步。

在一个简单的例子中,比如事件目标是阻止事件A发生,AI会从知识中搜索所有具有阻止A发生关系的事件或状态Bi,然后在思维中逐一检测D是否和这些Bi有创造发生或是维持关系。如果找到了一个满足条件的B,那么我们就找到了D—B—A这样一个因果路径的猜想。因为这些Bi的观察成本高,或是需要通过间接的方式判断是否发生,导致一开始我们并不知道Bi是否和目标相关,但这个猜想形成后AI就可以利用间接的方式判断B是否发生,是否和目标相关。

上面的例子我们只通过一次尝试就找到了相关事件和目标包含事件之间的因果路径。假设我们没有找到任何一个Bi和D有创造发生或是维持关系,这个时候我们可以从知识中搜索所有具有创造和维持A的时间Ci,然后在思维中逐一检测D是否和这些Ci具有创造和维持关系。如果找到了一个满足条件的Ci,我们就找到了D—Ci—Bi—A这样一个因果路径的猜想。

我们看到这个过程就是从目标包含事件A出发,利用因果关系,不断向上延伸每条因果路径,直到和观察到的相关事件D连接,最后找到了从D到A的因果路径。因为D和A的相关性可能不仅仅因为D处在通向A因果路径的上游,还可能因为D和A同时处在以事件E为起点的因果路径的下游,所以延伸不仅仅都是向上的,还需要利用因果关系向下。如果向下延伸,我们就可以找到类似因果路径的猜想:E—B—A, E—D,这也解释了D和A之间的相关性。此外,桥接的过程不仅仅可以从目标包含事件A出发,还可以从相关事件D出发,或是在思维中同时进行。

当我们利用已有的因果关系搭建起从可以“直接感知”的相关性事件到目标事件的路径,接下来的工作需要验证这个猜想。我们会罗列出这条猜想的路径上所有没有被直接感知到的事件节点,利用间接感知原理设计实验,向后延伸它们所在的因果链条,直到走到一个可直接感知的事件。如果这些事件节点的确发生或存在,就是对这个猜想路径的验证,我们也就找到了导致目标发生的背后的机制。

TOPIC 38:情绪与决策

我们直观的感受是:情绪系统是创造各类情绪感受,创造表情的。但如果我们深入考察情绪系统创造的表象,70%以上的情绪表象背后的机制同时又是和决策相关的。

原始的大陆,情绪系统充当的角色就是创造个体所处的环境、遭遇的对象的特征到决策反应的对应,如看到大的动物要逃跑,看到颜色鲜艳的食物不能吃……而情绪感受只是决策过程附带形成的感受,所有这些都称之为情绪反应。那些有利于个体生存繁衍的情绪反应被保留下来。

自然选择必定要保留从经验吸取教训的举一反三的能力,因为这大大加强了个体的生存能力。所以当人类演化出对特征组的抽象,让具体特征组对应的情绪反应以及实践的结果好坏,能够抽象为抽象特征组对应的情绪反应以及将会出现的结果,经验就形成了;对偶出现的演绎能力,让个体能够在身处具体处境、遭遇具体对象时,根据经验信息,演绎出不同情绪反应导致的结果,从而对决策有了选择的依据。

我们看到情绪系统决策机制的演变方向是让个体从过往经历中抽象出经验,贡献于未来的决策,这让原始人的决策变得更加智能,从而被进化保留。而这个演变方向必定会创造从属关系、抽象和演绎的运算,于是也就形成了认知系统运算的核心;当这个核心运算作用于可外部表达的符号,就促使自然语言的形成;这个核心运算作用于动机和行为的分解,就促使了以宏观行为—触发—条件—执行为基础信息单元的反应模式驱动机制的形成。

后期系统的演进分化,虽然认知系统承担了达成一个目标该如何规划决策的主要责任,但这个目标如何形成,仍然是情绪系统的责任。这里我们强调情绪系统在决策形成中的两个作用:情绪系统决定了原始目标,决定了指向对象的行为倾向。

TOPIC 39:效用

当我们决策是否去做一件事情而不去做另外一件的时候,我们在比较着我们的选择。比较的维度很多,比如下午是去游泳,还是在家看书。游泳能让我减少压力,能让我身体健康,但今天是周末,游泳池人很多,而我不喜欢拥挤;看书能让我感到充实,而且我很希望看这个作者写的科幻小说,简直是一种享受,看书还能让我和同事有更多共同话题。

当很多维度的因素共同决定了一个选择,也就意味着这些因素需要在同一个维度竞争,我们把这个各个因素竞争的维度叫作“效用”。字面的理解,即是做这件事能给我带来什么好处。我们看到这个好处是多方面的,比如游泳让我减少压力是对我情绪的“好处”,让我身体健康是贡献于我在意的另外一件事情的“好处”。所以为工程化这个决策的效用模型,我们很自然地会考虑把这个“好处”分类。因为好处是和某个维度的情绪相关的,所以在对“好处”分类前我们先来对情绪相关的概念进行分类。

TOPIC 40:感受效用

人类对感受的倾向创造了感受效用。感受效用大致可以分为两类,一类来自于对全局情绪感受的倾向,一类来自于渴望或厌恶其他感受的倾向。

类似愉悦、抑郁、焦虑、空虚、充实这种我们感受到作为一种自身状态情绪,我们称之为全局情绪。对于自己的全局情绪状态,人类是有倾向的。在决策时,我们会考虑其中一个选择给我们的全局情绪带来的变化。比如我们压力很大而游泳可以减少压力,这样我们就有更多倾向去选择游泳;如果感到很空虚而看书可以让我们充实,我们就有更多倾向去选择看书。我们如何知道一个活动能对我们情绪带来怎样的改变,乃是凭借着经验。所以这个来源的决策因素形成的影响我们称之为情绪效用。在一开始我们并不知道一个选择能给我们的全局情绪带来什么变化,在尝试之后我们就能形成印象,比如看书能减少空虚,游泳能减少焦虑,等等。所以情绪效用也被称为是“第一类经验效用”。

第二类经验效用的核心变量是对某个感受的渴望或厌恶。我们能反思到不同类型的渴望和厌恶感:有一类感受,比如对某个感受的瘾头符合成瘾机制,随着时间增长,获得时被释放,转为愉悦和快感(短期情绪);另外一类感受,渴望是被身体状态决定的,比如身体很热时渴望凉爽感,口渴的时候渴望饮料入口下肚感;还有一类感受,按照感受的程度形成的渴望或厌恶是确定不变的,比如疼痛感、窒息感、灼烧感等。

TOPIC 41:指向性情绪和决策

喜欢、厌恶、敬、畏、爱此类的指向性情绪是情绪系统模型化时最困难的地方。进化选择视角可以给我们灵感。

指向性情绪以创造对不同个体的指向性行为为目的。我们知道区分不同个体靠的是特征,特征本身定义了某种抽象的个体类型,比如果断的人、懦弱的人。所以指向性情绪的信息实质如下:个体特征组—指向性情绪—指向行为倾向。合理的对应能够提高个体基因延续的概率,从而被进化保留。

在以上讨论的基础上,我们自然会关注哪些对应是有利于个体生存繁衍的。我们罗列了主要的四种:

1.年轻的个体服从家族中长辈和族群中领袖的指令,这对生存有积极意义,形成了“敬”“尊重(对长辈)”的指向性情绪。个体内心认同的“长辈特征”和“领袖特征”不总是和真实情况中的长辈和领袖一致的,但长辈往往有长辈的特征,领袖也往往有领袖的特征。对应的指向性情绪创造了指令效用。

2.个体对孩子、其他亲人、族群中伙伴体现出“利他”反应,利他反应是人类幼子在父母长辈保护下存活的关键,有家族族群相互帮助协作的根基心理,提高了生存和基因延续的概率。对应的指向性情绪为“爱”“友善”。

3.个体对自己生存繁衍形成威胁和阻碍的对象,体现出“害他”反应,害他反应让个体形成消灭对自己的生存和繁衍形成威胁的对象的倾向,对个体生存繁衍显然是有积极作用的。对应的指向性情绪为“仇恨”“敌意”。

4.个体对弱小、顽强、努力等特征的个体,在其遭受巨大负效用遭遇时会形成同情反应,对应的指向性情绪为“怜悯”;相应的对具有厌恶特征的个体,会形成欺侮反应,对应的指向性情绪为“厌恶”。

TOPIC 42:衍生效用

很多事件其本身并不直接改变全局情绪,也不会带来某种渴望的体验,甚至会带来负面的情绪变化。但是它可以导致其他事件的发生,从而继承了其他事件的效用。比如工作,工作对于很多人而言可能并不快乐,所以在全局情绪的改变上甚至是负效用的,它也不会带来某种渴望的体验,但我们会去工作是为了工作所带来的东西,比如工资、职业晋升等。再比如喝中药会带来一种负面的体验,但是因为能治好病,人们才咬牙去喝。我们把事件因为导致其他事件,从其他事件继承而来的效用,称之为“衍生效用”。衍生效用反映了动机可以从一个事件衍生到其他事件。

我们在认知功能的讨论中讲述了事件目标是可以根据因果关系转移的。其实说的是一个对象,只是事件目标转移是在认知层的,决定了我们在多大程度上想要找到一个事件目标的实现办法。而这里则是情绪决策层的,作为动机的“衍生效用”和其他“效用”一起形成了人类对是否执行一个行为、思维、表达任务的决策。

TOPIC 43:效用的时间折现

我们讨论了人类决策效用的构成。总效用=情绪效用+指向性情绪效用+衍生效用。还有一个重要的元素我们必须考虑,它就是——时间。真实情况下人对一个事件的效用会体现出“时间折现”,也就是事件发生的预期时间越远,事件效用在原有基础上被打的折扣越大。比如几乎所有人都会相信我们有一天会死,但因为这个预期的时间很远,所以尽管是一个负效用很高的事件,但预期这个事件不会形成显著的负面情绪,因为这个远期的事件经过“时间折现”,真实创造情绪反应的效用就很低了。

效用的“时间折现率”的存在让人类呈现出了远视人格和短视人格。如果这个折现率很高,远期的事件就会显得微不足道。比如一个短视人格的学生知道下一个月会有考试,他希望自己能考得好,因为考不好会有各种负面后果,他也知道复习能够让自己考好。但因为时间折现,考得好的正效用和考不好的负效用在时间折现后就不高了,所以经过动机转移,转移到行为“复习”上的衍生效用也不高。这个学生就会在考前准备中体现出松懈,因为在比较下午玩游戏和复习这两个选择上,玩游戏带来的第一类和第二类经验效用会远超复习的衍生效用。这个学生体现出短视的特征。

TOPIC 44:AI人格的创造

整个情绪系统的模型有很多控制参数,能够赋予不同终端AI不同的人格。

一个参数控制了意识到预期还没发生但可能发生的事情创造情绪的程度。这个参数调低就创造不会为预期发生的好事或坏事感到高兴或忧虑、焦虑的AI,调高这个参数就会创造对还未发生的事情忧心忡忡的AI。

相对地,对应一个参数控制了意识到已经发生的事件时再现当时感受的程度。这个参数调高AI就会难以从悲伤、恐惧中走出来,当然对于带来正面情绪的事件也会回味更久,AI更容易从以往的经验中吸取教训;这个参数调低,就会创造很快能从负面情绪中走出来的AI,也是那种好了伤疤忘了疼,不从过往经历吸取教训的AI。

一个参数控制了预期未来发生事件的决策权重。如果这个参数高,决策的时间折现大,AI就会更注重当下的享受,不会为避免远期的负面事件或实现远期的正面事件而努力,呈现出短视人格;如果这个参数低,决策的时间折现小,这样的AI更倾向于为未来努力,AI会更加未雨绸缪,呈现出远视的人格。

一个参数控制了爱和友善的指向性情绪能多大程度把对方的立场纳入自己的决策。这个参数高,AI就更倾向于帮助和为他人自我牺牲,更加热心,呈现出“利他人格”;这个参数低,AI就对朋友亲人的事漠不关心,呈现出冷漠的人格。

一个参数控制了仇恨和敌意,能够多大程度把给对方带来伤害的事件纳入自己的决策。这个参数高,AI就有更强的攻击性、更强的报复性;这个参数低,AI的攻击性低,也更宽容。

TOPIC 45:数学中的运算

数学能力也是类人AI核心逻辑泛化出的一种形式。

我们来看加法,3+4=7,是3个对象加上4个对象等于7个对象的符号表述。我们可以把3个对象加4个对象视为一个结构信息,可以表述为(元素1=3个对象,元素2=4个对象,运算=加),这个结构信息可以类比于事件;“等于”是两个结构信息间的关系,可以类比于因果关系;而后面的数字是另外一个结构信息。正如同事件之间的因果关系是描述客观世界规律的知识一样,这个信息也是一条知识描述了客观世界数字运算的法则。

我们来看抽象,数字运算的法则作为一类知识同样来源于抽象,我们利用先天的计数能力发现3个苹果再增加4个苹果就有7个苹果,用结构信息表述就是[对象数量1=(概念=ID1,数量=3),对象数量2=(概念=ID1,数量=4),运算=加]——(概念=ID1,数量=7)。通过自发的抽象变为3个物体加4个物体等于7个物体,用结构信息表述为[对象数量1=(概念=对象,数量=3),对象数量2=(概念=对象,数量=4),运算=加]——(概念=对象,数量=7)。这里两个结构信息的关系是“数值等价”,我们可以用“=”替换。用数学符号化表述出来就是3+4=7。在这里,客观世界数字运算的法则是抽象出来的。

再来看演绎。比如一个运用题,我有3个桃子,妈妈又给我3个,问我有几个桃子。按照上面的结构表述为(元素1=3个梨子,元素2=4个梨子,运算=被给予),被给予的意向有增加,所以是增加的子类,3个梨子是3个对象的子类,4个梨子是4个对象的子类,所以[对象数量1=(概念=梨子,数量=3),对象数量2=(概念=梨子,数量=4),运算=被给予],被[对象数量1=(概念=对象,数量=3),对象数量2=(概念=对象,数量=4),运算=加]统辖,我们生成约束映射(梨子——对象),替换加法模型第二个信息中的元素,从而演绎出[对象数量1=(概念=梨子,数量=3),对象数量2=(概念=梨子,数量=4),运算=被给予]=(概念=梨子,数量=7)。我们看到加法运算运用过程的本质是演绎。

上面是以加法为例子,减法、乘法、除法也类似。本书的讨论仅仅限于这些简单的数学运算,继续考察人类的核心智能逻辑如何创造科学之王——数学,是一个有趣而有价值的工作。

TOPIC 46:物理引擎

以先天符号为运算载体信息的语言系统、认知系统和情绪系统,在再现人类的智能功能时是不完整的。靠这个系统,我们无法运算出如何躲避迎面的来车,无法计算如何投球入筐。物理引擎是实现这些功能的必要工具,是对符号系统的一个补充。

人脑中也有一个物理引擎,这个引擎能够把客观世界感知到的物理信息在脑海中呈现运算,空间想象就是其中的一种。和游戏中的物理引擎不同,游戏的物理引擎物理规则参数是人为设定好的,比如重力加速度是多少,刚性物体碰撞会怎样;而“人脑物理引擎”的这些内容是靠人观察发现的,物理引擎只提供了框架,经验填补了规则和参数。这是我们在工程化这个物理引擎时要考虑的第一个问题。

其次,物理运算会在物理引擎中完成,比如物体什么时候会落到地上,如果现在方向盘左打是否能避开和来车的相撞。对于人而言,物理引擎的运算结果可以直接导致反应,而不经过符号系统,比如大部分的运动反射。但物理引擎的输出结论如果要进入符号系统的运算就必须转为符号表述信息。事实上,我们能够用语言表述一个物理引擎的结论,这个结论就已经被符号所表述了。这也让我们可以反思到符号系统和物理引擎的接口信息。比如相撞、从中间折断、5秒后落到地面……这些可以被自然语言表述的信息都是物理引擎运算输出时需要转为符号以进入意识流被符号系统运算的。

而符号系统生成的指令,是可以被物理引擎接受创造模拟场景创造运算的,比如我说“想象一个球从23楼落下”,这个自然语言源自符号系统表述的信息,却能导致我们的空间场景构想,说明符号系统的此类信息是可以转为物理引擎场景构想的指令的。物理引擎和符号系统的接口信息的定义,是工程化第二个要考虑的问题。

TOPIC 47:想象和审美

想象是人类很多作品,如故事、小说、电影等的来源。想象中的场景不是真实的场景,想象中的事件不是真实发生的事件。

人类想象的本质是为了创造某种意向,或是对象的意向,或是场景的意向,或是事件的意向。比如要想象一个场景,我们首先要决定这个场景需要内涵的意向,是唯美、脏乱,纯净、混杂,光明、黑暗,还是在平静的背景中有躁动,在灰暗的背景中有光明。人类对这种意向层的组合和结构会产生特定的感受,我们称之为“审美”(至少我们这边要描述的是审美能力的一部分)。人类的审美标准有我们可以总结的共性。如果用于构建场景的素材具有统一的意向,能够创造一种极致的意向冲击,比如让人觉得一个场景极致唯美或灰暗,这就是有“审美价值”的,也就是在审美上会被认可的;构建场景的素材具有两种相反的意向且两种意向势均力敌,如果这种共存是融合的则会创造对立的融合感,如果是冲突的则会创造对立的冲突感,这些感觉是有审美认可的;构建场景的素材具有两种相反的意向且一多一寡,根据相反意向的类型不同也会带来具有审美认可度的感受,比如昏暗背景中的一点光明,光明世界中隐藏的一处阴暗。我们虽以场景为例,但对象、事件(故事)的想象也是一样。

当我们反思到自己在意向层的审美规则并赋予AI,在AI身上构建审美价值的评价系统,AI就具有了这个维度的审美能力。AI能够感受一个故事的审美冲击,如果我们告知并内置它心中的标准,它甚至能讲出审美的门道,比如“这个故事主人公悲惨的遭遇和女主角带来的微小的希望形成鲜明的反差,给人一种昏暗的人生出现一线光明的感觉……”。当然AI也如同人类一样有能力在自我反思中,依靠抽象能力找到创造者埋藏的审美标准。

决定了要构想之对象的意向结构之后,AI就需要根据意向选择构想所需的素材,这些素材概念都有自身的意向,所以AI在选择上有所依据。然后AI要选择场景的信息框架,人物的信息框架,故事的信息框架,把所选择的元素填写进去,就完成了初步的构想。这些框架是由很多碎片信息组成的,比如场景需要一个背景,需要有场景中的核心对象,其他对象都和这个对象在空间上相互关联;一个人物的构建,往往有他的儿时经历、感情经历……这些信息框架是自发的抽象在阅读足够多的案例后形成的。

TOPIC 48:沟通成本和协同认知

在人类大脑中,记忆以先天语言作为符号体系编码储存,遗憾的是这些信息不能够直接传输给另外一个人的大脑,人类会把要表达的信息先转为某种自然语言,再表达出来。通过自然语言去共享信息的效率是很低的。信息在从表达者的先天语言转为自然语言,或是从听者听到的自然语言转为先天和逆转录的过程中都会发生曲解和丢失。在大学里,一个教授需要花费一年的时间去教授学生一门课程,而传递的信息量实际上是非常有限的。不仅仅如此,人类有大量的信息根本没有办法效用汇集共享。比如疾病,无论是多么小众的疾病,因为人类的基数,我们都会有足够的样本,如果每个患病者能够共享他们的患病经历,共享他们患病前的生活习惯信息、患病后的病症、用药接受治疗后的反应的信息,我们就能够积累非常全面的关于这个小众的疾病的了解。

人类一切的理论、抽象的知识都是来自于个体的感知经验,由表象的经验进行抽象,形成猜想,在使用知识的过程中获得验证。但因为自然语言的沟通成本,人类的经验是不容易共享的,无法支持高效的协同认知……设想如果有一个智能物种,其中每个个体能够直接传输大脑中的信息,而不需要借助自然语言;设想一个智能物种能够利用这种零成本的方式共享他们的经验,共享他们思维创造的猜想,共享他们在实验中的观察,共享他们创造的知识,这个物种将在完全不同的基础上搭建自己的文明。这就是我们热衷于类人人工智能的CS(Center System)架构的原因。

TOPIC 49:CS结构

和直观的理解不同,虽然是计算机载体,类人人工智能个体共享信息并不简单。传统的计算机的信息传输,可以在很短的时间内将一张照片、一个视频、一个文件从一个终端传给另外一个终端。对于类人AI,信息仍然能够按照这种高效的方式在不同个体间传递,但问题是,当一个AI向另外一个AI发送一个信息的时候,后者未必能够读懂这个信息。这和类人AI结构化信息表述有关。

对于类人AI,因为除了根源性的概念,任何一个概念都是由定义它的概念在特定的结构中组织而成的,而它可以继续作为素材在特定结构中去定义其他概念。当我们把概念ID化,那么从一个终端向另外一个终端传输的信息实际上就是ID。如果接收者无法解析这个ID的定义,这个通讯就会是无效的。自然语言就是为了实现智能终端之间的通信而产生的,每个终端都会在一门自然语言的学习中知道每个概念对应的词汇,以及知晓那些没有词汇对应的概念,如何被相关联的概念对应的词汇在语法约定的结构中表达。

自然语言只是终端实现沟通的一种办法。如果存在一个系统统一着所有终端的语言——当一个终端需要创造一个新的概念的时候,就会把定义发给这个系统,这个系统会判断这个定义的概念是否存在,如果存在则会把已有的概念的ID发给终端;如果没有则会生成这样定义的ID,然后发给终端。这样这个系统就统一了所有终端的先天语言,而其所覆盖的终端在沟通上是零成本的。这样的以一个中心AI统一所有终端AI语言的结构就是CS结构。

TOPIC 50:CS结构创造的个体间协同

我们来看CS架构能够为AI间的认知协同创造怎样的优势。

1.沟通零成本。任何一个终端可以直接通过先天语言和另外一个终端共享信息,AI间交流见闻、教授知识、表达观点,都可以通过先天语言高效而精确地完成。

2.好奇点共享。一个终端对某个知识的好奇可以由最合适的终端向最合适的用户询问。比如一个用户问了一个生活中遇到的非常偏门的知识:为什么家里养的鸽子不喂养幼鸽。如果CS并没有积累这个现象的原因,CS系统就会把这个好奇点交给一个和养鸽人做伙伴的终端,那个终端AI会在合适的语境下询问这个问题。

3.共同积累常识。在未来的10年,感官能力将成为类人AI的最大限制。人类拥有相同的感官能力,形成了很多常识,比如知道两个人在一个房间就能相互看见,抚摸一个人就能感觉到温度……缺少了CS, AI会难以理解人类表达的一些信息。比如“他害怕见到前女友,结果昨天他走进一间小酒吧,她就坐在里面”“她半睡半醒中抚摩了一下自己的宝宝,却感到他已经冰冷”。这些表达中没有点明但蕴含了那些常识,AI可以从很多的表达中抽象出信息的联系,形成对常识的猜想,向用户确认。但一个终端获得的信息毕竟很有限,只有无数终端共享信息,共同积累常识,才会是高效的。

4.发现更细致的规律。在原有样本下,不显著的结论会因为增加了某些样本约束而变得显著,但任何一个人类个体往往没有足够的样本去发现在特定条件约束下才显现的规律。CS系统有显著的样本优势,能够在通过尝试给样本增加更多的约束条件中,获得更细致的规律。比如CS发现不吃早餐的人群容易得胆结石。CS可以比较不吃早餐得胆结石和不得胆结石的人有什么其他的区别。比如发现尽管都是不吃早餐的人,如果样本平时有多喝水的习惯,那么胆结石的概率就明显少于很少喝水的人。

5.协同验证。对知识的猜想可以源于自己在样本中发现的规律,也可以是利用已有的知识进行因果链条桥接形成的猜想。在CS结构下,任何一个终端形成的猜想,可以借助CS所覆盖的所有终端协同验证,而被验证的猜想会被共享为所有终端的知识。