思维工程
上QQ阅读APP看书,第一时间看更新

八、本章小结

本章我们讲述了自然语言的本质:

1.自然语言以词汇为信息单元和符号系统。

2.词汇具有声音、图像符号的对应关系。

3.自然语言约定了词汇和概念的对应关系。

4.自然语言约定了:A.概念组成的结构信息;B.概念对应的词汇组成的句子信息的映射关系,也就是语法映射。这是语法的本质。

5.从自然语言句子到表达语义的转化过程,我们称之为“自然语言正转录”;从表达语义到自然语言的转化过程,我们称之为“自然语言逆转录”。

我们讨论了自然语言的形成过程:

1.声音符号用作指向某类对象而产生,并在群落内传播。

2.群落间对语言符号在沟通中的使用,促使词汇到概念的对应,句子结构到表达语义信息的对应(语法)收敛到统一的标准。

3.图像文字作为声音背后概念的另外一种符号对应形成并用以记录信息。

4.一门自然语言随着群落生活内容的变化不断有新的概念和词汇加入。

5.同一类表达语义信息到句子结构的映射,也就是语法,在群落中具有自然的分化的机制,会变得越来越复杂,在同类表达语义信息中针对不同的具体层的语义信息形成不同语法映射。

我们讨论了自然语言学习的本质:

1.学习一门自然语言包含了两方面信息的习得:其一,词汇到概念的对应关系;其二,概念组成的结构信息到概念对应的词汇组成的句子信息的映射关系,也就是语法。

2.自然语言的学习有两个阶段:空白积累阶段和持续积累阶段。空白积累就是婴儿学习一门语言的状态,持续积累就是在有一定语言基础时持续学习一门语言的状态。

3.空白积累需要具体的语义信息和与此语义对应的表达信息同时出现在意识流中且具有极高关注度,这样就有足够的依据建立猜想映射。首先习得的是属性和对象类的概念,这是相对容易的。

4.空白积累阶段语法的习得是这样的过程:当具体的语义信息和对应的表达信息同时以高关注度出现在意识流时,此时猜想映射会建立;然后通过抽象机制抽象出此类型语义到表达模板的映射,作为猜想的语法映射;随着时间的推移,正确的猜想频次强度会凸显出来,从而沉淀为正式的语法映射。

5.持续积累阶段出现了两个新的语言习得机制:其一,因为已有语法映射,所以可以通过模糊匹配,猜想不完全一致的表达的语义,这样就创造了猜想映射。这种方式使猜想映射的样本量快速增长,智能体能够快速纠正不正确的语法,积累对较为具体语义信息的个性化表达的语法,熟悉对某一类人群特有表达习惯的语法。其二,已有的语义基础支持在沟通互动中学习修正语言,智能体开始询问对方表达中自己不熟悉的词汇概念,其他个体可以指出并纠正其表达过程中的用词不正确或表达方式(语法)不正确。

6.空白积累阶段需要严格的条件,进展非常缓慢;但到了持续积累阶段,语言的习得速度将有极大提升。

7.我们在人类身上看到的语言习得的举一反三的能力来自于自然语言这样的本质。语法映射和事件间因果关系(也可以看成一种映射)的本质是一样的,都是结构信息到结构信息的映射,因为句子(指词替换概念后的句子)也可以视为顺序关系组织的结构。所以当具体的语义结构信息和对应的句子结构信息产生对应,抽象能力就能生成某类语义结构信息到句子结构的映射,也就是语法映射。而正转录和逆转录的本质都是演绎过程,都是通过统辖检测识别到作为大类的句子结构或语义结构,建立约束映射,用子类替换对应语义结构或句子结构信息中的母类信息,生成具体的语义结构信息或句子结构信息。