人工智能在想什么:从科幻电影看AI未来(含15部科幻电影剧情讲解音频)
上QQ阅读APP看书,第一时间看更新

现实的人工智能,能超越“愚蠢的人类”吗?

REC

《2001太空漫游》电影片段:哈尔的唇读能力

在哈尔出现错误并表现出死不认账的态度之后,大卫和弗兰克察觉到了哈尔的异常。

这两个人躲进密封舱内,把通话开关统统关掉了!这样,哈尔就应该听不见他们俩的对话了。然后,两人悄悄商量着要把哈尔关掉。

万万没想到,哈尔竟然具有“唇读”功能,Ta透过舱门上的玻璃,发现了大卫和弗兰克的计划!

哈尔的唇读能力,真让我们这些“愚蠢的人类”感到羡慕不已——即便在今天,人类的唇读能力依然非常有限,在这方面,人工智能已有了无可比拟的优势!

今天,在唇读能力上,人工智能的确已经超越了人类——科幻电影中的情节已部分地变成了现实,难怪阿斯特罗·特勒(Astro Teller)说:“人工智能研究的是如何让机器在现实生活中做它们在电影里做的那些事情。”[4]

2016年,英国牛津大学计算机系的AI实验室使用深度学习技术,开发出了一个名为“Lip Net”的自动唇读系统,这个系统可以在句子层面帮助人工智能识别唇语,并且准确度可达到93.4%,超过了经验丰富的人类唇读专家52.3%的精准度,也超过了之前人工智能唇读 79.6%的最佳准确度。 [5]

Lip Net 系统目前93.4%的正确率已表现得十分抢眼了,但美中不足之处在于它仅限于正面唇形的识别。

那么,像《2001太空漫游》中哈尔看到的这种侧面唇形,目前的识别率又怎样呢?

谷歌旗下的Deep Mind公司(Alpha Go的研发者)与英国牛津大学工程科学系合作的团队在这方面表现得更为出色。该团队的研究从2010年起开始,用6年时间开发出了迄今为止全球最先进、最准确的人工智能唇读系统。在 2016年3—9月的节目库中随机选取的 200 个说话场景唇读对比测试中,这项人工智能唇读系统的完全准确率为46.8%。[6]

该唇读系统通过观察节目中说话者的唇形,可以准确解读出所对应的文字,甚至包括以下比较“拗口”的句子。

我们知道也将有上百位记者会出席。(We know there will be hundreds of journalists here as well.)

根据国家统计局的最新统计数据……(According to the latest figures from the Office of National Statistics...)

尽管46.8%的准确率似乎仍并不令人十分满意,但这是包括了很多侧面唇形(类似电影中哈尔观看视角)的正确率——想象一下,作为人类的我们,如果从未经过训练,也并不了解对方讲话的背景和话题,尤其是说话者还并非正面对着你,那么普通人的唇读准确率只有12.4%。

如此看来,在唇读能力上,人工智能已经把“愚蠢的人类”远远地甩在身后了!

当然,唇读技术的应用,绝不是为了“偷听别人在说什么”,而是让唇读软件可以帮助那些听障人士,或者在比较吵闹的环境中(也就是计算机很难分离出噪声的环境中)识别出对方的话语——比如,使用者可以佩戴具有内置摄像头的眼镜,在参加聚会时清楚地拍摄到目标人物说话时的唇部动作,并使用相关软件来实时将“唇部语言”翻译成文本,然后将语音传输到佩戴者耳中。[7]

当年,电影中的哈尔通过唇读,看透了“愚蠢的人类”的心思,让电影观众感到不明觉厉,更像是“科幻”。而今天,我们似乎通过对计算机进行大量的数据训练,已经能把科幻转变成一项现实的技术应用了。

近几年,人工智能在不少专项上都已经超过了人类,但目前的人工智能都仍属于弱人工智能(Weak AI),而非强人工智能(Strong AI)。下面我们简单区分一下这种不同等级的人工智能。

“弱人工智能”,又称“狭义人工智能”(Narrow AI),是专注于在特定领域能做出决策、预测和分类的人工智能应用。“弱人工智能”所制造出智能机器并不能真正地推理和解决问题,它们只不过看起来像是智能的,但并不真正拥有智能,也不会有自主意识。

“弱人工智能”也不会具有真实的“情感”——比如,Alpha Go作为弱人工智能的代表,它下得一手好棋,却无法体会“落子知心路”给人带来的微妙感受,更无法体会对手柯洁在对弈中所经历的自信、焦虑、害怕、希望、心碎等波澜起伏的情绪变化以及对围棋这项运动纯粹的热爱。所以,即便Alpha Go以3∶0的比分赢得了比赛,但落败的柯洁依然成为人们心目中的斗士——目前的“弱人工智能”,并不具备让人类引以为自豪的“情感”(因而人工智能的“情感”也往往成为在科幻电影中才会出现的新元素)。

“强人工智能”也称为“广义人工智能”(Artificial General Intelligence, AGI)。“强人工智能”具备人类所拥有的所有认知能力;人类能做的,人工智能都可以做,甚至做得更好。“强人工智能”有时也译作“通用人工智能”。[8]

不过,到目前为止,“强人工智能”在现实世界中并未诞生,Ta们仅仅出现在科幻电影中;人类依然有人工智能所不具备的优势(如情感、理解力、道德感等)——将来的人工智能会具备这些能力吗?这个问题仍然未知,并有待继续观察。