自然语言处理实战
上QQ阅读APP看书,第一时间看更新

1.3 实际应用

自然语言处理无处不在。它是如此普遍,以至于表1-1中的一些例子可能会出乎大家的意料。

表1-1 各种类型的NLP应用

如果在索引网页或文档库时考虑了自然语言文本的含义,那么搜索引擎可以提供更有意义的结果。自动补全(autocomplete)功能使用NLP技术来完成所想语句的输入,这在搜索引擎和手机键盘中十分常见。许多文字处理器、浏览器插件和文本编辑器都有拼写校正、语法检查、索引生成等功能,特别是近年来,还出现了写作风格指导的功能。一些对话引擎(聊天机器人)使用自然语言搜索来为对话消息查找相应的回复。

在聊天机器人和虚拟助手中,生成(撰写)文本的NLP流水线不仅可以用来撰写简短的回复,还可以编写长得多的文本段落。美联社使用NLP“机器人记者”撰写完整的金融新闻和体育赛事等报道[8]。也许是因为人类气象学家使用了带有NLP功能的文字处理器来起草天气预报的脚本,机器人编写的天气预报听起来和家乡天气预报员的播报并没有什么两样。

早期电子邮件系统中的NLP垃圾邮件过滤器助力电子邮件,使其在20世纪90年代超越了电话和传真这两个传统通信渠道。在垃圾邮件过滤器和垃圾邮件制造者之间的这场“猫鼠游戏”中,前者保持了优势地位,但是在像社交网络这类场景下并非如此。据估计,有关2016年美国总统大选的推文中有20%由聊天机器人自动撰写而成[9]。这些机器人放大了它们的所有者或开发者的观点,而这些“傀儡”的操纵者往往是政府或大公司,他们具备影响主流观点的资源和动机。

NLP系统不仅可以产生简短的社交网络帖子,还可以用来在亚马逊和其他网站撰写很长的电影和产品评论。许多评论都是NLP流水线自动产生的,尽管它从未踏入过电影院或购买过它们正在评论的产品。

Slack、IRC甚至客服网站上都有聊天机器人——在这些场景中聊天机器人必须处理带有歧义的指令或问题。配备语音识别和生成系统的聊天机器人甚至可以进行长篇的对话,这些对话可以不限定目标或者针对特定目标而进行,一个特定目标的例子就是在本地餐馆订餐[10]。NLP系统可以帮一些公司进行电话回复,这些公司希望系统比层层进入的电话树更好用,并且不希望给帮助客户的客服人员付费。


注意 

谷歌IO大会上对Duplex系统的演示表明,工程师和经理们都忽视了教导聊天机器人欺骗人类这一道德问题。当人们在Twitter和其他匿名社交网络上愉快地与聊天机器人交流时,大家都忽略了这个难题,因为在这些社交网络上,机器人不会与我们分享它们的来历。随着机器人能够如此令人信服地欺骗我们,人工智能的控制问题[11]就迫在眉睫了,《人类简史》(Homo Deus[12]中尤瓦尔·赫拉利(Yuval Harari)的警示性预测可能比我们想象的来得更早。


NLP系统可以作为企业的电子邮件“接待员”或管理人员的行政助理,这些助理通过电子Rolodex(一种名片簿的品牌)或者CRM(客户关系管理系统)安排会议,记录概要细节,并代表他们的老板通过电子邮件与他人互动。公司将他们的品牌和形象交由NLP系统管理,允许机器人执行营销和消息发布活动。更有甚者,一些缺乏经验、胆大包天的NLP教科书作者竟然让机器人在他们的书中撰写若干语句。关于这一点我们稍后再详细讨论。