
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3 对话式人工智能与自然语言理解
对话式人工智能是一个广泛使用的术语,用于描述使系统可以与人类进行口头和文本交流的方法。这些方法包括语音识别、NLU、对话管理、自然语言生成和文本到语音转换。重要的是要区分这些方法,因为它们经常被混淆。虽然本书的重点放在NLU上,但我们也将简要介绍其他相关方法,以便了解这些方法如何组成一个整体:
❑语音识别:也被称为语音到文本转换或自动语音识别(Automatic Speech Recognition,ASR)。语音识别是一种将语音音频转换为文本的方法。
❑自然语言理解:基于书面语言,生成可以由计算机处理的结构化表示。输入的书面语可以是语音识别的结果,也可以是原始书面语文本。结构化表示包含了用户的意图或目的。
❑对话管理:根据NLU的结构化输出,决定系统应该做出什么样的反应。系统反应包括提供信息、播放音乐,或执行某些操作从用户那里获取更多信息,以满足用户的意图。
❑自然语言生成:创建文本,该文本表达了对话管理对用户问题的回复或反馈。
❑文本到语音转换:基于自然语言生成过程创建的文本输入,该文本到语音转换模块在给定文本时生成语音音频输出。
这些模块之间的关系如图1.2所示,它们构成了一个完整的自然语言对话系统。本书的重点是NLU部分。然而,由于自然语言应用程序使用了其他模块,如语音识别、文本到语音转换、自然语言生成和对话管理,因此它们也会被偶尔提及。

图1.2 一个完整的口语对话系统
接下来的两节将总结一些重要的自然语言应用程序。你将了解到本书所涉及的方法及其发展潜力。希望这些广泛使用的工具及其实现能引起你的兴趣。