自然语言处理实战:从入门到项目实践
上QQ阅读APP看书,第一时间看更新

近年来,自然语言处理(NLP)领域在方法论和所支持的应用程序方面发生了翻天覆地的变化。方法论方面的进展多种多样,既有文档表示方法的创新,也有语言合成技术的创新。随之而来的是应用程序的创新,从开放式对话系统到使用自然语言做模型解释等,不一而足。最后,这些进展让自然语言处理在计算机视觉、推荐系统等相关领域也取得一席之地。

随着自然语言处理不断延伸到这些令人振奋的新领域,学习运用自然语言处理技术的从业人员也在不断增加。我在加州大学圣迭戈分校开设的数据科学课程(CSE 258),是本校计算机系参与人数最多的课程。我发现越来越多的学生选择自然语言处理作为项目课题。对于希望使用自然语言数据构建应用程序的工程师、产品经理、科学家、学生和爱好者,自然语言处理正在迅速成为一项必备技能。一方面,自然语言处理和机器学习的新工具和库,使得自然语言建模比以往任何时候都更容易。但另一方面,自然语言处理的学习资源又必须面向这一数量不断增长的多样化受众群体。对于最近采用自然语言处理的公司和首次使用自然语言数据的学生来说,情况尤其如此。

在过去的几年里,我很高兴与博迪萨特瓦•马祖达尔合作,在自然语言处理和对话领域研究令人兴奋的新应用程序。因此,听说他与索米亚•瓦贾拉、阿努杰•古普塔和哈尔希特•苏拉纳一起合写了一本关于自然语言处理的书时,我十分欣喜。他们在扩展自然语言处理方面拥有广泛的经验,包括多个创业公司、麻省理工学院媒体实验室、微软研究院和谷歌人工智能的经验。

让我感到兴奋的是,书中采用了端到端的方法,这种方法适用于一系列场景,而且使读者在构建自然语言处理应用程序时不至于迷失在各种可能的选项里。尤其令我感兴趣的是,他们不但重视聊天机器人等现代自然语言处理应用程序,还关注电商、零售等跨学科主题。这些主题对于行业领导者和研究人员特别有用,但大部分现有的教科书只对这些重要的主题一笔带过。这本书既可以作为新手认识自然语言处理领域的第一资源,也可以作为老手探究这一领域最新进展的实用指南,是理想的自然语言处理学习参考书。

——Julian McAuley
加州大学圣迭戈分校计算机科学与工程教授