上QQ阅读APP看书,第一时间看更新
内容提要
自然语言处理是一门融语言学、计算机科学、数学于一体的科学,研究人与计算机之间用自然语言进行有效通信的各种理论和方法。计算语言学是指通过建立形式化的数学模型来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,旨在以机器来模拟人的部分或全部语言能力的目的。
本书作为一本借助于Python编程语言以及各种开源工具(如Gensim、spaCy等)来执行文本分析、自然语言处理和计算语言学算法的图书,从应用层面介绍了相关的理论知识和所涉及的技术。本书共分为15章,其内容涵盖了文本分析的定义、使用Python进行文本分析的技巧、spaCy语言模型、Gensim工具、词性标注及其应用、NER标注及其应用、依存分析、主题模型、高级主题建模、文本聚类和文本分类、查询词相似度计算和文本摘要、词嵌入、使用深度学习处理文本、使用Keras和spaCy进行深度学习、情感分析与聊天机器人的原理介绍等。
本书适合对自然语言处理的实现细节感兴趣的Python程序开发人员阅读。如果读者具备统计学的基本知识,对学习本书内容会大有裨益。