自然语言处理与计算语言学
上QQ阅读APP看书,第一时间看更新

第1章 什么是文本分析

开发人员从来没有像今天这样方便地进行文本分析,可以很容易地获取数据,并使用功能强大且免费的开源工具来指导分析工作,研究机器学习算法。计算语言学和文本计算正在以前所未有的速度发展。

本章将详细讨论究竟什么是文本分析,学习和理解文本分析的动机。本章介绍的主题如下:

  • 什么是文本分析;
  • 搜集数据;
  • 若输入错误数据,则输出亦为错误数据(Garbage in,garbage out);
  • 为什么需要文本分析。