本章首先介绍两种常用的自然语言处理基础工具集,即英文处理工具集NLTK和中文工具集LTP。其次,介绍本书所使用的深度学习框架(Py-Torch)。最后,介绍常用的大规模预训练数据集以及更多自然语言处理数据集的获取方法。通过本章的学习,读者将对基础自然语言处理技术、深度学习工具以及大规模数据集有一个更直观的感受,并为后续章节的学习做好准备。