自然语言处理:基于预训练模型的方法
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第3章 基础工具集与常用数据集

本章首先介绍两种常用的自然语言处理基础工具集,即英文处理工具集NLTK和中文工具集LTP。其次,介绍本书所使用的深度学习框架(Py-Torch)。最后,介绍常用的大规模预训练数据集以及更多自然语言处理数据集的获取方法。通过本章的学习,读者将对基础自然语言处理技术、深度学习工具以及大规模数据集有一个更直观的感受,并为后续章节的学习做好准备。