上QQ阅读APP看书,第一时间看更新
2.7 小结
通过本任务的学习,了解了网络爬虫的基本概念、所涉风险和工作过程;了解并搭建了基于Python的爬虫环境:requests库、lxml库和BeautifulSoup库的安装;实现了使用requests库对需要爬取的百度网页进行请求并获得响应数据,使用lxml库和BeautifulSoup库对获得的响应数据进行解析后得到需要操作的页面元素。
通过本任务的学习,了解了网络爬虫的基本概念、所涉风险和工作过程;了解并搭建了基于Python的爬虫环境:requests库、lxml库和BeautifulSoup库的安装;实现了使用requests库对需要爬取的百度网页进行请求并获得响应数据,使用lxml库和BeautifulSoup库对获得的响应数据进行解析后得到需要操作的页面元素。