上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.2 日志
本书以Web日志为主要研究对象,通过分析Web日志可得到用户访问网站的特性,包括其频率和内容。目前常见的两种Web日志格式是Apache的NCSA日志格式和IIS的W3C日志格式。图2.1所示为一个基于NCSA扩展Web日志格式的Apache日志样例。
图2.1 基于NCSA扩展Web日志格式的Apache日志样例
一条Web日志表示用户的一次请求,包括请求的资源路径、用户的来源地址、日期和时间、状态码、传输字节数等字段。表2.1所示为日志中的各字段及其字段含义。
表2.1 日志中的各字段及其字段含义
(续表)