大数据平台异常检测分析系统的若干关键技术研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 日志

本书以Web日志为主要研究对象,通过分析Web日志可得到用户访问网站的特性,包括其频率和内容。目前常见的两种Web日志格式是Apache的NCSA日志格式和IIS的W3C日志格式。图2.1所示为一个基于NCSA扩展Web日志格式的Apache日志样例。

img

图2.1 基于NCSA扩展Web日志格式的Apache日志样例

一条Web日志表示用户的一次请求,包括请求的资源路径、用户的来源地址、日期和时间、状态码、传输字节数等字段。表2.1所示为日志中的各字段及其字段含义。

表2.1 日志中的各字段及其字段含义

img

(续表)

img