4.2 基于规则匹配的文本去噪和结构化方法