4.5 面向城市监控视频的复杂场景理解