第二节 计算机视觉
一、人工智能的双眼
作为智能世界的双眼,计算机视觉是人工智能技术里的一大分支。计算机视觉通过模拟人类视觉系统,赋予计算机“看”和“认知”的能力,是计算机认识世界的基础。确切来说,计算机视觉技术就是利用摄像机及计算机替代人眼,使计算机拥有人类的视觉所具有的分割、分类、识别、跟踪、判别及决策等功能,创建了能够在平面图像或三维立体图像的数据中获取所需“信息”的一个完整的人工智能系统。
计算机视觉利用成像系统代替视觉器官作为输入手段,利用视觉控制系统代替大脑皮层和大脑的剩余部分完成对视觉图像的处理和解释,让计算机自动完成对外部世界的视觉信息的探测,做出相应判断并采取行动,实现更复杂的指挥决策和自主行动。作为人工智能最前沿的领域之一,视觉类技术是人工智能企业的布局重点,具有最大的技术分布。
计算机视觉技术是一门包括计算机科学与工程、神经生理学、物理学、信号处理、认知科学、应用数学与统计等多门学科的综合性科学技术。计算机视觉技术系统在基于高性能的计算机的基础上能够快速获取大量数据信息并且基于智能算法快速进行信息处理,其本身包括不同的研究方向,如物体识别和检测(Object Detection)、语义分割(Semantic Segmentation)、运动和跟踪(Motion & Tracking)、视觉问答(Visual Question & Answering)等。
与计算机视觉概念相关的另一专业术语是机器视觉。机器视觉是计算机视觉在工业场景中的应用,目的是替代传统的人工,提高生产效率,降低生产成本。机器视觉与计算机视觉的侧重有所不同。计算机视觉主要是对质的分析,如物品分类识别。而机器视觉主要侧重对量的分析,如测量或定位。此外,计算机视觉的应用场景相对复杂,识别物体类型多,形状不规则,规律性不强。机器视觉则刚好相反,场景相对简单固定,识别类型少、规则且有规律,但对准确度、处理速度的要求较高。