|
计算机视觉,也称为机器视觉,它主要研究如何用计算机实现或模拟人类视觉功能。其主要研究目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力不仅包括对三维环境中物体形状、位置、姿态和运动等几何信息的感知,而且包括对这些信息的描述、存储、识别和理解。 计算机视觉研究从20世纪60年代就已经开始了,但是,直到20世纪80年代随着计算机硬件性能的大幅提升以及Marr提出了计算视觉理论,才使得整个领域有了突破性进展。现在,计算机视觉已经从模式识别的一个研究领域发展成为一门独立的子学科。 Marr计算视觉理论有两个核心论点:其一,人类视觉的主题是重构可见表面的几何形状;其二,人类视觉的重构过程是可以通过计算的方式完成的。虽然人们对Marr计算视觉理论提出了各种质疑和批评,但是,该理论仍然是计算机视觉的主流理论。 计算机视觉通常可分为低层视觉与高层视觉两类。低层视觉主要执行预处理功能,其目的是使被观察的对象更突出,去除背景或者其他干扰信息,以有利于获取有效特征,提高系统的准确性和执行效率。高层视觉则主要是理解所观察的形象,此时需要掌握与观察对象所关联的知识。 计算机视觉一般包括以下几个部分:图像获取部分、预处理部分、特征提取部分、检测分割部分、高级处理部分。 计算机视觉的研究内容包括实时并行处理、主动式定性视觉、动态和时变视觉、三维景物识别与重构、运动分割与跟踪、实时图像压缩传输和复原、多光谱和彩色图像的处理与解释等。计算机视觉已经在机器人装配、卫星图像处理、工业过程监控、飞行器跟踪、成像精确制导、景物识别和目标检测等很多领域获得了成功应用。 【出处】鲍军鹏,张选平.人工智能导论(第2版),机械工业出版社,2021年1月.
|