《计算机视觉发展史.ppt》由会员分享,可在线阅读,更多相关《计算机视觉发展史.ppt(41页珍藏版)》请在优知文库上搜索。
1、20232023年年4 4月月3 3日星期一日星期一1 1计算机视觉发展History of Computer Vision20232023年年4 4月月3 3日星期一日星期一2 2参考教材:参考教材: 贾云得贾云得 机器视觉机器视觉科学出版社,科学出版社,2000参考书目:参考书目:1、图像处理、分析与机器视觉图像处理、分析与机器视觉(第二版)(第二版) M.Sonka,V.Hlavac,R.Boyle著,艾海舟等译,著,艾海舟等译, 人民邮电出版社,人民邮电出版社,20032、机器视觉教程机器视觉教程W.E.Snyder,H.Qi著著 林学訚等译,机械工业出版社,林学訚等译,机械工业出版社
2、,20053、计算机视觉计算机视觉马颂德著,科学出版社,马颂德著,科学出版社,1999课程教材课程教材20232023年年4 4月月3 3日星期一日星期一3 31. 引言引言 智能机器智能机器: : 能模拟人类的功能,能感知外部世界并有效地能模拟人类的功能,能感知外部世界并有效地解决人所能解决问题解决人所能解决问题感知系统感知系统:人类感知外部世界主要是通过视觉、触觉、:人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感觉器官,其中约听觉和嗅觉等感觉器官,其中约80%80%的信息是由视觉获取的信息是由视觉获取的因此的因此, ,对于智能机器来说,赋予机器以人类视觉功能对于智能机器来说,赋予机器
3、以人类视觉功能对发展智能机器是及其重要的,也由此形成了一门新的学对发展智能机器是及其重要的,也由此形成了一门新的学科科计算机视觉计算机视觉( (也称机器视觉或图像分析与理解等也称机器视觉或图像分析与理解等) )计计算机视觉的发展不仅将大大推动智能系统的发展,也将拓算机视觉的发展不仅将大大推动智能系统的发展,也将拓宽计算机与各种智能机器的研究范围和应用领域宽计算机与各种智能机器的研究范围和应用领域 计算机视觉计算机视觉:研究用计算机来模拟生物视觉功能的科学:研究用计算机来模拟生物视觉功能的科学和技术计算机视觉系统的首要目标是用图像创建或恢复和技术计算机视觉系统的首要目标是用图像创建或恢复现实世界
4、模型,然后认知现实世界现实世界模型,然后认知现实世界20232023年年4 4月月3 3日星期一日星期一4 4 2020世纪世纪5050年代年代归入模式识别归入模式识别-主要集中在二维图像分析和识主要集中在二维图像分析和识别上,如,光学字符识别,工件表面、显微图片和航空图片的别上,如,光学字符识别,工件表面、显微图片和航空图片的分析和解释等分析和解释等6060年代年代MIT MIT 的的RobertsRoberts通过计算机程序从数字图像中提取出诸通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物
5、体的空间关系进行描述状及物体的空间关系进行描述Roberts Roberts 的研究工作开创了以理的研究工作开创了以理解三维场景为目的的三维计算机视觉的研究解三维场景为目的的三维计算机视觉的研究RobertsRoberts对积木世对积木世界的创造性研究给人们以极大的启发,许多人相信,一旦由白界的创造性研究给人们以极大的启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,则可以推广到理解更色积木玩具组成的三维世界可以被理解,则可以推广到理解更复杂的三维场景复杂的三维场景7070年代年代,已经出现了一些视觉应用系统,已经出现了一些视觉应用系统7070年代中期,麻省理年代中期,麻省理工学院
6、工学院(MIT)(MIT)人工智能人工智能(AI)(AI)实验室正式开设实验室正式开设“计算机视觉计算机视觉” ” (Machine Vision) (Machine Vision) 课程,由课程,由B BK KP PHornHorn教授讲授教授讲授2. 计算机视觉发展20232023年年4 4月月3 3日星期一日星期一5 5MIT AI 实验室吸引了国际上许多知名学者参与计算机视觉的理论、算法、系统设计的研究,David Marr教授就是其中的一位他于1973年应邀在MIT AI 实验室领导一个以博士生为主体的研究小组,1977年提出了不同于“积木世界”分析方法的计算视觉理论(computa
7、tional vision),该理论在80年代成为计算机视觉研究领域中的一个十分重要的理论框架20232023年年4 4月月3 3日星期一日星期一6 6研究热潮是从 20世纪80年代开始的,到了80年代中期,计算机视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等Marr的计算理论20232023年年4 4月月3 3日星期一日星期一7 7许多会议论文集都反应了该领域的最新进展,比如:Int. Conf. on Computer Vision and Pattern Recognition (CVPR); Int. C
8、onf. on Computer Vision(ICCV); Int. Conf. on Pattern Recognition(ICPR); Int. Conf. on Robotics and Automation(ICRA); Workshop on Computer Vision, SPIE还有许多学术期刊也包含了这一领域的最新研究成果, 如:IEEE Trans. on Pattern Analysis and Machine Intelligence(PAMI); Computer Vision, Graphics, and Image Processing(CVGIP); IEE
9、E Trans. on Image Processing; IEEE Trans. on Systems, Man, and Cybernetics(SMC); Machine Vision and Applications; Int. J on Computer Vision(IJCV); Image and Vision Computing; Pattern Recognition20232023年年4 4月月3 3日星期一日星期一8 83. Marr的视觉计算理论Marr Marr 的视觉计算理论的视觉计算理论Marr1982Marr1982立足于计算机科学,系统地立足于计算机科学,系统
10、地概括了心理生理学、神经生理学等方面取得的所有重要成果,概括了心理生理学、神经生理学等方面取得的所有重要成果,是视觉研究中迄今为止最为完善的视觉理论是视觉研究中迄今为止最为完善的视觉理论 Marr Marr 建立的建立的视觉计算理论,使计算机视觉研究有了一个比较明确的体系,视觉计算理论,使计算机视觉研究有了一个比较明确的体系,并大大推动了计算机视觉研究的发展人们普遍认为,计算并大大推动了计算机视觉研究的发展人们普遍认为,计算机视觉这门学科的形成与机视觉这门学科的形成与MarrMarr的视觉理论有着密切的关系的视觉理论有着密切的关系20232023年年4 4月月3 3日星期一日星期一9 9 3.
11、1 信息处理三个层次信息处理三个层次20232023年年4 4月月3 3日星期一日星期一10103.2 视觉表示框架视觉表示框架第一阶段第一阶段( (也称为早期阶段也称为早期阶段) )是将输入的原始图像进行处理,是将输入的原始图像进行处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图征,这些特征的集合称为基元图(primitive sketch)(primitive sketch);第二阶段第二阶段( (中期阶段中期阶段) )是指在以观测者为中心的坐标系中,是指在以观测者为中心的坐标系中,由输入图像和基元图恢复
12、场景可见部分的深度、法线方向、由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的包含了深度信息,但不是真正的物体轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图三维表示,因此,称为二维半图(2 (25 dimensional sketch)5 dimensional sketch);第三阶段第三阶段( (后期阶段后期阶段) )是在以物体为中心的坐标系中,由输是在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。入图像、基元图、二维半图来恢复、表示和识别三维物体。20232023年年4 4月月3 3日星期一日星期一1
13、111表1-2 由图像恢复形状信息的表示框架名 称目 的基 元图像光强表示图像中每一点的强度值基元图表示二维图像中的重要信息,主要是图像中的强度变化位置及其几何分布和组织结构零交叉,斑点,端点和不连续点,边缘片断,有效线段,组合群,曲线组织,边界 25维图在以观测者为中心的坐标系中,表示可见表面的方向、深度值和不连续的轮廓局部表面朝向(“针”基元)离观测者的距离深度上的不连续点表面朝向的不连续点3维模型表示在以物体为中心的坐标系中,用由体积基元和面积基元构成的模块化多层次表示,描述形状及其空间组织形式分层次组成若干三维模型,每个三维模型都是在几个轴线空间的基础上构成的,所有体积基元或面积形状基
14、元都附着在轴线上20232023年年4 4月月3 3日星期一日星期一1212MarrMarr理论是计算机视觉研究领域的划时代成就,但该理论是计算机视觉研究领域的划时代成就,但该理论不是十分完善的,许多方面还有争议比如理论不是十分完善的,许多方面还有争议比如: : 视觉处理框架基本上是自下而上,没有反馈视觉处理框架基本上是自下而上,没有反馈; ; 没有足够地重视知识的应用没有足够地重视知识的应用MarrMarr理论给了我们研究计算机视觉许多珍贵的哲学思理论给了我们研究计算机视觉许多珍贵的哲学思想和研究方法,同时也给计算机视觉研究领域创造了想和研究方法,同时也给计算机视觉研究领域创造了许多研究起点
15、。许多研究起点。3.3 Marr 视觉理论的不足视觉理论的不足20232023年年4 4月月3 3日星期一日星期一1313 计算机视觉应用系统 照明 成像装置 计算机视觉 场景 图象 描述 应用反馈20232023年年4 4月月3 3日星期一日星期一14144. 计算机视觉的应用计算机视觉的应用 零件识别与定位零件识别与定位 (工业生产线)(工业生产线) 产品检验产品检验 (纺织工业棉花质量检验)(纺织工业棉花质量检验) 移动机器人导航(星球机器人)移动机器人导航(星球机器人) 遥感图像分析(植被分析)遥感图像分析(植被分析) 医学图像分析(骨骼定位)医学图像分析(骨骼定位) 安全鉴别、监视与
16、跟踪(门禁系统)安全鉴别、监视与跟踪(门禁系统) 国防系统(目标自动识别国防系统(目标自动识别ATRATR与目标跟踪)与目标跟踪) 其它(动画、体育、考古)其它(动画、体育、考古)20232023年年4 4月月3 3日星期一日星期一1515Sojourner 火星车前部图,中部的两个小突出是两个黑白CCD摄像机20232023年年4 4月月3 3日星期一日星期一161620232023年年4 4月月3 3日星期一日星期一1717Rocky 7 火星机器人20232023年年4 4月月3 3日星期一日星期一181820232023年年4 4月月3 3日星期一日星期一1919 Rocky7视觉系统获取的立体图象对障碍物探测示意图Rocky7 视觉系统对场景的深度恢复 20232023年年4 4月月3 3日星期一日星期一2020CMU月球探测实验车Nomad漫游者20232023年年4 4月月3 3日星期一日星期一2121月球探测实验车Nomad漫游者20232023年年4 4月月3 3日星期一日星期一2222昆虫机器人足球机器人足球机器人20232023年年4 4月月3 3日星期一日星期一