《2023人工智能机器人.docx》由会员分享,可在线阅读,更多相关《2023人工智能机器人.docx(74页珍藏版)》请在优知文库上搜索。
1、人工智能机器人目录1.1 机器人51.2 机器人硬件71.2.1 机器人的硬件层面分类71.2.2 感知世界91.2.3 产生运动121.3 机器人学解决哪些问题131.4 机器人感知151.4.1 定位与地图构建161.4.2 其他感知类型221.4.3 机器人感知中的监督学习与无监督学习231.5 规划与控制251.5.1 构形空间251.5.2 运动规划301.5.3 轨迹跟踪控制42规划与策略471.5.4 最优控制471.5.5 规划不确定的运动501.5.6 机器人学中的强化学习541.5.7 利用模型54利用其他信息561.5.8 人类与机器人571.5.9 人类作为近似理性的智
2、能体581.5.10 预测人类动作591.5.11 人类对机器人的预测611512人类作为黑箱智能体621513学习做人类期望的事情631 .偏好学习:学习代价函数632 .直接从模仿中学习策略651.5.14 其他机器人框架681.5.15 反应式控制器681.5.16 包容架构691.5.17 应用领域72小结76在本文中,智能体被赋予传感器和实体效应器,以便它们在真实世界中四处走动、完成各种任务。1.1机器人机器人是通过操纵真实世界去完成任务的实体智能体。为此,它们配备了像腿、轮子、关节和夹具之类的效应器(effector)。效应器用于对环境施加物理力量。这时,会发生一些事情:机器人的状
3、态可能改变(例如,一辆车旋转车轮,促使它在路面上行进),环境的状态可能改变(例如,机械臂使用夹具推动马克杯滑过吧台),甚至连机器人周围的人类的状态都可能改变(例如,外骨骼运动会改变人腿的状态,或移动式机器人向电梯门前进,引起人类的注意并好心地为机器人让路,甚至帮它按下按钮)。机器人还配备了传感器,这使得它们能够感知其所处的环境。目前的机器人使用各种各样的传感器,包括摄像头、雷达、激光和麦克风,以便测量环境和周围人类的状态,而陀螺仪、压力与扭矩传感器和加速度计则用来测量机器人自身的状态。对机器人来说,最大化地发挥预计的功效意味着选择如何驱动其效应器施加正确的力,也就是能够使状态向积累最多预期奖励
4、的方向变化。最终,机器人会试图在物理世界中完成某些任务。机器人在部分可观测且随机的环境中运作:摄像头看不到拐角背后,齿轮则可能打滑。此外,在相同环境下人的行动也无法预测,因此机器人需要对其进行预测。机器人通常将其所处的环境建模为连续状态空间(机器人的位置具有连续的坐标)和连续动作空间(机器人发送到电动机的电流也是以连续单位测量的)。一些机器人运行于高维空间:汽车需要知道其自身和周围智能体的位置、朝向和速度,机械臂有六七个可以相互独立运动的关节,人形机器人则具有数百个关节。机器人的学习是受约束的,因为真实世界顽固地拒绝比真实时间运行得更快。在模拟环境中,可以使用学习算法(如第22章所述的Q学习)
5、在几小时内从几百万次试验中学习。在真实环境中,运行这些试验可能需要花掉数年,机器人也无法承担可能导致损害的试验风险(因此也无法从中学习)。因此,将从模拟环境中学到的东西转移到真正的机器人上,也就是从模拟到现实的问题,是热门的研究领域。实用的机器人系统需要体现关于机器人的先验知识、物理环境和要执行的任务,以便机器人可以快速学习、安全运行。机器人综合了我们在本书中所看到的许多概念,包括概率状态估计、感知、规划、无监督学习、强化学习和博弈论。对其中一些概念来说,机器人学在此处的作用是提供一个具有挑战性的应用范例。本文还会引入其他新概念,例如,对于一些我们先前只讲过离散情形的技术,本文中会介绍其连续版
6、本。1.2 机器人硬件本书到目前为止采用的一直是智能体架构,即传感器、效应器和处理器,并一直专注于智能体程序。但实际中,成功的机器人对适用于任务的传感器和效应器设计的依赖并不少于智能体程序。1.2.1 机器人的硬件层面分类当你想到机器人时,你可能会想象它有一个脑袋和两条胳膊,用腿或轮子移动。这种拟人机器人(anthropomorphicrobot)在电影终结者和动画杰森一家这样的虚构作品中十分流行。但真正的机器人有各种各样的外形和大小。机械手(manipulator)只是机器手臂。它们不需要附加在机器人的身体上,可能只是被螺栓固定在桌面或地板上,就像在工厂里那样(图26-la)0一些机械手(如
7、用来组装汽车的机械手)的载荷很大。而另一些机械手(如装在轮椅上用于帮助运动障碍者的机械手,见图261b)不能负重太多,但在人类环境中更安全。图264(a)具有定制末端效应器的工业机器人。图片来源:Macor/123RFo(b)安装在轮椅上的KinOVaJACOAssistiveRobot机械臂。KinoVa和JACo是KinoVa股份有限公司的商标移动机器人(mobilerobot)使用轮子、腿或螺旋桨在环境中移动。四旋翼无人机(quadcopterdrone)是一种无人驾般航空器(unmannedaerialvehicle,UAV),自主水下航行器(autonomousunderwaterv
8、ehicle,AUV)则在海底漫游。许爹移动机器人(如酒店的吸尘机器人或者毛巾递送机器人)只待在室内,并用轮子移动。在室外,则有自主无人车(autonomouscar),以及甚至能在火星上探索地形的巡视器(rover)(图26-2)。最后,腿式机器人(Ieggedrobot)用于在轮子无法通行的恶劣地形行动。它的缺点在于,正确地控制腿比转动车轮更具有挑战性。其他类型的机器人包括假体机器人、外骨骼机器人、有翼机器人、蜂群机器人和全屋就是一个机器人的智能环境。(b)图262(a)美国国家航空航天局的好奇号巡视器在火星上自拍。图片来自美国国家航空航天局。(b)Skydio无人机伴随一家人骑行。图片由
9、Skydio提供1.2.2 感知世界传感器是机器人与环境之间的感知接口。摄像头之类的被动传感器(passivesensor)是环境的真实状态观察者:它们捕获环境中的信号。如声呐之类的主动传感器(activeSenSor)则向环境发送能量,它们依赖能量会反射回传感器这样的规律。主动传感器通常能比被动传感器提供更多信息,但代价是增加能耗,并面临同时使用的多个被动传感器互相干扰的风险。我们也可以根据传感器是用于感知环境、感知机器人位置还是感知机器人的内部配置对其分类。测距仪(rangefinder)是用于测量与周围物体距离的传感器。声呐(sonar)传感器是发射有向声波的测距仪,当声波被物体反射,部
10、分声波就会回到传感器。返回信号的强度和时间表明与周围物体的距离。声呐是最受欢迎的自主水下航行器,在早期室内机器人中也十分流行。立体视觉(stereovision)(见25.6节)依靠多个相机从稍有不同的视角对环境进行成像,分析图像中的视差来计算与周围物体的距离。对地面移动机器人来说,声呐和立体视觉现在已很少使用,因为它们的精度不够可靠。KineCt是一种流行的低成本传感器,它结合了相机和结构光投影仪,能够将网格线的形状投射到场景中。摄像头观测网格的弯曲情况,就可以将场景中物体的形状反馈给机器人。根据需要,这种投影可以是红外光,以使其不与其他传感器(如人眼)发生干扰。大多数地面机器人现在配备有主
11、动光学测距仪。像声呐传感器一样,光学距离传感器发射主动信号(光)并测量信号返回传感器的时间。图26-3a展示了一台飞行时间照相机(time-of-flightcamera)o这台照相机能以最高60帧/秒的速度获取图26-3b所示的距离成像。无人汽车常常使用扫描激光雷达(scanninglidar),Iidar是Iightdetectionandranging(光探测与测距)的缩写。这是一种发射激光束并感知反射光束的主动传感器,它能够在100m处给出精度小于1厘米的距离测量。它们使用复杂精密的镜子或旋转机构来对环境扫射光束,并绘制地图。扫描光雷达在长距离下的性能通常好于飞行时间照相机,在明亮的白
12、天也有较好的性能。图263(a)飞行时间照相机。图片由MeSaImaging股份有限公司提供。(b)用该照相机得到的三维距离成像。这种距离成像使机器人检测附近的障碍物和物体成为可能。图片由WiHoWGarage有限责任公司提供雷达(radar)通常是航空器(自主或非自主)最青睐的距离探测传感器。雷达传感器可以探测以千米计的距离,与光学传感器相比,它的优势在于能够穿透云雾。而近端距离探测则有触觉传感器(tactilesensor),如触须传感器、碰撞板传感器和触敏表皮传感器。这些传感器基于物理接触测量距离,仅用于测量距离机器人非常近的物体。第二个重要的类别是位置传感器(Iocationsenso
13、r)。许多位置传感转使用距离测量技术作为确定距离的首要组成部分。在室外,全球定位系统(globalpositioningsystem,GPS)是定位问题最常见的解决方案。GPS测量与发射脉冲信号的卫星的距离。现在,轨道上有31颗正常运行的GPS卫星,并有24颗Glonass卫星。GSNASS是俄罗斯的卫星定位系统。GPS接收器可以通过分析相移来解算其与卫星的距离。通过对多个卫星使用三角定位法,GPS接收器可以确定其在地球上的绝对位置,精度可以到米。差分GPS(differentialGPS)需要用到已知其位置的另一个地面接收器,在理想条件下可以提供毫米级定位。遗憾的是,GPS无法在室内或水下工
14、作。室内定位通常通过在环境中的已知位置增设信标来实现。许多室内环境布满了无线基站,这有助于机器人通过分析无线信号来定位。在水下,主动声呐信标可以提供位置感知,它使用声音告知AUV与信标的相对距离。第三个重要的类别是本体感受传感器(proprioceptivesensor),它将自身运动告知机器人。要测量机器人关节的确切状态,电动机通常配有轴编码器(shaftencoder),它能够精确测量轴的运动角度。在机械臂上,轴编码器有助于追踪关节位置。在移动机器人上,轴编码器报告轮子的旋转以便于计程(Odometry),也就是测量行进距离。遗憾的是,轮子会漂移并打滑,因此计程只在短距离移动时才比较精确。
15、像风力、洋流这样的外力会增加位置的不确定性。惯性传感器(inertialsensor),如陀螺仪等,通过依靠质量对速度变化的抗性来减小这种不确定性。机器人状态的其他重要方面使用力传感器(forcesensor)和扭矩传感器(torquesensor)来测量。当机器人处理确切尺寸未知的易碎物体时,这些传感器是不可或缺的。想象一吨重的机械臂在拧紧灯泡。它很容易就会用力过猛而弄碎灯泡。力传感器使机器人能够感知它用了多大的力来握灯泡,扭矩传感器则使机器人能够感知它用了多大的力来旋转。高级的传感器可以在3个平移方向和3个旋转方向上测量力的大小。它们能够以每秒几百次的频率进行测量,因此,机器人可以快速检测
16、到不希望出现的力并在捏碎灯泡前对其动作进行纠正。不过,为机器人配备高端传感器和足以监控它们的计算能力则又是一个难题。1.2.3 产生运动使效应器运动的机械装置叫作执行器(actuator),其中包括变速箱、齿轮、电缆和链接。最常见的执行器是电动执行器(electricactuator),它使用电力来旋转电动机。它们大多用于需要旋转运动的系统,如机械臂的关节。液压执行器(hydraulicactuator)使用加压的液压液(如油或水),而气动执行器(PneUmatiCactuator)则使用压缩气体来产生机械运动。执行器常用于移动关节,关节则连在机器人固定的主体或其他活动连接物上。手臂和腿就有这样的关