您现在的位置:机电论文网>> 机器人>> 正文内容

一种机器人避障控制策略

作者: 来源: 发布时间:2018/2/11 16:12:47  点击数:1325
1引言
目前对于双足机器人的研究大部分集中在其平衡性及行走方面。动态可移动的智能机器人,能自主进行障碍检测、障碍规避及路径规划。障碍物体的检测实际上就是对周围环境的三维深度信息进行恢复的过程。
视觉系统可以捕获和理解机器人系统世界中的环境信息,由二维图像提取三维信息进而重建三维图像是视觉系统的重要功能。视觉系统利用不同的技术进行三维信息的恢复,例如双目立体视觉法、光流移动法和变焦距深度恢复法等。
在这篇论文中,我们提出了一种基本由焦距恢复深度信息原理的机器人实时避障方法。我们提出的焦距法是用两台设置为不同焦距的ccd摄像机拍摄同一场景的图像,然后比较每幅图像上相应区域的清晰度,区域清晰度最大的那幅图像的对应焦距所确定的距离就是这个图像区域的深度信息。尽管采用多个相机可以取得更好的深度恢复效果,但是为了简化计算,实际的控制算法中只需要知道图像各个区域粗糙的深度信息,在本算法中即为“远”和“近”两种标示,这个信息成为整个区域的深度标示。然后我们建立全幅图像的深度信息标示图,其过程类似于由焦距恢复地形3d信息,只不过我们的算法大大简化了。最后,机器人决策系统基于深度标示图设计其避障控制策略。
本文的第二部分介绍了这一领域的相关理论,第三部分介绍了深度标示图及避障控制策略的具体实现,最后给出了一些实验的结果。
2早期的工作
焦距分析很早就用于自动聚焦拍摄系统以及由所摄图像进行深度恢复的应用中。最早关于这一领域的著作是[1],作者通过对图像作傅立叶变换分析其聚焦程度。pentland在文献[2]中提出两种方法实现景物深度图像的重建,第一种方法基于测量散焦图像的模糊边缘,这种方法需要知道图像边缘的位置和幅值大小。第二种方法是通过比较两幅通过不同光圈相机所拍摄的图像,计算对应区域内的散焦度变化,得到深度信息。pentland取得了非常好的实验效果,处理图片的速度已经达到每秒钟8帧。其他学者采用更为精确的散焦数学模型提高了深度恢复精度[3]。然而,这些方法因为要对图像进行卷积和滤波的处理,所以需耗费大量的计算资源才能达到实时处理的目的。而且它们适用的环境是静态和固定的,所能恢复的深度信息也只限于很浅的范围内[4]。krokov在1987年的论文[5]中提出了由聚焦度提取深度信息的理论。原理是从大量不同焦距拍摄的图像中求取最大聚焦点。因为在滤波方法中用到了时间平均的概念,krokov同样需要静态不动的图像,且只能恢复图像中一个窗口的深度信息,而机器人实现连续平滑避障需要的是多个深度信息图。
1993年,krokov和bajcsy成功研制了一个将立体视觉定位和焦距相结合的视觉系统[6],深度恢复范围可达两米距离。darrel和wohn在1988年提出由焦距恢复深度信息的金字塔法[7],作者使用伺服系统控制镜头的焦距,拍摄8至30幅的图像,达到了理想的精度。但是与以前方法的缺点一样,它适用于静态的图像且所耗的计算量大。
3避障控制策略
为了克服上述方法普遍存在的计算量大的缺点,我们的算法应在焦距恢复深度原理的基础上尽量采用简单的数学模型,控制策略设计上本着简便、可行和稳定的原则。
建立一个简洁的机器人导航系统,重要的是了解要使机器人能做到稳定、连续避障,其感知系统至少应具备哪些功能。稳定指工作可靠,辨识障碍物体准确。而连续即机器人的动作要连贯而不停顿,这就要求感知系统提供给决策系统的深度信息需要有一定的提前量,同时避障策略的制定应根据机器人行走系统的速度及反应时间等指标。图1给出了机器人避障控制流程图。

对于图1所示的最简单的控制流程视觉系统必须能分辨左右两个方向以及深度的远、中和近。这样就意味着控制策略中只对应三类距离标示,而远、近距离标示的值分别代表一定范围的深度。当然,区分这三类深度范围的阈值制定要依据机器人行走的最大速度。也就是说,对应着“近”的深度距离要使机器人有足够的时间让前进速度从最大降到零,给机器人的控制系统和视觉系统以足够的反应时间。
通过将机器人前方视觉场景的深度信息分为三类,使算法较以前的算法简便了许多。这里视觉系统如何判断前方景物垢距离对控制策略起指导性的作用,既然是基于由焦距恢复深度的原理,我们需要一个标准来测量聚焦尺度,而最直观的标准莫过于清晰度的概念。
4清晰度标准
为了动态的测量图像内某个区域内的聚焦程度,我们需要一个计算这个区域的清晰度的标准。相对于聚焦的图像,散焦的概念就是丢失一些潜在的信息,相当于降低了画面的质量。从物理光学的角度来解释这种现象,散焦的出现是因为进入光学系统的入射光中的高频部分能量损失了的缘故,原理可用图2所示的光学系统模型来说明。p表示场景中可见表面的一点,q为p在图像上的聚焦点。如果成像底片沿着光轴移动一个位置,p点在底片上所成的就不是一个聚焦很好的点的像,而是圆圈。通过物理光学对这种现象的分析,我们得到两点结论。第一,在这个圆圈内所有像素的灰度值几乎相等;第二,这个模糊图像的数学模型可以用理想图像i(x,y)和一个圆形函数circ(x,y)的卷积来表示。假设相机为时不变线性系统,上面的卷积表示为


为了得到更进一步的结果,我们在频域中分析式(1)。对函数circ(x,y)进行付式变化后,在考虑了白光中各种不同波长的光波对图像畸变的影响基础之一,则circ(x,y)可以用一个二维的高斯点扩散函数h(x,y)来代替。

这里σ为与模糊圆圈的半径相关的扩散参数。利用h(x,y),成像底片上模糊的非聚焦图像id(x,y)可如式(4)由聚焦像i(x,y)和模糊函数h(x,y)的卷积组成

我们看出h(fx,fy)的一些特性,它允许低频的光线通过而截至高频光线。因为散焦的过程就类似低通滤波器,光线能量的频带度度随着散焦程度的增加而变窄。散焦的光学系统使天达成像底片的入射光高频成分减少,因此我们可以通过分析图像高频部分的成分来测量图像的聚焦程度。
自动控制焦距的目的就是寻找一个在各种变化图像情况下都能保持稳定的操作算子以保证聚焦,操作算子要检测的是图像中高频部分的内容。傅立叶变换是进行这种频域内测量的第一选择,但由于其十分巨大的计算量需要专用的硬件设备来提高运算速度,我们不考虑这种主法。因为散焦过程影响的是成像点的边缘特性,很自然的想到利用边缘检测的评价函数来测量图像的聚焦度。基于这种方法,我们计算图像上每一像点灰度的梯度值δi(x,y),然后将大于某一给定阈值的所有坡度值相加求和,聚焦评价函数就是在同一场景的不同聚焦程度的图像中寻找最大的和。
本视觉系统的避障算法中采用的就是上述的聚焦评价函数来判断清晰度。首先从由ccd摄像机中采集同一场景的三幅图像,ccd摄像机被设置为不同的焦距,分别代表近、中、远三个深度范围,所以每幅图像的聚焦程度都不一样,清晰度不同。将图像分为8×5的40个小区域,它们含有相同的像素数目。每个小区域的深度距离标示有近、中、远三种选择,究竟是哪一种标示由该小区域的聚焦评价函数决定,其计算过程是将小区域内的所有像素点的灰度梯度值相加求和,绝对值最大的那副图像的焦距所代表的标示就是这个小区域在深度图上的表示,这样我们就得到了整幅图像的深度标示图。
避障控制策略的选择由深度标示图决定,图中“0”、“1”、“2”分别代表深度距离的“远”、“中”、“近”。由于机器人头部的ccd摄像机安装的角度是俯视地面,所以原努的无障碍标示图底下的两行为“1”,也就是机器人行进路线的前方在地面有凹地或斜坡,机器人停止前进调转方向。机器人行走时选择方向我们用另一种策略,在每一步行走之前,将下两行的深度标示的值全置为“0”,然后将每一列的值相加,如果和大于1,说明这一列上至少存在两个“中”或一个“近”,这时控制策略就要指导机器人避开在这一列的方向上的障碍。机器人选择左和右方向时,也是先将下两行的标示置为“1”,然后对比左四列和右四列的标示和,选择值较小的方向,值小表示此方向上障碍物少且比另一方向上更开阔一些。
5结论
本文介绍了一种基于由焦距恢复深度信息原理的机器人实时避障方法,该方法通过建立模糊的深度标示图达到为控制策略提供障碍信息的目的。由于其计算量小,更有可能实现稳定、安全、实时的避障行为。方法的进一步完善还有待于视觉系统与机器人本体的联合测试,控制策略还应在实际工作中不断改进。
6参考文献
[1]b.k horn,“focusing”,mit artificial intelligence laboratory[r].memono160,may 1968.
[2]a.p.pentland,“a new sense for depth of field”[j].ieee trans.on pamii,vol pami-9,no4,july 1987,pp.423-430.
[3]v.m.bove.“discrete fourier transform based depth_from_focus”[r].understanding and machine vision,1989.technical digest series v.14,optical societyof america and air force office of scientific research,june 1989.
[4]j.ens and p.lawrence“a matrix based method for determiing depth from focus”[c].in ieee computer society conference on computer vision and pattern recognition (cvpr),san juan,pureto rico,june 1991,pp.615-620.
[5]e.krothov.focusing[j].international journal of computer cision,10(1):223-237,1987.
[6]e.krothov and r.bajcsy.“active vision for reliable ranging:cooperatingfocus,stereo,and vergence”[j].international journal of computer vision,11(2):187-203,1993.
[7]t.darrel and k.wohn."pyramid based depth from focus”[c].in ieee computer society conference on computer cision and pattern recognition (cvpr),ann ar
bor mi,usa,june 1988,pages 504-509.

更多
字体:【】-【】-【】【关闭此页

上一篇:专家系统在电梯控制柜故障诊断中的应用'   下一篇:机械工程中常见振动的相平面分析'


特别声明:机电之家(http://www.jdzj.com )所共享的机电类资料,机电论文、机电类文章、机电企业类管理制度、机电类软件都来自网上收集,其版权归作者本人所有,如果有任何侵犯您权益的地方,请联系我们,我们将马上进行处理。购买的论文都出自原创,保证作者的原创的版权的转让,任何纠纷由法律解决。