Professional Documents
Culture Documents
基于深度学习的起重机吊运手势识别
基于深度学习的起重机吊运手势识别
2018
第 41 卷第 23 期 Modern Electronics Technique Vol. 41 No. 23
127
DOI:10.16652/j.issn.1004-373x.2018.23.027
基于深度学习的起重机吊运手势识别
汪 涛 1,张建德 2
(1. 南京医科大学 信息与网络中心,江苏 南京 210029;2. 南京工程学院 计算机工程学院,江苏 南京 211167)
摘 要:起重机工作环境嘈杂,指挥员的吊运手势在作业现场发挥着重要的作用,设计一个自动化吊运手势识别系统
非常必要。以深度学习算法中卷积神经网络为基础方法,构建由静态手势模块和动态手势模块组成的复合神经网络模型,
提取吊运手势的特征,最后对特征进行组合并识别。实验结果表明,该系统能够有效地识别吊运手势。
关键词:吊运手势;卷积神经网络;手势分割;深度学习;颜色空间;特征提取
中图分类号:TN99-34;TP391.41 文献标识码:A 文章编号:1004-373X(2018)23-0127-03
Abstract:The crane ′ s working environment is very noisy,and the gesture of commander plays an important role in the job
site. Therefore,it is necessary to design an automatic lifting gesture recognition system. The convolution neural network in deep
learning algorithm is used as the basic method. The combined neural network model composed of dynamic gesture module and
static gesture module is constructed. The features of lifting gestures are extracted,combined and recognized. The experimental
results show that the system can recognize the lifting gesture effectively.
Keywords: lifting gesture; convolutional neural network; gesture segmentation; deep learning; color space; feature
extraction
CSRP;文献[4]提出一种基于手势主方向和类-Hausdorff
0 引 言
距离模板匹配的手势识别方法,通过构建直角坐标系提
起重机是现代化生产的重要设置装备部署,被广泛 取手势特征向量;文献[5]提出采用 Kinect 深度信息进行
应用于工场、矿山、口岸、车站、修建工地、电站等生产范 手势识别,对手部图像通过深度信息进行分割并去噪以
畴。由于起重机作业环境复杂,声音嘈杂,操作员视野 定位手位置,最后进行识别;文献[6]提出通过手的三维
受限等,需要现场指挥员予以手势指导。指挥员的吊运 坐标信息对手势轨迹进行特征提取并采用支持向量机
手势在整个起重机作业中,特别是在桥式起重机中发挥 进行分类识别。
着重要的作用。因此,设计一种能够自动化进行吊运手 但 是 在 起 重 机 适 用 的 场 合 ,指 挥 手 势 相 对 比 较 复
势识别系统非常有必要。 杂,通常需要两个手的配合。比如,预备动作要求手臂
手势是一种自然直观、易于学习的人机交互方式, 伸直,五指头自然分开,手心朝前。紧急停止,要求两小
同时基于视觉的手势识别也是一项难度较大、涉及领域 臂水平置于胸前,五指伸开,手心朝下,水平挥向两侧。
[1]
较广的研究内容 。目前关于手势识别的技术有:基于 在此场景下,手势识别存在难度,如何高效地对手势进
稀疏表示的手势识别方法 [2],提高了在手势偏转情况下 行识别成为本文的研究重点。
的识别率和识别速度;面向静态手势识别的边缘序列递 近几年,深度学习在计算机视觉领域取得了瞩目成
[3] [7-8]
归模型算法 ,从手势边缘序列角度出发提出一种基于 绩 ,其从人工神经网络的模型延伸发展而来,通过组
手 势 边 缘 轮 廓 递 归 图 的 CK - 1 距 离 的 手 势 识 别 算 法 合低层特征形成更加抽象的高层表示属性类别或特征,
收稿日期:2018-01-24 修回日期:2018-05-28
基金项目:江苏省自然科学基金青年基金项目(BK20150731);江苏省高校自然科学基金面上项目(15KJB520014)
Project Supported by the Young Scientists Fund of Natural Science Foundation of Jiangsu Province (BK20150731),the General Project of Natural
Science Foundation of Jiangsu Higher Education Institutions(15KJB520014)
万方数据
128 现代电子技术 2018 年第 41 卷
以发现数据的分布式特征表示,因此,本文考虑将深度 简单的预处理:预先将手势轮廓提取出来,将手势定义
学习应用于起重机吊运手势识别中。为了充分应用吊 为狭长型,然后将图像分割中的若干个实物区域进行轮
运 场 景 下 的 手 势 状 态 —— 初 始 静 态 手 势 、动 态 手 势 过 廓匹配,如果不符合手势轮廓,将其区域处理为背景色。
程,本文设计了一种动态手势轨迹静态化的方法,并且
对深度学习算法中的卷积神经网络进行扩充,设计了复
合神经网络模型,并将其应用于起重机吊运手势识别中。
图 1 手势提取图像
1 基于深度学习的吊运手势识别 Fig. 1 Gesture extraction image
背景中分割出来,得到手势的黑白二值图像。其中 Y 代
表亮度,C r 与 C b 分别可以表示成蓝色分量、红色分量与
X jt = f (∑
i ∈ Zj
( X it - 1 × k ti, j ) + b tj
) (2)
万方数据
第 23 期 汪 涛,等:基于深度学习的起重机吊运手势识别 129
手势特征提取模块、动态手势特征提取模块和合并输出 并 将 10 次 独 立 实 验 的 正 确 率 平 均 值 作 为 最 终 实 验 结
模块三部分组成。 果,图 3 列出了 5 种手势的识别率。
1)静态手势特征提取模块
该模块的作用是对静态手势的特征进行提取。其
输入以 t 0 时间段采集的图像为基础,进行手势分割后作
为特征提取对象。该模块中采用卷积神经网络作为基
础算法,通过多层的卷积操作、降采样操作,可以输出静
态手势的抽象特征。
2)动态手势特征提取模块
动态手势识别的关键就是识别手势在空间中运动
所形成的轨迹,如图 2 所示。采集 t 0 时刻手势图像的基
本 轮 廓 ,以 90° 为 一 个 间 隔 ,采 集 四 个 方 向 的 坐 标 点 图 3 每种手势的平均正确率结果
Fig. 3 Average accuracy of each gesture
( x i , y i ) ( i = 1, 2, 3, 4 ) ,并 计 算 手 势 的 中 心 坐 标 点 ( x t , y t ) =
复合神经网络模型的平均识别性能达到了 87.67%,
∑( x , y )
4
i i 4 。从 t 1 时间段开始,如果手势中心坐标点的
i=1 有效地识别了吊运指挥手势。
值没有变化,则动态手势部分的输入仍然是 t 0 时间段采
3 结 语
集的图像;如果手势中心坐标点的值发生了变化,则认为
本文以深度学习算法中的卷积神经网络为基础,实
是动态手势,记录其运动轨迹,取其在某个时间段内不同
现了一种复合神经网络模型,并将其应用于起重机吊运
帧的坐标点的集合。假设在 t 时刻,手势所处的初始位置
手势识别中,实验结果证明了该方法的有效性。深度学
为 ( x t , y t ),按照一定的速度进行采样,可形成手势轨迹
习 的 优 越 性 正 逐 步 被 发 掘 ,其 改 进 和 优 化 还 在 不 断 继
向量 G,因此动态手势已经转变为静态的运动轨迹图像。
续,后面将继续在网络结构的设置方案上进行研究,提
升手势识别的性能。
参 考 文 献
图 2 手势的运动轨迹
[1] WENG H L,ZHAN Y W. Vision -based hand gesture recogni-
Fig. 2 Motion trajectory of gesture
tion with multiple cues [J]. Computer engineering & science,
该模块的组成也包括卷积层和下采样层,用来对动 2012,34(2):123-127.
态手势的轨迹图像进行学习与特征提取。 [2] 宁亚楠,李定主,韩燮,等 . 基于稀疏表示的手势识别方法[J].
计算机工程与设计,2016,37(9):2548-2552.
3)合并输出模块
NING Yanan,LI Dingzhu,HAN Xie,et al. Gesture recogni-
合并输出模块由合并层和输出层组成,合并层将静
tion method based on sparse representation [J]. Computer engi-
态手势特征向量和动态手势轨迹特征向量合并在一起,
neering and design,2016,37(9):2548-2552.
与输出层的若干神经元进行全连接,该层神经元的输入 [3] 杨纪争,
冯筠, 等 . 面向静态手势识别的边缘序列递归模
卜起荣,
实际就是上层表述特征的各神经元的加权求和,输出对 2017,
型算法[J].计算机辅助设计与图形学学报, 29(4):
599-606.
手势类别的预测结果。 YANG Jizheng,FENG Jun,BU Qirong,et al. Gesture recogni-
tion algorithm based on contour sequence recursive model [J].
2 实 验
Journal of computer-aided design & computer graphics,2017,
本文采集了起重机吊运场景中的 5 种手势,分别是 29(4):599-606.
预备、要主钩、要副钩、吊钩上升、吊钩水平微微移动,共 [4] FENG Z Q,YANG X W,XU T,et al. Gesture recognition based
on combining gesture binary descriptor and Hausdorff-like dis-
采集样本数 1 400 个,选取其中 800 幅图像作为学习数
tance [J]. Acta electronica Sinica,2017,45(9):2281-2291.
据,其余 600 幅图像作为测试使用。每个数字图像的大
[5] 陶丽君,
李翠华, 等 . 基于 Kinect 传感器深度信息的动态
张希婧,
小为 28×28,均为灰度图像。静态手势识别的网络设置
2013,
手势识别[J].厦门大学学报(自然科学版), 52(4):
493-497.
为:设置 5 个卷积层,降采样层采用平均采样法。动态手 TAO Lijun,LI Cuihua,ZHANG Xijing,et al. Dynamic ges-
势识别模块的网络设置为:设置 3 个卷积层,降采样层 ture recognition based on Kinect depth data [J]. Journal of Xia-
采用平均采样法。合并输出层采用平均点积法,权值各 men University(natural science),2013,52(4):493-497.
为 0.5,分类器采用 Softmax 算法。实验分别进行 10 次, (下转第 133 页)
万方数据
第 23 期 袁 涛,等:发动机冷却水泵智能控制系统设计 133
作者简介:袁 涛(1990—),男,山西晋城人,硕士研究生,主要从事计算机辅助设计、智能制造等研究。
吕 健(1983—),男,满族,河北承德人,博士,副教授,主要从事计算机辅助设计、智能制造等研究。
王 波(1993—),男,贵州毕节人,硕士研究生,主要从事嵌入式与自动化装置研究。
(上接第 129 页)
[6] XU Y,WANG Q,BAI X,et al. A novel feature extracting [D]. 成都:电子科技大学,2013.
method for dynamic gesture recognition based on support vector WU Yaoling. YCrCb color space face detection algorithm based
machine [C]// 2014 IEEE International Conference on Informa- on the design and implementation [D]. Chengdu:University of
tion and Automation. Hailar:IEEE,2014:437-441. Electronic Science and Technology of China,2013.
[7] SERMANET P,KAVUKCUOGLU K,CHINTALA S,et al. Pe- [10] 彭雅琴,成孝刚 . 一种优化的卷积神经网络深度学习算法[J].
destrian detection with unsupervised multi - stage feature lear - 现代电子技术,2016,39(23):179-181.
ning [C]// 2013 IEEE Conference on Computer Vision and Pat- PENG Yaqin,CHENG Xiaogang. An optimized deep learning
tern Recognition. Portland:IEEE,2013:3626-3633. algorithm of convolutional neural networks [J]. Modern elec-
[8] ZHANG C, ZHANG Z. Improving multiview face detection tronics technique,2016,39(23):179-181.
with multi - task deep convolutional neural networks [C]// 2014 [11] SAXE A M,PANG W,KOH Z,et al. On random weights
IEEE Winter Conference on Application of Computer Vision. and unsupervised feature learning [C]// Proceeding of 2011 In-
Steamboat:IEEE,2014:1036-1041. ternational Conference on Machine Learning. Bellevue:
[9] 吴要领 . 基于 YCrCb 色彩空间的人脸检测算法的设计与实现 ACM,2011:1089-1096.
作者简介:汪 涛(1978—),男,江苏泰州人,硕士,主要研究方向为人工智能。
万方数据