雷雪梅等。 - 2022 - 基于卷积神经网络的农机图像自动识别研究

第４３卷第５期中国农机化学报Ｖｏ
ｌ．４３Ｎｏ．５
２０
１２０年５月
４２Ｊ
ｏｕｒ
ｎａｌｏ中国农机化学报
ｆＣｈｉ
ｎｅｓ
ｅＡｇ
ｒｉｃｕ
ｌｔｕ
ｒａｌＭｅ
ｃｈａｎ
ｉｚａ
ｔｉｏｎＭａｙ２．
０２２
２年
０２２
ＤＯＩ：１０．
１３７３３／
ｊｊ．
ｃａｍ．
ｉ
ｓｓｎ．
２０９５－５５５３．
２０２２．
０５．
０２１
基于卷积神经网络的农机图像自动识别研究＊
雷雪梅１，张光强２，姚旗３，刘伟渭４，邱帅５
１．四川化工职业技术学院智能制造学院，四川泸州，
（６４６０００；２．国家农业智能装备工程技术研究中心，
１０００８９；３．西北农林科技大学农学院，陕西咸阳，
北京市，７１２１００；４．西南交通大学机械工程学院，
６１００３１；５．西南大学人工智能学院，重庆市，
成都市，４００７１５）
摘要：基于农机物联网技术的农机作业监管系统通过采集机具图像来判断农业机具类型和作业状态，但是由于图像数据
量大，人工抽查方式工作量大、效率低，难以满足监管识别需求。构建包括播种机、翻转犁、起垄机、深松机和旋耕机等类
型的图像数据集，并在Ｇｏｏｇ
ｌｅ公司的深度学习平台Ｔｅｎｓ
ｏｒｆ
ｌｏｗ下对机具图像数据集进行标注和图像预处理。设计针对
实际监管需求和图像特点的卷积神经网络模型，并通过减少过拟合与提高训练效率对模型进行优化。模型训练试验结果
５％，相同试验条件下，
显示：本文设计的机具识别网络在验证集上的识别率达到９８．ｔ－５模型在验证集上的识别率
ＬｅＮｅ
为８１％，
ＲｅｓＮｅ８％，但是在识别效率上，
ｔ－５０模型在验证集上的识别率为９８．Ｒｅｔ－５０模型完成训练需要近６０ｈ，识
ｓＮｅ
别一张图片需要０．
３ｓ，而本文设计的机具识别网络完成训练仅需要３０ｈ，识别一张图片只需要０．
１ｓ。为进一步验证模型
的实用性，选取２００张图像进行测试，测得模型对各类机具图像的精确度平均值为９８．
４７％，召回率平均值为９８．
３７％，
Ｆ１－
ｃ
ｓｏｅ平均值为９８．
ｒ４１％，表明模型具有良好的鲁棒性，实用性良好。
关键词：农机机具；卷积神经网络；图像识别；深度学习
中图分类号：
Ｓ２２文献标识码：
Ａ文章编号：
２０９５－５５５３（
２０２２）０５－０１４０－０８
雷雪梅，张光强，姚旗，刘伟渭，邱帅．基于卷积神经网络的农机图像自动识别研究［
Ｊ］．中国农机化学报，２０２２，４３（
５）：
１４０－１４７
Ｌｅ
ｉＸｕｅｍｅｉ，ＺｈａｎｇＧｕａｎｇｑｉａｎｇ，ＹａｏＱｉ，ＬｉｕＷｅｉ，Ｑｉ
ｉｗｅｕＳｈｕａ
ｉ．Ｒｅｓｅ
ａｒｃｈｏｎａｕｔｏｍａｔｉ
ｃｒｅｃｏｇｎｉ
ｔｉｏｎｏ
ｆａｇｒ
ｉｃｕ
ｌｔｕｒ
ａｌ
ｍａｃｈ
ｉｎｅｉｍａｇｅｂａ
ｓｅｄｏｎｃｏｎｖｏｌｕ
ｔｉｏｎａ
ｌｎｅｕ
ｒａｌｎｅ
ｔｗｏｋ［
ｒＪ］．
ＪｏｕｒｎａｌｏｆＣｈ
ｉｎｅｓｅＡｇｒ
ｉｃｕｌ
ｔｕｒａｌＭｅｃｈａｎｉ
ｚａｔ
ｉｏｎ，２０２２，４３（５）：
１４０－１４７
计［１０－１１］、农机路径规划［１２］等都改变了传统的生产方
０引言
式，提高了工作效率。基于卷积神经网络的图像识别
目前，以通讯网络和互联网为基础，通过卫星定位算法［１３－１４］是以视觉系统的特征分层机制为依据，模拟
装置、农机作业工况传感器、图像传感器等感知农机实神经元之间的连接来自动提取图像特征，通过多层迭
时运行状态，实现对农机装备集群作业的智能化识别、代、特征抽象、最终实现分类识别。经典的卷积神经网
定位、
监测和管理的物联网技术得到了快速发展和实践络结构，如ＬｅＮｅ［］
ｔ１５、Ａｌｔ１６等，由卷积层、池化
ｅｘＮｅ
［］
应用。为了鼓励农户实施农业机械化作业，国家在
１－２］
［
层、全连接层组成。卷积层使用不同的卷积核提取多
多个省份相继展开农机作业补贴。然而在政策实施过程种图像特征，池化层在保留主要信息的同时对特征图
中，
存在农机作业质量层次不齐、虚报作业面积、虚报农进行降维处理，通过多次的卷积—池化连接，提取的图
机补贴等情况，
为了减少这种情况的出现，政府相关部门像特征从具体的边缘信息到抽象的语义信息，再经过
通过无线通讯和网络技术实现监管农机作业质量［
３－５］
。全连接层的迭代，实现分类识别［１７－１９］。卷积神经网络
利用图像识别技术自动识别农机机具类型和作业
其中，算法不需要手工提取特征，在图像识别［２０－２１］、语音识
状态，能够降低人工抽检强度、加强监管力度、提高系统别［２２－２３］、自然语言处理［２４－２５］等方向已经有了非常好
智能化水平，是农机作业监管系统的关键技术之一。的应用效果。彭明霞等［２６］采用Ｆａ
ｓｔｒＲ－ＣＮＮ方法
ｅ
图像识别技术在农业科技方面有着非常广泛的应对棉花杂草进行了识别，其平均目标识别准确率达到
用，如病虫害识别［
６－７］
、果实品种识别［
８－９］
、产量估了９５．
５％。卢伟等２７采用卷积神经网络方法检测拖拉
［］
２０２１年１０月３０日
收稿日期：２０２２年３月２５日
修回日期：
＊基金项目：中国博士后基金面上资助（２０２０Ｍ６８２５０６）；四川省科技计划项目（
１９ＹＹＪＣ０５１３）；国家自然科学青年基金（５１７０５４３２）
第一作者：雷雪梅，女，１９９１年生，四川泸州人，讲师；研究方向为自动化及控制工程。Ｅ－ｍａｌ：１３９２９５８６６７＠ｑｑ．
ｉｃｏｍ
第５期雷雪梅等：基于卷积神经网络的农机图像自动识别研究１４１
机驾驶员面部特征，用于识别驾驶员的疲劳状态，其模农机机具图像数据集。
型识别准确率为９８．
９％。孔庆好等
［
以拖拉机运行速
２８］
３农机机具图像预处理
１．
度与发动机转速等信息为基础，采用卷积神经网络对拖与其他研究领域的图像数据相比较，农机作业环
拉机工况进行了识别检测，其准确率可以达到９３．
３％。境较为恶劣，获取的机具图像质量较差、图像背景复
然而采用卷积神经网络对农机图像识别报道文献较少。杂、图像拍摄角度存在差异。图像预处理不仅可以消
本文采用基于卷积神经网络的图像识别技术，研除背景、颜色及尺寸差异等噪声的影响，还能减少网络
究大量农机机具图像的自动分类方法。对农机机具图训练计算量，提高算法效率和网络准确率。本文针对
像进行预处理，构建农机机具图像标注数据集，设计卷农机机具图像存在的问题，分别进行了图像裁剪、图像
积神经网络模型，实现农机机具图像的自动识别。色彩调整和运动模糊消除３个方面的图像预处理。
１图像裁剪
３．
１．
１构建农机机具图像标注数据集
原始机具图像是由不同地区的不同农机作业监控
１图像收集与整理
１．装置拍摄获得，因此存在图像尺寸差异。由于神经网
本文以农机机具图像作为识别对象，在农机作业络采用固定的输入节点，将机具图像输入给神经网络
ｎ拍摄一次作业机具图
过程中，车载摄像头每隔２ｍｉ之前，需要统一图像尺寸。本文采用双线性插值法将
像并通过ＧＰＲＳ无线网络上传到监管系统中。通过分机具图像裁剪为６４像素 ×６４像素。双线性插值法的
析农业机具作业图像，整理出多种作业背景下的播种核心思想是在ｘ与ｙ方向分别进行一次线性插值计
机、翻转犁、起垄机、深松机和旋耕机５种类型的常用算，相比于最邻近插值的粗糙以及双立方插值的计算
机具图像。构建了容量为７３９７０张的农机机具图像量过大，该算法处理效果较稳定、计算难度低。
数据集，其中，
５５０００张图像用于构建训练集，
１８９７０２图像色彩调整
３．
１．
张图像用于构建验证集，二者互相独立且无重叠。每在训练农机机具图像识别网络时，通过调整机具
种类型的机具图像数量均按照收集的原始图像比例设图像的色相、亮度、对比度等属性，能够使训练后的网
置，同时为满足网络输入要求，所有图像尺寸均转换为络尽可能少地受到无关因素的影响。本文采用
６４像素 ×６４像素大小，表１为数据集中不同机具类型Ｔｅｎｓｏ
ｒｆｏｗＡＰＩ提供的图像预处理函数ｂｒ
ｌｉｇｈ
ｔｓ函
ｎｅ
图像数量的具体分布情况。数对原始机具图像进行处理。经过图像预处理，局部
表１农机机具图像数量分布
ａ））、色相差的图像（图１（
亮度偏高的图像（图１（ｂ））、
Ｔａｂ．
１Ｑｕａｎ
ｔｉｙｄ
ｔｉ
ｓｔｒ
ｉｂｕ
ｔｉｏｎｏ
ｆａｇ
ｒｉｃｕ
ｌｔｕ
ｒａｌｍａ
ｃｈｉ
ｎｅｙｉｍａｇｅ
ｒ
对比度低的图像（图１（
ｃ））等，被恢复为清晰的农机机
样本尺寸（宽 × 高）ｄ），图１（
具图像（图１（ｅ），图１（
ｆ））。
机具类型训练集／张验证集／张
／像素 × 像素
播种机２００００８０００６４×６４

翻转犁１００００３８７０６４×６４
起垄机６０００１５００６４×６４
深松机６０００１５００６４×６４
旋耕机１３０００４１００６４×６４
合计５５０００１８９７０６４×６４
２标注数据集
１．图１机具图像调整色彩前后对比图
卷积神经网络算法属于监督分类，需要对大量数Ｆ
ｉｇ．
１Ｃｏｍｐａｒ
ｉｓｏｎｏｆｍａｃｈ
ｉｎｅａｎｄｔｏｏ
ｌｉｍａｇｅ
ｓｂｅ
ｆｏｒ
ｅａｎｄ
据集进行标注。本研究采用Ｔｅｎｓｏ
ｒｆｏｗ平台对农机
ｌａ
ｆｔｅ
ｒｃｏ
ｌｏｒａｄｕｓ
ｊｔｍｅｎ
ｔ
机具图像数据集进行标注。首先，将整理好的训练集３运动模糊消除

３．
１．
和验证集存放在两个文件夹下，每个文件夹包含前述农机机具图像是在农机作业过程中由车载摄像头
的５种图像类型，即播种机、翻转犁、起垄机、深松机和拍摄获得，因此经常会出现运动模糊的机具图像。所
旋耕机，并分别建立对应的文件夹标签。然后，使用谓运动模糊是指拍摄相机和被摄景物之间存在相对运
ｅ
Ｔｎｓ
ｏｒｆ
ｌｏｗ的内置函数将每张图片转换成固定长度的动而造成的图像模糊。模糊图像的处理方法主要有图
二进制数据，其中第一个字节为图像标签，剩余６４× 像超分辨率重构、图像增强、图像复原３种。其中，图
６４×３字节是图像信息。最终，本文将训练集和验证集像复原是根据图像退化的先验知识建立一个退化型，
分别转换为两个独立的二进制文件，得到完成标注的以该网络为基础，采用各种逆退化处理算法逐步进行
１４２中国农机化学报２０２２年
恢复，从而达到改善图像质量的目的。本文采用了图像复原方法中的维纳滤波算法对运
动模糊机具图像进行预处理，将运动模糊的播种机（图
ａ））、深松机（图２（
２（ｂ））、翻转犁（图２（
ｃ）），处理为清
晰的农机机具图像（图２ｄ图２ｅ图２（
（），（），ｆ））。
２农机机具图像自动识别算法
１卷积神经网络结构
２．
本文设计的卷积神经网络结构如图３所示，共７
层，包含４个卷积层和３个全连接层。其中，前２个卷
图２机具图像去除运动模糊前后对比图
ｉ
Ｆｇ．
２Ｃｏｍｐａ
ｒｉｓ
ｏｎｏｆｍａｃｈｉ
ｎｅａｎｄｔｏｏ
ｌｉｍａｇｅ
ｓｂｅ
ｆｏｒ
ｅ积层后面连接池化层，最后１个全连接层使用
ａｎｄａｆｔ
ｅｒｒ
ｅｍｏｖｉ
ｎｇｍｏｔ
ｉｏｎｂｌｕ
ｒＳｏ
ｆｔｍａｘ函数做分类。
图３卷积神经网络结构
ｉ
Ｆｇ．
３Ｓ
ｔｒｕｃ
ｔｕｒ
ｅｏｆｃ
ｏｎｖｏ
ｌｕｔ
ｉｏｎａ
ｌｎｅｕ
ｒａｌｎｅ
ｔｗｏ
ｒｋ
若Ｘｉ表示卷积神经网络的第ｉ层特征图，网络输１２８的卷积核，对Ｃ３层输出特征图做卷积，得到２５６
入Ｘ０为６４×６４×３的原始图像，则卷积层Ｘｉ的计算个１４×１４的特征图，输出给Ｆ５层。Ｆ５层采用３８４个
过程可描述为神经元，对２５６个１４×１４的特征图进行全连接处理；
Ｘｉ＝ｆ（∑Ｘｉ－１ ⊗ Ｗｉ＋ｂｉ）（
１）Ｆ６层采用１９２个神经元，对２５６个神经元进行全连接
ｉ
处理；Ｆ７层使用ｓｏ
ｆｔｍａｘ函数将特征向量处理结果分
其中，
Ｗｉ表示第ｉ层卷积核的权值向量；运算符
为５类。
号 ⊗ 代表卷积核与第ｉ层图像或特征图进行卷积操
表２卷积神经网络参数设计
作，卷积的结果与神经元偏移量ｂｉ相加；然后通过非Ｔａｂ．
２Ｄｅ
ｓｉｇｎｏｆｃｏｎｖｏ
ｌｕｔ
ｉｏｎｎｅｕ
ｒａｌｎｅ
ｔｗｏ
ｒｋｐａ
ｒａｍｅ
ｔｅｒ
ｓ
ｘ）得到第ｉ层的特征图，本文卷
线性的激励函数ｆ（详细参数
积神经网络中选用Ｒｅ层号类别
ｌｕ函数作为非线性激励函数，特征图数卷积核大小步长
它具有收敛性能好、计算复杂度低等特点。常用的
Ｃ１卷积层１３２５×５１
池化方式有平均池化和最大池化，本研究采用了最
Ｓ１池化层１３２３×３２
大池化法。若Ｘｉ是池化层，则Ｘｉ的计算过程可描
Ｃ２卷积层２６４５×５１
述为Ｓ２池化层２６４３×３２
Ｘｉ＝Ｍａｘｐｏ
ｏｌｎｇ（
ｉＸｉ－１）（
２）Ｃ３卷积层３１２８５×５１
表２为卷积神经网络详细设计参数。Ｃ４卷积层４２５６５×５１
Ｃ１层采用了３２个５×５×３的卷积核，步长为１，Ｆ５全连接层１神经元个数：

３８４
Ｆ６全连接层２神经元个数：
１９２
对输入图像卷积之后提取出３２种特征，得到３２个
Ｆ７Ｓｏ
ｆｔｍａｘ层神经元个数：
６
６０×６０的特征图，再经过Ｓ１层得到３２个２９×２９的特
征图。Ｃ２层有６４个５×５×３２的卷积核，对第Ｓ１层２减少过拟合
２．
输出特征图做卷积，得到６４个２９×２９的特征图，再经卷积神经网络模型对训练集识别率很高，而对于
过Ｓ２层得到６４个１４×１４的特征图。Ｃ３层有１２８个验证集识别率很低的情况称为过拟合，通常是由于模
５×５×６４的卷积核，对第Ｓ２层输出特征图做卷积，得型过于复杂，训练数据不足或训练集图像分布不均匀。
到１２８个１４×１４的特征图；
Ｃ４层使用２５６个５×５× 本研究采用了增强数据集和模型正则化的方法来减少
第５期雷雪梅等：基于卷积神经网络的农机图像自动识别研究１４３
过拟合。据归一化到０～１之间，可以简化计算，加快网络收敛

１增强数据集
２．
２．性能，提高网络计算精度。归一化方法有离差归一化
在本研究中，采用了２种方法增强数据集：增加数和标准差归一化，本研究中使用标准差归一化
据集的数量和提高数据集的丰富性。数据集的丰富性ｘ－μ
ｘ＊＝（
５）
能够保证模型对不同背景条件的机具图像都有良好的 σ
识别能力。通过采用随机裁剪和垂直翻转的方法来增式中：μ———所有像素的均值；
大数据集的数量，具体方法如下：首先，在６４×６４大小 σ———所有像素的标准差。
的图像中心位置和４个边角等５个区域分别提取６０× 归一化后的图像满足均值为０，标准差为１的标
６０区域用作训练，这样将数据集扩大了５倍；由于设准正态分布。神经网络是以样本在事件中的统计概率
备安装方式的不同，导致有部分机具图像是上下颠倒来进行训练和预测的，将数据归一化到０～１之间统计
的，为了平衡这部分数据，提高模型对其识别能力，对概率分布，使得样本所有像素的均值为０，并且其标准
所有图像进行垂直翻转，在保证数据丰富性的同时，又差一致，可以提高网络学习速度，加快网络收敛。
将数据集扩大了２倍。２多ＧＰＵ训练
３．
２．
２模型正则化
２．
２．本文设计的机具识别网络模型需要训练的参数有
正则化是降低模型复杂度的一种方法，通过给损２×１０５，处理完所有图片需要进行上亿次加乘运算，传
失函数加上约束项来对参数引入先验分布，控制损失统的ＣＰＵ单线处理需要４～５ｄ的时间才能使模型达
函数的优化倾向于选择较小参数的方向。本文所用的到收敛，效率太低不利于修改参数和调整网络。ＧＰＵ
Ｌ２正则化就是在损失函数后面加一个正则化项，得到计算模块专为处理大规模、高密度浮点数据而设计，其
新的损失函数带宽大、数据并行计算的优势极大地提高了运算速度，
λ 减少了运算时间。本文采用２块ＧＰＵ并行运算的方
Ｃ＝Ｃ０＋ ω
２
（
３）
２ｎ ∑
ω 式训练网络模型，如图４所示。
式中：Ｃ０ ———原始的代价函数；
λ
ω ———正则化项。
２
２ｎ∑
ω
所有参数 ω 平方和除以训练集样本大小ｎ，再乘
以正则系数λ，λ 的作用即是权衡正则项与原始代价函
数Ｃ０的比重。按照梯度下降法更新参数的规则，先对
新的损失函数求导，然后得到参数更新值
∂Ｃ ∂Ｃ０
′＝ω －η
ω
∂ω
＝ω － η （
∂ω
λ
＋η ω
ｎ）
∂Ｃ０
（λ
＝ω １－η －η
ｎ）∂ω
（４）图４ＧＰＵ计算模型
ｉ
Ｆｇ．
４ＭｏｄｅｌｏｆＧＰＵｃａ
ｌｃｕ
ｌａｔ
ｉｏｎ
４）中可以看出，正则化后的损失函数在更新
从式（
卷积神经网络的训练目标是最小化网络的损失函
λ
（）
参数时有一个衰减因子１－η ＜１，因此Ｌ２正则化
ｎ数。原始图像经过前向传输后得到预测值，使用平方
也称为权重衰减。权重衰减有２个作用：一是减少了误差代价函数计算预测值与实际值之间的差异，第ｎ
不重要特征的影响，使模型不至于学习过多特征而导个样本的误差函数可表示为
ｃ
致泛化能力差；二是在梯度下降的同时，从整体上保证１ｎｎ２
Ｅｎ（
Ｗ，ｂ）＝ ∑（
ｔｋ－ｙｋ）（
６）
了模型选择较小的参数，降低了模型复杂度。２ｋ＝１
３提高模型训练效率
２．式中：
ｔｋｎ ———第ｎ个样本对应标签的第ｋ维；
ｙｋ ———第ｎ个样本对应的网络输出的第ｋ个
ｎ
１归一化图像
３．
２．
图像归一化是计算机视觉中对数据集预处理的常输出；
用方法之一，主要利用图像的不变矩寻找一组参数使ｃ———分类数目。
其能够消除其他变换函数对图像变换的影响，也就是训练过程中，使用随机梯度下降方法将ｌ
ｏｓｓ值反
转换成唯一的标准形式来增强图像的仿射变换。在卷向传播，逐层更新网络参数。参数更新规则为
积神经网络算法中，将像素值为０～２５５的ＵＮＩＴ型数
１４４中国农机化学报２０２２年
∂Ｅ（
Ｗ，ｂ）１ＲＯＣ曲线与ＡＵＣ
２．
３．
Ｗｉ＝Ｗｉ－η （
７）
∂ＷｉＲＯＣ曲线的横坐标为假阳性率（
Ｆａｌ
ｓｅＰｏｓ
ｉｔｉ
ｖｅ
∂Ｅ（
Ｗ，ｂ）
（Ｒａ
ｔｅ，ＦＰＲ），纵坐标为真阳性率（ＴｒｕｅＰｏｓ
ｉｔｉ
ｖｅＲａｅ，
ｔ
ｂｉ＝ｂｉ－η ８）
ｂｉ
∂ ＴＰＲ），该曲线下各部分的面积求和即为ＡＵＣ。在图
式中： η ———学习率。
ＲＯＣ曲线能够尽量降低不同
像识别评价精度指标中，
０１，一次训练的数据集大
将初始学习率η 设为０．
测试集带来的干扰，更加客观地衡量网络本身的性能。
小（
ｂａｔ
ｃｈｓ
ｉｚｅ）为１２８，以０均值，标准差０．
０１的高斯分
ＦＰＲ和ＴＰＲ的计算方法分别为
布初始化每层权重Ｗｉ，神经元偏置量ｂｉ的初始值为
ＦＰ
ＦＰＲ＝（
９）
０。以８个线程将数据分批、独立地分布在２块ＧＰＵＮ
上，
２个ＧＰＵ共享模型参数，同步运算。由于ＧＰＵ之ＴＰ
ＴＰＲ＝１０）
（
间传输数据比较慢，计算得到的参数全部存储在ＣＰＵＰ
上，并在ＣＰＵ上更新所有参数。式中：Ｐ ———真实的正样本的数量；
Ｎ ———真实的负样本的数量；
３试验与分析
ＴＰ ———Ｐ个正样本中被分类器预测为正样本的
１模型训练试验与结果分析
３．个数；
本文网络模型在２块ＮＶＩＤＩＡＧｅＦｏ
ｒｃｅＧＴＸＦＰ ———Ｎ个负样本中被分类器预测为正样本
１０８０ＧＰＵ上训练，迭代１０００００次之后，损失函数收个数。
敛到０．０１。将本文所建的农机机具图像标注数据集在ＡＵＣ可通过对ＲＯＣ曲线下各部分的面积求和得
ｔ－５和Ｒｅ
ＬｅＮｅｔ－５０上分别进行训练，与本文所
ｓＮｅ到，且ＲＯＣ曲线是由坐标为｛（ｘ１，
ｙ１），（ｙ２），…，
ｘ２，
用机具识别网络进行对比，
３个网络的参数配置及训（ｙｍ）}的点按顺序连接而形成，则ＡＵＣ的计算为
ｘｍ，
练结果见表３。１
ｍ－１
表３３种卷积神经网络性能比较
ＡＵＣ＝
２ ∑ （ｘ
ｉ＝１
ｉ＋１－ｘｉ）·（
ｙｉ＋ｙｉ＋１）１１）
（
Ｔａｂ．
３Ｐｅ
ｒｆｏ
ｒｍａｎｃ
ｅｃｏｍｐａ
ｒｉｓ
ｏｎｏ
ｆｔｈｒ
ｅｅｃ
ｏｎｖｏ
ｌｕｔ
ｉｏｎａ
ｌ式中：
ｘｉ、ＦＰＲ）、真阳性率
ｙｉ ———上述假阳性率（
ｎｅｕ
ｒａｌｎｅ
ｔｗｏ
ｒｋｓ
ＴＰＲ）取值。
（
单张图
输入图像训练时识别准ＲＯＣ曲线经常作为二分类最重要的指标之一，对
网络名称层数片识别
大小间／ｈ确率／％于本文多分类，将ｍ个测试样本（
效率／ｓｎ个类
ｍ＝２６００），
别（
ｎ＝１３）。在训练完成后，计算出每个测试样本在各
ＬｅＮｅ
ｔ－５５３２×３２６８１０．
２
Ｒｅ
ｓＮｅ
ｔ－５０８２２４×２２４５８９８．
８０．
３类别下的概率，得到一个［ｍ，ｎ］形状的矩阵Ｑ，每一行
本文卷积神经网络７６４×６４３０９８．
５０．
１按类别标签排序，表示一个测试样本在各类别下概率
从表３的对比结果分析：ｔ－５结构简单，网
ＬｅＮｅ值。相应地，将每个测试样本的类别转换为类似二进
络层数少，输入图像小，所需训练时间最少，但是其识制的形式，每个位置按标签排序，用来标记是否属于对
别准确率较低，仅有８１％，无法满足实际应用需求；应的类别，由此也可以获得一个［
ｍ，ｎ］的标签矩阵Ｌ。
Ｒｅ
ｓＮｅｔ－５０网络和本文卷积神经网络识别准确率均每种类别下，都可以得到ｍ个测试样本为该类别的概
超过９８％，满足实际应用需求，但是ＲｅｓＮｅｔ－５０网络率（矩阵Ｑ中的列）。所以，根据概率矩阵Ｑ和标签矩
比较复杂，参数较多，其训练时间需要５８ｈ，相比之下，阵Ｌ中对应的每一列，可以计算出各个阈值下的假阳
本文的机具识别网络训练时间比较少，只有３０ｈ，并且性率（ＴＰＲ），从而绘制出一条
ＦＰＲ）和真阳性率（
测试一张图片的效率也高于Ｒｅｔ－５０。综上所述，
ｓＮｅＲＯＣ曲线。这样总共可以绘制出ｎ条ＲＯＣ曲线。最
从网络结构与参数、训练时间、识别准确率及效率上来后对ｎ条ＲＯＣ曲线取平均，得到最终的ＲＯＣ曲线和
说，本文设计的网络结构适用于农机机具图像识别，可ＡＵＣ。本次农机机具识别网络测试试验中，农机机具
满足实际监管需求。图像分类的ＲＯＣ曲线与ＡＵＣ如图５所示。
２模型测试试验与结果分析
３．在图５中，试验结果表明ＲＯＣ曲线下的ＡＵＣ均
为了描述网络的实际应用性能，本文从２０２１年９值为９２％，且曲线靠近左上角，说明本文的机具识别
月江苏省农机深松作业图像中挑选出５种机具类型图网络分类的真阳性率很高，分类错误较少，该网络对５
像各２００张对模型进行测试，并从召回率、鲁棒性２个种机具图像的分类能力符合实际应用需求；同时ＲＯＣ
方面对模型进行评价。曲线是光滑的，说明农机机具识别网络训练后没有出
第５期雷雪梅等：基于卷积神经网络的农机图像自动识别研究１４５
现太大的过拟合。３７％，说明网络对正样本的
强；召回率的平均值为９８．
识别能力很强；
Ｆ１－ｓ
ｃｏｒ４１％，说明分
ｅ的平均值为９８．
类网络对大部分机具类型、作业场景、非机具图像以及
光影干扰等都能准确识别，具有良好的鲁棒性、稳健
性、实用性较强，满足实际应用的要求。
表５精确度、召回率和Ｆ１值
Ｔａｂ．
５Ｐｒｅ
ｃｉｓ
ｉｏｎ，ｒ
ｅｃａ
ｌｌａｎｄＦ１－ｓ
ｃｏｒ
ｅ％
指标ＡＢＣＤＥ平均值
Ｐ１００９６．
９４９７．
４７９８．
９９９８．
９７９８．
４７
Ｒ９７．
９５９７．
９６９８．
９９９９．
５０９７．
４４９８．
３７
图５农机机具图像ＲＯＣ曲线与ＡＵＣ图Ｆ１－ｓ
ｃｏｒ
ｅ９８．
９６９７．
４５９８．
２２９９．
２４９８．
２０９８．
４１
ｉ
Ｆｇ．
５ＲＯＣｃｕ
ｒｖｅａｎｄＡＵＣｄｉ
ａｇｒａｍｏ
ｆａｇ
ｒｉｃｕ
ｌｔｕ
ｒａｌ
ｍａｃｈ
ｉｎｅ
ｒｙａｎｄｔｏｏ
ｌｓ３讨论
２．
３．
２．
３．２混淆矩阵和Ｆ１－ｓ
ｃｏｒ
ｅ识别错误的机具图像如图６所示，分析原因如下。
在图像识别评价精度中，混淆矩阵主要用于比较１）采集图像时，由于摄像头倾斜等原因只拍到机
真实结果和实际预测值。若Ｍ［
ｔ，ｐ］表示混淆矩阵，具的一部分导致识别错误，图６（ｆ）和图６（ｇ）将翻转犁
第ｔ行代表真实类别，每一行的总数代表该类别的真识别为起垄机，图６（
ｏ）将旋耕机识别为深松机。
实数量。第ｐ列代表预测类别，每一列的总数表示预２）机具表面存在土壤、秸秆、人、草等，遮挡了大
测为该类别的数量；矩阵中的值，实际为ｔ类的样本被部分机具，图６（
ｌ）和图６（ｍ）将旋耕机识别为翻转犁，
判定为ｐ类的数量。图６（
ｋ）将深松机识别为起垄机。
Ｆ１－ｓｃｏ
ｒｅ用于评价分类网络性能，它考虑测试的３）部分机具外形相似，如图６（
ｋ）将深松机识别为
精确度Ｐ和召回率Ｒ来计算分数，公式如式（
１２）翻转犁，该类型的深松机和翻转犁均为三角框架形式，
所示。差别只在其安装的深松铲。
２×Ｐ ×Ｒ４）数据集收集不够全面，如播种机图６（ａ）、图６
ｃ
Ｆ１－ｓｏｒ
ｅ＝１２）
（
Ｐ＋Ｒｂ）、图６（
（ｃ）、图６（
ｄ）图像均会出现识别错误，此种现
采用农机机具识别网络对测试集的５类机具图像象的情况较少，可能是其纹理、颜色比例与其他机具相
进行测试试验，试验结果的可视化混淆矩阵如表４似，所以识别错误。
所示。上述分析说明，模型仍存在不足之处：当机具图像
表４混淆矩阵有大面积遮挡或只拍摄到部分机具时，识别能力较弱。
Ｔａｂ．
４Ｃｏｎ
ｆｕｓ
ｉｏｎｍａ
ｔｒｉ
ｘ
ＡＢＣＤＥ
Ａ１９５１２０１
Ｂ０１９６３０１
Ｃ０２１９８００
Ｄ００１１９９０
Ｅ０３０２１９５
注：Ａ表示播种机，
Ｂ表示翻转犁，
Ｃ表示起垄机，
Ｄ表示深松机，
Ｅ表
示旋耕机。
分别计算机具类别Ａ～Ｅ的精确度、召回率和
ｃ
Ｆ１－ｓｏｅ，计算结果见表５。其中，精确度表示该类别
ｒ
混淆矩阵对角线的值除以该类别对应列总和；召回率
表示该类别混淆矩阵对角线的值除以该类别对应行总
和，ｃ
Ｆ１－ｓｏｅ值作为参数指标精确度和召回率的调和
ｒ
平均。
在表５中，农机机具识别网络在测试集上精确度图６识别错误农机机具图像
４７％，说明网络对负样本的区分能力很
的平均值为９８．ｉ
Ｆｇ．
６Ｍｉ
ｓｒｅ
ｃｏｇｎ
ｉｔｉ
ｏｎｉｍａｇｅｏ
ｆａｇ
ｒｉｃｕ
ｌｔｕ
ｒｅｍａ
ｃｈｉ
ｎｅ
１４６中国农机化学报２０２２年
害图像识别［Ｊ］．农业工程学报，２０１２，２８（１１）：１５２－１５７．

４结论［
８］Ｔ
ａｎＫｅ
ｚｈｕ，Ｃｈ
ａａ，ＳｏｎｇＷｅ
ｉＹｕｈｕｉｘｉ
ａｎ，ｅ
ｔａｌ．
Ｉｄｅ
ｎｔｉ
ｆｉ
ｃａｔ
ｉｏｎｏ
ｆ
ｓ
ｏｙｂ
ｅａｎｓ
ｅｅｄｖ
ａｒｉ
ｅｔｉ
ｅｓｂ
ａｓｅ
ｄｏｎｈｙｐ
ｅｒｓ
ｐｅｃ
ｔｒａ
ｌｉｍａ
ｇｅ［
Ｊ］．
１）构建了包括播种机、翻转犁、起垄机、深松机和
Ｔ
ｒａｎ
ｓａｃ
ｔｉｏｎ
ｓｏ
ｆｔ
ｈｅＣｈ
ｉｎｅ
ｓｅＳｏ
ｃｉｅ
ｔｙｏ
ｆＡｇ
ｒｉｃ
ｕｌｔ
ｕｒａ
ｌ
旋耕机５种类型的农机机具图像标注数据集，其中训
Ｅｎｇ
ｉｎｅ
ｅｒｉ９）：２３５－２４２．
ｎｇ，２０１４，３０（
练集５５０００张，验证集１８９７０张，该数据集可以用于９］陶华伟，赵力，奚吉，等．基于颜色及纹理特征的果蔬种类
［
研究农机机具的自动识别、检测、跟踪等智能化应用。识别方法［
Ｊ］．农业工程学报，２０１４，３０（
１６）：３０５－３１１．
针对农机机具图像存在的质量问题，分别进行了图像ＴａｏＨｕａｗｅｉ，ＺｈａｏＬ
ｉ，ＸｉＪｉ，ｅ
ｔａｌ．Ｆｒ
ｕｉｔｓａｎｄｖｅｇｅｔ
ａｂｌｅ
ｓ
裁剪、图像色彩调整和运动模糊消除３个方面的图像ｒ
ｅｃｏｇｎｉ
ｔｉｏｎｂａ
ｓｅｄｏｎｃ
ｏｌｏ
ｒａｎｄｔ
ｅｘｔｕｒ
ｅｆｅａ
ｔｕｒｅｓ［Ｊ］．
预处理。Ｔｒａｎｓａｃ
ｔｉｏｎｓｏｆｔｈｅＣｈｉ
ｎｅｓｅＳｏ
ｃｉｅ
ｔｙｏ
ｆＡｇ
ｒｉｃｕ
ｌｔｕ
ｒａｌ
Ｅｎｇｉｎｅ
ｅｒｉ，，（）：
ｎｇ２０１４３０１６３０５－３１１．
２）根据实际应用需求和数据特点，设计了能够自
１０］钱建平，李明，杨信廷，等．基于双侧图像识别的单株苹
［
动识别农机机具的卷积神经网络。在２块ＧＰＵ上训果树产量估测模型［
Ｊ］．农业工程学报，２０１３，２９（
１１）：
练了近８００００张机具图像，识别准确率超过９８％，单１３２－１３８．
张图片识别效率达０．
１ｓ。训练集和验证集识别率均Ｑｉ
ａｎＪ
ｉａｎｐ
ｉｎｇ，Ｌｎｇ，ＹａｎｇＸｉ
ｉＭｉｎｔｎｇ，ｅ
ｉｔａｌ．Ｙｉ
ｅｌｄ
超过９８％，说明网络对环境变化、光影干扰、小区域前ｅ
ｓｔｉｍａｔ
ｉｏｎｍｏｄｅ
ｌｏｆｓｉｎｇ
ｌｅｔｒｅｅｏｆＦｕ
ｊｉａｐｐｌ
ｅｓｂａ
ｓｅｄｏｎ
景遮挡具有良好的鲁棒性，训练集和验证集样本不重ｂ
ｉｌａｔ
ｅｒａ
ｌｉｍａｇｅｉｄｅｎｔ
ｉｆ
ｉｃａｔ
ｉｏｎ［Ｊ］．Ｔｒａｎｓ
ａｃｔ
ｉｏｎｓｏｆｔｈｅ
Ｃｈｉｎｅ
ｓｅＳｏ
ｃｉｅ
ｔｙｏｆＡｇ
ｒｉｃｕ
ｌｔｕ
ｒａｌＥｎｇ
ｉｎｅ
ｅｒｎｇ，２０１３，２９
ｉ
叠，说明网络有良好的泛化能力。
（１１）：１３２－１３８．
ｔ－５和Ｒｅ
３）与经典网络ＬｅＮｅｔ－５０相比，本
ｓＮｅ
１１］贾洪雷，王刚，郭明卓，等．基于机器视觉的玉米植株数
［
文设计的农机机具识别网络在保持较高识别准确率与量获取方法与试验［
Ｊ］．农业工程学报，２０１５，３１（
３）：
效率的同时，结构相对简单，参数较少，所需训练时间２１５－２２０．
较短。Ｊｉ
ａＨｏｎｇｌ
ｅｉ，ＷａｎｇＧａｎｇ，ＧｕｏＭｉ
ｎｇｚｈｕｏ，ｅ
ｔａｌ．Ｍｅ
ｔｈｏｄｓ
４）在训练集和验证集外，随机挑选５种类型的图ａｎｄｅｘｐｅ

ｒｉｍｅｎ
ｔｓｏ
ｆｏｂ
ｔａｉ
ｎｉｎｇｃ
ｏｒｎｐｏｐｕ
ｌａｔ
ｉｏｎｂａ
ｓｅｄｏｎ
ｍａｃｈｉｎｅｖｉｓ
ｉｏｎ［
Ｊ］．Ｔｒａｎｓ
ａｃｔ
ｉｏｎｓｏｆｔｈｅＣｈｉ
ｎｅｓ
ｅＳｏ
ｃｉｅ
ｔｙｏ
ｆ
像各２００张作为测试集，设计测试试验验证模型的实
Ａｇ
ｒｉ
ｃｕｌ
ｔｕｒ
ａｌＥｎｇｉｎｅ
ｅｒ，，（）：
ｎｇ２０１５３１３２１５－２２０．
ｉ
用性，测得模型对各类机具图像识别精确度平均值为
１２］张铁民，庄晓霖．基于ＤＭ６４２的高地隙小车的田间路径识
［
４７％，召回率平均值为９８．
９８．３７％，
Ｆ１－ｓ
ｃｏｒｅ平均值为别导航系统［
Ｊ］．农业工程学报，２０１５，３１（４）：１６０－１６７．
４１％，表明模型实用性较强；并分析了错误识别的
９８．Ｚｈ
ａｎｇＴ
ｉｎ，Ｚｈｕ
ｅｍｉａｎｇＸ
ｉａｏ
ｌｉｎ．
Ｉｄｅ
ｎｔｉ
ｆｉ
ｃａｔ
ｉｏｎａ
ｎｄｎ
ａｖｉ
ｇａｔ
ｉｏｎ
原因。ｓ
ｙｓｔ
ｅｍｏ
ｆｆａ
ｒｍｌ
ａｎｄｐａｔｈｆｏｒｈ
ｉｇｈ－ｃ
ｌｅａ
ｒａｎ
ｃｅｖｅ
ｈｉｃ
ｌｅｂ
ａｓｅｄｏｎ
综上所述，本文根据农机机具原始图像构建了基［］
ＤＭ６４２Ｊ．Ｔｒ
ａｎｓ
ａｃｔ
ｉｏｎ
ｓｏｆｔｈｅＣｈｉ
ｎｅｓ
ｅＳｏｃ
ｉｅｔ
ｙｏｆ
于卷积神经网络算法的农机机具图像标注数据集，设Ａｇｒ

ｉｃｕｌ
ｔｕｒ
ａｌＥｎｇ
ｉｎｅｅ
ｒｉｎｇ，２０１５，３１（
４）：１６０－１６７．
［］
１３Ｌｅ，
ｃｕｎＹＢｅｎｇｉ，
ｏＹＨｉｎｔ
ｏｎＧ．Ｄｅｅｐｌ
ｅａｒ
ｎｉｎｇ［
Ｊ］．
计卷积神经网络结构并训练模型实现了农机机具的自
Ｎａｔｕ
ｒｅ，２０１５，５２１：４３６－４４４．
动识别，能够较好地满足实际应用需求。［
１４］Ｓｃｈｍｉｄｈｕｂｅ
ｒＪ．Ｄｅｅｐｌ
ｅａｒｎ
ｉｎｇｉｎｎｅｕ
ｒａｌｎｅ
ｔｗｏ
ｒｋｓ：Ａｎ
ｏｖｅｒ
ｖｉ［］
ｅｗＪ．Ｎｅｕ
ｒａｌＮｅｔｗｏｒ，，：
ｋｓ２０１４６１８５－１１７．
参考文献
［
１５］Ｈａｙｋ
ｉｎＳ，ＫｏｓｋｏＢ．Ｇｒａｄ
ｉｅｎ
ｔｂａｓｅｄｌ
ｅａｒｎ
ｉｎｇａｐｐｌｉ
ｅｄｔｏ
１］何勇，聂鹏程，刘飞．农业物联网与传感仪器研究进展［
［Ｊ］．ｄｏ
ｃｕｍｅｎ
ｔｒｅｃｏｇｎｉｔ
ｉ［］
ｏｎＤ．Ｗｉｌｅｙ－ＩＥＥＥＰｒ
ｅｓ，，
ｓ２００９８６
农业机械学报，２０１３，４４（
１０）：２１６－２２６．（１１）：３０６－３５１．
２］李瑾，郭美荣，高亮亮．农业物联网技术应用及创新发展
［［
１６］Ｋｒｉ
ｚｈｅｖｋｙＡ，Ｓｕ
ｓｔｓ
ｋｅｖ
ｅｒＩ，Ｈｉｎｔ
ｏｎＧＥ．ＩｍａｅＮｅ
ｇｔ
策略［
Ｊ］．农业工程学报，２０１５，３１（Ｓ２）：２００－２０９．ｃ
ｌａｓｓ
ｉｆ
ｉｃａ
ｔｉｏｎｗ
ｉｔｈｄ
ｅｅｐｃｏｎｖ
ｏｌｕ
ｔｉｏｎ
ａｌｎｅｕ
ｒａｌｎ
ｅｔｗｏ
ｒｋ［］
ｓＣ．
３］刘阳春，苑严伟，张俊宁，等．深松作业远程管理系统设计
［Ｉｎ
ｔｅｒｎａ
ｔｉｏｎａ
ｌＣｏｎｆｅｒ
ｅｎｃｅｏｎＮｅｕｒ
ａｌＩｎ
ｆｏｒｍａｔ
ｉｏｎＰｒｏ
ｃｅｓ
ｓｉｎｇ
与试验［
Ｊ］．农业机械学报，２０１６，４７（
Ｓ１）：４３－４８．Ｓｙｓｔ
ｅｍｓ．Ｃｕｒｒ
ａｎＡｓｓｏ
ｃｉａ
ｔｅｓＩ
ｎｃ．：
２０１２１０９７－１１０５．
４］张晓东．基于Ａｎｄ
［ｒｏｄ的农机深松作业监控与服务系统设
ｉ［
１７］ＤａｎＣＣ，Ｍｅ
ｉｅｒＵ，Ｇａｍｂａ
ｒｄｅ
ｌｌａＬＭ，ｅ
ｔａ
ｌ．
计与实现［Ｄ］．泰安：山东农业大学，２０１６．Ｃｏｎｖｏ
ｌｕｔ
ｉｏｎａ
ｌｎｅｕｒ
ａｌｎｅｔｗｏｒ
ｋｃｏｍｍｉｔ
ｔｅｅｓｆｏｒｈａｎｄｗｒ
ｉｔｔ
ｅｎ
［
５］Ｙ
ｉｎＹａ
ｎｘｎ，Ｍｅ
ｉｎｇＺｈ
ｉｊｕｎ，Ｍｅｂｏ，ｅ
ｉＨｅｔａｌ．Ｓ
ｔｕｄｙｏｎｔ
ｉｌ
ｌｉ
ｎｇｃｈａ
ｒａｃ
ｔｅｒｃｌａ
ｓｓｉ
ｆｉｃ
ａｔｉ［］
ｏｎＣ．Ｉｎ
ｔｅｒ
ｎａｔ
ｉｏｎａｌＣｏｎ
ｆｅｒ
ｅｎｃ
ｅｏｎ
ｄｅｔ
ｐｈｄｅ
ｔｅｃ
ｔｉｏｎｍｅ
ｔｈｏｄｂ
ａｓｅｄｏｎａｔ
ｔｉ
ｔｕｄ
ｅｍｅａｓｕ
ｒｅｍｅｎ
ｔｆｏ
ｒＤｏ
ｃｕｍｅｎ
ｔＡｎａ
ｌｙｓ
ｉｓａｎｄＲｅ
ｃｏｇｎ
ｉｔｏｎ．ＩＥＥＥ，２０１１：
ｉ
ｓ
ｕｂｓｏｉ
ｌｅ［］
ｒＣ．Ｎａｔ
ｉｏｎ
ａｌＥｎｇｉ
ｎｅ
ｅｒｉ
ｎｇＲｅｓｅ
ａｒｃ
ｈＣｅｎｔ
ｅｒｆｏ
ｒ１１３５－１１３９．
Ｉ
ｎｆｏ
ｒｍａ
ｔｉｏｎＴ
ｅｃｈｎｏ
ｌｏｇｙｉ
ｎＡｇ
ｒｉｃ
ｕｌｔ
ｕｒｅ，２０１５．［
１８］ＳｚｅｇｅｄｙＣ，ＬｉｕＷ，ＪａＹ，ｅ
ｉｔａｌ．Ｇｏｉｎｇｄｅ
ｅｐｅｒｗｉｔｈ
６］邓继忠，李敏，袁之报，等．基于图像识别的小麦腥黑穗病害
［ｃｏｎｖｏｌｕ
ｔｉｏｎｓ［
Ｃ］．ＩＥＥＥＣｏｎ
ｆｅｒ
ｅｎｃ
ｅｏｎＣｏｍｐｕｔｅｒＶｉ
ｓｉｏｎ
特征提取与分类［Ｊ］．农业工程学报，２０１２，２８（３）：１７２－１７６．ａｎｄＰａ
ｔｔｅ
ｒｎＲｅ
ｃｏｇｎ
ｉｔｉ
ｏｎ．
ＩＥＥＥＣｏｍｐｕ
ｔｅｒＳｏ
ｃｉｅ
ｔｙ，２０１５：
７］温芝元，曹乐平．基于补偿模糊神经网络的脐橙不同病虫
［１－９．
第５期雷雪梅等：基于卷积神经网络的农机图像自动识别研究１４７
１９］Ｂ
［ｌｕｃｈｅＴ，ＮｅｙＨ，Ｋｅ
ｒｍｏ
ｒｖａｎ
ｔＣ．Ｆｅ
ａｔｕ
ｒｅｅｘ
ｔｒａ
ｃｔｉ
ｏｎｗｉ
ｔｈｔｈｅ２０１６ｃ
ｏｎｆｅ
ｒｅｎｃｅｏｎｍａｃｈ
ｉｎｅｔｒａｎｓ
ｌａｔ
ｉｏｎ［Ｃ］．
ｃ
ｏｎｖｏ
ｌｕｔ
ｉｏｎａ
ｌｎｅｕ
ｒａｌｎｅ
ｔｗｏ
ｒｋｓｆ
ｏｒｈａｎｄｗｒ
ｉｔｔ
ｅｎｗｏ
ｒｄＣｏｎｆ
ｅｒｅｎｃ
ｅｏｎＭａｃｈ
ｉｎｅＴｒａｎｓ
ｌａｔ
ｉｏｎ，２０１６：１３１－１９８．
ｒ
ｅｃｏｇｎｉｔ
ｉｏｎ［Ｃ］．Ｉｎ
ｔｅｒｎａｔ
ｉｏｎａｌＣｏｎ
ｆｅｒ
ｅｎｃ
ｅｏｎＤｏ
ｃｕｍｅｎ
ｔ２６］彭明霞，夏俊芳，彭辉．融合ＦＰＮ的Ｆａ
［ｓｔ
ｅｒＲ－ＣＮＮ复
Ａｎａｌｓ
ｙｉｓａｎｄＲｅｃｏｇｎｉ
ｔｉｏｎ．ＩＥＥＥ，２０１３：２８５－２８９．杂背景下棉田杂草高效识别方法［
Ｊ］．农业工程学报，
［
２０］ＨｅＨ，ＳｈａｏＺ，ＴａｎＪ．Ｒｅｃｏｇｎｉｔ
ｉｏｎｏｆｃａｒｍａｋｅｓａｎｄ２０１９，３５（２０）：２０２－２０９．
ｍｏｄｅ
ｌｓｆｒｏｍａｓ
ｉｎｇ
ｌｅｔ
ｒａｆ
ｆｉｃ－ｃ
ａｍｅｒ［］
ａｉｍａｇｅＪ．ＩＥＥＥＰｅｎｇＭｉ
ｎｇｘａ，Ｘ
ｉｉ
ａＪｕｎｆ
ａｎｇ，Ｐｅ
ｎｇＨｕ
ｉ．Ｅ
ｆｆｉ
ｃｉｅ
ｎｔｒ
ｅｃｏｇｎ
ｉｔｉ
ｏｎ
Ｔｒ
ａｎｓ
ａｃｔ
ｉｏｎｓｏｎＩ
ｎｔｅ
ｌｌ
ｉｇｅｎ
ｔＴｒ
ａｎｓｐｏ
ｒｔａ
ｔｉｏｎＳｙ
ｓｔｅｍｓ，ｏｆｃｏ
ｔｔｏｎａｎｄｗｅ
ｅｄｉｎｆｉ
ｅｌｄｂａ
ｓｅｄｏｎＦａｓ
ｔｅｒＲ－ＣＮＮｂｙ
２０１５，１６（
６）：３１８２－３１９２．ｉ
ｎｔｅｇｒ
ａｔｉｎｇＦＰＮ［Ｊ］．Ｔｒａｎｓ
ａｃｔｉｏｎｓｏｆｔｈｅＣｈｉｎｅ
ｓｅＳｏ
ｃｉｅ
ｔｙ
［］
２１ＬｉｕＺＬｕｏＰ，Ｑｉ
，ｕＳ，ｅｔａｌ．Ｄｅ
ｅｐＦａ
ｓｈｏｎ：Ｐｏｗｅ
ｉｒｉｎｇｏｆＡｇｒｉｃｕｌ
ｔｕｒａ
ｌＥｎｇｉ
ｎｅｅｒ
ｉ，，（）：
ｎｇ２０１９３５２０２０２－２０９．
ｒｏｂｕｓ
ｔｃｌ
ｏｔｈｅ
ｓｒｅ
ｃｏｇｎ
ｉｔｉ
ｏｎａｎｄｒ
ｅｔｒ
ｉｅｖａ
ｌｗｉｔｈｒｉｃｈ２７］卢伟，胡海阳，王家鹏，等．基于卷积神经网络面部图像
［
ａｎｎｏｔ
ａｔｏｎｓ［
ｉＣ］．ＩＥＥＥＣｏｎｆｅｒ
ｅｎｃ
ｅｏｎＣｏｍｐｕｔｅｒＶｉ
ｓｉｏｎａｎｄ识别的拖拉机驾驶员疲劳检测［Ｊ］．农业工程学报，２０１８，
Ｐａｔ
ｔｅｒ
ｎＲｅｃｏｇｎ
ｉｔｉｏｎ，２０１６：１０９６－１１０４．３４（
７）：１９２－１９９．
［
２２］ＮｏｄａＫ，ＹａｍａｇｕｃｈｉＹ，ＮａｋａｄａｉＫ，ｅｔａｌ．Ａｕｄｉ
ｏ－ｖ
ｉｓｕａｌｉ，ＨｕＨａ
ＬｕＷｅｙａｎｇ，ＷａｎｇＪ
ｉｉａｐｅｎｇ，ｅ
ｔａｌ．Ｔｒ
ａｃｔ
ｏｒｄ
ｒｉｖｅ
ｒ
ｓｐｅ
ｅｃｈｒ
ｅｃｏｇｎｉ
ｔｉｏｎｕｓｉｎｇｄｅ
ｅｐｌｅ
ａｒｎｉ［］
ｎｇＪ．Ａｐｐｌｉｅｄｆ
ａｔｉ
ｇｕｅｄｅｔｅ
ｃｔｉ
ｏｎｂａｓｅｄｏｎｃｏｎｖｏ
ｌｕ
ｔｉｏｎｎｅｕｒａ
ｌｎｅｔｗｏｒ
ｋａｎｄ
Ｉｎ
ｔｅｌ
ｌｉｇｅｎｃｅ，２０１５，４２（４）：７２２－７３７．ｆ
ａｃｉ
ａｌｉｍａｇｅｒｅｃｏｇｎ
ｉｔｉｏｎ［
Ｊ］．Ｔｒａｎｓａｃ
ｔｉｏｎｓｏｆｔ
ｈｅＣｈｉｎｅ
ｓｅ
［
２３］ＢａｈｄａｎａｕＤ，ＣｈｏｒｉＪ，Ｓｅ
ｏｗｓｋｒｄｙｕｋＤ，ｅ
ｔａｌ．Ｅｎｄ－ｔ
ｏ－ｅｎｄＳｏ
ｃｉｅ
ｔｙｏ
ｆＡｇ
ｒｉｃｕ
ｌｔｕ
ｒａｌＥｎｇ
ｉｎｅ
ｅｒｎｇ，２０１８，３４（
ｉ７）：１９２
ａｔ
ｔｅｎｔ
ｉｏｎ－ｂａｓｅｄｌａ
ｒｇｅｖｏｃａｂｕ
ｌａｒ
ｙｓｐｅｅｃｈｒ
ｅｃｏｇｎ
ｉｔｏｎ［
ｉＣ］．－１９９．
ＩＥＥＥＩｎｔ
ｅｒｎａ
ｔｉｏｎａ
ｌＣｏｎｆｅｒ
ｅｎｃｅｏｎＡｃｏｕｓ
ｔｉｓ，Ｓｐｅ
ｃｅｃｈａｎｄ２８］孔庆好，吐尔逊·买买提，赵梦佳．基于卷积神经网络的
［
Ｓｉｇｎａ
ｌＰｒｏ
ｃｅｓ
ｓｉｎｇ，２０１６：４９４５－４９４９．拖拉机工况识别［
Ｊ］．中国农机化学报，２０２１，４２（
１１）：
［
２４］ＨｕＢ，ＬｕＺ，ＬｉＨ，ｅｔａｌ．Ｃｏｎｖｏｌ
ｕｔｉ
ｏｎａｌｎｅｕｒａ
ｌｎｅｔｗｏ
ｒｋ１４４－１５０．
ａ
ｒｃｈ
ｉｔｅ
ｃｔｕ
ｒｅｓｆ
ｏｒｍａｔ
ｃｈｎｇｎａ
ｉｔｕｒａｌｌ
ａｎｇｕａｇｅｓｅｎ
ｔｅｎｃ
ｅｓ［Ｊ］．ＫｏｎｇＱｉ
ｎｇｈ
ａｏ，Ｔ
ｕｒｘｕｎＭａ
ｉｍａ
ｉｉ，Ｚｈ
ｔａｏＭｅ
ｎｇｉ
ｊａ．Ｒｅ
ｃｏｇｎ
ｉｔｉ
ｏｎ
Ａｄｖａｎｃ
ｅｓｉｎＮｅｕｒａ
ｌＩｎｆｏｒｍａｔ
ｉｏｎＰｒｏｃ
ｅｓｓ
ｉｎｇＳｙｓ
ｔｅｍｓ，ｏ
ｆｔｒ
ａｃｔ
ｏｒｗｏ
ｒｋｎｇｃ
ｉｏｎｄ
ｉｔｉ
ｏｎｂａｓ
ｅｄｏｎｃ
ｏｎｖｏｌ
ｕｔｉ
ｏｎａｌｎｅｕｒａ
ｌ
２０１５，３：２０４２－２０５０．ｎｅ
ｔｗｏｒｋ［Ｊ］．
Ｊｏｕｒｎ
ａｌｏｆＣｈｉｎ
ｅｓｅＡｇｒ
ｉｃｕｌ
ｔｕｒａ
ｌＭｅｃｈａ
ｎｉｚ
ａｔｏｎ，
ｉ
［
２５］ＢｏｊｒＯ，Ｃｈａ
ａｔｔ
ｅｒｅ
ｊｅＲ，ＦｅｄｅｒｍａｎｎＣ，ｅｔａｌ．Ｆ
ｉｎｄ
ｉｎｇｓｏｆ２０２１，４２（
１１）：１４４－１５０．
Ｒｅ
ｓｅａ
ｒｃｈｏｎａｕ
ｔｏｍａ
ｔｉｃｒｅｃ
ｏｇｎｉ
ｔｉｏｎｏｆａｒ
ｇｉｃ
ｕｌｔ
ｕｒａ
ｌｍａｃｈ
ｉｎｅｉｍａ
ｇｅｂａ
ｓｅｄｏｎ
ｃ
ｏｎｖｏｌ
ｕｔｉ
ｏｎａｌｎｅ
ｕｒａｌｎｅｔｗｏｒｋ
Ｌｅ
ｉＸｕｅｍｅ
ｉ１
，ＺｈａｎｇＧｕａｎｇｑ
ｉａｎｇ２，ＹａｏＱｉ３，Ｌ
ｉｕＷｅ
ｉｗｅ
ｉ４
，Ｑｉｉ５
ｕＳｈｕａ
（
１.Ｃｏ
ｌｌｅｇｅｏｆＩｎｔ
ｅｌｌ
ｉｇｅｎｔＭａｎｕｆａｃ
ｔｕｒｉｎｇ，ＳｉｃｈｕａｎＰｏ
ｌｙｔｅｃｈｎｉｃｏｆＣｈｅｍｉｃａ
ｌＩｎｄｕ
ｓｔｒｙ，Ｌｕｚｈｏｕ，６４６０００，Ｃｈｎａ；
ｉ
２.Ｂｅｉｉ
ｊｎｇＩｎｔ
ｅｌｌ
ｉｇｅｎｔＡｇｒ
ｉｃｕｌｔｕｒａｌＥｑｕ
ｉｐｍｅｎｔＴｅｃｈｎｏｌｏｇｙＲｅ
ｓｅａｒｃｈＣｅｎｔ
ｅｒ，Ｂｅｉ
ｊｉｎｇ，１０００８９，Ｃｈｉｎａ；
３.ＣｏｌｅｇｅｏｆＡｇｒ
ｌｏｎｏｍｙ，Ｎｏｒｔ
ｈｗｅｔＡ＆ＦＵｎ
ｓｉｖｅｒ
ｓｉｙ，Ｘｉ
ｔａｎｙａｎｇ，７１２１００，Ｃｈｎａ；
ｉ
Ｃｏ
４. ｌ
ｌｅｇｅｏｆＥｎｇｉ
ｎｅｅｒ
ｉｎｇａｎｄＴｅｃｈｎｏ
ｌｏｇｙ，Ｓｏｕｔｈｗｅｓ
ｔＪｉａｏｔｏｎｇＵｎｉ
ｖｅｒｓ
ｉｔｙ，Ｃｈｅｎｇｄｕ，６１００３１，Ｃｈｎａ；
ｉ
５.Ｓｃｈｏｏ
ｌｏｆＡｒｔｉ
ｆｉｃ
ｉａｌＩｎ
ｔｅｌ
ｌｉｇｅｎ
ｃｅ，Ｓｏｕ
ｔｈｗｅｓ
ｔＵｎｉ
ｖｅｒｓｉ
ｔｙ，Ｃｈｏｎｉｎ
ｇｑｇ，４００７１５，Ｃｈｉｎａ）
Ａｂｓ
ｔｒａ
ｃｔ：Ｔｈｅｏｐｅｒａ
ｔｉｏｎｓｕｐｅｒｖ
ｉｓｉ
ｏｎｓｙｓｔｅｍｂａ
ｓｅｄｏｎａｇｒ
ｉｃｕｌ
ｔｕｒ
ａｌｍａ
ｃｈｉｎｅ
ｒｙｎｅｔｗｏｒｋ
ｉｎｇｔｅ
ｃｈｎｏｌｏｇｙｃａｎｉｄｅｎ
ｔｉｙｔ
ｆｈｅｍａｃｈｉｎｅｔｙｐｅａｎｄ
ｔ
ｈｅｏｐｅｒａ
ｔｉｏｎｓ
ｔａｔ
ｅｂｙｃｏｌ
ｌｅｃｔ
ｉｎｇｔｈｅｉｍａｇｅｏｆｔｈｅｍａｃｈ
ｉｎｅｔｏｏ
ｌ．Ｈｏｗｅ
ｖｅｒ，ｗｉｔ
ｈｉｎｃｒ
ｅａｓｅｉｎｔｈｅａｍｏｕｎｔｏｆｉｍａｇｅｄａｔａ，ｍａｎｕａｌｓ
ａｍｐｌ
ｉｎｇ
ｉ
ｓｆａ
ｃｅｄｗｉ
ｔｈｃｈａｌ
ｌｅｎｇｅｓｓｕｃｈａｓｈａｖｉｎｇａｈｅａｖｙｗｏｒｋ
ｌｏａｄａｎｄｌｉｔ
ｔｌｅｓｕｐｅｒｖ
ｉｓｏｎ，ｗｈ
ｉｉ
ｃｈｄｏｅｓｎｏｔｍｅｅｔｔ
ｈｅｓｕｐｅｒ
ｖｉｓ
ｉｏｎｒｅｑｕ
ｉｒｅｍｅｎ
ｔｓ．Ｉｎ
ｔｈ
ｉｓｐａｐｅ，
ｒｉｍａｇｅｄａｔａｓｅｔｓｉ
ｎｃｌ
ｕｄｉｎｇｓｅｅｄｅ
ｒｔ，ｉｌ
ｔｉｎｇｐｌ，
ｏｕｇｈｅｒ
ａｓｉｎｇｍａ
ｃｈｉ，
ｎｅｄｅ
ｅｐｌｏｏ
ｓｅｒａｎｄｒｏ
ｔａｒ
ｙｃｕｌｔ
ｉｖａ
ｔｏｒｗｅｒｅｃ
ｏｎｓｔｒｕｃ
ｔ，
ｅｄａｎｄ
ｔｈｅｍａｃｈ
ｉｎｅｉｍａｇｅｄａｔａｓ
ｅｔｓｗｅｒ
ｅａｎｎｏｔ
ａｔｅｄａｎｄｐｒｅｐ
ｒｏｃｅｓｓｅｄｕｎｄｅｒＧｏｏｇ
ｌｅ’ｓｄｅｅｐｌｅａ
ｒｎｉｎｇｐｌ
ａｔｆ
ｏｒｍＴｅｎｓｏｒ
ｆｌｏｗ．Ａｃｏｎｖｏｌ
ｕｔｉｏｎａｌ
ｎｅｕｒａｌｎｅ
ｔｗｏｒｋｍｏｄｅ
ｌｗａｓｄｅｓｉｇｎｅｄｔｏｍｅｅｔｔｈｅａｃ
ｔｕａｌｒｅｇｕｌ
ａｔ
ｏｒｒｅ
ｙｑｕ
ｉｒｅｍｅｎｔ
ｓａｎｄｉｍａｇｅｃｈａ
ｒａｃ
ｔｅｒ
ｉｓｔ
ｉｃｓ，ａｆ
ｔｅｒｗｈ
ｉｃｈｔｈｅｍｏｄｅ
ｌｗａｓ
ｏｐ
ｔｉｍｉ
ｚｅｄｂｙｒ
ｅｄｕｃ
ｉｎｇｏｖｅ
ｒ－ｆ
ｉｔｔ
ｉｎｇａｎｄｉｍｐ
ｒｏｖ
ｉｎｇｔ
ｒａｉ
ｎｉｎｇｅ
ｆｆｉ
ｃｉｅｎｃｙ．Ｔｈｅｍｏｄｅ
ｌｔｒ
ａｉｎ
ｉｎｇｅｘｐｅ
ｒｉｍｅｎ
ｔｒｅ
ｓｕｌ
ｔｓｓｈｏｗｅｄｔ
ｈａｔｔ
ｈｅ
ｒｅｃｏｇｎｉ
ｔｉｏｎｒａｔ
ｅｏｆｔｈｅｍａｃｈ
ｉｎｅｒｅｃ
ｏｇｎｉｔ
ｉｏｎｎｅ
ｔｗｏｒｋｄｅ
ｓｉｇｎｅｄｉ
ｎｔｈ
ｉｓｐａｐｅ
ｒｒｅａｃｈｅｄ９８．
５％ｏｎｔｈｅｖｅ
ｒｉｆ
ｉｃａ
ｔｉｏｎｓｅ
ｔ．Ｕｎｄｅｒｓｉｍｉ
ｌａｒ
ｅｘｐｅｒｉｍｅｎｔａ
ｌｃｏｎｄ
ｉｔｉ，
ｏｎｓｔｈｅｒｅｃ
ｏｇｎｉｔ
ｉｏｎｒ
ａｔｅｏｆＬｅＮｅｔ－５ｍｏｄｅｌａｎｄＲｅｓＮｅ
ｔ－５０ｍｏｄｅｌｗａ
ｓ８１％ａｎｄ９８．，
８％ｒｅｓｐｅ
ｃｔｉｖｅ
ｌｙ．
Ｈｏｗｅ
ｖｅｒ，ｉ
ｎｔｅ
ｒｍｓｏ
ｆｒｅ
ｃｏｇｎ
ｉｔｉ
ｏｎｅ
ｆｆｉ
ｃｉｅｎｃｙ，Ｒｅ
ｓＮｅ
ｔ－５０ｍｏｄｅ
ｌｎｅ
ｅｄｅｄｎｅ
ａｒｌ
ｙ６０ｈｏｕ
ｒｓｔ
ｏｃｏｍｐ
ｌｅｔ
ｅｔｈｅｔ
ｒａｉ
ｎｉｎｇａｎｄ０．
３ｓｔ
ｏｒｅ
ｃｏｇｎ
ｉｚｅ
ａｐｉｃ
ｔｕｒｅ，ｗｈ
ｉｌｅｔｈｅｍａ
ｃｈｉ
ｎｅｒｅ
ｃｏｇｎｉ
ｔｉｏｎｎｅｔｗｏｒｋｄｅｓｉ
ｇｎｅｄｉｎｔｈ
ｉｓｐａｐｅｒｎｅｅｄｅｄ３０ｈｏｕｒｓｔｏｃ
ｏｍｐｌｅ
ｔｅｔｈｅｔｒａ
ｉｎｎｇ，ａｎｄ０．
ｉ１ｓｔｏ
ｒ
ｅｃｏｇｎｉ
ｚｅａｐｉ
ｃｔｕｒ
ｅ．Ｉｎｏｒｄｅ
ｒｔｏｆｕｒ
ｔｈｅ
ｒｖｅｒｉｆ
ｙｔｈｅｐｒａ
ｃｔｉｃ
ａｂｉ
ｌｉ
ｔｙｏ
ｆｔｈｅｍｏｄｅ，
ｌ２００ｉｍａｇｅｓｗｅ
ｒｅｓｅ
ｌｅｃ
ｔｅｄｆｏ
ｒｔｅ
ｓｔｉ，
ｎｇａｎｄｔｈｅａｖｅ
ｒａｇｅ
ａ
ｃｃｕ
ｒａｃｙｏ
ｆｔｈｅｍｏｄｅ
ｌｆｏ
ｒａｌ
ｌｋｉ
ｎｄｓｏ
ｆｍａ
ｃｈｉ
ｎｅａｎｄｔ
ｏｏｌｉｍａｇｅ
ｓｗａ４７％，ｔ
ｓ９８．ｈｅａｖｅ
ｒａｇｅｒ
ｅｃａ
ｌｌｒ
ａｔｅｗａ３７％，ａｎｄｔ
ｓ９８．ｈｅａｖｅ
ｒａｇｅＦ１－
ｃ
ｓｏｒｅｗａｓ９８．４１％，ｉ
ｎｄｉ
ｃａｔ
ｉｎｇｔｈａｔｔｈｅｍｏｄｅ
ｌｈａｄｇｏｏｄｒｏｂｕｓｔ
ｎｅｓｓａｎｄｐｒａ
ｃｔｉ
ｃａｂ
ｉｌｉ
ｔｙ．
Ｋｅｙｗｏ
ｒｄ：
ｓａｇ
ｒｉ
ｃｕｌ
ｔｕｒ
ａｌｍａｃｈｉ
ｎｅｒｙａｎｄｔｏｏｌ；
ｓｃｏｎｖｏ
ｌｕｔ
ｉｏｎａｌｎｅｕｒａ
ｌｎｅｔｗｏ
ｒ；
ｋｉｍａｇｅｒｅ
ｃｏｇｎ
ｉｔｏｎ；ｄｅ
ｉｅｐｌ
ｅａｒ
ｎｉｎｇ

雷雪梅等。 - 2022 - 基于卷积神经网络的农机图像自动识别研究

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

雷雪梅等。 - 2022 - 基于卷积神经网络的农机图像自动识别研究

Uploaded by

Copyright:

Available Formats

第４３卷第５期中国农机化学报Ｖｏ

播种机２００００８０００６４×６４

机具图像数据集进行标注。首先，将整理好的训练集３运动模糊消除

Ｃ１层采用了３２个５×５×３的卷积核，步长为１，Ｆ５全连接层１神经元个数：

过拟合。据归一化到０～１之间，可以简化计算，加快网络收敛

害图像识别［Ｊ］．农业工程学报，２０１２，２８（１１）：１５２－１５７．

４）在训练集和验证集外，随机挑选５种类型的图ａｎｄｅｘｐｅ

于卷积神经网络算法的农机机具图像标注数据集，设Ａｇｒ

You might also like

雷雪梅 等。 - 2022 - 基于卷积神经网络的农机图像自动识别研究

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

雷雪梅 等。 - 2022 - 基于卷积神经网络的农机图像自动识别研究

Uploaded by

Copyright:

Available Formats

第 ４３ 卷 第 ５ 期 中国农机化学报 Ｖｏ

播种机 ２００００ ８０００ ６４×６４

机具图像数据 集 进 行 标 注。 首 先，将 整 理 好 的 训 练 集 ３ 运动模糊消除

Ｃ１ 层采用了 ３２ 个 ５×５×３ 的 卷 积 核，步 长 为 １， Ｆ５ 全连接层 １ 神经元个数：

过拟合。 据归一 化 到 ０～１ 之 间，可 以 简 化 计 算，加 快 网 络 收 敛

害图像识别［ Ｊ］．农业工程学报，２０１２，２８（ １１）：１５２－１５７．

４）在训练集和验证集外，随 机 挑 选 ５ 种 类 型 的 图 ａｎｄ ｅｘｐｅ

于卷积神经网络 算 法 的 农 机 机 具 图 像 标 注 数 据 集，设 Ａｇｒ

You might also like

雷雪梅等。 - 2022 - 基于卷积神经网络的农机图像自动识别研究

雷雪梅等。 - 2022 - 基于卷积神经网络的农机图像自动识别研究

第４３卷第５期中国农机化学报Ｖｏ

播种机２００００８０００６４×６４

机具图像数据集进行标注。首先，将整理好的训练集３运动模糊消除

Ｃ１层采用了３２个５×５×３的卷积核，步长为１，Ｆ５全连接层１神经元个数：

过拟合。据归一化到０～１之间，可以简化计算，加快网络收敛

害图像识别［Ｊ］．农业工程学报，２０１２，２８（１１）：１５２－１５７．

４）在训练集和验证集外，随机挑选５种类型的图ａｎｄｅｘｐｅ

于卷积神经网络算法的农机机具图像标注数据集，设Ａｇｒ