Professional Documents
Culture Documents
基于深度学习的服装图像分类研究
基于深度学习的服装图像分类研究
(专业学位)
基于深度学习的服装图像分类研究
Research on Clothing Image Classification
作 者: 邓文雄
类别(领域): 工程硕士(计算机技术)
指 导 教 师: 周志宇 副教授
所 在 学 院: 信息学院
完成日期:二○二二年四月
万方数据
万方数据
万方数据
摘 要
摘 要
随着服装电商行业的发展,网络上的服装图像越来越多,如何对海 量服装
图像进行准确有效的分类与服装电商从业者的利益息息相关。使用人工 视觉来
标注服装图像成本过高,而现有的服装图像分类算法的性能也达不到要 求,因
此对服装图像分类进行研究具有重要意义。本文基于深度学习对服装图 像分类
进行研究,通过结合卷积神 经网 络(CNN)与优化 后的随 机向 量 函 数 链 接
(RVFL)神经网络来提高服装图像分类的性能,主要进行了以下两方面的研究:
(1)针对服装图像分类算法分类精度较低的问题,本文提出了一种基于并
行卷积神经网络(PCNN)和蝗虫优化算法(GOA)优化的 RVFL 神经网络相结合
的服装图像分类算法(PCNN-GOARVFL)。该算法使用并行的双通道卷积神经
网络模型来提取服装图像特征,解决了传统的卷积神经网络提取数据特 征有限
而且容易出现过拟合的问题。并行卷积神经网络模型使用 LeakyReLU 作为激活
函数,并且在每次卷积操作后进行批量标准化处理,以此来提高模型的 性能。
然后本文使用 GOA 算法优化 RVFL 的相关参数来提高 RVFL 的分类性能和稳定
性,并使用优化后的 RVFL 分类器对 PCNN 提取到的服装图像特征进行分类。
通 过 在 Fashion Mnist 数 据 集 上 进 行 大 量 实 验 可 知 , 本 文 提 出 的 PCNN-
GOARVFL 算 法 的 分 类 精 度 比 LBP-SVM,HOG-SVM,LBP-HOG-SVM 和
ALEXNET-SRC 算法分别高出 1.36%,2.05%,0.65%和 3.76%,有效的提高了服
装图像分类算法的性能。
(2)为了进一步提升服装图像分类算法的分类精度和泛化能力,本文提出
了一种基于迁移学习的 Densenet201 特征提取主干(DFEB)网络与海洋捕食者
算法(MPA)改进的天鹰优化器(AO)优化的正则化 RVFL 神经网络相结合的
服装图像分类算法(DFEB-MARRVFL)。首先,该算法使用基于迁移学习的
Densenet201 特征提取主干网络来提取服装图像的特征,减少了计算资源开销,
提高了特征利用效率。然后在 RVFL 中引入正则化系数来控制模型复杂度并解
决过拟合问题。并使用 MPA 算法生成 AO 算法的初始搜索种群,以此来提高 AO
算法的寻优和收敛效果。随后提出了一种基于 AO 算法种群个体位置的映射方
法,同时对 RRVFL 的正则化系数、输入权重和隐含层偏置进行优化,不仅自动
为 RRVFL 选取了合适的正则化系数,还提高了 RRVFL 的分类性能和稳定性。
最后本文使用优化后的 RRVFL 来对提取到的服装图像特征进行分类。从实验结
果可知,在 ACWS 数据集上,本文提出的 DFEB-MARRVFL 算法比其他服装图
像分类算法的性能更好,并在 DeepFashion 数据集和 Fashion Mnist 数据集上验
I
万方数据
摘 要
证了该算法优秀的泛化能力。
关键词:卷积神经网络;随机向量函数链接神经网络;蝗虫优化算法;天鹰优
化器;服装图像分类
II
万方数据
Abstract
Abstract
With the development of the clothing e-commerce industry, there are more and
more clothing images on the Internet. How to accurately and effectively classify the
massive clothing images is closely related to the interests of clothing e-commerce
practitioners. The cost of using artificial vision to label clothing image is too high, and
the effect of the existing clothing image classification algorithm cannot meet the
requirements, so it is of great significance to study the clothing image classification.
This paper builds clothing image classification algorithm models based on deep
learning, and improves the performance of clothing image classification by combining
convolutional neural network with optimized random vector functional link (RVFL)
neural network. The following two aspects are mainly studied:
(1)Aiming at the problem of low classification accuracy of clothing image
classification algorithm, this paper proposes a clothing image classification algorithm
(PCNN-GOARVFL) based on the combination of parallel convolutional neural network
(PCNN) and RVFL neural network optimized by grasshopper optimization algorithm
(GOA). This algorithm uses parallel two-channel convolutional neural network model
to extract clothing image features, which solves the problem that traditional
convolutional neural network extraction data features are limited and prone to over-
fitting. The parallel convolutional neural network model uses LeakyReLU as the
activation function, and a batch normalization process is carried out after each
convolution operation to improve the performance of the model. Then, this paper uses
GOA to optimize the relevant parameters of RVFL to improve the classification
performance and stability of RVFL, and the optimized RVFL classifier is used to
classify the clothing image features extracted by PCNN. Through a large number of
experiments on the Fashion Mnist dataset, it can be seen that the classification accuracy
of the PCNN-GOARVFL algorithm proposed in this paper is 1.36%, 2.05%, 0.65% and
3.76% higher than the LBP-SVM, HOG-SVM, LBP-HOG-SVM and ALEXNET-SRC
algorithms respectively, which effectively improves the performance of the clothing
image classification algorithm.
(2)To further improve the classification accuracy and generalization ability of
clothing image classification algorithm, this paper proposes a clothing image
classification algorithm (DFEB-MARRVFL), which combines Densenet201 feature
III
万方数据
Abstract
extraction backbone (DFEB) network based on transfer learning with the regularized
RVFL (RRVFL) optimized by the Aquila Optimizer (AO) modified by the Marine
Predators Algorithm (MPA) . Firstly, the algorithm uses Densenet201 feature extraction
backbone network based on transfer learning to extract clothing image features, which
reduces the cost of computing resources and improves the efficiency of feature
utilization. Then the regularization coefficient is introduced in RVFL to control the
model complexity and solve the over-fitting problem. Then the initial search population
of AO algorithm is generated by MPA algorithm to improve the optimization and
convergence effect of AO algorithm. Then, a mapping method based on AO algorithm
population individual position is proposed, and the regularization coefficient, input
weight and hidden layer bias of RRVFL are optimized at the same time, which not only
automatically selects the appropriate regularization coefficient for RRVFL, but also
improved the classification performance and stability of RRVFL. Finally, this paper
uses the optimized RRVFL to classify the extracted clothing image features. The
experimental results show that on the ACWS dataset, the proposed DFEB-MARRVFL
algorithm has better classification performance than other comparison algorithms. And
the excellent generalization ability of the algorithm is verified on the DeepFashion
dataset and Fashion Mnist dataset.
IV
万方数据
目 录
目 录
摘 要...............................................................................................................................I
Abstract ........................................................................................................................ III
第 1 章 绪论 .................................................................................................................. 1
1.1 研究背景和意义............................................................................................... 1
1.2 国内外研究现状............................................................................................... 1
1.3 论文的主要研究内容和结构........................................................................... 4
1.3.1 论文的研究内容..................................................................................... 4
1.3.2 论文的结构安排..................................................................................... 5
第 2 章 服装图像分类算法的基本理论 ...................................................................... 6
2.1 卷积神经网络的结构....................................................................................... 6
2.2 随机向量函数链接神经网络................................................................... 7
2.3 算法评价指标................................................................................................... 8
2.4 实验数据集....................................................................................................... 9
2.4.1 Fashion Mnist 数据集 ............................................................................. 9
2.4.2 ACWS 数据集 ...................................................................................... 10
2.4.3 DeepFashion 数据集............................................................................. 11
2.5 本章小结......................................................................................................... 11
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法 ................ 12
3.1 引言................................................................................................................. 12
3.2 蝗虫优化算法................................................................................................. 12
3.3 并行卷积神经网络模型................................................................................. 13
3.4 GOA 算法优化的 RVFL 分类器 ................................................................... 14
3.5 PCNN-GOARVFL 服装图像分类算法 ......................................................... 15
3.6 实验结果与分析............................................................................................. 16
3.6.1 实验参数设置....................................................................................... 16
3.6.1.1 RVFL 激活函数的选择 .............................................................. 16
3.6.1.2 RVFL 隐藏层节点数目对算法的影响 ...................................... 17
3.6.1.3 GOA 算法的参数研究 ............................................................... 18
3.6.1.4 算法的最终参数设置................................................................. 19
3.6.2 实验结果讨论....................................................................................... 20
3.6.2.1 实验结果对比............................................................................. 20
3.6.2.2 算法稳定性分析......................................................................... 22
3.6.2.3 算法有效性分析......................................................................... 23
3.7 本章小结......................................................................................................... 24
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法 ..... 25
4.1 引言................................................................................................................. 25
4.2 Densenet 结构与迁移学习 ............................................................................. 26
4.3 海洋捕食者算法............................................................................................. 26
4.4 天鹰优化器..................................................................................................... 27
4.5 正则化的随机向量函数链接神经网络......................................................... 28
V
万方数据
目 录
VI
万方数据
第 1 章 绪论
第 1 章 绪论
1.1 研究背景和意义
服装是人们日常生活中不可或缺的商品,作为世界上人口最多的国 家,我
国服装行业也具有很大的发展潜力。近年来,随着国内经济的快速发展 和互联
网时代的到来,服装行业在电商领域占据着非常重要的地位。2021 年 6 月 17 日,
浙江省电子商务促进会数字贸易研究院发布了《中国服装电商行业研究报告》,
该报告指出,虽然受新冠肺炎疫情的影响 2020 年的国内服装市场总体规模有所
下降,但是在后疫情时代,服装线上消费规模大幅攀升。根据国家统计 局的数
据,2021 年一季度服装商品的网上零售额同比增长了 39.6%。而且随着直播带
货的兴起,淘宝直播服装行业商品数量大幅增加。
现今,由于物流货运和电商平台已趋于成熟,网上购物已成为大多 数人的
习惯,越来越多的人喜欢在网络上购买服装,这样也带来了很大的经济 效益,
因此从事于服装电商行业的人也就越来越多[1]。对于这些服装电商从业者 来说,
他们需要将服装拍照成像,然后对服装图像进行分类并将其存储到电商平 台上,
这样消费者就能根据想要购买的服装类别搜索到对应的服装列表[2]。然而,传
统的服装图像分类主要是靠人工来完成,这不仅需要很高的成本,而且 人工检
测容易受到许多主客观因素的影响,其分类效果达不到要求。
现有的服装图像分类方法可以有效的处理背景简单,无形变的服装 图像,
但是现实生活中的服装多种多样,有些服装类别之间的差异很小,而且 服装图
像还可能存在着形变、褶皱等干扰分类的元素,所以现有的服装图像分 类算法
在处理这样的服装图像时,并不能满足服装电商行业的需求。研究出一 种实用
性强的服装图像分类算法不仅可以帮助相关从业者对服装图像进行快速 有效的
分类,还可以降低成本,并为其他应用场景下的图像分类研究提供参考 ,从而
促进相关领域的发展。
通过对上述内容的分析,本文基于深度学习来对服装图像分类算法 进行研
究,旨在通过使用卷积神经网络和优化随机向量函数链接神经网络的结 构与参
数,来得到更好的服装图像分类模型。
1.2 国内外研究现状
为了解决服装电商从业者对于服装图像自动准确分类的需求,国内 外的学
者已经对服装图像分类算法进行了相关研究,并取得了一定的成果。与 其他图
1
万方数据
第 1 章 绪论
像分类问题一样,根据提取服装图像特征方法的不同,服装图像分类算 法可以
分为基于传统特征提取的服装图像分类算法和基于深度学习特征提取的 服装图
像分类算法[3]。传统的特征提取方法主要有方向梯度直方图[4](Histogram Of
Oriented Gradients,HOG),Gobor 滤波器[5],灰度共生矩阵[6](Gray-Level Co-
occurrence Matrix,GLCM)和局部二值模式[7](Local Binary Pattern,LBP)等方
法,基于传统特征提取的服装图像分类算法首先使用这些特征提取方法 来提取
服装图像的颜色、边缘等低级特征,然后再使用分类器对提取到的特征 分类。
如 Yam 等[8]使用 Gabor 滤波器提取服装图像的特征,从而实现单个服装图像的
分类。Tenwsuan 等[9]结合 LBP 和 Gabor 滤波器来对服装图像进行预处理,通过
这种预处理技术使得提取的特征更加丰富,从而提高了服装图像的分类 精度。
Pawenin 等[10]提出了一种使用 GLCM,LBP 和不变矩来提取织物图像特征的方
法,并使用线性核支持向量机(Support Vector Machine,SVM)来对主成分分
析法降维后的特征进行分类。由于传统的特征提取方法只能提取服装图 像的低
级特征,而且容易受到服装图像的成像角度、背景和形变等因素的影响 ,所以
其提取到的服装图像特征并不理想。
近年来,随着深度学习[11]的蓬勃发展,其在图像处理[12],语音识别[13],对
象识别[14]和对象检测[15]等多个领域得到了应用,也取得了很好的效果,这也为
服 装 图 像 分 类 算 法 的 研 究 提 供 了 一 个 新 的 思 路 。 卷 积 神 经 网 络[16-18]
(Convolutional neural network,CNN)是当前较为热门的深度学习算法之一,
使用卷积神经网络提取特征能够更好地学习图像的特征和表征能力,从 而解决
了传统特征提取方法提取特征不丰富的问题,因此更多学者基于卷积神 经网络
来对服装图像分类算法进行研究。Yu 等[19]针对传统的神经网络无法获取服装图
像的空间结构特征的问题,提出了一种具有图像特征和空间结构特征的 增强胶
囊网络,该网络模型首先通过增强胶囊网络获取服装图像的空间结构特 征,再
通过更深层的网络结构和注意力机制使得提取到的服装特征更具有鲁棒 性,最
后通过参数优化减少了网络的计算量,其提出的增强胶囊网络在计算效 率和分
类精度上都具有较大优势。Lin 等[20]结合深度置信网络与 SOFTMAX 分类器来
对服装图像进行分类,该方法使用输入图像的所有图像像素对深度置信 网络进
行逐层训练,其顶层是用于分类的超平面。Tan 等[21]对 Xception 网络模型进行
了改进并将其应用于服装图像分类算法,他们同时采用 ELU 和 ReLU 函数作为
Xception 网络的激活函数,改善了网络的非线性与学习特性,并且引入了 L2 正
则化方法来增强网络的抗干扰能力,从而提升了网络对服装图像的分类 能力。
Chen 等[22]设计了五种不同的 CNN 来应用于服装图像分类,并通过实验结果证
明了基于迁移学习的 CNN 在五种 CNN 中的分类效果更好。Liu 等[23]将 VGG 网
万方数据
第 1 章 绪论
万方数据
第 1 章 绪论
1.3 论文的主要研究内容和结构
1.3.1 论文的研究内容
通过前面对服装图像分类算法研究现状的介绍和分析,本论文将卷 积神经
网络与优化后的 RVFL 相结合应用于服装图像分类,从而得到了具有良好性能
的服装图像分类模型。本文的主要工作包括以下两个方面:
(1) 本 文 提 出 了 一 种 并 行 卷 积 神 经 网 络(Parallel convolutional neural
network,PCNN)和蝗虫优化算法[46](Grasshopper optimization algorithm,GOA)
[46]优化的 RVFL 相结合的服装图像分类方法(PCNN-GOARVFL)。针对传统的
卷积神经网络提取的数据特征有限而且容易出现过拟合的问题,本文提 出了一
种并行卷积神经网络模型来提取服装图像特征,通过利用 CNN 的结构密集性和
改进的双通道很好的解决了这一问题,该模型使用 LeakyReLU 作为激活函数,
并在卷积操作之后进行批量标准化(Batch Normalization, BN)处理,有效地提
高了特征提取的能力。然后使用 GOA 算法优化 RVFL 的输入权重和隐含层偏置
来解决 RVFL 由于参数的随机性而导致的分类效果不稳定的问题,提高了 RVFL
的分类精度和稳定性。最后使用优化后的 RVFL 来对提取到的服装图像特征进
行分类。实验结果表明,本文提出的 PCNN-GOARVFL 算法不仅发挥了并行卷
积神经网络自动提取图像特征的功能,还使用优化后的 RVFL 分类器提高了对
服装图像特征的分类准确率,在服装图像分类上具有较大的优势。
(2)为了进一步的提升服装图像分类算法的分类性能与泛化能力,本文提
出一种基于迁移学习的 Densenet201 特征提取主干网络(Densenet201 Feature
Extraction Backbone, DFEB)与海洋捕食者算法[47](Marine Predators Algorithm,
MPA) 改 进 的 天 鹰 优 化 器[48](Aquila Optimizer, AO) 优 化 的 正 则 化 RVFL
(Regularized RVFL,RRVFL) 相 结 合 的 服 装 图 像 分 类 算 法 (DFEB-
MARRVFL)。 该 算 法 首 先 使 用 迁 移 学 习 将 ImageNet 数 据 集 预 训 练 后 的
Densenet201 网络的权重参数迁移到初始网络模型并对模型参数进行微调。然后
使用微调后的网络模型提取其全局平均池化层输出的服装图像特征。通 过使用
迁移学习,减少了模型在提取服装图像特征时的计算资源开销和训练时 间,提
万方数据
第 1 章 绪论
高了模型的泛化能力。并且相对于其他传统卷积神经网络,基于迁移学习的
Desenet201 特征提取主干网络能够融合利用更多低层次的特征,从而提 高了特
征的传播效率和利用效率,使得提取的特征更加丰富。然后在 RVFL 中引入正
则化系数来控制模型复杂度,解决过拟合问题。再通过 MPA 优化算法生成 AO
算法的初始种群,来提高 AO 算法的寻优和收敛效果。随后本文设计了一种基
于 AO 算法的种群个体位置的映射方法来优化 RRVFL 的输入权重、隐含层偏置
和正则化系数,通过不同的片段来映射 RRVFL 的相关参数,提高了 RRVFL 的
分类性能。最后使用优化后的 RRVFL 对提取到的服装图像特征进行分类。通过
大量的对比实验证明了 DFEB-MARRVFL 算法优秀的分类性能和泛化能力。
1.3.2 论文的结构安排
本论文的组织结构如下:
第一章为绪论部分,对服装图像分类算法的研究背景和意义进行了 介绍,
并且详细分析了国内外服装图像分类算法的研究现状,然后介绍了本文 的主要
研究工作与创新点,最后给出了本文的组织结构。
第二章为服装图像分类算法的基本理论,介绍了服装图像分类算法 的相关
理论基础,其中包括卷积神经网络和 RVFL 的相关原理,算法性能的评价指标
和实验中使用的数据集。
第三章为基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法,详
细介绍了本文提出的 PCNN-GOARVFL 服装图像分类算法的原理,并与其他算
法进行了大量的对比实验,证明了算法优秀的性能。
第四章为基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法,
详细阐述了本文提出的 DFEB-MARRVFL 算法的流程,并对 RRVFL 参数的寻优
过程进行了说明,最后通过实验验证了算法良好的分类性能和泛化能力。
第五章为总结与展望,对本文提出的两种服装图像分类算法进行了 总结,
阐述了本文研究成果的优势与不足,并指明了未来的研究和改进的方向。
万方数据
第 2 章 服装图像分类算法的基本理论
第 2 章 服装图像分类算法的基本理论
本章详细介绍了服装图像分类算法研究中使用到的相关理论基础, 主要介
绍了卷积神经网络的相关结构与各层的作用,随机向量函数链接神经网 络的结
构与数学模型,算法评价指标以及实验中用到的数据集。
2.1 卷积神经网络的结构
卷积神经网络是一种特殊的前馈神经网络,其修正了全连接神经网 络参数
过多,容易丢失图像空间信息的局限性,主要的网络结构有卷积层、池 化层和
全连接层。
卷积层由一组卷积核组成,其作用是进行特征提取。假设特征图大小为
5×5,卷积核大小为 3×3,步长为 1,图 2.1 展示了卷积运算的过程。如图所示,
在进行卷积操作时,卷积核与特征图中对应的元素相乘,并对乘积求和 得到输
出特征图中对应的值,然后卷积核滑动一个单位,进行下一次卷积操作 ,最终
得到卷积后的输出特征图。
图 2.1 卷积的运算过程
池化层也叫下采样层。通过池化层的池化操作,可以减少网络参数 ,防止
网络陷入过拟合。池化操作主要分为平均池化,最大池化和随机池化。 假设特
征图的大小为 4×4,滑动窗口的大小为 2×2,步长为 2,图 2.2 展示了平均池化
操作的处理过程,图 2.3 展示了最大池化操作的处理过程。随机池化则是按概率
大小随机选取滑动窗口内的元素值。
万方数据
第 2 章 服装图像分类算法的基本理论
图 2.2 平均池化的计算过程
图 2.3 最大池化的计算过程
输入的图像在经过多次的卷积操作和池化操作后,其分类结果一般 会由一
个或一个以上全连接层来给出。全连接层会将之前的网络提取的与类别 相关的
特征信息整合到一个特征图中,来减少特征位置对分类结果的影响。
2.2 随机向量函数链接神经网络
随机向量函数链接神经网络是一种单隐层神经网络,其包含输入层 ,隐含
层和输出层。假设有样本(𝑋𝑖 , 𝑌𝑖 ), 𝑖 = 1,2, … 𝑛,其中:𝑋𝑖 ,𝑌𝑖 表示第𝑖个 样本的输
入和输出, 𝑋𝑖 = [𝑥 𝑖1 , 𝑥 𝑖2 , . . . . . . , 𝑥 𝑖𝑛 ] ∈ 𝑅 𝑛 ,𝑌𝑖 = [𝑦𝑖1 , 𝑦𝑖2 , . . . . . . , 𝑦𝑖𝑚 ] ∈ 𝑅 𝑚 ,则一
个隐含层节点数为𝐿的 RVFL 神经网络的结构图如 2.4 所示。
万方数据
第 2 章 服装图像分类算法的基本理论
RVFL 的数学模型可表示为:
∑𝐿𝑗=1 𝛽𝑗 𝑔(𝑊𝑗 𝑋𝑖 + 𝑏𝑗 ) + ∑𝐿+𝑑
𝑗=𝐿+1 𝛽𝑗 𝑋𝑖𝑗 = 𝑜𝑖 (2-1)
其中:𝐻表示隐含层节点的输出,𝛽表示输出权重,𝑂表示实际的输出:
𝑔(𝑊1 𝑋1 + 𝑏1 ) ⋯ 𝑔(𝑊𝐿 𝑋1 + 𝑏𝐿 ) 𝑥 11 ⋯ 𝑥 1𝑛
𝐻 =[ ⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ] (2-3)
𝑔(𝑊1 𝑋𝑁 + 𝑏1 ) ⋯ 𝑔(𝑊𝐿 𝑋𝑁 + 𝑏𝐿 ) 𝑥 𝑁1 ⋯ 𝑥 𝑁𝑛 𝑁×(L+n)
𝛽1 𝑇
⋮
𝛽𝐿 𝑇
𝛽= (2-4)
𝛽𝐿+1 𝑇
⋮
[𝛽𝐿+𝑛 𝑇 ](𝐿+𝑛)×𝑚
𝑂1
𝑂=[ ⋮ ] (2-5)
𝑂𝑁 𝑁×𝑚
2
如果要使输出的误差𝐸 = ∑𝑁 ̂ †
𝑖 =1 ( 𝑂𝑖 − 𝑌𝑖 ) 最小,可转化为求 解 𝛽 = 𝐻 𝑌,其中𝐻
†
表示𝐻的广义逆矩阵。
2.3 算法评价指标
万方数据
第 2 章 服装图像分类算法的基本理论
在处理二分类问题时,通常使用精度(Precision,P),召回率(Recall,R),
F1 值(F1-score)和准确度(Accuracy)四个评价指标来对算法的性能进行评估。
而在处理多分类问题时,可以使用宏平均(Macro Average)或微平均(Micro
Average)来对算法的性能进行评估。为了使本文提出算法更有说服力 ,我们使
用 Macro-P,Macro-R,Macro-F1 和 Accuracy 来评估算法的性能,我们可以使用
等 式 (2-6) 到 (2-9) 来 计 算 不 同 算 法 的 Macro-P,Macro-R,Macro-F1 和
Accuracy。
1
𝑀𝑎𝑐𝑟𝑜 − 𝑃 = ∑𝑛1 𝑃𝑖 (2-6)
𝑛
1
𝑀𝑎𝑐𝑟𝑜 − 𝑅 = 𝑛 ∑𝑛1 𝑅𝑖 (2-7)
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = ∑𝑛1 𝑎𝑐𝑐𝑖 (2-8)
1
𝑀𝑎𝑐𝑟𝑜 − 𝐹1 = 𝑛 ∑𝑛1 𝐹1 − 𝑠𝑐𝑜𝑟𝑒𝑖 (2-9)
其中:
2×𝑃𝑖 ×𝑅𝑖
𝐹1 − 𝑠𝑐𝑜𝑟𝑒𝑖 = (2-10)
𝑃𝑖 +𝑅𝑖
𝑇 𝑃𝑖
𝑃𝑖 = 𝑇𝑃 (2-11)
𝑖 +𝐹𝑃𝑖
𝑇𝑃𝑖
𝑅𝑖 = (2-12)
𝑇𝑃𝑖 +𝐹𝑁𝑖
𝑇 𝑃𝑖
𝑎𝑐𝑐𝑖 = (2-13)
𝑇𝑃𝑖 +𝑇 𝑁𝑖 +𝐹𝑃𝑖 +𝐹𝑁𝑖
其中:𝑖是数据集中服装图像的类别数量;𝑇𝑃𝑖表示被算法正确分类为类别 𝑖的数
量;𝐹𝑃𝑖 表示其他类别被算法错误分类为类别𝑖的数量;𝐹𝑁𝑖表示类别𝑖被算法错
误分类为其他类别的数量; 𝑇𝑁𝑖表示其他类别被算法分类为其他类别的样 本数
量。𝐹1 − 𝑠𝑐𝑜𝑟𝑒𝑖表示类别𝑖的评价指标;𝑃𝑖表示类别𝑖的精确率;𝑅𝑖 表示 类别 𝑖的
召回率。由于传统计算准确率的方法对于负样本没有识别的能力,因此使用
𝑎𝑐𝑐𝑖 表示每个样本被正确分类为该样本类别的准确率,Macro-P 和 Macro-R 表示
所有类别的宏平均精确率和宏平均召回率,Macro-F1 表示所有类别的宏平均综
合评价指标,Accuracy 表示算法的分类准确度。
2.4 实验数据集
万方数据
第 2 章 服装图像分类算法的基本理论
(a) Blouses (b) Coat (c) Jacket (d) Long dress (e) Robe
(f) Shirt (g) Suit (h) Sweater (i) T-shirt (j) Uniform
10
万方数据
第 2 章 服装图像分类算法的基本理论
DeepFashion[50]数据集是一个大型服装图像数据集,包含 50 种类别的服装
图像。由于 DeepFashion 数据集过于庞大且本次研究主要是对服装图像进行分类,
因此我们从其类别相关的子集中选取 8 个类别进行实验,分别是 Dress,Skirt,
Tee,Jumpsuit, Shorts,Jeans,Sweater 和 Jacket,每个类别选取 2000 张图片,
共 16000 张。按照 7:3 的比例划分训练集与测试集。图 2.7 为本 文 选 取 的
DeepFashion 数据集类别的示例。
2.5 本章小结
本章主要介绍了服装图像分类算法的一些基本理论知识,首先详细 介绍了
卷积神经网络的卷积层、池化层和全连接层的相关知识,然后介绍了 RVFL 的
网络结构和数学模型,并对服装图像分类算法的四个评价指标 Macro-P,Macro-
R,Macro-F1 和 Accuracy 进行了说明,最后介绍了本次研究中使用到的三个服
装图像数据集。
11
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
3.1 引言
正如第一章所述,服装图像分类算法的关键点在于对服装图像特征 的提取
和对提取到的特征进行有效的分类,本文通过结合卷积神经网络和改进的 RVFL
神经网络来研究服装图像分类算法,但是传统的卷积神经网络提取的数 据特征
有限而且容易出现过拟合问题,RVFL 神经网络又因为随机生成输入权重和隐含
层偏置而导致分类效果不稳定。针对这些问题,本章提出了一种并行的 卷积神
经网络网络与 GOA 优化的 RVFL 相结合的服装图像分类算法。本章的主要创新
点如下:
(1)提出一种并行卷积神经网络模型提取服装图像特征,通过利用 CNN
的结构密集性和改进的双通道解决了传统的卷积神经网络提取特征不丰 富和过
拟合的问题,该模型在每次卷积操作后进行批量标准化处理,加快了提 取特征
的速度,避免了梯度消失问题,并使用 LeakyReLU 作为激活函数,减少了静默
神经元的数量,提高了提取特征的性能。
(2)由于 RVFL 随机生成输入权重和隐含层偏置会导致其分类效果不稳定,
本章使用 GOA 算法优化 RVFL 的权重和偏置,从而避免了 RVFL 参数的随机性,
提高 RVFL 的分类性能和稳定性。
(3)使用 GOA 优化后的 RVFL 来对并行卷积神经网络提取的服装特征进
行分类,提高了服装图像分类算法的性能。该算法不仅发挥了卷积神经 网络自
动提取图像特征的功能,还使用优化后的 RVFL 提高了对特征的分类准确率,
在服装图像分类上具有较大的优势。
3.2 蝗虫优化算法
蝗虫优化算法(GOA)是根据自然界中蝗虫的觅食行为而提出的一 种元启
发式算法。GOA 算法的数学模型可以表示为式(3-1)。
𝑋𝑖 = 𝑟1 𝑆𝑖 + 𝑟2 𝐺𝑖 + 𝑟3 𝐴𝑖 (3-1)
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
𝑆𝑖 的计算公式如下所示。
𝑆𝑖 = ∑𝑁 ̂
𝑗=1 𝑠(𝑑𝑖𝑗 )𝑑𝑖𝑗 (3-2)
𝑗≠𝑖
其中:𝑓为吸引力强度;𝑙为吸引长度的尺度;𝑟为蝗虫之间的距离。𝐺𝑖 的计算公
式如下所示。
𝐺𝑖 = −𝑔𝑒̂ 𝑔 (3-4)
𝐴𝑖 = 𝑢𝑒̂ 𝑤 (3-5)
其中:𝑢为漂移系数;𝑒̂ 𝑤 为风向的单位向量。
3.3 并行卷积神经网络模型
由于传统的卷积神经网络在提取图像特征时,提取的特征有限而且 有过拟
合的风险,本章提出了一种并行的卷积神经网络结构,通过利用卷积神 经网络
的结构密集型和双通道来解决这一问题。并使用 LeakyReLU 作为激活函数,与
ReLU 激活函数不同的是,当输入为负值时,LeakyReLU 的输出并不为 0,从而
解决了神经元失效的问题。并行卷积神经网络在每次卷积操作之后进行 批量标
准化处理。通过批量标准化处理可以使特征值呈标准正态分布,不仅解 决了梯
度消失问题,还加快了模型的收敛速度。而且卷积神经网络的模型效果 与数据
的分布有很大关系,对训练数据和测试数据进行批量标准化处理,可以 避免数
据分布不同对模型的影响。在所有 的卷积 操作和 池化 操作完 成之 后 , 使 用
Dropout 层来提高模型的泛化能力,然后使用两层全连接层来整合与服装图像类
别相关的特征信息,最后使用 SOFTMAX 分类器对特征进行最终分类。本章提
出的并行卷积神经网络的结构如图 3.1 所示。该模型处理服装图像的流程如下:
(1)输入图像尺寸为 28×28×1,首先经过 32 个 5×5 的卷积核卷积,卷积后
尺寸为 28×28×32,然后经过批量标准化处理和 LeakyReLU 函数处理。
(2)作 2×2 的 Max Pooling 池化,尺寸变为 14×14×32。
(3)此时,将生成的特征图同时输入到两个通道 A/B 进行处理;通道 A 和
通道 B 的结构相同,都是首先经过 32 个 3×3 的卷积核卷积,然后做批量标准化
13
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
图 3.1 并行卷积神经网络模型
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
测试集的分类准确率。
GOA-RVFL 分类器的详细流程如图 3.2 所示。
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
3.6 实验结果与分析
本次研究选取 Fashion Mnist 数据集进行实验。实验环境为 Windows10 操作
系统,内存为 64GB,GPU 为 NVIDIA GeForce RTX 2080Ti,CPU 为 intel (R)
Xeon(R) Bronze 3106。编程软件为 Matlab 2018b。为了使实验更具有说服力,将
每部分的对比实验都进行了 10 次重复实验,并取平均值来作为最终实验结果。
本次研究设置了 11 种算法来与本章提出的 PCNN-GOARVFL 算法进行对比实验,
其 中 包 括 PCNN-SOFTMAX,CNN-SOFTMAX,PCNN-RVFL,PCNN-
WOARVFL,PCNN-SSARVFL,PCNN-GWORVFL,PCNN-GOARVFL,LBP-
SVM,HOG-SVM,LBP-HOG-SVM,ALEXNET- SRC(Sparse Representation-
based Classifier)。
3.6.1 实验参数设置
16
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
表 3.1 激活函数的选取
Activation function
Times Sigmoid Sine Hardlim Tribas Radbas ReLU
1 92.50% 91.94% 92.19% 91.88% 91.97% 79.97%
2 92.88% 91.67% 91.80% 91.38% 92.45% 84.82%
3 92.12% 91.92% 92.04% 91.04% 91.35% 67.38%
4 92.20% 92.00% 91.71% 91.75% 92.04% 84.90%
5 92.45% 92.08% 92.04% 91.42% 91.88% 85.57%
6 92.25% 92.11% 92.08% 91.88% 92.25% 80.67%
7 92.29% 91.97% 91.81% 92.33% 91.83% 86.90%
8 92.83% 91.58% 92.08% 91.58% 92.63% 66.37%
9 92.74% 92.33% 91.25% 91.69% 92.79% 83.28%
10 92.67% 92.10% 91.88% 91.21% 92.17% 80.54%
Average 92.49% 91.97% 91.89% 91.62% 92.14% 80.04%
对于 RVFL 来说,设置一个较为合适的隐含层节点数尤为重要,如果设置
的隐含层节点数太少,则 RVFL 的分类性能达不到要求,如果设置的隐含层节
点数太多,则 RVFL 容易陷入过拟合,因此本小节选取 RVFL 的隐含层节点数为
数组 N = {5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100}中的 20 组
值进行实验,并 将 PCNN-WOARVFL,PCNN-SSARVFL 和 PCNN-
GWORVFL 3 种算法加入到横向对比实验中,来对比隐含层节点数对算 法精度
的影响。所有算法的种群数和最大迭代次数都设置为相同值,仅改变隐 含层节
点数来进行对比实验。实验结果如图 3.4 所示。从图中可看出,相比于 WOA,
SSA 和 GWO 算法优化的 RVFL,使用 GOA 算法优化的 RVFL 的精度基本上都
是最高,且在高精度下算法性能稳定,没有出现较大幅波动,当节点数为 100
时,精度达到了最高。考虑到精度与计算量,选取隐含层节点数为 100 进行实
验。
17
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
图 3.4 隐含层节点数对算法的影响
18
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
3.6.1.4 算法的最终参数设置
通过上述实验,最终确定选取表 3.2 中的算法参数进行后续的实验。
表 3.2 算法的最终参数设置
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
3.6.2 实验结果讨论
3.6.2.1 实验结果对比
Convergenc
Method Macro-P Macro-R Marco-F1 Accuracy
e Time(s)
ALEXNET 92.56% 92.22% 89.88% 92.22% 3758.93
PCNN-SOFTMAX 90.18% 89.81% 89.87% 89.81% 811.89
CNN-SOFTMAX 89.76% 89.52% 89.70% 89.52% 983.77
PCNN-GOARVFL 92.84% 92.93% 92.87% 92.93% 1479.29
20
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
21
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
3.6.2.2 算法稳定性分析
22
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
3.6.2.3 算法有效性分析
23
万方数据
第 3 章 基于并行卷积神经网络和优化的 RVFL 的服装图像分类算法
3.7 本章小结
本章介绍了一种基于并行卷积神经网络和 GOA 优化的 RVFL 相结合的服装
图像分类算法。首先,针对传统的卷积神经网络提取特征时的不足,提 出了一
种并行卷积神经网络模型,并对其结构进行了详细介绍。然后介绍了 GOA 算法
优化 RVFL 的权重和偏置的具体步骤,最后详细阐述了 PCNN-GOARVFL 服装
图像分类算法模型。本章还通过大量实验研究了 RVFL 的激活函数,隐含层节
点和 GOA 的参数对算法分类性能的影响,从而选取出更加合适的参数组合进行
后续实验。本章通过对 PCNN-GOARVFL 算法的各个创新点进行相应的对比实
验,证明了算法的优越性。最后还通过绘制箱型图和与其他服装图像分 类算法
进行对比证明了 PCNN-GOARVFL 算法的稳定性和有效性。本次研究虽然提升
了服装图像分类的准确率,但是还有很大的进步空间,后续研究会进一 步的改
进算法来提高服装图像分类算法的性能和泛化能力。
24
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
4.1 引言
上一章所提出的 PCNN-GOARVFL 算法虽然在 Fashion Mnist 数据集上的效
果很好,但是由于该算法结构相对简单,提取的图像特征不够丰富,所 以不适
用于像 ACWS 和 DeepFashion 这样的纹理背景复杂的服装图像数据集。而且传
统的 RVFL 是基于经验风险最小化来训练模型的,这样容易出现过拟合问题。
针对上述问题,本章提出了一种基于 Densenet201 网络和优化的正则化 RVFL 相
结合的服装图像分类算法。该算法的主要创新点如下:
(1)首先,我们使用迁移学习将 ImageNet 数据集预训练后的 Densenet201
网络的权重参数迁移到初始网络模型并对模型参数进行微调,从而得到 基于迁
移学习的 Densenet201 特征提取主干(DFEB)网络。使用基 于迁 移 学 习 的
DFEB 网络提取 Densenet201 网络的全局平均池化层输出的服装图像特征。通过
使用迁移学习,减少了模型在提取服装图像特征时的计算资源开销和训练 时间,
提高了模型的泛化能力。并且相对于其他传统卷积神经网络,基于迁移 学习的
Desenet201 特征提取主干网络能够融合利用更多低层次的特征,从而使 得提取
的服装图像特征更加丰富。
(2)针对 RVFL 分类性能较低,不稳定,并且容易出现过拟合的问题,本
章提出在传统的 RVFL 中引入正则化系数来提高 RVFL 的泛化能力。然后使用
MPA 优化算法为 AO 算法提供一组合适的初始种群,降低了初始种群质量对 AO
算法寻优效果和收敛效果的影响。随后提出了一种基于 MPA 改进的 AO 种群个
体位置的片段映射方法来优化 RRVFL 的输入权重,隐含层偏置和正则化系数,
通过不同的片段来映射 RRVFL 的相关参数,不仅自动为 RRVFL 选取了合适的
正则化系数降低了调参的时间成本,而且还解决了 RRVFL 因为参数的随机性而
导致的分类性能低,不稳定的问题。
(3)使用 MPA 改进的 AO 算法优化的正则化 RVFL 分类器(MARRVFL)
来对 DFEB 提取到的服装图像特征进行分类,从而得到了本章提出的 DFEB-
MARRVFL 服装图像分类算法。该算法不仅具有优秀的分类性能,还具 有良好
的泛化能力,适用于纹理背景复杂的服装图像数据集。
25
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
迁移学习[51]实质上就是把已经训练好的模型(预训练模型)参数迁 移到新
模型中,使得新模型拥有更高的初始性能,并且还能加快新模型在训练 过程中
提升的速率,降低了新模型的数据依赖性,从而提高新模型的泛化能力。
4.3 海洋捕食者算法
海洋捕食者算法(MPA)是一种新型的元启发式优化算法,其启发 于自然
界中捕食者的捕食策略。该算法有精英矩阵(Elite)和猎物矩阵(Prey),顶 级捕食
者们构成精英矩阵(一个顶级捕食者即为问题的一个解)。该算法在寻优过程中
有三个阶段,第一个阶段用于解空间的全局搜索,当迭代次数不超过最 大迭代
次数的三分之一时,种群个体的更新策略如下:
26
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
其中:𝐶𝐹表示步长𝑠𝑖 的自适应参数:
𝐼𝑡𝑒𝑟
𝐼𝑡𝑒𝑟 (2 )
𝐶𝐹 = (1 − 𝑀𝑎𝑥_𝐼𝑡𝑒𝑟 ) 𝑀𝑎𝑥_𝐼𝑡𝑒𝑟 (4-7)
其中:𝐼𝑡𝑒𝑟表示算法的迭代次数,𝑀𝑎𝑥_𝐼𝑡𝑒𝑟表示算法的最大迭代次数。
第三阶段用于对解空间的当前最优解位置进行局部搜索。当迭代次 数大于
最大迭代次数的三分之二时,种群个体的更新策略如下:
𝑠𝑖 = 𝑅𝐿 (𝑅𝐿 𝐸𝑙𝑖𝑡𝑒𝑖 − 𝑃𝑟𝑒𝑦𝑖 ), i = 1, … , n (4-8)
𝑃𝑟𝑒𝑦𝑖 = 𝐸𝑙𝑖𝑡𝑒𝑖 + 𝑃. 𝐶𝐹𝑠𝑖 (4-9)
4.4 天鹰优化器
天鹰优化器(AO)是一种基于种群的优化算法,其灵感来自于天鹰在捕
捉猎物过程中的行为。该算法的寻优过程有四个步骤.第一个步骤为拓 展探索,
即采用高空俯冲和垂直俯冲来搜索空间。首先,天鹰通过高空俯冲和垂 直俯冲
27
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
来搜索最佳狩猎区,该行为在数学上的表示方程式为:
𝑡
𝑋1 (𝑡 + 1) = 𝑋𝑏𝑒𝑠𝑡 (𝑡) × (1 − 𝑇) + (𝑋𝑀 (𝑡) − 𝑋𝑏𝑒𝑠𝑡 (𝑡) ∗ 𝑟𝑎𝑛𝑑) (4-11)
第二个步骤为缩小探索范围,即通过等高线短滑攻击在发散搜索空 间内探
索。数学公式表示如下所示。
𝑋2 (𝑡 + 1) = 𝑋𝑏𝑒𝑠𝑡 (𝑡) × 𝐿𝑒𝑣𝑦(𝐷) + 𝑋𝑅 (𝑡) + (𝑦 − 𝑥 ) ∗ 𝑟𝑎𝑛𝑑 (4-13)
4.5 正则化的随机向量函数链接神经网络
当训练集中异常的样本数据较多时,传统的 RVFL 网络的泛化性会降低且
容易陷入过拟合。针对这一问题,本章通过在 RVFL 上添加正则化项来约束其
28
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
其中:𝑒 = 𝑦 − 𝐻𝛽,式子(4-16)可以转化为:
𝑚𝑖𝑛 𝐶 ‖ 𝑒‖ 22 + ‖ 𝛽‖ 22 (4-17)
𝛽
构造拉格朗日函数为:
𝐿(𝛽, 𝑒, 𝜆) = 𝐶 ‖ 𝑒‖ 22 + ‖ 𝛽‖ 22 + 𝜆𝑇 (𝑦 − 𝐻𝛽 − 𝑒) (4-18)
这样就可得出𝛽̂的解为:
𝐼 −1
(𝐻𝑇 𝐻𝐶 + 𝐶 ) 𝐻𝑇𝑦 𝐿≤𝑁
𝛽̂ = { (4-20)
𝐼 −1
𝐻 𝑇 (𝐻𝐻 𝑇 + 𝐶 ) 𝑦 𝐿>𝑁
其中:𝐿是隐含层增强节点的个数。
29
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
否则进行下一次迭代来继续进行探索和开发。如果算法达到了最大迭代 次数,
则返回最优解的位置。第三部分是 RRVFL 分类器,这部分的任务是对提取到的
服装图像数据集的特征进行分类。首先我们对 MPA-AO 优化算法返回的最优个
体的位置进行分段,重排和映射等操作得到 RRVFL 的输入权重,隐含层偏置和
正则化系数,并使用提取好的训练集特征来训练 RRVFL,计算其输出权重。然
后调用 RRVFL 的分类函数,测试集特征、求得的输入权重和输出权重来计算测
试集特征的输出。最后,将求得的测试集特征的输出矩阵与其真实的标 签矩阵
作对比,若输出与标签不相等,则视为分类错误,最终将分类正确的数 量除以
测试集样本数即得出测试集的分类准确率。DFEB-MARRVFL 算法模型的详细
流程如图 4.3 所示。
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
4.7 实验结果与分析
本次研究主要是在 ACWS 数据集上进行实验。实验环境为 Windows10 操作
系统,内存为 64GB,GPU 为 NVIDIA GeForce RTX 2080Ti,CPU 为 intel (R)
Xeon(R) Bronze 3106。编程软件为 Matlab 2018b。在后续的算法泛化性实验中,
还在 Fashion Mnist 数据集和 DeepFashion 数据集上对算法的泛化能力进行了验
证。为了使实验更具有说服力,将每部分的对比实验都进行了 10 次重复实验,
并取平均值来作为最终实验结果。本次研究将本章提出的 DFEB-MARRVFL 算
法 与 Resnet50,Resnet101,Densenet201,Inception V3,DFEB-RVFL,DFEB-
RRVFL,DFEB-GWORRVFL,DFEB-ALORRVFL,DFEB-SSARRVFL,DFEB-
MPARRVFL,DFEB-AORRVFL,DFEB-AARRVFL(ALO-AO-RRVFL) ,
DFEB-SARRVFL(SSA-AO-RRVFL),DFEB-GARRVFL(GWO-AO-RRVFL),
GLCM-RVFL,LBP-HOG-SVM 和 INCEPTIONV3-SRC 共 17 种算法进行了相应
的对比实验。
4.7.1 实验参数设置
32
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
Activation function
Times Sigmoid Sine Hardlim Tribas Radbas
1 86.20% 81.90% 82.97% 70.47% 12.13%
2 86.27% 44.20% 84.77% 11.37% 11.02%
3 84.90% 85.23% 83.60% 80.60% 80.00%
4 86.10% 10.20% 84.97% 60.30% 13.03%
5 85.83% 9.83% 85.70% 82.17% 81.40%
6 86.30% 10.33% 86.73% 10.30% 81.53%
7 85.47% 10.03% 85.50% 10.43% 81.80%
8 85.83% 10.27% 76.93% 10.60% 80.87%
9 85.73% 85.67% 82.50% 10.67% 73.70%
10 85.80% 83.90% 85.53% 76.30% 79.20%
Average 85.84% 43.16% 83.92% 42.32% 59.47%
RVFL 作为一种单隐含层的神经网络,选取合适的隐含层节点数目对提高其
分类性能尤为重要。如果选取的节点数过少,则可能会使算法的分类性 能达不
到要求,如果选取的节点数过多,不仅会加大计算量,而且还有陷入过 拟合的
风险。本文选取 20 组 RVFL 的隐含层节点的值进行实验,隐含层节 点数目在
[10,200]区间中,每次实验增加 10 个隐含层节点,并且在每个隐含层 节点的取
值下都进行 10 次实验,通过计算平均分类精度来研究隐含层节点数对算法性能
的影响,实验结果如表 4.2 到表 4.5 所示。从这些表中数据可知,当隐含层节点
数目在区间[10,140]时,算法的分类性能随着隐含层节点数的增加而上升,这说
33
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
明在此区间上,隐含层节点数目的增加能够有效的提高算法的分类性能 。而当
隐含层节点数目在区间[150-200]时,隐含层节点数目的增加并没有提高 算法的
分类性能,相反还有所下降,这表明算法陷入了过拟合。因此本文选取 隐含层
节点数目为 140 进行后续实验。
表 4.2 算法的隐含层节点在区间[10-50]时的分类结果
Number of node
Times 10 20 30 40 50
1 66.87% 76.13% 78.77% 81.40% 83.20%
2 67.87% 74.60% 80.47% 82.23% 82.00%
3 64.07% 77.80% 78.40% 81.17% 81.60%
4 70.20% 72.13% 79.00% 80.93% 84.20%
5 66.60% 73.60% 78.43% 80.03% 83.53%
6 68.37% 75.97% 78.03% 81.23% 82.57%
7 65.50% 74.73% 78.27% 80.97% 82.70%
8 73.07% 74.90% 77.70% 82.83% 81.47%
9 65.60% 75.00% 75.03% 80.10% 82.27%
10 70.83% 74.23% 77.30% 80.27% 80.90%
Average 67.90% 74.91% 78.14% 81.12% 82.44%
表 4.3 算法的隐含层节点在区间[60-100]时的分类结果
Number of node
Times 60 70 80 90 100
1 83.03% 85.20% 85.57% 86.37% 85.43%
2 83.70% 85.07% 84.00% 85.47% 86.20%
3 84.23% 83.60% 85.67% 86.30% 86.26%
4 84.20% 84.00% 81.90% 84.90% 84.90%
5 82.93% 83.87% 84.77% 85.87% 86.10%
6 82.43% 84.53% 84.30% 85.73% 85.83%
7 84.07% 84.83% 84.57% 85.53% 86.30%
8 84.43% 83.77% 85.20% 85.67% 85.47%
9 83.33% 84.83% 81.80% 86.10% 85.83%
10 84.47% 84.07% 84.80% 86.17% 85.80%
Average 83.68% 84.38% 84.26% 85.81% 85.81%
34
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
表 4.4 算法的隐含层节点在区间[110-150]时的分类结果
Number of node
Times 110 120 130 140 150
1 85.97% 86.20% 86.47% 86.70% 86.33%
2 86.57% 86.77% 86.77% 86.40% 85.97%
3 85.60% 85.70% 86.87% 86.27% 85.83%
4 86.03% 86.67% 86.60% 86.87% 86.07%
5 85.37% 85.93% 86.40% 86.43% 86.47%
6 86.27% 85.67% 86.50% 87.33% 85.93%
7 86.50% 86.97% 86.10% 86.33% 86.07%
8 85.43% 86.33% 86.50% 86.17% 85.90%
9 86.47% 87.20% 86.33% 86.60% 85.33%
10 86.57% 86.77% 85.97% 86.73% 86.37%
Average 86.08% 86.42% 86.45% 86.58% 86.03%
表 4.5 算法的隐含层节点在区间[160-200]时的分类结果
Number of node
Times 160 170 180 190 200
1 86.43% 86.63% 85.20% 85.53% 84.77%
2 86.53% 86.47% 85.63% 85.47% 86.10%
3 85.83% 86.13% 85.40% 84.73% 86.27%
4 86.27% 86.57% 85.43% 85.60% 85.50%
5 86.03% 86.23% 85.33% 84.47% 85.53%
6 86.47% 86.33% 85.27% 84.93% 86.47%
7 86.30% 85.97% 85.56% 85.40% 85.53%
8 85.93% 86.83% 84.93% 85.87% 85.03%
9 86.57% 86.03% 85.60% 85.50% 85.60%
10 85.47% 85.77% 85.43% 85.77% 85.33%
Average 86.18% 86.30% 85.38% 85.33% 85.61%
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
寻优算法还未收敛,而在高迭代次数的情况下,由于寻优算法已经收敛 ,因此
精度也相对更高。在种群数为 15,迭代次数为 80 的参数组合下,算法的分类精
度达到了最高,后续再增加种群数和最大迭代次数并未有效的提高算法 的分类
性能,反而增加了计算量。因此,本文选取 MPA-AO 优化算法的种群大小为 15,
最大迭代次数为 80 进行后续的实验。
表 4.6 算法的最大迭代次数在区间[10-50]时各个种群数下的平均分类精度
Max Iteration
Pop 10 20 30 40 50
5 82.30% 83.50% 85.43% 85.20% 84.00%
10 82.97% 83.90% 84.07% 85.53% 85.57%
15 82.57% 83.27% 84.07% 83.17% 84.80%
20 83.60% 83.37% 83.97% 84.73% 85.03%
25 82.83% 82.70% 83.80% 84.43% 85.30%
30 82.80% 83.90% 84.80% 85.47% 85.10%
35 83.10% 83.67% 85.50% 84.17% 85.67%
40 82.97% 82.00% 85.83% 83.70% 85.43%
45 82.43% 83.23% 84.17% 84.73% 85.23%
50 83.57% 84.10% 85.23% 83.13% 85.40%
表 4.7 算法的最大迭代次数在区间[10-50]时各个种群数下的平均分类精度
Max Iteration
Pop 60 70 80 90 100
5 85.30% 85.47% 85.47% 86.00% 85.17%
10 85.37% 85.63% 85.50% 84.47% 85.57%
15 85.83% 83.20% 86.33% 83.37% 85.87%
20 85.33% 85.80% 85.30% 84.53% 86.03%
25 83.13% 85.17% 83.87% 85.10% 85.27%
30 83.47% 83.77% 85.93% 85.30% 85.27%
35 85.73% 84.80% 85.50% 84.93% 85.10%
40 84.83% 85.43% 82.47% 84.63% 85.00%
45 85.30% 85.30% 85.47% 83.17% 84.73%
50 85.37% 85.30% 85.73% 83.83% 85.07%
36
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
4.7.1.4 算法最终参数设置
在经过大量实验后,确定算法的最终参数如表 4.8 所示。
表 4.8 算法的最终参数设置
4.7.2 实验结果讨论
4.7.2.1 实验结果对比
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
38
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
39
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
40
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
41
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
4.7.2.2 算法稳定性分析
42
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
4.7.2.3 算法参数寻优收敛性分析
43
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
4.7.2.4 算法有效性分析
4.7.2.5 算法泛化性分析
万方数据
第 4 章 基于 Densenet201 网络和优化的正则化 RVFL 的服装图像分类算法
4.8 本章小结
本章提出了一种基于 Densenet201 网络与优化的正则化 RVFL 相结合的服装
图像分类算法,并且充分验证了算法的有效性和泛化性。首先,本章详 细介绍
了基于迁移学习的 Densenet201 网络的特征提取主干网络相较于其他传统的卷积
神经网络的优势。然后介绍了 MPA 算法改进的 AO 算法优化正则化 RVFL 的具
体步骤。最后,对本章所提出的 DFEB-MARRVFL 算法的模型和 AO 种群个体
位置映射正则化 RVFL 参数的过程进行详细阐述。通过与 GLCM-RVFL,LBP-
HOG-SVM,INCEPTIONV3-SRC 和 DFEB-MARRVFL 算法在 ACWS 数据集上
进行对比实验证明了本章提出的 DFEB-MARRVFL 算法的有效性。在 Fashion
Mnist 数据集和 DeepFashion 数据集上验证了算法良好的泛化能力。
45
万方数据
第 5 章 总结与展望
第 5 章 总结与展望
随着互联网时代的到来,越来越多的人们选择在网上进行购物, 人们在网
络上购买服装的需求也越来越大,这也使得网络上的服装图像呈现爆发式 增长。
对于服装电商从业者来说,他们急需寻找一种能够自动准确分类服装图 像的方
法。一个好的服装图像分类模型不仅可以帮助这些服装电商从业者减少 人工成
本,而且还对其他图像分类问题有一定的启发作用。因此,本文基于深 度学习
来服装图像分类进行研究。本论文取得的研究成果如下:
(1)为了解决传统的卷积神经网络提取的数据特征有限而且容易出现过拟
合的问题,本文提出了一种并行的卷积神经网络(PCNN)来提取服装图像特
征。并且针对 RVFL 随机产生输入权重和隐含层偏置会使得其分类效果不稳定
的问题,本文采用 GOA 对 RVFL 的输入权重和隐含层偏置进行寻优得到优化后
的 RVLF 分类器(GOA-RVFL)。最后使用 GOA-RVFL 对 PCNN 提取到的服装
图像特征进行分类。在 Fashion Mnist 数据集,本文提出的 PCNN-GOARVFL 算
法的 Macro-P,Macro-R,Macro-F1 和 Accuracy 均高于其他服装图像分类算法,
充分证明了该算法的有效性。并且通过绘制箱型图验证了算法优秀的稳定性。
(2)为了进一步的提高服装图像分类算法的性能和泛化能力,本文提出了
一种基于迁移学习的 Densenet201 特征提取主干网络和 MPA 改进的 AO 算法优
化的正则化 RVFL 相结合的服装图像分类算法。该算法首先使用迁移学习和微
调得到了 Densenet201 特征提取主干网络,减少了提取服装图像特征时计算资源
的开销,提高了特征的传播效率和利用效率。然后,通过在传统的 RVFL 中引
入正则化系数解决了过拟合问题。采用 MPA 算法为 AO 算法提供一组合适的初
始种群,提高了 AO 算法的寻优能力和收敛能力,并且提出了一种基于 AO 算法
的种群个体位置的片段映射方法,同时优化 RRVFL 的正则化系数,输入层权重
和隐含层偏置,自动为 RRVFL 选取了合适的正则化系数,并且解决了 RRVFL
分类精度低,性能不稳定的问题。通过在 ACWS 数据集上进行多次对比实验可
知,本文提出的 DFEB-MARRVFL 算法具有优秀的分类性能和稳定性。并且在
Fashion Mnist 数据集和 DeepFashion 数据集上,该算法也同样具有优秀的分类性
能,这充分证明了其良好的泛化能力。
虽然本文取得了一定的研究成果,但是由于时间比较仓促,论文中 仍然存
在许多需要改进的地方,后续的研究可以从以下两个方面进行改进:
(1)论文提出的服装图像分类算法只是对服装图像进行了粗粒度的划分,
但是在一个大的类别的服装图像中,有许多服装图像之间存在服装纹理 ,风格
46
万方数据
第 5 章 总结与展望
等差异,如吊带裙和连衣裙都属于裙子这一类别,但是却存在一定差异 。本论
文在进行研究时,并未考虑到这些问题,因此无法对大类别的服装图像 进行进
一步的细粒度分类。后续的研究可以结合服装图像的纹理特征和形状特 征,来
对服装图像进行细粒度分类。
(2)本文在对 RVFL 和 RRVFL 进行优化的过程中,主要是针对其输入权
重,隐含层偏置以及正则化系数进行了优化,但是并未对 RVFL 的其他参数
(如激活函数和隐含层节点数等)进行优化,而是采用对比实验的方式 来选取
较为合适的值。后续的研究中,可以考虑使用本文提出的种群个体位置 映射方
法对 RVFL 的其他参数来进行寻优,这样也许能进一步的提升 RVFL 的分类性
能。
47
万方数据
参考文献
参考文献
48
万方数据
参考文献
[18] He K, Zhang X, Ren S, et al. Deep residual learning for image recognition[C]//Proceedings of
the IEEE conference on computer vision and pattern recognition. Las Vegas: IEEE Computer
Society, 2016: 770-778.
[19] Yu F, Du C, Hua A, et al. EnCaps: Clothing Image Classification Based on Enhanced Capsule
Network[J]. Applied Sciences, 2021, 11(22): 11024.
[20] Lin X, Peng L, Wei G, et al. Clothes classification based on deep belief network[C]//2016 3rd
International Conference on Informative and Cybernetics for Computational Social Systems
(ICCSS). Jinzhou: IEEE, 2016: 87-92.
[21] Tan Z, Hu Y, Luo D, et al. The clothing image classification algorithm based on the improved
Xception model[J]. International Journal of Computational Science and Engineering, 2020,
23(3): 214-223.
[22] Chen L, Han R, Xing S, et al. Research on Clothing Image Classification by Convolutional
Neural Networks[C]//2018 11th International Congress on Image and Signal Processing,
BioMedical Engineering and Informatics (CISP-BMEI). Beijing: IEEE, 2018: 1-5.
[23] Liu Y, Luo G, Dong F. Convolutional Network Model using Hierarchical Prediction and its
Application in Clothing Image Classification[C]//2019 3rd International Conference on Data
Science and Business Analytics (ICDSBA). Istanbul: IEEE, 2019: 157-160.
[24] Di W. A comparative research on clothing images classification based on neural network
models[C]//2020 IEEE 2nd International Conference on Civil Aviation Safety and Information
Technology (ICCASIT. Weihai: IEEE, 2020: 495-499.
[25] Kayed M, Anter A, Mohamed H. Classification of garments from fashion MNIST dataset using
CNN LeNet-5 architecture[C]//2020 International Conference on Innovative Trends in
Communication and Computer Engineering (ITCE). Aswan: IEEE, 2020: 238-243.
[26] Lee C H, Lin C W. A two-phase fashion apparel detection method based on YOLOv4[J].
Applied Sciences, 2021, 11(9): 3782.
[27] Ge Y, Zhang R, Wang X, et al. Deepfashion2: A versatile benchmark for detection, pose
estimation, segmentation and re-identification of clothing images[C]//Proceedings of the
IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach: IEEE
Computer Society, 2019: 5337-5345.
[28] Wang W, Xu Y, Shen J, et al. Attentive fashion grammar network for fashion landmark
detection and clothing category classification[C]//Proceedings of the IEEE Conference on
Computer Vision and Pattern Recognition. Salt Lake City: IEEE Computer Society, 2018:
4271-4280.
[29] Cychnerski J, Brzeski A, Boguszewski A, et al. Clothes detection and classification using
convolutional neural networks[C]//2017 22nd IEEE international conference on emerging
technologies and factory automation (ETFA). Limassol: IEEE, 2017: 1-8.
[30] 高樱萍, 宋丹, 陈玉婷. 基于卷积神经网络和迁移学习的服装图像分类[J]. 纺织科技进展,
2021(11):48-52.
[31] 程铭, 马佩, 何儒汉. 基于流形结构神经网络的服装图像集分类方法[J]. 计算机科学, 2021,
48(11A): 391-395.
49
万方数据
参考文献
万方数据
参考文献
[50] Liu Z, Luo P, Qiu S, et al. Deepfashion: Powering robust clothes recognition and retrieval with
rich annotations[C]//Proceedings of the IEEE conference on computer vision and pattern
recognition. Las Vegas: IEEE Computer Society,2016: 1096-1104.
[51] Pan S J, Yang Q. A survey on transfer learning[J]. IEEE Transactions on Knowledge & Data
Engineering, 2010, 22(10):1345-1359.
51
万方数据
致谢
致谢
一转眼三年的研究生生活即将结束,马上就要步入社会了,心中难 免有一
点不舍与忧愁。在这里由衷的感谢帮助过我的老师、朋友和家人们。
首先,我要感谢我的父母这二十四年来对我辛勤地培养,无私地付出。
其次,我要感谢我的导师周志宇和实验室的师兄师姐们在学习上和 科研上
对我的帮助,如果没有他们的帮助,我的毕业论文不可能完成的如此顺利。
然后,我要感谢我的高中同学对我的陪伴与开导。
最后,我要感谢我的室友,是他们陪我一起度过了三年的快乐时光。
52
万方数据
攻读硕士学位期间的研究成果
攻读硕士学位期间的研究成果
1. 参与的科研项目
[1] 参与浙江省重点研发项目“作业型海底管线检测无缆机器人的研制及示范应
用” (No. 2021C03013), 2021.1-2023.12
[2] 参与浙江省自然科学基金项目 “基于极限学习机和视觉伺服的机械手目标跟
踪与抓取” (编号:LY18F030018),2018.1-2020.12
2. 论文
[1] Zhou Z, Deng W, Zhu Z, et al. Fabric defect detection based on feature fusion of a
convolutional neural network and optimized extreme learning machine[J].Textile
Research Journal, 2021,92(7-8):1161-1182.(SCI 收录)
[2] Zhou Z, Deng W, Wang Y, et al. Classification of clothing images based on a parallel
convolutional neural network and random vector functional link optimized by the
grasshopper optimization algorithm[J].Textile Research Journal,2022,92(9-10):1415-
1428.(SCI 收录)
53
万方数据