基于改进ShuffleNet v2的垃圾分类系统外文翻译资料

 2023-05-14 19:43:49

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


基于改进ShuffleNet v2的垃圾分类系统

摘 要

垃圾分类技术不仅是垃圾无害化处理和资源回收的重要基础,也是社会发展的必然趋势。目前的垃圾分类方法在垃圾收集阶段依靠人工分类,在一致性、稳定性和卫生条件方面难以达到令人满意的结果。为此,本研究设计并开发了一个基于深度学习的垃圾分类系统,可以识别和回收生活垃圾。针对垃圾分类精度低、实时性差的问题,提出了一种轻量级垃圾分类模型GCNet(垃圾分类网)。GCNet包含对ShuffleNet v2的三项改进,包括并行混合注意机制(PMAM)的设计、新激活函数的使用和转移学习。实验结果表明,GCNet在自建数据集上的平均准确率为97.9%,模型参数量仅为130万,在树莓派4B上的单次推理时间约为105毫秒,分类系统只需0.88秒即可完成单个对象的分类和收集。本文提出的方法是机器视觉在垃圾分类和资源回收方面的一次有效尝试。随着技术的进步,将有效地促进资源与环境领域的学术探索和工程应用。

关键词 垃圾图像分类、ShuffleNet v2、注意机制、激活函数、转移学习、回收

目 录

第1章 绪论 3

1.1 引言 3

第2章 材料与方法 5

2.1 垃圾分拣机 5

2.1.2 控制电路 6

2.2 数据集说明 7

2.3 算法设计 7

2.3.3 激活功能 12

第3章 结论 14

3.1 实验结论 14

绪论

引言

近年来,随着居民生活水平的不断提高和消费结构的日益丰富,生活垃圾数量急剧增加,许多城市都遭受着“垃圾围城”的痛苦。垃圾分类被认为是提高资源效率和保护环境的有效途径,已作为管理措施在各地积极推广。然而,由于垃圾种类繁多,居民垃圾分类意识低,相关政策不完善,垃圾分类的实施情况并不乐观。因此,研究一种有效的垃圾自动分类方法具有重要的学术价值和现实意义。

人工智能的发展为这个问题提供了新的解决方案。许多学者已经设计了基于深度学习技术的智能垃圾分类算法。这些方法可以直接应用于智能垃圾分类设备,如智能垃圾桶、垃圾分类器、智能垃圾站、移动App等,将有效提高垃圾分类效率。但仍然存在诸如复杂的模型结构,较长的推理时间和高计算成本等问题。垃圾分类技术的一般应用对象是分类设备。对于垃圾分类设备,识别通常在操作之前执行,即控制器只有在获得识别结果后才能向执行器发送指令。如果不能保证垃圾的实时识别,控制过程将有明显的延迟甚至系统崩溃,导致分类失败。结合应用程序,为每个设备配备高性能图形处理单元(GPU)设备可能是不切实际的,这导致巨大的芯片成本。执行电机的速度相对容易控制,甚至可以选择速度更快的电机,这样也不会明显增加成本。因此,制约整个系统速度的主要因素是计算平台。目前,轻量级深度学习模型取得了重大进展,这些模型体积更小,速度更快。在保证准确性的同时,为嵌入式设备提供理论和技术支持,实现垃圾分类。

大型网络模型在计算机视觉任务中的成就是显著的,例如AlexNet,GoogLeNet和ResNet。然而,大型网络模型的庞大和结构复杂性(通常只能在高计算GPU设备中运行)促使深度学习转向轻量级研究。轻量级神经网络已经开发到现在,并且有Xception、移动网,ShuffleNet,以及许多其他更小、更快的轻量级网络,同时确保准确性。这些模型的出现使得直接在边缘计算设备上运行深度学习模型成为可能。

鉴于轻量级神经网络在推理速度方面的优势,大量学者已经使用轻量级网络进行图像分类任务。Gfa等人设计了一种基于预先训练的主干挤压网的钢表面缺陷快速准确分类模型,用于转移学习,该模型在TITANX平台,上可以达到每秒100帧(FPS)。Tang等人提出了一个轻量级葡萄病害分类模型,选择ShuffleNet作为模型主干,并使用通道注意力机制进行优化,识别准确率为99.14%,参数仅为110万;Jia等人提出一种新冠肺炎胸部X射线(CXR)图像分类的轻量级模型,以MobileNet v3作为主干网络,对逐点卷积输出进行加权组合,精度为99.6%,模型参数仅为186万;Gao等人设计了一种基于新型空间注意力机制和转移学习的轻量级网络主干网,对垃圾图像进行分类,在华为云平台上的垃圾分类任务中取得了良好的效果,准确率为96.17%,每秒约450M次;Yang和Li借鉴了当前的主流网络结构,在引入注意机制的同时,使用了一个深度可分离的卷积轻量级模型,设计了一个轻量级垃圾分类网络WasNet,在自建的生活垃圾数据集上的准确率为82.5%,模型参数计数为150万。

上述研究从几个方面改进了轻量级网络,在保持其轻量级性质的同时提高了准确性。因此,本研究将轻量级神经网络的速度优势应用于垃圾图像分类,并设计了一种高效的垃圾分类算法,用于嵌入式设备。基于轻量级ShuffleNet v2网络主干网,从以下三个方面设计了一种快速准确的垃圾图像分类方法:

1.在模型中嵌入并行混合注意力机制,以增强重要特征并抑制无用特征;

2.使用FReLU代替ReLU作为激活函数,实现像素级空间信息建模;

3.基于迁移学习的培训来优化网络主干网的初始化权重,提高模型性能。

第2章 材料与方法

2.1 垃圾分拣机

2.1.1 分拣机介绍

我们使用Unigraphics(UG)软件对垃圾分类系统的结构进行建模。整体设备结构如所示图2-1并分为四个部分:垃圾输送平台,机器视觉识别,致动电机和收集箱。移动皮带速度范围为0-50cm/s,可调。垃圾之间的距离至少设置为40厘米,以确保系统的稳定性。收集箱是与设定的垃圾类别相对应的四箱结构,包括可回收垃圾,湿垃圾,危险垃圾和干垃圾。具体设备说明如下。

光电传感器:如图所示图2-1(a),选择的元件是E18-D80NA光电开关,工作电压为5V,检测距离为3-80cm。

工业相机:如图所示图2-1(b),选择的相机是LRCP1080P;相机的焦距为8.0mm;输出图像为RGB像素格式,分辨率为1920times;1080;相机的接口是USB,图像传输速率为30 FPS。

驱动电机:如图所示图2-1(c),电机为步进电机,具体型号为86BYG250D,提供稳定、精确的电机旋转角度控制。

图2-1 垃圾分类系统的结构

根据垃圾分类系统的建模结构设计图,进行实物生产,如图2-2。该设备的工作原理是靠近传送带末端的识别区域安装有工业相机和光电传感器;当光电传感器检测到垃圾时,触发工业相机并获得当前帧的图像;系统调用图像识别算法对垃圾进行快速识别,并根据识别结果进行分类。执行器驱动分类挡板根据分类情况旋转,使垃圾落入沿分级挡板倾斜方向的对应箱体。

图2-2 垃圾分类系统的产生

2.1.2 控制电路

树莓派被选为分类系统的中央控制芯片。Raspberry Pi是一款基于ARM架构的微机主板,广泛应用于人工智能、物联网等应用。其系统支持Python、C、C 等编程语言,具有基于Linux的丰富可编程电路引脚,具有低成本、低功耗等优点。为保证系统的稳定性和实时性,选用了Raspberry Pi 4B,CPU频率为1.5GHz,RAM尺寸为4G,支持摄像头和显示器等外围设备,以及40个电路引脚,其中8个可编程。最后,硬件电路的设计如图2-3。

图2-3 控制电路

2.2 数据集说明

本研究构建了一个场景丰富的自建垃圾图像数据集。这些图像是从网络图片和现实生活中的镜头中收集的,包括单个对象、复杂的背景和许多其他场景,涉及各种干扰,例如照明、运动模糊和对象变形。根据上海垃圾分类标准,本文将所有生活垃圾分为四类:可回收垃圾、湿垃圾、危险垃圾和干垃圾。收集箱也是按照标准设置的。数据集共采集了14个子类别,共4256张图像。具体关系和数量见表2-1。

表2-1 自建垃圾数据集的详细信息

2.3 算法设计

在垃圾图像分类中,为了解决硬件资源消耗高,背景干扰和分类精度低的问题,通过转移学习、引入注意力机制和优化激活函数,选择并改进了一个轻量级网络ShuffleNet v2,设计了一个低消耗、高精度的端到端垃圾分类模型GCNet,模型架构如图2-4。该模型描述如下:构建以ShuffleNet v2为核心的主干特征提取网络;通过转移学习初始化主干网权重,增强模型的训练起点;引入并行混合注意力机制,提高网络细化特征的能力,增强有用特征,抑制无用特征;采用新的激活函数FReLU,使激活函数具有空间语境特征提取能力,避免了当输入为负值时使用ReLU导致神经元失活。

图2-4 垃圾分类模型的框架

2.3.1 ShuffleNet v2

ShuffleNet v2是是MEGVII提出的ShuffleNet v1的升级版本,它基于通道混洗和四个设计标准,在相同复杂度下,在准确性方面优于ShuffleNet v1和MobileNet v2。通道随机排列分组卷积允许每个卷积内核仅对相应的信道分组进行操作,从而显著降低了计算成本。但是,分组卷积会导致给定通道的输出特征仅与该组中的输入相关,从而阻止通道组之间的信息交换并削弱表达能力。为了解决上述问题,ShuffleNet (张等,2018) 提出了通道随机播放的方法,该方法保证了不同信道分组的特征图交换信息,而无需增加计算。通道随机播放在组卷积中的应用如所示图2-5.。规则是随机且均匀地破坏通道维度中前--组卷积的输出特征。通道随机播放后,下一组卷积的每组输入特征都包含前一组卷积的不同组的输出特征,以便输入和输出在通道上相关。

图2-5 通道混洗在群卷积中的应用

设计指南在ShuffleNet v2之前,衡量轻量级模型复杂性的常用标准是失败次数。ShuffleNet v2证明,触发器只能用作模型复杂性的间接指示器。内存访问成本、并行度和张量运算等因素可能会导致相同触发器下模型推理速度的巨大差异。因此,ShuffleNet v2基于四个标准进行设计,构建的单元结构如图2-6所示。通道分离是指按通道将输入特征分为两部分;DW卷积是深度卷积。ShuffleNet v2的基本单元是根据四个准则设计的。相应的指导方针如下:

  1. 通过保持卷积层中输入特征和输出特征的通道数尽可能相等,最小化内存访问成本。以1times;1卷积为例,输入特征大小为times;htimes;w,为输出通道数,B为触发器,则:

当B保持不变时,根据平均不等式:

当时,不等号成立,MAC消耗最小。

  1. 减少组卷积的使用,过多的组卷积会增加内存访问的成本。假设组数在组卷积中为g,则

可以看出,当浮点运算量B确定时,MAC随着组数g的增加而增加。

  1. 减少网络分支:网络设计中的分支越多,速度越慢。在Inception体系结构中,大量的多分支结构被用作网络的基本模块,这影响了计算机的并行计算能力。
  2. 减少张量运算:例如,ReLU激活函数和特征求和运算,虽然触发器都很小,但MAC消耗量很大。

图2-6 Shufflenet v2的基本单位

2.3.2 注意力机制

CBAM是一个集成的通道和空间卷积注意机制模块,可嵌入网络中与CNN(卷积神经网络)模型进行端到端学习,有效增强特征图的重要特征,抑制无用特征。CBAM由通道注意和空间注意序列子模块组成。输入特征F经过通道注意模块加权以获得,然后通过空间注意机制输出特征。计算过程如下:

⨂F

其中表示通道注意映射,表示空间注意映射。⨂表示元素与广播机制相乘。

可以观察到,CBAM是通道和空间注意力机制之间的串行连接,这会导致后者的输入来自前者注意机制修改的特征,在一定程度上影响后者的特征学习。同时,通道注意力机制利用MLP层进行降维和增维操作,这不仅增加了参数数量,而且容易导致特征丢失。针对上述问题,本文提出了一种并行混合注意机制模块(PMAM),该模块设计为并行连接,使通道注意和空间注意机制的输入是原始特征,相互独立;MLP层被一维卷积代替,以避免特征降维,从而增强通道之间的相关性。图2-7所示为并行混合注意力机制模块。

从图2-7中可以看出,PMAM模块通过并行通道注意和空间注意机制,使特征能够增强通道和空间维度中的重要特征,总体公式如下:

⨂⨂

图2-7 并行混合注意机制模块(PMAM)

对于通道注意力机制,特征映射Fisin;

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[591499],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。