http://www.mpmpc.cn/file/upload/202112/07/16-14-00-42-1.gif
 
 
 
当前位置: 首页 » 电子期刊 » 技术应用 » 正文

基于深度学习的猪胴体图像分级系统设计与实现

韩宏宇 沈阳工业大学信息科学与工程学院

      来源:《肉类产业资讯》    2021年第5期
 
内容摘要:对整个卷积神经网络从结构上分解,其本质为不同种类网络层的组合。不同的网络层可以实现不同的作用。在CNN中,网络主要分为卷积层与全连接层两个大类。对这两类继续细化,卷积层中除了卷积核个数尺寸等参数不同外,层内是否具有池化操作以及是否进行Padding都将导致网络层的不同功能与性能;而全连接层中是否采用Dropout也会导致整体网络性能的不同。
  《续》
  4.3.3  不同网络层结构的分析
  对整个卷积神经网络从结构上分解,其本质为不同种类网络层的组合。不同的网络层可以实现不同的作用。在CNN中,网络主要分为卷积层与全连接层两个大类。对这两类继续细化,卷积层中除了卷积核个数尺寸等参数不同外,层内是否具有池化操作以及是否进行Padding都将导致网络层的不同功能与性能;而全连接层中是否采用Dropout也会导致整体网络性能的不同。
  传统神经网络分析过程中,一般选择全连接的方式,且假设上一层的全部输入和当前网络层的输出全部会表现出一定的关联,在这种处理模式下,如果面对复杂问题会导致相应的数据参数过多,网络规模也过大,不容易进行分析和计算。卷积神经网络中通过卷积层相关的局部连接和权值共享处理并进行对应的池化层下采样操作,可以有效的减少参数,降低网络的规模。在多个卷积层后设置再全连接,并在最后的全连接层上通过softmax分类器进行图像分类,相关权值数量可以明显的减小,对应的网络层复杂度降低,并且可以有效的避免过拟合现象。为了确定不同的网络层设置对于图像识别效果的影响,本文基于猪胴体图像分级的原始网络模型,将其他参数固定,适当的修改各网络层的数量,确定以下四种不同的实验模型。
  模型一:将网络模型中的fc1、fc2全连接层去掉,将卷积层部分直接连接到fc3层的全连接与softmax运算;
  模型二:去掉网络模型中的一个卷积层C4层,将C3层的结果直接连接到fc1全连接层;
  模型三:去掉网络模型中两层卷积层C2、C3,在C1层卷积池化操作后直接连接到C4层;
  模型四:去掉网络模型中的两个卷积层C3、C4以及全连接层fc1、fc2,在C2层卷积操作后直接连接到fc3层全连接并softmax。
  确定以上模型之后,分别对猪胴体图像数据集进行训练识别,所得结果如表4.3所示。
表4.3  不同的网络结构模型测试结果
模型 训练集误判率 测试集误判率
模型一 8.93% 21.65%
模型二 11.60% 23.43%
模型三 19.93% 35.22%
模型四 29.02% 71.70%
基础模型 6.22% 17.71%
  分析上表结果可发现,在解决猪胴体图像分级问题时,网络中的全连接层的改变对整个网络性能的影响明显小于卷积层的改变,通过模型二、模型三与原始模型的对比,可以发现网络模型中其他参数不变的情况下,卷积层的减少将明显地对网络识别效果产生影响,且减少的数量越大造成的性能损失越大。由此可知卷积神经网络中网络的性能与网络层的深度密切相关,且网络层数的增加将一定程度的提升网络的整体性能。但如果不恰当地对网络层数量过分地增加后,相应的网络结构复杂度也大幅度的提高,因而在卷积神经网络的构建过程中,应设置合适的网络层层数。
  4.3.4  尝试其他激活函数的分析
  多层神经网络结构的建立是基于神经网络模型的理论之上的。由单个神经元模型可知,多层神经网络中的神经元的功能实现也需要通过激活函数f来确定出相应的结构。在选择网络的激活函数f的过程中,可以选择的函数有Sigmoid、Tanh和Relu函数等。前两个函数的对应的表达式如(4.4)、(4.5)所示:
  (4.4)
  (4.5)
 
  各函数的函数曲线图具体如图4.5所示。

图4.5  sigmoid函数、ReLU函数以及Tanh函数
  ReLU函数是由数学家希尔顿在2012年首次提出的,通过此函数对模型初始化时可以降低噪声的影响,且可以有效的避免出现0梯度问题的出现,对应的函数表达式如(4.6)所示:
  f(x)=max(0,x)    (4.6)
  在ReLU函数中,当输入信号小于0时相应的输出都是0,而在输入大于0情况下,则输出该值。Krizh等学者在进行此方面的研究时发现,通过Relu激活函数建立的模型随机梯度下降的收敛速度明显的高于其他函数,并且在网络参数的设置过程中,Relu只需设定一个阈值即可满足激活要求,不必进行大量的数学运算。本文在分析激活函数和这种图像识别的关系时,控制其他参数不变,分别利用TensorFlow框架中对应的三个函数封装包分别应用于训练相应的网络模型,对其相应的识别率进行比对分析。结果显示如图4.6所示。

图4.6  不同激活函数对猪胴体图像识别效果的影响
  分析图4.6的结果可发现,将ReLU作为激活函数对应的网络模型的识别图像结果,识别效果更优,明显的高于其他两种函数,而其对两种数据的误判率分别为6.54%和17.85%,和其他两种函数对应的网络模型识别效果存在明显的差异,其他两种函数的识别效果差异则不明显。对此进行分析可以发现其原因在于通过Sigmoid函数对应的网络处理时,会导致饱和的神经元梯度消失,对应的输出结果分散性很严重,容易造成数据分散,不满足分类要求。而通过Tanh函数进行处理时,虽然所得数据以零点为分类中心点,不过在处理过程中也会出现神经元饱和、梯度消失等缺陷。而ReLU函数可以很好的避免以上两者遇到的问题,且对应的收敛能力明显的提高,识别效果也满足要求。
  4.4  优化的猪胴体图像识别模型
  在此基础上总结以上模型各参数对猪胴体图像识别影响情况,然后优化和改进基础模型,建立起对应的猪胴体图像识别模型CNN-P。该模型较原始模型的改变与参数设置如下:
  在结构上,CNN-P模型较原始模型增加了一个包含池化运算的卷积层C2,加大了网络深度的同时增加了卷积运算并多了一次池化操作,进一步提升了提取特征值的准确度。各卷积层的参数设置中,从C2 到C5层的卷积核尺寸全部选择为3×3,池化范围尺寸选择为3×3。相应的 Padding 设置选择SAME,在卷积时对应的外围添加一层0,这样可以保证卷积所得映射层图像大小满足一致性要求,且相应的特征表达也明显的提高。
  同时为了防止出现过拟合问题,在改进时主要在全连接层fc2增加dropout方法,对应的参数设置为0.5,也就是随机让一半连接到输出层的结点不工作。
  经过改进后,CNN-P网络模型共有八个网络层,其中包括五个卷积层和三个全连接层,在网络的最后一层fc3中设置softmax进行分类。这种改进后的网络模型CNN-P具体参数如表4.4、4.5所示。
表4.4  改进后的网络模型全连接层部分参数
全连接层 激活函数 dropout
fc1 RELU
fc2 RELU
fc3

表4.5  改进后的网络模型卷积层部分参数
卷积层 卷积 池化 激活函数 填充
C1 卷积核数量:96   卷积核大小:11×11 步长:4 池化大小:3×3   
步长:2
RELU
C2 卷积核数量:256    
卷积核大小:3×3
池化大小:3×3   
步长:2
RELU Same
C3 卷积核数量:384 
卷积核大小:3×3
RELU Same
C4 卷积核数量:384   
卷积核大小:3×3
RELU Same
C5 卷积核数量:256    
卷积核大小:3×3
池化大小:3×3   
步长:2
RELU Same
  4.5  优化后的模型效果
  4.5.1  CNN-P测试结果
  利用构建的猪胴体图像数据集中的训练集部分对优化后的CNN-P网络模型进行训练,在网络模型的学习过程中,由于参照A模型应用了ReLU作为激活函数,由权值衰减部分与交叉熵两部分之和构成的总缺失值在经过6900次左右的运算后开始进入相对稳定静止的状态,可判断此时模型对特征的学习达到了拟合状态。缺失值与迭代次数的关系如图 4.7所示。

图 4.7 网络模型训练中缺失值和迭代次数的关系
  利用猪胴体图像数据集中的测试集对优化后的网络模型进行测试,每次从测试集中随机抽取1000张进行测试,通过三次测试得到测试结果如表 4.6所示。

表4.6  1000张随机测试测试结果
测试组数 第一组 第二组 第三组 平均
准确率 93.4% 91.1% 93.6% 92.7%
  4.5.2  与其他相关猪胴体分级研究的比较
  本文中研究的利用卷积神经网络模型对猪胴体图片进行分级的研究目前在同领域其他学者中研究较少,在前人的研究中,彭彦昆(2012,2014,2015)的关于利用传统图像处理方法对猪肉及猪胴体图片进行处理后得到预定测量点处猪背膘厚度(实际生产中获得指定测量点处猪背膘厚度即可推算胴体瘦肉率进而进行分级)的研究及张萌(2016)利用RBF神经网络和图像处理技术对活体生猪图像标定测量点并根据测量到的数据预测生猪瘦肉率与本文研究范围及目标较为接近,选取这两个研究与本文的CNN-P网络模型性能进行对比。
  彭彦昆进行了一系列通过图片处理的方法从猪胴体图像中获取指定点的背膘厚度的研究,《基于近邻法聚类和改进Hough算法的猪胴体背膘厚度检测》中介绍了通过人工选取拍摄位置获得猪胴体图像后,对图像进行处理进而获得指定位置膘厚的技术,准确率达到了 92.31%,而在《基于机器视觉的猪胴体背膘厚度在线检测技术》中通过算法改进,检测时间达到了0.3s,准确率达到了93.5%。其峰值准确率略高于本文方法实现的网络模型的平均性能。但其研究中的图片位置需要人工进行精确框选,如果框选区域不够准确或图片拍摄存在失误则判断准确率将受到极大的影响。目前仍无法大规模应用于实际生产中。
  张萌的《基于机器视觉的生猪瘦肉率无损检测技术研究》一文中,介绍了通过拍摄活体生猪图片后,经过图片处理方法和拐点检测算法获得生猪图片中的特定测量点,通过获取测量点数据,结合前人总结的腿臀比、背膘厚、眼肌面积与瘦肉率的关系,将数据输入RBF神经网络模型进行训练,利用训练好的网络模型对生猪的标准化图像进行瘦肉率预测,在小规模数据集内,准确率达到了94.5%。其研究与本文的研究针对对象不同,与生猪具有明显的外形特征不同,猪胴体的整体单侧图像的特定测量点选择通过图像算法很难进行准确获取。仅因其作为近年来发表的利用传统图像算法和浅层神经网络相结合实现瘦肉率预测的研究,特选择其进入对比组。
  而在实际的生产加工中,目前猪肉加工企业采用的是人工目视分级的方法。令专业的工人两名分别站立在猪肉加工生产线两侧,两人交替对沿传送链输送而来的经过一系列加工的猪胴体成品进行检测,在检测过程中,由于生猪胴体生长的均衡性,只对每只生猪分成的两半胴体中的一个进行分辨。每个猪胴体从开始检测到给出评判并手动记录的完整检测时间约为十秒,而根据对猪肉加工企业的实际调研,工作人员对猪胴体的分级准确率标准为“八九不离十”即可录用,设其检测的准确率为八成与九成的均值85%。同时,猪胴体专业检测员在上岗前也需要一定时间的专业培训,在实际上岗后的一个月内采用的是师傅带徒弟式的搭配工作方式,故掌握目视胴体分级方法的培训时间为一个月以上。
  本文采用的CNN-P网络模型与前人利用传统图像学及浅层学习方法实现的猪胴体图像分级方法的效果以及实际生产中人工目视分级的方法进行对比如表4.7所示。

表4.7  本文CNN-P与前人利用非深度学习方法的效果比较
  彭彦昆研究 张萌研究 本文CNN-P模型 企业使用方法
使用方法 传统图像处理(改进的Hough)算法 传统图像处理浅层神经网络 卷积神经网络 人工目视估测
针对目标 猪胴体图像 活体生猪图像 猪胴体图像 猪胴体
使用者训练要求 高(需要准确选择猪胴体特定局部位置拍摄,须杜绝各类干扰因素) 中(须将生猪赶至专用采样台拍摄图像) 低(只需会朝向猪胴体方向拍照即可) 高(须一个月以上的培训期,并须老员工指导)
检测准确率 峰值准确率93.5% 无分离测试集94.5% 纯测试集平均92.7% 约85%
检测时间 0.3s(已处理完成的图片输入模型学习的时间) 无相关描述 0.9s(从拍照到检测完成,结果记录完毕) 10s
数据预处理内容 多次包括Canny检测及Hough检测等需要占用较长时间的图像处理 图像二值化、Canny检测、拐点截取等 图像压缩、图像截取两个占用内存极少的图像处理方法
总结 准确率稍高但自动化程度较低,且对操作人员的技术水平有交稿要求 准确率高但并不是针对流水线环境,与本文针对目标不同 准确率与识别速度较高,更适合流水线作业要求。对操作人员技术水平要求低,是深度学习在该领域的初次尝试 准确率低、识别时间长,对工作人员技术水平要求高
  通过比较,可见本文的方法虽然单纯在准确率方面略低于彭彦昆利用传统图像处理方法手动选择识别区域的研究结果,但本文中的实验是针对未接受过训练的纯测试集部分进行的,同时利用多组实验的平均准确率相比彭研究中的峰值准确率差距不到1%,其研究与本研究相比并不具有实际优势。本文提出的CNN-P具有对猪胴体图像识别的自动性,无需人为添加预选框,相比其他研究的方法在使用情况中有明显的优势,更适合于实际生产的使用,同时本次研究是将深度学习方法应用于猪胴体图片分级技术中的首次尝试,随着更加深入的研究,网络模型将更稳定、性能更佳。
  4.6  本章小结
  本章构建了基于AlexNet卷积神经网络模型,通过使用TensorFlow机器学习框架,对构建的网络模型进行了一系列实验,对实验结果进行研究,分析了网络中各参数和网络结构对猪胴体图像分级的影响。从卷积核数量及大小;池化层数、池化方法和池化大小;卷积层及全连接层数量;激活函数及dropout使用几方面对网络模型进行了实验与分析,通过实验结果逐步确定网络模型的优化方向,对原始的网络模型进行调参和优化,设计完成最终的猪胴体图像分级网络模型。将猪胴体图像数据集的训练集部分应用于该模型进行训练,通过测试集对训练所得模型进行评估,与前人的相关研究进行了多方面的对比。
  第5章  结论
  本次研究,出发点是利用近年来快速发展的深度学习技术解决由于进口检测设备价格高、市场要求偏低导致的国内猪胴体分级情况普遍不严谨的问题。作为国内外利用深度学习方法从图像方面解决在猪胴体分级(瘦肉率检测)问题的首次尝试,本文再一次证明了深度学习理论在图像分类方面强大的泛用性。
  研究采集了猪肉加工企业生产线中的猪胴体图像,对采集的图像进行平移、镜像、增加噪音等操作,并通过SMOTE算法对少数样本类进行了扩充,以此构建了猪胴体图像分级信息数据集。构建以AlexNet网络模型为蓝本,构建网络模型,利用猪胴体数据集对网络进行训练并对网络性能进行分析与优化,通过对数据的分析,在模型参数选择方面获得了以下几点结论:
  (1)在网络的设置方面,理想情况下网络中的卷积层与池化层数量越多,图像识别的效果越好,考虑到硬件设备的限制,本文的CNN-P采用五个卷积层,其中第一、二、五层包含池化层。
  (2)在卷积层部分,卷积核的个数与尺寸对网络模型存在显著影响,卷积核个数增大、尺寸减小可以提升网络分类性能。CNN-P中第二到第四卷积层采用256-384-384的卷积核数量,在后四层卷积层中使用3×3尺寸的卷积核。第一、二、五卷积层中的池化操作中选择池化区域为3×3的尺寸,平衡了池化操作与网络整体的识别效果。同时由于受限于计算能力等方面的客观因素,对卷积核数量尺寸及池化效果的过度要求会极大地影响网络训练的效率与效果。
  (3)本文CNN-P网络模型在网络第七层也就是第二全连接层增加了dropout方法,一定程度上避免了过拟合情况的发生,提升了网络效果。
  针对以上几点结论,设计搭建了适用于猪胴体图像分级的卷积神经网络模型CNN-P。为验证其识别效果,使用猪胴体图像数据集中的测试集进行分级,分级效果达到92.7%。说明模型的训练效果较好,对猪胴体图像的分级问题具有较强的泛化能力。
  《完》
 
 
http://www.mpmpc.cn/news/show.php?itemid=34711
 
关注"肉食界"微信公众号
专注肉类纵横资源,服务于肉类全产业链的信息“复兴号”
[ ]  [ 打印 ]  [ 投稿 ]  [ 关闭 ]  [ 评论 ]  [ 返回顶部
 
 
免责与声明:

1. 转载本网内容,请注明来源“中国肉类机械网”,或与本网联系,违者将追究法律责任。

2. 本网转载编辑的内容,版权由原作者或资料提供方所拥有,本站不承担任何法律责任。

3. 如涉及内容、版权等问题,请在15日内与本网联系,我们将及时作出回应或删除相关内容并致歉!

4. 友情提醒:网上交易有风险,请买卖双方谨慎交易,谨防上当受骗!

5. 投稿与合作热线:010-88133989, E-mail:info@mpmpc.org


 
 
 
热点推荐
新闻排行
 
×关闭
http://www.xinglongjixie.com/
×关闭
http://www.mpmpc.cn/news/show.php?itemid=27579