Degradation-elimination rules and influences on aquatic ecosystems of arsenilic acid in simulating pond
-
摘要:目的
研究模拟池塘水生态系统中阿散酸在水体与底泥中的降解规律及对水生态功能的影响.
方法设立空白猪粪添加50、150和500 mg/L阿散酸的试验池,采集不同时间池中水及2 cm深处底泥样品,采用HPLC法测定阿散酸质量浓度,HG-AFS法测定总砷含量.
结果和结论阿散酸在水体和底泥中的降解时间随药物质量浓度的增大而延长,降解半衰期分别为3.73~16.04和35.17~61.27 d,而总砷在底泥中呈现由浅入深的沉降趋势且消减缓慢.各生态池用药后对其溶解氧(DO)、pH和初级生产力(P/R)、底泥碱性磷酸酶、过氧化氢酶以及全氮和全磷含量等指标进行定期检测.结果表明:阿散酸质量浓度≥150 mg/L对水生态系统可造成不可逆转的影响,高质量浓度阿散酸对过氧化氢酶活性产生明显的抑制作用,底泥全氮含量呈现“抑制-促进”变化过程,各质量浓度下全磷含量均出现下降且呈现浓度依赖性关系.
Abstract:ObjectiveIn this paper, by simulating the pond water ecosystem, degradation rule in water and sediment and the impact on aquatic ecosystem of arsanilic acid were studied.
MethodFour mini-aquatic pond ecosystems were established; the control was added 100 g pig manure and treated with different mass concentrations of 50, 150 and 500 mg/L of arsanilic acid. Samples of water and 2 cm-depth-sediment were taken. Arsanilic acid was determined by HPLC and the total arsenic contents were determined by HG-AFS.
Result and conclusionThe half-life of arsanilic acid increased with the extension of the delivery drug concentration in pond water and surface sediment, which was 3.73 to 16.04 d and 35.17 to 61.27 d, respectively, and the total arsenic showed a distinguished subsidence trend in sediment and degraded slowly. The values of dissolved oxygen(DO), pH, primary productivity(P/R), activities of sediment alkaline phosphatase and catalase, and the content of total nitrogen and phosphorus indicators were regularly detected. The results showed that 500, and 150 mg/L arsanilic acid could cause irreversibly detectable effects on the ponds. High mass concentration of arsanilic acid obviously inhibited catalase activities. The total nitrogen content of sediment showed an inhibition-promotion-change process, and all mass concentrations of the total phosphorus content declined and presented a concentration dependent relationship.
-
Keywords:
- arsanilic acid /
- aquatic ecosystem /
- degradation /
- ecotoxicity
-
随着深度学习的发展,基于机器视觉的视频分析技术逐步深入到牲畜养殖的各个领域[1-4]。其中通过机器智能感知来识别生猪行为特征并构建养殖可追溯系统成为当今研究的热点,并已在生猪行为识别[5]、体重监测[6]、健康衡量[7]、母猪发情预判[8]以及分娩控制[9]等领域取得不俗的研究成果。构建可追溯系统的核心步骤和经典难题是如何将生猪个体从猪舍场景中分离出来。生猪轮廓包含了猪体尺寸、猪蹄形状等身份信息,这些信息对区分生猪个体至关重要,因而可通过轮廓提取的方式分离猪舍环境下的生猪个体。当前机器视觉算法在人脸轮廓检测领域已经得到广泛应用[10-12],因此,探讨如何基于图像处理技术进行高精度生猪个体轮廓提取以提高识别自动化程度和精度,并进一步提高计算机视觉算法在生猪行为分析研究领域的实用性,成为有待解决的问题。
基于机器视觉的生猪个体轮廓分割研究在诸多方面已经取得了较大进展。目前生猪分割算法主要分为静态图像分割、动态图像分割以及其他分割算法。常见的静态图像分割方法有分水岭分割、边缘检测分割、阈值分割等。如孙龙清等[13]结合交互分水岭算法,提出基于改进Graph cut算法的生猪图像分割方法。朱伟兴等[14]提出基于伪球边缘像素提取、低计算代价的猪只前景帧检测法,但该方法前景提取依据边缘点的概率,无法保证检测到前景的完整边缘像素点,所得的边缘轮廓并不适合做后继目标形状分析。动态图像分割方法有背景差分法、帧差法和光流法等,如:Guo等[15]基于复杂场景中群养生猪视频序列特征,提出一种基于MoG的背景差分法获取猪只目标区域,但其对处于前景与背景相差不大场景下的生猪个体轮廓分割效果并不理想;刘波等[16]将生猪红外热图像和光学图像相结合,提出了一种基于非子采样轮廓波的图像融合算法,用于改善生猪异常检测中的前景轮廓提取;马丽等[17]提出联立生猪外接矩形高宽比和低频傅里叶系数构建猪只侧视图的特征向量的方法,能够从猪舍监控视频中自动分割猪只,但猪只外接矩形框对原始轮廓比较敏感,该研究未考虑卧姿的轮廓对理想侧俯视图的干扰。除此之外,随着卷积神经网络在人脸轮廓提取方面的成功运用[18],探讨其用于动物个体轮廓分割领域成为可能。传统卷积神经网络(Convolutional neural network,CNN)由卷积层、池化层、全连接层以及Softmax分类器组成[19],如常见的AlexNet[20]、VGG[21]、GoogleNet[22]等网络。图像经过一系列的卷积、池化及全连接操作后,映射成固定长度的特征向量,最终将其输入分类器中来识别图像所属类别。但这些网络模型在全连接层铺展过程中破坏了图像空间维度结构,丢失了大量灰度级信息,较难实现语义级的图像分割。而全卷积神经网络[19](Fully convolutional networks,FCN)在卷积神经网络的基础上,通过反卷积层替代全连接层的方式对最终卷积层的Feature map进行上采样操作,有效保留图像空间维度信息,能够对图像进行灰度级分类,进而实现图像分割。杨阿庆等[23]以VGG16为基础网络,设计哺乳母猪分割的FCN,实现对猪舍场景下哺乳母猪的准确、快速分割。赵凯旋等[24]结合帧间差值法与卷积神经网络,在提取出奶牛粗略轮廓的基础上实现奶牛个体身份识别。然而目前面向生猪个体的基于卷积神经网络的机器视觉技术,主要关注生猪个体在复杂环境下的提取问题,而对生猪个体轮廓提取问题研究甚少。
基于此,本文提出了一种基于计算机视觉算法的非接触、低成本的生猪轮廓提取方法,在生猪真实养殖环境下,利用视频中图像序列样本量充足这一特点,基于人脸轮廓提取算法结合生猪个体特征,研究并提出了基于视频分析与全卷积神经网络的生猪个体轮廓提取模型。该模型通过结合VGG16与UNET网络构建,实现对猪舍环境下生猪轮廓精确提取,能有效分离视频帧中的生猪个体轮廓,避免猪舍、猪粪等噪声对后续识别效果的影响。
1. 材料与方法
1.1 数据采集
本文VGG-UNET模型采用的数据集来自于JDD-2017京东金融全球数据探索者大赛提供的30个视频文件,每个文件对应猪舍场景下的1头长白生猪个体,时长均约为1 min,在确保每张图中仅包含1头生猪个体的基础上,分别从每个视频中随机截取5张帧图,最终得到30头生猪共150张大小为1 280×720像素的初始数据集图片。为减少模型训练占用内存,本文将1 280×720像素图裁剪为320×160大小,考虑到裁剪前后图片宽高像素比不同的特点,对原图高度像素进行微量收缩,经该步处理前后生猪个体胖瘦虽发生细微变化,但并不影响后期模型试验效果。
如图1所示,为丰富数据集,对裁剪后的150张320×160像素的图片分别随机进行旋转、平移、调色度、亮度、遮光、缩放、加入椒盐噪声扰动等图像增强操作以扩充数据样例,其中旋转角度、亮度级别、遮光部位以及缩放比例等操作均随机选取对应数值以保证生成图片的随机性。经该步处理后,每张图片分别生成24张扩充样例,筛选其中11到13张变换效果较好的样例,最终得到1 815张图片,其中30头生猪各自包括55~65张图片。由于本文VGG-UNET模型仅用于提取生猪轮廓,并不关注猪只类别信息,因此即使在模型数据集中每头生猪对应图片数量不均衡也并不影响本试验效果。最终将扩充前后的数据作为本文模型输入数据集,并分为训练集1 158张,验证集296张以及测试集361张。以1头生猪帧图为例,对其进行数据增强操作后结果如图1图像增强部分所示。经旋转操作后,生猪个体在图片中所处空间位置发生明显变化,这有利于模型对不同拍摄角度、不同空间位置的生猪轮廓有效抽取。经平移操作后,生猪个体部分部位移出图片空间区域,这有利于提升模型对不包含生猪某些部位轮廓提取精度,避免模型过分依靠生猪某些部位或某些特点进行轮廓提取。经色度调节、亮度、遮光以及加入椒盐噪声等图像增强操作,有利于模型提取光线较弱、包含生猪背影以及图片像素不高等复杂条件下的轮廓信息。对生猪个体进行缩放操作,有利于模型提取不同胖瘦状态下的生猪轮廓,避免生猪随生长周期导致体型变化而影响提取精度。
在得到模型输入数据集的基础上,考虑到全卷积神经网络训练是有监督的学习过程,因此需要手动标注模型的输出数据,即手动提取图片中的生猪轮廓部分用于模型输出。同时由于本文VGG-UNET模型仅用于提取生猪的轮廓部分,因此无需对生猪图片进行分类标签化处理,只需抠取出每张图中生猪部位即可。为此,本文对经上述图像增强操作得到的数据集进行下面2步预处理操作,以得到数据集的真实输出:
1)利用MAC系统自带的Pixelmator软件抠取出经图像增强操作后的1 815张图片中的生猪个体部分,经抠取操作之后祛除了图片中的猪舍等背景信息,保留了图片中的生猪个体。该步操作如图1中生猪抠取部分所示,从中可看出,经该步操作后,生猪个体部位被有效抠取出来。
2)为减少模型训练时间并保留猪体重要轮廓信息,本文对上一步处理获得的猪体部分像素值进行归一化操作。将三色通道值均除以255,所得的值大于0.5则将该通道值替换为1,所得值小于等于0.5则将该通道值替换成0,最终可视化结果如图1归一化部分所示,从中可发现用于区分猪只个体信息与其他背景信息的猪耳、猪嘴及猪蹄等部位经该步处理后比较突出。
经上述预处理操作后,整个数据集共包含1 815张320×160像素的图片,将其用于模型输入以及Pixelmator软件抠取,并经过归一化处理后得到1 815张仅包含生猪个体轮廓信息的图片,将这些图片用于模型输出。此外上述预处理操作部分虽是在长白生猪数据集上进行的,但在整个操作过程中并未刻意考虑生猪品种信息,因此同样适用于诸如黑毛猪、宁乡花猪等品种的生猪个体预处理过程。
1.2 猪舍环境下生猪轮廓提取VGG-UNET模型
考虑到猪舍环境下的生猪图片帧中包含猪粪、猪食、猪栏等非生猪个体信息,而这些信息在灰度级上存在较大差异,因而可通过语义分割的方式将生猪轮廓从噪音环境中提取出来,为此本文基于VGG16与UNET[25]网络结构提出了VGG-UNET全卷积神经网络模型。
VGG-UNET模型基于VGG16和UNET网络主要思想并对其进行了一定优化。VGG16模型通过反复堆叠3×3的小型卷积核和2×2的最大池化层构建16层深的卷积神经网络,被广泛用于提取图像特征。UNET是基于FCN的语义分割网络,共包括23个卷积层,主要用于医学细胞领域的图像分割。本文通过迁移VGG16网络已训练好的模型参数并结合UNET结构构建VGG-UNET混合模型,充分利用2个模型的优势,最终结构如图2所示。
图 2 VGG-UNET网络结构图图中conv 3×3,relu中conv表示卷积操作,3×3表示卷积核大小,relu表示激活函数;conv 1×1,sigmoid中conv表示卷积操作,1×1表示卷积核大小,sigmoid表示激活函数;up-conv 2×2中up-conv表示反卷积操作,2×2表示反卷积核大小;max pool 2×2中maxpool表示最大池化操作,2×2表示池化核大小;layer output表示当前卷积层级输出;merge表示融合与上采样层处于同一层的下采样层输出操作Figure 2. Diagram of the VGG-UNET network structure该模型由编码层、解码层及FIN-CONV层(最终卷积层)3个部分组成,模型输入和输出图像均为320×160像素,输入猪舍场景下的生猪个体图片,输出为图片中的生猪轮廓部分信息。
从图2可知,编码层由VGG16[21]网络的前10层构成,将这10层进一步划分为4层,每层进行2~3次不等卷积操作,卷积操作间通过引入dropout层以防止模型参数过多造成过拟合。每次卷积操作的卷积核大小均为3×3,编码部分层与层间通过max-pooling池化操作衔接,池化窗口大小设置为2×2。随着网络层数递增,卷积核通道每经过1次池化操作均翻倍,直到等于512为止。考虑到本文训练集较小的特点,通过迁移学习VGG16已训练好的前10层模型参数初始化编码层卷积核参数,在加速模型收敛的同时增强了模型的泛化能力。随着网络的深入,编码层对输入的表示越来越抽象,但具有更高的维度特征表示,对图像的表征能力越来越强。经编码层处理后,图像缩小为原图的1/16。解码层基于UNET模型结构与ResNet网络思想构建,共包括4层,每层同样进行2~3次不等卷积操作,卷积操作间设置dropout层,卷积核大小均为3×3,随着解码层深入,卷积核通道数逐渐减小,这与编码层卷积通道数变化规律正好相反。层与层间通过upsampling操作衔接,对于upsampling操作,传统的全卷积神经将图像经过层层映射,只对最终映射结果进行上采样以此得到与输入大小相同的图像,在此过程中忽略了映射中间层的输出信息,而这些信息对于图像具有一定的表征能力。解码层借助ResNet残差网络思想,通过构建复制通道的方式将映射中间层信息与对应解码层进行特征融合,使得浅层上下文信息能够传播到更高的分辨率层,将深层抽象特征与浅层特征组合起来以定位图像灰度级类别信息。FIN-CONV层进行2次卷积操作,卷积核大小分别为3×3与1×1,卷积核个数均为3,经过在FIN-CONV层操作后,图像恢复到与输入相同的维度。
从图2中可看出,本文编码层即下采样部分共包括4层,从上至下分别表示1~4层,各层均采用3×3大小卷积核,第1层卷积核个数为64,随着层数递增,每层卷积核个数呈现递增趋势,下一层卷积核个数是上一层卷积核个数的2倍,最终第4层卷积核个数增加为512个。本文解码层即上采样部分同样包括4层,整个网络模型从下至上分别表示1~4层,各层同样采用3×3大小卷积核,第1层卷积核个数为512,随着层数递增,每层卷积核个数呈现递减趋势,下一层卷积核个数是上一层卷积核个数的一半,直至第4层卷积核个数减小为64。经过编码层与解码层后,紧跟FIN-CONV层,分别执行2次个数为3、卷积核大小为3×3卷积操作,提取出输入图片的轮廓部位。
VGG-UNET通过构建复制通道的方式分层提取高低阶图像特性,保证最终输出图像中包含原图的上下文信息。该模型在下采样部分实现4层卷积操作,通过每层包含不同大小卷积核的方式分层提取图像中生猪个体部位信息,通过下采样操作可定位图片中的生猪个体部分,但无法获取其轮廓信息。随后的上采样部分实现4层反卷积操作,通过构建复制通道方式将映射中间层信息与对应解码层进行特征融合,在该过程中可逐步分层提取生猪轮廓,上层充分融合下层轮廓提取结果,最终得到完整生猪轮廓。
1.3 模型结果评价指标
采用图像分割领域公认的4种语义分割评价指标评估模型分割结果。评测指标分别是像素精度(Pixel accuracy,PA)、均像素精度(Mean pixel accuray,MPA)、均交并比(Mean intersection over union,MIoU)以及频权交并比(Frequency weighted intersection over union,FWIoU),各指标的定义如下[26]:
$$ {\rm PA} = \displaystyle\frac{{\displaystyle\sum\nolimits_{i = 0}^k {{p_{_{{ii}}}}} }}{{\displaystyle\sum\nolimits_{i = 0}^k {\displaystyle\sum\nolimits_{j = 0}^k {{p_{_{{ij}}}}} } }}, $$ (1) $$ {\rm MPA} = \displaystyle\frac{1}{{k + 1}}\displaystyle\sum\limits_{i = 0}^k {\displaystyle\frac{{{p_{_{{ii}}}}}}{{\displaystyle\sum\nolimits_{j = 0}^k {{p_{{_{ij}}}}} }}} , $$ (2) $$ {\rm MIoU} = \displaystyle\frac{1}{{k + 1}}\displaystyle\sum\limits_{i = 0}^k \displaystyle\frac{{p_{{}_{ii}}}} {\displaystyle\sum\nolimits_{j = 0}^k {p_{{}_{ij}}} + \displaystyle\sum\nolimits_{j = 0}^k {p_{{}_{ji}}} - {p_{{}_{ii}}}}, $$ (3) $$ {\rm FWIoU} = \displaystyle\frac{1}{{\displaystyle\sum\nolimits_{i = 0}^k {\displaystyle\sum\nolimits_{j = 0}^k {{p_{{_{ij}}}}} } }}\displaystyle\sum\limits_{i = 0}^k {\displaystyle\frac{{{p{_{ii}}}}}{{\displaystyle\sum\nolimits_{j = 0}^k {{p_{_{{ji}}}} - {p_{{_{ii}}}}} }}} , $$ (4) 式中,pij表示本属于类i但被预测为类j的像素数量,k+1表示类别数,本文k取1。PA表示标记正确的像素占总像素的比例,能够反映分割灰度级的准确性,而MIoU指标表示真实值与预测值像素间的交集和并集之比,能充分反映分割区域完整性和分割位置准确性,这2种指标常用于衡量图像语义分割的效果,本文生猪轮廓提取为图像语义分割中的子问题,因而本文将PA及MIoU值作为模型最终的评价指标分别用于评价模型对生猪图像中每个像素点的预测情况以及生猪轮廓部位提取完整程度。
1.4 试验参数设置
将数据集分为训练集、验证集及测试集3个部分,其中训练集大小为1 158,验证集大小为296,测试集大小为361。为避免内存溢出,采取批训练方式对UNET和VGG-UNET模型在训练集和验证集上设置6组对比试验,6组试验对应每个批次分别训练4、6、8、10、12和14张图片,即6组试验的训练批和验证批大小均分别设置为4、6、8、10、12和14。遍历1次全部训练集数据称为1轮迭代,即1轮迭代会遍历所有训练集数据,而并不仅仅是1个批次数据,因此1轮迭代真正遍历的图片集大小为1 158,以第1组试验为例,该组试验的批大小设置为4,则1轮迭代需要执行290个批次。经过前期试探性测试发现,模型可能会在第15轮附近收敛,因而本文将迭代设置为15×2轮(即30轮),每轮迭代完成后在测试集上计算“1.3”节中定义的各个模型评价指标值。采用keras中对数损失函数binary_crossentropy作为代价函数。为解决反向传播过程中梯度消失和爆炸问题,引入批规范化,对网络隐藏层输入进行标准化。为加快模型收敛速度以获得最优模型参数,迁移学习已训练好的VGG16模型参数初始化VGG-UNET模型下采样部分参数,并在迭代过程中fine-tuning微调参数。此外为防止过拟合,引入keras中的EarlyStopping机制,当训练集在连续迭代5轮loss值不再减小时停止训练。为提高调参效率,采用自适应矩阵估计算法(Adaptive moment estimation,Adam)[27]优化模型,初始学习率设置为0.000 1。为保存最优模型参数,引入keras中的ModelCheckpoint机制,每轮迭代完成之后,通过观察验证集准确率是否发生提升决定是否保存当前模型。最终将保存的模型结构及参数用于后续生猪轮廓提取预测。
2. 结果与分析
2.1 相同批大小下 VGG-UNET 与 UNET 模型对比
图3展示了2种模型在测试集上6组对比试验中每轮迭代完成后的PA指标值,每幅图对应一组对比试验,不同组试验间除了批大小选取不同外,其余试验参数设置完全相同。表1选取2种模型在测试集上6组对比试验中试验效果较佳的3组(即批大小设置为4、6、8)计算其经30轮迭代后的平均评测指标PA、MPA、MIoU以及FWIoU值。
表 1 不同批大小下模型性能比较Table 1. The performance comparison of models with different batch sizes模型 批次 PA MPA MIoU FWIoU UNET 4 0.934 3 0.868 0 0.846 4 0.860 7 6 0.932 7 0.863 8 0.849 3 0.858 1 8 0.883 9 0.857 2 0.817 9 0.838 9 VGG-UNET 4 0.940 3 0.877 6 0.864 2 0.866 5 6 0.941 8 0.874 1 0.864 9 0.864 1 8 0.943 2 0.885 1 0.866 0 0.851 5 如表1所示,VGG-UNET模型PA、MPA、MIoU和FWIoU最优情况下分别达到94.32%、88.51%、86.60%和86.65%,比UNET模型最优情况分别高出0.89%、1.71%、1.67%和0.58%,且在反映分割区域完整性和分割位置准确性的MIoU指标上性能提升较大。可得出本文提出的VGG-UNET网络模型明显优于UNET模型,这是由于VGG-UNET模型在下采样部分迁移已训练好的VGG16模型参数进行fine-tuning以得到最佳参数值,上采样部分借助UNET网络框架和ResNet残差思想,构建复制通道分层提取高低阶图像特征所致,说明VGG-UNET模型结构能够充分提取图像轮廓特征。
在VGG-UNET模型下,模型的衡量指标值变化趋势与批大小间存在一定关系。在PA、MPA和MIoU方面,批次8比批次4分别高出0.29%、0.75%和0.18%,比批次6分别高出0.14%、1.10%和0.11%。但在FWIoU指标方面,批次4能达到最佳效果。说明批大小的选取对模型性能评价指标值变化的影响程度不同。对某些评价指标,批大小选取越大,指标值越高,但对于部分评价指标,指标值的高低与批大小选取间并不存在正比关系。这可能是由于指标计算的侧重点不同导致的。PA指标更侧重像素级准确率,其值是标记正确的像素占总像素的比例。MPA作为PA的升级版,计算的是所有类别上的均像素精度,一般情况下,这2个指标间的数值随着批大小的变化呈现相同的变化规律。但对于MIoU指标值,更侧重的是计算分割区域完整性和分割位置准确性,其值反映的是预测结果像素值与真实测定像素值间交集与并集的比值,FWIoU指标作为MIoU指标的提升,其变化规律理应与MIoU相近,但该指标在MIoU指标的基础上加入权重参数,而该权重参数的取值与预测出的图像轮廓占整个图像的比例有关,因而可能会导致其变化规律与MIoU不一致的现象发生,这点也符合本文的试验结果。
从图3可探讨批大小对模型收敛速度的影响。对于同一种模型,理论上批越大,处理相同数据集所需迭代次数越少,达到相同精度所需要的迭代次数将增多,相应收敛速度将放缓。但在本试验环境下,批大小对迭代收敛速度的影响程度并不是很大。VGG-UNET模型在批大小为6的情况,迭代至第13轮时触发了EarlyStopping机制,提前结束了整个训练过程。而在批大小为4、8情况下,分别在第12、14轮趋于收敛,三者收敛速度相差无几,出现这种情况可能是由于本文设置的批大小间相差不是很大所致,但总体收敛需要的迭代次数会随着批大小选取增大而增加,因而批大小对模型收敛速度的影响具有一定研究价值。
2.2 不同批大小条件下VGG-UNET模型试验结果分析
为纵向衡量批大小对VGG-UNET模型性能的影响,图4绘制了其在测试集上不同批大小(在此同样选取试验效果较佳情况即批大小为4、6、8)下每轮迭代的PA及MIoU指标值。
如图4a所示,对于VGG-UNET模型,不同批大小情况下每轮迭代过程中PA指标值变化呈现不同特点。批大小为6时,迭代开始时PA较小,但随着迭代深入,PA逐渐趋于稳定,并在第13轮迭代时触发EarlyStopping机制,即模型在第13轮前面的5轮训练中其loss值不再减小,提前结束训练。而批大小为4或8时,其PA在整个30轮训练过程中最初呈现较大波动现象,但随着迭代的深入,均维持在相对稳定的状态,模型均能够在30轮迭代次数内收敛。说明VGG-UNET模型在不同批大小情况下均能保证较强稳定性和较高鲁棒性。如果将PA大小也考虑在内,可发现,从第14轮迭代开始,批大小等于8的PA开始高于批大小为4时的数值,因而在综合考虑模型稳定性与像素级准确率两方面,VGG-UNET模型在批大小为8的情况下效果最佳。
如图4b所示,对于VGG-UNET模型,不同批大小情况下每轮迭代过程中MIoU指标值变化呈现不同特点。在批大小为6的条件下其值与PA呈现出相似的变化规律,最初迭代开始时,MIoU均小于批大小为4和8时的数值,但随着迭代的深入,其迅速在第13轮触发EarlyStopping退出机制而收敛。而批大小为4或8时,随着迭代的深入,虽未触发EarlyStopping机制,但基本处于稳定状态,并从第15轮迭代开始,批大小等于8的MIoU虽然出现震荡情况,但其值普遍高于批大小为4时的数值。综合考虑图4a、4b可发现,对于VGG-UNET模型,相同批大小条件下,迭代过程中PA与MIoU呈现出一致的变化规律。原因在于PA与MIoU间虽侧重点不同,但本身存在一定的关联,两者结合更能反映模型的性能。
综合上述相同批大小条件下VGG-UNET与UNET 2种模型指标值对比以及不同批大小条件下VGG-UNET模型性能状况对比结果分析,本文得出批大小为8情况下的VGG-UNET模型能够取得所有对比试验中最佳的效果,因而该条件下的模型将作为后续模型中间层可视化与模型预测结果可视化分析使用的模型。
2.3 VGG-UNET模型中间层可视化
为进一步探讨模型隐藏层学到的特征,该部分以经“1.1”节试验数据预处理后得到的数据集中的1张生猪图片为例,对VGG-UNET模型下采样部分的卷积层与上采样部分的反卷积层学习到的知识进行可视化展示,最终结果如图5所示。
从图5可看出下采样部分的CONV1与CONV2层主要学到的是边缘轮廓、亮度等底层特征,CONV3层学习到一些诸如纹理等有区别性的特征,而CONV4层的特征具有更低的空间分辨率,无法通过肉眼直接判断出图片中是否存在生猪个体。即随着网络的深入,获取的图像越模糊,提取的特征越抽象,但区别于其他图像的特征越明显。对于上采样部分,UP1层获取的图像较为模糊,无法具有肉眼辨识性,经过4次上采样操作后,其表征结果逐渐明显。由此可得出上采样与下采样互为逆过程,下采样层数越深,特征抽取越抽象,而上采样层数越深,图像越清晰,特征抽取越明显。上述两部分的最终输出经FIN-CONV层3个1×1卷积核操作后,实现了对前述过程卷积输出的降维操作。通过对每个像素点在不同通道上进行线性组合,保留了图像的原有平面结构。最终将3个通道信息进行线性合并得到模型输出部分。
2.4 VGG-UNET模型预测结果可视化分析
为进一步分析模型在不同输入情况下的预测效果,本文采用“2.2”节分析得出最佳模型,即批大小设置为8的VGG-UNET模型对测试集图片数据进行生猪轮廓提取,部分预测结果可视化后如图6所示。
图6中a、b和c组预测效果较好,d、e和f组预测效果较差。从图6a、6b和6c可看出,本文提出的模型对于侧身生猪轮廓提取效果较好,且模型能够排除人体、猪栏、光线强弱以及其他非生猪个体的干扰。对于背朝镜头或者不存在头部信息的生猪个体如图6d和6e所示,本文的提取效果不太理想,这可能是由于这2种情况下的生猪个体不包含能区别于生猪与其他事物的特点信息所致。对于粘连猪个体如图6f所示,VGG-UNET模型能够抠取出其中较大的生猪个体轮廓,但对于个体较小的生猪提取效果不佳,这也是下一步研究需要解决的问题。
3. 结论
本文提出一种基于全卷积神经网络的生猪轮廓提取VGG-UNET模型,以探讨具有更强实际应用能力的生猪轮廓提取方法。主要结论如下:
1)为量化模型准确率,计算VGG-UNET模型在测试集上的各指标值。试验结果表明,对于PA与MIoU指标VGG-UNET模型比单独采用UNET模型最优条件下高出0.89%和1.67%。证明模型对于生猪轮廓提取具有较高准确率,可为实际生猪个体轮廓抽取提供参考。
2)为探讨批大小与模型预测指标值变化趋势间的关系,选取在VGG-UNET模型上效果最佳的3组结果进行探究。结果表明,模型的衡量指标值变化趋势与批大小间存在一定关系,但不同指标值变化情况与批大小间的关系不尽相同。
3)为探究批大小对模型收敛速度的影响,选取在VGG-UNET上试验效果最佳的3组结果进行分析。结果表明,在本文试验条件下,批大小对模型收敛速度影响不大。但批大小对模型收敛速度的研究具有一定价值,这也是下一步需要研究的内容之一。
4)通过探究VGG-UNET模型不同批大小情况下每轮迭代过程中PA及MIoU指标值变化规律,得出该模型具有较强稳定性和较高鲁棒性,能够在提高准确率的同时保证模型收敛。并得出在批大小为8的情况下,本文提出的VGG-UNET模型效果最佳。
因此,本研究提出的进行生猪轮廓提取的方法是有效的,其提取的生猪个体区域细节完整,轮廓清晰,有较高稳定性和鲁棒性,可为下一步生猪个体身份识别提供有益参考。不足之处在于:一方面,本文模型对于背朝镜头生猪及粘连猪个体轮廓提取效果不太理想,另一方面本文针对批大小影响模型收敛速度方面研究欠妥,但这并不影响模型的实用性,在下一步研究工作中可适当深入探讨这两部分内容。
致谢:由衷感谢JDD-2017京东金融全球数据探索者大赛为本文提供数据支持!
-
表 1 各生态池水中和底泥中阿散酸的降解动力学参数
Table 1 Pharmacokinetic parameters of degradation of arsanilic acid in all ecological pools
表 2 底泥中总砷降解动力学参数
Table 2 Pharmacokinetic parameters of degradation of total arsenic in sediment
-
[1] 刘强, 但堂胜.从生态效益出发及早禁用含砷药物作为畜禽促生长剂[J].兽药饲料添加剂, 1997(3):25-27. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=QK199700536422 [2] 罗雪莲, 李轲, 陈超, 等.阿散酸在猪体内的药动学与生物利用度研究[J].中国兽医科学, 2011, 41(10):1076-1079. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=QK201102788026 [3] OVERBY L R, FREDRICKSON R L. Metabolism of arsanilic acid:Ⅱ: Localization and type of arsenic excreted and retained by chickens[J]. Toxicol Appl Pharmacol, 1965, 7(6):855-867. doi: 10.1016/0041-008X(65)90012-8
[4] OVERBY L R, STRAUBE L. Metabolism of arsanilic acid: Ⅰ: Metabolic stability of doubly labeled arsanilic acid in chickens[J]. Toxicol Appl Pharmacol, 1965, 7(6):850-854. doi: 10.1016/0041-008X(65)90011-6
[5] 鲍士旦.土壤农化分析[M].北京:中国农业出版社, 2000. [6] 关松荫.土壤酶及其研究法[M].北京:农业出版社, 1986. [7] 曾婧. 我国部分猪场砷污染调查及阿散酸在猪鸡饲后的排泄规律研究[D]. 广州: 华南农业大学, 2010. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y1765385 [8] 张树清, 张夫道, 刘秀梅, 等.规模化养殖畜禽粪主要有害成分测定分析研究[J].植物营养与肥料学报, 2005, 11(6):822-829. doi: 10.3321/j.issn:1008-505X.2005.06.019 [9] 李银生, 曾振灵, 陈杖榴, 等.2种含砷兽药对蚯蚓的急性毒性试验[J].中国兽医学报, 2005, 25(4):425-426. doi: 10.3969/j.issn.1005-4545.2005.04.031 [10] 贝荣塔, 王乐, 郑才庆, 等.污染底泥砷解析规律研究[J].现代农业科技, 2010(6):279-281. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=ahny201006175 [11] GARBARINO J R, RUTHERFORD D W, WERSHAW R L. Degradation of roxarsone in poultry litter[C/OL]//Anon. The proceedings of arsenic in the environment workshop. [2013-10-01]. http://search.usa.gov/search?affiliate=usgs&utf8=%E2%9C%93&query=+Degradation+of+Roxarsone+in+Poultry+Litter%3A&commit=Search.
[12] WOOLSON E A. The persistence and chemical distribution of arsanilic acid in three soils[J]. J Agric Food Chem, 1975, 23(4):677-681. doi: 10.1021/jf60200a016
[13] 荆红卫, 许嘉琳, 杨居荣.砷污染土壤的作物效应及其影响因素[J].土壤, 1996(2):85-89. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=QK199600818095 [14] 王力平, 杨居荣, 任燕, 等.砷对土壤微生物及土壤生化活性的影响[J].土壤, 1996(2):101-104. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=QK199600537478 [15] 陈静, 方萍.土壤-植物系统中磷和砷相互作用关系的研究进展[J].四川环境, 2010(6):118-121. doi: 10.3969/j.issn.1001-3644.2010.06.026 [16] 杨四坤, 祖艳群, 李元, 等.丘北辣椒种植区土壤中砷和磷的含量及其相互关系[J].农业环境科学学报, 2010(S1):84-88. http://d.old.wanfangdata.com.cn/Periodical/nyhjbh2010z1017 [17] 何念祖, 史建华, 林玉胜.砷和铅对土壤酶活性的影响[J].环境科学学报, 1987, 7(4):498-502. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=QK000001366679 [18] ZANTUA M I, BREMNER J M. Stability of urease in soils [J]. Soil Biol Biochem, 1977, 9(2):135-140. doi: 10.1016/0038-0717(77)90050-5