• 《中国科学引文数据库(CSCD)》来源期刊
  • 中国科技期刊引证报告(核心版)期刊
  • 《中文核心期刊要目总览》核心期刊
  • RCCSE中国核心学术期刊

基于Swin-Unet的奶牛饲料消耗状态监测方法

张博, 罗维平

张博, 罗维平. 基于Swin-Unet的奶牛饲料消耗状态监测方法[J]. 华南农业大学学报, 2024, 45(5): 754-763. DOI: 10.7671/j.issn.1001-411X.202404003
引用本文: 张博, 罗维平. 基于Swin-Unet的奶牛饲料消耗状态监测方法[J]. 华南农业大学学报, 2024, 45(5): 754-763. DOI: 10.7671/j.issn.1001-411X.202404003
ZHANG Bo, LUO Weiping. Feed consumption status monitoring method of dairy cows based on Swin-Unet[J]. Journal of South China Agricultural University, 2024, 45(5): 754-763. DOI: 10.7671/j.issn.1001-411X.202404003
Citation: ZHANG Bo, LUO Weiping. Feed consumption status monitoring method of dairy cows based on Swin-Unet[J]. Journal of South China Agricultural University, 2024, 45(5): 754-763. DOI: 10.7671/j.issn.1001-411X.202404003

基于Swin-Unet的奶牛饲料消耗状态监测方法

基金项目: 国家自然科学基金(62103309);湖北省数字化纺织装备重点实验室开放课题(DTL2022001)
详细信息
    作者简介:

    张 博,硕士研究生,主要从事计算机技术在农业工程中的应用研究,E-mail: zhangbowust@163.com

    通讯作者:

    罗维平,教授,硕士,主要从事计算机技术在农业工程中的应用研究,E-mail: l_wp1@163.com

  • 中图分类号: S24;TP391

Feed consumption status monitoring method of dairy cows based on Swin-Unet

  • 摘要:
    目的 

    针对监控图像中饲料区域结构较长、边界模糊,且形状与尺寸复杂多变等特点,本研究旨在更准确地分割饲料残余区域与消耗区域,以达到准确监测饲料消耗状态的目的。

    方法 

    本研究提出了基于Swin-Unet的语义分割模型,其在Swin Transformer块的开始阶段应用ConvNeXt块,增强模型对特征信息的编码能力,以提供更好的特征表示,并利用深度卷积替换线性注意力映射,以提供局部空间上下文信息。同时提出了新颖的宽范围感受野模块来代替多层感知机,以丰富多尺度空间上下文信息。此外在编码器的开始阶段,将线性嵌入层替换为卷积嵌入层,通过分阶段压缩特征,在块之间和内部引入更多的空间上下文信息。最后引入多尺度输入策略、深度监督策略,并提出了特征融合模块,以加强特征融合。

    结果 

    所提出方法的平均交并比、准确率、F1分数与运行速度分别为86.46%、98.60%、92.29%和23帧/s,相较于Swin-Unet,分别提高4.36、2.90、0.65个百分点和15%。

    结论 

    基于图像语义分割的方法应用于饲料消耗状态的自动监测是可行的,该方法通过将卷积引入Swin-Unet,有效地提高了分割精度与计算效率,对提升生产管理效率具有重要意义。

    Abstract:
    Objective 

    In view of the characteristics of the feed area in the monitoring image, which has a long structure, fuzzy boundaries, as well as complex and changeable shapes and sizes, the aim of this study was to more accurately segment the feed residual area and consumption area, and achieve the purpose of accurately monitoring the feed consumption status.

    Method 

    This study proposed a semantic segmentation model based on Swin-Unet, which applied ConvNeXt block at the beginning of the Swin Transformer block to enhance the model’s ability of encoding feature information to provide better feature representation. The model used depth-wise convolution to replace linear attention projection to provide local spatial context information. At the same time, a novel wide receptive field module was proposed to replace the multi-layer perceptron to enrich multi-scale spatial context information. In addition, at the beginning of the encoder, the linear embedding layer was replaced with a convolutional embedding layer, which introduces more spatial context information between and within patches by compressing features in stages. Finally, a multi-scale input strategy, a deep supervision strategy and a feature fusion module were introduced to strengthen feature fusion.

    Result 

    The mean intersection over union, accuracy, F1-score and operation speed of the proposed method were 86.46%, 98.60%, 92.29% and 23 frames/s respectively, which were 4.36, 2.90, 0.65 percentage points and 15% higher than those of Swin-Unet.

    Conclusion 

    It is feasible to apply the method based on image semantic segmentation to the automatic monitoring of feed consumption status. This method effectively improves the segmentation accuracy and computing efficiency by introducing convolution into Swin-Unet, which is of great significance for improving production management efficiency.

  • 水稻直播栽培技术便于实现机械化,具有降低劳动强度,缓解农时,节本增效等优点[1-3],随着人们对水稻直播理念的深入了解[4],水稻直播机在各地得到广泛推广。但现有的机械式水稻直播机大多采用镇压轮传动播种,这种播种方式普遍存在一些不足:镇压轮易于裹草堵转,导致漏播;播量靠手动调节且控制精度低;无法实时依据机具车速变化自动调节播种量;自动化程度较低。目前国内外针对播种机播量调节已有一些相关研究,国外直播装备研究和运用起步较早,基本实现自动化、智能化作业[5],如LEMKEN公司生产的Saphir系列播种机通过配备电脑控制终端Easytronic系统,可以预设播种量并对播种量、施肥量进行校对,可完成多种作物播种;日本矢崎公司生产了一种直接配套插秧机进行播种作业的SYG-8型水稻直播机,播种量、穴距可精准调节,但该机具作业效率较低,价格高昂,使其推广受到限制。国内现有水稻直播机的研究主要集中在机械结构的设计改进以及关键部件的参数优化[6-8],未能从根本上解决镇压轮传动播种导致的漏播以及播种量无法同步均匀调节问题。

    本文以现有苏南地区机械式水稻播种机为基础,设计了一种基于PID控制算法[9-11]的水稻直播机播量控制系统。该系统可以在线无极调节排种量,实现排种转速的闭环控制,达到同步播种目的,提高播量控制精度,为现有的水稻直播机播量自动化改造提供了一种可靠途径。

    播量控制系统工作原理如图1所示。播种作业时,通过电位器设定目标播量,结合安装在测速轮上的编码器采集实时机具车速以及排种转速,计算出排种目标转速;同时安装在排种轴上的编码器实时检测排种轴转速;决策系统将目标播量、机具车速、排种转速作为控制系统的输入量,得到当前排种器的转速控制量,然后通过PID调速算法使控制器输出相应PWM波[12-13],再经过放大调理后,驱动排种电机在线调节排种转速,实现同步排种作业。

    图  1  控制原理结构图
    Figure  1.  Schematic diagram of control principle

    单位面积上的播种量[Q(t)]可以表示为[14-15]

    $$ Q(t) = \frac{{0.06q(t){{n}}}}{{L v(t)}}, $$ (1)

    式中, q(t)为单个排种器播种量,g/min;n为播种行数;L为排种通道所能覆盖的作业幅宽,m;v(t)为机具作业车速,km/h;0.06是各变量单位换算产生的系数;q(t)和排种电机转速(ɑ)的标定公式为:

    $$ q(t) = ka + b, $$ (2)

    式中, kb是标定试验测定系数。根据目标播种量,排种电机转速和机具车速之间关系可以表示为:

    $$ a = \frac{{Q(t) L v(t)}}{{1\,000k{{n}}}} - \frac{b}{k}{\text{。}} $$ (3)

    根据公式(3),机具车速发生变化时,控制器可以同步调整排种轴转速,确保实际单位面积排种量与目标播种量一致。

    针对江苏丹阳欣田机械制造有限公司生产的2BFGK-12型播种机进行自动化改造,改造后的播种机结构简图如图2所示。自动化改进保留了机械式播种开沟、旋耕、播种、镇压等功能,重点改进了排种驱动方式,将链轮传动改为直流电机驱动,排种轴下方种箱内侧安装直流电机驱动,通过链轮驱动排种轴,播种行数为12行,机具宽度230 mm,取消地轮与排种轴连接的链式结构;设计增加了一种铁质测速轮,直径为400 mm,测速轮表面均匀布设15个防滑齿[16],抓地性良好,且具有单铰链仿行机构,弹簧支杆上方每隔20 mm开调节孔位1个,共计10个,可以通过开口销调节弹簧压缩长度,减缓测速轮对地弹跳,提高测速准确度;弹簧压杆上方安装行程开关,抬起机具可断停排种电机,防止重播;通过轴套分别在排种轴和地轮安装2个编码器用于测量排种轴转速和机具车速;播量可按需无极调节,简化了播量调节方法,可实现同步播种。

    图  2  播种机结构图
    Figure  2.  Seeder structure diagram

    控制系统按照模块化设计思路,由速度采集、人机交互、执行机构、主控单元等主要模块组成,如图3所示。排种控制系统设计手动和自动2种模式:手动模式可转动旋钮调节播量;自动模式下,控制系统可依据设定机具前进速度与播种量的比例系数,在线调节排种转速。数码管采用三段式设计,分别显示机具车速、播量档位、排种转速。速度采集模块采用2个编码器测速,分别采集排种转速和机具车速,信号经过A/D转换发送主控器STC12C5A60S2单片机[17]。驱动电路采用拖拉机12 V电源供电,控制电路经L7805稳压芯片输出5 V供电,强弱电分离,提高电路板稳定性与可靠性,控制系统主控原理图如图4

    图  3  控制系统硬件结构框图
    Figure  3.  Hardware structure diagram of control system
    图  4  控制系统原理图
    Figure  4.  The circuit diagram of control system

    1)测速模块:编码器是把角位移或直线位移等非电量信号转换为电量信号的装置[18],安装于具有单铰链仿行机构的测速轮,实时检测机具行进速度,产生脉冲信号经过调理电路将脉冲信号放大并滤掉杂波,确保输出标准方波。选用欧姆龙增量式编码器E6B2-CWZ6C,旋转1周输出600脉冲数,该编码器具有构造简单、性能稳定,测量精度高等优点[19]。编码器采样频率为5 Hz,对每5个采样脉冲数据进行均值滤波,输出1 Hz速度控制信号,提高了测量速度的精度与稳定性。采用一个0.2 μF电容滤除采样信号过程中的杂波,并对LM358放大器进行保护。

    试验中设计直径为400 mm的测速轮模拟拖拉机后轮,播种机测速轮的转速与脉冲频率的关系为:

    $$ N = \frac{{60{{f_0}}}}{{ZM}}, $$ (4)

    式中,Z表示编码器每转输出的脉冲个数;f0为准时钟的脉冲频率,Hz;M为编码器2个脉冲之间的时钟脉冲的个数。

    2)直流电机驱动模块:直流电机工作时需要驱动12个排种槽轮,为了提高电路板驱动性能,设计了二极驱动电路单元,双NPN型三极管组合构成达林顿管,提升了SSF7509增强型MOS管[20]驱动电流,有效提高了驱动效率,最大漏极电流达60 A,漏源击穿电压为80 V,漏源导通电阻为6.5 mΩ。PWM信号经驱动模块调理运算控制排种电机,为提高驱动模块可靠性与稳定性,对MOS管电路铜箔表面走锡处理,形成3 mm的焊锡导线,增大有效走线截面,提高电路板载荷电流,驱动模块电路图如图5

    图  5  直流电机驱动电路图
    Figure  5.  Driving circuit diagram of DC motor

    3)人机交互模块:人机交互模块由按键、播量旋钮和数码管组成。74HC595驱动3个2位1.42 cm的共阴极数码管[21],将串行信号转为并行信号,分别显示拖拉机速度(km/h)、播量档位、排种轴转速(r/min);电源芯片实现了DC12 V与DC5 V的电压转换,排种轴控制模式可手动自动切换,按键输出端与P0.5引脚相连,高电平为自动模式、低电平为手动模式,墒情较为严重时,可选用手动模式,确保播种效果,人机交互电路图如图6

    图  6  人机交互电路图
    Figure  6.  Circuit diagram of human-computer interaction

    排种器转速控制本质是一个直流电机控制系统,测速轮转速作为系统输入量,输出量为排种槽轮转速。在忽略微小电感的情形下[22],可将该排种器驱动电机看成经典的一阶系统,其传递函数是一个典型积分环节和惯性环节串联[23]

    $$ G(s) = \frac{{1/2\pi {C_{\rm e}}}}{{s\left(\displaystyle\frac{{{J_{\rm a}}{R_{\rm a}}}}{{{C_{\rm e}}{C_{\rm t}}}}s + 1\right)}}, $$ (5)

    式中,G(s)是原函数经过拉普拉斯变换后的复函数表达式;Ce为电动势常数,由电动机结构参数确定;Jɑ为电动机转子转动惯量;Rɑ为电动机电阻;Ct为电磁力矩常数,由电动机结构参数确定;s为复频率。

    选用邦瑞公司生产的5D90-12GU直流电机,电机参数为Ce=12.04, Jɑ=4×10–5 kg·m2, Rɑ=6Ω, Ct=0.115 N·m/A,代入式(5)得:

    $$ G(s) = \frac{{8.69}}{{s(0.642s + 1)}}{\text{。}} $$ (6)

    本研究选用PID控制器模型,被控对象由排种电机、电机驱动器、执行机构组成。PID控制系统输入信号Nin,Sin为经PID控制器输出的最佳转速控制量,Nout为排种轴的作业转速;控制器执行过程中,编码器实时监测测速轮和排种轴转速,并将转速信号输入到控制系统中,与最佳转速控制量形成偏差(e),经PID调节器输出相应的控制量来调节排种转速,实现播量在线无极调节,达到控制目标。PID控制器与电机数学模型、负反馈控制量组成闭环控制系统,其传递函数近似于二阶惯性环节,通过与标准惯性环节比较取PID参数:kp=15.216 2,ki=0.319 3,kd=1.012 1,PID控制系统结构图如图7

    图  7  PID控制系统结构图
    Figure  7.  Structure diagram of PID control system

    电机空载下,测试控制器变速调节电机转速响应变化效果,排种轴转速选取农户常用播种量对应的3个转速,分别为20、30和40 r/min,测试控制系统启动后的电机响应转速数据曲线如图8,性能参数如表1所示。结果表明:控制系统在目标转速40 r/min下超调量最大,不同转速下的调整峰值时间差距较小,整体调整时间低于0.63 s,响应及时。

    表  1  空载响应试验数据
    Table  1.  The experimental data of no-load response
    转速/(r·min–1)
    Speed
    超调量/%
    Overshoot
    峰值时间/s
    Peak time
    调整时间/s
    Adjusted time
    20 7.66 0.24 0.38
    30 8.02 0.29 0.54
    40 8.21 0.33 0.63
    下载: 导出CSV 
    | 显示表格
    图  8  不同目标转速下电机空载转速响应曲线
    Figure  8.  The response curve of motor velocity without load under different target speeds

    传统播种机由于制造工艺和加工精度的差异,致使相同槽轮的排种轴阻力差距较大,对控制系统带负载能力要求较高。依据排种轴扭矩标准[24],12行以下播种机扭矩不大于10 N·m,通过磁负载装置给电机施加7.5、10.0和12.5 N·m负载,测试控制系统带负载能力及负载变化的调节能力,记录排种电机实时转速值及驱动电路负载电流。变负载响应曲线如图9所示。施加负载7.5 N·m时,电机瞬时转速回落较小,转速回调时间短,随着负载增大,电机瞬时转速回落逐渐增大,调整时间延长,当负载12.5 N·m时,转速瞬间下降了23.5%,控制系统迅速响应,系统转速回调时间为0.32 s,最大负载电流为6.5 A,大负载作业条件下控制系统工作稳定,性能可靠,为控制系统适配不同播种机提供了理论依据,带负载性能测试如图10所示。

    图  9  施加不同负载的电机转速曲线
    Figure  9.  The curve of motor speed under different loads
    图  10  负载性能试验台
    Figure  10.  Test platform of load performance

    排种转速控制精度对于播种效果起关键作用,为了综合测试播种机性能,开展了排种转速及播量控制精度田间试验(图11)。试验地点位于南京高淳禾田家庭农场,田间秸秆留茬高度18.5 cm,秸秆含水率(w)21.2%,秸秆切碎长度13.5 cm,秸秆量6 725.6 kg/hm2。土壤状况如表2所示,试验品种为‘南粳46’。设计机具车速和目标播量两因素三水平试验,依据苏南地区农户实际播种要求,选取试验机具车速为0.8、1.2和1.6 m/s,目标播量为7.50、11.25和15.00 g/m2。水稻直播机有效播种幅宽2.3 m,由久保田754拖拉机牵引,播种作业距离140 m(田块长约70 m)视为1次试验,记录排种轴实时转速、机具车速、实际播量,每个目标播量重复2次试验,取平均值为最终数据,结果见表3表3的结果表明,3种目标播量下的转速最大误差分别为6.73%、6.59%和7.21%,转速误差平均值分别为4.67%、4.92%和5.31%,对比传统播种机最大控制误差24.54%和平均控制误差17.08%[23],本系统控制精度显著提高;目标播量15.00 g/m2时,机具车速提升后转速误差平均值降低较为明显且播量误差显著降低,说明本控制系统在较高车速和较高目标播量下,控制效果更好;播种机整机转速控制精准,能满足实际需求,在不同的测试条件下,播量控制系统性能稳定。

    图  11  田间试验图
    Figure  11.  Field experiment chart
    表  2  田间土壤状况
    Table  2.  Soil condition in field
    土壤深度/cm
    Soil depth
    容重/(g·cm−1)
    Density
    含水率(w)/%
    Water content
    坚实度/MPa
    Firmness
    0~5 1.32 23.41 0.43
    5~10 1.45 20.26 0.86
    10~15 1.53 18.96 1.23
    下载: 导出CSV 
    | 显示表格
    表  3  不同目标播量下田间试验的控制精度
    Table  3.  Control accuracy of speed and seeding amount in field under different target seeding amounts
    播量/(g·m−2)
    Seeding amount
    机具车速/(m·s−1)
    Vehicle speed
    转速最大误差/%
    Max. speed error
    转速误差均值/%
    Average speed error
    播量误差/%
    Seeding amount error
    7.50 0.8 6.73 4.67 3.86
    1.2 4.96 3.62 3.91
    1.6 4.13 2.74 3.66
    11.25 0.8 6.59 4.92 3.25
    1.2 5.81 3.83 2.76
    1.6 5.34 2.32 2.12
    15.00 7.21 5.21 3.96 7.21
    5.68 3.54 2.52 5.68
    4.08 1.63 1.04 4.08
    下载: 导出CSV 
    | 显示表格

    机具行驶作业速度变化时需要排种轴快速同步响应,为测试播量控制系统排种同步性,设计了田间阶梯车速播种试验。选取目标播量11.25 g/m2,测试机具行驶速度在0.8~1.6 m/s范围内阶梯变化,实时记录排种轴转速和车速,田间排种车速同步跟随效果如图12图12的结果表明,田间播种车速变化时排种转速响应及时,具有较高的排种同步性,说明本研究设计改造的排种驱动机构和PID控制算法的引入措施起到了关键性的作用。

    图  12  排种车速同步跟随图
    Figure  12.  Synchronization follow map of seeding speed

    对传统水稻直播机进行自动化改造,重点改进了播量调节机构,并设计了配套的播量控制系统,简化播量调节方式。控制系统引入PID控制策略,并且建立了相应的传递函数,针对设计目标播量下的转速范围内,排种电机空载转速最大超调量为8.21%,转速调整最大时间为0.63 s,电机负载状况下最大回调时间为0.32 s,最大负载电流6.5 A, 控制系统响应迅速,满足实际播种需求。

    田间试验转速最大误差为7.21%,最大转速误差均值5.31%,最大播量误差为3.96%,播种机整机转速控制精度较传统播种机显著提高,田间播种车速变化时排种转速响应及时,具有较高的排种稳定性和同步性,实现了同步播种作业,提高了传统播种机播种性能。

    该控制系统自动化改造简便,对传统机械直播机具有较高适配性,为现有的机械式播种机低成本播量自动化改造提供了思路。

  • 图  1   ISwin-Unet的总体框架

    Figure  1.   Overall framework of ISwin-Unet

    图  2   FCST块的结构

    Figure  2.   The structure of the FCST block

    图  3   ConvNeXt块的结构

    k为卷积核的大小,s为步长,p为填充值的大小,H为特征图的高,W为特征图的宽,C为通道的维度

    Figure  3.   The structure of the ConvNeXt block

    k is the size of the convolution kernel, s is the step size, p is the size of the padding value, H is the height of the feature map, W is the width of the feature map, and C is the dimension of the channel

    图  4   WRF模块的结构

    Figure  4.   The structure of the WRF module

    图  5   DAC模块的结构

    rate为空洞卷积的空洞率

    Figure  5.   The structure of the DAC module

    Rate is the dilation rate of the atrous convolution

    图  6   卷积嵌入层

    k为卷积核的大小,s为步长,p为填充值的大小,H为特征图的高,W为特征图的宽,C为通道的维度

    Figure  6.   Convolutional embedding layer

    k is the size of the convolution kernel, s is the step size, p is the size of the padding value, H is the height of the feature map, W is the width of the feature map, and C is the dimension of the channel

    图  7   特征融合模块

    Figure  7.   Feature fusion module

    图  8   饲料消耗情况分割结果图

    图b中红色区域为饲料残余区域,绿色区域为饲料消耗区域

    Figure  8.   Feed consumption segmentation result map

    The red area in figure b is the feed residual area, and the green area is the feed consumption area

    图  9   不同算法对4张测试图片的分割结果

    绿色区域表示饲料消耗区域,红色区域表示饲料残余区域

    Figure  9.   Segmentation results of different algorithms for four test pictures

    The green area represents the feed consumption area, and the red area represents the feed residual area

    表  1   不同模型的性能比较

    Table  1   Performance comparison of different models

    模型
    Model
    MIoU1)/%准确率/%
    Accuracy
    F1分数/%
    F1-score
    速度/(帧·s−1)
    Speed
    Unet[2]80.3797.7288.1525
    Attention Unet[9]81.7297.9389.1024
    Swin-Unet[15]82.1097.9589.3920
    TransUnet[11]83.2398.2290.1218
    Transfuse[12]84.8198.4091.2017
    nnFormer[18]85.5098.4991.6715
    ISwin-Unet86.4698.6092.2923
     1) MIoU为平均交并比
     1) MIoU is the mean intersection over union
    下载: 导出CSV

    表  2   添加不同模块对模型性能的影响

    Table  2   Effects of adding different modules on model performance

    方法
    Method
    模块1
    Module 1
    模块2
    Module 2
    模块3
    Module 3
    模块4
    Module 4
    模块5
    Module 5
    模块6
    Module 6
    模块7
    Module 7
    模块8
    Module 8
    F1分数/%
    F1-score
    MIoU1)/% 准确率/%
    Accuracy
    0 89.39 82.10 97.95
    1 90.27 83.42 98.07
    2 91.13 84.06 98.13
    3 91.39 85.54 98.26
    4 91.78 86.07 98.32
    5 91.96 86.15 98.38
    6 92.02 86.23 98.45
    7 92.16 86.33 98.52
    8 92.29 86.46 98.60
     1) MIoU为平均交并比
     1) MIoU is the mean intersection over union
    下载: 导出CSV
  • [1] 张玉磊, 乔泓博. 畜牧业发展方式及其未来发展趋势[J]. 科技风, 2023, 25: 161-163.
    [2]

    RONNEBERGER O, FISCHER P, BROX T. U-net: Convolutional networks for biomedical image segmentation[M]//Lecture Notes in Computer Science. Springer International Publishing, 2015: 234-241.

    [3]

    ZHOU Z W, RAHMAN SIDDIQUEE M M, TAJBAKHSH N, et al. UNet++: A nested U-net architecture for medical image segmentation[M]//Deep Learning in Medical Image Analysis and Multimodal Learning for Clinical Decision Support. Springer International Publishing, 2018: 3-11.

    [4]

    HUANG H M, LIN L F, TONG R F, et al. UNet 3+: A full-scale connected UNet for medical image segmentation[C]//2020 IEEE International Conference on Acoustics, Speech and Signal Processing. Barcelona, Spain: IEEE, 2020: 1055-1059.

    [5]

    SCHLEMPER J, OKTAY O, SCHAAP M, et al. Attention gated networks: Learning to leverage salient regions in medical images[J]. Medical Image Analysis, 2019, 53: 197-207. doi: 10.1016/j.media.2019.01.012

    [6]

    KAUL C, MANANDHAR S, PEARS N. Focusnet: An attention-based fully convolutional network for medical image segmentation[C]//2019 IEEE 16th International Symposium on Biomedical Imaging (ISBI 2019). Venice, Italy: IEEE, 2019: 455-458.

    [7]

    KAUL C, PEARS N, DAI H, et al. Focusnet++: Attentive aggregated transformations for efficient and accurate medical image segmentation[C]//2021 IEEE 18th International Symposium on Biomedical Imaging (ISBI 2021). Nice, France: IEEE, 2021: 1042-1046.

    [8]

    DOSOVITSKIY A, BEYER L, KOLESNIKOV A, et al. An image is worth 16 × 16 words: Transformers for image recognition at scale[EB/OL]. arXiv: 2010.11929 (2020-10-22) [2024-04-01]. https://doi.org/10.48550/arXiv.2010.11929.

    [9]

    OKTAY O, SCHLEMPER J, FOLGOC L L, et al. Attention U-Net: Learning where to look for the pancreas[EB/OL]. arXiv: 1804.03999 (2018-4-11) [2024-04-01]. https://doi.org/10.48550/arXiv.1804.03999.

    [10]

    PETIT O, THOME N, RAMBOUR C, et al. U-Net transformer: Self and cross attention for medical image segmentation[EB/OL]. arXiv: 2103.06104 (2021-03-10) [2024-04-01]. https://doi.org/10.48550/arXiv.2103.06104.

    [11]

    CHEN J, LU Y, YU Q, et al. TransUNet: Transformers make strong encoders for medical image segmentation[EB/OL]. arXiv: 2102.04306 (2021-02-08) [2024-04-01]. https://doi.org/10.48550/arXiv.2102.04306.

    [12]

    ZHANG Y D, LIU H Y, HU Q. TransFuse: Fusing transformers and CNNs for medical image segmentation[M]//Medical Image Computing and Computer Assisted Intervention-MICCAI 2021. Springer International Publishing, 2021: 14-24.

    [13]

    VALANARASU J M J, OZA P, HACIHALILOGLU I, et al. Medical transformer: Gated axial-attention for medical image segmentation[EB/OL]. arXiv: 2102.10662 (2021-02-21) [2024-04-01]. https://doi.org/10.48550/arXiv.2102.10662.

    [14]

    KARIMI D, VASYLECHKO S D, GHOLIPOUR A. Convolution-free medical image segmentation using transformers[M]//Medical Image Computing and Computer Assisted Intervention-MICCAI 2021. Springer International Publishing, 2021: 78-88.

    [15]

    CAO H, WANG Y Y, CHEN J, et al. Swin-Unet: Unet-like pure transformer for medical image segmentation[EB/OL]. arXiv: 2105.05537 (2021-05-12) [2024-04-01]. https://doi.org/10.48550/arXiv.2105.05537.

    [16]

    LIN A L, CHEN B Z, XU J Y, et al. DS-TransUNet: Dual swin transformer U-net for medical image segmentation[J]. IEEE Transactions on Instrumentation and Measurement, 2022, 71: 1-15.

    [17]

    HUANG X, DENG Z, LI D, et al. MISSFormer: An effective medical image segmentation transformer[EB/OL]. arXiv: 2109.07162 (2021-09-15) [2024-04-01]. https://doi.org/10.48550/arXiv.2109.07162.

    [18]

    ZHOU H Y, GUO J, ZHANG Y, et al. nnformer: Interleaved transformer for volumetric segmentation[EB/OL]. arXiv: 2109.03201 (2021-09-07) [2024-04-01]. https://doi.org/10.48550/arXiv.2109.03201.

    [19]

    WANG H Y, XIE S, LIN L F, et al. Mixed transformer U-Net for medical image segmentation[EB/OL]. arXiv: 2111.04734 (2021-11-08) [2024-04-01]. https://doi.org/10.48550/arXiv.2111.04734.

    [20]

    TRAGAKIS A, KAUL C, MURRAY-SMITH R, et al. The fully convolutional transformer for medical image segmentation[C]//2023 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV). Waikoloa, HI, USA: IEEE, 2023: 3660-3669.

    [21]

    LIU Z, LIN Y T, CAO Y, et al. Swin transformer: Hierarchical vision transformer using shifted windows[C]//2021 IEEE/CVF International Conference on Computer Vision (ICCV). Montreal, QC, Canada: IEEE, 2021: 10012-10022.

    [22]

    LIU Z, MAO H Z, WU C Y, et al. A ConvNet for the 2020s[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New Orleans, LA, USA: IEEE, 2022: 11976-11986.

    [23]

    WU H P, XIAO B, CODELLA N, et al. Cvt: Introducing convolutions to vision transformers[C]//2021 IEEE/CVF International Conference on Computer Vision (ICCV). Montreal, QC, Canada: IEEE, 2021: 22-31.

    [24]

    GU Z W, CHENG J, FU H Z, et al. CE-net: Context encoder network for 2D medical image segmentation[J]. IEEE Transactions on Medical Imaging, 2019, 38(10): 2281-2292. doi: 10.1109/TMI.2019.2903562

  • 期刊类型引用(7)

    1. 朱士江,李虎,徐文,冯雅婷. 三峡库区土壤含水量对柑橘园果实品质的影响. 中国农业科技导报. 2023(06): 201-207 . 百度学术
    2. 余高,陈芬,田霞,卢心,滕明欢,谢婉莹. 冬季覆盖对幼龄柑橘园土壤化学性质及酶活性的影响. 河南农业科学. 2023(09): 91-101 . 百度学术
    3. 同晓蕾,豆攀,张伯虎,问亚军,闫苗苗. 旱地果园生草栽培技术研究进展. 黑龙江农业科学. 2021(02): 127-131 . 百度学术
    4. 黄玉杰,唐明明,刘道纯. 覆草和浇水量对桃树幼苗生长及土壤温湿度的影响. 经济林研究. 2021(01): 184-190 . 百度学术
    5. 高海英. 果园生草对土壤和果树影响的试验研究. 乡村科技. 2021(20): 62-64 . 百度学术
    6. 高鹏,谢家兴,孙道宗,陈文彬,杨明欣,周平,王卫星. 基于物联网和LSTM的柑橘园土壤含水量和电导率预测模型. 华南农业大学学报. 2020(06): 134-144 . 本站查看
    7. 李运珍,谢永旺,邹彬. 浅析沃柑的引种栽培管理技术. 农村科学实验. 2019(13): 47+49 . 百度学术

    其他类型引用(3)

图(9)  /  表(2)
计量
  • 文章访问数:  554
  • HTML全文浏览量:  20
  • PDF下载量:  18
  • 被引次数: 10
出版历程
  • 收稿日期:  2024-03-31
  • 网络出版日期:  2024-07-02
  • 发布日期:  2024-07-07
  • 刊出日期:  2024-08-07

目录

/

返回文章
返回