• 《中国科学引文数据库(CSCD)》来源期刊
  • 中国科技期刊引证报告(核心版)期刊
  • 《中文核心期刊要目总览》核心期刊
  • RCCSE中国核心学术期刊

基于无人机高光谱遥感的柑橘患病植株分类与特征波段提取

邓小玲, 曾国亮, 朱梓豪, 黄梓效, 杨佳诚, 童泽京, 殷献博, 王天伟, 兰玉彬

邓小玲, 曾国亮, 朱梓豪, 等. 基于无人机高光谱遥感的柑橘患病植株分类与特征波段提取[J]. 华南农业大学学报, 2020, 41(6): 100-108. DOI: 10.7671/j.issn.1001-411X.202006042
引用本文: 邓小玲, 曾国亮, 朱梓豪, 等. 基于无人机高光谱遥感的柑橘患病植株分类与特征波段提取[J]. 华南农业大学学报, 2020, 41(6): 100-108. DOI: 10.7671/j.issn.1001-411X.202006042
DENG Xiaoling, ZENG Guoliang, ZHU Zihao, et al. Classification and feature band extraction of diseased citrus plants based on UAV hyperspectral remote sensing[J]. Journal of South China Agricultural University, 2020, 41(6): 100-108. DOI: 10.7671/j.issn.1001-411X.202006042
Citation: DENG Xiaoling, ZENG Guoliang, ZHU Zihao, et al. Classification and feature band extraction of diseased citrus plants based on UAV hyperspectral remote sensing[J]. Journal of South China Agricultural University, 2020, 41(6): 100-108. DOI: 10.7671/j.issn.1001-411X.202006042

基于无人机高光谱遥感的柑橘患病植株分类与特征波段提取

基金项目: 国家自然科学基金(61675003);广东省重点领域研发计划(2019B020214003);广东高校重点领域(人工智能)专项(2019KZDZX1012);广东大学生科技创新培育专项(pdjh2019b007)
详细信息
    作者简介:

    邓小玲(1978—),女,副教授,博士,E-mail:dengxl@scau.edu.cn

    通讯作者:

    兰玉彬(1961—),男,教授,博士,E-mail: ylan@scau.edu.cn

  • 中图分类号: TP79; S436.66

Classification and feature band extraction of diseased citrus plants based on UAV hyperspectral remote sensing

  • 摘要:
    目的 

    结合传统与现代农业病虫害监测的优缺点,探索通过无人机高光谱遥感技术检测出患病的柑橘植株、通过人工田间调查方式判断其患病种类及患病程度的病虫害监测方法。

    方法 

    使用无人机获取原始高光谱图像,经过光谱预处理和特征工程后,采用连续投影算法提取对柑橘患病植株分类贡献值最大的特征波长组合,基于全波段使用BP神经网络和XgBoost算法、基于特征波段使用逻辑回归和支持向量机算法,建立分类模型。

    结果 

    基于全波段的BP神经网络和XgBoost算法的ROC曲线下面积(Area under curve,AUC)分别为0.883 0和0.912 0,分类准确率均超过95%;提取出698和762 nm的特征波长组合,基于特征波长使用逻辑回归和支持向量机算法建立的分类模型召回率分别达到了93.00%和96.00%。

    结论 

    基于特征波长建模在患病样本分类中表现出很高的准确率,证明了特征波长组合的有效性。本研究结果可为柑橘种植园的病虫害监测提供一定的数据和理论支撑。

    Abstract:
    Objective 

    Combined with the advantages and disadvantages of traditional and modern agricultural pest monitoring, the method of monitoring pest and disease were discussed, which detected the diseased citrus plants by UAV hyperspectral remote sensing technology and judged the disease species and disease degree by artificial field investigation.

    Method 

    The original hyperspectral images were obtained by UAV. After spectral preprocessing and feature engineering, continuous projection algorithm was used to extract the feature wavelength combination which contributed the most to the classification of citrus diseased plants. Finally, the BP neural network and XgBoost algorithm were used based on the full band, and the logistic regression and support vector machine algorithm were used to establish the classification model based on the characteristic band.

    Result 

    The AUC scores of BP neural network and XgBoost were 0.8830 and 0.9120 respectively, and the accuracy rates of both methods were over 95%. The feature wavelength combination of 698 and 762 nm was extracted. Based on this characteristic band, the recall rates of logistic regression and support vector machine algorithm were 93.00% and 96.00% respectively.

    Conclusion 

    The model based on characteristic band shows high accuracy in the classification of disease samples, which proves the effectiveness of characteristic wavelength combination. This result can provide some data and theoretical support for monitoring diseases and pests in citrus plantations.

  • 手性识别是一种特殊的分子识别,在生命活动过程中起着极其重要的作用。研究发现,由于构型的不同,氨基酸在生命体内进行信号转导、调节代谢通路及蛋白质合成等许多生理过程中的作用具有很大差异[1-4]。食品中D−色氨酸(D-tryptophan,D-Trp)难水解,转化成L−色氨酸(L-tryptophan,L-Trp)才可以被人体吸收,其含量增加会使蛋白质的消化性和蛋白质的营养价值显著降低,摄入过量D-Trp会引起中毒甚至危及生命[5]D-Trp的存在通常被认为是食品掺假或受到微生物污染的重要标志[6-7]。因而,食品中D-Trp的含量成为反映食品组成、生物功能及安全性的重要指标[8]。食品中氨基酸的手性识别和分离对于食品营养分析和质量控制具有十分重要的意义。

    分子印迹作为一种制备分子印迹聚合物的新型人工分子识别技术,近年来在氨基酸手性识别方面展现出越来越大的吸引力[9-10]。在分子印迹技术中,功能单体的选择至关重要。但是目前可供选择的功能单体大多局限于甲基丙烯酸、丙烯酰胺和乙烯基吡啶等[11-13],寻找新型功能单体对于开发高效的分子印迹手性识别材料具有重要意义。多巴胺(Dopamine,DA)最近被认为能很好地模拟贻贝黏附蛋白,因其具有羟基和氨基官能团,在碱性条件下氧化自聚合生成聚多巴胺(Polydopamine,PDA)[14-15]。PDA含有儿茶酚和氨基等官能团,所以具有化学多功能性和高亲和力[16-17]。受此启发,近年来DA成为了制备分子印迹聚合物新型功能单体的研究热点[18-20]

    研究分子印迹的预组装体系,尤其是预组装体系中模板−功能单体复合物之间的作用,对于提高分子印迹聚合物手性识别的亲和力具有重要的意义。目前研究模板与功能单体之间作用采用的分析方法一般为静态吸附法,而对机理的研究较少[21-22]。以Trp为模板,PDA为功能单体,关于两者间相互作用的研究鲜见报道。本文运用分子模拟法从不同角度考察PDA与L-Trp、D-Trp分子(结构如图1所示)之间的相互作用差异,以阐明PDA对色氨酸对映体手性选择的机理,对于更全面地了解手性识别的化学本质具有非常重要的作用。

    图  1  色氨酸对映体的结构图
    Figure  1.  Chemical structure of tryptophan enantiomers

    L-Trp、D-Trp、盐酸多巴胺(AR),均购自上海麦克林生化试剂公司;18.2 MΩ•cm超纯水由Milli-Q超纯水仪制取。

    在HyperChem软件中进行构象搜索,通过Conformation search模块,采用分子力学的方法和Random walk算法,搜索PDA四聚体可能的稳定构型。

    以具有最低能量结构的PDA四聚体为受体,色氨酸的2个对映体为配体,将L-Trp和D-Trp分别与PDA对接,得到L-Trp和D-Trp与PDA结合的可能构型,初步比较二者结合力的差异。对接研究在Autodock软件中进行,采用AutoDock tool删除非极性氢,加电荷,保存为pdbqt格式;L-Trp和D-Trp分子结构来源于ZINC数据库,同样删除结构中的非极性氢,加电荷,作为配体保存为pdbqt格式。分子对接的中心位于四聚体的中心,对接盒子大小60×60×60,其他设置均采用Autodock软件的默认值。分子对接结果保留25个能量最低的结合形式,并进行均方根偏差(Root mean square deviation,RMSD)为5 Å的聚类(Cluster)分析。

    L-Trp-PDA和D-Trp-PDA复合物最稳定构象的基础上,运用量子化学计算软件Gaussian 09,在密度泛函B3LYP方法6-31G*基组上,加上隐式的溶剂模型考虑水溶剂对复合物的影响,研究L-Trp、D-Trp与PDA之间的相互作用,优化各复合物的稳定构型,并计算结合能(ΔE)。ΔE按下式计算:

    $$ \Delta E = {E_{{\text{复合物}}}} - {E_{\rm Trp}} - {E_{{\rm{PDA}}}}, $$ (1)

    式中:E复合物为复合物能量,ETrp为色氨酸的能量,EPDA 为PDA的能量。

    采用Gaussian View软件绘图,在软件默认条件下获取轨道图像。

    目前,PDA的组成和分子结构还存在很多争议。Chen等[23]根据Kaxiras等[24]提出的黑色素模型,结合计算机模拟和PDA的形貌观测等试验结果,推断PDA为四聚体形式,结构式如图2所示。根据我们的初步试验,PDA对色氨酸的手性异构体有不同的吸附效果,从而推断直链状的多聚体结构不能产生手性异构体的差异识别;并且合成分子印迹聚合物过程中,PDA和色氨酸的摩尔浓度比接近1︰1,因此推断PDA的聚合度不会太高。本文以四聚体结构为基础,构建PDA四聚体的三维结构。四聚化的低聚物吡咯和苯环并联形成刚性的平面,聚合后的体系柔性较差,只存在苯环与相邻单体的吡咯环的顺反异构,因此定义两两相邻的苯环与吲哚之间的3个二面角为变量。PDA四聚体最稳定的结构如图3所示,分子力学能量为348.71 kJ/mol。用于构象搜索的3个二面角分别为152、169和171°。可见由于位阻效应,相邻单体的吲哚平面发生扭转,形成不对称的立体结构。

    图  2  PDA四聚体的结构式
    Figure  2.  Chemical structure of PDA tetramer
    图  3  PDA四聚体的三维结构
    Figure  3.  3D structure of PDA tetramer

    由分子对接结果可知,D-Trp与四聚体的最大结合能为5.3 kcal/mol,L-Trp与四聚体的最大结合能为5.7 kcal/mol,两者差异较小。聚类分析发现,结合位置差异大于5 Å为条件,D型的可以划分为2类,其中最稳定的位置有16个,另一类9个;L型的25种结合位置的差异都不超过5 Å,所以结合形式归为同一类。

    图4可以看出,2种色氨酸对映体的羧基均可与吲哚上的氨基氢形成较强的氢键,D型复合物(D-Trp-PDA)中存在色氨酸的羧基与四聚体的2个氢键作用,键长分别是1.8和2.2 Å;L型复合物(L-Trp-PDA)则存在3个氢键作用,键长分别为1.8、2.0和1.8 Å,这是因为L-Trp还可以通过氨基氢与PDA上的酚羟基氧形成氢键。因此可以推断,L-Trp与PDA的氢键作用强于D-Trp。

    图  4  色氨酸对映体与PDA四聚体结合示意图
    Figure  4.  Schematic diagram of tryptophan enantiomers binding to PDA

    由分子对接的结果可以发现,色氨酸与PDA的结合力以氢键作用为主。分子对接只是粗糙地把原子看成刚性的质点研究分子间的相互作用,没有考虑在水溶液条件下的影响,因此需要运用更加精确的量子化学手段从电子结构层面考察分子间的弱相互作用形式。

    通过量子化学计算发现,手性色氨酸分子与PDA结合形成的复合物在隐性水溶剂模型中可以稳定存在,与试验条件相吻合。表1列出了L-Trp、D-Trp、PDA和复合物的能量(E),并由式(1)计算2种复合物的结合能(ΔE)。结合能越低,表明形成的复合物越稳定[25]。从表1可知,色氨酸与PDA四聚体结合后,体系总能量大大降低,2种复合物是稳定的。L-Trp-PDA复合物能量降低得比D-Trp-PDA复合物多,但是差异不大,仅为约4.184 kJ/mol。

    表  1  模板分子、功能单体和复合物的能量和结合能1)
    Table  1.  Energies and binding energies of templates,monomers and complexes
    项目 Item E/a.u ΔE/a.u ΔE/(kJ·mol−1)
    D-Trp −686.169 1
    L-Trp −686.168 1
    PDA −2 052.865 5
    D-Trp-PDA −2 739.859 9 −0.825 3 −2 166.756 4
    L-Trp-PDA −2 739.860 5 −0.826 8 −2 170.870 5
     1) “…”表示不存在
     1) “…” represents nonexistent
    下载: 导出CSV 
    | 显示表格

    L-Trp分子除了羧基作为给体(提供孤电子对)形成2个氢键,色氨酸上的氨基氢作为受体(接受孤电子对)与酚羟基的氧原子还形成氢键。D型复合物中羧基氧的Mulliken电荷分别为−0.631和−0.575,L-Trp-PDA中羧基氧的Mulliken电荷分别为−0.604和−0.600。从静电分布(图5)可以看出,L-Trp-PDA的结合程度更高,因此氨基酸的羧基和氨基的静电荷分布趋向平均。

    图  5  复合物弱相互作用区域的静电荷分布示意图
    Figure  5.  Schematic diagram of electrostatic charge distribution in weak interaction zone of complex

    进一步运用前线轨道理论从微观电子结构层次上对手性色氨酸分子与PDA的预聚合反应机理进行分析。EHOMO为最高占据轨道能,其表征分子推电子的能力,EHOMO值越大,其推电子的能力越强;ELUMO为最低空轨道能,其表征分子吸电子的能力,ELUMO越小,其吸电子能力越强[26]。能级差ΔE′(ΔE′=ELUMOEHOMO)可以综合考虑电子得失的难易程度,估计复合物的稳定性和研究分子内的电子转移情况。ΔE′越小,则表征分子中电子越容易发生跃迁,复合物越不稳定;反之亦然。从表2可知,L-Trp-PDA复合物的能级差ΔE′比D-Trp-PDA复合物的大,说明L-Trp-PDA的电子不容易转移,比D-Trp-PDA更加稳定。

    表  2  复合物的前线轨道能级及能级差
    Table  2.  Frontier orbital energy and energy gap of complex eV
    复合物 Complex EHOMO ELUMO ΔE
    D-Trp-PDA −4.708 −1.072 3.636
    L-Trp-PDA −4.742 −1.028 3.714
    下载: 导出CSV 
    | 显示表格

    此外,从分子轨道的形状示意图(图6)可以发现,L-Trp的羧基和PDA四聚体的氨基氢有明显的轨道重叠,D-Trp-PDA复合物不存在轨道重叠。所以从轨道的相互作用角度也说明了L-Trp在电子结构层面上与PDA四聚体的弱相互作用比D型的大。

    图  6  复合物分子轨道形状示意图
    Figure  6.  Schematic diagram of molecular orbital shape of complex

    手性分子的识别一直是化学分离的一个难题,同时也是近年来研究的热点,机理的阐释对手性识别具有非常重要的指导作用。本文通过分子对接和量子化学方法,模拟了L-Trp、D-Trp分子与聚多巴胺四聚体之间的相互作用,从不同角度揭示了聚多巴胺四聚体对色氨酸对映体手性选择的机理。L-Trp、D-Trp分子与PDA主要通过氢键结合,这与Li等[27]的研究观点一致,PDA链上的氨基可以与色氨酸的羧基形成氢键。并且,L-Trp、D-Trp分子与PDA的氢键作用差异和前线轨道能级差的差异决定了PDA对色氨酸的手性选择性,这有待于进一步通过试验手段(如圆二色光谱法或表面等离子共振传感法等)研究分子间相互作用来佐证。

    总之,上述结果可为下一阶段分子印迹聚合物的合成提供理论支持,并为进一步将其应用到食品中色氨酸的手性识别奠定基础。分子模拟方法使用相对简便,计算速度快,在研究分子印迹手性识别机理以及分子印迹聚合物的设计和合成中具有良好的应用前景。

  • 图  1   试验区域及样本标注

    粉、红、蓝、黄、白圆圈标记分别代表1、2、3、4级和患病未定级的黄龙病植株,三角形标记为缺素植株;没有标记的植株为完全健康植株

    Figure  1.   Experiment area and sample marking

    The pink, red, blue, yellow and white circle markers represented the plants with Huanglongbing disease of grades 1, 2, 3, 4 and indefinite respectively, and the triangular markers represented the plants lacking in nutrients; The plants without markers were the complete healthy plants.

    图  2   特征工程技术路线图

    Figure  2.   The technology roadmap of feature engineering

    图  3   不均衡数据样本处理流程

    Figure  3.   The flow diagram of processing unbalanced data samples

    图  4   均方根误差(RMSE)曲线图

    Figure  4.   The curve of root mean square error(RMSE)

    图  5   特征波段示意图

    Figure  5.   Schematic diagram of feature band

    表  1   BP神经网络结构

    Table  1   The structure of BP neural network

    层(类型)
    Layer (Type)
    输入节点数
    Number of input node
    输出节点数
    Number of ouput node
    激活函数
    Activation function
    输入层(全连接) Input layer(Full connect) 125 32 ReLu
    隐含层1(全连接) Hidden layer 1(Full connect) 32 32 ReLu
    隐含层2(全连接) Hidden layer 1(Full connect) 32 16 ReLu
    输出层(全连接) Output layer(Full connect) 16 2 Sigmoid
    下载: 导出CSV

    表  2   BP神经网络和XgBoost测试结果(混淆矩阵)

    Table  2   The test results of BP neural network and XgBoost (Confusion matrix)

    模型 Model 项目 Item 预测为患病 Predicted illness 预测为健康 Predicted healthy 总计 Total
    BP神经网络
    BP neural network
    真实为患病 True illness 78 22 100
    真实为健康 True healthy 7 493 500
    总计 Total 85 515 600
    XgBoost 真实为患病 True illness 85 15 100
    真实为健康 True healthy 13 487 500
    总计 Total 98 502 600
    下载: 导出CSV

    表  3   特征波长下LR和SVM分类结果(混淆矩阵)

    Table  3   The results of LR and SVM test bases of feature bands(Confusion matrix)

    模型 Model 项目 Item 预测为患病 Predicted illness 预测为健康 Predicted healthy 总计 Total
    LR 真实为患病 True illness 93 7 100
    真实为健康 True healthy 44 456 500
    总计 Total 137 463 600
    SVM 真实为患病 True illness 96 4 100
    真实为健康 True healthy 61 439 500
    总计 Total 157 443 600
    下载: 导出CSV

    表  4   4种模型评估得分

    Table  4   The evaluation scores of four models

    评价指标
    Evaluating
    indicator
    全波段 Full-wave band 特征波段 Feature band
    BP Net XgBoost LR SVM
    ACC 0.951 7 0.953 3 0.915 0 0.891 6
    Recall 0.780 0 0.850 0 0.930 0 0.960 0
    Precision 0.917 6 0.867 3 0.678 8 0.611 5
    F1-score 0.843 8 0.858 5 0.784 9 0.747 1
    AUC 0.883 0 0.912 0 0.921 0 0.919 0
    下载: 导出CSV
  • [1]

    DENG X, LAN Y, HONG T, et al. Citrus greening detection using visible spectrum imaging and C-SVC[J]. Comput Electron Agr, 2016, 130: 177-183. doi: 10.1016/j.compag.2016.09.005

    [2] 陈波, 姚林建. 光谱检测技术在柑橘黄龙病诊断中的研究进展[J]. 赣南师范大学学报, 2018, 39(6): 69-72.
    [3] 兰玉彬, 邓小玲, 曾国亮. 无人机农业遥感在农作物病虫草害诊断应用研究进展[J]. 智慧农业, 2019, 1(2): 1-19.
    [4] 纪景纯, 赵原, 邹晓娟, 等. 无人机遥感在农田信息监测中的应用进展[J]. 土壤学报, 2019, 56(4): 1-13.
    [5] 黄文江, 张竞成, 师越, 等. 作物病虫害遥感监测与预测研究进展[J]. 南京信息工程大学学报(自然科学版), 2018, 10(1): 30-43.
    [6]

    LI X, LEE W S, LI M, et al. Spectral difference analysis and airborne imaging classification for citrus greening infected trees[J]. Comput Electron Agr, 2012, 83: 32-46. doi: 10.1016/j.compag.2012.01.010

    [7]

    KUMAR A, LEE W S, EHSANI R J, et al. Citrus greening disease detection using aerial hyperspectral and multispectral imaging techniques[J]. J Appl Remote Sens, 2012, 6(1): 63542. doi: 10.1117/1.JRS.6.063542

    [8] 兰玉彬, 朱梓豪, 邓小玲, 等. 基于无人机高光谱遥感的柑橘黄龙病植株的监测与分类[J]. 农业工程学报, 2019, 35(3): 92-100. doi: 10.11975/j.issn.1002-6819.2019.03.012
    [9]

    LAN Y, HUANG Z, DENG X. Comparison of machine learning methods for citrus greening detection on UAV multispectral images[J]. Comput Electron Agr, 2020, 171: 10524. doi: 10.1016/j.compag.2020.105234

    [10] 李修华, 李民赞, LEE W S, et al. 柑桔黄龙病的可见−近红外光谱特征[J]. 光谱学与光谱分析, 2014, 34(6): 1553-1559. doi: 10.3964/j.issn.1000-0593(2014)06-1553-07
    [11] 尚方信, 郭浩, 李钢, 等. 基于One-class SVM的噪声图像分割方法[J]. 计算机应用, 2019, 39(3): 874-881. doi: 10.11772/j.issn.1001-9081.2018071494
    [12]

    TAX D M J, DUIN R P W. Support vector data description[J]. Mach Learn, 2004(54): 45-66.

    [13]

    CHAWLA N V, BOWYER K W, HALL L O. SMOTE: Synthetic minority over-sampling technique[J]. J Artif Intell Res, 2002(16): 321-357.

    [14] 成忠, 张立庆, 刘赫扬, 等. 连续投影算法及其在小麦近红外光谱波长选择中的应用[J]. 光谱学与光谱分析, 2010, 30(4): 949-952. doi: 10.3964/j.issn.1000-0593(2010)04-0949-04
    [15] 高洪智, 卢启鹏, 丁海泉, 等. 基于连续投影算法的土壤总氮近红外特征波长的选取[J]. 光谱学与光谱分析, 2009, 29(11): 2951-2954. doi: 10.3964/j.issn.1000-0593(2009)11-2951-04
    [16] 吴迪, 金春华, 何勇. 基于连续投影算法的光谱主成分组合优化方法研究[J]. 光谱学与光谱分析, 2009, 29(10): 2734-2737. doi: 10.3964/j.issn.1000-0593(2009)10-2734-04
    [17]

    CHEN T, GUESTRIN C. XgBoost: A scalable tree boosting system[C]//The 22nd ACM SIGKDD International Conference. ACM, 2016: 785-794.

    [18] 王术波, 韩宇, 陈建, 等. 基于深度学习的无人机遥感生态灌区杂草分类[J]. 排灌机械工程学报, 2018, 36(11): 1137-1141.
    [19] 高林, 杨贵军, 于海洋, 等. 基于无人机高光谱遥感的冬小麦叶面积指数反演[J]. 农业工程学报, 2016, 32(22): 113-120. doi: 10.11975/j.issn.1002-6819.2016.22.016
图(5)  /  表(4)
计量
  • 文章访问数:  1130
  • HTML全文浏览量:  4
  • PDF下载量:  1555
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-06-18
  • 网络出版日期:  2023-05-17
  • 刊出日期:  2020-11-09

目录

/

返回文章
返回