• 《中国科学引文数据库(CSCD)》来源期刊
  • 中国科技期刊引证报告(核心版)期刊
  • 《中文核心期刊要目总览》核心期刊
  • RCCSE中国核心学术期刊

基于知识图谱的水稻病虫害智能诊断系统

于合龙, 沈金梦, 毕春光, 梁婕, 陈慧灵

于合龙, 沈金梦, 毕春光, 等. 基于知识图谱的水稻病虫害智能诊断系统[J]. 华南农业大学学报, 2021, 42(5): 105-116. DOI: 10.7671/j.issn.1001-411X.202101010
引用本文: 于合龙, 沈金梦, 毕春光, 等. 基于知识图谱的水稻病虫害智能诊断系统[J]. 华南农业大学学报, 2021, 42(5): 105-116. DOI: 10.7671/j.issn.1001-411X.202101010
YU Helong, SHEN Jinmeng, BI Chunguang, et al. Intelligent diagnostic system for rice diseases and pests based on knowledge graph[J]. Journal of South China Agricultural University, 2021, 42(5): 105-116. DOI: 10.7671/j.issn.1001-411X.202101010
Citation: YU Helong, SHEN Jinmeng, BI Chunguang, et al. Intelligent diagnostic system for rice diseases and pests based on knowledge graph[J]. Journal of South China Agricultural University, 2021, 42(5): 105-116. DOI: 10.7671/j.issn.1001-411X.202101010

基于知识图谱的水稻病虫害智能诊断系统

基金项目: 国家自然科学基金(U19A2061);国家重点研发计划(2019YFC1710700);吉林省科技发展计划(20190301024NY,20200301047RQ)
详细信息
    作者简介:

    于合龙(1974—),男,教授,博士,E-mail: yuhelong@aliyun.com

    沈金梦(1995—),女,硕士研究生,E-mail: 1757516665@qq.com;†表示同等贡献

    通讯作者:

    陈慧灵(1983—),男,副教授,博士,E-mail: chenhuiling.jlu@gmail.com

  • 中图分类号: S435.11;TP182

Intelligent diagnostic system for rice diseases and pests based on knowledge graph

  • 摘要:
    目的 

    利用知识图谱对水稻病虫害领域复杂的异构数据信息进行结构化存储,建立病虫害间语义关系,为水稻病虫害关联检索及智能诊断提供理论依据。

    方法 

    首先提出一种面向水稻病虫害的知识图谱构建方法和基于图的水稻病虫害检索算法,通过引入节气实体实现水稻病虫害的预警。其次提出基于确定性因子(Certainty factor,CF)模型和知识图谱相结合的知识推理方法,利用CF与水稻病株症状的结合实现水稻病虫害的诊断。

    结果 

    利用命名实体识别模型,得出病、虫害名称及危害症状实体的准确率分别为0.92、0.90及0.87,进一步构建包括1 972个实体及5 226个实体关系的垂直领域知识图谱。通过自主开发的智能诊断系统进行案例分析,试验表明,诊断算法正确率达到86.25%。

    结论 

    该系统有效地解决了水稻病虫害领域数据检索、预警与诊断中知识的复杂性及不确定性的问题,有较强的实用价值和推广前景。

    Abstract:
    Objective 

    To conduct structured storage of complex and heterogeneous data information in the field of rice diseases and pests using knowledge graphs, establish semantic relationships between diseases and pests, and provide a theoretical basis for rice diseases and pests association retrieval and intelligent diagnosis.

    Method 

    Firstly, a method of constructing a knowledge graph for rice diseases and pests was proposed. At the same time, a series of graph-based retrieval algorithms for rice diseases and pests were proposed for information mining, through introducing solar terms entities to achieve early warning of rice diseases and pests. Secondly, a knowledge reasoning method based on the combination of certainty factor (CF) model and knowledge graph was proposed to realize the intelligent diagnosis of rice diseases and pests by combining CF with the symptom of diseased plant.

    Result 

    The accuracy rates of named entity recognition model were 0.92, 0.90, and 0.87 in disease and pest name and hazard symptom entities. Further, a knowledge graph of rice disease and pest domain including 1 972 entities and 5 226 entity relationships was constructed. Through the self-developed intelligent diagnosis system, case analysis was conducted and the test showed that the correct rate of the diagnosis algorithm reached 86.25%.

    Conclusion 

    This study effectively solves the complexity and uncertainty of knowledge in data retrieval, early warning and diagnosis in the field of rice diseases and pests, and has a strong practical value and extension prospects.

  • 我国柚、橙等柑橘类果园主要分布在广东、江西和广西等地山区,其水肥灌溉作业由人工现场操作逐步向离线定时控制[1-3]、物联网在线远程监控[4-6]等现代农业方向发展。随着技术的发展,设备的精细监控、故障检测、果园设备的兼容性和网络部署等方面均在不断完善,以适应智慧果园和市场需求[7-9]

    云服务、云计算、物联网、大数据、3S等为代表的信息技术,被广泛应用于农业各领域,促进农业的现代化。其中物联网能获取最直接的现场数据和控制现场设备,为农业现代化提供基础数据[10-13]。农业物联网局部信息传输技术主要有ZigBee、433 MHz无线射频、Bluetooth、Wi-Fi等,远程传输依托运营商网络[5,9,14]。低功耗广域通信网(Low power wide area,LPWA)是面向物联网中远距离和低功耗的通信需求技术,主要包括窄带物联网(Narrow band internet of things, NB-IoT)、增强型机器类型通信 (Enhance machine type communication, eMTC)、长距离 (LoLong-range, LoRa)通信、SigFox等,具有覆盖广、功耗低、成本低、连接稳定的特点,其中,NB-IoT和LoRa因在功耗和传输距离方面有明显优势,成为推广应用的主要技术[15-16]。现阶段运营商用NB-IoT来布置物联网,其上报数据至云平台方面有优势,但其信号覆盖有限,需要通过LoRa扩展其覆盖范围。

    农业物联网会受农业环境影响,如墙体厚度及材质、作物高度、地形地貌、田间遮挡物、气候等,在应用中需要研究和整合相关技术,以适应农业场景的需要。本研究依据果园灌溉需求,整合2种物联网通信新技术,在原有灌溉控制系统的基础上,对通信技术和检测电路等重新进行了设计,通过传感器采集土壤、空气和设备运行状态等相关信息反馈给云平台,使平台全面掌握灌溉所产生的细微变化,从而提升灌溉的精细化水平,起到节能减排、简化网络部署和节约成本等作用。以期系统既能满足灌溉需求,又可兼容果园其他传感器和设备,为农业生产和农产品信息溯源提供数据通道。

    系统总体框架包括现场设备、无线网络和云平台设计。整体系统依托电信的NB-IoT平台(EasyIoT开发者云平台,简称公有云),实现终端与私有云服务器(简称私有云)的数据传输。果园局部数据传输采用LoRa扩展NB终端的无线覆盖范围,也为灌溉作业提供实时的反馈信号。依据果园实际需求,设计了如图1所示的整体系统架构。

    图  1  果园监控云平台总体架构
    Figure  1.  Main architecture of cloud platform for orchard monitor and control

    总体架构中,北向系统主要由云服务器、PC和智能手机上的APP构成,南向系统主要由负责与基站通信的通信终端模块和与具体设备或传感器相连的执行机构构成。通信终端根据NB-IoT基站信号是否覆盖,配备NB-IoT或LoRa通信模块,具体实践中,将通信终端与执行机构以通用接口的形式整合成一体。

    对精细化果园管理系统业务需求的分析表明,通用系统需要满足系统管理模块化、设备类型分类化、系统容量最大化等要求[12,17-18]。对产品以研发和管理的最小功能单元划分,最小单元以模块(包括软件和硬件模块)通过通用接口加载到系统,在硬件上采用通用电路板设计,在软件上只需要更新固件,可减少设计研发及维护成本。

    山地果园日常事务主要有浇水、施肥、虫害监测、喷洒农药等[19]。果园终端的功能是可模块化的,其中通信模块是所有终端都必需的,用于数据的收发。指令执行模块和传感器模块是可选的,根据需求进行选配。在原有的滴灌控制研究基础上,本研究采用新的物联网和互联网技术,为传统果园设备、数据采集和智能设备设计监控终端,以期为果园设备控制和数据传输提供便利。终端内部功能框架图如图2所示。

    图  2  终端内部功能框架图
    Figure  2.  Inner block diagram for terminal

    终端样机的主要功能有数据通信、继电器控制、异常检测与上报、定位、终端设备编号、常用传感器数据采集、输入输出隔离、设置信息掉电存储、PC机设置、提供通用接口等。

    终端的主控微处理器选用STM32F103(功耗要求高时用STM32L151替换),通信模组选用移远BC95-B5。其中通信模组内部LDO输出的DC 3V为微处理器供电。模组的RESET引脚连接微处理器的GPIO引脚,再用3 V的电压上拉,实现硬件复位。新注册设备、重设连接的服务器、修改通信模式(eDRX或PSM)或需要重新获取基站时间时,需要对模组复位,也可用AT指令对模组复位。

    终端电路集成了通电检测、电池电压检测和复位电路(图3)。图3a中PWR_BAD信号连接微处理器的GPIO口,检测5 V电源是否正常。当采用AC 220V为系统供电或USB供电处于正常供电状态时,此信号应为高电平,据此判断供电是否正常。ADC_BAT_V检测锂电池电压,供Easy IoT的固件代码回调使用,每次上传数据时,自动将终端的电量信息上报。令微处理器从ADC口的读数为D,依据图3a电路和欧姆定律,锂电池电压(VLi)计算公式为:

    图  3  终端关键电路
    Figure  3.  Key circuit for terminal
    $$ {V_{{\rm{Li}}}} = 3D\left( {{R_{19}} + {R_{20}}} \right)/{2^{12}}, $$ (1)

    EasyIoT平台上报的电量是按百分比来计算的,所以折算后的上报值(Y)为:

    $$ Y = 100{V_{{\rm{Li}}}}/4.2{\text{。}} $$ (2)

    锂电池电量与电压是非线性关系,所以实践中对检测精度要求较高时,可以采用查表法来实现,即根据D值查表得到电量值,然后将电量数据传入电量回调函数,上传至计算机服务器后台。

    微处理器与BC95的复位电路分开设计,因为特殊情况下微处理器需要单独复位,如果同时复位BC95,需要较长的时间与基站重新建立连接,也增加了连接次数。为加快重启速度和减少连接次数,本研究将微处理器与模组的复位引脚分开,通过微处理器的GPIO引脚与模组的复位引脚相连,由微处理器的程序控制GPIO去复位模组。

    从用电安全和用户习惯角度考虑,外部电源只有部分时段才能提供,其他时段通过锂电池供电,故需要有供电、充电及整流电路(也称LDO)(图3b),其中用5 V电压与电源模块或USB的供电引脚相连,通过TP4056实现对锂电池的充电管理。利用二极管D6、D8和D10结电压压降,将5 V降压后直接给模组供电,这样当锂电池出现故障时,只要外部电源有电,则整个电路板就能正常供电。无锂电池时,VBAT处电压不稳定,特别是模组收发数据期间,电压下降至3 V左右,但实际测试时,发现此电压的波动并不影响数据收发的稳定性。

    ME6206A33为LDO,输出3.3 V供微处理器及外围电路使用。因为BC95可以输出3.0 V,LDO为可选部分。D2为5.1 V稳压管,可防止外部输入电压过高烧毁内部芯片。泵房以外的温度、湿度、土壤含水量等传感器模块采用原有的太阳能模块供电,输出到锂电池接口,由BC95模组的LDO输出3 V供系统其他部分使用。

    果园泵房的基本功能是抽水、浇水和施肥。将浇水和施肥通过混肥装置进行一体化设计,以达到更好的效果。果园现场测试时发现,电网电压不稳定是山地果园普遍存在的问题,部分地区波动范围为170~240 V,电机也有可能出现故障,果农或果园管理人员无法确认远程设备的运行状态,如电机是否启动、电机有没有损坏和电网电压是否正常等。

    在执行终端中加入电量计量电路以获取果园(特别是泵房)用电设备运行的精确状态,可以精确监控功率、电压、电流和电量。监控页面可图形化显示当前的功率和电压,依据这2个参数的动态变化,管理人员可以判断远程设备是否有故障,甚至可以根据文献[20]分析出引起故障的原因。电量检测功能电路如图3c所示,此电路需双路隔离电源,其中一路供给处理器等低压数字电路部分,另一路电量供检测芯片HLW8032使用。

    滴灌和混肥装置常用电磁阀实现水管的开关控制,电磁阀需要采用H桥电路/芯片实现双向控制,其控制信号的脉冲宽度由CPU决定,以兼容不同的电磁阀。

    微处理器(Microcontroller unit, MCU)的串口负责与BC95-B5、HLW8032、PC或LoRa模块进行通信,另外还需要提供I2C和SPI等常用的外设接口,以提高终端的兼容性。终端MCU的主要外设接口如图4所示。

    图  4  终端MCU主要外设接口
    Figure  4.  Main interface for terminal MCU

    继电器和电量检测电路负责对泵房电机抽水、浇水和施肥等作业进行监测和控制,检测作业功率、电压、电流等参数。终端内控制板与通信模组等集成设计,简化接线、方便测试和批量应用。此外,终端还实现了电机开关控制、蓝牙通信、MOS驱动和光耦隔离等,完善了微处理器与外围设备的交互。

    通信终端(含NB终端和LoRa终端)设计要考虑兼容已有设备。果园已有设备包括各种传感器和智能设备,对外提供UART、SPI和I2C等常见硬件接口,通过修改已有设备的固件程序,可以实现数据兼容。山地果园滴灌作业需要检测的主要指标有土壤含水量、温度和湿度等[2]

    终端开发基于EasyIoT的开源库,其终端固件与平台的数据交换采用CoAP协议。公有云与私有云之间的数据交换采用JSON协议交换。为解决果园终端数据的多样性,在由LoRa组成的局域网之间进行数据传输,在NB终端内设计了在CoAP协议内嵌JSON数据的方式,实现从终端至私有云服务器的数据交换,而LoRa终端直接采用JSON数据格式[21-22]。本研究采用cJSON开源代码实现,但由于STM32F1/L1系列处理器的SRAM大小和处理性能的限制,需要对cJSON源代码进行修改,以提高效率。

    通信终端提供3种常见接口:UART、SPI和I2C,将已有设备的数据输出格式修改为JSON格式,经UART通道,即可完成数据上下行传输。传感器改造后网络结构如图5所示。

    图  5  已有设备传感器和设备改进
    Figure  5.  Sensors and device improvement of existing equipment

    嵌入开发通信终端的内部固件程序流程如图6所示。

    图  6  固件程序流程图
    Figure  6.  Flow chart of firmware

    终端收到的平台数据,经cJSON解释后,数据格式与PC机指令格式保持一致,需要测试相关指令时,直接由PC机发送相同的指令,方便离线调试。固件运行相关的信息也通过串口发送到PC机,PC机通过串口助手可实时了解系统运行状态。

    固件还有数据掉电储存功能,将用户设置的参数存储在Flash内。

    EasyIoT的Java开发包,采用HttpClient开发包与平台连接,数据采用JSON数据交换协议,其中JSON采用fastJSON进行编码与解码。

    系统整体主要由上报数据、发送指令、权限控制、数据解析等模块构成。项目初期选择租用云服务器部署项目,云服务器使用Ubuntu系统,运行MySQL、Redis、Tomcat等软件。不同的模块组合成不同的子系统,主要功能包括数据收集、视图、服务调用和单点登录等。云服务器开放不同端口运行不同的子系统,为提高系统性能,使用Nginx软件实现子系统集群。网页系统功能如图7所示。

    图  7  网页系统功能框图
    Figure  7.  Function block of web system

    为便于批量测试终端设备的运行情况,本研究采用40 W电灯模拟泵房的水泵和灯光等需要继电器进行开关控制的设备(终端的继电器为AC 220 V/10 A,最高可带2200 W负载),用于测试数据收发、电学参数检测、传感器数据传输和解释、电池待机时间、终端稳定性等项目。测试板上安装10套终端设备,持续测试和观察终端的可靠性,也方便查找故障。控制指令由远程服务器发送或本地计算机通过串口线模拟远程数据发送。本地计算机模拟远程指令发送,加快指令测试效率、减少连接次数。PC机通过USB转UART串口适配器,连接终端微处理器的UART口,具体端口见图3通信终端的主控微处理器电路图。BC95-B5与微处理器的UART2连接,而PC机的适配器与微处理器的UART1连接,微处理器程序解释串口指令时,两路的串口数据输入到同一个串口指令解释函数,实现PC指令与远程指令同等作用,但来自PC的指令可以即时响应,起到加快调试的作用。能够收发串口数据的软件就可以实现对此终端的测试。

    在STM32F103C8T6处理器上,分别基于Janson与cJSON对JSON数据进行解释。因Janson在Keil里提供,而cJSON来自JSON库的源代码。测试{"foo": 42, "bar": 7},其中将Heap_Size改为0x1800时,测试生成和解释串:{"foo": 42, "bar": 7}。Janson可以成功生成并解释32次,第33次出错。cJSON可以成功生成并解释44次,第45次出错。JSON测试结果表明,Janson与cJSON对JSON数据的生成次数有限。但2个库函数对JSON串解释未测试到上限,所以本研究设计的终端设备,JSON串改用宏定义生成,生成时间约为cJSON方法的10%,而解释采用cJSON库。生成和解释的测试程序流程如图8所示。

    图  8  JSON串生成与解释测试
    Figure  8.  Test for generating and parsing JSON string

    大部分设备10年内解释次数不超过20万次,因此测试程序以此值为终止条件。PC观察的测试结果表明,本研究的JSON串生成方法满足设备长期运行要求。

    功率计量芯片HLW8032出厂时已经过校准,但由于电路中的采样电阻等电路中的元器件值存在误差,所以对于要求较高的场合,需要再次进行校准。本研究设计使用的元器件,测量功率分别为13和200 W的设备,实测值比标称值高约10%。电量计量值校准方法如图9所示。

    图  9  计量值校准框图
    Figure  9.  Block diagram for meterage value calibration

    利用图9的校准方案,测试结果如图10所示。

    图  10  功率标定测试结果
    Figure  10.  Power calibration test result

    图10可以看出,测试功率与实际功率可以拟合为过原点的直线,测试误差来自电学参数检测和隔离电路芯器件的参数,拟合的决定系数为0.9998,拟合的线性公式为:

    $$ y = 1.128\;8x - 8.944\;0{\text{。}} $$ (3)

    为减少工作量,对于同一批次的元器件,测试1次拟合直线的斜率即可用于推算实际功率。

    通过功率计量芯片对输出功率进行监控,当功率变动幅度超过阈值时,终端及时自动上报状态。典型应用是果园灌溉系统,果农远程发送或预先设置了电机启动,配合湿度传感器上传的信息,果农可以确定正在作业的水泵有没有启动、功率是否在正常范围内、灌溉是否成功等。

    周期性上报数据能够观察到长时间跨度的状态变化,但设备启动/停止或突然发生故障时需要即时上报,以便云平台即时做出响应。加权递推平均滤波法为经典的软件滤波算法,可以有效地消除异常的瞬时值对信号计算带来的影响。采用中值滤波法去除噪声,并在规定时间内不重复上报同类型功率突变状态,通过这种方法,可以在有限的上传次数内,及时上报数据。

    本研究基于加权递推平均滤波法设计了滤波分析公式,即是否上报的计算公式:

    $$ Y = \left\{ {\begin{array}{*{20}{c}} 1&{\dfrac{{{{\boldsymbol{W_c}}}{X_c}}}{{n - 2}} - \dfrac{{{{\boldsymbol{W_o}}}{X_o}}}{{m - 2}} \geqslant T}\\ 0&{\text{其他情况}} \end{array}} \right. ,$$ (4)

    式中,Xn为电学参数检测电路在前n个时刻检测得到的值,Xn={x[−n+1],…,x[−1],x[0]};Xm为在前m个时刻检测得到的值,Xm={x[−mk+1],…,x[−1−k+1],x[−k]};Xc为集合Xn去掉其中的最大值[即max(Xn)]和最小值[即min(Xn)]2个元素而形成的集合,故Xcn−2维;Xo为集合Xm去掉其中的最大值[即max(Xm)]和最小值[即min(Xm)]2个元素而形成的集合,故Xom−2维;Wcn−2维行向量,n>2;T是阈值;Wom−2维行向量,m>2;k为历史数据序列偏移量;当Y=1时,判定为异常状态;当Y=0时,判定为正常状态。相关参数可远程设置,以增加滤波算法的通用性。

    果园现场设备受干扰的随机性强、时间跨度大,且受上报次数的限制,因此,以果园设备直接测试对功率变动的响应速度不现实。为测试功率变动的有效性,本研究测试了1个标称功率为13 W的负载和1个有多档(200、600和1200 W)的负载。为方便测试,式(4)取n=6,m=4,忽略功率不变的时间段,得到2种功率曲线(图11)。

    图  11  不同负载下的功率曲线
    Figure  11.  Test curve of power under different loads

    不同负载对应不同阈值,图11a11b分别选取5和50 W时,可以在150 ms内检测出异常,而分别取10和150 W时,可以在100 ms内检测出异常,即在时间段内实现即时上报。果园现场测试发现,由于山地果园电网的不稳定以及其他干扰的存在,平台监测到的上报次数较多,而短时间内同性质故障信息重复上报无意义,所以需要限制短时间内同类故障上报。本研究中采用的上报数据的方案为:1)周期性上报:忙时间隔15 min/次,闲时间隔60 min/次;2)设备启动与停止时各上报一次;3)功率变动异常时上报一次,同类型异常在规定时间段内不重复上报。

    终端设备可以检测出异常的状态,云端也可检测异常数据。由于周期性上报数据时将常用的状态上传到云端,云端将当前状态与数据库内的历史数据对比,可检测到异常,并做出响应。通过试验选定相关参数,有效的减少连接次数、节约资费。

    试验测试时,将终端供电、充电和LDO电路的锂电池接口串联万用表的电流测试端口进行电流测试。

    试验测试结果(表1)表明,终端功耗主要由控制板待机功耗和NB-IoT模组唤醒后的功耗组成。根据STM芯片文档,降低微处理器主频可降低功耗,在满足所有日常计算的情况下,主频降至1~2 MHz可以满足正常计算和控制操作。考虑到处理能力的冗余,设定微处理器最低主频为2 MHz。

    表  1  功耗测试
    Table  1.  Power consumption test
    项目
    Item
    测量功耗/mA
    Measured power
    微处理器功耗/mA
    Microprocessor power
    微处理器外设功耗/mA
    Microprocessor peripheral
    power consumption
    微处理器主频/MHz
    Microprocessor frequency
    待机
    Standby
    9.0 3.30 0.77 8
    7.5 1.50 0.31 2
    收发数据
    Transceiver data
    62.0 3.30 0.77 8
    60.0 1.51 0.31 2
    下载: 导出CSV 
    | 显示表格

    每次收发数据的状态持续20 s。出于安全考虑,泵房需要抽水时才供电。抽水泵通电时,充电电路给锂电池充电。在不充电情况下,按上报频率200 mA·H锂电池,实际工作时长为24 h,考虑到工程冗余,300~400 mA·H锂电池可以满足正常工作需求。

    换用STM32L151的微处理器,200 mA·H电池实际工作时长为4 d,是STM32F103的4倍。

    本研究整合NB-IoT和LoRa技术,设计了山地果园现场监控终端和远程云平台,是农业大数据建立数据采集和远程传输的基础,简化了系统部署,解决了NB-IoT覆盖盲区的问题。

    电学参数检测电路结合参数异常检测算法,实现即时异常状态上报,并将上报次数限制在每年2万次,可在150 ms内检测出异常状态。将JSON数据解释和生成分开实现,在内存受限的微处理器中实现JSON数据生成和解释20万次以上。对检测功率进行标定,其中功率的线性回归预测决定系数(R2)为0.9998。通过电路低功耗设计和降低微处理器主频等,终端配200 mA·H锂电池可满足常规工作需求,采用低功耗微处理器可以进一步延长工作时间。在满足计算和控制需求的前提下,2 MHz的微处理器主频和200 mA·H锂电池可以满足果园灌溉系统计算和持续工作的要求。

    本研究采用的物联网新技术、电学参数检测电路、终端JSON数据格式和滤波算法,解决了在有限连接次数下的即时上报问题,并延伸了物联网的覆盖范围。这些技术的有机整合具有较强的创新性、扩展性和兼容性,可以延伸较多的综合应用。

  • 图  1   水稻病虫害本体构建图

    Figure  1.   The ontogeny construction figure of rice diseases and pests

    图  2   知识图谱概念层次图及实体关系图

    Figure  2.   Conceptual hierarchy graph and entity relationship graph of knowledge graph

    图  3   本体与知识图谱映射图

    Figure  3.   The mapping picture from ontology to knowledge graph

    图  4   Bi-LSTM-CRF模型

    Figure  4.   Bi-LSTM-CRF model

    图  5   知识图谱可视化

    Figure  5.   Knowledge graph visualization

    图  6   检索流程图

    Figure  6.   Search flow chart

    图  7   8种常见病害的系统诊断性能评价结果

    Ⅰ:水稻纹枯病Rhizoctonia solani;Ⅱ:稻瘟病Pyricularia oryzae;Ⅲ:水稻霉霜病Sclerophthora macrospora;Ⅳ:稻曲病Ustilaginoidea virens;Ⅴ:烂秧病Fusarium graminearum;Ⅵ:水稻白叶枯病Xanthomonas campestris;Ⅶ:水稻恶苗病Fusarium moniliforme;Ⅷ:水稻窄条斑病Cercospora oryzae

    Figure  7.   Evaluation results of system diagnostic performance of eight common diseases

    图  8   智能诊断系统整体架构

    Figure  8.   Overall architecture of an intelligent diagnostic system

    图  9   系统界面图

    Figure  9.   System interface figure

    表  1   Bi-LSTM-CRF模型参数设置

    Table  1   Parameter settings of Bi-LSTM-CRF model

    参数
    Parameter
    参数值
    Parameter value
    字向量维度 Word vector dimension 100
    隐藏层维数 Hidden layer dimension 128
    学习率 Learning rate 0.001
    批尺寸 Batch_size 32
    学习衰减率 Dropout rate 0.75
    迭代次数 Epoch 50
    下载: 导出CSV

    表  2   命名实体试验结果

    Table  2   Named entity experimental results

    实体类型
    Entity type
    准确率
    Accuracy rate
    召回率
    Recall rate
    F1值
    F1 value
    病害名称 Disease name 0.92 0.88 0.90
    虫害名称 Pest name 0.90 0.87 0.88
    危害症状 Hazard symptom 0.87 0.84 0.85
    下载: 导出CSV

    表  3   水稻病害实体关系部分三元组示例

    Table  3   Examples of triples in the entity relationship of rice diseases

    实体
    Entity
    关系
    Relationship
    实体
    Entity
    水稻纹枯病
    Rhizoctonia solani
    REL_CI 椭圆形 Oval shape
    水稻纹枯病
    R. solani
    REL_CI 暗绿色 Dark green
    水稻纹枯病
    R. solani
    REL_CP 苗期 Seedling stage
    水稻纹枯病
    R. solani
    REL_CC 及时拔除病株
    Promptly pull up diseased plants
    椭圆形 Oval shape REL_ID 叶片 Leaf blade
    下载: 导出CSV

    表  4   知识图谱实体类型及属性

    Table  4   Knowledge graph entity types and properties

    实体类型 Entity type 实体属性 Entity property 举例 Example
    Category Disease name 水稻纹枯病、水稻白叶枯病
    Rhizoctonia solani, Xanthomonas campestris
    Control methods Control methods name 浅水勤灌、无色防虫网
    Shallow water and diligent irrigation, colorless insect-proof net
    Period Period name 苗期、分蘖期 Seedling stage, tillering stage
    Damage site Damage site name 根、茎 Root, stem
    Ill spot Ill spot name 暗绿色、水浸状 Dark green, water-soaked
    Pest category Pest name 二化螟、稻纵卷叶螟
    Chilo suppressalis, Cnaphalocrocis medinalis
    Insect structure Insect structure name 头部、胸部 Head, thorax
    Morphological characteristic Morphological characteristic name 灰白色、鱼鳞状 Grayish white, fish scale shape
    Developmental stage Developmental stage name 幼虫、蛹 Larvae, chrysalis
    Hazard pattern Hazard pattern name 刺吸、食叶 Prickly suction, leaf-eating
    Solar term Solar term name 春分、小暑 The beginning of spring, lesser heat
    总计/个 Total 1972
    下载: 导出CSV

    表  5   知识图谱实体关系类型及属性

    Table  5   Knowledge graph entity relationship types and properties

    实体关系类型
    Entity relationship type
    实体关系属性
    Entity relationship property
    举例
    Example
    REL_CC Relcc name 水稻纹枯病防治方法是科学灌溉
    Rhizoctonia solani was prevented and controlled by scientific irrigation
    REL_CP Relcp name 水稻纹枯病发病阶段是苗期
    The onset stage of R. solani is seedling stage
    REL_CI relic name、CF 水稻纹枯病的症状为有暗绿色、水浸状病斑
    The symptoms of R. solani include dark green, water-soaked spots
    REL_ID Relid name 暗绿色出现的部位是叶鞘
    The part that appears dark green is the leaf sheath
    REL_PH Relph name 二化螟危害方式是钻蛀
    The damage method of Chilo suppressalis is borer
    REL_PI Relpi name 二化螟症状是有枯黄色斑点
    The C. suppressalis symptoms include withered yellow spot
    REL_PM Relpm name、CF 二化螟形态特征为有暗褐色纵线
    The C. suppressalis morphological characteristics include dark brown longitudinal lines
    REL_MI Relmi name 头部表现出铜绿色、近三角形
    The head exhibits copper-green, sub-triangular shape
    REL_MD Relmd name 暗褐色纵线出现的发育期是幼虫期
    The developmental stage that appears dark brown longitudinal lines is larvae
    REL_CS Relcs name 水稻纹枯病出现的节气为立夏
    The solar terms for the emergence of R. solani is the beginning of summer
    总计/个 Total 5226
    下载: 导出CSV

    表  6   诊断实例表

    Table  6   Table of examples of diagnoses

    ID 症状名称
    Symptom name
    症状名称代码
    Symptom
    name tag
    病害名称  
    Disease name  
    病害名称代码
    Disease
    name tag
    确定性因子
    Certainty
    factor (CF)
    1 暗绿色 Dark green H1 水稻纹枯病 Rhizoctonia solani M1 0.55
    2 水浸状 Water-soaked H2 水稻纹枯病 R. solani M1 0.55
    3 暗绿色 Dark green H1 细菌性条斑病 Xanthomonas oryzae M2 0.36
    4 水浸状 Water-soaked H2 细菌性条斑病 X. oryzae M2 0.36
    5 卷曲 Curl H3 细菌性条斑病 X. oryzae M2 0.36
    6 暗绿色 Curl H1 水稻白叶枯病 X. campestris M3 0.47
    7 水浸状 Water-soaked H2 水稻白叶枯病 X. campestris M3 0.47
    8 卷曲 Curl H3 水稻白叶枯病 X. campestris M3 0.47
    下载: 导出CSV
  • [1] 刘万才, 陆明红, 黄冲, 等. 水稻重大病虫害跨境跨区域监测预警体系的构建与应用[J]. 植物保护, 2020, 46(1): 87-92.
    [2] 刘明辉, 沈佐锐, 高灵旺, 等. 基于WebGIS的农业病虫害预测预报专家系统[J]. 农业机械学报, 2009, 40(7): 180-186.
    [3]

    HU X F, CHENG C, LUO F, et al. Effects of different fertilization practices on the incidence of rice pests and diseases: A three-year case study in Shanghai, in subtropical southeastern China[J]. Field Crops Research, 2016, 196: 33-50. doi: 10.1016/j.fcr.2016.06.004

    [4] 许童羽, 郭忠辉, 于丰华, 等. 采用GA-ELM的寒地水稻缺氮量诊断方法[J]. 农业工程学报, 2020, 36(2): 209-218. doi: 10.11975/j.issn.1002-6819.2020.02.025
    [5] 孙娟, 蔡银杰, 冯成玉, 等. 无人机施药防治水稻病虫害参数组合初选[J]. 中国植保导刊, 2018, 38(12): 72-73. doi: 10.3969/j.issn.1672-6820.2018.12.016
    [6] 王艺, 王英, 原野, 等. 基于语义本体的柑橘肥水管理决策支持系统[J]. 农业工程学报, 2014, 30(9): 93-101. doi: 10.3969/j.issn.1002-6819.2014.09.012
    [7] 姚青, 张超, 王正, 等. 分布式移动农业病虫害图像采集与诊断系统设计与试验[J]. 农业工程学报, 2017, 33(S1): 184-191.
    [8] 戴建国, 赖军臣. 基于图像规则与Android手机的棉花病虫害诊断系统[J]. 农业机械学报, 2015, 46(1): 35-44. doi: 10.6041/j.issn.1000-1298.2015.01.006
    [9] 杨林楠, 郜鲁涛, 林尔升, 等. 基于Android系统手机的甜玉米病虫害智能诊断系统[J]. 农业工程学报, 2012, 28(18): 163-168. doi: 10.3969/j.issn.1002-6819.2012.18.024
    [10] 马浚诚, 温皓杰, 李鑫星, 等. 基于图像处理的温室黄瓜霜霉病诊断系统[J]. 农业机械学报, 2017, 48(2): 195-202. doi: 10.6041/j.issn.1000-1298.2017.02.026
    [11] 温皓杰, 张领先, 傅泽田, 等. 基于Web的黄瓜病害诊断系统设计[J]. 农业机械学报, 2010, 41(12): 178-182. doi: 10.3969/j.issn.1000-1298.2010.12.037
    [12]

    SARMA S K, SINGH K R, ABHIJEET S. An expert system for diagnosis of disease in rice plant[J]. International Journal of Artificial Intelligence, 2010, 1(2): 26-31.

    [13]

    HONGGOWIBOWO A S. A web-based rice plant expert system using rule-based reasoning[J]. Telkomnika, 2009, 7(3): 187-194. doi: 10.12928/telkomnika.v7i3.593

    [14]

    SHARMA R, CHANDERMOHAN, SINGH H, et al. Development of an image based expert system for identification of rice diseases and their management[J]. Plant Disease Research, 2012, 27(2): 158-161.

    [15]

    MUHIBUDDIN A, AIRLANGGA P, SULTHONI M M, et al. Implementing backward chaining method in expert system to detect and treat rice, chilli, and corn plant's pests and diseases[J]. Journal of Information Technology and Computer Engineering, 2018, 2(2): 71-75.

    [16] 王昊奋, 丁军, 胡芳槐, 等. 大规模企业级知识图谱实践综述[J]. 计算机工程, 2020, 46(7): 1-13.
    [17]

    SU X L, LI J, CUI Y P, et al. Review on the work of agriculture ontology research group[J]. Journal of Integrative Agriculture, 2012, 11(5): 720-730. doi: 10.1016/S2095-3119(12)60061-6

    [18] 索俊锋, 刘勇. 基于农业本体的语义相似度算法及其在农作物本体中的应用[J]. 农业工程学报, 2016, 32(16): 175-182. doi: 10.11975/j.issn.1002-6819.2016.16.024
    [19]

    DRURY B, FERNANDES R, MOURA M F, et al. A survey of semantic web technology for agriculture[J]. Information Processing in Agriculture, 2019, 6(4): 487-501.

    [20] 夏迎春. 基于知识图谱的农业知识服务系统研究[D]. 合肥: 安徽农业大学, 2018.
    [21]

    LIU X X, BAI X S, WANG L H, et al. Review and trend analysis of knowledge graphs for crop pest and diseases[J]. IEEE Access, 2019, 7: 62251-62264. doi: 10.1109/ACCESS.2019.2915987

    [22] 王娟. 基于案例推理和KG的烟草病害防控模型研究[D]. 合肥: 安徽农业大学, 2016.
    [23]

    YANG Y, CHEN K, CHAO L, et al. Research on hierarchy structure generation method of ontology knowledge pan-concept in agriculture[J]. Advances in Robotics & Automation, 2017, 6(3): 1-6.

    [24] 余凡. 领域本体构建方法及实证研究[M]. 武汉: 武汉大学出版社, 2015: 75-79.
    [25]

    GUAN N, SONG D, LIAO L. Knowledge graph embedding with concepts[J]. Knowledge-Based Systems, 2019, 164(3): 38-44.

    [26]

    AYDIN S, AYDIN M N. Ontology-based data acquisition model development for agricultural open data platforms and implementation of OWL2MVC tool[J]. Computers and Electronics in Agriculture, 2020, 175(3): 1-9.

    [27] 李涓子, 侯磊. 知识图谱研究综述[J]. 山西大学学报(自然科学版), 2017, 40(3): 454-459.
    [28] 王莉军, 周越, 桂婕, 等. 基于BiLSTM-CRF的中医文言文文献分词模型研究[J]. 计算机应用研究, 2020, 37(11): 3359-3362.
    [29] 赵鹏飞, 赵春江, 吴华瑞, 等. 基于注意力机制的农业文本命名实体识别[J]. 农业机械学报, 2021, 52(1): 185-192. doi: 10.6041/j.issn.1000-1298.2021.01.021
    [30] 张善文, 王振, 王祖良. 结合知识图谱与双向长短时记忆网络的小麦条锈病预测[J]. 农业工程学报, 2020, 36(12): 172-178. doi: 10.11975/j.issn.1002-6819.2020.12.021
    [31] 李想, 魏小红, 贾璐, 等. 基于条件随机场的农作物病虫害及农药命名实体识别[J]. 农业机械学报, 2017, 48(S1): 178-185. doi: 10.6041/j.issn.1000-1298.2017.S0.029
    [32]

    KHAN N A, MOHAMMADI M. A Modified viterbi algorithm-based if estimation algorithm for adaptive directional time–frequency distributions[J]. Circuits, Systems, and Signal Processing, 2018, 38(5): 2227-2244.

    [33]

    PRAVEENA R K S, JUSTUS S. Concept relation knowledge visualization with CR logic using Neo4j[J]. International Journal of Recent Technology and Engineering (IJRTE), 2019, 8(4): 8475-8480. doi: 10.35940/ijrte.D9792.118419

    [34] 吴运兵, 杨帆, 赖国华, 等. 知识图谱学习和推理研究进展[J]. 小型微型计算机系统, 2016, 37(9): 2007-2013. doi: 10.3969/j.issn.1000-1220.2016.09.022
    [35] 于合龙, 陈程程, 林楠, 等. 互联网+农业科技服务云平台构建与农业时空推荐算法研究[J]. 吉林农业大学学报, 2019, 41(4): 495-504.
    [36] 刘欣. 基于确定性因子理论的肺癌诊断Web专家系统的研究与实现[D]. 长春: 吉林大学, 2017.
    [37] 靳留乾, 徐扬, 方新, 等. 基于证据理论的不确定性推理方法及其应用[J]. 计算机工程与应用, 2015, 51(10): 6-11. doi: 10.3778/j.issn.1002-8331.1410-0304
  • 期刊类型引用(2)

    1. 付晨妃,李冰,邓敏,植彬,黄启锋. 气象因素对荔枝椿象和霜疫霉病的影响及预测. 广东气象. 2022(01): 59-61 . 百度学术
    2. 孔广辉,冯迪南,李雯,连帅利,习平根,姜子德. 荔枝霜疫病的研究进展. 果树学报. 2021(04): 603-612 . 百度学术

    其他类型引用(0)

图(9)  /  表(6)
计量
  • 文章访问数:  2122
  • HTML全文浏览量:  131
  • PDF下载量:  961
  • 被引次数: 2
出版历程
  • 收稿日期:  2021-01-05
  • 网络出版日期:  2023-05-17
  • 刊出日期:  2021-09-09

目录

/

返回文章
返回