Assessment for soil nutrient content prediction model based on visible-near infrared spectroscopy in the typical regions of Guangdong Province
-
摘要:目的
可见−近红外光谱(Visible-near infrared spectroscopy,VNIRS)可以利用少量土壤样品建立预测模型,从而无损快速地预测土壤养分含量。然而,至今鲜见广东省土壤养分的VNIRS预测模型的报道。本研究旨在通过传统化学分析方法和VNIRS技术对广东典型地区的耕地土壤进行分析,构建土壤全量及速效养分含量的VNIRS预测模型,并评估利用光谱分析土壤全量和速效养分含量的可行性,为广东省土壤养分的快速检测及质量评估提供科学参考。
方法本研究采集了粤东(梅州)、粤西(湛江)、粤北(韶关)、粤西北(肇庆)和珠三角(惠州和珠海) 5个地区共514份耕地土壤样品,测量样品有机质、全氮、可溶性有机碳、碱解氮和速效磷含量,同时利用VNIRS在400~2490 nm波长范围内探明其全光谱特征,筛选定标样品,结合偏最小二乘法和主成分分析,建立预测模型,并在此基础上进行反向验证,评估模型的可行性。
结果各地区土壤有机质、全氮、可溶性有机碳、碱解氮和速效磷含量及光谱特征均存在显著差异。有机质和全氮的定标预测模型效果较好,其中,粤西北地区的有机质定标相关系数达到0.831 1,珠三角地区的全氮定标相关系数达到0.789 8;可溶性有机碳、碱解氮和速效磷的预测模型效果在地区间差异较大,粤西北和珠三角地区碱解氮和速效磷的定标效果远优于其他地区。反向验证结果表明,有机质和全氮的预测值与实测值具有较好的相关性,决定系数(R2)最高分别达到0.69和0.65;粤西北和珠三角地区碱解氮的反向验证结果也较好,R2达到0.63和0.62;而可溶性有机碳和速效磷的反向验证结果总体较差。
结论VNIRS技术能够区分省域内不同地区的土壤来源,可以作为未来土壤分类和土壤质量调查的重要评价指标。VNIRS技术能够较好地直接预测耕地土壤有机质和全氮含量,对可溶性有机碳、碱解氮、速效磷含量的预测存在明显元素差别和地区差异,今后需进一步筛选光谱范围或采用更优方式构建模型。
Abstract:ObjectiveVisible-near-infrared spectroscopy (VNIRS) can non-invasively and rapidly predict soil nutrient contents based on models developed using data of some representative soil samples, but soil nutrient content prediction models for different regions of Guangdong Province are still lacking. In this study, representative agricultural soil samples were collected from Guangdong Province, and models were developed based on the traditional soil chemical analyses and VNIRS spectral signatures. The objective was to assess the predictive ability of the models for soil total and available nutrients so as to provide a scientific basis for rapid soil nutrient content estimation and soil quality evaluation in Guangdong Province.
MethodA total of 514 representative soil samples were collected from the east (Meizhou), west (Zhanjiang), north (Shaoguan), and northwest regions (Zhaoqing) and the Pearl River Delta (Huizhou and Zhuhai) in Guangdong Province, and the contents of soil organic matter, total nitrogen, dissolved organic carbon, available nitrogen, and available phosphorus were analyzed. In addition, the VNIRS spectral signatures of soil samples were obtained between 400 and 2 490 nm. Models were developed and calibrated using partial least squares regression combined with principal component analysis, and the models were reversely validated and assessed for their predictive abilities.
ResultThere were significant differences in the contents of soil organic matter, total nitrogen, dissolved organic carbon, available nitrogen and available phosphorus and VNIRS spectral signatures among the soils from different regions. The models for soil organic matter and total nitrogen showed good prediction performances, with validation determination coefficients of 0.831 1 for soil organic matter in the northwest region and 0.789 8 for total nitrogen in the Pearl River Delta. The models for dissolved organic carbon, available nitrogen, and available phosphorus showed very different prediction performances among regions, with much better performances for available nitrogen and available phosphorus in the northwest region and Pearl River Delta compared with other regions. Model validation showed good correlations between the predicted and measured values of soil organic matter and total nitrogen, with the highest coefficients of determination (R2) being up to 0.69 and 0.65, respectively. The predicted and measured values of available nitrogen in the northwest region and Pearl River Delta also showed good correlations, with R2 of 0.63 and 0.62, respectively. However, model validation showed generally poor correlations between the predicted and measured values of dissolved organic carbon and available phosphorus.
ConclusionVNIRS technology can predict soil organic matter and nutrient contents to differentiate soils from different regions at the provincial scale. Soil VNIRS spectral signature can be used as an important index for soil classification and soil quality evaluation. VNIRS technology shows good performance in the predictions of soil organic matter and total nitrogen contents, but its performance in the predictions of dissolved organic carbon, available nitrogen, and available phosphorus contents is element- and region-dependent. Therefore, future efforts should be focused on spectral range selection and model optimization.
-
柑橘是全球广泛种植的经济作物,其经济价值不仅体现在果实,还包括果实深加工得到的产品(如果汁、果酱等)[1-2]。在果园管理中,传统二维图像识别方法无法精确感知果实的空间分布和实际尺寸[3],导致自动化采摘的效率低下和无法准确进行估产。通过三维重建技术,能够精确获取果树的空间结构[4],为进一步的果实分割和分析提供数据支持[5]。而点云分割技术则能够从复杂背景中准确提取果实,为后续的果实计数、质量控制或产量预测提供基础。这些技术的应用不仅显著减少了人力成本,还为精准农业中的自动化处理奠定了基础[6-9]。
果树三维重建是果实空间信息获取的重要基础[10],传统的三维重建方法主要包括基于几何推理和基于点云2大类[11]。基于几何推理的建模方法依赖多视角图像,通过结构化运动(Structure from motion, SfM)[12]和多视角立体视觉(Multi view stereo, MVS)[13]等技术重建三维模型。Dong等[14]利用SfM和MVS技术成功实现了果树三维重建与参数估计。Li等[15]提出了基于Matting-SfM的改进算法,通过电动转盘旋转物体,提升了建模精度。这类方法在果树三维重建中具有一定优势,但容易受到光照、遮挡和果树动态变化特性的影响,模型准确度不足。此外,高分辨率图像增加了计算资源的需求,低分辨率图像则可能丢失细节,限制模型的精确度。基于点云的建模方法依靠激光雷达等深度传感器直接获取果树的三维点云数据,这类方法对光照变化和遮挡具备更高的鲁棒性。Gené-Mola等[16]使用车载激光雷达对果树进行扫描,成功获取了高精度的点云数据。Chakraborty等[17]利用3D雷达结合IMU实现了苹果树和葡萄藤的精准建模。然而,点云建模也存在不足,主要是点云数据存在的噪声和稀疏性导致模型精度下降;且果实相对较小,难以通过激光雷达准确还原果实的空间位置和形状;同时,激光雷达设备价格较高,增加了应用成本[18-21]。
近年来,基于深度学习的三维重建方法备受关注。其中,神经辐射场(Neural radiance field, NeRF)技术是一种新颖的隐式三维表示方法,通过神经网络学习场景的几何结构和外观,并使用体渲染实现高质量的新视角合成[22]。NeRF在三维重建领域取得了显著的成果,但尚未被广泛应用于果树场景。Adamkiewicz等[23]将NeRF用于机器人导航,展示了其在不同环境中的适用性。Shen等[24]提出了基于NeRF的非视线成像技术,实现了复杂场景的三维重建。Hong等[25]开发了Inspection-Nerf,用于大坝表面检查,显示了NeRF在工业检测中的潜力。Gao等[26]提出的MPS-NeRF实现了从多视角图像生成高保真三维人体模型。Deng等[27]提出了FoV-NeRF,通过聚焦渲染优化了虚拟现实中的视点合成效果。NeRF的主要优势为高质量的视角合成能力、对复杂场景和动态场景的适应性以及高精度的重建表现。将NeRF引入果树的三维重建任务中,可以有效解决传统方法在复杂环境下的局限性,提供更高精度、语义丰富的三维点云模型,为精准农业中的自动化处理提供更强大的技术支持。
如何准确分割果实点云是本研究的关键。近年来,基于深度学习的三维点云分割方法引起了广泛关注。PointNet[28]及其变体PointNet++[29]是最早的经典方法,能够高效处理点云数据,但在大规模场景中效率较低。PointRCNN[30]通过直接生成候选区域提高了检测精度,但开销较大。PV-RCNN[31]结合点云和体素的优点,提升了检测效果,但网络结构复杂、训练过程繁琐。VoteNet[32]采用投票机制适应复杂三维环境,但在处理稀疏点云时精度下降。作为一种轻量级网络,RandLA-Net[33]通过随机采样和局部特征聚合,显著提升了计算效率,并能在大规模场景中保持高精度,尤其适用于资源有限的环境和果实点云分割任务。本研究基于RandLA-Net的优势,并对其进行改进,增加双边增强模块,以便更好地捕捉果实的局部几何特征和全局空间关系。此外,还采用了更适合果实点云分割的损失函数,进一步提升网络的分割精度和鲁棒性,使其能够在复杂的果树点云中更准确地检测和分割果实,同时保持较高的计算效率。
本研究旨在解决复杂果园环境下的果实精准分割的问题。通过引入NeRF进行高质量三维建模,并结合改进的RandLA-Net进行语义分割,以期能够有效提升果实点云的分割精度和效率,从而为果园自动化管理提供新的技术支持。
1. 材料与方法
1.1 试验材料
研究地点位于中国广东省肇庆市四会市黄田镇柑橘园(23°36'N, 112°68'E),如图1所示,本研究选取的40棵柑橘树年龄相近,生长环境条件良好,且还未进行果实收获,试验于2024年1月进行。此时的柑橘正处于成熟期,该阶段的主要任务为果实采摘。
1.2 原始数据采集方法
使用OAK-D-PRO相机在离果树树干约2 m、离地约1.5 m的位置对果树进行环绕拍摄录制果树的RGB视频。数据采集在室外自然光条件下进行,本次采集包含处于成熟期且未进行收获作业的40棵柑橘果树的RGB视频。录制视频分辨率为
1920 ×1080 ,帧率为30帧/s。为了方便后续的三维重建工作,本研究从视频里每2帧图片提取出1帧来作为数据集。OAK-D-PRO相机的具体参数如表1所示。表 1 相机参数表Table 1. Camera parameter table相机
Camera视场角/(°)
Field of view (FOV)分辨率
Resolution最大帧率/(帧·s−1)
Max frame rate焦距/mm
Focal distance光圈/%
Aperture镜头尺寸
Lens size像素/(µm×µm)
Pixel对角
Diagonal水平
Horizontal垂直
VerticalRGB 78 66 54 12( 4032 ×3040 )60 4.81 1.8±5 1/2.3” 1.55×1.55 OAK-D-PRO 82 72 50 1( 1280 ×800)120 2.35 2.0±5 1/4” 3×3 1.3 三维重建技术的应用
基于NeRF对果树进行三维重建。在进行三维重建之前,需要使用Colmap来计算相机的位姿,Colmap支持自动化的特征提取、匹配、增量式结构从SfM以及稠密重建等功能,能够在不依赖特定硬件的情况下,生成高精度的三维模型[34]。Colmap首先对每张输入图像提取尺度不变特征变换(Scale-invariant feature transform, SIFT)特征点,通过基于FLANN(Fast library for approximate nearest neighbors)的近邻匹配算法进行特征匹配,并使用(随机抽样一致性Random sample consensus, RANSAC)算法剔除错误匹配点获得可靠的匹配对。在此基础上,算法选择最佳的初始图像并利用五点算法估计相对位姿。接着通过增量式SfM方法,利用PnP算法逐步计算其他图像的位姿,最后使用光束平差法(Bundle adjustment, BA)进行全局优化,得到准确的相机位姿参数[35],相机位姿如图2所示。
获取相机的位置和姿态信息后,将这些数据与对应的RGB图像一起输入到NeRF模型中,NeRF网络结构如图3所示。NeRF通过对场景进行密集采样,并使用多层感知机(Multi-layer perceptron, MLP)来预测每个位置的体积密度和视角依赖的辐射率,从而实现从新视角生成高质量图像的能力。
在NeRF处理的最终阶段,模型输出用于构建果树的详细点云图。这些点云图不仅捕捉了果树与果实的几何结构和颜色信息,还能反映出树体的复杂纹理和枝杈分布,为后续的农业应用如果实成熟度判断,果实自动化采摘、果树的自动化修剪和健康监测提供精确的三维数据。
从图4可以看出,通过Colmap和NeRF的结合,本研究能够实现对果树的精确三维重建。此外,该方法为使用非侵入性方式获取果树三维结构数据提供了一种新的技术途径,具有推广到其他植物或复杂场景的潜力。
1.4 果实数据集制作
完成三维重建后,使用CloudCompare软件对生成的点云数据进行处理。CloudCompare是一款强大的三维点云处理软件,能够对点云数据进行精细的分割和标签化。在本研究中,CloudCompare使用步骤如下:使用CloudCompare的分割工具对果树的点云数据进行手动分割,将果实从整体点云中分离出来。此过程通过视觉检查和手动选取果实部分的点云完成,确保果实点云的准确分割;在成功分割出果实点云后,对点云数据进行标签化处理。每个果实点云均被赋予标签,以便在后续的数据分析和处理中能够进行准确地识别和使用。本试验一共重建了35棵果树,包含560个果实,按照果树所处的种植行对数据进行划分,将1~6行的果树数据分别划分为6个子集。通过上述步骤,构建一个包含精确果实点云的高质量数据集。该数据集不仅保留了果树整体结构的信息,还提供了详细的果实点云数据,为后续的果实检测与分析提供了坚实的数据基础。
1.5 RandLA-Net改进
1.5.1 RandLA-Net网络
RandLA-Net是一种专为大规模点云语义分割设计的端到端的神经网络。它通过编码和解码结构,并利用跳跃连接(Skip Connection)和MLP作为基本单元,显著提高了点云处理的效率。RandLA-Net 依赖于随机采样(Random sampling,RS)原则和局部特征聚合(Local feature aggregation,LFA)模块,实现高效的点云语义分割。
在处理大规模点云时,RandLA-Net不需要额外的预处理或后处理步骤,极大地减少了内存消耗,使得大规模点云可以快速分割。在编码阶段,通过局部特征聚合算法,每一层点的特征得以丰富和学习,并通过随机采样减少点云的规模。在解码阶段,使用线性插值和 K 近邻算法(KNN)获取最近点进行上采样,并通过跳跃连接将编码端的特征叠加,然后输入共享的 MLP 进行特征维度的缩减。最后通过若干全连接层进行分类预测。RandLA-Net的具体结构图见图5。
图 5 RandLA-Net的结构N代表输入点的数量,din代表每个点的特征维度,n_classes代表点的种类数,数字代表特征的通道数。FC、LFA、RS、MLP、US分别表示全连接层、局部特征聚合、随机采样、多层感知器、上采样。Figure 5. Structure of RandLA-NetN represents the number of input points, din represents the Characteristic dimension of each point, n_classes represents the number of point categories, numbers represent the feature channel dimensions. FC, LFA, RS, MLP and US stand for fully connected layer, local feature aggregation, random sampling, multi-layer perceptron, and upsampling, respectively.1.5.2 双边增强模块
RandLA-Net网络在进行局部空间编码后,简单地把点的几何信息进行融合,然而对于大部分数据来说,数据里还可能包括大量的语义信息如点的颜色、反射强度、类别标签等,会造成网络并不能充分利用并学习到点之间的差异,从而使网络性能下降。果实点云的分割需要高度精确地区分果实与周围的环境,这在高密度植被中尤具挑战性。果实通常体积较小且与其他植物部件在空间上紧密相连,这使得普通的点云处理网络难以准确分割。为了解决这个问题,本研究设计了一个双边增强模块(Bilateral enhancement module, BEM),提高网络在捕捉一些复杂结构,特别是在形状不规则的果树环境里的特征的能力。BEM通过邻域查找、局部上下文提取、双边偏移估计、上下文增强和混合局部特征步骤实现特征增强,具体操作如下。
首先,对于每个点
$ i $ ,使用KNN找到其邻域点集合$ N({p}_{i} $ ):$$ N({p}_{i}=\{{p}_{j}|{p}_{j}\in \mathrm{k}-\mathrm{N}\mathrm{N}\left({p}_{i}\right)\} \text{,} $$ (1) 式中,
$ i $ 为当前处理的点,$ j $ 为点$ i $ 的邻域点。局部上下文提取公式如下所示:
$$ {G}_{{\psi }\mathrm{}}\left({p}_{i}\right)=\left\{{{\boldsymbol{p}}}_{{\boldsymbol{j}}}-{{\boldsymbol{p}}}_{{\boldsymbol{i}}}|{p}_{j}\in N\left({p}_{i}\right)\right\} \text{,} $$ (2) $$ {G}_{\mathrm{\phi }\mathrm{}}\left({f}_{i}\right)=\left\{{{\boldsymbol{f}}}_{{\boldsymbol{j}}}-{{\boldsymbol{f}}}_{{\boldsymbol{i}}}|{p}_{j}\in N\left({f}_{i}\right)\right\} \text{,} $$ (3) 式中,
$ {G}_{\mathrm{\psi }\mathrm{}}\left({p}_{i}\right) $ 为点$ i $ 的局部几何上下文,$ {G}_{\mathrm{\phi }\mathrm{}}\left({f}_{i}\right) $ 为点$ i $ 的局部语义上下文,$ {{\boldsymbol{p}}}_{{\boldsymbol{j}}}-{{\boldsymbol{p}}}_{{\boldsymbol{i}}} $ 为邻域点$ j $ 相对于点$ i $ 的位移向量,$ {{\boldsymbol{f}}}_{{\boldsymbol{j}}}-{{\boldsymbol{f}}}_{{\boldsymbol{i}}} $ 为邻域点$ j $ 相对于点$ i $ 的特征向量差。通过MLP对局部几何和语义上下文进行处理,估计出邻域点和特征的偏移量,计算公式如下所示。
$$ \mathrm{\Delta }{p}_{j}={{\mathrm{MLP}}}_{{\mathrm{geo}}}\left[{G}_{\mathrm{\phi }\mathrm{}}\left({f}_{i}\right)\right] \text{,} $$ (4) $$ {\widetilde{p}_{j}}={p}_{j}+\mathrm{\Delta }{p}_{j} \text{,} $$ (5) $$ \mathrm{\Delta }{f}_{j}={{\mathrm{MLP}}}_{{\mathrm{sem}}}\left[{G}_{\mathrm{\psi }\mathrm{}}\left({p}_{i}\right)\right] \text{,} $$ (6) $$ {\widetilde{f}_{j}}={f}_{j}+\mathrm{\Delta }{f}_{j} \text{,} $$ (7) 式中,
$ \mathrm{\Delta }{p}_{j} $ 与$ \mathrm{\Delta }{f}_{j} $ 为估计的邻域点$ j $ 的几何偏移和语义偏移,$ {{\mathrm{MLP}}}_{{\mathrm{geo}}} $ ,$ {{\mathrm{MLP}}}_{{\mathrm{sem}}} $ 为MLP网络,用于估计几何偏移和语义偏移,$ {\widetilde{p}_{j}} $ 与$ {\widetilde{f}_{j}} $ 是邻域点$ j $ 增强后的几何特征与语义特征。将增强后的几何和语义特征拼接起来,形成增强后的局部上下文(
$ {\widetilde{G}_{i}} $ )。$$ {\widetilde{G}_{i}}={{\mathrm{MLP}}}_{{\mathrm{fusion}}}\left({\widetilde{p}_{j}}\oplus {\widetilde{f}_{j}}\right){\text{,}} $$ (8) 式中,
$ {{\mathrm{MLP}}}_{{\mathrm{fusion}}} $ 用于融合几何和语义特征,$ \oplus $ 是拼接操作,将增强后的几何和语义特征拼接在一起。对增强后的局部上下文信息进行聚合,形成最终的点特征表示(
$ {s}_{i} $ )。$$ {s}_{i}=\mathrm{c}\mathrm{o}\mathrm{n}\mathrm{c}\mathrm{a}\mathrm{t}\left[{max}_{j\in \mathrm{N}\left(\mathrm{i}\right)}\left({\widetilde{G}_{i}}\right),{{\mathrm{mean}}}_{j\in \mathrm{N}\left(\mathrm{i}\right)}\left({\widetilde{G}_{i}}\right)\right]{\text{,}} $$ (9) 式中,concat代表拼接操作,max代表对增强后的局部上下文
$ {\widetilde{G}_{i}} $ 进行最大池化,mean代表对增强后的局部上下文$ {\widetilde{G}_{i}} $ 进行加权平均。1.5.3 损失函数
在自制的果树数据集中,本研究的分割目标果实点云的占比很小,约占总点云数量的8%,为了应对数据集中存在的类不平衡问题,即不同的标签样本数量可能存在明显差距,RandLA-Net采用的损失函数是加权交叉熵损失函数(Weighted cross-entropy loss, WCEL),此外,本研究引入焦点损失(Focal loss, FL)与戴斯损失(Dice loss, DL)。加权交叉熵损失函数是在标准交叉熵损失函数的基础上,对不同类别分配不同的权重,以应对类别不平衡的问题。其定义如下:
$$ {L}_{\mathrm{W}\mathrm{C}\mathrm{E}}=-{\sum }_{i=1}^{N}{w}_{{y}_{i}}\left[{y}_{i}\mathrm{lg}\left(\widehat{{y}_{i}}\right)+\left(1-{y}_{i}\right)\mathrm{lg}\left(1-\widehat{{y}_{i}}\right)\right] \text{,} $$ (10) 式中,
$ {y}_{i} $ 是第$ i $ 个样本的真实标签,取值为0或1。$ \widehat{{y}_{i}} $ 是第$ i $ 个样本被预测为正类的概率,$ {w}_{{y}_{i}} $ 是与第$ i $ 个样本真实标签对应的权重,N是样本的总数。焦点损失是为了处理类别极度不平衡问题而设计的,它在标准交叉熵损失的基础上增加了1个调制因子,以减少易分类样本的权重。其定义如下:
$$ {L}_{{\mathrm{F}}}=-{\sum }_{i=1}^{N}\alpha {\left(1-\widehat{{y}_{i}}\right)}^{\gamma }{y}_{i}\mathrm{lg}\left(\widehat{{y}_{i}}\right) \text{,} $$ (11) 式中, α是平衡因子,用于平衡正负样本,
$ \gamma $ 是调制因子,控制难易样本的权重,通常取值为 [0, 5] 。戴斯损失主要用于分割任务,它基于戴斯系数设计,能够有效处理类别不平衡和预测不稳定的问题。其定义如下:
$$ {L}_{{\mathrm{D}}}=1-\frac{2{\displaystyle\sum }_{i=1}^{N}{y}_{i}\widehat{{y}_{i}}}{{\displaystyle\sum }_{i=1}^{N}{y}_{i}+{\displaystyle\sum }_{i=1}^{N}\widehat{{y}_{i}}} 。 $$ (12) 2. 结果与分析
2.1 试验设计
本研究使用自制的果树数据集来评估所提出的方法。在单个GeForce RTX3090GPU上进行训练,项目使用Linux系统和TensorFlow2.60框架实现。在训练过程中,将数据集其中的1个子集作为验证集,剩余的5个子集作为训练集进行模型训练,并计算模型在验证集上的表现。此过程重复6次,每次选择1个不同的子集作为验证集。最终,模型的性能通过6次验证试验的平均值来衡量。这种方法可以有效地减少模型评估中因数据划分带来的随机性,从而提供更加稳定和可靠的性能估计。在本研究中,模型训练采用了以下超参数设置:训练轮数(Epochs)设为100;批次大小(Batch size)为6;优化器(Optimizer)选用Adam;学习率(Learning rate)设定为0.01;学习率衰减系数(lr_decay)为0.95;K近邻(KNN)参数设为16。
2.2 评价指标
采用平均分类准确率(Mean accuracy, mAcc)、总体分类准确率(Overall accuracy, OA)、交并比(Intersection over union, IoU)和平均交并比(Mean intersection over union, mIoU) 4个指标来评价模型在自制数据集上的性能。IoU表示预测区域与真实区域的交集与并集的比值,mIoU则是所有类别IoU的平均值。计算公式如下。
$$ \mathrm{m}\mathrm{A}\mathrm{c}\mathrm{c}=\frac{1}{N}{\sum }_{i=1}^{N}{A}_{i} \text{,} $$ (13) $$ \mathrm{O}\mathrm{A}=\frac{\mathrm{T}\mathrm{P}+\mathrm{T}\mathrm{N}}{\mathrm{T}\mathrm{P}+\mathrm{T}\mathrm{N}+\mathrm{F}\mathrm{P}+\mathrm{F}\mathrm{N}} \text{,} $$ (14) $$ \mathrm{m}\mathrm{I}\mathrm{o}\mathrm{U}=\frac{\mathrm{T}\mathrm{P}}{\mathrm{T}\mathrm{P}+\mathrm{F}\mathrm{P}+\mathrm{F}\mathrm{N}} \text{,} $$ (15) 式中,
$ {A}_{i} $ 表示第i类的准确率,N为类别总数,TP为真阳性(True positive),TN为真阴性(True negative),FP为假阳性(False positive),FN为假阴性(False negative)。2.3 BEM对模型性能的影响
以RandLA-Net网络为基准网络,在网络的编码器层后面加入双边增强模块。这样能最低程度增加模型的复杂程度,从而处理高层次的全局特征,提升全局特征的表达能力。为了直观地体现双边增强模块的有效性,在相同的试验条件下使用RandLA-Net与增加了双边增强模块的RandLA-Net对自建的果树数据集进行分割,得到的结果如表2所示,与基准网络RandLA-Net相比,加入BEM的RandLA-Net在各项评估指标上均有所提升。具体而言,mAcc提高了1.33个百分点,mIoU提高了2.64个百分点,特别是在果实这一类别的IoU上,性能提升更为显著,达到了4.8个百分点,OA也有小幅提升,从96.3%增加到96.5%。这些结果充分证明加入BEM的模型在保持整体性能的同时重点加强了对关键目标的识别能力,这对果实点云的分割任务来说尤为重要。值得注意的是,在2个模型训练过程中的每批次耗时几乎相当,即使加入BEM会给网络增加新的计算量,但耗时比基准网络平均少2.52ms。BEM引入的流动性和更新机制,使得优化过程更加高效,从而略微减少了每个批次的训练时间。
表 2 BEM对模型性能的影响Table 2. Influence of BFM on model performance模型 Model mAcc/% mIoU/% OA/% $ \mathrm{I}\mathrm{o}{\mathrm{U}}_{\mathrm{f}\mathrm{r}\mathrm{u}\mathrm{i}\mathrm{t}} $/% t/ms RandLA-Net 87.45 85.24 96.3 74.76 228.64 RandLA-Net+BEM 88.78 87.88 96.5 79.56 226.12 试验结果表明,BEM不仅显著提升了模型的分割性能,特别是对关键类别果实的分割能力,且并未增加额外的计算负担。这种性能的提升和计算效率的优化,使得改进后的模型更适用于实际应用场景中的果树点云分割任务。
2.4 损失函数对模型性能的影响
为解决点云数据中类别比例不平衡的问题,本研究探讨了不同损失函数对分割性能的影响。以使用WCEL的RandLA-Net+BEM为基准网络,对比使用FL、DL以及FL+DL组合。试验结果如表3所示,不同的损失函数对模型的分割性能产生了显著影响,尤其是在关键指标果实IoU上。基准网络采用的WCEL通过为不同类别分配不同权重来平衡类别差异,在所有指标上都取得了较好的表现。FL虽通过自适应调整样本权重来增强对少数类别的学习能力,但由于类别不平衡问题与空间分布特征相关,其性能略低于基准网络。单独使用DL时性能最差,果实IoU仅为65.79%,这主要是因为在处理样本数量差异大的点云数据时,其梯度优化不稳定,难以有效学习类别特征。FL+DL组合在果实分割任务中表现最为出色,果实IoU达到82.09%,相比基准网络提升了2.53个百分点,同时获得了最高的mIoU(88.76%),比基准网络提升了0.88个百分点,表明该组合不仅增强了模型对样本较少目标的分割性能,还提升了整体分割性能。各损失函数在背景类别的IoU上的表现均比较优越(93.27%~96.21%),表明模型在样本目标较多时能保持分割性能的稳定。FL+DL组合的优异表现可归因于其互补性,FL通过动态调整样本权重有效缓解了类别不平衡问题,而DL则专注于提高整体分割准确性,尤其在处理小目标和优化边界区域方面表现卓越。这种组合实现了点和区域级别的协同优化,在保持高分类准确率的同时,显著提高了区域分割质量,特别是对于数量较少的果实点云。总体而言,试验结果强有力地支持了FL+DL组合在处理类别不平衡和提高果实分割精度方面的优越性,为优化果树点云分割任务提供了有效的解决方案。
表 3 损失函数对模型性能的影响Table 3. Influence of loss functions on model performance% 损失函数
Loss functionmAcc mIoU IoU 果实 fruit 背景 background WCEL 88.78 87.88 79.56 96.21 FL 83.54 86.43 77.91 96.11 DL 71.82 75.95 65.79 93.27 FL+DL 87.99 88.76 82.09 96.16 2.5 结果可视化及分析
为直观展示本文提出的改进,在RandLA-Net基础上添加BEM并采用FL与DL组合损失函数所带来的性能提升,图6展示了原版RandLA-Net与改进后模型的分割效果,以地面真值(Ground-truth)为参考。对比结果显示,改进后的模型在果实边界分割和整体识别上均明显优于原版RandLA-Net。这种提升主要归因于两方面:首先,本文设计的BEM不仅捕获局部几何信息,还将局部语义信息纳入特征提取过程,显著增强了果实点云与背景点云的特征区分度;其次,组合损失函数的应用对识别数量较少的果实点云起到了关键作用。
这种改进方案不仅从总体上提升了网络的分割能力,并且对于本研究数据集中所出现的类不平衡问题也有很大程度地改善。这对于果实的估产来说十分重要,在一些小果实的分割处理上,改进模型的效果也优于RandLA-Net。可视化结果有力地支持了前文中定量分析的结论,证实了本研究方法在果树点云分割任务中的有效性。
3. 结论
本研究提出了一种基于NeRF和RandLA-Net的柑橘果树三维重建与果实语义分割方法。试验结果表明,改进后的RandLA-Net在果实语义分割任务中表现出色,mIoU提高了2.64个百分点,果实IoU提升了7.33个百分点,显著增强了模型分割能力。这证实了引入BEM和优化损失函数能有效提高复杂果树场景的处理能力。此外,研究发现损失函数的选择对结果有显著影响,采用更适合果实点云分割任务的损失函数能进一步提升性能。综上所述,本文提出的方法不仅能准确重建果树三维结构和识别果实,还为果园智能管理和自动采摘提供了新的技术支持,这种非破坏性的果树分析方法可以帮助果园管理者更好地掌握果树的生长状况,提高农业生产的效率和质量。未来,将进一步优化算法性能,探索在更大规模果园和不同果树品种上的应用,以及研究与农业机器人系统的集成,实现实时、高效的果实检测和采摘。通过这些深入研究,期望能够进一步推动智慧农业的发展,为农业现代化和可持续发展做出更大贡献。
-
图 1 广东省不同地区土壤养分含量的差异
NG:粤北,EG:粤东,WG:粵西,NWG:粤西北,PRD:珠三角;各小图中不同小写字母表示不同地区间差异显著(P < 0.05,Duncan’s法)
Figure 1. Differences of soil nutrient contents in different areas of Guangdong Province
NG: North Guangdong, EG: East Guangdong, WG: West Guangdong, NWG: Northwest Guangdong, PRD: Pearl River Delta; Different lowercase letters in each figure indicate significant differences among different areas (P < 0.05, Duncan’s method)
表 1 采样区概况
Table 1 Information about sampling pots
地区
Region行政市
Administrative city样点数量
Sampling point number气候类型
Climate type土壤类型
Soil type粤北
North Guangdong韶关 100 亚热带季风气候 以红壤为主,风化程度深,富铁铝化作用明显,质地较黏重 粤东
East Guangdong梅州 102 亚热带季风气候 以赤红壤、黄壤为主 粤西
West Guangdong湛江 98 热带北缘季风气候 有赤红壤、砖红壤,土层深厚,质地黏重,呈强酸性反应,铁铝富集最为显著 粤西北
Northwest Guangdong肇庆 99 南亚热带季风气候 以赤红壤为主,农田土壤整体偏酸 珠三角
Pearl River Delta惠州 65 亚热带季风气候 有红壤、赤红壤和黄壤,以赤红壤类型分布最广,土壤呈酸性,阳离子交换量较低,矿质养分较贫乏 珠海 50 亚热带季风海洋性
气候有红壤和赤红壤,红壤面积较少,分布不广,300 m以上的丘陵台地多分布有红壤 表 2 广东省各地区的土壤养分模型预测效果1)
Table 2 Prediction performance of soil nutrient models in different areas of Guangdong Province
指标
Index地区
AreaSEC RSQ SECV 1-VR 有机质
Soil organic matter粤北 4.260 2 0.662 2 5.666 3 0.406 5 粤东 10.191 2 0.476 4 11.699 5 0.337 7 粤西 3.803 4 0.837 8 7.071 8 0.595 1 粤西北 3.985 1 0.831 1 5.032 2 0.735 8 珠三角 5.057 6 0.817 2 6.123 1 0.729 5 全氮
Total nitrogen粤北 0.107 4 0.898 6 0.180 9 0.731 9 粤东 0.295 9 0.784 0 0.382 5 0.646 6 粤西 0.219 8 0.660 5 0.347 6 0.336 7 粤西北 0.245 3 0.704 7 0.310 4 0.540 2 珠三角 0.245 4 0.789 8 0.308 9 0.677 0 可溶性有机碳
Dissolved organic carbon粤北 24.437 4 0.694 1 26.896 4 0.641 1 粤东 31.206 8 0.141 4 34.763 2 0.043 9 粤西 25.987 2 0.471 5 30.433 7 0.324 5 粤西北 31.937 4 0.281 6 33.930 4 0.216 6 珠三角 27.896 4 0.132 6 30.310 7 −0.021 7 碱解氮
Available nitrogen粤北 61.912 7 0.108 7 72.340 4 −0.040 3 粤东 50.192 4 0.323 6 57.612 0 0.148 8 粤西 42.216 6 0.380 4 53.081 4 0.130 4 粤西北 19.314 8 0.731 4 25.338 4 0.536 7 珠三角 20.557 2 0.820 0 27.365 0 0.685 0 速效磷
Available phosphorus粤北 15.325 8 0.225 1 18.882 4 0.077 8 粤东 24.353 7 0.070 1 27.115 0 −0.040 5 粤西 31.471 9 0.482 7 34.417 0 0.374 3 粤西北 18.240 2 0.647 6 28.404 3 0.400 4 珠三角 28.844 6 0.694 9 35.797 0 0.546 2 1) SEC:定标标准误差;RSQ:定标相关系数;SECV:交互验证标准误差;1-VR:交叉验证相关系数
1) SEC: Standard error of calibration; RSQ: Coefficient of determination for validation; SECV: Standard error of cross validation; 1-VR: 1 minus the variance ration -
[1] 赵其国, 孙波, 张桃林. 土壤质量与持续环境Ⅰ: 土壤质量的定义及评价方法[J]. 土壤, 1997(3): 113-120. [2] 张甘霖, 朱永官, 傅伯杰. 城市土壤质量演变及其生态环境效应[J]. 生态学报, 2003, 23(3): 539-546. [3] XIAO R, SU S, ZHANG Z, et al. Dynamics of soil sealing and soil landscape patterns under rapid urbanization[J]. Catena, 2013, 109: 1-12. doi: 10.1016/j.catena.2013.05.004
[4] 江恩赐, 陈林, 颜继忠, 等. 智能高光谱成像融合CARS特征波段筛选快速检测硫熏牛膝SO2含量[J]. 中国中药杂志, 2022, 47(7): 1864-1870. [5] 王巧华, 马逸霄, 付丹丹. 基于光谱技术的禽蛋内部品质无损检测研究进展[J]. 华中农业大学学报, 2021, 40(6): 220-230. [6] 宋亮, 刘善军, 虞茉莉, 等. 基于可见−近红外和热红外光谱联合分析的煤和矸石分类方法研究[J]. 光谱学与光谱分析, 2017, 37(2): 416-422. [7] BADARÓ A T, MORIMITSU F L, FERREIRA A R, et al. Identification of fiber added to semolina by near infrared (NIR) spectral techniques[J]. Food Chemistry, 2019, 289: 195-203. doi: 10.1016/j.foodchem.2019.03.057
[8] 孙园园, 蔡怡聪, 谢黎虹, 等. 近红外光谱分析技术在稻米品质测定和遗传分析中应用研究概述[J]. 中国稻米, 2016, 22(6): 1-3. [9] MENDES DE OLIVEIRA D, FONTES L M, PASQUINI C. Comparing laser induced breakdown spectroscopy, near infrared spectroscopy, and their integration for simultaneous multi-elemental determination of micro-and macronutrients in vegetable samples[J]. Analytica Chimica Acta, 2019, 1062: 28-36. doi: 10.1016/j.aca.2019.02.043
[10] ELLE O, RICHTER R, VOHLAND M, et al. Fine root lignin content is well predictable with near-infrared spectroscopy[J]. Scientific Reports, 2019, 9: 6396. doi: 10.1038/s41598-018-37186-2
[11] BELLON-MAUREL V, MCBRATNEY A. Near-infrared (NIR) and mid-infrared (MIR) spectroscopic techniques for assessing the amount of carbon stock in soils: Critical review and research perspectives[J]. Soil Biology and Biochemistry, 2011, 43(7): 1398-1410. doi: 10.1016/j.soilbio.2011.02.019
[12] 刘燕德, 熊松盛, 刘德力. 近红外光谱技术在土壤成分检测中的研究进展[J]. 光谱学与光谱分析, 2014, 34(10): 2639-2644. [13] VELASQUEZ E, LAVELLE P, BARRIOS E, et al. Evaluating soil quality in tropical agroecosystems of Colombia using NIRS[J]. Soil Biology and Biochemistry, 2005, 37(5): 889-898. doi: 10.1016/j.soilbio.2004.09.009
[14] DE SANTANA F B, DE SOUZA A M, POPPI R J. Visible and near infrared spectroscopy coupled to random forest to quantify some soil quality parameters[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2018, 191: 454-462. doi: 10.1016/j.saa.2017.10.052
[15] JOUQUET P, HENRY-DES-TUREAUX T, MATHIEU J, et al. Utilization of near infrared reflectance spectroscopy (NIRS) to quantify the impact of earthworms on soil and carbon erosion in steep slope ecosystem: A study case in Northern Vietnam[J]. Catena, 2010, 81(2): 113-116. doi: 10.1016/j.catena.2010.01.010
[16] 张欣跃, 赵玉国, 刘峰, 等. 基于可见−近红外光谱与化学属性的土壤来源地判别[J]. 土壤学报, 2019, 56(5): 1060-1071. [17] MOUAZEN A M, KUANG B, DE BAERDEMAEKER J, et al. Comparison among principal component, partial least squares and back propagation neural network analyses for accuracy of measurement of selected soil properties with visible and near infrared spectroscopy[J]. Geoderma, 2010, 158(1/2): 23-31. doi: 10.1016/j.geoderma.2010.03.001
[18] 李伟, 张书慧, 张倩, 等. 近红外光谱法快速测定土壤碱解氮、速效磷和速效钾含量[J]. 农业工程学报, 2007, 112(1): 55-59. [19] 赵明松, 谢毅, 陆龙妹, 等. 基于高光谱特征指数的土壤有机质含量建模[J]. 土壤学报, 2021, 58(1): 42-54. [20] 陈秋宇, 杨仁敏, 朱长明. 基于 VIS-NIR 光谱的互花米草入侵湿地土壤有机碳预测研究[J]. 土壤学报, 2021, 58(3): 694-703. [21] QIAO Y, ZHANG S. Near-infrared spectroscopy technology for soil nutrients detection based on LS-SVM[C]//International Conference on Computer and Computing Technologies in Agriculture. Berlin, Heidelberg: Springer, 2012: 325-335.
[22] 陈滢伊, 司友涛, 鲍勇, 等. 隔离降雨对亚热带米槠天然林土壤可溶性有机质数量及光谱学特征的影响[J]. 应用生态学报, 2019, 30(9): 2964-2972. [23] LIU S, ZHU Y, LIU L, et al. Cation-induced coagulation of aquatic plant-derived dissolved organic matter: Investigation by EEM-PARAFAC and FT-IR spectroscopy[J]. Environmental Pollution, 2018, 234: 726-734. doi: 10.1016/j.envpol.2017.11.076
[24] 刘雪梅, 柳建设. 基于MC-UVE的土壤碱解氮和速效钾近红外光谱检测[J]. 农业机械学报, 2013, 44(3): 88-91. [25] 贾生尧, 杨祥龙, 李光, 等. 近红外光谱技术结合递归偏最小二乘算法对土壤速效磷与速效钾含量测定研究[J]. 光谱学与光谱分析, 2015, 35(9): 2516-2520. [26] 方向, 金秀, 朱娟娟, 等. 基于可见−近红外光谱预处理建模的土壤速效氮含量预测[J]. 浙江农业学报, 2019, 31(9): 1523-1530. [27] 汪六三, 鲁翠萍, 王儒敬, 等. 土壤碱解氮含量可见/近红外光谱预测模型优化[J]. 发光学报, 2018, 39(7): 1016-1023. [28] 何电源. 华南热带土壤养分含量状态及肥力评价[J]. 土壤学报, 1983, 20(2): 154-166. [29] 孟鑫鑫, 于雷, 周勇, 等. 基于可见近红外和中红外近地面光谱数据融合的土壤有机碳含量反演[J]. 土壤通报, 2022, 53(2): 301-307. [30] SHI Z, WANG Q L, PENG J, et al. Development of a national VNIR soil-spectral library for soil classification and prediction of organic matter concentrations[J]. Science China Earth Sciences, 2014, 57(7): 1671-1680. doi: 10.1007/s11430-013-4808-x
[31] TZIOLAS N, TSAKIRIDIS N, OGEN Y, et al. An integrated methodology using open soil spectral libraries and Earth Observation data for soil organic carbon estimations in support of soil-related SDGs[J]. Remote Sensing of Environment, 2020, 244: 111793. doi: 10.1016/j.rse.2020.111793
[32] 鲁如坤. 土壤农业化学分析方法[M]. 北京: 中国农业科技出版社, 1999: 146-191. [33] 刘磊, 沈润平, 丁国香. 基于高光谱的土壤有机质含量估算研究[J]. 光谱学与光谱分析, 2011, 31(3): 762-766. [34] 张雪莲, 李晓娜, 武菊英, 等. 不同类型土壤总氮的近红外光谱技术测定研究[J]. 光谱学与光谱分析, 2010, 30(4): 906-910. [35] 王昶. 近红外光谱快速评估土壤和有机肥质量研究[D]. 南京: 南京农业大学, 2014. [36] BEN-DOR E, HELLER D, CHUDNOVSKY A. A novel method of classifying soil profiles in the field using optical means[J]. Soil Science Society of America Journal, 2008, 72(4): 1113-1123. doi: 10.2136/sssaj2006.0059
[37] 曾招兵, 曾思坚, 汤建东, 等. 广东省耕地土壤有效磷时空变化特征及影响因素分析[J]. 生态环境学报, 2014, 23(3): 444-451. [38] 王文俊, 李志伟, 王璨, 等. 高光谱成像的褐土土壤速效钾含量预测[J]. 光谱学与光谱分析, 2019, 39(5): 1579-1585. -
期刊类型引用(5)
1. 许文英. 西南桦的生长特征及栽培技术探讨. 农村科学实验. 2024(07): 82-84 . 百度学术
2. 连晓倩,田云龙,黄健,钟兆全,周垂帆,黄伟,吴鹏飞. 杉木林分密度对套种闽楠树型、光合能力及生物量分配的影响. 林业科学研究. 2024(05): 13-22 . 百度学术
3. 余清海. 不同基质·遮阴强度对盐肤木种子萌发的影响. 安徽农业科学. 2023(23): 90-92+103 . 百度学术
4. 代嵩华,黄印冉,冯树香,闫淑芳,刘易超,陈丽英,樊彦聪. 不同遮阴强度对白桦幼苗生长情况的影响. 河北林业科技. 2022(02): 25-27+36 . 百度学术
5. 朱秀征,靳超,房丽莎,刘震,王艳梅,蔡齐飞,李志,耿晓东. 不同密度下山桐子自然整枝差异性分析. 河南科学. 2022(08): 1257-1263 . 百度学术
其他类型引用(3)