Applicability of the relationship between stand DBH and height to evaluate the site quality of major coniferous stands in China
-
摘要:目的
建立科学的立地质量评价体系,指导林业生产实践。
方法根据全国主要针叶林分样地数量情况,划分16个针叶树种组,采用Richards、Logistic和Korf模型拟合导线曲线,构建立地形指数模型,并进行落点检验,运用1999—2018年连续4期清查数据进行立地形等级动态变化分析。
结果Richards、Logistic和Korf模型拟合导向曲线决定系数均值均大于0.95,建立的立地形指数模型落点检验值均大于90.00%,落点检验均值达96.59%,适用于实际生产。20年间,针叶林分Ⅰ级和Ⅱ级均值合计增长了7.60个百分点,Ⅲ级均值合计减少了3.50个百分点,Ⅳ级和Ⅴ级均值合计减少了4.10个百分点,立地质量表现为较好的改善趋势。
结论基于胸径−树高关系建立全国统一的立地质量评价模型具有可行性和合理性,通过减少气候差异导致基于树龄的生长速率对立地质量评价的影响偏差,使不同地区间相同林分的评价结果具有可比性,在大尺度水平具有较好的适用性,但仍然需要警惕经营措施和小样本数据导致的评价结果不确定。
Abstract:ObjectiveTo establish a scientific site quality evaluation system, guide forestry production practice.
MethodBased on the number of major coniferous forest stand plots across the country, 16 coniferous tree groups were classified. The Richards, Logistic, and Korf models were applied to fit the guiding curves and establish a site form index model, which was then validated through a scatter plot test. Data from four consecutive forest inventory periods from 1999 to 2018 were used to analyze dynamic changes in site form levels.
ResultThe mean coefficients of determination for guiding curves fitted with the Richards, Logistic, and Korf models were all above 0.95. The scatter plot validation of the established site form index model showed test values exceeding 90.00%, with an average value of 96.59%, indicating its feasibility for practical use. Over 20 years, site quality for coniferous stands improved, with a combined proportion increase of 7.60 percent in grades I and II, a 3.50 percent decrease in grade III, and a combined reduction of 4.10 percent in grades IV and V.
ConclusionDeveloping a national unified site quality assessment model based on DBH-height relationships is feasible and reasonable. This approach reduces the impact deviations of climate-induced and age-based growth rate on site quality assessment, allowing for comparable site quality evaluations across regions. The model demonstrates good applicability on a large scale, though it is essential to consider potential uncertainties due to management practices and limited sample data.
-
Keywords:
- Site quality /
- DBH-height /
- Dynamic change /
- Coniferous forest stand
-
森林生物量指的是森林范围内生物所含有机物的量,常用干质量表示。作为重要的生态学指标,森林生物量直接反映森林的生产力与碳汇能力,对于评价森林生态系统的结构和功能具有重要作用[1]。传统森林生物量的获取方法通常采用直接收获法,主要有皆伐法[2]、标准木法[3]和相对生长法[4]3种方式,通过对样地内树木伐倒、烘干以及称质量等步骤得到单株树木各部分的生物量,进而得到单株树木生物量和样地生物量。这些方法获取数据存在工作量大、费时费力等不足,且对树木造成不可逆转的损伤。因此如何通过有效的途径快速、无损地获取森林生物量一直是生态学领域的研究热点[5]。
无人机激光雷达(Unmanned aerial vehicle laser scanning,UAV-LS)是一种新兴的遥感技术,能够通过高密度的点云数据获取水平以及垂直结构的森林参数[6],因其高效无损、便捷灵活等优点广泛应用于林业中。目前,基于UAV-LS数据进行森林生物量估测的方法大多依赖于异速生长模型[7],主要是将激光雷达数据中提取的变量与生长模型结合,从而完成生物量估测。其中,将UAV-LS数据衍生的变量(高度百分位数、强度百分位数等)与实测树高、胸径等参数相结合,利用机器学习方法进行地上生物量估算已取得良好效果[8],并且,这一方法进一步拓展到基于机载激光雷达冠层高度与信号强度等变量的结合,构建生物量估测模型[9]。相较于传统回归模型,机器学习方法因其不需要描述预测关系和响应变量而被越来越多地运用在森林清查中[10],特别是在预测碳储量、生物量等方面[11]。除此之外,也有利用UAV-LS提取的单木参数(树高、胸径、冠幅等)在非线性CAR(Constant allometric ratio)模型的基础上进行生物量的估测[12]。
UAV-LS所提取的参数信息已被证实在生物量估测上具有较高的可信度[13],但是,利用树木定量结构模型(Quantitative structure model,QSM)从UAV-LS数据中提取参数估测生物量则鲜有报道。QSM是利用三维模型定量描述和理解树木结构与生长规律的工具,已广泛应用在地基激光雷达(Terrestrial laser scanning,TLS)中,通过TLS点云数据建模并提取树木三维结构参数,进而估算材积[14]、蓄积量[15]、生物量[16]等森林量化指标。同样,QSM利用无人机激光点云进行生物量估测的应用潜力已得到证实[17],特别是在考虑到树木结构和生物量构成组分时,无人机QSM可以成为森林管理活动和决策过程中有效的替代方案[18]。但是,如果数据集的质量太差、点云密度不高时,建模精度便无法保证,会出现生物量被低估的现象[19]。
因此,本研究在获取高密度UAV-LS数据的基础上,基于落叶阔叶林树种进行QSM的构建。通过三维模型提取树木参数,并进一步利用随机森林(Random forest,RF)、多层感知机(Multi-layer perceptron,MLP)和支持向量机(Support vector machine,SVM) 3种机器学习方法进行单木生物量估测,筛选最优单木生物量估测模型,为复杂森林环境下生物量估算提供科学参考。
1. 材料与方法
1.1 研究区概况
研究区位于安徽省六安市金寨县天马国家级自然保护区。保护区地处大别山腹地,生物资源丰富,是北亚热带向暖温带的过渡地域,地理坐标介于115°20′~115°50′E,31°10′~31°20′N,海拔800~
1729 m。保护区属于北亚热带湿润季风气候类型,四季分明,年平均气温13.8 ℃,年平均降雨量1400 mm。保护区总面积约28913.7 hm2,其中核心区5745.3 hm2,缓冲区8118.6 hm2,实验区15049.8 hm2。研究区植被类型属暖温带落叶阔叶林向亚热带常绿阔叶林过渡型,植被垂直分布明显,落叶阔叶林属天然次生林,主要有茅栗Castanea seguinii、短柄枹栎Quercus glandulifera、锐齿槲栎Quercus aliena var. acutiserrata等栎类以及化香Platycarya strobilacea、大别山山核桃Carya dabieshanensis、领春木Euptelea pleiosperma等其他硬阔类树种。样地内最高海拔1103 m,最低海拔1055 m,高度差达48 m,坡度主要集中在22°~36°。1.2 地面样地数据
地面数据的获取来源于2023年3月对落叶阔叶林样地的调查。首先在研究区布设75 m×75 m的大样地,划分为9个25 m×25 m的小样地,利用全站仪获取样地4个至角点坐标,并确定界外木。对样地内胸径(DBH)≥5 cm的乔木进行每木检尺,并记录树种信息。使用TruePulse200激光测距仪测量树高,用胸径卷尺测量胸径,用徕卡DistoD510激光测距仪测量树冠垂直投影距离。同时,将树的基部位置作为定位点,利用华测i86RTK(精度15 mm)记录每株树准确的位置信息,定位点的空间参照采用WGS84坐标系和UTM投影。样地基本概况见表1,除枯死木外,共统计样地内563株阔叶树种。根据相关研究并结合样地实际情况[20],按胸径大小将样地树木划分为4个生活史阶段,分别为小树(5 cm≤DBH<7.5 cm,176株)、中树(7.5 cm≤DBH<22.5 cm,234株)、大树(22.5 cm≤DBH<47.5 cm,140株)以及老树(DBH≥47.5 cm,13株)。在忽略小树后,样地内主要优势树种为茅栗(100株)、短柄枹栎(86株)与化香(63株)。
表 1 样地基本情况Table 1. Basic information of sample plots统计值
Statistical value胸径/cm
DBH树高/m
Tree height平均冠幅/m
Average crown
breadth最大值 Max. 65.50 21.70 12.00 最小值 Min. 5.00 2.00 0.50 平均值 Average 17.03 10.16 3.17 标准差 SD 12.12 4.82 1.67 1.3 UAV-LS数据及预处理
1.3.1 Lidar数据采集
利用大疆M300RTK无人机搭载禅思L1传感器(水平精度:150 m测量距离下误差为5 cm,垂直精度:150 m测量距离下误差为4 cm),同步获取样地近地面的激光雷达数据。在仿地飞行60 m的高度下进行作业,飞行速度为5 m/s,回波模式为三回波并重复扫描,激光旁向重叠率为60%,点云密度达到631 m−2。点云采集过程中,飞行高度越低、速度越慢,点云密度就越大,高密度点云可以更好地描述树木的结构特征。本试验使用的无人机具备载波相位差分技术(Real-time kinematic,RTK),能提供精确的位置信息,其坐标系和投影设置与华测i86RTK保持一致,航线设置如图1所示。
1.3.2 归一化处理
通过开源软件CloudCompare (https://www.cloudcompare.org)对Las格式点云进行去噪处理,再利用CSF(Cloth simulation filter)算法[21]对去噪后的点云进行滤波,分离出地面点与非地面点。最后,将地面点转换为分辨率0.1 m大小的栅格数据,使用拉普拉斯算子对栅格平滑后计算非地面点到该栅格的距离,并将计算的距离作为非地面点的高度,从而完成归一化(图2)。
1.3.3 点云分割
使用LiDAR360软件中集成的相对最短路径算法(Comparative shortest-path algorithm,CSP)对点云进行分割,该算法借鉴了生态学理论,采用自下而上的方式,从点云主干进行搜索,并通过分支到主干的最近距离来判断所属关系,从而完成点云分割。这种方法在落叶期的阔叶树中表现出良好的分割效果[22]。本文研究数据采集时期正是树木的落叶期,枝干点云清晰,符合该算法的应用场景。点云分割精度采用召回率(t)、正确率(p)以及t和p的调和平均值(F)进行评价,三者取值范围均为0到1,数值越接近1表示分割效果越好。计算公式如下:
$$ t = \dfrac{{{\mathrm{TP}}}}{{{\mathrm{TP}} + {\mathrm{FN}}}}{\text{,}} $$ (1) $$ p = \dfrac{{{\mathrm{TP}}}}{{{\mathrm{TP}} + {\mathrm{FP}}}}{\text{,}} $$ (2) $$ F = \dfrac{{2t p}}{{t + p}}{\text{,}} $$ (3) 式中,
${\mathrm{TP}}$ 表示正确分割,指一对一的关系,将树木分割为单独的一株树,即有效单木分割;${\text{FP}}$ 表示过分割,指一对多的关系,把原本属于1个整体的单木分成了多株单木;${\text{FN}}$ 表示欠分割,指1株或几株树被划分到其临近的单木中,且未被检测出来。1.4 树木定量结构模型
树木定量结构模型是重建树木三维模型的方法。目前较为常用的模型有PypeTree[23]、TreeQSM[24]、SimpleTree[25]等,本文将TreeQSM (https://github.com/InverseTampere/TreeQSM)作为试验模型,该模型由芬兰坦佩雷理工大学的Pasi Raumonen等开发,在不同森林类型中均具有较好的普适性,其构建单木模型的核心方法是对点云进行体元化分割,实现对树木几何特征的定量表达,如体积、冠幅、分支角度等。其中,PatchDiam1、PatchDiam2Min和PatchDiam2Max是TreeQSM建模所必需的3个重要参数。建模过程主要分为2个阶段,第一阶段是按照PatchDiam1定义的体元大小进行简单分割;第二阶段是按照设置的最大、最小体元实现精细分割,也可同时添加其他参数实现更具体的分割。其中,在所有样本中随机选取20株树对参数进行敏感性分析,并将最优参数作为其他样本的输入参数。具体参数设置可以参照开发者文档(https://github.com/InverseTampere/TreeQSM/blob/master/Manual)。在完成三维模型后,提取胸径、主干体积、枝干体积、分支数、冠层基部高度、冠层面积、冠层体积以及冠幅等参数,并且为保证建模效果具有稳定性,每个样本获取20组树木定量结构模型,各个参数取其平均值作为最终结果。
1.5 单木生物量模型构建及精度评价
1.5.1 地上生物量计算
按照《主要树种立木生物量模型与碳计量参数》标准(GB/T 43648—2024)[26]计算单木生物量,研究区内栎树采用南方其他省份栎树分布区对应的计算公式,而其他阔叶树则采用全国通用的其他硬阔树地上生物量公式,具体如下:
$$ M = 0.213\;6{D^{2.304\;16}}{\text{,}} $$ (4) $$ M = 0.187\;5{D^{2.333\;00}}{\text{,}} $$ (5) 式中,M为地上生物量估计值,D为林木胸径。式(4)为栎树公式,式(5)为其他阔叶树公式。
1.5.2 建模变量筛选
利用Pearson相关系数(r)和方差膨胀因子(Variance inflation factor,VIF)进行特征筛选,移除共线性变量,具体计算公式如下:
$$ r=\dfrac{{\displaystyle\sum }_{i=1}^{n}({X}_{i}-\overline {X})({Y}_{i}-\overline {Y})}{\sqrt{{\displaystyle\sum }_{i=1}^{n}{({X}_{i}-\overline {X})}^{2}}\sqrt{{\displaystyle\sum }_{i=1}^{n}{({Y}_{i}-\overline {Y})}^{2}}}, $$ (6) $$ {{\mathrm{VIF}}}_{i}=\dfrac{1}{1-{r}_{i}^{2}}, $$ (7) 式中,
$ {X}_{i} $ 和$ {Y}_{i} $ 分别是2个变量的第i个观察值,$ \overline {X} $ 和$ \overline {Y} $ 是2个变量的均值,ri表示第i个变量与其他变量的相关系数,VIFi是第i个变量的方差膨胀因子,当VIF小于5时可以认为该变量与其他变量之间不存在明显的共线性。1.5.3 机器学习算法
选取RF、SVM和MLP 3种方法进行生物量建模。RF是集成算法的延伸,其核心是对样本进行随机抽样,通过构造多个决策树来提升算法的性能,对模型具有很好的解释性。SVM通过划分超几何空间并结合核函数,将数据隐式地映射到一个更高维的空间,使其在新的空间中变得线性可分,进而完成模型构建。MLP是前馈神经网络,由输入层、1个或多个隐藏层和输出层组成,数据传入输入层,通过激活函数完成在隐藏层的传输,最终由输出层对数据进行预测。机器学习可以使用各种具有更高精度的大输入数据对复杂的空间模式进行建模,这种方法越来越多地用于森林生物量的估测研究中[27-28]。
1.5.4 模型评价
本文将试验样本数据集按7∶3随机划分成训练集和测试集。在训练集上,通过网格搜索与十折交叉验证的方式寻找模型的最优参数。具体而言,将训练集进一步分为10等份,每次选取其中1份作为验证集,剩余的9份作为训练集,循环10次,确保每一份数据都被用作验证集,并利用交叉验证确定的最优参数,在整个训练集上重新训练模型。模型训练完成后,使用测试集对模型的性能进行评估,以检验模型的泛化能力。其中,采用决定系数(R2)、均方根误差(RMSE)和相对均方根误差(rRMSE)进行模型训练集及测试集的精度评价。R2用于评估模型的整体拟合效果,RMSE和rRMSE用于衡量模型的预测准确性,具体公式如下:
$$ {R}^{2}=1-{ \displaystyle\sum\nolimits _{i=1}^{n}{({y}_{i}-{\overset{\frown}{y}_{i}})}^{2}/}{ \displaystyle\sum\nolimits _{i=1}^{n}{({y}_{i}-\overline{y})}^{2}}, $$ (8) $$ {\mathrm{RMSE}}=\sqrt{{ \displaystyle\sum\nolimits _{i=1}^{n}{({y}_{i}-{\overset{\frown}{y}_{i}})}^{2}/n}} ,$$ (9) $$ {\mathrm{rRMSE}} = \dfrac{{{\mathrm{RMSE}}}}{{\overline y}} \times 100{\text{%}}, $$ (10) 式中,
$n$ 为样本中单木数量,${{{y}}_{{i}}}$ 为单木生物量的估计值,$ {\overset{\frown}{y}_{i}} $ 为模型预测值,$\overline y$ 为样本平均值。2. 结果与分析
2.1 基于机载激光雷达的多变量精度评价
2.1.1 空间位置精度
将非地面点按照TIN内插法生成分辨率为0.1 m的栅格,即数字高程模型(Digital elevation model,DEM)。在相同位置处对比DEM与单木RTK的海拔,以此验证激光雷达的位置精度。结果(图3)显示两者海拔几乎一致(R2=
0.9999 ),说明UAV-LS所采集的数据位置偏差极小,点云数据中显示的单木位置就是其本身在真实空间的位置,不需要再进行空间位置校正。2.1.2 点云分割精度
本文采用边界角点所确定的范围对整个大样地进行划分,共分为9块小样地,当靠近边界的树木提取不完整时,按照树基部位置判断所属的样地,并对缺失部分采取提取、合并的方式进行补全,得到完整的样地点云。由于阔叶林林下植被复杂且UAV-LS采用自上而下的方式获取数据,因此所获取的点云均为中上层枝干较为清晰的点云数据,较难获取样地内中下层小树点云。根据样地内树种分布的复杂性,在进行点云分割时,需针对不同样地采用不同参数进行设置,以期达到最优分割。最后对各个样地的分割结果进行精度评价,具体结果如表2所示。
表 2 样地分割精度统计结果Table 2. Plot segmentation accuracy statistical results样地
Plot实测株数
Actual tree count分割株数
Segmented tree countTP FN FP t P F值
F-score1 20 19 18 2 1 0.90 0.95 0.92 2 23 22 19 4 3 0.83 0.86 0.84 3 27 24 21 6 3 0.78 0.88 0.82 4 23 23 18 5 5 0.78 0.78 0.78 5 36 37 30 6 7 0.83 0.81 0.82 6 27 26 20 6 5 0.77 0.80 0.78 7 19 19 18 1 1 0.95 0.95 0.95 8 17 19 16 3 1 0.84 0.94 0.89 9 28 28 25 3 3 0.89 0.89 0.89 由表2可知,在所有样地的分割中,4号和6号样地调和平均值相对偏低,即F值为0.78。影响其分割精度的主要原因有2点:一是样地中存在丛生的树木点云,二是林分中间层的乔木点云不够清晰。整体来看,共有185株树木被准确地识别并分割出来,占样地内点云树木总量的84%。在阔叶林树种中,分割的综合效果较好,对于一些分割效果较差的树木,通过添加种子点的位置进行再次分割,完成单株树木的精准提取。最终得到220株中大型的乔木点云数据,其胸径范围为15.0~67.2 cm,生活史阶段均为中树及以上树木。
2.1.3 树高提取精度
根据单木分割结果,提取归一化后高度的最大值与最小值,其差值即是树高。与野外实际测量值对比结果(图4)表明,提取的单木树高与测量结果非常接近(R2=0.870 0),说明激光雷达数据能很好地反演树木的实际高度。
2.2 TreeQSM构建及参数提取
在进行参数敏感性分析后,设置PatchDiam1、PatchDiam2Min、PatchDiam2Max参数值分别为[0.05,0.08]、[0.01,0.015,0.02]与[0.06,0.10]。敏感性分析后的参数能较好地构建出大胸径树木,但针对胸径较小的树木需要在此基础上稍作修改,其中PatchDiam1参数较为影响小胸径树木的模型效果。在剔除树冠不完整以及主干缺失的点云数据后,共构建176个TreeQSM模型。所有模型中,茅栗(65株)数量最多,其次是短柄枹栎(43株)和化香(42株)。槲栎Quercus aliena Blume和锐齿槲栎也略高,分别为8和9株。其他树种如灯台树Cornus controversa、金缕梅Hamamelis mollis、鹅耳枥Carpinus turczaninowii、黄檀Dalbergia hupeana、山合欢Albizia kalkora以及尾叶樱Cerasus dielsiana等数量较少,各自仅有1或2株。总体来看,树种分布不均,其中茅栗、短柄枹栎和化香占据了较大比例,为优势树种。树木具体建模效果以1株分支较多的点云数据(图5)进行展示,图中所构建的TreeQSM模型能较为清晰地模拟出树木各级枝干的特征。
通过构建三维模型从而量化树木参数,并在其中选取7个树木结构参数进行分析,分别统计各个参数的平均值、标准差、最小值、上四分位数、中位数、下四分位数以及最大值,结果见表3。并通过实测胸径与冠幅检验提取精度,其中提取的胸径与实测胸径R2达到0.930 0,冠幅拟合R2达到0.440 0(图6),说明构建的三维模型能较为准确地反映出树木的三维结构。这与相关研究结果[29-30]相符,当胸径大于30 cm时,TreeQSM能更准确地实现重建[31]。本文参与构建模型的点云树木多为胸径较大的乔木树种,因提取的胸径数据为计算生物量的强关联因子,故不参与生物量的模型构建。
表 3 参数统计信息Table 3. Parameter statistical information统计量
Statistic主干体积/m3
Trunk volume枝干体积/m3
Branch volume分支数
Branch number冠层基部高度/m
Crown base height冠层面积/m2
Crown area冠层体积/m3
Crown volume冠幅/m
Crown width平均值 Average 0.82 0.76 146.97 7.89 16.79 39.72 3.78 标准差 SD 0.58 1.40 166.26 3.17 19.34 103.76 2.31 最小值 Min. 0.12 0.01 8.00 0.44 1.38 0.01 0.67 下四分位 P25 0.41 0.11 41.00 5.47 5.09 0.71 2.10 中位数 P50 0.67 0.25 85.00 8.34 10.49 3.81 3.25 上四分位 P75 1.04 0.68 173.00 10.43 19.27 26.33 4.85 最大值 Max. 3.56 10.35 903.00 14.57 138.73 929.58 13.17 2.3 生物量估算模型构建
2.3.1 变量筛选
经过共线性分析后,共保留5个特征因子用于模型构建,分别是主干体积、分支数、冠层体积、冠层基部高度以及冠幅。其VIF均小于5,主干体积VIF为2.95,分支数3.82,冠层体积3.11,冠层基部高度1.30,冠幅4.62,说明筛选后的变量之间没有较为严重的共线性。进一步对各变量之间进行显著性检验,结果如表4所示。各变量之间均在P<0.001水平下显著相关,除变量冠层基部高度与其他变量负相关外,其他变量之间均为正相关,其中主干体积与生物量相关系数最高,达到0.91。通过相关性分析结果可以看出,冠层结构参数对于生物量研究具有重要意义,如冠层体积(0.72)、冠幅(0.77)等。在陆地生态系统中,植物冠层是介于大气和土壤基质间进行有机物合成代谢的重要部位,对于研究树木生物量起到直接或间接的作用。如单木生物量随冠层基部高度的上升会出现一定程度的下降,这与冠层大小有着密切的关系,当冠层基部位置低时,属于树木冠层的部分就会增多,从而使生物量增加。
表 4 各建模因子相关性统计1)Table 4. Correlation analysis of each modeling factor因素
Factor生物量
Biomass主干体积
Trunk volume冠层体积
Crown volume冠幅
Crown width冠层基部高度
Crown base height分支数
Branch number生物量 Biomass 1.00 主干体积 Trunk volume 0.91*** 1.00 冠层体积 Crown volume 0.72*** 0.71*** 1.00 冠幅 Crown width 0.77*** 0.77*** 0.73*** 1.00 冠层基部高度 Crown base height −0.46*** −0.40*** −0.38*** −0.46*** 1.00 分支数 Branch number 0.64*** 0.61*** 0.77*** 0.81*** −0.44*** 1.00 1) ***表示在P<0.001水平显著相关(Pearson法)。
1) *** indicates significant correlation at P<0.001 level (Pearson method).2.3.2 模型参数及建模结果
利用网格搜索遍历所有可能的参数组合,并在优化过程中通过交叉验证来评估每个参数组合的性能,从而选择最优的参数集。RF中,max_depth代表决策树的最大深度,限制树的深度可以防止过拟合;min_samples_split是每个节点可以分裂的最小样本数量,该参数影响树的分枝过程,较大的值可以防止过拟合;n_estimators控制树的数量,更多的树通常能提高模型的稳定性。MLP中,alpha代表正则化系数,用于防止模型过拟合,较大的alpha会使模型更平滑,但可能降低模型拟合能力;hidden_layer_sizes是隐藏层的大小和数量,影响模型的学习能力和复杂性;learning_rate控制学习率模型参数更新的速度,其中自适应学习率可根据模型收敛情况自动调整;max_iter为模型训练过程中允许的最大迭代步数。SVM中,C代表惩罚系数,较大的C值会强制模型在训练集上更好地拟合,但可能导致过拟合;gamma是核函数中的参数,决定样本的影响范围,较大的gamma会使模型更倾向于对训练数据的过拟合;Kernel是核函数类型(如线性核等)。
在经过参数筛选后,RF的最优参数为max_depth=3,min_samples_split=5,n_estimators=100;MLP的最优参数是alpha=0.1,hidden_layer_sizes=(50, 50),learning_rate=‘adaptive’,max_iter=
1000 ;SVM的最优参数是C=1,gamma=0.1,kernel=‘linear’。根据最优参数进行生物量估测的结果(图7)表明,RF的测试集R2达到0.880 0,单木生物量的RMSE为192.81 kg,rRMSE为29.88%;MLP的测试集R2达到0.820 0,单木生物量的RMSE为236.48 kg,rRMSE为36.65%;SVM的测试集R2达到0.810 0,单木生物量的RMSE为243.67 kg,rRMSE为37.77%。3种机器学习模型中,RF的效果最佳,MLP与SVM结果较为接近,精度稍低于RF,但也都表现出较高的准确性,证实了树木定量结构模型所提取的参数能够较好地构建出单木生物量模型,为森林资源清查提供了新方法,对后续研究具有重要意义。3. 讨论
本研究使用的RF算法可以训练出最优的单木生物量估测模型,在生物量估测模型的研究中,可以分为参数和非参数模型两大类[10,32],参数模型分为多元线性模型和非线性模型,非参数模型则包括人工神经网络、支持向量机、深度学习等机器学习方法。针对不同研究区域和研究对象,两类模型估测精度各有所长[33]。本文采用机器学习方法进行模型构建,旨在提高目标变量的预测精度,而参数模型可以通过参数组合评估和解释变量对目标变量的影响程度。后续研究如需揭示目标变量与解释变量之间的特定关系,可以选择多元线性和非线性模型探究各参数对单木生物量的响应关系。如Abd Rahman等[34]根据树高、胸径、树冠大小和树冠基部高度生成新的异速生长方程进行生物量计算。也可以将生物量模型细化,分为主干生物量与枝干生物量,这可能需要加入更多的树木参数进行模型完善,如唐依人等[35]利用枝条因子进行分支生物量模型构建。同样,可以根据主干体积与单木生物量之间的强相关性,探索基于体积与木材密度的生物量计算方式是否优于异速生长模型[36],值得注意的是,不同树种的木材密度存在差异,因此需要先区分树种的木材密度,才能得到更准确的结果。
点云密度也会对TreeQSM模型效果产生影响,并在一定程度上影响树木分割精度。虽然本研究获取的数据为高密度的点云数据,但是也存在点云冠层以及枝干缺失的情况,UAV-LS采用自上而下的方式获取点云数据,当上层树木出现遮挡时,就无法完整获取中下层的树木点云[37]。本研究的阔叶林为天马国家级自然保护区内的天然阔叶混交林,群落发育比较成熟,具有地带性稳定群落特征。因其冠层、林下环境较为复杂,所获取的树木点云主要为主林层大胸径乔木树种数据,胸径均在15.0 cm以上,而对于林下的小乔木则较难获取。但随着地基激光雷达(TLS)和移动激光扫描仪(Mobile laser scanning,MLS)等便携设备的深入应用,也为多源点云数据融合获取高精度三维数据提供了新的技术手段。通过与地面点云数据相结合,可以很好地弥补无人机点云数据在林下缺失的情况,无人机点云数据也能补充地面点云数据缺失的上层树冠部分,多源点云的融合可以促进对树木参数更可靠的估计,从而有助于对复杂森林场景进行互补解释[38],起到扩大应用范围与提高应用精度的效果。Qi等[39]研究发现,在冠层覆盖率增加的情况下,无人机激光点云与MLS相融合的数据在树木定量结构模型中表现最好。除多源点云数据的融合外,探究无人机点云最佳的建模密度也是一种新思路。本文研究情境下表现为仿地飞行高度60 m,后续的研究可以尝试更低的飞行高度以获取更丰富的树木结构,进而深入探究哪种高度下无人机点云数据的三维建模效果最好。
树木定量结构模型不仅用来估测森林蓄积量、生物量等参数,在树种识别方面也取得了不错的结果[40-41]。Hui等[42]利用几何分形特征和QSM特征进行树种分类,探索特征向量的分类效果,获得了较好的分类结果。QSM可以定量化树木结构,统计树木几何和拓扑属性,如本研究中的主干体积等参数。树木结构可以作为树种分类的重要依据,本文主要基于树木参数进行回归训练,未涉及分类任务。针对植被结构复杂的落叶阔叶林,如何精准识别树种显得尤为重要。特别在树木落叶期,无法根据树叶等信息判断种属,如果能通过树冠、分支等树木结构信息直接进行树种识别,将大大降低野外工作中树种识别的难度。
4. 结论
本文基于UAV-LS和QSM开展天马自然保护区阔叶树种单木生物量研究。其中,空间位置精度R2达到
0.9999 ,树高提取精度R2为0.870 0,表明激光雷达数据精度很高,并在点云总体分割精度较高的情况下,进行单木点云的精确提取。在此基础上,构建单木的三维结构模型,结果显示,胸径、冠幅拟合精度R2分别为0.930 0和0.440 0,并进一步选择3种机器学习算法对树木参数进行生物量估测模型构建。3种模型中,RF算法结果最优(R2=0.880 0, RMSE=192.81 kg, rRMSE=29.88%),证明QSM所提取的树木参数可以构建出精度较高的落叶期阔叶树种生物量估测模型,为以后相关研究提供启发。本文使用的方法在一定程度上大大减轻了野外工作量和难度,点云数据的获取比地基激光雷达更方便,在森林资源调查中具有巨大的应用价值。 -
表 1 立地形指数模型研建数据描述性统计
Table 1 Descriptive statistics of model establishment data for site form index
林分类型 Stand types 样地数量
Number of plots林分胸径/cm Stand DBH 林分树高/m Stand height 区间 Range 均值 Mean 标准差 SD 区间 Range 均值 Mean 标准差 SD 冷杉 Abies fabri 4363 6.5~77.1 32.8 11.05 2.8~43.7 19.8 5.95 云杉 Picea asperata 11869 5.0~60.0 27.2 10.61 1.7~41.5 17.0 6.11 铁杉 Tsuga chinensis 182 6.9~58.0 29.9 9.61 4.0~29.0 16.6 4.42 油杉 Keteleeria fortunei 217 6.9~27.1 13.0 4.18 2.8~18.3 7.2 2.97 落叶松 Larix gmelinii 9105 5.0~69.7 16.4 9.19 2.0~36.2 13.5 5.00 红松 Pinus koraiensis 290 5.0~58.9 17.5 10.52 1.5~29.2 12.1 5.83 樟子松 Pinus sylvestris 563 5.4~43.2 16.9 7.13 2.8~26.7 11.6 4.78 赤松 Pinus densiflora 296 5.3~23.1 10.6 3.55 1.8~16.7 6.1 3.06 黑松 Pinus thunbergii 346 5.3~20.0 10.8 3.13 2.2~16.0 6.3 2.46 油松 Pinus tabuliformis 4525 5.0~35.0 13.2 5.16 1.5~23.0 7.7 3.27 华山松 Pinus armandii 1029 5.0~34.3 13.9 5.60 1.5~25.0 9.3 3.83 马尾松 Pinus massoniana 15430 5.0~39.9 12.9 4.90 1.5~28.5 9.2 3.58 云南松 Pinus yunnanensis 3510 5.0~43.0 14.6 6.58 2.2~30.0 9.6 4.48 思茅松 Pinus kesiya var. langbianensis 478 5.7~33.4 16.5 5.14 2.9~27.2 12.4 4.13 高山松 Pinus densata 5125 5.3~40.0 27.9 6.53 2.0~28.0 17.8 4.41 其他松类1) Other pines 1350 5~27.4 12.8 4.44 2.5~18.7 8.1 3.06 1) 其他松类指样地数量较少的针叶林分类型。
1) Other pines indicate stand types with less sample plots.表 2 主要针叶林分胸径和树高模型参数
Table 2 Model parameters of DBH and height for major coniferous stands
林分
Stand typesRichards Logistic Korf a b c R2 SEE a b c R2 SEE a b c R2 SEE 冷杉 34.9304 0.0278 1.2032 0.94 2.08 29.7918 6.2168 − 0.0711 0.92 2.25 71.0181 − 8.2024 0.5228 0.94 2.07 云杉 35.0515 0.0292 1.2862 0.99 0.83 27.6166 7.9591 − 0.0872 0.98 1.12 104.1793 − 7.7122 0.4304 0.99 0.82 铁杉 42.7731 0.0100 0.7756 0.84 2.36 25.0287 4.3132 − 0.0612 0.81 2.52 228.4099 − 6.1365 0.2395 0.84 2.35 油杉 49.4001 0.0217 1.5328 0.96 0.94 17.6832 15.4880 − 0.1514 0.95 0.96 356.5069 − 9.6653 0.3327 0.96 0.94 落叶松 21.7763 0.0825 1.6565 0.92 1.54 21.4231 5.7592 − 0.1286 0.91 1.63 24.4672 − 16.0920 1.1943 0.91 1.63 红松 23.7699 0.0706 1.9944 0.95 1.54 22.4409 9.9858 − 0.1324 0.95 1.64 31.3234 − 15.3821 0.9800 0.95 1.60 樟子松 23.1622 0.0573 1.6375 0.97 1.07 19.8216 9.2197 − 0.1350 0.96 1.27 69.4325 − 7.1841 0.4718 0.97 1.06 赤松 11.2997 0.1945 5.7997 0.89 1.32 10.6562 48.3629 − 0.3444 0.92 1.14 15.2157 − 32.2581 1.4462 0.88 1.43 黑松 32.0888 0.0315 1.4875 0.97 0.60 13.1164 14.9074 − 0.2020 0.98 0.49 646.3492 − 8.9301 0.2569 0.97 0.62 油松 34.1642 0.0217 1.2051 0.99 0.28 17.6943 9.4751 − 0.1219 0.99 0.49 474.2441 − 8.0463 0.2431 0.99 0.26 华山松 23.2458 0.0527 1.5916 0.99 0.59 17.9922 10.4218 − 0.1496 0.98 0.68 69.1080 − 7.7007 0.4897 0.99 0.59 马尾松 20.7730 0.0585 1.4939 0.99 0.28 17.5935 8.1581 − 0.1427 0.99 0.55 41.5400 − 7.4772 0.5971 0.99 0.24 云南松 32.6336 0.0345 1.4617 0.99 0.38 22.9034 10.6239 − 0.1183 0.99 0.67 182.4129 − 7.9799 0.3567 0.99 0.38 思茅松 23.3830 0.0688 1.8721 0.97 0.87 19.5171 10.3107 − 0.1589 0.96 1.01 42.3634 − 10.2905 0.7343 0.98 0.84 高山松 47.8737 0.0196 1.2483 0.99 0.71 25.0354 10.2222 − 0.1076 0.98 0.89 378.0811 − 8.2583 0.2902 0.99 0.71 其他松类1) 15.6588 0.0804 1.7907 0.99 0.35 13.0084 10.8083 − 0.1960 0.99 0.28 36.7931 − 7.3685 0.5885 0.99 0.40 1) 其他松类指样地数量较少的针叶林分类型。
1) Other pines indicate stand types with less sample plots. -
[1] WEISKITTEL A R, HANN D W, KERSHAW J A, et al. Forest growth and yield modeling[M]. New York: John Wiley & Sons, 2011.
[2] AGUIRRE A, MORENO-FERN´ANDEZ D, ALBERDI I, et al. Mapping forest site quality at national level[J]. Forest Ecology and Management, 2022, 508: 120043. doi: 10.1016/jforece.2022.120043.
[3] 夏洪涛, 郭晓斌, 张珍, 等. 基于不同立地质量评价指标的杉木大径材林分树高−胸径模型[J]. 中南林业科技大学学报, 2023, 43(10): 80-88. [4] 李贤伟, 李守剑, 张健, 等. 四川盆周西缘水杉人工林林地立地质量评价研究[J]. 四川农业大学学报, 2002, 20(2): 106-109. doi: 10.3969/j.issn.1000-2650.2002.02.010 [5] 刘智军, 朱丽艳, 吴恒, 等. 基于清查数据的立地质量评价方法准确性分析[J]. 西南林业大学学报(自然科学), 2019, 39(5): 127-135. [6] VANCLAY J K, HENRY N B. Assessing site productivity of indigenous cypress pine forest in southern Queensland[J]. The Commonwealth Forestry Review, 1988, 67(1): 53-64.
[7] 吴恒, 党坤良, 田相林, 等. 秦岭林区天然次生林与人工林立地质量评价[J]. 林业科学, 2015, 51(4): 78-88. [8] 沈剑波, 雷相东, 雷渊才, 等. 长白落叶松人工林地位指数及立地形的比较研究[J]. 北京林业大学学报, 2018, 40(6): 1-8. [9] PADILLA-MARTÍNEZ J R, PAUL C, CORRAL-RIVAS J J, et al. Evaluation of the site form as a site productive indicator in temperate uneven-aged multispecies forests in Durango, Mexico[J]. Plants, 2022, 11(20): 2764. doi: 10.3990/plants11202764.
[10] 张会儒, 雷相东, 张春雨, 等. 森林质量评价及精准提升理论与技术研究[J]. 北京林业大学学报, 2019, 41(5): 1-18. [11] 胡庭兴, 李贤伟, 杨祯禄. 立地质量综合评价及其应用的研究[J]. 四川农业大学学报, 1993,11(3): 397-403. [12] PERIN J, HÉBERT J, BROSTAUX Y, et al. Modeling the top-height growth and site index of Norway spruce in Southern Belgium[J]. Forest Ecology and Management, 2013, 298: 62-70.
[13] 付晓, 曹霖, 王雪军, 等. 吉林省林地立地质量评价及生产潜力研究[J]. 中南林业科技大学学报, 2019, 39(5): 1-9. [14] 黄国胜, 马炜, 王雪军, 等. 基于一类清查数据的福建省立地质量评价技术[J]. 北京林业大学学报, 2014, 36(3): 1-8. [15] MACFARLANE D W, GREEN E J, BURKHART H E. Population density influences assessment and application of site index[J]. Canadian Journal of Forest Research, 2000, 30(9): 1472-1475.
[16] 雷相东, 符利勇, 李海奎, 等. 基于林分潜在生长量的立地质量评价方法与应用[J]. 林业科学, 2018, 54(12): 116-126. doi: 10.11707/j.1001-7488.20181213 [17] SHARMA M, PARTON J. Height–diameter equations for boreal tree species in Ontario using a mixed-effects modeling approach[J]. Forest Ecology and Management, 2007, 249(3): 187-198.
[18] KROON J, ANDERSSON B, MULLIN T J. Genetic variation in the diameter-height relationship in Scots pine (Pinus sylvestris)[J]. Canadian Journal of Forest Research, 2008, 38(6): 1493-1503.
[19] 王彬. 祁连山青海云杉树木生长及其对气候变化的响应[D]. 北京: 中国林业科学研究院, 2020. [20] MOTALLEBI A, KANGUR A. Are allometric relationships between tree height and diameter dependent on environmental conditions and management[J]. Trees, 2016, 30(4): 1429-1443.
[21] 郭小阳, 吴恒, 田相林, 等. 基于优势高模型分析多源数据对立地质量评价的影响[J]. 西北林学院学报, 2017, 32(6): 184-189. doi: 10.3969/j.issn.1001-7461.2017.06.28 [22] MOLINA-VALERO J A, DIÉGUEZ-ARANDA1 U, ÁLVAREZ-GONZÁLEZ1 J G, et al. Assessing site form as an indicator of site quality in even-aged Pinus radiata D. Don stands in north-western Spain[J]. Annals of Forest Science, 2019, 76(4): 113. doi: 10.1007/s13595-019-0904-1
[23] 刘俊, 孟雪, 高媛赟, 等. 基于不同立地质量的松树林分生物量遥感估测[J]. 中南林业科技大学学报, 2016, 36(5): 41-46. [24] GARCIA O. Comparing and combining stem analysis and permanent sample plot data in site index models[J]. Forest Science, 2005, 51(4): 277-283. doi: 10.1093/forestscience/51.4.277