• 《中国科学引文数据库(CSCD)》来源期刊
  • 中国科技期刊引证报告(核心版)期刊
  • 《中文核心期刊要目总览》核心期刊
  • RCCSE中国核心学术期刊

基于深度学习的龙眼叶片叶绿素含量预测的高光谱反演模型

甘海明, 岳学军, 洪添胜, 凌康杰, 王林惠, 岑振钊

甘海明, 岳学军, 洪添胜, 等. 基于深度学习的龙眼叶叶绿素含量预测的高光谱反演模型[J]. 华南农业大学学报, 2018, 39(3): 102-110. DOI: 10.7671/j.issn.1001-411X.2018.03.016
引用本文: 甘海明, 岳学军, 洪添胜, 等. 基于深度学习的龙眼叶叶绿素含量预测的高光谱反演模型[J]. 华南农业大学学报, 2018, 39(3): 102-110. DOI: 10.7671/j.issn.1001-411X.2018.03.016
GAN Haiming, YUE Xuejun, HONG Tiansheng, LING Kangjie, WANG Linhui, CEN Zhenzhao. A hyperspectral inversion model for predicting chlorophyll content of Longan leaves based on deep learning[J]. Journal of South China Agricultural University, 2018, 39(3): 102-110. DOI: 10.7671/j.issn.1001-411X.2018.03.016
Citation: GAN Haiming, YUE Xuejun, HONG Tiansheng, LING Kangjie, WANG Linhui, CEN Zhenzhao. A hyperspectral inversion model for predicting chlorophyll content of Longan leaves based on deep learning[J]. Journal of South China Agricultural University, 2018, 39(3): 102-110. DOI: 10.7671/j.issn.1001-411X.2018.03.016

基于深度学习的龙眼叶片叶绿素含量预测的高光谱反演模型

基金项目: 国家自然科学基金(30871450);广东省科技计划项目(2015A020224036,2014A020208109);广东省水利科技创新项目(2016-18)
详细信息
    作者简介:

    甘海明(1991—),男,硕士研究生,E-mail:444504196@qq.com

    通讯作者:

    岳学军(1971—),女,教授,博士,E-mail: yuexuejun@scau.edu.cn

  • 中图分类号: S127

A hyperspectral inversion model for predicting chlorophyll content of Longan leaves based on deep learning

  • 摘要:
    目的 

    探讨龙眼Dimocarpus longan Lour. 叶片发育过程中叶绿素含量二维分布变化规律,实现无损检测病虫害对叶片叶绿素含量分布的影响,为评估嫩叶抗寒能力、龙眼结果期的施肥量和老熟叶的修剪提供参考。

    方法 

    利用高光谱成像仪采集龙眼叶片在369~988 nm区间的高光谱图像,自动提取感兴趣区域,利用分光光度法测定叶片叶绿素含量。基于皮尔森相关系数(r)分析了龙眼叶片生长过程中各波段光谱响应与叶绿素含量之间相关性,建立偏最小二乘回归模型。分析了特征波段图像纹理特征与叶绿素含量相关性,将光谱特征和纹理特征结合导入深度学习中的稀疏自编码(SAE)模型预测龙眼叶片叶绿素含量,结合“图谱信息”的SAE模型预测龙眼叶片叶绿素含量的分布情况。

    结果 

    龙眼叶片3个生长发育期相关系数的曲线均在700 nm附近出现波峰,嫩叶、成熟叶和老熟叶3个阶段相关性最高的波长分别为692、698 和705 nm;全发育期的最敏感波段相关性远高于3个生长发育期,r达到0.890 3。回归模型中,吸收带最小反射率位置和吸收带反射率总和建立的最小二乘回归模型预测效果最好(R2c=0.856 8,RMSEc=0.219 5;R2v=0.771 2,RMSEv=0.286 2),其校正集和验证集的决定系数均高于单一参数建立的预测模型。在所有预测模型中,结合“图谱信息”的SAE模型预测效果最好(R2c=0.979 6,RMSEc=0.171 2;R2v=0.911 2,RMSEv=0.211 5),且预测性能受叶片成熟度影响相对较小,3个生长阶段R2v的标准偏差仅为最小二乘回归模型标准偏差的29.9%。

    结论 

    提出了一种自动提取感兴趣区域的方法,成功率为100%。基于光谱特征的回归模型对不同生长阶段的叶片预测效果变化较大,而基于“图谱信息”融合的SAE模型预测性能受叶片成熟度影响相对较小且预测精度较高,SAE模型适用于不同成熟度的龙眼叶片叶绿素含量分布预测。

    Abstract:
    Objective 

    To study the distribution of chlorophyll content of Longan (Dimocarpus longan Lour) leaves in different growth periods, realize non-destructive measurement of the influence of pests and diseases on chlorophyll distribution, and provide a reference for evaluating the cold-resistant ability of young leaves, fertilizing amount in the fruiting period and pruning of mature leaves.

    Method 

    Hyperspectral images of Longan leaves in three growth periods were acquired via an online hyperspectral imaging system within the spectral region of 369–988 nm wavelength. An automatic masking method was used to extract the interest regions. The chlorophyll content was measured by the spectrophotometric method. The relationships between the spectral response characteristics and chlorophyll contents of Longan leaves in three growth periods were measured based on Pearson correlation coefficient (r). A partial least squares regression (LSR) model was established. The relationship between the texture feature of selected image and chlorophyll content was analyzed. The spectroscopy and texture features were imported to the spare auto-encoder (SAE) model in deep learning to predict the chlorophyll content of Longan leaves. The distribution of chlorophyll content was predicted using SAE model based on the mapping information.

    Result 

    The peaks of correlation coefficient curves of Longan leaves in three growth periods appeared in the vicinity of 700 nm. The wavelength of the highest correlation coefficient for young, mature and old ripe leaves was 692, 698 and 705 nm, respectively. The correlation coefficient (r) of the most sensitive band in full period was higher than those in three growth periods, which was up to 0.890 3. Among all regression models, the prediction effect of LSR model based on the absorption band of the minimum reflectivity and total reflectivity was the best (R2c=0.856 8, RMSEc=0.219 5; R2v=0.771 2, RMSEv=0.286 2), and the determination coefficients of its calibration and validation sets were higher than those based on a single parameter. SAE model importing spectroscopy and texture features performed the best (R2c=0.979 6, RMSEc=0.171 2; R2v=0.911 2, RMSEv=0.211 5) and the most stable to predict chlorophyll contents of Longan leaves in different growth periods, its standard deviation was only 29.9% of LSR model.

    Conclusion 

    A method automatically extracting interest region was proposed, its success rate was 100%. The performance of SAE model based on spectroscopy and texture features was more stable than those of regression models based on spectroscopy to predict chlorophyll contents of Longan leaves in different growth periods. SAE model is suitable for predicting the distribution of chlorophyll content of Longan leaves as a non-destructive method.

  • 林木遗传改良通常需在田间试验基础上,估算参试样本(种源、家系、单株或无性系)目标性状的遗传参数,并运用一定的评价方法筛选出具有优异目标性状的种源、家系或无性系[1]。目前,林木遗传评估基本采用混合线性模型,即根据观测表型值和设计的关联矩阵,利用最佳线性无偏估计(Best linear unbiased estimation, BLUE)方法获得固定效应估计值,利用最佳线性无偏预测(Best linear unbiased prediction, BLUP)方法获得随机效应预测值。而育种值(Breeding value)即属随机效应预测值,且BLUP值依赖于混合线性模型的关联设计矩阵。然而,对林木田间试验而言,个体间存在竞争,且基因型与环境互作较为显著,即空间效应明显。如竞争效应和空间效应没有被考虑到混合线性模型中,遗传评估则会产生偏差,其中空间正相关易导致加性遗传方差偏大,中等竞争效应则抑制偏差[2]。因而,在林木遗传评估模型中,应纳入竞争效应和空间效应。

    空间效应(或称环境异质性)可以是空间连续的,其表现为土壤和小气候效应的相似模式,也可以是不连续的,表现为育林措施和测量方法的不同效应,此外还可以是随机的,其表现为微环境的异质性[3]。针对空间效应的空间分析(Spatial analysis)已被广泛用于农作物品种田间试验研究。与传统试验设计相比,空间分析可减少试验误差并提高农作物品种评估的准确性。空间分析方法通常有趋势面分析法和空间自相关分析法等。其中,趋势面分析法是采用空间坐标的多项式函数来模拟环境的变异[4],而空间自相关分析法则通过行和列的空间自相关分析剔除地点内的空间相关误差来提高遗传试验分析的精确性[5]

    在林木研究上,Costa等[6]利用空间自相关分析法分析了辐射松Pinus radiata等3个树种的子代和无性系试验林,发现空间自相关分析可更有效拟合试验林的空间变异,显著降低了区组和小区的方差,且极大提高了遗传评估的准确度与遗传增益。另外,Dutkowski等[7-8]在更大数据量的树种与试验林上进一步采用空间分析,也发现空间分析可显著提高种源、家系、亲本和无性系遗传效应估算的准确性。但林木是多年生植物,除空间差异外,往往还存在个体竞争[9]。虽然Cappa等[10]采用遗传干预模型(Genotypic interference model, GIM)评估了林木遗传加性效应和竞争加性效应,但是没有考虑空间效应,因此模型比较受限。值得注意的是,Stringer等[11]提出空间效应与竞争效应的联合模型进行糖蔗品种试验的遗传分析,模型采用等根二阶自回归法(Equal-roots second-order autoregressive, EAR2)拟合环境的空间效应,而遗传的竞争效应则采用处理干预模型(Treatment interference model, TIM)。此外,Cappa等[12]提出拟合空间效应与竞争效应的林木单株混合模型,并采用贝叶斯法估计遗传参数。上述模型均在一定程度上提高了林木遗传评估的准确性,但模型涵盖的遗传竞争效应均为单一值,而实际上林木个体周边的遗传竞争效应可能不同,因此有必要提出新的单株混合模型,同时拟合不同的遗传竞争效应和异质的空间效应。基于此,本研究根据现代线性统计理论,构建了异质空间效应和不同竞争效应的联合模型,并通过数据模拟的方式,结合实际测定数据进行验证,同时运用REML 法估算遗传参数,对不同模型进行比较,进而探讨异质空间效应和不同竞争效应的分析模型在林木遗传测定中的有效性,以期为林木精确的遗传评估和后续可靠的良种选育提供理论参考和技术支撑。

    单株混合模型为:y=Xb+Zgug+e。式中: y为个体性状表型值构成的向量; b为固定效应构成的向量; u为随机遗传效应构成的向量, ${\boldsymbol u}_{\rm{g}}' =\left( {{u}_{{{\rm{g}}_{\rm{d}}}}',{u}_{{{\rm{g}}_{{\rm{en}}}}}',} \right. $ $\left. {u}_{{{\rm{g}}_{{\rm{wn}}}}}', {u}_{{{\rm{g}}_{{\rm{sn}}}}}',{u}_{{{\rm{g}}_{{\rm{nn}}}}}' \right)$ ${u}_{{{\rm{g}}_{\rm{d}}}}'\text{、} {u}_{{{\rm{g}}_{{\rm{en}}}}}'\text{、} {u}_{{{\rm{g}}_{{\rm{wn}}}}}'\text{、} {u}_{{{\rm{g}}_{{\rm{sn}}}}}'\text{和 } {u}_{{{\rm{g}}_{{\rm{nn}}}}}'$ 分别为直接遗传效应、东向近邻效应、西向近邻效应、南向近邻效应和北向近邻效应;e为剩余误差向量;X为固定效应的关联矩阵;Zg为随机效应的关联矩阵。

    遗传效应的方差–协方差矩阵为:

    $$ {\rm{var}}\left( {{\boldsymbol{u}_{\rm{g}}}} \right) = \left[ \begin{array}{l} \begin{array}{*{20}{c}} {\delta _{{{\rm{g}}_{\rm{d}}}}^2} & {{\delta _{{{\rm{g}}_{{\rm{den}}}}}}} & {{\delta _{{{\rm{g}}_{{\rm{dwn}}}}}}}\\ {{\delta _{{{\rm{g}}_{{\rm{den}}}}}}} & {\delta _{{{\rm{g}}_{{\rm{en}}}}}^2} & {{\delta _{{{\rm{g}}_{{\rm{ewn}}}}}}}\\ {{\delta _{{{\rm{g}}_{{\rm{dwn}}}}}}} & {{\delta _{{{\rm{g}}_{{\rm{ewn}}}}}}} & {\delta _{{{\rm{g}}_{{\rm{wn}}}}}^2} \end{array}\begin{array}{*{20}{c}} {{\delta _{{{\rm{g}}_{{\rm{dsn}}}}}}} & {{\delta _{{{\rm{g}}_{{\rm{dnn}}}}}}}\\ {{\delta _{{{\rm{g}}_{{\rm{esn}}}}}}} & {{\delta _{{{\rm{g}}_{{\rm{enn}}}}}}}\\ {{\delta _{{{\rm{g}}_{{\rm{wsn}}}}}}} & {{\delta _{{{\rm{g}}_{{\rm{wnn}}}}}}} \end{array}\\ \begin{array}{*{20}{c}} {{\delta _{{{\rm{g}}_{{\rm{dsn}}}}}}} & {{\delta _{{{\rm{g}}_{{\rm{esn}}}}}}} & {{\delta _{{{\rm{g}}_{{\rm{wsn}}}}}}}\\ {{\delta _{{{\rm{g}}_{{\rm{dnn}}}}}}} & {{\delta _{{{\rm{g}}_{{\rm{enn}}}}}}} & {{\delta _{{{\rm{g}}_{{\rm{wnn}}}}}}} \end{array}\begin{array}{*{20}{c}} {\delta _{{{\rm{g}}_{{\rm{sn}}}}}^2} & {{\delta _{{{\rm{g}}_{{\rm{snn}}}}}}}\\ {{\delta _{{{\rm{g}}_{{\rm{snn}}}}}}} & {\delta _{{{\rm{g}}_{{\rm{nn}}}}}^2} \end{array} \end{array} \right] \otimes {\boldsymbol{I}_m}, $$

    其中,对角线上依次为直接遗传效应、东向近邻效应、西向近邻效应、南向近邻效应和北向近邻效应的方差分量,非对角线为上述两两效应之间的协方差分量。var代表方差,δ2δ 分别代表方差和协方差,Im代表单位矩阵。

    为减少计算量和促进模型收敛,可通过因子分析法[1]将遗传效应的方差–协方差矩阵改写为如下矩阵:

    $$ {\rm{var}}\left( \boldsymbol{u} \right) = \left( {\boldsymbol \varGamma \times \boldsymbol\varGamma ' + \boldsymbol\varPsi } \right) \otimes \boldsymbol{A}, $$

    其中,Γ 是因子载荷矩阵,Ψ 是特殊方差矩阵,A是加性遗传相关矩阵。

    在常规的空间分析[7]中,剩余误差(R)可分解为空间自相关误差方差( $\delta _\xi ^2$ )和随机测量误差方差( $\delta _\eta ^2$ ),因此剩余误差的方差协方差矩阵为:

    $$ \boldsymbol{R} = \delta _\xi ^2\left( {\sum\nolimits_c {\rm{(}}{\rho _{_c}}{\rm{)}} \otimes \sum\nolimits_r {\rm{(}}{\rho _{_r}}{\rm{)}}} \right) + \delta _\eta ^2\boldsymbol{I}, $$

    其中, $\sum\nolimits_c{\rm{(}}{\rho _{_c}}{\rm{)}}$ $\sum\nolimits_r{\rm{(}}{\rho _{_r}}{\rm{)}}$ 分别是列、行自回归的相关矩阵,ρcρr分别是列、行自相关值,I是单位矩阵。

    $\mathop \sum \nolimits {\rm{(}}\rho {\rm{)}}$ 自回归的相关矩阵,具体如下:

    $$ \sum {(\rho )} = \left| {\begin{array}{*{20}{c}} 1 & \rho & {{\rho ^2}} & \cdots & {{\rho ^{n - 1}}}\\ \rho & 1 & \rho & \cdots & \vdots \\ {{\rho ^2}} & \rho & 1 & \cdots & \vdots \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ {{\rho ^{n - 1}}} & \cdots & \cdots & \cdots & 1 \end{array}} \right|\text{。} $$

    采用R软件[1]和R程序包breedR[13]进行数据模拟。为简化数据模拟,参考下述松树数据,以该松树胸径均值(13)和估算的加性方差( $\delta _a^2$ 为2.46)、剩余残差( $\delta _e^2$ 为3.00)作为模拟初始值,4次重复,5株行式小区,10个父本,10个母本,共30行、40列。为简化不同模型的比较,设置加性遗传效应与竞争遗传效应相关值[简称竞争相关值(Cr)]为–0.6, 空间行、列自相关值分别为0.6、–0.6,比较模型包括随机完全区组设计模型(RCBM)、空间模型(SM)、空间与测量误差模型(SUM)和空间与竞争模型(SCM)。为探究遗传竞争效应和环境空间效应的影响,设置竞争相关值(Cr= –0.3, –0.6, –0.9)以及空间行相关值( ρr= 0.3, 0.6, 0.9)、列自相关值(ρc= –0.3, –0.6, –0.9),通过正交设计 [1],产生9组数据。

    数据来源于文献[1]中的例6.4.4.2,该数据有46个全同胞家系,采用完全随机区组设计,设7个区组,5株行式小区,试验林共35行40列,测定性状是10年生胸径。

    所有模型分析均采用ASReml软件V4.0[14],除总体均值作为固定因子外,所有其他试验因子均作为随机因子。空间相关的残差采用行列AR1自相关结构,遗传竞争效应的方差采用单因子XFA1结构。拟合模型的原始数据图和残差图采用R包AAfun[15]生成,空间变异图variogram由ASReml运行生成,所有估计的参数由ASReml运行获得。

    单株狭义遗传力( $h_i^2$ )的计算公式如下:

    $$ h_i^2 = \delta _a^2/\left( {\delta _a^2 + \delta _e^2} \right), $$

    式中, $\delta _a^2$ 为加性方差, ${\delta _e^2}$ 为随机误差方差(剩余残差)。

    AIC值的计算公式如下:

    $$ {\rm AIC} = - 2 \times ({\rm ln}L - P)\text{,} $$

    式中,AIC值是赤池信息量准则,lnL是模型迭代收敛似然值,P是模型中随机参数的数量。

    对模拟数据设置随机区组设计模型(RCBM)、空间模型(SM)、空间与测量误差模型(SUM)和空间与竞争模型(SCM)4种模型,模型的拟合结果(表1)显示:模型RCBM的参数最少(4个),收敛似然值(lnL)最小(–1 927),AIC值最大(3 863),剩余残差(7.56)也最大,所估算的单株狭义遗传力也最小(0.24±0.08);模型SM的参数为6个,收敛似然值(lnL)稍微增加,为–1 904,AIC值下降至3 820,空间自相关误差为7.04,加性方差为3.44,比RCBM提高了45%,但估计的行列相关值远低于模拟设置值,行自相关值为0.25,列自相关值为–0.07;模型SUM的参数中,随机测量误差方差为5.72,空间自相关误差方差为1.83,行列相关值与模拟设置值一致,加性方差为2.43,估计的单株狭义遗传力为0.30±0.10;模型SCM 参数最多(10个),似然值(lnL)最大(–1 853),但AIC值(3 734)和随机测量误差方差(3.13)均最小,估计的单株狭义遗传力最高,为0.43±0.13。此外,模型SCM估计的4个近邻效应方差在0.34~0.74,并且均显著。根据似然值lnL最大和AIC值最小原则,可知SCM为最佳模型。

    表  1  模拟数据不同模型估计参数的比较1)
    Table  1.  Comparison of estimated parameters from different models for simulated data
    模型 参数/
    lnL AIC $\delta _{{\rm{rep}}}^2$ $\delta _{{\rm{plot}}}^2$ $\delta _e^2$ $\delta _{\rm{\eta }}^2$ $\delta _{\rm{\xi }}^2$ ρr ρc $\delta _a^2$ $\delta _{{{\rm{g}}_{{\rm{en}}}}}^2$ $\delta _{{{\rm{g}}_{{\rm{wn}}}}}^2$ $\delta _{{{\rm{g}}_{{\rm{sn}}}}}^2$ $\delta _{{{\rm{g}}_{{\rm{nn}}}}}^2$ $h_i^2$
    RCBM 4 –1 927 3 863 0.060.85 0.101.03 7.5613.52 2.372.67 0.24±0.08
    SM 6 –1 904 3 820 0.080.81 0.070.80 7.048.92 0.258.92 –0.075.87 3.442.52
    SUM 7 –1 897 3 808 0.070.89 0.080.84 5.729.02 1.834.21 0.615.84 –0.708.00 2.432.70 0.30±0.10
    SCM 10 –1 853 3 734 3.134.74 2.204.75 0.535.24 –0.709.63 2.372.81 0.592.22 0.341.60 0.682.39 0.742.54 0.43±0.13
     1) lnL为迭代收敛似然值,AIC 为赤池信息量准则, $\delta _{{\rm{rep}}}^2$为区组方差, $\delta _{{\rm{plot}}}^2$为小区方差, $\delta _e^2$为剩余残差, $\delta _{\rm{\eta }}^2$、 $\delta _{\rm{\xi }}^2$分别为随机测量误差方差和空间自相关误差方差,ρrρc 分别为行、列自相关值, $\delta _a^2$为加性方差, $\delta _{{{\rm{g}}_{{\rm{en}}}}}^2$、 $\delta _{{{\rm{g}}_{{\rm{wn}}}}}^2$、 $\delta _{{{\rm{g}}_{{\rm{sn}}}}}^2$、 $\delta _{{{\rm{g}}_{{\rm{nn}}}}}^2$分别为东向、西向、南向和北向近邻遗传竞争方差, $h_i^2$为单株狭义遗传力;表中的上标值是 t 检验统计量,为估计值与标准误的比值;…表示单株遗传力因没有随机测量误差而不能计算。
    下载: 导出CSV 
    | 显示表格

    残差图显示,RCBM的残差图(图1C)与原始数据图(图1A)非常相似,表明RCBM模型未能很好地拟合空间异质性。虽然SM模型比RCBM有所改进,但也只拟合了残差小的空间部分(图1D)。SUM和SCM模型,图形比较相似,有明显的行列空间趋势,但SCM模型更能消除部分残差高的区域(图1E1F)。从空间变异图可以看出,SM模型的图形比较平坦(图2B),表明捕获的空间变异很小,而SUM和SCM模型的图形比较相似(图2C2D),在行方向上存在明显的空间变异趋势,在列方向的突起尖峰表示列相关为负值,存在环境的竞争效应,表明SUM和SCM模型捕获空间变异的效果不错。此外,残差值与近邻表型均值的散点图(图2A)显示两者存在明显的负相关(r= –0.30),表明存在遗传竞争效应。上述结果与 表1的结果相一致。

    图  1  不同模型的剩余残差图
    Figure  1.  Residual plot of different model
    图  2  残差与近邻均值的散点图(A)和不同模型的空间变异图(B、C、D)
    Figure  2.  Scatter plot of residuals and neighbor(A) means as well as spatial variogram of different models(B, C, D)

    为了解不同初始参数值条件下,SCM模型拟合的效果,根据竞争相关值、行列自相关值设计了9组数据,结果(表2)表明,所有数据拟合的加性方差为2.25~2.52,随机测量误差方差为2.90~3.96,空间自相关误差方差为1.31~2.43,除了列相关值(pc= –0.3)拟合得一般外,其他均与初始值接近。各近邻效应方差多数在0.45~0.80,基本上都显著;此外,估计的单株狭义遗传力差异不大,均在0.40左右。可见,SCM 模型对于空间效应和竞争效应的拟合效果稳定性较好。

    表  2  不同参数初始值的SCM模型估计结果1)
    Table  2.  Estimated results of SCM with different initial values for parameters
    参数初始值 ρr ρc $\delta _{\rm{\eta }}^2$ $\delta _{\rm{\xi }}^2$ $\delta _a^2$ $\delta _{{{\rm{g}}_{{\rm{en}}}}}^2$ $\delta _{{{\rm{g}}_{{\rm{wn}}}}}^2$ $\delta _{{{\rm{g}}_{{\rm{sn}}}}}^2$ $\delta _{{{\rm{g}}_{{\rm{nn}}}}}^2$ $h_i^2$
    Cr–0.3/ρr0.3/ρc–0.3 0.362.24 –0.675.45 3.965.20 1.312.77 2.472.72 0.742.43 0.241.32 0.562.01 0.652.43 0.38±0.12
    Cr–0.3/ρr0.6/ρc–0.9 0.586.00 –0.9133.47 3.285.61 2.395.05 2.452.75 0.652.36 0.331.71 0.492.32 0.762.58 0.43±0.13
    Cr–0.3/ρr0.9/ρc–0.6 0.9125.41 –0.738.56 3.245.37 1.803.95 2.522.77 0.912.60 0.472.03 0.522.35 0.832.83 0.44±0.13
    Cr–0.6/ρr0.3/ρc–0.9 0.403.35 –0.9131.91 3.356.09 2.375.08 2.252.89 0.532.28 0.411.89 0.602.63 0.622.44 0.40±0.12
    Cr–0.6/ρr0.6/ρc–0.6 0.535.24 –0.709.63 3.134.74 2.204.75 2.362.81 0.592.22 0.341.60 0.682.39 0.742.54 0.43±0.13
    Cr–0.6/ρr0.9/ρc–0.3 0.9440.34 0.010.04 3.214.77 2.213.69 2.273.29 0.452.12 0.451.88 0.802.61 0.512.18 0.41±0.11
    Cr–0.9/ρr0.3/ρc–0.6 0.383.04 –0.687.71 3.965.20 1.312.77 2.472.72 0.742.43 0.241.32 0.562.01 0.652.43 0.44±0.08
    Cr–0.9/ρr0.6/ρc–0.6 0.545.36 –0.668.38 2.904.56 2.414.51 2.353.24 0.452.10 0.431.87 0.802.58 0.592.33 0.43±0.13
    Cr–0.9/ρr0.9/ρc–0.9 0.9120.45 –0.9224.47 3.246.82 2.433.05 2.383.64 0.512.41 0.572.48 0.652.77 0.532.51 0.42±0.10
     1) Cr为竞争相关值,ρrρc分别为行、列自相关值, $\delta _{\rm{\eta }}^2$、 $\delta _{\rm{\xi }}^2$分别为随机测量误差方差和空间自相关误差方差, $\delta _a^2$为加性方差, $\delta _{{{\rm{g}}_{{\rm{en}}}}}^2$、 $\delta _{{{\rm{g}}_{{\rm{wn}}}}}^2$、 $\delta _{{{\rm{g}}_{{\rm{sn}}}}}^2$、 $\delta _{{{\rm{g}}_{{\rm{nn}}}}}^2$分别为东向、西向、南向和北向近邻遗传竞争方差, $h_i^2$为单株狭义遗传力;表中的上标值是t检验统计量,为估计值与标准误的比值。
    下载: 导出CSV 
    | 显示表格

    真实数据拟合的结果(表3)显示,常规的RCBM模型,估计的区组方差为0.19,加性方差为2.46,剩余残差为2.96;仅有空间行列自相关的模型SM,加性方差被高估为7.58;加上区组因子后的空间模型SM1,这种偏差被修正,加性方差为2.74,空间自相关误差方差为2.84,但行、列自相关值仅为0.11、0.13;“空间+测量”误差模型SUM,有较好的拟合结果,加性方差为2.21,随机测量误差方差为2.80,空间自相关误差方差为0.80;空间与竞争模型SCM为最优模型,加性方差为2.25,随机测量误差方差和空间自相关误差方差均比SUM有所降低,分别为2.41和0.72,所估算的近邻竞争方差在0.01~0.13,但没达到显著水平。从似然值lnL和AIC值可知,SCM模型仍是最优。

    表  3  真实数据不同模型估计参数的比较1)
    Table  3.  Comparison of estimated parameters from different models for real data
    模型 参数/
    lnL AIC $\delta _{{\rm{rep}}}^2$ $\delta _{{\rm{plot}}}^2$ $\delta _e^2$ $\delta _{\rm{\eta }}^2$ $\delta _{\rm{\xi }}^2$ ρr ρc $\delta _a^2$ $\delta _{{{\rm{g}}_{{\rm{en}}}}}^2$ $\delta _{{{\rm{g}}_{{\rm{wn}}}}}^2$ $\delta _{{{\rm{g}}_{{\rm{sn}}}}}^2$ $\delta _{{{\rm{g}}_{{\rm{nn}}}}}^2$ $h_i^2$
    RCBM 4 –1 605 3 219 0.191.54 0.00 2.968.04 2.463.82 0.45±0.09
    SM 4 –1 578 3 165 0.816.84 0.9839.29 0.9842.75 7.5824.29
    SM1 6 –1 600 3 212 0.191.49 0.00 2.846.84 0.118.92 0.132.69 2.743.69
    SUM 7 –1 569 3 153 0.010.14 0.00 2.808.37 0.801.26 0.9738.63 0.9839.76 2.213.81 0.44±0.10
    SCM 10 –1 559 3 138 2.416.43 0.722.96 0.9120.33 0.9326.38 2.253.75 0.130.75 0.091.13 0.010.32 0.051.00 0.48±0.10
     1) lnL为迭代收敛似然值,AIC为赤池信息量准则, $\delta _{{\rm{rep}}}^2$为区组方差, $\delta _{{\rm{plot}}}^2$为小区方差, $\delta _e^2$为剩余残差, $\delta _{\rm{\eta }}^2$、 $\delta _{\rm{\xi }}^2$分别为测量随机误差方差和空间自相关误差方差,ρrρc分别为行、列自相关值, $\delta _a^2$为加性方差, $\delta _{{{\rm{g}}_{{\rm{en}}}}}^2$、 $\delta _{{{\rm{g}}_{{\rm{wn}}}}}^2$、 $\delta _{{{\rm{g}}_{{\rm{sn}}}}}^2$、 $\delta _{{{\rm{g}}_{{\rm{nn}}}}}^2$分别为东向、西向、南向和北向近邻遗传竞争方差, $h_i^2$为单株狭义遗传力;表中的上标值是t检验统计量,为估计值与标准误的比值;…表示单株遗传力因没有随机测量误差而不能计算。
    下载: 导出CSV 
    | 显示表格

    本研究利用R软件及其程序包breedR模拟数据,结合实测数据,采用XFA1结构拟合加性效应、近邻竞争效应和AR1结构拟合空间效应,建立了RCBM、SM、SUM和SCM 4种模型并进行比较,发现SCM是最优模型,该模型可大大降低随机误差方差,并估算到四周近邻竞争方差,设置参数的不同初始值,SCM估计的参数结果均较为稳定。

    对林木研究而言,试验林面积一般较大,采用常规试验设计难以避免环境异质性,传统的分析模型因忽略环境的异质性而导致遗传参数和育种值估算的偏差,因此Dutkowski 等[8]提出林木遗传试验数据应尽可能采用空间分析。对于环境的空间变异,一般使用3次B样条函数(Cubic B spline)或行列自回归拟合。考虑到残差结构的灵活性,本文采用行列自回归法进行空间分析。从模拟数据的似然值lnL和AIC值结果可以看出,空间分析模型比常规分析模型拟合的结果更好,但是没有随机误差方差的空间模型,随机误差被纳入空间相关误差,从而导致空间相关误差方差被高估,因此,也造成空间变异趋势被抑制,使得行、列自相关值被低估,这从残差图和空间变异图也可得到佐证。然而,仅有行、列自相关的空间模型会导致加性方差被严重高估[3],本文也得到一致的结果。Magnussen[2] 指出,环境异质性一般存在于试验林早期,林木个体周围相似的微环境会导致个体间存在正相关,但随着林木生长,个体间的竞争日趋严重,将会导致个体间存在负相关。因此,对于多年生的林木试验林,个体间存在竞争效应是必然的,这是造成个体致死率的重要因素[9]。换言之,林木性状的表型中,会同时存在空间效应和竞争效应,忽略任何一个因素,都可能会造成遗传评估的偏差,并进一步影响后续的选择工作。对于遗传竞争效应,拟合的方法有GIM[10]、TIM[11]和CSM[12],但上述研究中遗传竞争效应均为单一值,忽略了林木个体周边的遗传竞争效应可能不同。本文提出的以加性效应及其四周近邻竞争效应的方差–协方差矩阵作为G结构,替代常规的加性G结构,从而达到拟合近邻竞争效应值不唯一的目的。考虑到降低运算量和模型收敛,采用因子分析法来拟合G结构。模拟数据的拟合结果表明,新的SCM模型,拟合方差虽然没有增加,但随机误差方差大大降低了,分别由7.56(RCBM)、5.72(SUM)降低到3.13(SCM),分别降低了58.6%、45.3%,这与同时考虑竞争效应和空间效应的研究模型结果[12]相一致。此外,拟合数据的SCM模型单株狭义遗传力保持在0.40左右,高于RCBM(0.24)和SUM模型(0.30)。而针对参数不同初始值的模拟数据,SCM模型的拟合结果都比较稳定,表明其可用于林木的遗传分析。最后,利用松树的实测数据验证SCM模型,估算结果与模拟结果比较一致,笔者认为,新单株混合模型即SCM模型可用于林木遗传分析,在提高遗传评估的准确性和可靠性方面具有优势。

  • 图  1   高光谱成像仪系统

    Figure  1.   Hyperspectral imaging system

    图  2   龙眼叶片高光谱图像不同区域划分

    R1:叶肉区域;R2:背景区域;R3:叶脉区域

    Figure  2.   Different regions in a hyperspectral image of Longan leaf

    图  3   叶肉、背景与叶脉区域的光谱特征

    Figure  3.   The spectral characterisitics of mesophyll, background and vein

    图  4   自动提取感兴趣区域去噪后的效果

    Figure  4.   The effect of automatically extracted image of interest area after background removal

    图  5   龙眼叶片不同生长期光谱特性的相关性分析

    Figure  5.   Correlation analyses of spectral characteristics of Longan leaves in different growth periods

    图  6   300个样本的光谱一阶导数曲线

    Figure  6.   The first derivative curves of 300 samples

    图  7   基于图像特征及光谱特征的SAE模型预测的龙眼叶片叶绿素含量

    Figure  7.   Prediction of chlorophyll contents of Longyan leaves using SAE model based on image and spectral features

    图  8   基于SAE模型预测的龙眼叶片叶绿素含量分布图

    Figure  8.   Distribution maps of chlorophyll contents of Longyan leaves based on SAE model

    表  1   龙眼叶片样本校正集与验证集的叶绿素含量

    Table  1   Chlorophyll contents in Longan leaves for calibration and validation sets

    项目 样本数/个 w(叶绿素)/(mg·g–1)
    最大值 最小值 平均值 标准偏差
    校正集 240 3.416 3 0.731 4 1.915 5 0.531 2
    验证集 60 3.353 2 0.721 1 1.930 1 0.520 2
    下载: 导出CSV

    表  2   龙眼叶片叶绿素含量与光谱特性相关性分析建模及验证结果1)

    Table  2   Modeling and validation of correlation between chlorophyll content and spectral characteristic of Longan leaves

    生长阶段 强相关
    波长/nm
    入选波
    段数/个
    最高相关性
    波长/nm
    最高相关
    系数(r)
    基于最高相关性
    波长的回归方程
    校正集 验证集
    R2c RMSEc R2v RMSEv
    嫩叶   488~722 194 692 –0.856 9 y=–105.2x+55.8 0.657 9 0.577 6 0.551 3 0.600 1
    成熟叶  508~648、682~721 149 698 –0.873 0 y=–270.6x+81.7 0.682 1 0.555 2 0.605 5 0.574 3
    老熟叶  509~603、690~712 95 705 –0.852 3 y=–168.1x+86.2 0.676 5 0.566 5 0.599 1 0.589 4
    全生长期 495~715 182 703 –0.890 3 y=–188.9x+82.5 0.762 2 0.256 9 0.621 2 0.289 6
     1)回归方程中,x:最高相关性波段的反射率,y:叶绿素含量
    下载: 导出CSV

    表  3   不同光谱特征参数的龙眼叶片叶绿素含量反演结果

    Table  3   The inversion results of chlorophyll contents of Longan leaves based on different spectral characteristic parameters

    回归模型1) 校正集 验证集
    R2c RMSEc R2v RMSEv
    y=0.155x1–106.1 0.823 4 0.232 4 0.756 7 0.301 2
    y=–0.342x2+11.7 0.472 3 0.795 1 0.338 7 0.845 3
    y=0.086x1–0.212x2–36.4 0.742 4 0.302 5 0.654 5 0.386 5
    y=–0.434x3+242.1 0.175 0 1.204 5 0.155 4 1.468 2
    y=–0.24x4+5.5 0.793 8 0.253 4 0.680 1 0.299 6
    y=104.4–0.315x3+2.99x4 0.686 5 0.289 0 0.595 1 0.421 3
    y=–0.14x5+95.5 0.816 8 0.234 4 0.757 9 0.296 0
    y=–0.431x6+5.5 0.718 5 0.286 5 0.656 7 0.301 3
    y=55.3–0.082x5+0.017x6 0.856 8 0.219 5 0.771 2 0.286 2
    y=0.058x7+1.9 0.062 1 1.364 9 0.051 5 1.379 2
     1) x1: 红边位置, 683~765 nm光谱曲线一阶导数最大值波段;x2: 683~765 nm红边反射率总和;x3: 490~595 nm反射率最大值波段;x4: 490~595 nm反射峰带所有反射率总和;x5: 595~682 nm吸收带反射率最小的波段;x6: 595~682 nm吸收带所有反射率总和;x7: 平台区800~960 nm所有反射率总和;y: 叶绿素含量
    下载: 导出CSV

    表  4   不同生长阶段龙眼叶片特征波段图像纹理特征与叶绿素含量的相关系数(r)

    Table  4   The correlation coefficients of chlorophyll contents and texture parameters from characteristic wavelength images of Longyan leaves in different periods

    λ/nm 嫩叶 成熟叶 老熟叶 全生长期
    对比度 相关性 能量 同质性 对比度 相关性 能量 同质性 对比度 相关性 能量 同质性 对比度 相关性 能量 同质性
    550 –0.37 0.54 0.61 0.64 –0.45 0.55 0.65 0.67 –0.44 0.56 0.66 0.69 –0.46 0.53 0.67 0.69
    677 –0.41 0.56 0.62 0.64 –0.46 0.55 0.69 0.68 –0.50 0.60 0.69 0.71 –0.48 0.58 0.68 0.69
    703 –0.48 0.55 0.65 0.62 –0.55 0.60 0.70 0.71 –0.51 0.63 0.71 0.72 –0.50 0.61 0.68 0.70
    下载: 导出CSV
  • [1] 李粉玲, 王力, 刘京, 等. 基于高分一号卫星数据的冬小麦叶片SPAD值遥感估算[J]. 农业机械学报, 2015, 46(9): 273-281.
    [2] 何启平, 陈莹. 校园常见植物叶绿素提取方法比较及其含量测定[J]. 黑龙江农业科学, 2015(10): 117-120.
    [3] 丁永军, 李民赞, 安登奎, 等. 基于光谱特征参数的温室番茄叶片叶绿素含量检测[J]. 农业工程学报, 2011, 27(5): 244-247.
    [4] 岳学军, 全东平, 洪添胜, 等. 柑橘叶片叶绿素含量高光谱无损检测模型[J]. 农业工程学报, 2015, 31(1): 294-302.
    [5] 李媛媛, 常庆瑞, 刘秀英, 等. 基于高光谱和BP神经网络的玉米叶片SPAD值遥感估算[J]. 农业工程学报, 2016, 32(16): 135-142.
    [6] 冯雷, 骆一凡, 何勇, 等. 基于机器视觉技术的尖椒冠层SPAD值测定仪的开发[J]. 农业工程学报, 2016, 32(21): 177-182.
    [7] 赵艳茹, 余克强, 李晓丽, 等. 基于高光谱成像的南瓜叶片叶绿素分布可视化研究[J]. 光谱学与光谱分析, 2014, 34(5): 1378-1382.
    [8] 余克强, 赵艳茹, 李晓丽, 等. 高光谱成像技术的不同叶位尖椒叶片氮素分布可视化研究[J]. 光谱学与光谱分析, 2015, 35(3): 746-750.
    [9]

    CHENG J H, SUN D W, PU H, et al. Comparison of visible and long-wave near-infrared hyperspectral imaging for colour measurement of grass carp[J]. Innov Food Sci Emerg, 2014, 7(11): 3109-3120.

    [10] 朱瑶迪, 邹小波, 石吉勇, 等. 高光谱图像技术快速预测发酵醋醅总酸分布[J]. 农业工程学报, 2014, 30(16): 320-327.
    [11] 李芳, 石吉勇, 张德涛, 等. 银杏叶中黄酮含量的叶面分布检测研究[J]. 食品工业科技, 2015, 36(9): 270-272.
    [12]

    JIN H L, LI L L, CHENG J H. Rapid and non-destructive determination of moisture content of peanut kernels using hyperspectral imaging technique[J]. Food Anal Method, 2015, 8(10): 2524-2532.

    [13] 刘顺枝. 不同成熟度龙眼叶片组织显微结构的观察[J]. 嘉应大学学报, 2000, 18(6): 85-86.
    [14] 黄玉溢, 谭宏伟, 周柳强, 等. 龙眼施用长效氮肥的效应研究[J]. 南方农业学报, 2003(S2): 71-73.
    [15] 周庆贤, 周颂棠, 伦演鹏, 等. 广州地区石硖龙眼高产栽培技术[J]. 广东农业科学, 2005, 32(3): 83-84.
    [16] 彭庆芳. 浅谈龙眼优质高产栽培技术[J]. 吉林农业(学术版), 2010(7): 107.
    [17] 潘玲玲, 徐晓洁, 谭晶晶, 等. 分光光度法快速测定玉米叶片中的叶绿素[J]. 分析化学, 2007, 35(3): 413-415.
    [18]

    WU D, SHI H, WANG S, et al. Rapid prediction of moisture content of dehydrated prawns using online hyperspectral imaging system[J]. Analytica Chimica Acta, 2012, 726(9): 57-66.

    [19]

    WU D, SUN D W, HE Y. Application of long-wave near infrared hyperspectral imaging for measurement of color distribution in salmon fillet[J]. Innov Food Sci Emerg, 2012, 16(39): 361-372.

    [20] 张永贺, 郭啸川, 褚武道, 等. 基于红边位置的木荷叶片叶绿素含量估测模型研究[J]. 红外与激光工程, 2013, 42(3): 798-804.
    [21] 薛利红, 杨林章. 采用不同红边位置提取技术估测蔬菜叶绿素含量的比较研究[J]. 农业工程学报, 2008, 24(9): 165-169.
    [22] 梁爽, 赵庚星, 朱西存. 苹果树叶片叶绿素含量高光谱估测模型研究[J]. 光谱学与光谱分析, 2012, 32(5): 1367-1370.
    [23] 岳有军, 杨雪, 赵辉, 等. 基于支持向量机的油菜缺素诊断研究[J]. 广东农业科学, 2015, 42(20): 145-148.
    [24] 尹征, 唐春晖, 张轩雄. 基于改进型稀疏自动编码器的图像识别[J]. 电子科技, 2016, 29(1): 124-127.
    [25] 孙文珺, 邵思羽, 严如强. 基于稀疏自动编码深度神经网络的感应电动机故障诊断[J]. 机械工程学报, 2016, 52(9): 65-71.
    [26]

    LUO W, YANG J, XU W, et al. Locality-constrained sparse auto-encoder for image classification[J]. IEEE Signal Proc Let, 2015, 22(8): 1070-1073.

    [27]

    VINCENT P, LAROCHELLE H, LAJOIE I, et al. Stacked denoising auto-encoders[J]. J Mach Learn Res, 2010, 11(12): 3371-3408.

    [28] 刘文雅, 潘洁. 基于神经网络的马尾松叶绿素含量高光谱估算模型[J]. 应用生态学报, 2017, 28(4): 1128-1136.
    [29] 邹小波, 张小磊, 石吉勇, 等. 基于高光谱图像的黄瓜叶片叶绿素含量分布检测[J]. 农业工程学报, 2014, 30(13): 169-175.
    [30] 陈晨, 张永成. 马铃薯不同品种间气孔密度及叶绿素含量的差异性研究[J]. 中国农学通报, 2013, 29(27): 83-87.
    [31] 顾振芳, 王伟清, 朱爱萍, 等. 黄瓜对霜霉病的抗性与叶绿素含量、气孔密度的相关性[J]. 上海交通大学学报(农业科学版), 2004, 22(4): 381-384.
    [32] 颜惠霞, 徐秉良, 梁巧兰, 等. 南瓜品种对白粉病的抗病性与叶绿素含量和气孔密度的相关性[J]. 植物保护, 2009, 35(1): 79-81.
图(8)  /  表(4)
计量
  • 文章访问数:  1877
  • HTML全文浏览量:  4
  • PDF下载量:  3095
  • 被引次数: 0
出版历程
  • 收稿日期:  2017-09-13
  • 网络出版日期:  2023-05-17
  • 刊出日期:  2018-05-09

目录

/

返回文章
返回