• 《中国科学引文数据库(CSCD)》来源期刊
  • 中国科技期刊引证报告(核心版)期刊
  • 《中文核心期刊要目总览》核心期刊
  • RCCSE中国核心学术期刊

肝脏RNA-seq揭示杜洛克猪剩余采食量的社会遗传效应调控的关键基因和分子途径

崔晟頔, 王书杰, 赵真坚, 陈栋, 申琦, 余杨, 王俊戈, 陈子旸, 禹世欣, 陈佳苗, 王翔枫, 吴平先, 唐国庆

崔晟頔, 王书杰, 赵真坚, 等. 肝脏RNA-seq揭示杜洛克猪剩余采食量的社会遗传效应调控的关键基因和分子途径[J]. 华南农业大学学报, 2025, 46(3): 336-341. DOI: 10.7671/j.issn.1001-411X.202407006
引用本文: 崔晟頔, 王书杰, 赵真坚, 等. 肝脏RNA-seq揭示杜洛克猪剩余采食量的社会遗传效应调控的关键基因和分子途径[J]. 华南农业大学学报, 2025, 46(3): 336-341. DOI: 10.7671/j.issn.1001-411X.202407006
CUI Shengdi, WANG Shujie, ZHAO Zhenjian, et al. Liver RNA-seq reveals key genes and molecular pathways regulating the social genetic effects of residual feed intake in Duroc pigs[J]. Journal of South China Agricultural University, 2025, 46(3): 336-341. DOI: 10.7671/j.issn.1001-411X.202407006
Citation: CUI Shengdi, WANG Shujie, ZHAO Zhenjian, et al. Liver RNA-seq reveals key genes and molecular pathways regulating the social genetic effects of residual feed intake in Duroc pigs[J]. Journal of South China Agricultural University, 2025, 46(3): 336-341. DOI: 10.7671/j.issn.1001-411X.202407006

肝脏RNA-seq揭示杜洛克猪剩余采食量的社会遗传效应调控的关键基因和分子途径

基金项目: 

国家生猪技术创新中心先导科技项目(NCTIP-XD/B01);四川省科技厅项目(2020YFN0024,2021ZDZX0008,2021YFYZ0030)

详细信息
    作者简介:

    崔晟頔,E-mail: 313164192@qq.com

    通讯作者:

    唐国庆,主要从事猪分子遗传研究,E-mail: tyq003@163.com

  • 中图分类号: S828.2

Liver RNA-seq reveals key genes and molecular pathways regulating the social genetic effects of residual feed intake in Duroc pigs

  • 摘要:
    目的 

    旨在解析杜洛克猪剩余采食量的社会遗传效应(The social genetic effects of residual feed intake, SGE-RFI)的分子调控机制,揭示其通过能量代谢途径影响群体行为的生物学基础,为提高猪只饲料利用效率提供理论依据。

    方法 

    通过RNA测序技术对杜洛克猪肝脏组织进行全转录组分析,系统筛选与SGE-RFI性状相关的关键差异表达基因,并采用功能富集方法解析其参与的生物学通路。

    结果 

    鉴定出360个显著差异表达基因,功能分析表明这些基因主要富集于线粒体氧化磷酸化和ATP代谢等能量代谢相关通路,提示其可能通过调控机体能量稳态间接影响社会行为。载脂蛋白基因簇APOA1APOC3APOA4的协同表达改变,揭示了社会遗传效应调控过程中神经内分泌系统与脂代谢的交互作用。

    结论 

    本研究构建了杜洛克猪SGE-RFI的多维度调控网络,不仅为解析群体行为遗传机制提供了新视角,更为精准选育低剩余采食量种猪和优化群体饲养管理方案奠定了分子基础。

    Abstract:
    Objective 

    This study aims to elucidate the molecular regulatory mechanisms of the social genetic effects of residual feed intake (SGE-RFI) in Duroc pigs, and reveal the biological basis of how it influences group behavior through energy metabolism pathways, thereby providing a theoretical basis for improving feed utilization efficiency in pigs.

    Method 

    By employing RNA sequencing technology, a comprehensive transcriptome analysis of the liver tissue in Duroc pigs was conducted, systematically screening for key differentially expressed genes related to the SGE-RFI trait. Functional enrichment methods were used to analyze the biological pathways involved.

    Result 

    The study identified 360 significantly differentially expressed genes. Functional analysis indicated that these genes were primarily enriched in energy-related pathways such as mitochondrial oxidative phosphorylation and ATP metabolism, suggesting an indirect influence on social behavior through the regulation of energy homeostasis. The coordinated expression changes in the apolipoprotein gene cluster APOA1, APOC3 and APOA4 revealed the interaction between the neuroendocrine system and lipid metabolism during the social genetic effect regulation.

    Conclusion 

    This research has constructed a multi-dimensional regulatory network for SGE-RFI in Duroc pigs, offering not only a new perspective for understanding the genetic mechanisms of group behavior, but also laying a molecular foundation for the precise selection of breeding pigs with low residual feed intake and the optimization of group feeding management strategies.

  • 森林生物量指的是森林范围内生物所含有机物的量,常用干质量表示。作为重要的生态学指标,森林生物量直接反映森林的生产力与碳汇能力,对于评价森林生态系统的结构和功能具有重要作用[1]。传统森林生物量的获取方法通常采用直接收获法,主要有皆伐法[2]、标准木法[3]和相对生长法[4]3种方式,通过对样地内树木伐倒、烘干以及称质量等步骤得到单株树木各部分的生物量,进而得到单株树木生物量和样地生物量。这些方法获取数据存在工作量大、费时费力等不足,且对树木造成不可逆转的损伤。因此如何通过有效的途径快速、无损地获取森林生物量一直是生态学领域的研究热点[5]

    无人机激光雷达(Unmanned aerial vehicle laser scanning,UAV-LS)是一种新兴的遥感技术,能够通过高密度的点云数据获取水平以及垂直结构的森林参数[6],因其高效无损、便捷灵活等优点广泛应用于林业中。目前,基于UAV-LS数据进行森林生物量估测的方法大多依赖于异速生长模型[7],主要是将激光雷达数据中提取的变量与生长模型结合,从而完成生物量估测。其中,将UAV-LS数据衍生的变量(高度百分位数、强度百分位数等)与实测树高、胸径等参数相结合,利用机器学习方法进行地上生物量估算已取得良好效果[8],并且,这一方法进一步拓展到基于机载激光雷达冠层高度与信号强度等变量的结合,构建生物量估测模型[9]。相较于传统回归模型,机器学习方法因其不需要描述预测关系和响应变量而被越来越多地运用在森林清查中[10],特别是在预测碳储量、生物量等方面[11]。除此之外,也有利用UAV-LS提取的单木参数(树高、胸径、冠幅等)在非线性CAR(Constant allometric ratio)模型的基础上进行生物量的估测[12]

    UAV-LS所提取的参数信息已被证实在生物量估测上具有较高的可信度[13],但是,利用树木定量结构模型(Quantitative structure model,QSM)从UAV-LS数据中提取参数估测生物量则鲜有报道。QSM是利用三维模型定量描述和理解树木结构与生长规律的工具,已广泛应用在地基激光雷达(Terrestrial laser scanning,TLS)中,通过TLS点云数据建模并提取树木三维结构参数,进而估算材积[14]、蓄积量[15]、生物量[16]等森林量化指标。同样,QSM利用无人机激光点云进行生物量估测的应用潜力已得到证实[17],特别是在考虑到树木结构和生物量构成组分时,无人机QSM可以成为森林管理活动和决策过程中有效的替代方案[18]。但是,如果数据集的质量太差、点云密度不高时,建模精度便无法保证,会出现生物量被低估的现象[19]

    因此,本研究在获取高密度UAV-LS数据的基础上,基于落叶阔叶林树种进行QSM的构建。通过三维模型提取树木参数,并进一步利用随机森林(Random forest,RF)、多层感知机(Multi-layer perceptron,MLP)和支持向量机(Support vector machine,SVM) 3种机器学习方法进行单木生物量估测,筛选最优单木生物量估测模型,为复杂森林环境下生物量估算提供科学参考。

    研究区位于安徽省六安市金寨县天马国家级自然保护区。保护区地处大别山腹地,生物资源丰富,是北亚热带向暖温带的过渡地域,地理坐标介于115°20′~115°50′E,31°10′~31°20′N,海拔800~1729 m。保护区属于北亚热带湿润季风气候类型,四季分明,年平均气温13.8 ℃,年平均降雨量1400 mm。保护区总面积约28913.7 hm2,其中核心区5745.3 hm2,缓冲区8118.6 hm2,实验区15049.8 hm2。研究区植被类型属暖温带落叶阔叶林向亚热带常绿阔叶林过渡型,植被垂直分布明显,落叶阔叶林属天然次生林,主要有茅栗Castanea seguinii、短柄枹栎Quercus glandulifera、锐齿槲栎Quercus aliena var. acutiserrata等栎类以及化香Platycarya strobilacea、大别山山核桃Carya dabieshanensis、领春木Euptelea pleiosperma等其他硬阔类树种。样地内最高海拔1103 m,最低海拔1055 m,高度差达48 m,坡度主要集中在22°~36°。

    地面数据的获取来源于2023年3月对落叶阔叶林样地的调查。首先在研究区布设75 m×75 m的大样地,划分为9个25 m×25 m的小样地,利用全站仪获取样地4个至角点坐标,并确定界外木。对样地内胸径(DBH)≥5 cm的乔木进行每木检尺,并记录树种信息。使用TruePulse200激光测距仪测量树高,用胸径卷尺测量胸径,用徕卡DistoD510激光测距仪测量树冠垂直投影距离。同时,将树的基部位置作为定位点,利用华测i86RTK(精度15 mm)记录每株树准确的位置信息,定位点的空间参照采用WGS84坐标系和UTM投影。样地基本概况见表1,除枯死木外,共统计样地内563株阔叶树种。根据相关研究并结合样地实际情况[20],按胸径大小将样地树木划分为4个生活史阶段,分别为小树(5 cm≤DBH<7.5 cm,176株)、中树(7.5 cm≤DBH<22.5 cm,234株)、大树(22.5 cm≤DBH<47.5 cm,140株)以及老树(DBH≥47.5 cm,13株)。在忽略小树后,样地内主要优势树种为茅栗(100株)、短柄枹栎(86株)与化香(63株)。

    表  1  样地基本情况
    Table  1.  Basic information of sample plots
    统计值
    Statistical value
    胸径/cm
    DBH
    树高/m
    Tree height
    平均冠幅/m
    Average crown
    breadth
    最大值 Max. 65.50 21.70 12.00
    最小值 Min. 5.00 2.00 0.50
    平均值 Average 17.03 10.16 3.17
    标准差 SD 12.12 4.82 1.67
    下载: 导出CSV 
    | 显示表格

    利用大疆M300RTK无人机搭载禅思L1传感器(水平精度:150 m测量距离下误差为5 cm,垂直精度:150 m测量距离下误差为4 cm),同步获取样地近地面的激光雷达数据。在仿地飞行60 m的高度下进行作业,飞行速度为5 m/s,回波模式为三回波并重复扫描,激光旁向重叠率为60%,点云密度达到631 m−2。点云采集过程中,飞行高度越低、速度越慢,点云密度就越大,高密度点云可以更好地描述树木的结构特征。本试验使用的无人机具备载波相位差分技术(Real-time kinematic,RTK),能提供精确的位置信息,其坐标系和投影设置与华测i86RTK保持一致,航线设置如图1所示。

    图  1  航线规划图
    Figure  1.  Flight path planning map

    通过开源软件CloudCompare (https://www.cloudcompare.org)对Las格式点云进行去噪处理,再利用CSF(Cloth simulation filter)算法[21]对去噪后的点云进行滤波,分离出地面点与非地面点。最后,将地面点转换为分辨率0.1 m大小的栅格数据,使用拉普拉斯算子对栅格平滑后计算非地面点到该栅格的距离,并将计算的距离作为非地面点的高度,从而完成归一化(图2)。

    图  2  归一化前后对比结果
    Figure  2.  Comparison results before and after normalization

    使用LiDAR360软件中集成的相对最短路径算法(Comparative shortest-path algorithm,CSP)对点云进行分割,该算法借鉴了生态学理论,采用自下而上的方式,从点云主干进行搜索,并通过分支到主干的最近距离来判断所属关系,从而完成点云分割。这种方法在落叶期的阔叶树中表现出良好的分割效果[22]。本文研究数据采集时期正是树木的落叶期,枝干点云清晰,符合该算法的应用场景。点云分割精度采用召回率(t)、正确率(p)以及tp的调和平均值(F)进行评价,三者取值范围均为0到1,数值越接近1表示分割效果越好。计算公式如下:

    $$ t = \dfrac{{{\mathrm{TP}}}}{{{\mathrm{TP}} + {\mathrm{FN}}}}{\text{,}} $$ (1)
    $$ p = \dfrac{{{\mathrm{TP}}}}{{{\mathrm{TP}} + {\mathrm{FP}}}}{\text{,}} $$ (2)
    $$ F = \dfrac{{2t p}}{{t + p}}{\text{,}} $$ (3)

    式中,${\mathrm{TP}}$表示正确分割,指一对一的关系,将树木分割为单独的一株树,即有效单木分割;${\text{FP}}$表示过分割,指一对多的关系,把原本属于1个整体的单木分成了多株单木;${\text{FN}}$表示欠分割,指1株或几株树被划分到其临近的单木中,且未被检测出来。

    树木定量结构模型是重建树木三维模型的方法。目前较为常用的模型有PypeTree[23]、TreeQSM[24]、SimpleTree[25]等,本文将TreeQSM (https://github.com/InverseTampere/TreeQSM)作为试验模型,该模型由芬兰坦佩雷理工大学的Pasi Raumonen等开发,在不同森林类型中均具有较好的普适性,其构建单木模型的核心方法是对点云进行体元化分割,实现对树木几何特征的定量表达,如体积、冠幅、分支角度等。其中,PatchDiam1、PatchDiam2Min和PatchDiam2Max是TreeQSM建模所必需的3个重要参数。建模过程主要分为2个阶段,第一阶段是按照PatchDiam1定义的体元大小进行简单分割;第二阶段是按照设置的最大、最小体元实现精细分割,也可同时添加其他参数实现更具体的分割。其中,在所有样本中随机选取20株树对参数进行敏感性分析,并将最优参数作为其他样本的输入参数。具体参数设置可以参照开发者文档(https://github.com/InverseTampere/TreeQSM/blob/master/Manual)。在完成三维模型后,提取胸径、主干体积、枝干体积、分支数、冠层基部高度、冠层面积、冠层体积以及冠幅等参数,并且为保证建模效果具有稳定性,每个样本获取20组树木定量结构模型,各个参数取其平均值作为最终结果。

    按照《主要树种立木生物量模型与碳计量参数》标准(GB/T 43648—2024)[26]计算单木生物量,研究区内栎树采用南方其他省份栎树分布区对应的计算公式,而其他阔叶树则采用全国通用的其他硬阔树地上生物量公式,具体如下:

    $$ M = 0.213\;6{D^{2.304\;16}}{\text{,}} $$ (4)
    $$ M = 0.187\;5{D^{2.333\;00}}{\text{,}} $$ (5)

    式中,M为地上生物量估计值,D为林木胸径。式(4)为栎树公式,式(5)为其他阔叶树公式。

    利用Pearson相关系数(r)和方差膨胀因子(Variance inflation factor,VIF)进行特征筛选,移除共线性变量,具体计算公式如下:

    $$ r=\dfrac{{\displaystyle\sum }_{i=1}^{n}({X}_{i}-\overline {X})({Y}_{i}-\overline {Y})}{\sqrt{{\displaystyle\sum }_{i=1}^{n}{({X}_{i}-\overline {X})}^{2}}\sqrt{{\displaystyle\sum }_{i=1}^{n}{({Y}_{i}-\overline {Y})}^{2}}}, $$ (6)
    $$ {{\mathrm{VIF}}}_{i}=\dfrac{1}{1-{r}_{i}^{2}}, $$ (7)

    式中,$ {X}_{i} $$ {Y}_{i} $分别是2个变量的第i个观察值,$ \overline {X} $$ \overline {Y} $是2个变量的均值,ri表示第i个变量与其他变量的相关系数,VIFi是第i个变量的方差膨胀因子,当VIF小于5时可以认为该变量与其他变量之间不存在明显的共线性。

    选取RF、SVM和MLP 3种方法进行生物量建模。RF是集成算法的延伸,其核心是对样本进行随机抽样,通过构造多个决策树来提升算法的性能,对模型具有很好的解释性。SVM通过划分超几何空间并结合核函数,将数据隐式地映射到一个更高维的空间,使其在新的空间中变得线性可分,进而完成模型构建。MLP是前馈神经网络,由输入层、1个或多个隐藏层和输出层组成,数据传入输入层,通过激活函数完成在隐藏层的传输,最终由输出层对数据进行预测。机器学习可以使用各种具有更高精度的大输入数据对复杂的空间模式进行建模,这种方法越来越多地用于森林生物量的估测研究中[27-28]

    本文将试验样本数据集按7∶3随机划分成训练集和测试集。在训练集上,通过网格搜索与十折交叉验证的方式寻找模型的最优参数。具体而言,将训练集进一步分为10等份,每次选取其中1份作为验证集,剩余的9份作为训练集,循环10次,确保每一份数据都被用作验证集,并利用交叉验证确定的最优参数,在整个训练集上重新训练模型。模型训练完成后,使用测试集对模型的性能进行评估,以检验模型的泛化能力。其中,采用决定系数(R2)、均方根误差(RMSE)和相对均方根误差(rRMSE)进行模型训练集及测试集的精度评价。R2用于评估模型的整体拟合效果,RMSE和rRMSE用于衡量模型的预测准确性,具体公式如下:

    $$ {R}^{2}=1-{ \displaystyle\sum\nolimits _{i=1}^{n}{({y}_{i}-{\overset{\frown}{y}_{i}})}^{2}/}{ \displaystyle\sum\nolimits _{i=1}^{n}{({y}_{i}-\overline{y})}^{2}}, $$ (8)
    $$ {\mathrm{RMSE}}=\sqrt{{ \displaystyle\sum\nolimits _{i=1}^{n}{({y}_{i}-{\overset{\frown}{y}_{i}})}^{2}/n}} ,$$ (9)
    $$ {\mathrm{rRMSE}} = \dfrac{{{\mathrm{RMSE}}}}{{\overline y}} \times 100{\text{%}}, $$ (10)

    式中,$n$为样本中单木数量,${{{y}}_{{i}}}$为单木生物量的估计值,$ {\overset{\frown}{y}_{i}} $为模型预测值,$\overline y$为样本平均值。

    将非地面点按照TIN内插法生成分辨率为0.1 m的栅格,即数字高程模型(Digital elevation model,DEM)。在相同位置处对比DEM与单木RTK的海拔,以此验证激光雷达的位置精度。结果(图3)显示两者海拔几乎一致(R2=0.9999),说明UAV-LS所采集的数据位置偏差极小,点云数据中显示的单木位置就是其本身在真实空间的位置,不需要再进行空间位置校正。

    图  3  海拔验证图
    Figure  3.  Elevation verification map

    本文采用边界角点所确定的范围对整个大样地进行划分,共分为9块小样地,当靠近边界的树木提取不完整时,按照树基部位置判断所属的样地,并对缺失部分采取提取、合并的方式进行补全,得到完整的样地点云。由于阔叶林林下植被复杂且UAV-LS采用自上而下的方式获取数据,因此所获取的点云均为中上层枝干较为清晰的点云数据,较难获取样地内中下层小树点云。根据样地内树种分布的复杂性,在进行点云分割时,需针对不同样地采用不同参数进行设置,以期达到最优分割。最后对各个样地的分割结果进行精度评价,具体结果如表2所示。

    表  2  样地分割精度统计结果
    Table  2.  Plot segmentation accuracy statistical results
    样地
    Plot
    实测株数
    Actual tree count
    分割株数
    Segmented tree count
    TP FN FP t P F
    F-score
    1 20 19 18 2 1 0.90 0.95 0.92
    2 23 22 19 4 3 0.83 0.86 0.84
    3 27 24 21 6 3 0.78 0.88 0.82
    4 23 23 18 5 5 0.78 0.78 0.78
    5 36 37 30 6 7 0.83 0.81 0.82
    6 27 26 20 6 5 0.77 0.80 0.78
    7 19 19 18 1 1 0.95 0.95 0.95
    8 17 19 16 3 1 0.84 0.94 0.89
    9 28 28 25 3 3 0.89 0.89 0.89
    下载: 导出CSV 
    | 显示表格

    表2可知,在所有样地的分割中,4号和6号样地调和平均值相对偏低,即F值为0.78。影响其分割精度的主要原因有2点:一是样地中存在丛生的树木点云,二是林分中间层的乔木点云不够清晰。整体来看,共有185株树木被准确地识别并分割出来,占样地内点云树木总量的84%。在阔叶林树种中,分割的综合效果较好,对于一些分割效果较差的树木,通过添加种子点的位置进行再次分割,完成单株树木的精准提取。最终得到220株中大型的乔木点云数据,其胸径范围为15.0~67.2 cm,生活史阶段均为中树及以上树木。

    根据单木分割结果,提取归一化后高度的最大值与最小值,其差值即是树高。与野外实际测量值对比结果(图4)表明,提取的单木树高与测量结果非常接近(R2=0.870 0),说明激光雷达数据能很好地反演树木的实际高度。

    图  4  树高回归图
    Figure  4.  Tree height regression graph

    在进行参数敏感性分析后,设置PatchDiam1、PatchDiam2Min、PatchDiam2Max参数值分别为[0.05,0.08]、[0.01,0.015,0.02]与[0.06,0.10]。敏感性分析后的参数能较好地构建出大胸径树木,但针对胸径较小的树木需要在此基础上稍作修改,其中PatchDiam1参数较为影响小胸径树木的模型效果。在剔除树冠不完整以及主干缺失的点云数据后,共构建176个TreeQSM模型。所有模型中,茅栗(65株)数量最多,其次是短柄枹栎(43株)和化香(42株)。槲栎Quercus aliena Blume和锐齿槲栎也略高,分别为8和9株。其他树种如灯台树Cornus controversa、金缕梅Hamamelis mollis、鹅耳枥Carpinus turczaninowii、黄檀Dalbergia hupeana、山合欢Albizia kalkora以及尾叶樱Cerasus dielsiana等数量较少,各自仅有1或2株。总体来看,树种分布不均,其中茅栗、短柄枹栎和化香占据了较大比例,为优势树种。树木具体建模效果以1株分支较多的点云数据(图5)进行展示,图中所构建的TreeQSM模型能较为清晰地模拟出树木各级枝干的特征。

    图  5  TreeQSM建模前(a)、后(b)对比图
    Figure  5.  Comparison images before (a) and after (b) TreeQSM modeling

    通过构建三维模型从而量化树木参数,并在其中选取7个树木结构参数进行分析,分别统计各个参数的平均值、标准差、最小值、上四分位数、中位数、下四分位数以及最大值,结果见表3。并通过实测胸径与冠幅检验提取精度,其中提取的胸径与实测胸径R2达到0.930 0,冠幅拟合R2达到0.440 0(图6),说明构建的三维模型能较为准确地反映出树木的三维结构。这与相关研究结果[29-30]相符,当胸径大于30 cm时,TreeQSM能更准确地实现重建[31]。本文参与构建模型的点云树木多为胸径较大的乔木树种,因提取的胸径数据为计算生物量的强关联因子,故不参与生物量的模型构建。

    表  3  参数统计信息
    Table  3.  Parameter statistical information
    统计量
    Statistic
    主干体积/m3
    Trunk volume
    枝干体积/m3
    Branch volume
    分支数
    Branch number
    冠层基部高度/m
    Crown base height
    冠层面积/m2
    Crown area
    冠层体积/m3
    Crown volume
    冠幅/m
    Crown width
    平均值 Average 0.82 0.76 146.97 7.89 16.79 39.72 3.78
    标准差 SD 0.58 1.40 166.26 3.17 19.34 103.76 2.31
    最小值 Min. 0.12 0.01 8.00 0.44 1.38 0.01 0.67
    下四分位 P25 0.41 0.11 41.00 5.47 5.09 0.71 2.10
    中位数 P50 0.67 0.25 85.00 8.34 10.49 3.81 3.25
    上四分位 P75 1.04 0.68 173.00 10.43 19.27 26.33 4.85
    最大值 Max. 3.56 10.35 903.00 14.57 138.73 929.58 13.17
    下载: 导出CSV 
    | 显示表格
    图  6  胸径(DBH)及冠幅拟合结果
    Figure  6.  Diameter at breast height (DBH) and crown width fitting results

    经过共线性分析后,共保留5个特征因子用于模型构建,分别是主干体积、分支数、冠层体积、冠层基部高度以及冠幅。其VIF均小于5,主干体积VIF为2.95,分支数3.82,冠层体积3.11,冠层基部高度1.30,冠幅4.62,说明筛选后的变量之间没有较为严重的共线性。进一步对各变量之间进行显著性检验,结果如表4所示。各变量之间均在P<0.001水平下显著相关,除变量冠层基部高度与其他变量负相关外,其他变量之间均为正相关,其中主干体积与生物量相关系数最高,达到0.91。通过相关性分析结果可以看出,冠层结构参数对于生物量研究具有重要意义,如冠层体积(0.72)、冠幅(0.77)等。在陆地生态系统中,植物冠层是介于大气和土壤基质间进行有机物合成代谢的重要部位,对于研究树木生物量起到直接或间接的作用。如单木生物量随冠层基部高度的上升会出现一定程度的下降,这与冠层大小有着密切的关系,当冠层基部位置低时,属于树木冠层的部分就会增多,从而使生物量增加。

    表  4  各建模因子相关性统计1)
    Table  4.  Correlation analysis of each modeling factor
    因素
    Factor
    生物量
    Biomass
    主干体积
    Trunk volume
    冠层体积
    Crown volume
    冠幅
    Crown width
    冠层基部高度
    Crown base height
    分支数
    Branch number
    生物量 Biomass 1.00
    主干体积 Trunk volume 0.91*** 1.00
    冠层体积 Crown volume 0.72*** 0.71*** 1.00
    冠幅 Crown width 0.77*** 0.77*** 0.73*** 1.00
    冠层基部高度 Crown base height −0.46*** −0.40*** −0.38*** −0.46*** 1.00
    分支数 Branch number 0.64*** 0.61*** 0.77*** 0.81*** −0.44*** 1.00
     1) ***表示在P<0.001水平显著相关(Pearson法)。
     1) *** indicates significant correlation at P<0.001 level (Pearson method).
    下载: 导出CSV 
    | 显示表格

    利用网格搜索遍历所有可能的参数组合,并在优化过程中通过交叉验证来评估每个参数组合的性能,从而选择最优的参数集。RF中,max_depth代表决策树的最大深度,限制树的深度可以防止过拟合;min_samples_split是每个节点可以分裂的最小样本数量,该参数影响树的分枝过程,较大的值可以防止过拟合;n_estimators控制树的数量,更多的树通常能提高模型的稳定性。MLP中,alpha代表正则化系数,用于防止模型过拟合,较大的alpha会使模型更平滑,但可能降低模型拟合能力;hidden_layer_sizes是隐藏层的大小和数量,影响模型的学习能力和复杂性;learning_rate控制学习率模型参数更新的速度,其中自适应学习率可根据模型收敛情况自动调整;max_iter为模型训练过程中允许的最大迭代步数。SVM中,C代表惩罚系数,较大的C值会强制模型在训练集上更好地拟合,但可能导致过拟合;gamma是核函数中的参数,决定样本的影响范围,较大的gamma会使模型更倾向于对训练数据的过拟合;Kernel是核函数类型(如线性核等)。

    在经过参数筛选后,RF的最优参数为max_depth=3,min_samples_split=5,n_estimators=100;MLP的最优参数是alpha=0.1,hidden_layer_sizes=(50, 50),learning_rate=‘adaptive’,max_iter=1000;SVM的最优参数是C=1,gamma=0.1,kernel=‘linear’。根据最优参数进行生物量估测的结果(图7)表明,RF的测试集R2达到0.880 0,单木生物量的RMSE为192.81 kg,rRMSE为29.88%;MLP的测试集R2达到0.820 0,单木生物量的RMSE为236.48 kg,rRMSE为36.65%;SVM的测试集R2达到0.810 0,单木生物量的RMSE为243.67 kg,rRMSE为37.77%。3种机器学习模型中,RF的效果最佳,MLP与SVM结果较为接近,精度稍低于RF,但也都表现出较高的准确性,证实了树木定量结构模型所提取的参数能够较好地构建出单木生物量模型,为森林资源清查提供了新方法,对后续研究具有重要意义。

    图  7  3种机器学习算法的生物量估测模型散点拟合对比
    Figure  7.  Scatter plot fitting comparison of biomass estimation models based on the three machine learning algorithms

    本研究使用的RF算法可以训练出最优的单木生物量估测模型,在生物量估测模型的研究中,可以分为参数和非参数模型两大类[10,32],参数模型分为多元线性模型和非线性模型,非参数模型则包括人工神经网络、支持向量机、深度学习等机器学习方法。针对不同研究区域和研究对象,两类模型估测精度各有所长[33]。本文采用机器学习方法进行模型构建,旨在提高目标变量的预测精度,而参数模型可以通过参数组合评估和解释变量对目标变量的影响程度。后续研究如需揭示目标变量与解释变量之间的特定关系,可以选择多元线性和非线性模型探究各参数对单木生物量的响应关系。如Abd Rahman等[34]根据树高、胸径、树冠大小和树冠基部高度生成新的异速生长方程进行生物量计算。也可以将生物量模型细化,分为主干生物量与枝干生物量,这可能需要加入更多的树木参数进行模型完善,如唐依人等[35]利用枝条因子进行分支生物量模型构建。同样,可以根据主干体积与单木生物量之间的强相关性,探索基于体积与木材密度的生物量计算方式是否优于异速生长模型[36],值得注意的是,不同树种的木材密度存在差异,因此需要先区分树种的木材密度,才能得到更准确的结果。

    点云密度也会对TreeQSM模型效果产生影响,并在一定程度上影响树木分割精度。虽然本研究获取的数据为高密度的点云数据,但是也存在点云冠层以及枝干缺失的情况,UAV-LS采用自上而下的方式获取点云数据,当上层树木出现遮挡时,就无法完整获取中下层的树木点云[37]。本研究的阔叶林为天马国家级自然保护区内的天然阔叶混交林,群落发育比较成熟,具有地带性稳定群落特征。因其冠层、林下环境较为复杂,所获取的树木点云主要为主林层大胸径乔木树种数据,胸径均在15.0 cm以上,而对于林下的小乔木则较难获取。但随着地基激光雷达(TLS)和移动激光扫描仪(Mobile laser scanning,MLS)等便携设备的深入应用,也为多源点云数据融合获取高精度三维数据提供了新的技术手段。通过与地面点云数据相结合,可以很好地弥补无人机点云数据在林下缺失的情况,无人机点云数据也能补充地面点云数据缺失的上层树冠部分,多源点云的融合可以促进对树木参数更可靠的估计,从而有助于对复杂森林场景进行互补解释[38],起到扩大应用范围与提高应用精度的效果。Qi等[39]研究发现,在冠层覆盖率增加的情况下,无人机激光点云与MLS相融合的数据在树木定量结构模型中表现最好。除多源点云数据的融合外,探究无人机点云最佳的建模密度也是一种新思路。本文研究情境下表现为仿地飞行高度60 m,后续的研究可以尝试更低的飞行高度以获取更丰富的树木结构,进而深入探究哪种高度下无人机点云数据的三维建模效果最好。

    树木定量结构模型不仅用来估测森林蓄积量、生物量等参数,在树种识别方面也取得了不错的结果[40-41]。Hui等[42]利用几何分形特征和QSM特征进行树种分类,探索特征向量的分类效果,获得了较好的分类结果。QSM可以定量化树木结构,统计树木几何和拓扑属性,如本研究中的主干体积等参数。树木结构可以作为树种分类的重要依据,本文主要基于树木参数进行回归训练,未涉及分类任务。针对植被结构复杂的落叶阔叶林,如何精准识别树种显得尤为重要。特别在树木落叶期,无法根据树叶等信息判断种属,如果能通过树冠、分支等树木结构信息直接进行树种识别,将大大降低野外工作中树种识别的难度。

    本文基于UAV-LS和QSM开展天马自然保护区阔叶树种单木生物量研究。其中,空间位置精度R2达到0.9999,树高提取精度R2为0.870 0,表明激光雷达数据精度很高,并在点云总体分割精度较高的情况下,进行单木点云的精确提取。在此基础上,构建单木的三维结构模型,结果显示,胸径、冠幅拟合精度R2分别为0.930 0和0.440 0,并进一步选择3种机器学习算法对树木参数进行生物量估测模型构建。3种模型中,RF算法结果最优(R2=0.880 0, RMSE=192.81 kg, rRMSE=29.88%),证明QSM所提取的树木参数可以构建出精度较高的落叶期阔叶树种生物量估测模型,为以后相关研究提供启发。本文使用的方法在一定程度上大大减轻了野外工作量和难度,点云数据的获取比地基激光雷达更方便,在森林资源调查中具有巨大的应用价值。

  • 图  1   高RFI-SGE组较低RFI-SGE组肝脏组织中差异表达mRNA的火山图分析

    Figure  1.   Volcano plot analysis of differentially expressed mRNAs in high RFI-SGE group compared with low RFI-SGE group

    图  2   高RFI-SGE(HRS)与低RFI-SGE(LRS)组肝脏组织中差异表达mRNA的层次聚类热图

    Figure  2.   Hierarchical clustering heatmap of differentially expressed mRNAs in high RFI-SGE (HRS) and low RFI-SGE (LRS) groups

    图  3   肝脏组织部分差异表达基因蛋白−蛋白互作网络

    Figure  3.   Protein-protein interaction network of selected differentially expressed genes in liver tissue

    图  4   肝脏组织中差异表达基因的RT-qPCR验证

    Figure  4.   RT-qPCR validation of differentially expressed genes in liver tissue

    表  1   试验猪只剩余采食量与社会遗传效应数据1)

    Table  1   Data on residual feed intake (RFI) and social genetic effects (SGE) of test pigs

    猪只
    Pig
    分组
    Group
    样品编号
    Sample number
    剩余采食量/kg
    RFI
    社会遗传效应
    SGE
    DDJYZC120019500 LRS LRS1 0.3283 0.0179
    DDJYZC120019491 LRS2 0.3372 0.0168
    DDJYZC120019494 LRS3 0.3383 0.0144
    DDJYZC120019492 LRS4 0.3385 0.0141
    DDJYZC120022569 HRS HRS1 0.2406 0.0127
    DDJYZC120022570 HRS2 0.2452 0.0098
    DDJYZC120022571 HRS3 0.2483 0.0091
    DDJYZC120022575 HRS4 0.2609 0.0089
     1) LRS:低RFI-SGE;HRS:高RFI-SGE。
     1) LRS: Low RFI-SGE; HRS: High RFI-SGE.
    下载: 导出CSV

    表  2   高RFI-SGE组肝脏组织Top 10上调与下调基因

    Table  2   Top 10 up- and down-regulated genes in liver tissue of high RFI-SGE group

    基因 Gene log2FC P Padj
    TCN1 5.48 3.14×10−6 3.31×10−4
    HBM 3.77 4.57×10−4 1.20×10−2
    HBB 3.31 2.23×10−4 7.29×10−3
    C2H11orf86 2.73 2.84×10−7 5.26×10−5
    LOC100737768 2.62 9.25×10−4 1.98×10−2
    ARF4 2.54 7.27×10−14 3.59×10−10
    PNPLA3 2.53 3.36×10−5 1.84×10−3
    LOC100517779 2.41 1.75×10−7 3.45×10−5
    APOA4 2.41 4.93×10−7 8.21×10−5
    SPATA22 2.39 1.78×10−7 3.47×10−5
    LOC102164346 −2.43 4.47×10−5 2.25×10−3
    CYP1A1 −2.44 1.99×10−5 1.22×10−3
    COLCA1 −2.46 2.95×10−4 8.86×10−3
    LOC110259967 −2.47 5.12×10−5 2.47×10−3
    GALP −2.69 8.77×10−4 1.90×10−2
    LOC100154757 −3.01 1.77×10−4 6.13×10−3
    KCNH7 −3.14 1.14×10−4 4.49×10−3
    LOC110261964 −3.24 5.52×10−4 1.37×10−2
    ASIC1 −3.35 1.74×10−4 6.08×10−3
    CA3 −3.88 6.27×10−5 2.87×10−3
    下载: 导出CSV
  • [1]

    VIGORS S, O'DOHERTY J V, BRYAN K, et al. A comparative analysis of the transcriptome profiles of liver and muscle tissue in pigs divergent for feed efficiency[J]. BMC Genomics, 2019, 20(1): 461. doi: 10.1186/s12864-019-5740-z

    [2]

    IBRAGIMOV E, PEDERSEN A, XIAO L, et al. Analysis of merged transcriptomic and genomic datasets to identify genes and pathways underlying residual feed intake in growing pigs[J]. Scientific Reports, 2022, 12(1): 21946. doi: 10.1038/s41598-022-26496-1

    [3]

    LIU H, FEYE K M, NGUYEN Y T, et al. Acute systemic inflammatory response to lipopolysaccharide stimulation in pigs divergently selected for residual feed intake[J]. BMC Genomics, 2019, 20(1): 728. doi: 10.1186/s12864-019-6127-x

    [4] 禹世欣, 王书杰, 赵真坚, 等. 杜洛克猪剩余采食量的社会遗传效应与其他经济性状的关联分析 [J]. 中国畜牧杂志, 2024, 60(8): 141-145.
    [5]

    ZHANG Y, PARK C, BENNETT C, et al. Rapid and accurate alignment of nucleotide conversion sequencing reads with HISAT-3N[J]. Genome Research, 2021, 31(7): 1290-1295. doi: 10.1101/gr.275193.120

    [6]

    SHUMATE A, WONG B, PERTEA G, et al. Improved transcriptome assembly using a hybrid of long and short reads with StringTie[J]. PLoS Computational Biology, 2022, 18(6): e1009730. doi: 10.1371/journal.pcbi.1009730

    [7]

    TRAPNELL C, HENDRICKSON D G, SAUVAGEAU M, et al. Differential analysis of gene regulation at transcript resolution with RNA-seq[J]. Nature Biotechnology, 2013, 31(1): 46-53. doi: 10.1038/nbt.2450

    [8]

    SHERMAN B T, HAO M, QIU J, et al. DAVID: A web server for functional enrichment analysis and functional annotation of gene lists (2021 update)[J]. Nucleic Acids Research, 2022, 50(W1): W216-W221. doi: 10.1093/nar/gkac194

    [9]

    SZKLARCZYK D, KIRSCH R, KOUTROULI M, et al. The STRING database in 2023: Protein-protein association networks and functional enrichment analyses for any sequenced genome of interest[J]. Nucleic Acids Research, 2023, 51(D1): D638-D646. doi: 10.1093/nar/gkac1000

    [10]

    SHANNON P, MARKIEL A, OZIER O, et al. Cytoscape: A software environment for integrated models of biomolecular interaction networks[J]. Genome Research, 2003, 13(11): 2498-2504. doi: 10.1101/gr.1239303

    [11]

    ROSSMANN M P, DUBOIS S M, AGARWAL S, et al. Mitochondrial function in development and disease[J]. Disease Models & Mechanisms, 2021, 14(6): dmm048912.

    [12]

    MOR D E, SOHRABI S, KALETSKY R, et al. Metformin rescues Parkinson's disease phenotypes caused by hyperactive mitochondria[J]. Proceedings of the National Academy of Sciences of the United States of America, 2020, 117(42): 26438-26447.

    [13]

    AWASTHI S, HINDLE A, SAWANT N A, et al. RALBP1 in oxidative stress and mitochondrial dysfunction in Alzheimer’s disease[J]. Cells, 2021, 10(11): 3113. doi: 10.3390/cells10113113

    [14]

    ALLEN J, CARUNCHO H J, KALYNCHUK L E. Severe life stress, mitochondrial dysfunction, and depressive behavior: A pathophysiological and therapeutic perspective[J]. Mitochondrion, 2021, 56: 111-117. doi: 10.1016/j.mito.2020.11.010

    [15] 鲜盼盼. 硫化氢代谢异常在孤独症社交障碍中的作用及机制研究 [D]. 西安: 中国人民解放军空军军医大学, 2023.
    [16] 涂静怡, 王世成, 申长庆, 等. 线粒体功能障碍对认知的影响[J]. 中国细胞生物学学报, 2024, 46(5): 1054-1063.
    [17] 陈海霞, 马欣旭, 王艺霖, 等. 线粒体功能障碍与抑郁症发病机制的研究进展[J]. 神经解剖学杂志, 2023, 39(4): 476-480.
    [18]

    HOLLIS F, VAN DER KOOIJ M A, ZANOLETTI O, et al. Mitochondrial function in the brain links anxiety with social subordination[J]. Proceedings of the National Academy of Sciences of the United States of America, 2015, 112(50): 15486-15491.

    [19]

    TRANIELLO J F, LINKSVAYER T A, COTO Z N. Social complexity and brain evolution: Insights from ant neuroarchitecture and genomics[J]. Current Opinion in Insect Science, 2022, 53: 100962. doi: 10.1016/j.cois.2022.100962

    [20]

    FAN Y, GAO J, LI Y, et al. The variants at APOA1 and APOA4 contribute to the susceptibility of schizophrenia with inhibiting mRNA expression in peripheral blood leukocytes[J]. Frontiers in Molecular Biosciences, 2021, 8: 785445. doi: 10.3389/fmolb.2021.785445

    [21]

    GUO Q W, SI Y J, SHEN Y L, et al. Depression augments plasma APOA4 without changes of plasma lipids and glucose in female adolescents carrying G allele of APOA4 rs5104[J]. Journal of Molecular Neuroscience, 2021, 71(10): 2060-2070. doi: 10.1007/s12031-020-01766-7

    [22] 蒲阳, 母其文, 郭志伟, 等. 老年患者阿尔兹海默病风险预测模型的建立和验证[J]. 神经损伤与功能重建, 2024, 19(7): 392-396.
图(4)  /  表(2)
计量
  • 文章访问数:  49
  • HTML全文浏览量:  9
  • PDF下载量:  5
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-07-02
  • 网络出版日期:  2025-02-26
  • 发布日期:  2025-03-02
  • 刊出日期:  2025-05-09

目录

/

返回文章
返回