Classification of fresh tea leaf based on random forest model by feature fusion
-
摘要:目的
解决机采茶鲜叶中混有不同等级的茶叶,且混杂度高、物理特征分类精确度低的问题。
方法利用随机森林分类模型,提出一种基于颜色和边缘特征融合的方法。试验采集3种不同等级的茶鲜叶,对原始图像进行裁剪、尺寸归一化和去噪等处理,再进行颜色特征和边缘特征提取。通过参数的修改和测试,构建最优的随机森林分类模型,并且同K最近邻、SVM分类器进行对比试验。
结果特征融合之后随机森林模型的分类准确率达到99.45%,比单一颜色特征和边缘特征的分类准确率分别高7.14和9.34个百分点;比K最近邻和SVM分类器准确率分别高15.38和5.49个百分点。
结论所建立的方法能够对茶鲜叶单芽、一芽一叶、一芽二叶进行精确的分类。
Abstract:ObjectiveTo solve the problems of the machine-picked fresh tea leaves mixing with different grades of tea leaves, high mixing degree and low classification accuracy of physical characteristics.
MethodUsing the random forest classification model, a method based on the fusion of color and edge feature was proposed. We collected three different grades of fresh tea leaves, and processed the original images with cropping, size normalization and denoising, and then extracted the color features and edge features. Through parameter modification and testing, the optimal random forest classification model was constructed, and the comparison experiment was performed with the K-nearest neighbor and SVM classifier.
ResultAfter feature fusion, the classification accuracy of random forest model reached 99.45%, which was 7.14 and 9.34 percentage points higher than those of single color feature and single edge feature, 15.38 and 5.49 percentage points higher than those of K-nearest neighbor model and SVM classifier respectively.
ConclusionThe established method can accurately separate single bud, one bud and one leaf, and one bud and two leaves of fresh tea leaves.
-
荔枝Litchi chinensis是原产华南且最具中国特色的果树,2018年是我国有史以来最丰产的一年,据不完全统计,全国荔枝种植面积约为54.2万hm2,产量约为301万t,种植面积排在苹果、柑橘、梨、葡萄和桃之后,属于大宗果树,但从总产量来看却还算“小水果”。究其原因,主要与荔枝成花不稳定和果实发育过程生理落果严重导致的单产低且不稳有关,2018年荔枝结果面积按照总种植面积的80%计算,平均单产不足7.0 t/hm2。国内外学者对荔枝花果发育生理与调控技术的研究自20世纪80年代以来取得了长足进步,前人就花芽分化[1-3]、果实发育[4]、果实裂果[5]和果实大小[6]相关的研究进展也有过综述。本文主要侧重于评述近20年来,我国在荔枝花芽分化、果实和种子发育、落果和裂果、果皮色泽形成与调控、果实糖酸积累的生理和分子机制等方面的研究进展。
1. 花芽分化
陈厚彬等[7-8]引进了俗称的“白点”作为“成花诱导期”和“花穗发端期”肉眼可辨的分界标识,以阶段观剖视了荔枝花芽分化的全过程,阐释了影响成花关键因子的作用,明确指出12月至次年1月中旬期间10 ℃以下低温时数约160 h是‘糯米糍’和‘桂味’等成花难品种完成其成花诱导的最基本要求,而花穗发端发育期则需要适度升温和水分;在诱导性低温来临前,荔枝必需有足够的碳水化合物储备,由结果枝到末次秋梢再到叶片中的淀粉含量梯度可能是荔枝枝梢叶接受成花诱导、反映诱花效果的一个标志[9];末次梢抽梢早,碳水化合物的含量高,成花率也高[10],而“白点期”是荔枝碳氮物质变化较为关键的转折点[11]。
基于转录组学的分析,目前已经建立了低温、干旱和氧化胁迫等胁迫因子对荔枝开花的基因调控网络[12-14]。研究发现,参与干旱和低温协同调控荔枝成花的基因有932个,发挥主要调控功能的转录因子有38个,而LcFT1和LcTFL1分别是其中促进和抑制荔枝成花的决定基因[13];开花抑制因子(Flowering locus C,FLC)作为核心的抑制因子可能在活性氧调控荔枝成花中起关键的作用[14]。在这些调控网络中,均发现有成花素(Flowering Locus T,FT)的参与,说明FT在荔枝成花中起关键作用。Ding等[15]发现LcFT1专一在成熟叶片中表达,且随着低温诱导时间的延长表达量增加,将LcFT1转入拟南芥和烟草中可提早开花;不同荔枝品种的LcFT1同源基因的低温响应趋势有差异,在早花荔枝品种中启动子对低温更为敏感,而这种差异很大程度上决定了成花时间的早晚。Xiao等[16]从荔枝基因组中共挖掘到18个SPL基因,发现LcSPL1和LcSPL2主要参与枝梢状态影响荔枝开花的过程,但不能直接调控LcFT1的表达,而LcSPL3和LcSPL10可直接调控LcFT1的表达,但不参与枝梢状态调控荔枝开花的过程。
荔枝在完成成花诱导后,进入发端和形态分化期,此时适度的低温有利于荔枝花序原基的继续发育,而不利于花穗上的雏形叶/小叶的发育,但如果环境的温度过高,雏形叶会迅速生长,形成带叶的花穗,甚至转变成为营养梢[17]。研究者们进一步以花序原基和雏形叶的竞争关系作为切入点,较深入探讨了外源的活性氧(Reactive oxygen species,ROS)和一氧化氮(NO)处理促进花序雏形叶的脱落机制,细胞程序性死亡参与了它们调控雏形叶衰老和脱落过程[17-18],通过抑制性差减杂交(Suppression subtractive hybridization,SSH)和RNA-seq技术构建了与其相关的差异表达基因文库[19-21],并进一步从差异表达基因中筛选出LcMCⅡ-1基因,利用病毒诱导的基因沉默(Virus-induced gene silencing,VIGS)技术,在盆栽‘糯米糍’荔枝植株上进行LcMCⅡ-1沉默处理,发现沉默处理的雏形叶对ROS诱导的衰老表现迟缓,通过遗传转化拟南芥,发现过表达植株叶片表现出提早衰老的现象,表明LcMCⅡ-1参与了荔枝雏形叶衰老过程[22]。LcLFY和LcAP1基因主要在花芽中表达,且随花芽发育表达上调,将LcLFY和LcAP1基因转入烟草均可显著地提早开花,说明这2个基因是花芽形态分化关键基因[23];诱导ROS产生的百草枯和NO发生剂硝普钠明显促LcLFY基因的表达,而NO的清除剂2−苯基−4,4,5,5−四甲基咪唑啉−3−氧代−1−氧(2-Phenyl-4,4,5,5-tetramethylimidazoline-3-oxide-1-oxyl,PTIO)以及H2O2的捕获剂二甲基硫脲(Dimethythiourea,DMTU)会削弱这种效应[18];用ABA处理带叶花序,可以加强LcLFY和LcAP1的表达,而乙烯利处理带叶花序,则不影响这2个基因的表达[18, 24]。
2. 果实和种子发育
华南农业大学黄辉白教授领导的课题组开拓了具假种皮荔枝果实发育生理研究,他们采用多种生物统计的方法,对荔枝果实发育过程中种皮、种胚、假种皮和果皮等组织之间的相关性进行了测定,提出了具假种皮荔枝果实发育的“球皮对球胆效应”理论,揭示了荔枝果实各组织的发端、发育及其相互关系[25-27]。李建国等[28]明确提出荔枝果实的个体发育应划分2个时期(第Ⅰ期和第Ⅱ期),第Ⅱ期又可划分为2个亚期(Ⅱa和Ⅱb)的新观点,并揭示了果实不同发育时期水分和溶质进入果实规律,解决了国内外学术界关于荔枝果实发育时期划分长期存在的分歧。这种对荔枝果实个体发育时期的划分法,更贴切地阐明了荔枝果实“先长皮后长肉”及“球皮对球胆效应”的概念,对栽培更具实用价值。基于果皮发育对假种皮发育和果实大小具有决定性影响认识,李建国等[29]通过对花前子房壁和花后果皮发育的解剖学特点的细致研究,揭示了外、中、内果皮细胞分裂和膨大的规律,发现果皮的细胞分裂主要发生在开花前,花后不同部分的细胞还会有一定的分裂行为,但分裂的旺盛程度和停止的时间有所不同,下中果皮停止早,上中果皮其次,内果皮和裂纹处外果皮最晚。
果实大小是重要品质性状,目前商业栽培的荔枝品种中果实最小的为‘新兴香荔’(单果质量10~15 g),最大的为‘紫娘喜’(单果质量45~55 g)。对同一品种而言,果实越大价格越高。荔枝果实发育受制于“球皮对球胆效应”,即大果皮导致形成大果,李建国等[30]研究表明,细胞数量而非细胞大小是形成大果皮的细胞学基础。李建国等[31-32]还从温度、营养、激素和基因表达等角度揭示了果实大小形成机制,发现‘妃子笑’早花果比晚花果大1.5倍以上,其大小差异与它们发育期间所经历的温度和早花果果实争夺水分、矿质营养、碳水化合物的能力均大于晚花果有关;ZRs和ABA含量及其比值可能对荔枝果实发育和果实大小具有重要的影响[30, 33];Xia等[34]从荔枝果实中克隆了一个可能与荔枝果实大小相关的甲基戊二酰辅酶A还原酶(3-hydroxy-3-methylglutary CoA reductase, HMGR)基因(Lc-hmg1),认为该基因的作用机理可能是通过调控果皮中CTK与ABA的动态平衡,进而对细胞分裂活性和库强产生作用来实现对果实大小的调控。
果实的生长和最终大小受制于果实各组织之间、果实与果实之间、果实与其他器官之间的关系,报道最多的是种子数目和果实大小之间的正相关关系。福建农林大学吕柳新教授领导的课题组开拓了荔枝胚胎发育领域的研究,其研究认为荔枝不同品种胚胎发育状况是相对稳定的,大致可分为正常型、部分败育型和完全败育型3种类型,且不同类型胚胎发育的差异可能是受多基因控制的可遗传的性状[35];通过进一步比较幼果或胚珠中内源调节物质与荔枝胚胎发育的关系,认为胚胎败育不是因为染色体的数量和结构变异或配子的不育引起的,而是与内源生长调节物质的含量、配比和消长关系密切[36],如胚珠中ABA/(IAA+GA1+3)和ABA/(ZRs+DHZRs)比值高易导致胚胎败育[37]。李建国等[38]研究发现同一株‘桂味’荔枝树上种子的大小虽然对果实最终大小有显著的影响,但对最终果皮和假种皮的鲜质量无影响,也没有改变果实、果皮和假种皮的生长型。
荔枝受精后的极核在花后3~6 d内开始分裂,发育成核型胚乳,不能实现细胞化,呈液体状,故称之为液态胚乳。完全败育型品种的液态胚乳期限极短,数量极少,以致不能够启动合子的分裂,如‘糯米糍’在受精后15 d左右种皮腔只观察到液态胚乳的痕迹,但种子正常发育的‘怀枝’在受精后35 d种腔内还充满着液态胚乳。李建国等[39]在液态胚乳盛期,针刺抽乳导致形成焦核小果皮的小果,针刺不抽乳导致形成胚部分败育的小果,不处理对照则为正常大核大果,该研究结果证实液态胚乳的正常发育是保证胚和果实正常发育的重要前提。而对于胚部分败育的‘桂味’来说,是发育大核、小核还是焦核果取决于液态胚乳中内源促进类激素水平和总氨基酸含量(李建国,未发表数据)。
Pathak等[40]利用转录组分析了种子大小不同的荔枝品种种子发育过程的基因表达差异,筛选出了一批差异表达基因。然而,内源激素含量和基因表达差异是种子败育的原因还是结果无法厘清。Zhang等[41]发现母体组织细胞壁酸性转化酶活性低是‘糯米糍’种子败育的主要原因。荔枝细胞壁酸性转化酶基因家族中的2个成员LcCWIN2和LcCWIN5是种子发育的关键基因,分别在控制种子大小和调控种胚发育过程中起关键作用;‘糯米糍’种胚完全败育可能与LcCWIN5转录后调控造成酶活性低有关,而‘妃子笑’在种子充实的关键阶段LcCWIN2表达低是其种子中后期败育和种子小的主要原因。Xie等[42]研究发现,种子发育关键期即盛花至花后45 d前的平均最低温度与种子败育率呈显著正相关,花后2周把‘桂味’盆栽移入控温室,发现低温室(22 ℃/18 ℃)种子显著比高温室(26 ℃/22 ℃)大,败育率高,此外还发现‘桂味’种子发育明显受花粉源影响,存在明显自交不育现象,自交焦核率>90%,其他品种花粉授粉,焦核率介于39.2%~76.8%。这些研究结果说明‘桂味’荔枝存在明显的温敏不育和自交不育现象。
3. 果实脱落和裂果
荔枝果实在大约3个月的发育过程中,有3~4次生理落果高峰,导致生产中经常出现“满树花半树果,甚至颗粒无收”的现象[43],是引起荔枝大小年结果的重要原因。过去,国内外研究人员主要从气象因子[44]、品种特性[45]、栽培管理[46]、开花习性[47-48]、营养水平[49-50]、内源激素[51-53]、源库关系[54-56]等方面开展研究。近10年来,李建国领导的课题组在荔枝落果相关基因的挖掘和筛选方面取得了一定进展。起初主要是通过单基因的同源克隆和mRNA荧光定量RT-PCR表达验证等策略[57],从荔枝果柄离区中分离出5个IAA相关基因[58]、1个果胶酶基因[59]和2个乙烯合成的关键基因[60-61],其均与荔枝落果相关。后来,利用新一代超高通量测序技术(简称RNA-seq),成功组装完成首个荔枝果实转录组数据库,共得到57 050条基因序列[62],以此作为参考序列,分别分析了荔枝幼果在遮阴、环剥去叶和乙烯利处理导致脱落过程中其转录组水平上的变化,建立了与荔枝果实脱落相关的候选基因数据库,并据此初步提出了碳水化合物胁迫和乙烯利诱导荔枝落果的基因调控网络[62-64]。近年来,我们从候选荔枝落果相关基因RNA-Seq数据库中筛选出下列几个关键基因,并进行了深入的功能分析。Ying等[65]在荔枝离区中克隆出拟南芥IDA(Inflorescence deficient in abscission)小分子信号肽同源基因LcIDL1全长,并发现LcIDL1的mRNA转录水平与落果正相关,异源转入拟南芥后明显促进花器官提前脱落,并可功能回补拟南芥ida-2突变体的花器官脱落表型,证明了LcIDL1是诱导荔枝落果的关键基因之一;纤维素酶是植物细胞壁发生水解的重要酶类之一,其活性与器官脱落进程(离区细胞的分离)的关系甚为密切,荔枝全基因组中至少存在20个纤维素酶基因,其中LcCEL2/8的表达水平与幼果脱落显著正相关,异源过表达证明LcCEL2/8可造成拟南芥花器官的提前脱落,经凝胶阻滞分析和双荧光素酶瞬时表达分析发现了一个HD-ZIP转录因子(LcHB2)可以直接结合LcCEL2/8启动子并激活其表达[66];最近还发现HD-ZIPⅠ家族的另一成员LcHB3的表达和荔枝幼果脱落的变化趋势相一致,与LcHB2一起正调控乙烯和ABA的生物合成,乙烯和ABA的积累可显著促进细胞壁果胶酶活性的提高,使得果柄离区细胞间的中胶层发生降解,促进离区细胞发生分离而导致荔枝幼果脱落[67]。
此外,Peng等[68]首次从表观遗传学的角度对植物器官脱落的调控进行了阐述,初步发现了17个组蛋白修饰酶在果实脱落过程中发生了显著变化。Zhang等[69]在荔枝全基因组范围内鉴定出39个ARF基因,发现LcARF2D/2E、Lc7A/7B、Lc 9A/9BLc、16A/16B和LcARF5A/B与荔枝落果相关。Ma等[70]成功构建了荔枝不同组织的小RNA文库、降解组文库和链特异性转录组文库,鉴定了荔枝物种特异的miRNA和phasiRNA,获得了miRNA耦合可变剪切/选择性多聚腺苷化产生不同phasiRNA的调控机制。同时,借助小RNA文库筛选和鉴定出了10条可能参与碳水化合物胁迫诱导荔枝幼果脱落过程的miRNA调控通路(未发表),为后续荔枝果实脱落的小RNA分子调控网络的研究提供重要的参考。
荔枝裂果主要发生在果实采收前15~20 d的假种皮快速生长阶段,且与品种关系密切,‘糯米糍’、‘无核荔’、‘观音绿’、‘新兴香荔’等焦核和无核品种裂果严重,一般年份裂果率为20%~30%,严重时超过50%,有的年份个别果园或单株竟高达80%~90%。因此,裂果是限制这些名优品种发挥效益的主要限制因子。Li等[71]对荔枝裂果发生的机理进行了较为详细的综述,主要综述了气象因子、果皮理化和解剖学特性、果实生长、水分吸收和矿质营养等因子参与荔枝裂果发生的作用机制,认为荔枝生理性裂果机理是由于果皮延展性减弱的渐变和假种皮生长加快的骤变相叠加的结果。果实中钙水平与荔枝裂果关系密切[72]。Huang等[73-78]深入揭示了钙参与荔枝果实抗裂性形成的机理及果实钙摄取途径与调控机制,多角度证明钙通过构建细胞壁参与抗裂性形成,同时还发现果实发育早期中果皮钙富集诱发细胞程序性死亡,形成海绵组织而提高果实后期延展性参与抗裂性形成;发现抗裂果品种(‘怀枝’)果实不仅摄取钙能力强于易裂果品种(‘糯米糍’),其细胞壁结构钙形成能力也更强,这与‘怀枝’果皮细胞壁非甲基化半乳糖醛酸含量高有关;果实钙摄取能力与果实生长速率正相关,果柄富集高浓度钙,其中主要分布在韧皮部组织中,并大量以草酸钙晶体形式存在于筛管周边的薄壁细胞中。Song等[79-80]的研究证明韧皮部也是钙摄取的主要路径,韧皮部草酸钙含量和比率随发育时间有明显变化,果柄草酸钙再利用能力弱的‘糯米糍’易于裂果;草酸钙含量与草酸氧化酶活性普遍呈负相关,表明草酸氧化酶可能参与调控草酸钙形成;此外,Song等[79-80]还克隆了荔枝钙通道(LcTPC1)、液泡膜钙交换体(LcCAX1a-1和LcCAX1a-2)、钙泵(LcACA-2)基因,分析了它们对果实钙摄取的作用,利用VIGS技术显著降低LcTPC1和LcCAX1a基因的表达,同时也降低了果柄钙的滞留和果实钙摄取,据此表明钙通道及液泡钙−氢交换体参与了果实中钙的积累,果柄液泡钙的积累有利于钙向果实运输。
4. 果实糖酸代谢
荔枝假种皮(果肉)可溶性糖约占果肉鲜质量的15%,主要为蔗糖、葡萄糖和果糖,不同的荔枝品种蔗糖和己糖(葡萄糖和果糖)含量有较大的差异,根据己糖/蔗糖比例可将荔枝分为3类糖积累类型[81-82]:蔗糖型(己糖/蔗糖<1)、中间型(1<己糖/蔗糖<2)、己糖型(己糖/蔗糖>2)。此外,Wu等[83]利用气−质联用技术检测到荔枝果肉中含有一定量的半乳糖和环糖醇,包括白坚木皮醇(Quebrachitol)、无患子醇(Bornositol)和肌醇(Myo-inositol),其中无患子醇为国内外首次报道并命名。荔枝叶片特异合成白坚木皮醇,在叶片和韧皮部中含量甚至超过了蔗糖,目前研究表明该物质是荔枝主要的光合产物之一,也是韧皮部碳水化合物运输的主要形式,是一种相对惰性的可溶性碳水化合物,其合成可能是荔枝低耗、节能和高抗生物胁迫的碳素代谢策略[84-85]。
通过蔗糖代谢相关的酶活性和基因表达与糖组分的关联分析,发现假种皮糖的组分主要取决于蔗糖水解酶特别是酸性转化酶活性[82]。不同品种之间积累的糖含量有显著的差异,含量低的品种糖的质量分数不足10%(如‘双肩玉荷包’),而含量高的(如‘糯米糍’)可达18%以上[82]。荔枝假种皮中糖分韧皮部卸载,涉及由果柄韧皮部疏导组织到种柄的共质体通道,后由种柄和假种皮基部的细胞通过跨膜运输进入假种皮的其他细胞[86]。蔗糖水解酶活性高的品种如‘黑叶’和‘妃子笑’的种柄组织糖分明显高于酶活性低的‘无核荔’和‘糯米糍’,说明蔗糖水解酶引起的糖浓度梯度确实可影响后韧皮部(Post-phoelm)共质体运输的效率。然而,假种皮中的糖分积累量却与蔗糖水解酶活性无关,假种皮主动积累糖的能力,如更高的ATPase活性和高蔗糖转运载体LcSUT4表达,才是决定荔枝假种皮糖积累量的关键因素[86]。
荔枝假种皮有机酸约占其鲜质量的0.1%~0.5%,早中熟品种如‘三月红’、‘妃子笑’含酸量较高,而晚熟品种如‘糯米糍’、‘桂味’等则含酸量较低,主要的有机酸包括苹果酸、酮戊二酸和抗坏血酸(维生素C)等,其中苹果酸占总有机酸的质量分数为70%以上[81, 83]。糖酸比是影响荔枝风味的主要因素,随着荔枝果实成熟度的提高,糖含量增加,有机酸下降,因而荔枝的风味明显与采收成熟度相关。维生素C是水果中重要的营养和保健成分,Wu等[83]利用高效液相色谱技术检测不同品种荔枝果肉的维生素C,发现其质量分数明显低于美国USDA的官方数据715 μg/g,介于80~390 μg/g(以鲜质量计),差异的原因可能与品种、成熟度或检测方法不同有关。荔枝假种皮中的苹果酸在假种皮发育早期含量增加,而后随着发育成熟含量迅速下降,研究发现一个R2R3-MYB转录因子LcMYB5和质子泵基因LcPH1表达与苹果酸含量的变化趋势一致,它们可能与LcHLH1转录因子一起参与荔枝有机酸代谢的调控[87]。
5. 果皮色泽形成与调控
荔枝果实的着色是果皮中叶绿素降解和花色苷积累的结果,根据2种色素含量的差异,荔枝果实的颜色可分为不着色型(如‘新球蜜荔’)、不均匀着色型(如‘妃子笑’)和均匀着色型(如‘糯米糍’)3种类型[88]。‘妃子笑’荔枝果实着色不均匀的原因是叶绿素降解缓慢导致的 “滞绿” 现象[89],叶绿素降解与LcSGR基因表达和叶绿素酶活性密切相关[90]。荔枝果实着色与否取决于花色苷的生物合成。矢车菊色素−3−葡萄糖苷和矢车菊色素−3−芸香糖苷是荔枝主要的花色苷种类,花色苷的组分在特定的品种内稳定,不受环境因子和发育阶段的影响,LcFGRT4(Flavonoid-3-O-glucoside rhamnosyltransferase)基因序列差异在花色苷组分决定中有重要作用[91]。荔枝花色苷生物合成途径中由LcUFGT1编码的类黄酮糖基转移酶(UDP glucose: Flavonoid-3-O-glycosyltranferase,UFGT)在荔枝花色素苷积累和着色中起决定性的作用[88, 92]。花色苷的生物合成发生在细胞质中,合成后需要转运至液泡中贮藏,LcGST4是荔枝中转运花色苷的主要基因,其表达水平与花色苷的积累量正相关[93]。由MYB-bHLH-WH40组成的复合体在转录水平上调控植物花色苷的生物合成,荔枝中有53个MYB成员,通过关联分析和异源表达验证,确定了荔枝花色苷生物合成途径中的关键转录因子为LcMYB1/5和LcbHLH1/3,其作用机理是通过增加花色苷生物合成结构中下游基因的表达来促进果实着色,其中LcMYB5可能还通过促进组织酸化来增强着色[87, 94-95]。
在果皮颜色调控方面,发现外源ABA处理可显著促进果皮花色苷的生物合成,细胞分裂素类的生长调节剂如6-BA处理可显著降低果皮内源ABA的含量,同时显著抑制叶绿素的降解和花色苷的生物合成[96],CPPU抑制叶绿素降解和花色苷的合成作用更明显,这些外源生长调节物质主要通过抑制花色苷生物合成相关调控因子如LcMYB1和结构基因如LcUFGT1的表达延迟果实的着色[88, 94]。此外,还发现3个ABA信号途径因子LcABFs参与了荔枝果皮叶绿素降解和花色苷生物合成的调控[97]。
6. 展望
我国在荔枝花果发育应用基础研究,特别是相关分子生物学研究方面所取得成果处于世界“领跑”水平,这既得益于农业部现代农业产业技术体系和国家自然科学基金的稳定和持续的经费支持,更是因为2008年以来,随着下一代高通量测序技术的兴起,为荔枝研究带来了革新式的变化。随着研究方法和研究手段的逐步更新和升级,生物学研究进入了后基因组和系统生物学时代,其显著标志就是各种组学(如代谢组、转录组、蛋白组、DNA甲基化组、小分子RNA组和表观遗传等)技术在生物学研究中得到越来越广泛的应用,果实发育研究领域也不例外。果实是代谢最为丰富的植物器官之一,其形成和发育过程必然涉及复杂代谢网络的变化,随着各类高通量检测和生物信息分析技术的开发与应用,相关代谢网络变化与调控机理的研究已成为果实形成与发育生理的一个研究热点方向。目前荔枝基因组已经完成测序和注释,大量的荔枝转录组和小分子RNA组数据也已得到测序,荔枝基因组数据库正在构建当中。这些“大数据”的出现必将促使荔枝花果发育研究进一步往纵深发展。同时基于基因组学的大规模重测序、全基因组关联分析、重要性状QTL定位等也将进一步加快荔枝花果实发育分子调控网络、重要性状功能基因(如调控成花、花性别分化、坐果与落果、果实大小和裂果、种子败育等)挖掘及其作用机制解析的进程。
-
表 1 颜色特征分类结果
Table 1 Color feature classification results
% 茶鲜叶等级
Grade of fresh tea leaf精确率
Precision召回率
Recall综合评价指标
F1-score准确率
Accuracy单芽 Single bud 96.23 96.23 96.23 一芽一叶 One bud and one leaf 92.06 87.88 89.92 一芽二叶 One bud and two leaves 89.39 93.65 91.67 平均值 Average 92.56 92.59 92.61 92.31 表 2 边缘特征分类结果
Table 2 Edge feature classification results
% 茶鲜叶等级
Grade of fresh tea leaf精确率
Precision召回率
Recall综合评价指标
F1-score准确率
Accuracy单芽 Single bud 100 95.59 97.74 一芽一叶 One bud and one leaf 81.36 87.27 84.21 一芽二叶 One bud and two leaves 87.93 86.44 87.18 平均值 Average 89.96 89.77 89.71 90.11 表 3 融合特征分类结果
Table 3 Fusion feature classification results
% 茶鲜叶等级
Grade of fresh tea leaf精确率
Precision召回率
Recall综合评价指标
F1-score准确率
Accuracy单芽 Single bud 100 100 100 一芽一叶 One bud and one leaf 98.21 100 99.10 一芽二叶 One bud and two leaves 100 98.31 99.15 平均值 Average 99.40 99.44 99.42 99.45 表 4 不同模型的平均分类结果
Table 4 Average classification results of different models
% 模型
Model精确率
Precision召回率
Recall综合评价指标
F1-score准确率
AccuracyK最近邻 KNN 83.05 83.00 83.02 84.07 SVM 93.81 93.90 93.82 93.96 随机森林 Random forest 99.40 99.44 99.42 99.45 -
[1] 黄藩, 刘飞, 王云, 等. 计算机视觉技术在茶叶领域中的应用现状及展望[J]. 茶叶科学, 2019, 39(1): 81-87. doi: 10.3969/j.issn.1000-369X.2019.01.009 [2] 唐小林, 李文萃, 范起业. 机采茶鲜叶分类分级技术及相关设备研究进展[J]. 中国茶叶加工, 2015(2): 5-8. [3] 陈全胜, 赵杰文, 蔡健荣, 等. 支持向量机在机器视觉识别茶叶中的应用研究[J]. 仪器仪表学报, 2006(12): 1704-1706. doi: 10.3321/j.issn:0254-3087.2006.12.032 [4] 吴正敏, 曹成茂, 王二锐, 等. 基于形态特征参数的茶叶精选方法[J]. 农业工程学报, 2019, 35(11): 315-321. doi: 10.11975/j.issn.1002-6819.2019.11.036 [5] 高震宇, 王安, 刘勇, 等. 基于卷积神经网络的鲜茶叶智能分选系统研究[J]. 农业机械学报, 2017, 48(7): 53-58. doi: 10.6041/j.issn.1000-1298.2017.07.007 [6] 余洪. 基于计算机视觉技术的茶叶品质分级研究[D]. 南昌: 江西农业大学, 2017. [7] 金良海, 李德华. 基于噪声检测的图像去噪算法[J]. 模式识别与人工智能, 2008, 21(3): 298-302. doi: 10.3969/j.issn.1003-6059.2008.03.005 [8] 孙卫红, 黄志鹏, 梁曼, 等. 基于颜色特征和支持向量机的蚕茧分类方法研究[J]. 蚕业科学, 2020, 46(1): 86-95. [9] 杨倩, 高晓阳, 武季玲, 等. 基于颜色和纹理特征的大麦主要病害识别研究[J]. 中国农业大学学报, 2013, 18(5): 129-135. doi: 10.11841/j.issn.1007-4333.2013.05.20 [10] 员伟康, 木拉提·哈米提, 严传波, 等. 基于颜色和纹理特征的新疆维吾尔医植物药材图像特征提取与判别分析[J]. 中国中医药信息杂志, 2016, 23(1): 78-81. doi: 10.3969/j.issn.1005-5304.2016.01.018 [11] 刘永波, 雷波, 胡亮, 等. 机器视觉在HSV颜色空间下稻瘟病病程分级判定研究[J]. 农学学报, 2020, 10(10): 83-90. doi: 10.11923/j.issn.2095-4050.cjas20190700108 [12] 苗荣慧, 杨华, 武锦龙, 等. 基于图像分块及重构的菠菜重叠叶片与杂草识别[J]. 农业工程学报, 2020, 36(4): 178-184. doi: 10.11975/j.issn.1002-6819.2020.04.021 [13] 谢文涌, 柴琴琴, 甘永辉, 等. 基于多特征提取和Stacking集成学习的金线莲品系分类[J]. 农业工程学报, 2020, 36(14): 203-210. doi: 10.11975/j.issn.1002-6819.2020.14.025 [14] 宋彦, 谢汉垒, 宁井铭, 等. 基于机器视觉形状特征参数的祁门红茶等级识别[J]. 农业工程学报, 2018, 34(23): 279-286. doi: 10.11975/j.issn.1002-6819.2018.23.036 [15] 段红燕, 邵豪, 张淑珍, 等. 一种基于Canny算子的图像边缘检测改进算法[J]. 上海交通大学学报, 2016, 50(12): 1861-1865. [16] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. doi: 10.1023/A:1010933404324
[17] 曹正凤. 随机森林算法优化研究[D]. 北京: 首都经济贸易大学, 2014. [18] 陈进, 毛先成, 刘占坤, 等. 基于随机森林算法的大尹格庄金矿床三维成矿预测[J]. 大地构造与成矿学, 2020, 44(2): 231-241. [19] 王猛, 张新长, 王家耀, 等. 结合随机森林面向对象的森林资源分类[J]. 测绘学报, 2020, 49(2): 235-244. doi: 10.11947/j.AGCS.2020.20190272 [20] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016. [21] 王珏. 基于SVM和组合特征的分类算法研究[D]. 大连: 大连理工大学, 2017. [22] 赵立新, 侯发东, 吕正超, 等. 基于迁移学习的棉花叶部病虫害图像识别[J]. 农业工程学报, 2020, 36(7): 184-191. doi: 10.11975/j.issn.1002-6819.2020.07.021 -
期刊类型引用(8)
1. 杨玉超,籍颖,李敬蕊,宫彬彬,高洪波. 基于热成像处理技术的生菜水分胁迫检测模型研究. 中国农机化学报. 2025(01): 131-137 . 百度学术
2. 李宏星,樊鑫,金慷鹏,陈威,蓝启明. 基于集成学习的空气质量评估. 长江信息通信. 2024(03): 115-117 . 百度学术
3. 张钰霆,张瑞瑞,潘非斐,潘友浩,李聪,林华,陈仕玺,穆景利. 三沙湾大黄鱼野生和养殖群体的幽门盲囊微生物群落结构比较分析. 海洋学报. 2024(01): 77-87 . 百度学术
4. 段宇飞,孙记委,董庚,卢周成,霍俊,王焱清. 油茶果壳籽实时分选系统设计与试验. 农机化研究. 2024(10): 79-86 . 百度学术
5. 李帅彪. 基于TPOC识别与检测人工智能生成内容的研究与探讨. 科技传播. 2024(12): 18-22 . 百度学术
6. 庞文媛,孙意岚,王芹,陈杰博,沈朝增,周一鸣,庞杰. 机器学习在花果茶生产加工中的应用进展. 食品安全质量检测学报. 2023(11): 181-189 . 百度学术
7. 陈裕锋,冯佩雯,凌金生,张书琪,余振鹏,熊琳琳,刘洪,谢家兴. 基于无人机多光谱图像的水稻品种鉴定. 南京农业大学学报. 2023(05): 995-1003 . 百度学术
8. 汪瑞,魏利胜. 基于特征融合与半监督协同训练随机森林的包装袋缺陷识别. 安徽工程大学学报. 2022(05): 36-41+58 . 百度学术
其他类型引用(15)