Research on the index system of cultivated land quality grading based on random forest algorithm
-
摘要:目的
分析研究区域内的耕地质量差异,优化耕地利用与布局,为耕地保护提供参考依据。
方法以青海省共和县、都兰县和乌兰县的耕地为研究对象,根据历史及现有文献收集耕地质量的影响因素,采用随机森林算法和相关性分析筛选定级指标并确认权重,通过加权求和法计算定级指数并划分级别,得到定级结果。与常用的特尔菲法定级成果进行比较分析。
结果随机森林算法得到的变量重要性(I)范围在0.03~11.94,相关性分析结果显示,大部分影响因素间相关性不显著,有8个为显著相关,综合I值和相关性分析结果将30个影响因素收敛为4个纬度下的14个定级指标,其中影响研究区域耕地质量的主要因素为生态系统脆弱性、生长季平均降水和年总太阳辐射量,权重分别为0.11、0.10和0.09,随机森林算法评价结果与实际情况相符。
结论与常用的特尔菲法比较,随机森林算法稳定性更好,级别指数变幅区间更小,更有利于构建省级空间尺度的耕地级别可比序列。
Abstract:ObjectiveTo analyze the difference of cultivated land quality in the study region, optimize the use and layout of cultivated land, and provide a reference for cultivated land protection.
MethodTaking the cultivated land in Gonghe County, Dulan County and Wulan County in Qinghai Province as the research object, the influencing factors of cultivated land quality were collected based on the history and existing literature, and the random forest algorithm and correlation analysis were used to screen the grading indicators and confirm the weight. We calculated the grading index and divided the levels by weighted sum method to get the grading result. We compared the results with the grading results of commonly used Delphi method.
ResultThe value of variable importance I obtained by random forest algorithm ranged from 0.03 to 11.94. Correlation analysis showed that the correlation between most influencing factors was not significant, eight of which were significant correlation. The 14 rating indicators under four dimensions were astringed from 30 influencing factors. The main factors influencing the quality of cultivated land in the study area were ecosystem vulnerability, mean precipitation of growing season and annual solar radiation amount, with the weights of 0.11, 0.10 and 0.09, respectively.
ConclusionCompared with Delphi method, the random forest algorithm has better stability and smaller level of index variation interval, which is more conducive to construct a comparable sequence of cultivated land levels at provincial spatial scale.
-
骨形态发生蛋白(Bone morphogenetic protein,BMP)家族是转化生长因子β(Transforming growth factor-β)超家族成员。1965年,Urist[1]从脱钙骨基质提取物中发现一种能够让间充质细胞定向分化为成骨细胞且能促进骨形成的活性蛋白,并将其命名为BMP。到目前为止,科学家发现的BMP家族成员已超过20种[2]。在BMP家族中,除BMP1外,其他成员均属于TGF-β家族,具有促进骨形成的作用[3]。1990年,Celeste等[4]从人的胎盘cDNA文库中分离得到的hBMP6克隆具有BMP家族成员的特征,从而将该基因命名为BMP6。BMP6基因在多种组织中发挥功能。Arndt等[5]通过比较BMP6−/−和野生型小鼠的肝脏中BMP6基因的表达差异,发现BMP6基因的缺失会导致肝组织或干细胞损伤。Yung等[6]通过定量分析牛主动脉内皮细胞中的BMP6基因及各种配体的表达量发现BMP6基因与氧化低密度脂蛋白(Oxidized low density lipoprotein, oxLDL)基因独立而协同地诱导成骨分化和钙化。BMP6基因在动物的生殖系统中也发挥着重要作用,Ma等[7]研究发现,BMP6基因在雌性卵巢中的表达水平显著高于在雄性睾丸中的表达。Toma等[8]研究发现BMP6基因能够影响卵泡的成熟并进一步影响动物生殖系统。
鸡BMP6基因(GenBank:NC_052533.1)定位于2号常染色体上,基因全长85848 bp,拥有7个外显子,外显子全长2988 bp。Ye等[9]和Lu等[10]研究发现,BMP6参与了软骨细胞的增殖过程。外源性鸡BMP6蛋白能显著促进鸡颗粒细胞的增殖[11]。此外,Regassa等[12]研究发现,BMP6基因参与了脂肪的形成过程。而鸡BMP6基因多态性研究较少。姚国瑜[13]以金寨黑鸡为研究材料,扩增了BMP6基因的7个外显子后发现外显子4上存在1个A76150G突变位点,且该突变位点与金寨黑鸡的体质量有显著的相关性。目前,关于BMP6基因多态性的研究更多集中在羊品种上。肖朝庭等[14]以不同绵羊品种为试验材料,扩增BMP6基因的外显子5、6和7,结果发现其没有多态性;储明星等[15]以不同山羊品种为试验材料,同样扩增BMP6基因的外显子5、6和7,未发现多态位点,这可能是由于BMP6基因外显子5、6和7序列在羊品种中比较保守。可以看出,在不同物种中,同一基因不同位点的碱基突变所产生的影响也是有差异的。
粤西卷羽鸡别称麒麟鸡,因其羽毛向上翻卷而得名,是产于粤西茂名、湛江一带的广东省地方特色品种,其羽毛、脚和皮均呈黄色,具有典型的三黄鸡特征。该品种具有耐粗饲、抗病性强、体型大、成活率以及屠宰率高的特点[16-17]。目前,关于BMP6基因在广东地方品种粤西卷羽鸡的研究鲜见报道。本研究以粤西卷羽鸡为研究对象,构建DNA混合池,PCR扩增BMP6基因外显子序列,通过直接测序法筛选SNP位点,并对筛选出的SNP位点进行群体遗传学、连锁不平衡分析,旨在筛选出粤西卷羽鸡生长性状以及屠宰性状的分子遗传标记,为今后地方品种粤西卷羽鸡的分子选育和品种改良提供基础数据。
1. 材料与方法
1.1 试验动物的饲养管理及样品采集
以120只粤西卷羽鸡(公母各半)为研究对象,参照肉鸡的饲养标准进行饲喂,试验期间自由采食、饮水,饲喂至90日龄,测定并记录其体质量、体尺(龙骨长、胫长和胫围)。同时选取60只(公母各半)测定屠宰性能(活质量、屠体质量、半净膛质量、全净膛质量、腹脂质量、胸肌质量、腿肌质量和肝脏质量),翅静脉真空采血管采血1 mL,EDTA抗凝,−20 ℃保存。
1.2 主要仪器
DNA提取试剂盒购自南京诺唯赞生物科技股份有限公司);分光光度计(型号为ND-LITE)购自基因有限公司;PCR仪(型号为Veriti 96-well)购自广州源起健康科技有限公司;电泳仪(型号为DYCP-31DN+DYY-6C)购自北京市六一仪器厂。
1.3 主要试剂
2×EasyTaq® PCR SuperMix(赛默飞)、琼脂糖(Sangon Biotech)和无毒核酸染料(Sangon Biotech)。
1.4 鸡血液 DNA 的提取和纯度检测
参考血液基因组 DNA 提取试剂盒说明书,完成 DNA 的抽提,凝胶电泳检测其完整性,用分光光度计测定 DNA 纯度。
1.5 引物设计
以NCBI数据库中鸡BMP6基因序列(GenBank登录号: NC_052533.1)为参考序列,利用SnapGene®Viewer 2.3.4软件对外显子设计特异性扩增引物,引物序列见表1,引物由上海生物工程(生工)技术服务有限公司合成。
表 1 BMP6基因的引物序列Table 1. Primer sequences of BMP6 gene引物名称
Primer name正向序列(5′→3′)
Forward sequence反向序列(5′→3′)
Reverse sequence产物长度/bp
Product
length退火温度/℃
Annealing
temperatureBMP6-Exon2 TCTTGAGGGAACAGGTGGCAG GCATCATCCCTCCCTAGG 314 60 BMP6-Exon3 GCATGTGTACGGTGTGGAAGA TGTCACCTTGTGCTCACCTAG 560 59 BMP6-Exon4 GAGCCTCTTGTCTCGGATGGA TTGCGCTGTTCTACCAGCT 769 60 BMP6-Exon5 TTCTAAGCCAGTCACTGTTACGC CATGAGTGACAGAGGATGGCT 502 60 BMP6-Exon6 GACACGAACATCAGTGTCCATGG CTCACTCACAAACTCACCTATGG 358 60 BMP6-Exon7-1 CAGCAAGACCTGTGCTAAAGC GCCAAGCCATCTTACACTTGC 880 60 BMP6-Exon7-2 CCTGTCATGATAGTACGCATCTT CAGTGGAAGCTAAGTGTTGTACT 825 58 1.6 粤西卷羽鸡DNA混池的构建、PCR扩增及SNP位点检测
将不同DNA样品稀释到相同的浓度后,各抽取5 μL到1.5 mL离心管中制成DNA混池。扩增总体积为25 μL,其中,2× EasyTaq® PCR SuperMix 10 μL,上、下游引物各1 μL (10 μmol·L−1),混池基因组DNA模板1 μL,加Nuclease-free Water至25 μL。PCR反应程序:94 ℃预变性5 min;94 ℃变性30 s,59 ℃退火30 s,72 ℃延伸1 min,32个循环;72 ℃延伸10 min。PCR产物于4 ℃保存并用于后续测序。对PCR扩增产物进行琼脂糖凝胶电泳检测,若电泳条带与目的条带大小一致,则将所得PCR产物送公司进行正反向测序。使用DNAMAN Versiong 9.0软件将测序结果与NCBI上参考片段进行比对,同时利用Chromas Versiong 2.3软件观察测序结果中的峰图,进而筛选出突变位点。
1.7 数据统计分析
利用WPS Office软件中的Excel计算等位基因频率、基因型频率、遗传杂合度、有效等位基因数、多态信息含量以及χ2,计算方法参照刘梅等[18]。
采用IBM SPSS Statistics 26.0软件中的单因素方差分析对粤西卷羽鸡BMP6基因SNP位点的不同基因型与生长性状及屠宰性状进行关联分析,结果表示形式为“平均值±标准误”,P<0.05表示差异显著,P<0.01表示差异极显著。对于方差不齐的性状采用Tamheini法进行多重比较,对于只有2种基因型的性状则采用t检验进行分析。
2. 结果与分析
2.1 基因组DNA的提取及PCR扩增结果
提取的DNA通过分光光度计检测DNA质量,D260 nm:D280 nm皆处于1.8~2.0之间,表明提取的DNA质量达到标准,可用于后续试验。
粤西卷羽鸡BMP6基因不同外显子PCR扩增产物经10 g/L琼脂糖凝胶电泳检测显示,电泳条带明亮,特异性好,无杂带,符合用PCR产物直接测定核苷酸排列顺序的要求(图1)。
2.2 粤西卷羽鸡BMP6基因SNP位点检测
将测序结果与NCBI上参考片段进行比对后筛选SNP位点,结果显示,在第3、6和7外显子上共检测到7个SNP位点:分别为第3外显子上的g.64185950 T>C位点,第6外显子上的g.64195411 G>A位点,第7外显子上的g.64195613 C>T、g.64195821 G>A、g.64195833 T>A、g.64196373 T>C和g.64196735 T>C位点。在粤西卷羽鸡BMP6基因的第2、4和5外显子上均未检测到SNP位点。粤西卷羽鸡BMP6基因7个SNP位点信息见表2。SNP位点基因型Sanger测序峰见图2。
表 2 粤西卷羽鸡BMP6基因突变位点信息Table 2. Information of BMP6 gene mutation sites of Yuexi Frizzled Feather chicken外显子
Exon碱基突变
Base mutation染色体位点1)
Chromosome positionmRNA位点
mRNA site编码氨基酸2)
Encoded amino acid突变类型
Mutation type3 T→C g.64185950 T1135C His 同义突变 Synonymous mutation 6 G→A g.64195411 G1441A Tyr 同义突变 Synonymous mutation 7 C→T g.64195613 C1549T Tyr 同义突变 Synonymous mutation G→A g.64195821 G1757A — T→A g.64195833 T1769A — T→C g.64196373 T2309C — T→C g.64196735 T2671C — 1)以NCBI数据库中鸡BMP6基因序列(GenBank:NC_052533.1) 外显子 1的第1个碱基为起始位点;2)“—”表示无氨基酸编码
1) Starting from the first base of exon 1 in the chicken BMP6 gene sequence (GenBank: NC: 052533.1) in the NCBI database; 2) “—” indicates no amino acid coding2.3 BMP6基因SNP位点遗传特性分析
对粤西卷羽鸡BMP6基因SNP位点进行遗传特性分析,结果见表3。由表3可知:BMP6基因7个SNP位点中优势基因型(基因型频率)分别为CT(0.542)、AG(0.500)、CT(0.517)、GG(0.675)、AT(0.967)、CC(0.525)和CT(0.475),相对应的优势等位基因(等位基因频率)分别为C(0.604)、A(0.633)、C(0.583)、G(0.829)、A(0.517)、C(0.742)和C(0.621)。PIC计算值表明,7个SNP位点中, g.64195821 G>A位点为低度多态,其余位点均为中度多态。BMP6基因SNP位点Hardy-Weinberg平衡检验结果显示,g.64195833 T>A在粤西卷羽鸡群体中显著偏离Hardy-Weinberg平衡(P<0.05),其余位点均未偏离Hardy-Weinberg平衡(P>0.05)。
表 3 BMP6基因SNP位点遗传特性分析结果1)Table 3. Genetic characteristics analysis results of SNP sites in BMP6 geneSNP位点
SNP site基因型
Genotype频率
Frequencyn 等位
基因
Allele等位基
因频率
Allele
frequency杂合度
(He)
Heterozygosity有效等位
基因数(Ne)
Effective
allele
number多态信息
含量(PIC)
Polymorphism
information
contentχ2 g.64185950 T>C CC 0.333 40 C 0.604 0.478 1.917 0.364 2.106 CT 0.542 65 T 0.396 TT 0.125 15 g.64195411 G>A AA 0.383 46 A 0.633 0.465 1.868 0.357 0.703 AG 0.500 60 G 0.367 GG 0.117 14 g.64195613 C>T CC 0.325 39 C 0.583 0.486 1.946 0.368 0.474 CT 0.517 62 T 0.417 TT 0.158 19 g.64195821 G>A AA 0.017 2 A 0.171 0.284 1.396 0.243 0.936 AG 0.308 37 G 0.829 GG 0.675 81 g.64195833 T>A AA 0.033 4 A 0.517 0.499 1.998 0.375 105.025* AT 0.967 116 T 0.483 TT 0 0 g.64196373 T>C CC 0.525 63 C 0.742 0.383 1.620 0.310 2.058 CT 0.433 52 T 0.258 TT 0.042 5 g.64196735 T>C CC 0.383 46 C 0.621 0.471 1.889 0.360 0.010 CT 0.475 57 T 0.379 TT 0.142 17 1) PIC≥0.5为高度多态,0.25≤PIC<0.5为中度多态,PIC<0.25为低度多态;以χ2检验Hardy-Weinberg平衡,df=2,χ$_{0.05}^{2} $=5.99,χ$_{0.01}^{2} $=9.21;“*”表示P<0.05,偏离Hardy-Weinberg平衡
1) PIC≥0.5 is highly polymorphic, 0.25≤PIC<0.5 is moderately polymorphic, PIC<0.25 is lowly polymorphic; Hardy-Weinberg equilibrium is tested by χ2, df=2, χ$_{0.05}^{2} $=5.99, χ$_{0.01}^{2} $=9.21; “*” indicates P<0.05 and deviation from Hardy-Weinberg equilibrium2.4 BMP6基因多态性与生长性状和屠宰性状的关联性分析
基因型个体数低于5的不做关联分析,直接剔除。对粤西卷羽鸡BMP6基因7个SNP位点不同基因型与生长性状和屠宰性状进行关联性分析,由表4可知:在公鸡BMP6基因的7个SNP位点中,g.64195613 C>T的3种基因型在胫长上存在差异,CC基因型显著高于TT基因型,其余位点各基因型间生长性状差异不显著。
表 4 粤西卷羽公鸡BMP6基因SNP位点各基因型的生长性状1)Table 4. Growth traits of each genotype at SNP sites of BMP6 gene in Yuexi Frizzled Feather cockSNP位点
SNP site基因型
Genotypen 体质量/g
Body weight胫长/cm
Tibia length龙骨长/cm
Keel length胫围/cm
Tibia girthg.64185950 T>C CC 17 1740.16±35.00a 9.06±0.08a 10.14±0.10a 5.02±0.05a CT 33 1716.82±30.55a 8.93±0.09a 10.16±0.10a 5.02±0.04a TT 10 1706.39±71.64a 8.71±0.10a 10.09±0.14a 4.92±0.13a g.64195411 G>A AA 20 1699.59±37.49a 8.78±0.08a 10.16±0.10a 5.01±0.06a AG 33 1715.61±31.84a 8.99±0.09a 10.16±0.09a 4.98±0.04a GG 7 1813.54±52.25a 9.06±0.14a 10.00±0.22a 5.09±0.08a g.64195613 C>T CC 16 1786.34±30.94a 9.06±0.10a 10.09±0.12a 5.09±0.05a CT 35 1709.30±30.93a 8.94±0.08ab 10.15±0.09a 4.96±0.04a TT 9 1654.97±65.51a 8.65±0.10b 10.22±0.17a 5.02±0.12a g.64195821 G>A AG 18 1765.67±33.84a 8.96±0.11a 10.27±0.12a 4.99±0.05a GG 42 1702.85±28.41a 8.92±0.07a 10.09±0.08a 5.01±0.04a g.64195833 T>A AT 57 1718.29±23.52a 8.92±0.06a 10.13±0.07a 5.00±0.03a g.64196373 T>C CC 34 1720.02±30.76a 8.88±0.08a 10.26±0.08a 4.97±0.05a CT 23 1716.21±37.06a 9.00±0.10a 9.96±0.11a 5.04±0.04a g.64196735 T>C CC 21 1774.43±27.32a 9.07±0.08a 10.06±0.10a 5.05±0.05a CT 28 1687.00±39.45a 8.87±0.11a 10.10±0.10a 4.96±0.05a TT 11 1709.33±43.23a 8.82±0.06a 10.40±0.13a 5.01±0.08a 1) 相同位点同列数据后的不同小写字母表示差异显著(P<0.05,Tamheini法或t检验)
1) Different lowercase letters of the same column for the same site indicate significant differences (P<0.05, Tamheini method or t test)由表5可知:在母鸡BMP6基因的7个SNP位点中,g.64195411 G>A的3种基因型在龙骨长上存在差异,AA基因型显著高于AG基因型;g.64196373 T>C的2种基因型在胫长上存在差异,CC基因型的胫长极显著高于CT基因型(P<0.01);g.64196735 T>C的3种基因型在胫长上存在差异,CT基因型显著高于TT基因型;其余位点各基因型间生长性状差异不显著。
表 5 粤西卷羽母鸡BMP6基因SNP位点各基因型的生长性状1)Table 5. Growth traits of each genotype at SNP sites of BMP6 gene in Yuexi Frizzled Feather henSNP位点
SNP site基因型
Genotypen 体质量/g
Body weight胫长/cm
Tibia length龙骨长/cm
Keel length胫围/cm
Tibia girthg.64185950 T>C CC 23 1425.72±27.56a 7.99±0.07a 9.47±0.08a 4.60±0.04a CT 32 1467.16±24.99a 8.10±0.07a 9.44±0.08a 4.60±0.03a TT 5 1378.20±103.47a 8.19±0.33a 9.33±0.24a 4.59±0.13a g.64195411 G>A AA 26 1437.28±29.46a 8.13±0.10a 9.55±0.10a 4.58±0.03a AG 27 1443.81±29.07a 8.04±0.06a 9.31±0.08b 4.60±0.04a GG 7 1468.47±49.26a 7.94±0.07a 9.51±0.09ab 4.63±0.05a g.64195613 C>T CC 23 1440.44±30.21a 8.10±0.06a 9.37±0.08a 4.63±0..04a CT 27 1446.68±25.40a 8.08±0.09a 9.43±0.09a 4.56±0.04a TT 10 1444.10±62.31a 7.96±0.15a 9.64±0.15a 4.61±0.07a g.64195821 G>A AG 19 1418.37±28.84a 8.26±0.10a 9.46±0.11a 4.57±0.03a GG 39 1453.69±25.32a 7.96±0.06a 9.43±0.07a 4.61±0.03a g.64195833 T>A AT 59 1444.87±19.20a 8.06±0.05a 9.44±0.06a 4.59±0.03a g.64196373 T>C CC 29 1456.64±26.20a 8.17±0.09a 9.59±0.08a 4.62±0.04a CT 29 1425.49±28.87a 7.97±0.05b 9.29±0.07a 4.57±0.04a g.64196735 T>C CC 24 1427.00±29.48a 8.03±0.07ab 9.40±0.08a 4.61±0.04a CT 29 1491.68±19.47a 8.17±0.08a 9.50±0.09a 4.61±0.04a TT 7 1303.53±79.57a 7.74±0.06b 9.35±0.20a 4.47±0.09a 1) 相同位点同列数据后的不同小写字母表示差异显著(P<0.05,Tamheini法或t检验)
1) Different lowercase letters of the same column for the same site indicate significant differences (P<0.05, Tamheini method or t test)由表6可知:在公鸡BMP6基因的7个SNP位点中,g.64196735 T>C的3种基因型在活质量上存在差异,CC基因型显著高于CT基因型,其余位点各基因型间屠宰性能差异不显著。
表 6 粤西卷羽公鸡BMP6基因SNP位点各基因型的屠宰性能1)Table 6. Slaughter performance of each genotype at SNP sites of BMP6 gene in Yuexi Frizzled Feather cockSNP位点
SNP site基因型
Genotypen 活质量/g
Live
weight屠宰率/%
Dressing
percentage半净膛率/%
Half-bore
weight rate全净膛率/%
Full-bore
weight rate腹脂率/%
Abdominal fat
weight rate胸肌率/%
Breast muscle
weight rate腿肌率/%
Leg muscle
weight rateg.64185950 T>C CC 5 1 658.54a 0.90a 0.82a 0.71a 0.013a 0.11a 0.18a CT 22 1 637.76a 0.89a 0.81a 0.70a 0.012a 0.11a 0.20a g.64195411 G>A AA 13 1 635.90a 0.91a 0.83a 0.71a 0.015a 0.11a 0.19a AG 13 1 621.65a 0.89a 0.81a 0.70a 0.013a 0.11a 0.20a g.64195613 C>T CC 9 1 711.99a 0.89a 0.81a 0.71a 0.010a 0.11a 0.19a CT 17 1 610.45a 0.89a 0.82a 0.70a 0.012a 0.11a 0.20a g.64195821 G>A AG 13 1 643.43a 0.89a 0.82a 0.71a 0.015a 0.11a 0.19a GG 17 1 648.28a 0.90a 0.82a 0.70a 0.010a 0.11a 0.20a g.64195833 T>A AT 29 1 645.82a 0.89a 0.82a 0.70a 0.012a 0.11a 0.20a g.64196373 T>C CC 19 1 625.11a 0.90a 0.82a 0.71a 0.015a 0.11a 0.20a CT 11 1 682.57a 0.89a 0.81a 0.70a 0.007a 0.11a 0.19a g.64196735 T>C CC 11 1 718.33a 0.89a 0.81a 0.71a 0.010a 0.11a 0.18a CT 14 1 601.74b 0.90a 0.82a 0.70a 0.013a 0.11a 0.20a TT 5 1 611.86ab 0.89a 0.82a 0.70a 0.014a 0.11a 0.20a 1) 相同位点同列数据后的不同小写字母表示差异显著(P<0.05,Tamheini法或t检验)
1) Different lowercase letters of the same column for the same site indicate significant differences (P<0.05, Tamheini method or t test)由表7可知:在母鸡BMP6基因的7个SNP位点中,g.64195613 C>T的3种基因型在腹脂率上存在差异,CC基因型显著高于CT基因型;g.64196373 T>C的2种基因型在半净膛率上存在差异,CC基因型显著高于CT基因型;其余位点各基因型间屠宰性能差异不显著。
表 7 粤西卷羽母鸡BMP6基因SNP位点各基因型的屠宰性能1)Table 7. Slaughter performance of each genotype at SNP sites of BMP6 gene in Yuexi Frizzled Feather henSNP位点
SNP site基因型
Genotypen 活质量/g
Live
weight屠宰率/%
Dressing
percentage半净膛率/%
Half-bore
weight rate全净膛率/%
Full-bore
weight rate腹脂率/%
Abdominal fat
weight rate胸肌率/%
Breast muscle
weight rate腿肌率/%
Leg muscle
weight rateg.64185950 T>C CC 10 1 318.85a 0.87a 0.78a 0.68a 0.030a 0.12a 0.19a CT 18 1 380.92a 0.87a 0.80a 0.71a 0.027a 0.14a 0.23a g.64195411 G>A AA 13 1 345.03a 0.88a 0.80a 0.71a 0.024a 0.13a 0.25a AG 12 1 349.35a 0.87a 0.78a 0.69a 0.029a 0.12a 0.18a GG 5 1 417.44a 0.88a 0.81a 0.71a 0.029a 0.15a 0.19a g.64195613 C>T CC 11 1 368.40a 0.87a 0.79a 0.70a 0.034a 0.13a 0.18a CT 14 1 353.41a 0.88a 0.80a 0.70a 0.022b 0.13a 0.25a TT 5 1 352.92a 0.88a 0.80a 0.69a 0.024ab 0.13a 0.19a g.64195821 G>A AG 8 1 342.86a 0.86a 0.79a 0.70a 0.025a 0.12a 0.18a GG 21 1 359.04a 0.88a 0.80a 0.69a 0.029a 0.14a 0.23a g.64195833 T>A AT 30 1 358.83a 0.87a 0.79a 0.70a 0.027a 0.13a 0.21a g.64196373 T>C CC 13 1 369.73a 0.87a 0.80a 0.69a 0.027a 0.12a 0.18a CT 15 1 340.58a 0.87a 0.78b 0.70a 0.025a 0.14a 0.24a g.64196735 T>C CC 11 1 345.33a 0.87a 0.79a 0.70a 0.032a 0.13a 0.18a CT 15 1 366.59a 0.88a 0.80a 0.70a 0.021a 0.13a 0.25a 1) 相同位点同列数据后的不同小写字母表示差异显著(P<0.05,Tamheini法或t检验)
1) Different lowercase letters of the same column for the same site indicate significant differences (P<0.05, Tamheini method or t test)3. 讨论
粤西卷羽鸡是广东省地方特色品种资源,本研究以粤西卷羽鸡为试验材料,对BMP6基因外显子SNP位点与生长性状及屠宰性状进行关联分析,深入挖掘对粤西卷羽鸡标记辅助选择具有一定的参考价值的鸡BMP6基因SNP位点。
本研究在粤西卷羽鸡BMP6基因的外显子上共检测到7个SNP位点,其中g.64185950 T>C、g.64195411 G>A和g.64195613 C>T位点位于外显子编码区,且均为同义突变。Hardy-Weinberg平衡检验结果显示,g.64195833 T>A在粤西卷羽鸡群体中显著偏离Hardy-Weinber平衡,说明该基因多态性丰富[19]。基因在配子中的随机分离以及在合子里的随机重组都会导致一定的误差,从而引起基因频率的变化[20],提示BMP6基因SNP位点g.64195833 T>A显著偏离Hardy-Weinberg平衡状态可能与遗传漂变、突变、样本数量或群体育种措施有关[21]。
BMP6基因SNP位点在不同品种中均具有不同的功能。本研究将BMP6基因的7个SNP位点与生长性状及屠宰性状进行关联分析后发现:在公鸡中,g.64195613 C>T位点与胫长存在显著相关性;在母鸡中,g.64195411 G>A位点与龙骨长存在显著相关性,g.64196373 T>C位点与胫长存在极显著相关性,g.64196735 T>C位点与胫长存在显著相关性。Cui等[22]以艾维茵鸡和矮脚黄鸡为试验材料,通过DNA库构建筛选BMP6基因的内含子区和外显子区,之后扩增DNA片段并测序,发现9个SNP位点,并将这些位点与胴体和骨骼性状进行关联分析,结果表明,BMP6基因与艾维茵鸡的股骨质量、胫骨质量和股骨长度存在显著相关性,与胫骨长度存在极显著差异,而与矮脚黄鸡的所有屠宰性能均无显著相关性。肖朝庭等[14]以不同绵羊品种为试验材料,扩增BMP6基因的外显子5、6和7,结果发现其没有多态性。储明星等[15]以不同山羊品种为试验材料,同样扩增BMP6基因的外显子5、6和7,未发现多态位点,可能是由于BMP6基因外显子5、6和7序列在羊品种中比较保守。El-Halawany等[23]扩增埃及绵羊BMP6基因的部分片段,测序后发现,在BMP6基因的3'UTR区检测到3个SNP位点,且BMP6-1位点与埃及绵羊的产仔数存在相关性。我们的研究结果与肖朝庭等[14]、储明星等[15]以及El-Halawany等[23]的研究结果存在差异,而与姚国瑜[13]、Cui等[22]的研究结果相似,即BMP6基因外显子上的部分位点突变与鸡的体质量或体尺存在显著相关性,可能是由于所选物种不同而造成的结果。关于屠宰性状的关联分析发现:在公鸡中,g.64196735 T>C位点与活质量存在显著相关性,其余位点各基因型间屠宰性能差异不显著;在母鸡中,g.64195613 C>T位点与腹脂率存在显著相关性,g.64196373 T>C位点与半净膛率存在显著相关性。因此,可以将BMP6基因g.64195411 G>A、g.64195613 C>T、g.64196373 T>C和g.64196735 T>C这4个位点作为粤西卷羽鸡部分生长性状的分子育种标记,将g.64195613 C>T、g.64196373 T>C和g.64196735 T>C这3个位点作为粤西卷羽鸡部分屠宰性状的分子育种标记。
4. 结论
BMP6基因在粤西卷羽鸡中的多态性丰富,本研究共得到7个粤西卷羽鸡BMP6基因SNP位点。结合生长性状与屠宰性状数据进行关联分析发现,g.64195411 G>A、g.64195613 C>T、g.64196373 T>C和g.64196735 T>C与粤西卷羽鸡生长性状存在显著关联,g.64195613 C>T、g.64196373 T>C和g.64196735 T>C与粤西卷羽鸡屠宰性状存在显著关联,以上位点可以作为粤西卷羽鸡生长性状及屠宰性状的分子育种标记。
-
表 1 研究区域调查样点产量数据
Table 1 Yield information of investigation plot in research area
耕地类型
Type of cultivated land耕地数量/块
Amount of cultivated land耕地密度/(块·hm−2)
Density of cultivated land产量/(kg·hm−2)
Yield最大值 Max. 最小值 Min. 平均值 Mean 旱地 Rainfed cropland 20 306.26 3 840 1 980 2 671.50 水浇地 Irrigable cropland 77 556.42 9 375 2 100 5 296.35 总计 Total 97 512.78 9 375 1 980 4 755.15 表 2 影响耕地质量的因素
Table 2 Factors impacting the quality of cultivated land
类别
Classification影响因素
Impact factor类别
Classification影响因素
Impact factor自然因素
Natural factor生长季均温
Mean temperature of growing season社会经济因素
Socioeconomic factor林网化程度
Degree of forestation生长季降水量
Mean precipitation of growing season耕作距离
Cultivation distance年总太阳辐射量
Annual solar radiation amount农田路网密度
Farmland road network density海拔高度
Elevation田块形状
Field shape地形坡度
Topographic slope田块大小
Field size有效土层厚度
Effective soil thickness农田破碎度
Farmland fragmentation degree表层土壤质地
Surface soil texture利用现状
Utilization status砾石含量
Gravel content区位因素
Location factor城镇影响度
Urban influence degree土壤有机质含量
Soil organic matter content农贸市场影响度
Agricultural market influence degree土壤酸碱度
Soil pH道路通达度
Road accessibility degree灌溉保证率
Irrigation guarantee rate对外交通便利度
External traffic convenience degree灌溉水质量
Irrigation water quality工程因素
Engineering factor灌溉排水工程
Irrigation drainage project生态因素
Ecological factor自然灾害危险性
Natural disaster risk道路工程
Road construction project生态系统脆弱性
Ecosystem vulnerability农田防护林工程
Farmland protective forest project水土流失状况
Soil erosion condition土地平整工程
Land leveling project表 3 采用特尔菲法的定级指标体系
Table 3 Grading indicators system using Delphi method
一级 Primary level 二级 Secondary level 定级 Grading level 一级指标
Primary indicator权重
Weight二级指标
Secondary indicator权重
Weight定级指标
Grading indicator权重
Weight生态因素
Ecological factor0.19 生态状况
Ecological condition0.19 生态系统脆弱性
Ecosystem vulnerability0.02 自然灾害危险性 Natural disaster risk 0.08 水土流失状况 Soil erosion condition 0.09 自然因素
Natural factor0.48 气候状况
Climate condition0.16 生长季平均温度
Mean temperature of growing season0.06 生长季平均降水
Mean precipitation of growing season0.08 年总太阳辐射量
Annual solar radiation amount0.02 地形状况
Terrain condition0.08 海拔高度 Elevation 0.03 地形坡度 Topographic slope 0.04 砾石含量 Gravel content 0.01 土壤条件
Soil condition0.22 有效土层厚度 Effective soil thickness 0.06 表层土壤质地 Surface soil texture 0.06 土壤酸碱度 Soil pH 0.03 土壤有机质含量
Soil organic matter content0.07 水资源状况
Water resources condition0.02 灌溉水质量
Irrigation water quality0.02 社会经济因素
Socioeconomic factor0.09 基础设施条件
Infrastructure condition0.04 农田路网密度
Farmland road network density0.01 林网化程度 Degree of forestation 0.01 农田破碎度
Farmland fragmentation degree0.01 灌溉保证率 Irrigation guarantee rate 0.01 续表 3 Continued table 3 一级 Primary level 二级 Secondary level 定级 Grading level 一级指标
Primary indicator权重
Weight二级指标
Secondary indicator权重
Weight定级指标
Grading indicator权重
Weight耕作条件
Cultivating condition0.03 耕作距离 Cultivation distance 0.01 田块形状 Field shape 0.01 田块大小 Field size 0.01 土地利用状况
Land use status0.02 利用现状
Utilization status0.02 区位因素
Location factor0.20 区位条件
Locational condition0.11 城镇影响度 Urban influence degree 0.06 农贸市场影响度
Agricultural market influence degree0.05 交通条件
Traffic condition0.09 道路通达度 Road accessibility degree 0.05 对外交通便利度
External traffic convenience degree0.04 工程因素
Engineering factor0.04 工程建设状况
Construction condition0.04 灌溉排水工程
Irrigation drainage project0.01 农田防护林工程
Farmland protective forest project0.01 道路工程 Road construction project 0.01 土地平整工程 Land leveling project 0.01 表 4 随机森林算法对影响因素的变量重要性(I)排序
Table 4 Variable importance (I) ranking of impact factors by random forest algorithm
影响因素 Impact factor I 影响因素 Impact factor I 生态系统脆弱性 Ecosystem vulnerability 11.94 灌溉保证率 Irrigation guarantee rate 4.74 生长季降水量 Mean precipitation of growing season 10.63 有效土层厚度 Effective soil thickness 4.65 自然灾害危险性 Natural disaster risk 10.01 灌溉排水工程 Irrigation drainage project 4.58 年总太阳辐射 Annual solar radiation 9.08 表层土壤质地 Surface soil texture 4.50 土壤酸碱度 pH 8.54 海拔高度 Elevation 3.85 灌溉水质量 Irrigation water quality 7.94 农田路网密度 Farmland road network density 3.85 对外交通便利度 External traffic convenience 7.60 道路工程 Road construction project 3.63 地形坡度 Slope 7.47 利用现状 Utilization status 3.61 生长季均温 Mean temperature of growing season 6.82 砾石含量 Gravel content 3.38 农田破碎度 Farmland fragmentation 6.75 农田防护林工程 Protective forest project 2.85 城镇影响度 Urban influence 6.14 林网化程度 Degree of forestation 2.62 农贸市场影响度 Agricultural market influence 6.10 道路通达度 Road accessibility 2.57 土壤有机质含量 Soil organic matter 5.79 土地平整工程 Land leveling project 2.01 水土流失状况 Soil erosion condition 5.73 田块大小 Field size 1.02 耕作距离 Cultivation distance 5.70 田块形状 Field shape 0.03 表 5 显著相关影响因素的相关系数1)
Table 5 Correlation coefficients matrix of significantly related impact factors
影响因素 Impact factor Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y1 1 Y2 0.790** 1 Y3 0.254* 0.310** 1 Y4 −0.278* −0.150* 0.957** 1 Y5 0.132* 0.119* 0.243* −0.251* 1 Y6 0.142* 0.156* 0.222* −0.258* 0.856** 1 Y7 0.140* 0.177* 0.278* −0.262* 0.905** 0.986** 1 Y8 0.190* 0.104* 0.189* −0.247* 0.851** 0.969** 0.982** 1 1)Y1:表层土壤质地;Y2:砾石含量;Y3:自然灾害危险性;Y4:生态系统脆弱性;Y5:灌溉排水工程;Y6:道路工程;Y7:农田防护林工程;Y8:土地平整工程;“*”和“**”分别表示在0.05和0.01水平显著相关(Pearson法)
1)Y1: Surface soil texture; Y2: Gravel content; Y3: Natural disaster risk; Y4: Ecosystem vulnerability; Y5: Irrigation drainage project; Y6: Road construction project; Y7: Farmland protective forest project; Y8: Land leveling project; “*” and “**” indicate significant correlation at 0.05 and 0.01 levels, respectively(Pearson method)表 6 耕地质量定级指标体系
Table 6 The index system of cultivated land quality grading
一级 Primary level 二级 Secondary level 定级 Grading level 一级指标
Primary indicator权重
Weight二级指标
Secondary indicator权重
Weight定级指标
Grading indicatorI 权重
Weight生态因素
Ecological factor0.16 生态状况
Ecological condition0.16 生态系统脆弱性
Ecosystem vulnerability11.94 0.11 水土流失状况
Soil erosion condition5.73 0.05 自然因素
Natural factor0.53 气候状况
Climate condition0.25 生长季平均温度
Mean temperature of growing season6.82 0.06 生长季平均降水
Mean precipitation of growing season10.63 0.10 年总太阳辐射量
Annual solar radiation amount9.08 0.09 地形状况
Terrain condition0.07 地形坡度 Topographic slope 7.47 0.07 土壤条件
Soil condition0.14 土壤有机质含量
Soil organic matter content5.79 0.08 土壤酸碱度 pH 8.54 0.06 水资源状况
Water resources condition0.07 灌溉水质量 Irrigation water quality 7.94 0.07 社会经济因素
Socioeconomic factor0.12 基础设施条件
Infrastructure condition0.06 农田破碎度
Farmland fragmentation degree6.75 0.06 耕作便利条件
Cultivating condition0.06 耕作距离 Cultivation distance 5.70 0.06 区位因素
Location factor0.19 区位条件
Locational condition0.12 城镇影响度 Urban influence degree 6.14 0.06 农贸市场影响度
Agricultural market influence degree6.10 0.06 交通条件
Traffic condition0.07 对外交通便利度
External traffic convenience degree7.60 0.07 -
[1] 吴大放, 刘艳艳, 董玉祥, 等. 我国耕地数量、质量与空间变化研究综述[J]. 热带地理, 2010, 30(2): 108-113. doi: 10.3969/j.issn.1001-5221.2010.02.002 [2] 温良友, 孔祥斌, 辛芸娜, 等. 对耕地质量内涵的再认识[J]. 中国农业大学学报, 2019, 24(3): 156-164. [3] 张超, 乔敏, 郧文聚, 等. 耕地数量、质量、生态三位一体综合监管体系研究[J]. 农业机械学报, 2017, 48(1): 1-6. doi: 10.6041/j.issn.1000-1298.2017.01.001 [4] 刘兴华, 孙鹏举, 刘学录. 甘肃省临夏县耕地资源社会保障价值测算[J]. 干旱区资源与环境, 2013, 27(1): 53-57. [5] 中华人民共和国国土资源部. 农用地定级规程: GB/T 28405—2012 [S]. 北京: 中国标准出版社, 2012. [6] 高中贵, 彭补拙. 我国农用地分等定级研究综述[J]. 经济地理, 2004, 24(4): 514-519. doi: 10.3969/j.issn.1000-8462.2004.04.020 [7] 金东海, 许皞, 秦文利. 基于分等成果的农用地定级新方法:两层七参数法[J]. 中国土地科学, 2004, 18(6): 34-39. doi: 10.3969/j.issn.1001-8158.2004.06.007 [8] 鲁明星, 贺立源, 吴礼树. 我国耕地地力评价研究进展[J]. 生态环境, 2006, 8(4): 866-871. [9] 冯超. 中国谷物产出的"面积− 质量"导向因素分析[J]. 干旱区资源与环境, 2015, 29(8): 7-13. [10] 沈仁芳, 陈美军, 孔祥斌, 等. 耕地质量的概念和评价与管理对策[J]. 土壤学报, 2012, 49(6): 1210-1217. doi: 10.11766/trxb201208130319 [11] 张凤荣, 安萍莉, 王军艳, 等. 耕地分等中的土壤质量指标体系与分等方法[J]. 资源科学, 2002, 24(2): 71-75. doi: 10.3321/j.issn:1007-7588.2002.02.014 [12] 付国珍, 摆万奇. 耕地质量评价研究进展及发展趋势[J]. 资源科学, 2015, 35(2): 226-236. [13] 盛艳, 姚云峰, 秦富仓, 等. 基于GIS的耕地地力等级划分研究[J]. 干旱区资源与环境, 2014, 28(6): 27-32. [14] 马瑞明, 马仁会, 韩冬梅, 等. 基于多层级指标的省域耕地质量评价体系构建[J]. 农业工程学报, 2018, 34(16): 249-257. doi: 10.11975/j.issn.1002-6819.2018.16.032 [15] 杜国明, 刘彦随, 于凤荣, 等. 耕地质量观的演变与再认识[J]. 农业工程学报, 2016, 32(14): 243-249. [16] 马昊翔, 陈长成, 宋英强, 等. 青海省近10年草地植被覆盖动态变化及其驱动因素分析[J]. 水土保持研究, 2018, 25(6): 137-145. [17] 保广裕, 张静, 周丹, 等. 青海省太阳辐射强度时空变化特征分析[J]. 冰川冻土, 2017, 39(3): 563-571. [18] 樊杰. 中国主体功能区划方案[J]. 地理学报, 2015, 70(2): 186-201. doi: 10.11821/dlxb201502002 [19] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. doi: 10.1023/A:1010933404324
[20] CHEN X W, LIU M. Prediction of protein-protein interactions using random decision forest framework[J]. Bioinformatics, 2005, 21(24): 4394-4400. doi: 10.1093/bioinformatics/bti721
[21] WARD M M, PAJEVIC S, DREYFUSS J, et al. Short-term prediction of mortality in patients with systemic lupus erythematosus: Classification of outcomes using random forests[J]. Arthrit Rheumat, 2006, 55(1): 74-80. doi: 10.1002/art.21695
[22] OPARIN I, GLEMBEK O, BURGET L, et al. Morphological random forests for language modeling of inflectional languages[C/OL]//IEEE. 2008 IEEE Spoken Language Technology Workshop. Goa: IEEE, 2008: 189-192. [2019-08-25]. https://www.infona.pl/resource/bwmeta1.element.ieee-art-000004777872/tab/summary. doi: 10.1109/SLT.2008.4777872.
[23] ZHANG M, ZHANG H, WU P, et al. Prediction of soil organic carbon in an intensively managed reclamation zone of eastern China: A comparison of multiple linear regressions and the random forest model[J]. Sci Total Environ, 2017, 592: 704-713. doi: 10.1016/j.scitotenv.2017.02.146
[24] 方匡南, 朱建平, 谢邦昌. 基于随机森林方法的基金收益率方向预测与交易策略研究[J]. 经济经纬, 2010, 27(2): 61-65. doi: 10.3969/j.issn.1006-1096.2010.02.015 [25] 董师师, 黄哲学. 随机森林理论浅析[J]. 集成技术, 2013, 2(1): 1-7. [26] 张雷, 王琳琳, 张旭东, 等. 随机森林算法基本思想及其在生态学中的应用:以云南松分布模拟为例[J]. 生态学报, 2014, 24(3): 650-659. [27] 刘斌, 郭星, 朱宇恩. 基于随机森林模型的土壤重金属源解析:以晋中盆地为例[J]. 干旱区资源与环境, 2019, 33(1): 106-111. [28] 马玥, 姜琦刚, 孟治国, 等. 基于随机森林算法的农耕区土地利用分类研究[J]. 农业机械学报, 2016, 47(1): 297-303. doi: 10.6041/j.issn.1000-1298.2016.01.040 [29] ZHU Z, WOODCOCK C E, ROGAN J, et al. Assessment of spectral, polarimetric, temporal, and spatial dimensions for urban and peri-urban land cover classification using Landsat and SAR data[J]. Rem Sens Environ, 2012, 117: 72-82. doi: 10.1016/j.rse.2011.07.020
[30] VAN BEIJMA S, COMBER A, LAMB A. Random forest classification of salt marsh vegetation habitats using quad-polarimetric airborne SAR, elevation and optical RS data[J]. Rem Sens Environ, 2014, 149: 118-129. doi: 10.1016/j.rse.2014.04.010
[31] LIAW A, WIENER M. Classification and regression by random forest[J]. R News, 2002, 2(3): 18-22.
[32] 刘欢, 吴克宁, 宋文, 等. 耕地质量定级方法改进研究:以农安县为例[J]. 北京师范大学学报(自然科学版), 2018, 54(3): 315-320. [33] 赵璐, 郑新奇, 闫弘文, 等. 基于地统计学的县域农用地定级方法[J]. 农业工程学报, 2008, 24(S1): 99-103. [34] 黄居茂. 青海省农作物生产发展的科学技术探讨[J]. 青海农林科技, 1984, 14(4): 18-26. [35] 朱文江, 康素珍. 柴达木盆地春小麦高产的气候因素[J]. 中国农业科学, 1978, 19(2): 51-56. [36] 张玮, 李江. 青海省菜田盐渍化形成及治理[J]. 青海农技推广, 2015, 20(2): 32-33. doi: 10.3969/j.issn.1008-7117.2015.02.012