Effects of phenotypic data from different time span on pig genetic evaluation
-
摘要:
以杜洛克猪主要生长性状为研究对象,评估不同时间跨度、相同个体估计育种值(EBV)的准确性和排名的差异。利用DMU软件和单性状动物模型估计了主要生长性状的方差组分,并计算性状的遗传力;划分不同时间跨度,包括2年、3年、4年、5年和全部数据,评估验证群体个体的EBV准确性及其与利用全部数据时评估育种值的秩相关。结果表明,115 kg体重日龄(AGE)、30~115 kg日增重(ADG)、115 kg体重背膘厚(BF)、115 kg体重眼肌面积(LEA)和综合体型评分(BCS)的遗传力分别为0.22、0.16、0.38、0.30和0.09,除BCS外,均为中高遗传力性状。固定方差组分情况下,AGE、ADG、BF、LEA和BCS的EBV准确性变化范围分别为0.62~0.64、0.56~0.59、0.72~0.73、0.67~0.69和0.49~0.53;不固定方差组分情况下,各性状EBV准确性变化范围分别为0.64~0.65、0.51~0.59、0.61~0.73、0.67~0.69和0.42~0.53;不同条件下,秩相关均较为接近。利用群体全部数据计算方差组分作为先验值,优于利用阶段数据方差组分估计值时EBV准确性;不同时间跨度下,EBV排名差异较小,可适当缩小数据取值时间范围。
Abstract:The accuracy and ranking difference of estimated breeding values(EBV) of the same individuals in different time span were evaluated for the major production traits of Duroc pig. Univariate animal model and DMU software were used to estimate the variances and heritabilities of major production traits. The accuracy of EBV and spearman correlation were compared between data from different periods, including two years, three years, four years, five years and all data. The results also showed that the heritabilities of age at 115 kg live weight (AGE), average daily gain between 30-115 kg (ADG), backfat thickness at 115 kg live weight (BF), loin eye area at 115 kg live weight (LEA) and body conformation score (BCS) were 0.22, 0.16, 0.38, 0.30 and 0.08 respectively. Except BCS, the heritabilities of other traits were medium and high. Furthermore, if the variance components were fixed, the accuracy ranges of AGE, ADG, BF, LEA and BCS were 0.62-0.64, 0.56-0.59, 0.72-0.73, 0.67-0.69 and 0.49-0.53 respectively. If the variance components were not fixed and estimated from the specific time span, the accuracy ranges of AGE, ADG, BF, LEA and BCS were 0.64-0.65, 0.51-0.59, 0.61-0.73, 0.67-0.69 and 0.42-0.53 respectively. For another, the spearman correlations were close for conditions of different time span. The results also showed that the prior variance components calculated from the whole data were better than the phase data, while the rank of EBV were close for different periods, so the time span of data could be reduced appropriately.
-
Keywords:
- Duroc pig /
- production trait /
- time span /
- genetic evaluation
-
在对种猪进行常规遗传评估时,育种值估计准确性取决于数据的数量和质量[1],现场常将历史表型数据全部纳入计算,这种做法能够最大限度地使用全部亲属的遗传信息,预期估计育种值(EBV)也将更加准确。然而,这种做法也可能会存在一些问题,一方面在性状收集早期,由于人员经验不足,数据错误率往往偏高,而且由于测定仪器的更新换代和折旧,使得数据不同时间阶段呈现不同的特点[2];另一方面随着群体遗传改良的进行,群体加性方差会随之改变[3],使用统一的方差组分先验值,可能会使育种值估计的准确性降低。因此,利用早期数据也可能会带来一定的风险。本文以某一杜洛克猪核心育种群体生长性状为研究对象,利用不同时间跨度表型数据参与最佳线性无偏估计(BLUP)运算,并以部分最近终测个体作为验证群,比较不同时间跨度下,相同个体EBV估计的准确性差异;以利用全部数据计算的结果作为参照,计算其与不同时间跨度条件下EBV的秩相关;分析了在不固定遗传方差的情况下EBV的差异。本研究可为科学合理使用表型数据提供参考。
1. 材料与方法
1.1 数据来源
以温氏食品集团股份有限公司种猪分公司某核心场S22系杜洛克猪为研究对象,并以该场为出生和测定场,选取2012—2018年约17 000条生长性状测定记录,主要包括校正115 kg体重日龄(AGE)、校正30~115 kg体重日增重(ADG)、校正115 kg体重背膘厚(BF)、校正115 kg体重眼肌面积(LEA)和终测体型评分(BCS)。
1.2 数据收集和处理
115 kg体重日龄的测定方法是, 先用电子秤对体重85~130 kg范围内的后备种猪称重,并记录其日龄,然后对其进行校正。30~115 kg体重日增重为总增重85 kg除以校正后的30 kg体重日龄与115 kg体重日龄之差所得。背膘厚、眼肌面积均由法国兽用便携式B超仪AGROSCAN测定并根据图形测量所得,校正至115 kg体重日龄,校正公式均为公司内部资料,此处不便列出。终测体型评分是由体型评定熟练的育种技术人员实施,在猪只进行终测时,现场对每头参与测定的猪只进行体型评定。评分采用10分制,6.0分以上为体型合格猪只;分值越高,体型越好。综合体型评分考虑种猪的头型、前驱、后驱、腹线、肢蹄和生殖器官,符合品种特征和育种目标。
利用Excel剔除缺失值和异常数据,结合整理好的数据文件,利用DMUTrace软件追溯群体系谱,并按照DMU软件[4]要求整理为数据文件和系谱文件。DMU软件是一个全面的集合程序,可用于估计正态分布和非正态分布性状的方差-协方差组分,采用AI和EM算法相结合的REML方法估计方差组分。
1.3 方差组分和育种值估计模型
按公式(1)计算个体观察值:
$$ y=\mathrm{X}b+{{\mathrm{Z}}_{1}}a+{{\mathrm{Z}}_{2}}m+e, $$ (1) 式中:y是个体观察值,均已校正;b是固定效应向量,包括年季效应和性别效应。a是动物个体加性效应;m是窝效应;e是残差效应。X、Z1、Z2分别是b、a、m的结构矩阵。
使用DMU软件的DMUAI模块计算方差组分,利用DMU4模块计算在方差组分给定条件下个体的育种值和标准误。
1.4 育种值估计的准确性
通过公式(2)计算出对应的GEBV理论准确性(ri2)[5]:
$$ ~r_{i}^{2}=1-\frac{s_{i}^{2}}{(1+{{f}_{i}})\sigma _{a}^{2}}, $$ (2) 式中,si为第i个体EBV的标准误,fi为个体的近交系数,σa2为加性遗传方差。
2. 结果与分析
2.1 表型基本统计量
表 1为主要生长性状的表型基本统计量,包括校正115 kg体重日龄(AGE)、校正30~115 kg体重日增重(ADG)、校正115 kg体重背膘厚(BF)、校正115 kg体重眼肌面积(LEA)和终测体型评分(BCS)。由表 1可知,AGE、ADG、BF、LEA和BCS分别为179.76 d、863.44 g、12.55 mm、40.46 cm2和8.22分,且数据量均在17 000条以上,达到后续分析要求。
表 1 杜洛克猪各生长性状表型基本统计量Table 1. Basic statistics of selected productive traits of Duroc pigs性状 数据量/条 平均数±标准差 最大值 最小值 偏度 峰度 AGE/d 17 592 179.76±14.22 244.44 132.01 0.28 0.01 ADG/g 17 269 863.44±118.17 1 566.24 541.54 0.56 0.61 BF/mm 17 591 12.55±2.85 43.54 5.72 0.67 1.74 LEA/cm2 17 591 40.46±4.22 60.61 5.22 0.11 0.59 BCS/分 17 592 8.22±0.56 10.00 6.00 -1.01 1.13 2.2 方差组分估计和遗传参数
表 2为各生长性状加性方差、窝效应方差和残差方差估计值,并计算了遗传力。由表 2可知,AGE、ADG、BF、LEA和BCS遗传力分别为0.22、0.16、0.38、0.30和0.09,窝效应占表型方差比率分别为0.20、0.19、0.13、0.17和0.14。
表 2 杜洛克猪各生长性状方差组分估计值Table 2. Variance components and heritability of selected productive traits of Duroc pigs性状 加性方差 窝效应方差 残差方差 表型方差 遗传力 AGE 31.923 28.776 84.042 144.741 0.22 ADG 1 511.075 1 757.593 6 161.660 9 430.328 0.16 BF 1.857 0.631 2.384 4.872 0.38 LEA 4.696 2.605 8.476 15.777 0.30 BCS 0.015 0.023 0.121 0.159 0.09 2.3 固定方差组分下不同时间跨度数据的育种值估计准确性和秩相关
以2018年第3至4季度终测的种猪863头作为验证群体,分别选取2年(2017—2018年)、3年(2016—2018年)、4年(2015—2018年)、5年(2014—2018年)和全部数据(2012—2018年)的表型记录,在性状方差组分已知(方差由全部数据计算所得)的情况下,利用不同时间跨度表型数据,采用BLUP方法计算验证群体估计育种值(EBV),计算不同时间跨度数据EBV的准确性以及该育种值与全部数据计算育种值之间的秩相关, 结果见表 3。表 3的结果显示,AGE、ADG、BF、LEA和BCS不同时间跨度EBV准确性变化范围分别为0.62~0.64、0.56~0.59、0.72~0.73、0.67~0.69和0.49~0.53;时间跨度为2年时,育种值与全部数据秩相关分别为0.970、0.948、0.966、0.969和0.960。
表 3 固定方差组分、不同时间跨度数据EBV的准确性和秩相关1)Table 3. The accuracy and spearman correlation of EBV of different time span data in the case of fixed variance components性状 2年 3年 4年 5年 全部数据 r2 S2 r3 S3 r4 S4 r5 S5 rall Sall AGE 0.62±0.02 0.970 0.63±0.02 0.987 0.63±0.02 0.992 0.64±0.02 0.996 0.64±0.02 1.000 ADG 0.56±0.03 0.948 0.57±0.03 0.973 0.57±0.03 0.981 0.58±0.03 0.992 0.59±0.03 1.000 BF 0.72±0.01 0.966 0.72±0.01 0.990 0.73±0.01 9.997 0.73±0.01 1.000 0.73±0.01 1.000 LEA 0.67±0.02 0.969 0.68±0.02 0.987 0.68±0.02 0.995 0.68±0.02 0.997 0.69±0.02 1.000 BCS 0.49±0.03 0.960 0.51±0.03 0.968 0.51±0.03 0.981 0.52±0.03 0.988 0.53±0.03 1.000 1)ri和Si表示i年参考群EBV的准确性和秩相关,i分别为2年(2017—2018年)、3年(2016—2018年)、4年(2015—2018年)、5年(2014—2018年)和全部数据(2012—2018年); ri为平均值±标准误 2.4 不固定方差组分时不同时间跨度数据育种值估计准确性和秩相关
不同时间跨度数据利用AIREML方法分别估计方差组分,验证群中各性状育种值及准确性,与全部数据纳入计算得出EBV的秩相关,结果见表 4。表 4的结果显示AGE、ADG、BF、LEA和BCS不同时间跨度EBV准确性变化范围分别为0.64~0.65、0.51~0.59、0.61~0.73、0.67~0.69和0.42~0.53;时间跨度为2年时,育种值与全部数据秩相关分别为0.968、0.944、0.930、0.968和0.952。
表 4 不固定方差组分下不同时间跨度数据EBV的准确性和秩相关1)Table 4. The accuracy and spearman correlation of EBV of different time span data in the case of unfixed variance components性状 2年 3年 4年 5年 all r2 S2 r3 S3 r4 S4 r5 S5 rall Sall AGE 0.65±0.02 0.968 0.64±0.02 0.986 0.64±0.02 0.991 0.64±0.02 0.995 0.64±0.02 1.000 ADG 0.51±0.04 0.944 0.52±0.04 0.968 0.51±0.04 0.974 0.53±0.04 0.986 0.59±0.03 1.000 BF 0.61±0.02 0.930 0.68±0.02 0.981 0.70±0.02 0.995 0.73±0.01 1.000 0.73±0.01 1.000 LEA 0.67±0.02 0.968 0.66±0.02 0.985 0.66±0.02 0.993 0.67±0.02 0.996 0.69±0.02 1.000 BCS 0.42±0.04 0.952 0.43±0.04 0.958 0.42±0.04 0.965 0.49±0.04 0.983 0.53±0.03 1.000 1)ri和Si表示i年参考群EBV的准确性和秩相关,i分别为2年(2017—2018年)、3年(2016—2018年)、4年(2015—2018年)、5年(2014—2018年)和全部数据(2012—2018年);ri为平均值±标准误 3. 讨论与结论
3.1 生长性状的表型和遗传分析
本文生长性状数据量均达到17 000条以上,数据平均数和标准差在正常范围内。有研究表明,AGE和BF遗传力分别为0.21和0.41[2],ADG遗传力估计值在0.20左右[6],与本研究的遗传力估计值较为接近。有研究表明,BCS遗传力估计值在0.04左右[7],低于本研究结果,可能是本文杜洛克猪表型选择较为集中,数据离散度较小所致。
3.2 不同时间跨度下EBV估计准确性和秩相关
在固定方差组分时,EBV估计的准确性整体上高于不固定方差组分时的准确性,可见利用群体全部数据,或在数据量较大时,估计的群体遗传参数更准确,且更加符合群体遗传变异的情况;随着时间跨度的增大和数据量的提升,EBV估计准确性逐渐提升;秩相关排名显示,不同时间跨度下,本研究涉及的几个中高遗传力性状验证群体的EBV秩相关较为接近,均在0.95以上,满足应用需求。相关研究显示,在随机去除部分个体情况下,方差组分变化较小,对选种准确性影响较小[8],这与本研究结果相似。利用部分数据,EBV估计准确性能够达到70%以上[9-10]。在考虑计算速度便捷性时,可适当缩小育种值估计表型取值范围。
3.3 结论
本研究以校正达115 kg体重日龄、校正30~115 kg体重日增重、校正达115 kg体重背膘厚、校正达115 kg眼肌面积和终测体型评分等为研究对象,除体型评分外,这些性状均为中等偏高遗传力性状。结果显示,在进行常规遗传评估时,利用群体全部数据计算所得的方差组分优于分阶段方差组分估计值;随着时间跨度的增大,EBV准确性逐渐提高。
-
表 1 杜洛克猪各生长性状表型基本统计量
Table 1 Basic statistics of selected productive traits of Duroc pigs
性状 数据量/条 平均数±标准差 最大值 最小值 偏度 峰度 AGE/d 17 592 179.76±14.22 244.44 132.01 0.28 0.01 ADG/g 17 269 863.44±118.17 1 566.24 541.54 0.56 0.61 BF/mm 17 591 12.55±2.85 43.54 5.72 0.67 1.74 LEA/cm2 17 591 40.46±4.22 60.61 5.22 0.11 0.59 BCS/分 17 592 8.22±0.56 10.00 6.00 -1.01 1.13 表 2 杜洛克猪各生长性状方差组分估计值
Table 2 Variance components and heritability of selected productive traits of Duroc pigs
性状 加性方差 窝效应方差 残差方差 表型方差 遗传力 AGE 31.923 28.776 84.042 144.741 0.22 ADG 1 511.075 1 757.593 6 161.660 9 430.328 0.16 BF 1.857 0.631 2.384 4.872 0.38 LEA 4.696 2.605 8.476 15.777 0.30 BCS 0.015 0.023 0.121 0.159 0.09 表 3 固定方差组分、不同时间跨度数据EBV的准确性和秩相关1)
Table 3 The accuracy and spearman correlation of EBV of different time span data in the case of fixed variance components
性状 2年 3年 4年 5年 全部数据 r2 S2 r3 S3 r4 S4 r5 S5 rall Sall AGE 0.62±0.02 0.970 0.63±0.02 0.987 0.63±0.02 0.992 0.64±0.02 0.996 0.64±0.02 1.000 ADG 0.56±0.03 0.948 0.57±0.03 0.973 0.57±0.03 0.981 0.58±0.03 0.992 0.59±0.03 1.000 BF 0.72±0.01 0.966 0.72±0.01 0.990 0.73±0.01 9.997 0.73±0.01 1.000 0.73±0.01 1.000 LEA 0.67±0.02 0.969 0.68±0.02 0.987 0.68±0.02 0.995 0.68±0.02 0.997 0.69±0.02 1.000 BCS 0.49±0.03 0.960 0.51±0.03 0.968 0.51±0.03 0.981 0.52±0.03 0.988 0.53±0.03 1.000 1)ri和Si表示i年参考群EBV的准确性和秩相关,i分别为2年(2017—2018年)、3年(2016—2018年)、4年(2015—2018年)、5年(2014—2018年)和全部数据(2012—2018年); ri为平均值±标准误 表 4 不固定方差组分下不同时间跨度数据EBV的准确性和秩相关1)
Table 4 The accuracy and spearman correlation of EBV of different time span data in the case of unfixed variance components
性状 2年 3年 4年 5年 all r2 S2 r3 S3 r4 S4 r5 S5 rall Sall AGE 0.65±0.02 0.968 0.64±0.02 0.986 0.64±0.02 0.991 0.64±0.02 0.995 0.64±0.02 1.000 ADG 0.51±0.04 0.944 0.52±0.04 0.968 0.51±0.04 0.974 0.53±0.04 0.986 0.59±0.03 1.000 BF 0.61±0.02 0.930 0.68±0.02 0.981 0.70±0.02 0.995 0.73±0.01 1.000 0.73±0.01 1.000 LEA 0.67±0.02 0.968 0.66±0.02 0.985 0.66±0.02 0.993 0.67±0.02 0.996 0.69±0.02 1.000 BCS 0.42±0.04 0.952 0.43±0.04 0.958 0.42±0.04 0.965 0.49±0.04 0.983 0.53±0.03 1.000 1)ri和Si表示i年参考群EBV的准确性和秩相关,i分别为2年(2017—2018年)、3年(2016—2018年)、4年(2015—2018年)、5年(2014—2018年)和全部数据(2012—2018年);ri为平均值±标准误 -
[1] 张勤, 丁向东, 陈瑶生.种猪遗传评估技术研发与评估系统应用[J].中国畜牧杂志, 2015, 51(8):61-65. http://d.old.wanfangdata.com.cn/Periodical/zgxmzz201508012 [2] 叶健, 胡晓湘, 边成, 等.大白猪主要生长性状的遗传参数估计及育种中存在问题的探讨[J].华南农业大学学报, 2017, 38(1):1-4. http://xuebao.scau.edu.cn/zr/hnny_zr/ch/reader/view_abstract.aspx?flag=1&file_no=201701003&journal_id=hnny_zr [3] DARFOUR-ODURO K A, NAAZIE A, AHUNU B K, et al. Genetic parameter estimates of growth traits of indigenous pigs in Northern Ghana[J]. Livest Sci, 2009, 125(2):187-191. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=3e9725de17be2475ee161721841368d7
[4] MADSEN P, SØRENSEN P, SU G, et al. DMU: A package for analyzing multivariate mixed models[C]//8th World Congress on Genetics Applied to Livestock Production. Belo Horizonte, MG, Brazil, 2006.
[5] HIDALGO A M, BASTIAANSEN J W, LOPES M S, et al. Accuracy of genomic prediction using deregressed breeding values estimated from purebred and crossbred offspring phenotypes in pigs[J]. J Anim Sci, 2015, 93(7):3313-3321. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=41818c29d452ccf2cb27e3bb50f1c63e
[6] CHEN C Y, KACHMAN S D, JOHNSON R K, et al. Estimation of genetic parameters for average daily gain using models with competition effects[J]. J Anim Sci, 2008, 86(10):2525-2530. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=6821014a80ac73c60780eda19d5aa42b
[7] 叶健, 胡晓湘, 屈胜丽, 等.体型评分性状的遗传分析及其在选种中的利用[J].中国畜牧杂志, 2017, 53(2):36-39. http://d.old.wanfangdata.com.cn/Periodical/zgxmzz201702008 [8] GAO H, NIELSEN B, SU G, et al. Use of Repeated Group measurements with drop out animals for variance component estimation and genetic evaluation:A simulation study[J]. G3:Genes, Genomes, Genetics, 2019, 9(9):2935-2940. http://cn.bing.com/academic/profile?id=7494aa9b8b64cb8f2c43cf5614403fc3&encoded=0&v=paper_preview&mkt=zh-cn
[9] BISCARINI F, BOVENHUIS H, van ARENDONK J A. Estimation of variance components and prediction of breeding values using pooled data[J]. J Anim Sci, 2008, 86(11):2845-2852. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=95c93b3f491791aeaa47ecc40ffae15e
[10] SU G, MADSEN P, NIELSEN B, et al. Estimation of variance components and prediction of breeding values based on group records from varying group sizes[J]. Genet Sel Evol, 2018, 50(42). doi: 10.1186/s12711-018-0413-y.
计量
- 文章访问数: 670
- HTML全文浏览量: 14
- PDF下载量: 1102