用微信扫码二维码

分享至好友和朋友圈

WE ARE COMMITTED TO REPORTING THE LATEST FORESTRY ACADEMIC ACHIEVEMENTS

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

林木子代试验中小区平均值法与转化分析法比较

叶金俊 叶金水 包小梅 黄琳 毛海淋

叶金俊, 叶金水, 包小梅, 等. 林木子代试验中小区平均值法与转化分析法比较[J]. 四川林业科技, 2022, 43(5): 107−114 doi: 10.12172/202109240003
引用本文: 叶金俊, 叶金水, 包小梅, 等. 林木子代试验中小区平均值法与转化分析法比较[J]. 四川林业科技, 2022, 43(5): 107−114 doi: 10.12172/202109240003
YE J J, YE J S, BAO X M, et al. Comparative analysis about plot average method and transformation analysis method in forest progeny tests[J]. Journal of Sichuan Forestry Science and Technology, 2022, 43(5): 107−114 doi: 10.12172/202109240003
Citation: YE J J, YE J S, BAO X M, et al. Comparative analysis about plot average method and transformation analysis method in forest progeny tests[J]. Journal of Sichuan Forestry Science and Technology, 2022, 43(5): 107−114 doi: 10.12172/202109240003

林木子代试验中小区平均值法与转化分析法比较


doi: 10.12172/202109240003
详细信息
    作者简介:

    叶金俊(1975—),男,工程师,本科,kfgsyjj@126.com

    通讯作者: kfgsyjj@126.com
  • 基金项目:  浙江省林业发展和资源保护专项资金

Comparative Analysis about Plot Average Method and Transformation Analysis Method in Forest Progeny Tests

More Information
    Corresponding author: kfgsyjj@126.com
  • 摘要: 为了评价林木非平衡试验资料小区平均值法的分析效果,运用蒙特卡罗(Monte Carlo)模拟数据,以转化分析法为参照对象,比较评价了小区平均值法的优缺点,为筛选的统计方法提供科学依据。基于工作量和普遍性考虑,采用了5个试验,单因素随机区组设计,先以单株观察值参与统计分析,获得转化分析法的结果;然后以小区平均值参与计算,获得小区平均值法的分析结果。在此基础上,评价非平衡试验资料小区平均值法的统计效果。比较分析发现:(1)对于非平衡试验数据,转化分析法具有严密的科学性和优越性,小区平均值法仅适合于无性系试验;(2)小区平均值法无法获得单株遗传变异性信息,故统计效率较低;(3)5个试验的蒙特卡罗模拟数据,小区平均值法,其区组重复因子出现负的方差分量概率,随着区组重复数的减少而增加,试验Ⅳ中区组因子有3%的试验出现负方差分量,试验Ⅴ中区组因子有6%的试验出现负方差分量,而转化分析法则消灭了负的方差分量;(4)小区平均值法偏性和误差均大于转化分析法;(5)小区平均值法的家系遗传力比转化分析法的小,且试验分析的精确性比转化分析法低,这不利于逆向选择和前向选择;(6)在固定模型条件下,小区平均值法关于家系效应的平均值有一定的误差,许多家系的秩与转化分析法的结果不一致,选择的失误概率为1/8~2/8。综合以上结果得出:尽管小区平均值法具有计算量小的优势,但因其缺点太多,建议在林木遗传育种领域中,优先采用转化分析法。
  • 表  1  单因素随机区组不平衡数据转化分析法的期望均方结构

    Tab.  1  Expected mean square structure of single factor random block non-equilibrium data in transformation analysis method

    变因 Source of variation自由度 Freedom均方 Mean square期望均方结构 Expected mean square structure
     重复间 Between repetition$\displaystyle\sum\limits_j {(1)} -1$MSbσe2+k1σf2+k2σb2
     半同胞家系间 Between half-sib families$\displaystyle\sum\limits_i {(1) - 1}$MSfσe2+k3σf2+k4σb2
     株间变异 Between plants${\rm{N}}..+1- \displaystyle\sum\limits_j {(1)} - \displaystyle\sum\limits_i {(1)}$MSeσe2+k5σf2+k6σb2
     总变异 Total variationN..--1
    下载: 导出CSV

    表  2  半同胞试验小区平均值法的期望方差结构

    Tab.  2  Expected variance structure of plot average method in half-sib experimental plot

    变因
    Source of variation
    自由度
    Freedom
    平方和
    Sum of squares
    均方
    Mean square
    期望均方结构
    Expected mean square structure
     区组 Between blocks(b-1)SSbMSbVe+ f σb2
     半同胞家系 Between half-sib families(f-1)SSfMSfVe+ b σf2
     机误 Probable error(f-1)(b-1)SSeMSeVe
     总变异 Total variationf.b-1SST
    下载: 导出CSV

    表  3  五个模拟试验中两种方法获得参试因子负方差分量的频率(%)

    Tab.  3  frequencis of negative variance component of the test factors obtained by two methods in five simulated experiments

    试验类型 Experiment Type因子方差分量 Variance componentσf2σb2σe2 / Ve
    试验I Experiment I转化分析法 Transformation analysis method0.000.000.00
    小区平均值法 Plot average method0.000.000.00
    试验Ⅱ Experiment II转化分析法 Transformation analysis method0.000.000.00
    小区平均值法 Plot average method0.000.000.00
    试验Ⅲ Experiment III转化分析法 Transformation analysis method0.000.000.00
    小区平均值法 Plot average method0.000.000.00
    试验Ⅵ Experiment IV转化分析法 Transformation analysis method0.000.000.00
    小区平均值法 Plot average method0.003.000.00
    试验Ⅴ Experiment V转化分析法 Transformation analysis method0.000.000.00
    小区平均值法 Plot average method0.006.000.00
    下载: 导出CSV

    表  4  试验Ⅱ转化分析法与小区平均值法分析结果的比较

    Tab.  4  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅱ

    试验
    Experiment
    类目
    Category
    误差方差 Ve
    Error variance
    区组方差 Vb
    Block variance
    家系方差 Vf
    Family variance
    5株小区转化为单株小区
    5-plant plot is transformed
    into one-plant plot
    真值 True value280/561520
    平均估计值 Average estimated value281.142414.774519.6009
    偏差 Deviation1.1424−0.2255−0.3391
    偏差的显著性 Deviation significance0.41%1.73%1.53%
    均方误差 Mean-squared error95.569884.652240.5086
    小区平均值法
    Plot average method
    平均估计值 Average estimated value69.801316.370615.6123
    偏差 Deviation13.80131.3706−4.3877
    偏差的显著性 Deviation significance19.77%**8.37%**28.1%**
    均方误差 Mean-squared error231.8221101.385245.6777
    下载: 导出CSV

    表  5  试验Ⅰ转化分析法与小区平均值法分析结果的比较

    Tab.  5  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅰ

    试验
    Experiment
    类目
    Category
    误差方差Ve
    Error variance
    区组方差Vb
    Block variance
    家系方差Vf
    Family variance
    4株小区转化为单株小区
    4-plant plot is transformed into one-plant plot
    真值 True value280/701520
    平均估计值 Average estimated value280.410814.926820.5873
    偏差 Deviation+0.4108−0.0732+0.5873
    偏差的显著性 Deviation significance0.15%0.49%2.85%
    均方误差 Mean-squared error94.309263.550238.6721
    小区平均值法
    Plot average method
    平均估计值 Average estimated value84.919314.950519.8776
    偏差 Deviation14.9193−0.0495−0.1224
    偏差的显著性 Deviation significance17.57%**0.33%0.62%
    均方误差 Mean-squared error328.517071.204040.8241
      附注:表中误差方差一栏280/70表示转化分析法和小区平均数值法的误差真值(下同)。
      Note: The number 280/70 in the error variance column indicates the true error value of transformation analysis method and average numerical value method (the same below).
    下载: 导出CSV

    表  6  试验Ⅲ转化分析法与小区平均值法分析结果的比较

    Tab.  6  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅲ

    试验
    Experiment
    类目
    Category
    误差方差Ve
    Error variance
    区组方差Vb
    Block variance
    家系方差Vf
    Family variance
    6株小区转化为单株小区
    6-plant plot is transformed into one-plant plot
    真值 True value280/46.66671520
    平均估计值 Average estimated value281.926214.288420.1442
    偏差 Deviation+1.9262−0.7116+0.1442
    偏差的显著性 Deviation significance0.68%4.98%0.72%
    均方误差 Mean-squared error79.422976.720739.8306
    小区平均值法
    Plot average method
    平均估计值 Average estimated value58.454215.159120.2591
    偏差 Deviation11.78750.15910.2591
    偏差的显著性 Deviation significance20.17%**1.05%1.28%
    均方误差 Mean-squared error166.651790.197442.7054
    下载: 导出CSV

    表  7  试验Ⅳ转化分析法与小区平均值法分析结果的比较

    Tab.  7  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅳ

    试验
    Experiment
    类目
    Category
    误差方差Ve
    Error variance
    区组方差Vb
    Block variance
    家系方差Vf
    Family variance
    8株小区转化为单株小区
    8-plant plot is transformed into one-plant plot
    真值 True value280/35.001520
    平均估计值 Average estimated value283.494714.685320.5721
    偏差 Deviation+3.4947−0.3147+0.5721
    偏差的显著性 Deviation significance1.23%2.14%2.78%
    均方误差 Mean-squared error102.910379.704532.1549
    小区平均值法
    Plot average method
    平均估计值 Average estimated value44.32789.049719.8998
    偏差 Deviation9.3278−5.9503−0.1002
    偏差的显著性 Deviation significance21.04%**65.75%**0.50%
    均方误差 Mean-squared error104.512072.513741.3727
    下载: 导出CSV

    表  8  试验Ⅴ转化分析法与小区平均值法分析结果的比较

    Tab.  8  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅴ

    试验
    Experiment
    类目
    Category
    误差方差Ve
    Error variance
    区组方差Vb
    Block variance
    家系方差Vf
    Family variance
    10株小区转化为单株小区
    10-plant plot is transformed into one-plant plot
    真值 True value280/281520
    平均估计值 Average estimated value283.2712.762920.242
    偏差 Deviation+3.27−2.2371+0.242
    偏差的显著性 Deviation significance1.15%17.53%**1.20%
    均方误差 Mean-squared error140.379473.483639.2938
    小区平均值法
    Plot average method
    平均估计值 Average estimated value33.55285.141420.6603
    偏差 Deviation5.5528−9.85860.6603
    偏差的显著性 Deviation significance16.55%**191.75%**3.20%
    均方误差 Mean-squared error50.1136119.760241.2234
    下载: 导出CSV

    表  9  转化分析法与小区平均值法遗传力的大小和精度比较

    Tab.  9  Comparison of heritability and accuracy between transformation analysis method and plot average method

    试验
    Experiment
    类目
    Category
    参数评估
    Parameter estimation
    家系遗传力
    Family heritability
    单株遗传力
    Heritability per plant
    (Mse/bn)^.5
    试验I
    Experiment I
    转化分析法TAM估计值Estimated value0.69680.25982.6477
    小区平均值法PAM估计值Estimated value0.68472.9086
    家系遗传力
    Family heritability
    相对误差的大小
    Relative error size
    −1.74%
    试验‖
    Experiment II
    转化分析法TAM估计值Estimated value0.68330.24732.6508
    小区平均值法PAM估计值Estimated value0.67482.9508
    家系遗传力
    Family heritability
    相对误差的大小
    Relative error size
    −1.24%
    试验Ⅲ
    Experiment III
    转化分析法TAM估计值Estimated value0.72490.25382.4235
    小区平均值法PAM估计值Estimated value0.67482.7004
    家系遗传力
    Family heritability
    相对误差的大小
    Relative error size
    −6.91%
    试验Ⅳ
    Experiment IV
    转化分析法TAM估计值Estimated value0.73330.25812.4303
    小区平均值法PAM估计值Estimated value0.71252.7151
    家系遗传力
    Family heritability
    相对误差的大小
    Relative error size
    −2.84%
    试验Ⅴ
    Experiment V
    转化分析法TAM估计值Estimated value0.69010.25722.6612
    小区平均值法PAM估计值Estimated value0.68762.8901
    家系遗传力
    Family heritability
    相对误差的大小
    Relative error size
    −0.36%
    下载: 导出CSV
  • [1] ABDERRAHMAXE Achouch,ZHU Jun. Simulation Studies for Comparing Genetics Models withAdditive- Dominance-Maternal Effectsand GE Interaction Effects[J]. 生物数学学报,2002,17(2):208−214. doi: 10.3969/j.issn.1001-9626.2002.02.011
    [2] DA Huber, TL White, GR Hodge. Variance components estimation techniques compared for two mating designs with forest genetic architecture though computer simulation[J]. Theor. Appl. Genet., 1994, 88: 236−242. doi: 10.1007/BF00225903
    [3] Barnes R D, Schweppenhauser M A. Genetic control of 15-year-old traits in <italic>pinus patula</italic> and a comparison of progeny test methods[J]. Silvae Genetica, 1979, 28(4): 156−167.
    [4] Huber D A. Efficiency of half –sib, half-diallel and circular mating designs in the estimation of genetic parameters in forestry: A simulation[J]. Forest Science, 1992, 38: 757−776.
    [5] Loo-Dinkins J A. Statistical efficiency of six progeny test field designs on three loblolly pine types[J]. Can. J. For. Res., 1987, 17: 1066−1070. doi: 10.1139/x87-163
    [6] Loo-Dinkins J A. Selection system efficiencies for computer simulated progeny test field designs in loblolly pine[J]. Theor. Appl. Genet., 1990, 79: 89−96. doi: 10.1007/BF00223792
    [7] 许自成,朱军. 三交和双交组合加性-显性-母体效应的遗传模型及蒙特卡罗模拟分析[J]. 作物学报,2000,26(1):40−46. doi: 10.3321/j.issn:0496-3490.2000.01.011
    [8] 许自成,吕德彬,朱军. 三交组合ADAA模型和种子模型的Monte Carlo模拟分析[J]. 河南农业大学学报,2003,37(4):311−316. doi: 10.3969/j.issn.1000-2340.2003.04.001
    [9] 许自成,丁永乐,朱军. 双交组合种子性状的遗传模型及蒙特卡罗模拟分析[J]. 生物数学学报,2005,20(3):339−344. doi: 10.3969/j.issn.1001-9626.2005.03.013
    [10] 张勤. 著. 动物遗传育种中的计算方法[M]. 北京: 科学出版社, 2007, P125−138
    [11] 张勤,张沅,刘增廷等. 方差组分估计方法MIVQUE和REML的模拟比较[J]. 遗传学报,1995,22(6):424−430.
    [12] 童继平,韩正姝. 蒙特卡罗方法与计算机模拟[J]. 计算机与农业,2000(7):17−21.
    [13] 齐明. 编著. 林木遗传育种中试验统计法新进展[M]. 北京: 中国林业出版社, 2009, P24−31;P147−165
    [14] 齐明, 何贵平. 著. 林木遗传育种中平衡不平衡、规则不规则试验数据处理技巧[M]. 北京: 中国林业出版社, 2014, P32−44
    [15] 齐明,何贵平. 运用Monte Carlo模拟方法评价林木转化分析法[J]. 生物数学学报,2016,31(2):263−271.
    [16] 谭小梅. 马尾松二代育种群体亲本选择及种子园交配系统研究[D]. 北京: 中国林业科学研究院博士论文, 2011
    [17] 孟景祥. 高海拔生境下高山松 油松 云南松及杂种苗期适应性研究[D]. 北京: 北京林业大学博士论文, 2018
    [18] 郑勇平,孙鸿友,董汝湘. 杉木不同世代不同类型种子园遗传改良增益研究[J]. 林业科学,2007,43(3):20−27. doi: 10.3321/j.issn:1001-7488.2007.03.004
    [19] 邓薇 编著. MATLAB函数全能速查宝典[M]. 北京: 人民邮电出版社, 2012
    [20] 王建卫, 曲中水, 凌滨. 编著. MATLAB7. X程序设计[M]. 北京: 中国水利水电出版社, 2007
    [21] William H. Swallow, John F. Monahan. Monte Carlo Comparison of ANOVA, MIVQUE, REML, and ML Estimators ofVariance Components[J]. Technometrics, 1984, 26(1): 47−57. doi: 10.1080/00401706.1984.10487921
  • [1] 刘兴良, 李旭华, 刘杉, 李伟, 蔡蕾, 张利, 潘红丽, 冯秋红, 徐峥静茹, 李慧超, 刘千里, 胡宗达.  人为干扰对中国次生林的影响:I. 林木生长、更新与群落结构 . 四川林业科技, 2022, 43(3): 1-12. doi: 10.12172/202202240002
    [2] 陈艳华, 丛郁锬, 杜官本, 董春雷, 雷洪, 万辉.  正交胶合木生产工艺研究进展 . 四川林业科技, 2022, 43(4): 141-148. doi: 10.12172/202110120005
    [3] 柳海兵, 陈斌.  基于正交设计的红楠轻基质选择研究 . 四川林业科技, 2022, 43(1): 87-91. doi: 10.12172/202104170001
    [4] 谢孔平, 杨适, 毛冀, 鲁松.  峨眉金线莲ISSR反应体系的建立与优化 . 四川林业科技, 2022, 43(4): 76-82. doi: 10.12172/202110110001
    [5] 王翠兰, 肖银波, 杨双昱, 周大松, 王新, 陈俊华.  剑阁县野生林木种质资源分布特征及保护利用 . 四川林业科技, 2021, 42(6): 82-85. doi: 10.12172/202108110002
    [6] 陈德朝, 达郎周, 鄢武先, 邓东周, 贺丽, 吴世磊, 余凌帆, 杨靖宇, 王嘉智, 张利.  基于AHP分析法的川西北高寒沙地适生治沙灌木筛选评价研究 . 四川林业科技, 2021, 42(1): 65-69. doi: 10.12172/201905210001
    [7] 孙曾丽, 徐玉成, 薄育新, 李金武.  ‘邳县2号’银杏硬枝扦插育苗技术研究 . 四川林业科技, 2021, 42(5): 128-132. doi: 10.12172/202107100003
    [8] 康英, 朱欣伟, 张利, 李旭华, 何建社, 刘千里, 李登峰, 冯秋红, 杨晓梅.  基于隶属函数法和灰色关联度分析的岷江上游干旱河谷11种经济树种适应性综合评价 . 四川林业科技, 2020, 41(5): 13-18. doi: 10.12172/202007090001
    [9] 朱鸿超, 龙文聪, 陈永兰, 杨瑶君, 于嘉欣.  慈竹纤维添加对福寿螺生长速率的影响 . 四川林业科技, 2020, 41(3): 132-136. doi: 10.12172/201912260007
    [10] 李明丹, 王阿晴, 汤祖翔, 吴闰生, 周婧涵, 王伟, 刘华.  非生长季糖槭树干液流特征及影响因子分析 . 四川林业科技, 2018, 39(3): 24-28,43. doi: 10.16779/j.cnki.1003-5508.2018.03.005
    [11] 魏鹏, 贾晨, 周永丽, 辜云杰, 罗建勋.  鹅掌楸天然林木材物理力学及垂直变异特性研究 . 四川林业科技, 2018, 39(1): 27-31. doi: 10.16779/j.cnki.1003-5508.2018.01.006
    [12] 杨磊, 徐伟恒, 孔雷, 赵晓峰, 吴瑞旭.  林木直径测量方法现状与展望 . 四川林业科技, 2018, 39(2): 65-70. doi: 10.16779/j.cnki.1003-5508.2018.02.016
    [13] 周先明, 徐春, 杨汉波, 陈炙, 郭洪英, 黄振, 王泽亮.  主成分分析法在四川桤木优树选择中的应用 . 四川林业科技, 2018, 39(3): 98-102. doi: 10.16779/j.cnki.1003-5508.2018.03.020
    [14] 罗艳, 李裕冬, 姚民, 罗晓波, 王琼瑶.  重金属镉(Cd)胁迫下4种林木幼苗生长初期的生理生化响应 . 四川林业科技, 2018, 39(5): 87-92. doi: 10.16779/j.cnki.1003-5508.2018.05.020
    [15] 齐昊, 权丽, 王永元, 黄旭东, 张小磊, 孙学刚.  白龙江、洮河林区林木种质资源信息共享平台设计与实现 . 四川林业科技, 2018, 39(3): 70-76,82. doi: 10.16779/j.cnki.1003-5508.2018.03.015
    [16] 罗艳, 李裕冬, 罗晓波, 王琼瑶, 姚民.  重金属镉对4种林木种子萌发及幼苗生长的影响 . 四川林业科技, 2018, 39(2): 7-12. doi: 10.16779/j.cnki.1003-5508.2018.02.002
    [17] 廖维华, 刘杰, 石晓东, 彭建国, 柏子奎.  林木高空压条生根率影响因素分析 . 四川林业科技, 2018, 39(2): 103-107. doi: 10.16779/j.cnki.1003-5508.2018.02.023
    [18] 吴开志, 吴春艳, 龚毅红, 冯德宾, 段琼, 秦小舒.  四川省林木良种基地现状及发展对策 . 四川林业科技, 2017, 38(3): 65-68. doi: 10.16779/j.cnki.1003-5508.2017.03.013
    [19] 贾玉珍, 张鑫, 周建华.  基于主成分分析法的蜀柏毒蛾灾害发生影响因子筛选研究 . 四川林业科技, 2017, 38(5): 58-62. doi: 10.16779/j.cnki.1003-5508.2017.05.014
    [20] 付卓锐, 陈思多, 黄伊嘉, 吴斌, 莫开林.  3种用材林木对Pb耐受性和吸附性研究 . 四川林业科技, 2016, 37(1): 51-55. doi: 10.16779/j.cnki.1003-5508.2016.01.010
  • 加载中
  • 计量
    • 文章访问数:  207
    • HTML全文浏览量:  65
    • PDF下载量:  36
    • 被引次数: 0
    出版历程
    • 收稿日期:  2021-09-24
    • 网络出版日期:  2022-07-14
    • 刊出日期:  2022-10-26

    林木子代试验中小区平均值法与转化分析法比较

    doi: 10.12172/202109240003
      作者简介:

      叶金俊(1975—),男,工程师,本科,kfgsyjj@126.com

      通讯作者: kfgsyjj@126.com
    基金项目:  浙江省林业发展和资源保护专项资金

    摘要: 为了评价林木非平衡试验资料小区平均值法的分析效果,运用蒙特卡罗(Monte Carlo)模拟数据,以转化分析法为参照对象,比较评价了小区平均值法的优缺点,为筛选的统计方法提供科学依据。基于工作量和普遍性考虑,采用了5个试验,单因素随机区组设计,先以单株观察值参与统计分析,获得转化分析法的结果;然后以小区平均值参与计算,获得小区平均值法的分析结果。在此基础上,评价非平衡试验资料小区平均值法的统计效果。比较分析发现:(1)对于非平衡试验数据,转化分析法具有严密的科学性和优越性,小区平均值法仅适合于无性系试验;(2)小区平均值法无法获得单株遗传变异性信息,故统计效率较低;(3)5个试验的蒙特卡罗模拟数据,小区平均值法,其区组重复因子出现负的方差分量概率,随着区组重复数的减少而增加,试验Ⅳ中区组因子有3%的试验出现负方差分量,试验Ⅴ中区组因子有6%的试验出现负方差分量,而转化分析法则消灭了负的方差分量;(4)小区平均值法偏性和误差均大于转化分析法;(5)小区平均值法的家系遗传力比转化分析法的小,且试验分析的精确性比转化分析法低,这不利于逆向选择和前向选择;(6)在固定模型条件下,小区平均值法关于家系效应的平均值有一定的误差,许多家系的秩与转化分析法的结果不一致,选择的失误概率为1/8~2/8。综合以上结果得出:尽管小区平均值法具有计算量小的优势,但因其缺点太多,建议在林木遗传育种领域中,优先采用转化分析法。

    English Abstract

    • 单株观察值法常用于处理林木统计学研究试验数据,不少学者[1-6]应用Monte Carlo(蒙特卡罗)模拟法,在试验数据不平衡或严重不平衡时,比较验证不同分析方法间的分析效果、优点和不足之处,分析其与方差分量估计法的优劣[1-2,7-9,10-12]

      林木田间试验由于外在环境及植物间竞争等因素,导致部分试验植株死亡,最终得到的是非平衡试验资料。按照传统的现代线性模型理论、方差分析等来处理这些非平衡的试验数据,常常获得负的方差分量,不能给出数学解释,同时也没有生物学意义,说明试验数据的分析方法可能有问题。2009年,齐明对林木正交试验设计的非平衡数据处理,提出了一个转化理论[13],2014年,齐明采用计算机模拟,论证了转化分析法的统计学基础,并得出就同一非平衡数据,转化分析法无论是在随机模型,还是在固定模型上均优于Henderson方法I的结论[14,15]。但小区平均值法处理林木田间试验数据的现象仍然随处可见,并且数据量越大(如多地点多年度的试验数据),采用小区平均值法的频度就越高。知网文献检索结果显示:至2021年2月采用小区平均值法来处理林木田间试验的非平衡数据的文献多达8943条。 林木遗传育种中,无性系材料的田间试验资料,可采用小区平均值法进行数据处理;林木遗传育种的正交田间试验数据,由于平衡不平衡(缺株)、规则不规则(缺区),宜以单株值进行转化分析法统计分析[13-14]。为系统地评估小区平均值法在处理林木子代试验非平衡数据中的优缺点,借助Monte Carlo模拟法,产生非平衡试验数据,以转化分析法分析结果为参照对象,评估了林木试验中小区平均值法的统计效率,分析精确性、参数大小和精度,比较研究了这两种方法在随机模型和固定模型条件下的分析后果: (1)着重评估数据处理方法能否达到田间试验的目的;(2)其统计分析的效率如何;(3)其统计分析的精确性如何。为选用正确而合适的统计分析方法和促进林木数量遗传学发蔚县提供科学依据。

      • 从研究的普遍性、计算工作量的大小等方面考虑,采用单因素随机区组(RCB)设计。林木子代测定的田间试验中,小区的设计一般为4~6株小区、也有8或10株小区。以下五个试验,采用Monte Carlo法模拟。为体现研究性状内在的遗传变异幅度,采用了40个半同胞家系,每个试验分别产生100套数据:

        (Ⅰ)40个半同胞家系,10个区组,4株小区参试;

        (Ⅱ)40个半同胞家系,8个区组,5株小区参试;

        (Ⅲ)40个半同胞家系,8个区组,6株小区参试;

        (Ⅳ)40个半同胞家系,6个区组,8株小区参试;

        (Ⅴ)40个半同胞家系,4个区组,10株小区参试。

      • 按照林木遗传育种的经验,假设半同胞家系间、区组重复、小区株间因子服从正态分布,指定株间变异的方差Ve、区组重复因子的方差Vb、半同胞家系的方差Vf分别为280、15 、20。

        按原试验设计模式(即Henderson方法I)来模拟试验数据:处理与区组重复间的交互作用因子不遵循正态分布,绘散点图表明(FB)ij遵从二项分布,因此按二项分布产生其效应值。群体平均值为60。采用Matlab7.X语言[19,20]编写程序,以获取RCB设计的试验平衡资料。每个试验一次模拟共100套数据,保存至EXCEL文件。

      • 由于气候环境、造林技术和株间竞争等多方面因素对造林存活率有所影响,多年来林木测定调查结果为造林存活率多数在75%~95%,多片10多年生杉木试验林的平均保存率在83%。假设随机死亡的保存率为83%,通过MATLAB语言中设计的删除语句随机删除,获取非平衡试验数据。

      • 由于是正交试验,故每套资料先将多株小区转化为单株小区[13],采用转化分析法建立如下线性模型:

        $$ Y_{ijk }= u +F_{i }+ B_{j }+ E_{ijk } $$

        其中: i = 1→40; j =1→40~48;k=1或0。u是群体平均效应;Fi是第i个家系的效应值;Bj是第j个区组重复的效应值; Eijk 是株间变异;Yijk 是第i个家系在第j个区组重复中第k个观察值。

        在随机模型条件下,各参试因子都是随机因子。于是:

        $$ F_{i} \sim N(0,σ_{f}^{2 } );B_{j} \sim N(0,σ_{b}^{2 } );E_{ijk} \sim N(0,σ_{e}^{2 } ) $$

        方差分析原理参见有关文献[13] 。期望均方结构见表1

        表 1  单因素随机区组不平衡数据转化分析法的期望均方结构

        Table 1.  Expected mean square structure of single factor random block non-equilibrium data in transformation analysis method

        变因 Source of variation自由度 Freedom均方 Mean square期望均方结构 Expected mean square structure
         重复间 Between repetition$\displaystyle\sum\limits_j {(1)} -1$MSbσe2+k1σf2+k2σb2
         半同胞家系间 Between half-sib families$\displaystyle\sum\limits_i {(1) - 1}$MSfσe2+k3σf2+k4σb2
         株间变异 Between plants${\rm{N}}..+1- \displaystyle\sum\limits_j {(1)} - \displaystyle\sum\limits_i {(1)}$MSeσe2+k5σf2+k6σb2
         总变异 Total variationN..--1

        表中的期望均方的调节系数k计算、非平衡数据的处理和参数估计见参考文献[13,14]

      • 使用Matlab7.X语言,编写以获得以小区平均值为单位,参与统计分析非平衡数据的程序。林木半同胞子代试验,以小区平均值进行统计分析时的线性模型为:

        $$ Yij= u+ f_{i } + b_{j } + εij i=1→35\text{,}j=1→10 $$

        以小区平均值参与计算时,原试验变成了两因素无重复的方差分析模型,其期望均方结构如下表2

        表 2  半同胞试验小区平均值法的期望方差结构

        Table 2.  Expected variance structure of plot average method in half-sib experimental plot

        变因
        Source of variation
        自由度
        Freedom
        平方和
        Sum of squares
        均方
        Mean square
        期望均方结构
        Expected mean square structure
         区组 Between blocks(b-1)SSbMSbVe+ f σb2
         半同胞家系 Between half-sib families(f-1)SSfMSfVe+ b σf2
         机误 Probable error(f-1)(b-1)SSeMSeVe
         总变异 Total variationf.b-1SST

        根据表2中的结果,估算随机模型条件下,因子方差分量和家系遗传力;然后分析固定模型条件下,家系效应值的大小和秩的次序,以转化分析法的结果为参照物来分析小区平均值法的家系效应值产生的误差及选择产生的失误率大小。

        在此模型中,半同胞家系遗传力为:hf2f2/[σf2 +(1/b)Ve]

          由于缺乏株间变异性信息,无法计算单株遗传力,许多文献采用如下公式:

        $$ hi^{2} =4σ_{f}^{2} /\left[σ_{f}^{2} +σ_{b}^{2} + Ve \right] $$

        上述公式中Ve为小区间的误差,故该计算公式结果有误。

      • 转化分析法:根据参试因子的调节系数和参试因子的方差分量,计算半同胞家系遗传力 Hf2 和家系内单株遗传力hi2;小区平均值法:根据平衡模型,估计方差分量和家系遗传力。

        根据100次Monte Carlo模拟结果,计算出若干参数的估计值,参数的偏差(偏差=估计值-参数真值)、偏差的显著性检验[1-2,7-9]。如果偏差的绝对值被其估计值除得的商,大于5%,可认为该参数有偏(Graybill & wortham,1956)。均方误差为MSE=Var(估计值)+偏差2。在相同参数情况下,均方误差越小,估计效益和精度越高[2,3-6,7-9,21]

        所有计算分析均在MATLAB7.0[19-20]和Excel 2003平台上完成。

      • (1)五个模拟试验中两种方法获得参试因子负方差分量的频率

        五个试验的非平衡试验数据,林木转化分析法和小区平均值法的分析结果列于表3.

        表 3  五个模拟试验中两种方法获得参试因子负方差分量的频率(%)

        Table 3.  frequencis of negative variance component of the test factors obtained by two methods in five simulated experiments

        试验类型 Experiment Type因子方差分量 Variance componentσf2σb2σe2 / Ve
        试验I Experiment I转化分析法 Transformation analysis method0.000.000.00
        小区平均值法 Plot average method0.000.000.00
        试验Ⅱ Experiment II转化分析法 Transformation analysis method0.000.000.00
        小区平均值法 Plot average method0.000.000.00
        试验Ⅲ Experiment III转化分析法 Transformation analysis method0.000.000.00
        小区平均值法 Plot average method0.000.000.00
        试验Ⅵ Experiment IV转化分析法 Transformation analysis method0.000.000.00
        小区平均值法 Plot average method0.003.000.00
        试验Ⅴ Experiment V转化分析法 Transformation analysis method0.000.000.00
        小区平均值法 Plot average method0.006.000.00

        表3可见, 五个试验的非平衡试验数据,林木转化分析法均未获得负的方差分量;而小区平均值法中,试验Ⅵ、Ⅴ中,区组因子分别有3%、6%的试验有负的方差分量。结果支持了转化分析法中参试因子是随机正态因子的观点。只有满足方差分析的正态性前提条件,才不会有负的方差分量[13,15],同时表明转化分析法构建的线性模型是科学的、转化分析法优越于小区平均值法。

        (2)几个参数效益的比较

        在随机死亡的前提下,采用MATLAB语言的删除指令,将平衡的试验数据转变成不平衡的试验数据。用转化分析法来处理试验资料,计算小区平均值,再采用小区平均值法来分析试验数据,其结果列于表4~8

        表 4  试验Ⅱ转化分析法与小区平均值法分析结果的比较

        Table 4.  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅱ

        试验
        Experiment
        类目
        Category
        误差方差 Ve
        Error variance
        区组方差 Vb
        Block variance
        家系方差 Vf
        Family variance
        5株小区转化为单株小区
        5-plant plot is transformed
        into one-plant plot
        真值 True value280/561520
        平均估计值 Average estimated value281.142414.774519.6009
        偏差 Deviation1.1424−0.2255−0.3391
        偏差的显著性 Deviation significance0.41%1.73%1.53%
        均方误差 Mean-squared error95.569884.652240.5086
        小区平均值法
        Plot average method
        平均估计值 Average estimated value69.801316.370615.6123
        偏差 Deviation13.80131.3706−4.3877
        偏差的显著性 Deviation significance19.77%**8.37%**28.1%**
        均方误差 Mean-squared error231.8221101.385245.6777

        表 5  试验Ⅰ转化分析法与小区平均值法分析结果的比较

        Table 5.  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅰ

        试验
        Experiment
        类目
        Category
        误差方差Ve
        Error variance
        区组方差Vb
        Block variance
        家系方差Vf
        Family variance
        4株小区转化为单株小区
        4-plant plot is transformed into one-plant plot
        真值 True value280/701520
        平均估计值 Average estimated value280.410814.926820.5873
        偏差 Deviation+0.4108−0.0732+0.5873
        偏差的显著性 Deviation significance0.15%0.49%2.85%
        均方误差 Mean-squared error94.309263.550238.6721
        小区平均值法
        Plot average method
        平均估计值 Average estimated value84.919314.950519.8776
        偏差 Deviation14.9193−0.0495−0.1224
        偏差的显著性 Deviation significance17.57%**0.33%0.62%
        均方误差 Mean-squared error328.517071.204040.8241
          附注:表中误差方差一栏280/70表示转化分析法和小区平均数值法的误差真值(下同)。
          Note: The number 280/70 in the error variance column indicates the true error value of transformation analysis method and average numerical value method (the same below).

        表 6  试验Ⅲ转化分析法与小区平均值法分析结果的比较

        Table 6.  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅲ

        试验
        Experiment
        类目
        Category
        误差方差Ve
        Error variance
        区组方差Vb
        Block variance
        家系方差Vf
        Family variance
        6株小区转化为单株小区
        6-plant plot is transformed into one-plant plot
        真值 True value280/46.66671520
        平均估计值 Average estimated value281.926214.288420.1442
        偏差 Deviation+1.9262−0.7116+0.1442
        偏差的显著性 Deviation significance0.68%4.98%0.72%
        均方误差 Mean-squared error79.422976.720739.8306
        小区平均值法
        Plot average method
        平均估计值 Average estimated value58.454215.159120.2591
        偏差 Deviation11.78750.15910.2591
        偏差的显著性 Deviation significance20.17%**1.05%1.28%
        均方误差 Mean-squared error166.651790.197442.7054

        表 7  试验Ⅳ转化分析法与小区平均值法分析结果的比较

        Table 7.  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅳ

        试验
        Experiment
        类目
        Category
        误差方差Ve
        Error variance
        区组方差Vb
        Block variance
        家系方差Vf
        Family variance
        8株小区转化为单株小区
        8-plant plot is transformed into one-plant plot
        真值 True value280/35.001520
        平均估计值 Average estimated value283.494714.685320.5721
        偏差 Deviation+3.4947−0.3147+0.5721
        偏差的显著性 Deviation significance1.23%2.14%2.78%
        均方误差 Mean-squared error102.910379.704532.1549
        小区平均值法
        Plot average method
        平均估计值 Average estimated value44.32789.049719.8998
        偏差 Deviation9.3278−5.9503−0.1002
        偏差的显著性 Deviation significance21.04%**65.75%**0.50%
        均方误差 Mean-squared error104.512072.513741.3727

        表 8  试验Ⅴ转化分析法与小区平均值法分析结果的比较

        Table 8.  Comparison of analysis results between transformation analysis method and plot average method in experiment Ⅴ

        试验
        Experiment
        类目
        Category
        误差方差Ve
        Error variance
        区组方差Vb
        Block variance
        家系方差Vf
        Family variance
        10株小区转化为单株小区
        10-plant plot is transformed into one-plant plot
        真值 True value280/281520
        平均估计值 Average estimated value283.2712.762920.242
        偏差 Deviation+3.27−2.2371+0.242
        偏差的显著性 Deviation significance1.15%17.53%**1.20%
        均方误差 Mean-squared error140.379473.483639.2938
        小区平均值法
        Plot average method
        平均估计值 Average estimated value33.55285.141420.6603
        偏差 Deviation5.5528−9.85860.6603
        偏差的显著性 Deviation significance16.55%**191.75%**3.20%
        均方误差 Mean-squared error50.1136119.760241.2234

        试验‖转化分析法和小区平均值法的比较分析结果列于表4

        表4可见,转化分析法的参数偏差不显著,小区平均值法中,误差方差、家系方差和区组方差偏性显著,且其均方误差也比转化分析法的误差大。

        试验Ⅰ转化分析法和小区平均值法的比较分析结果列于表5

        试验Ⅲ中,转化分析法和小区平均值法的比较分析结果列于表6

        试验Ⅳ中,转化分析法与小区平均值法分析结果的比较列于表7

        试验Ⅴ中,转化分析法与小区平均值法分析结果的比较列于表8

        表5~8可见,转化分析法,各参数都存在一定的偏差,但均未达到显著水平,参试因子的方差分量估计值可认为无偏的。试验资料的小区平均值法,各参数也存在偏差,但只有表5~6中机误、表7中机误和区组、表8中机误和区组两因子的偏差达到显著水平,因此其估计值是有偏差的。进一步观察表5~8可见,参试因子的均方误差中小区平均值法都大于转化分析法,因此小区平均值法的参试因子方差分量的精度要比转化分析法小。

        采用蒙特卡罗模拟法产生的非平衡试验数据,按照转化分析法和小区平均值法进行分析,其结果(列于表4-8)的变化趋势完全一致:试验资料的转化分析法,各参数都存在一定的偏差,但在这些偏差中,只有个别试验中,区组的方差分量偏差达到显著水平;而小区平均值法,通常区组和误差因子的偏性分析结果均显著。家系方差Vf 的均方误两者比较接近,对于Ve和Vb,转化分析法的均方误通常显著小于小区平均值法的分析结果。

        比较表4-8中参数均方误差的相对大小,除家系遗传方差两者十分接近外,其它误差因子和区组因子的均方误差,转化分析法的结果均明显小于小区平均值法的均方误差,而均方误差的大小则表明该法参数估计效益的高低和分析结果精确性的高低,估计这种结果与区组数太少有关[2-6]

        (3)小区平均值法获得的遗传参数评估

        试验林在83%存活率的条件下,根据Ve、Vb、Vf的大小和调节系数的大小,可计算出理论上遗传力的大小。以此为参照物,对非平衡试验数据转化前后的实际遗传力进行评价,见表9

        表 9  转化分析法与小区平均值法遗传力的大小和精度比较

        Table 9.  Comparison of heritability and accuracy between transformation analysis method and plot average method

        试验
        Experiment
        类目
        Category
        参数评估
        Parameter estimation
        家系遗传力
        Family heritability
        单株遗传力
        Heritability per plant
        (Mse/bn)^.5
        试验I
        Experiment I
        转化分析法TAM估计值Estimated value0.69680.25982.6477
        小区平均值法PAM估计值Estimated value0.68472.9086
        家系遗传力
        Family heritability
        相对误差的大小
        Relative error size
        −1.74%
        试验‖
        Experiment II
        转化分析法TAM估计值Estimated value0.68330.24732.6508
        小区平均值法PAM估计值Estimated value0.67482.9508
        家系遗传力
        Family heritability
        相对误差的大小
        Relative error size
        −1.24%
        试验Ⅲ
        Experiment III
        转化分析法TAM估计值Estimated value0.72490.25382.4235
        小区平均值法PAM估计值Estimated value0.67482.7004
        家系遗传力
        Family heritability
        相对误差的大小
        Relative error size
        −6.91%
        试验Ⅳ
        Experiment IV
        转化分析法TAM估计值Estimated value0.73330.25812.4303
        小区平均值法PAM估计值Estimated value0.71252.7151
        家系遗传力
        Family heritability
        相对误差的大小
        Relative error size
        −2.84%
        试验Ⅴ
        Experiment V
        转化分析法TAM估计值Estimated value0.69010.25722.6612
        小区平均值法PAM估计值Estimated value0.68762.8901
        家系遗传力
        Family heritability
        相对误差的大小
        Relative error size
        −0.36%

        表9可见:(1)所有的试验,转化分析法的统计效率要比小区平均值法的的统计效率要高,利于逆向选择和前向选择;(2)转化分析法的分析精确性要高于小区平均值法,因为前者的(Mse/bn)^.5比后者要小;(3) 小区平均值法的家系遗传力比转化分析法的结果低,并且遗传力的相对误差在−0.36%到−6.91%间变化,不利于逆向选择。

        综合以上研究,从参数的精度和统计效益上证明了林木中小区平均值法不及转化分析法的分析结果,在林木子代测定资料的分析中宜优先采用转化分析法。

      • 在固定模型条件下,同一试验资料,以转化分析法获得的家系效应值为参照对象,分析了小区平均值法获得的家系效应值的大小,相对误差,秩变化及20%的入选率时,优良家系选择的失误率大小如下:

        以转化分析法为参照对象,小区平均值法的家系效应值,将产生1.02%~7.08%的相对误差;小区平均数值法中的许多家系秩与这些家系转化分析获得的秩不一致;采取20%的入选强度时,逆向选择会产生1/8—2/8的失误概率。这一结果与以前的研究结果[13] 相一致。

      • 林木遗传育种中,规则的、平衡的试验设计常常获得的是非平衡试验资料。由于林木遗传育种是以单株值作为操作程序,此时采用转化分析法具有优越性,小区平均值法更适合处理平衡规则的林木无性系田间试验数据,存在缺区时,还要用最小二乘法补平,这非常麻烦.据齐明(2009)利用9年生的杉木全同胞子代试验林资料(实生起源)的研究表明:当出现数据缺失时,转化分析法(即直接采用缺株分析),其分析结果造成的统计误差,比该资料用小区平均值法(用最小二乘法补齐数据)获得的分析结果的误差小[13]

        蒙特卡罗(Monte Carlo)模拟法,产生的非平衡试验数据(针对实生苗),其分析结果在4、5、6、8、10株小区试验中表明:(1)小区平均值法适合于平衡规则的数据,在处理林木试验非平衡资料时,尤其是存在缺区时,要用最小二乘法补平,这与转化分析法相比,更加麻烦;(2)相对于转化分析法,小区平均值法的计算量小,但没法获得单株的遗传变异性,即统计效率低,不利于前向选择;(3)由于小区平均值法获得的家系遗传力,其大小和精度要低于转化分析法,不利于逆向选择;(4)转化分析法在若干参数上的偏性大小和均方误大小,明显优于小区平均值法的分析结果,这说明林木中采用小区平均值法处理非平衡资料时,其参数的精确性不及转化分析法。

        在处理林木正交试验非平衡数据时,由于小区平均值法的统计效率低,获得的参数精确性差,不利于逆向选择和前向选择,建议采用转化分析法来处理。

    参考文献 (21)

    目录

      /

      返回文章
      返回