用微信扫码二维码

分享至好友和朋友圈

WE ARE COMMITTED TO REPORTING THE LATEST FORESTRY ACADEMIC ACHIEVEMENTS

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

联合Sentinel-1和Sentinel-2数据反演森林蓄积量

张雨田 许晓东 石军南 刘洋 蔡耀通 林辉 石灵杰 张怀清

张雨田, 许晓东, 石军南, 等. 联合Sentinel-1和Sentinel-2数据反演森林蓄积量[J]. 四川林业科技, 2022, 43(2): 71−80 doi: 10.12172/202107040001
引用本文: 张雨田, 许晓东, 石军南, 等. 联合Sentinel-1和Sentinel-2数据反演森林蓄积量[J]. 四川林业科技, 2022, 43(2): 71−80 doi: 10.12172/202107040001
ZHANG Y T, XU X D, SHI J N, et al. Inversion of forest volume by combining Sentinel-1 and Sentinel-2 data[J]. Journal of Sichuan Forestry Science and Technology, 2022, 43(2): 71−80 doi: 10.12172/202107040001
Citation: ZHANG Y T, XU X D, SHI J N, et al. Inversion of forest volume by combining Sentinel-1 and Sentinel-2 data[J]. Journal of Sichuan Forestry Science and Technology, 2022, 43(2): 71−80 doi: 10.12172/202107040001

联合Sentinel-1和Sentinel-2数据反演森林蓄积量


doi: 10.12172/202107040001
详细信息
    作者简介:

    张雨田(1995—),女,硕士研究生,554363860@qq.com

    通讯作者: zhang@ifrit.ac.cn
  • 基金项目:  “十三五”国家重点研发计划项目“人工林资源监测关键技术研究”(2017YFD0600900)

Inversion of Forest Volume by Combining Sentinel-1 and Sentinel-2 Data

More Information
  • 摘要: 为明确遥感数据源及机器学习模型对森林蓄积量估测的影响,从而提高区域森林蓄积量估测精度。本文以内蒙古旺业甸林场38个落叶松样地与43个油松样地外业调查数据为基础,提取Senitnel-1和Sentinel-2影像光谱和极化等遥感特征信息。根据不同特征组合分别建立支持向量机回归(Support Vector Regression, SVR)、k最近邻(k-NearestNeighbor, kNN)、多层感知器(Multi-Layer Neural Network, MLP)及多元线性回归(Multiple Linear Regression, MLR)4种蓄积量反演模型,并对模型结果进行精度验证与比较。结果表明:(1)与单一数据源相比,联合Sentinel-1与Sentinel-2数据有助于提高森林蓄积量反演精度(油松蓄积量反演R2提高0.08,RMSE提高10.28 m3·hm−2;落叶松蓄积量反演R2提高0.05,RMSE提高4.51 m3·hm−2);(2)与MLP和MLR模型相比,SVR与kNN模型的蓄积量反演效果较好。其中,SVR模型在油松蓄积量反演效果最佳(R2=0.84,RMSE=44.58 m3·hm−2);kNN模型在落叶松蓄积量反演精度最高(R2=0.74,RMSE=41.41 m3·hm−2)。联合Sentinel-1与Sentinel-2多源数据的机器学习方法可获得较高的蓄积量反演精度,可期为区域尺度森林蓄积量遥感反演提供理论支持与可行方案。
  • 图  1  研究区位置图及样地分布

    Fig.  1  Location of the study area and plots distribution

    图  2  研究区油松与落叶松蓄积量反演结果

    Fig.  2  Inversion results of Pinus tabuliformis and Larix gmelinii volume in the study area

    图  3  蓄积量估测精度对比

    Fig.  3  Accuracy comparison of forest volume inversion

    图  4  蓄积量反演结果残差对比

    Fig.  4  Residuals comparison of forest volume inversion

    表  1  落叶松、油松树木材积计算公式

    Tab.  1  Formula of timber/tree volume calculation of Chinese pine and larch

    树种 Tree Species材积计算公式 Formula of timber/tree volume calculation
    落叶松V = −0.001498 + 0.00007 × D2 + 0.000901 × H + 0.000032 × H × D2
    油松V = 0.013464 − 0.001967 × D +×0.000089 D2 + 0.000628 × H × D + 0.000032 × H × D2 − 0.003173 × H
    注: V表示单木材积( m3); D代表胸径(m); H为树高(m)。
    Note: V represents the volume of single wood (m3); D stands for breast diameter (m); H is the tree height (m).
    下载: 导出CSV

    表  2  样地蓄积量统计

    Tab.  2  Volume statistics of sample plots

    树种
    Tree Species
    样地数
    Number of Plots
    蓄积量分布
    stock volume Range/(m3·hm−2)
    均值
    Mean/(m3·hm−2)
    标准差
    Standard Deviation
    变异系数
    Coefficient of variation/%
    落叶松3886.17~405.56208.3881.8439.27
    油松4391.97~514.96253.32112.7544.51
    下载: 导出CSV

    表  3  特征变量筛选结果

    Tab.  3  Selected feature variables

    树种
    Tree Species
    数据源
    Data Source
    特征变量
    Feature Variables
    SVRKNNMLPMLR
    S1AVV, VHVV, VHVV, VV_D, VV_HVV, VH, VH_E, VV_M, VV_V
    油松
    Pinus tabuliformis
    S2AEVI, S2A_B, RVI, SVI, S2A_R_M, S2A_G_Cor, S2A_VRE_V, S2A_NIR_V, S2A_G_M, S2A_NIR_EB, SVI, S2A_R_M, S2A_R_Cor, S2A_NIR_V, EVI_2, S2A_G, S2A_VRE_Cor, S2A_NIR_H, S2A_VRE_V, S2A_B_V, S2A_G_ASMSVI, EVI, S2A_R, NDVI, S2A_NIR_ASMEVI, S2A_B, RVI, S2A_VRE_M, S2A_G_Cor, S2A_R_Cor, S2A_R, S2A_G_H, S2A_NIR_Cor, S2A_G_Con, S2A_B_ASM
    S12AVV, SVI, EVI, NDVI, VH_V, S2A_R_V, SAVI, S2A_NIR_S, S2A_NIR_E, VH_M, S2A_VRE_EVV, SVI, S2AB, S2A_G_Cor, VH_V, S2A_R_V, SAVI, VV_DSVI, EVI, VH, RVI, S2A_VREVV, SVI, S2A_B, S2A_G_Cor, RVI, VH_V, SAVI, S2A_R, S2A_R_ASM, VH_E, S2A_VRE_H, VH_ASM, S2A_VRE_Con, S2A_VRE_Con, VH_Con, S2A_VRE_E, VV_M
    S1AVH_CorVH_Cor, VH_M, VH, VH_ASMVH_Cor, VV_MVH_Cor
    落叶松
    Larix gmelinii
    S2ASVI, EVI, S2A_G_H, S2A_G_E, S2A_NIR_Cor, S2A_NIR_D, S2A_G_ASMSVI, S2A_B, S2A_G, EVI, S2A_VRE_VSVI, EVI_2, NDVI, S2A_G, S2A_VRE, S2A_NIR_MSVI, SAVI, EVI_2
    S12ASVI, RVI, S2AG_ASM, S2A_VRE_Con, S2ANIR_Cor, S2ANIR_H, S2AG_E, VV_V,SVI, S2AB, S2AG, S2AR, SAVI, VH, S2AG_Con, S2AVRE_D, S2AR_M, S2AVRE_MSVI, NDVI, EVISVI, RVI, S2A_G, S2A_NIR_M, S2A_VRE_V, S2A_VRE_E, S2A_VRE_Con, S2A_VRE_H, S2A_VRE_E, S2A_NIR_H, S2A_VRE_M
    注:S1A—Sentinel-1A影像,S2A—Sentinel-2A影像,B—Blue,G—Green,R—Red,VRE—Vegetation Red Edge,M—mean, V—variance, H—homogeneity, Con—contrast, D—dissimilarity, E—entropy, ASM—angular second moment, Cor—correlation
    下载: 导出CSV

    表  4  蓄积量反演模型精度评价

    Tab.  4  Accuracy Evaluation of forest volume inversion models

    树种
    Tree Species
    数据源
    Data Scenarios
    4种模型的精度评价
    Performance Evaluation of 4 Models
    SVRKNNMLPMLR
    R2RMSE/
    (m3·hm−2)
    rRMSE
    /%
    R2RMSE/
    (m3·hm−2)
    rRMSE
    /%
    R2RMSE/
    (m3·hm−2)
    rRMSE
    /%
    R2RMSE/
    (m3·hm−2)
    rRMSE
    /%
    油松
    Pinus tabuliformis
    S1A0.4385.1433.610.3491.6236.170.3690.1435.580.3094.1737.18
    S2A0.7654.8621.660.6468.0626.870.6765.0525.680.5972.1328.47
    S12A0.8444.5817.600.7753.5621.140.7061.5124.280.6566.8626.40
    落叶松
    Larix gmelinii
    S1A0.0479.9938.390.0778.9737.900.1177.1137.000.0779.0137.92
    S2A0.6747.0222.560.6945.9222.030.5256.8027.260.3764.7731.08
    S12A0.7342.7520.520.7441.4119.870.5356.3427.040.4858.9128.27
    下载: 导出CSV
  • [1] 汪少华,张茂震,赵平安,等. 基于TM影像、森林资源清查数据和人工神经网络的森林碳空间分布模拟[J]. 生态学报,2011,31(04):998−1008.
    [2] 赵敏,周广胜. 基于森林资源清查资料的生物量估算模式及其发展趋势[J]. 应用生态学报,2004(8):1468−1472.
    [3] 刘茜,杨乐,柳钦火,等. 森林地上生物量遥感反演方法综述[J]. 遥感学报,2015,19(1):62−74.
    [4] 汪康宁,吕杰,李崇贵. 基于多尺度遥感影像纹理特征的森林蓄积量反演[J]. 中南林业科技大学学报,2017,037(11):84−89.
    [5] 尹惠妍,李海奎. 基于蓄积的森林生物量估算方法的对比分析[J]. 林业科学研究,2014,27(6):848−853.
    [6] Li D, Wang C, Hu Y, et al. General review on remote sensing-based biomass estimation[J]. Geomatics & Information ence of Wuhan University, 2012, 37(6): 631−635.
    [7] 曹霖,彭道黎,王雪军,等. 应用Sentinel-2A卫星光谱与纹理信息的森林蓄积量估算[J]. 东北林业大学学报,2018,46(9):54−58.
    [8] 郑阳,吴炳方,张淼. Sentinel-2数据的冬小麦地上干生物量估算及评价[J]. 遥感学报,2017,21(2):318−328.
    [9] 黄丽艳,闫巧玲,高添,等. 基于ALOSPALSAR雷达影像的人工林蓄积量估算——以塞罕坝机械林场华北落叶松人工林为例[J]. 生态学杂志,2015,34(9):2401−2409.
    [10] 田颖,陈卓奇,惠凤鸣,等. 欧空局哨兵卫星Sentinel-2A/B数据特征及应用前景分析[J]. 北京师范大学学报(自然科学版),2019,55(1):57−65.
    [11] 孙忠秋,吴发云,胡杨,等. 基于Landsat-8 OLI数据的马尾松林蓄积量饱和点确定及估测[J]. 林业资源管理,2020,0(6):135−142.
    [12] 梁志锋,凌飞龙,汪小钦. L波段SAR与中国东北森林蓄积量的相关性分析[J]. 遥感技术与应用,2013,28(5):871−878.
    [13] 杨永恬,李增元,陈尔学,等. 基于ALOS PALSAR数据的森林蓄积量估测技术研究[J]. 林业资源管理,2010,0(1):113−117. doi: 10.3969/j.issn.1002-6622.2010.01.021
    [14] 廖展芒. 森林地上生物量极化干涉SAR反演方法研究[D]. 电子科技大学, 2019.
    [15] 张苏,周小成,黄洪宇,等. 基于SVR的GF1号遥感影像森林蓄积量估测[J]. 贵州大学学报(自然科学版),2019,36(3):21−26.
    [16] 蒙诗栎,庞勇,张钟军,等. WorldView-2纹理的森林地上生物量反演[J]. 遥感学报,2017,21(5):812−824.
    [17] 蒋馥根,孙华,Feng Zhao,等. 基于方差优化k最近邻法的森林蓄积量估测[J]. 森林与环境学报,2019,39(5):497−504.
    [18] 杨铭,王月婷,张晓丽. 基于双源遥感数据的杉木林分蓄积量估测模型研究[J]. 南京林业大学学报(自然科学版),2016,40(5):107−114.
    [19] 潘磊,孙玉军,王轶夫,等. 基于Sentinel-1和Sentinel-2数据的杉木林地上生物量估算[J]. 南京林业大学学报(自然科学版),2020,44(3):149−156.
    [20] 洪奕丰,张守攻,陈伟,等. 基于机载激光雷达的落叶松组分生物量反演[J]. 林业科学研究,2019,32(5):83−90.
    [21] 杨明星,徐天蜀,牛晓花,等. 基于Sentinel-1A雷达影像的思茅松林蓄积量估测[J]. 西部林业科学,2019,48(2):52−58.
    [22] 陈旭,郝震寰. 哨兵卫星Sentinel-2A数据特性及应用潜力分析[J]. 科技视界,2018(16):48−50.
    [23] Tucker C J. Red and photographic infrared linear combinations for monitoring vegetation[J]. Remote Sensing and Environment, 1979, 8(2): 127−150. doi: 10.1016/0034-4257(79)90013-0
    [24] Jiang Z, Huete A R, Didan K, et al. Development of a two-band enhanced vegetation index without a blue band[J]. Remote Sensing of Environment, 2008, 112(10): 3833−3845. doi: 10.1016/j.rse.2008.06.006
    [25] 杨凯, 侯艳, 李康. 随机森林变量重要性评分及其研究进展[J]. 2015.
    [26] Blanchet F G, Legendre P, D Borcard. Forward selection of explanatory variables[J]. Ecology, 2008, 89(9): 2623−2632. doi: 10.1890/07-0986.1
    [27] 蒋馥根,孙华,林辉,等. 旺业甸林场人工林生物量遥感反演研究[J]. 中南林业科技大学学报,2019,39(10):88−94.
    [28] 陈尔学,李增元,武红敢,等. 基于k-NN和Landsat数据的小面积统计单元森林蓄积估测方法[J]. 林业科学研究,2008,021(6):745−750.
    [29] 雷相东. 机器学习算法在森林生长收获预估中的应用[J]. 北京林业大学学报,2019,41(12):23−36.
  • [1] 谢仕奎.  基于混合效应模型的林分优势木平均高-平均胸径模型研究 . 四川林业科技, 2024, 45(1): 84-90. doi: 10.12172/202303240001
    [2] 秦炜锐, 刘景怡, 宋心强, 付明霞, 潘翰, 程勇, 薛飞, 周材权, 杨彪.  大熊猫国家公园荥经片区大熊猫可食竹生物量模型 . 四川林业科技, 2024, 45(): 1-7. doi: 10.12172/202309070001
    [3] 陈俊华, 刘威君, 蒋川东, 刘一丁, 王凯, 谢川, 唐艺家, 慕长龙.  川中丘陵区人工柏木林生物量模型及碳计量参数 . 四川林业科技, 2023, 44(6): 32-39. doi: 10.12172/202308100001
    [4] 张丽, 马光良, 赵博, 李相君, 王光剑, 王履娟, 孙鹏.  料慈竹经济秆材生物量模型 . 四川林业科技, 2023, 44(5): 41-47. doi: 10.12172/202302020001
    [5] 侯晓云, 许戈, 王疆评, 黎燕琼, 毛颖娟.  基于MCR模型的天府新区生态廊道构建 . 四川林业科技, 2022, 43(4): 17-23. doi: 10.12172/202204080003
    [6] 林伟军, 李春萍, 李哲敏.  基于TPB拓展模型的森林防火意识驱动机理研究 . 四川林业科技, 2021, 42(4): 139-144. doi: 10.12172/202101110001
    [7] 张军, 章路, 张琴, 郑绍伟, 慕长龙, 黎燕琼.  岷江干旱河谷区峨眉蔷薇地上生物量及模型研究 . 四川林业科技, 2021, 42(2): 52-56. doi: 10.12172/202012290001
    [8] 马琴, 邵林娟, 杨桦.  川硬皮肿腿蜂学习经历对花椒与虎天牛虫粪挥发物的行为反应测定 . 四川林业科技, 2019, 40(4): 90-96. doi: 10.16779/j.cnki.1003-5508.2019.04.018
    [9] 赖长鸿, 张文, 刘波, 王丽丽, 邱帅, 赵庆霞, 金彦强.  基于森林资源清查资料的四川立木生物量建模类型划分及样本分布研究 . 四川林业科技, 2018, 39(3): 93-97. doi: 10.16779/j.cnki.1003-5508.2018.03.019
    [10] 杨长青, 朱艳, 蔡卫红, 张林.  氮沉降对中国森林土壤CO2通量的影响 . 四川林业科技, 2018, 39(1): 82-86. doi: 10.16779/j.cnki.1003-5508.2018.01.017
    [11] 王勇军, 肖前刚, 廖兴勇, 杨科, 谢文娟, 张文, 李永忠, 靳敏, 王洪荣, 罗文.  基于GIS的成都市森林资源数据管理平台设计 . 四川林业科技, 2018, 39(1): 96-100. doi: 10.16779/j.cnki.1003-5508.2018.01.020
    [12] 孙鹏, 刘屈原, 李艳, 费世民, 李映平, 龚毅红, 李晓清.  四川竹业转型升级基础与潜力 . 四川林业科技, 2017, 38(5): 13-17. doi: 10.16779/j.cnki.1003-5508.2017.05.003
    [13] 唐霄, 罗力嘉, 杨良, 伍晓川.  基于GIS技术森林资源数据更新与管理探讨 . 四川林业科技, 2017, 38(1): 92-94,98. doi: 10.16779/j.cnki.1003-5508.2017.01.024
    [14] 郑绍伟, 李隽, 黎燕琼, 慕长龙, 陈俊华, 周大松, 谢天资, 李宇奇, 罗奕爽.  利用形态因子建立城市森林主要乔木树种三维绿量预测模型 . 四川林业科技, 2017, 38(1): 6-10. doi: 10.16779/j.cnki.1003-5508.2017.01.002
    [15] 谢云, 王洪荣, 黄从德.  四川洪雅林场森林植被碳储量的空间分布特征研究 . 四川林业科技, 2016, 37(4): 14-18. doi: 10.16779/j.cnki.1003-5508.2016.04.003
    [16] 唐婷, 胡进耀, 杨远兵, 傅红伟, 邓东周.  北川3种箭竹属植物地上生物量结构和回归模型的研究 . 四川林业科技, 2015, 36(2): 32-37. doi: 10.16779/j.cnki.1003-5508.2015.02.007
    [17] 高天雷, 武萍, 尹学明.  土壤侵蚀模型研究进展 . 四川林业科技, 2014, 35(4): 42-44. doi: 10.16779/j.cnki.1003-5508.2014.04.009
    [18] 孙存举, 梁楠.  遥感光谱混合模型在成都城区植被信息提取中的应用 . 四川林业科技, 2014, 35(5): 84-87. doi: 10.16779/j.cnki.1003-5508.2014.05.018
    [19] 李智华.  西北地区山杨立木生物量模型研建 . 四川林业科技, 2013, 34(4): 55-58. doi: 10.16779/j.cnki.1003-5508.2013.04.015
    [20] 杨军, 赵勇, 张红实, 李国祥, 罗洪.  利用卫星遥感影像数据分析邛海湿地近50年的变迁 . 四川林业科技, 2013, 34(4): 65-68,13. doi: 10.16779/j.cnki.1003-5508.2013.04.018
  • 加载中
  • 图(4) / 表(4)
    计量
    • 文章访问数:  718
    • HTML全文浏览量:  186
    • PDF下载量:  45
    • 被引次数: 0
    出版历程
    • 收稿日期:  2021-07-04
    • 网络出版日期:  2022-03-16
    • 刊出日期:  2022-04-26

    联合Sentinel-1和Sentinel-2数据反演森林蓄积量

    doi: 10.12172/202107040001
      作者简介:

      张雨田(1995—),女,硕士研究生,554363860@qq.com

      通讯作者: zhang@ifrit.ac.cn
    基金项目:  “十三五”国家重点研发计划项目“人工林资源监测关键技术研究”(2017YFD0600900)

    摘要: 为明确遥感数据源及机器学习模型对森林蓄积量估测的影响,从而提高区域森林蓄积量估测精度。本文以内蒙古旺业甸林场38个落叶松样地与43个油松样地外业调查数据为基础,提取Senitnel-1和Sentinel-2影像光谱和极化等遥感特征信息。根据不同特征组合分别建立支持向量机回归(Support Vector Regression, SVR)、k最近邻(k-NearestNeighbor, kNN)、多层感知器(Multi-Layer Neural Network, MLP)及多元线性回归(Multiple Linear Regression, MLR)4种蓄积量反演模型,并对模型结果进行精度验证与比较。结果表明:(1)与单一数据源相比,联合Sentinel-1与Sentinel-2数据有助于提高森林蓄积量反演精度(油松蓄积量反演R2提高0.08,RMSE提高10.28 m3·hm−2;落叶松蓄积量反演R2提高0.05,RMSE提高4.51 m3·hm−2);(2)与MLP和MLR模型相比,SVR与kNN模型的蓄积量反演效果较好。其中,SVR模型在油松蓄积量反演效果最佳(R2=0.84,RMSE=44.58 m3·hm−2);kNN模型在落叶松蓄积量反演精度最高(R2=0.74,RMSE=41.41 m3·hm−2)。联合Sentinel-1与Sentinel-2多源数据的机器学习方法可获得较高的蓄积量反演精度,可期为区域尺度森林蓄积量遥感反演提供理论支持与可行方案。

    English Abstract

    • 森林在调节和维系全球碳循环的过程中发挥重要作用[1]。森林蓄积量指一定森林面积上存在着的林木树干部分的总材积,是森林资源调查中一个重要因子,也是评价森林固碳能力的重要指标[2]。及时、准确的蓄积量估算可为区域生态状况评价提供重要依据,同时可为评价我国在全球碳源、碳汇中的地位做有力参考[3]

      传统的森林蓄积量估算以实地外业调查方式为主要手段。例如,全国森林资源一、二类调查是国家了解森林蓄积量变化状况的主要测算方法。传统实地调查方法虽然具备较高的准确度,但费时耗力、效率低下,甚至可能存在破坏性采样[4, 5]。遥感技术以其准确、快速、高效的特征优势,为反演森林蓄积量提供了可靠的影像资源和技术手段[6-8]。通过遥感因子与森林信息建立对等关系的方法,已成为林分参数反演的一种常用技术。目前用于森林蓄积量反演的数据主要有光学和微波遥感数据,或多源数据相结合[9]。常用于反演的光学遥感影像包含Landsat TM/ETM/OLI、MODIS、AVHRR和Sentinel-2等国外遥感数据,以及国产高分系列、资源三号卫星影像等。Sentinel-2卫星影像与Landsat等传统遥感数据相比,具有更高的空间分辨率和更短的重返周期。此外,Sentinel-2光谱信息更为丰富,其有效载荷能获取对植被敏感的红边波段信息,可有效提高植被信息提取精度[7, 8, 10]。然而,光学遥感数据在森林蓄积量反演中存在一定的局限性。光学遥感获取的波段信息主要来自森林冠层表层,导致其在森林密集区域易发生光饱和现象[11]。相比之下,合成孔径雷达数据(Synthetic Aperture Radar, SAR)穿透性强,对地物三维结构参数敏感,能更好地反映森林蓄积量信息[12, 13]。然而,早期SAR数据费用昂贵,某种程度上限制了SAR数据森林参数反演等相关研究的发展进程。Sentinel-1为欧空局2014年发射的C波段SAR卫星,并向用户免费提供,已也被广泛用于各类资源环境遥感研究[14]

      目前,已有大量学者利用遥感数据和机器学习算法反演区域森林蓄积量和生物量。张苏等[15]以GF-1卫星影像为数据源,选取光谱纹理信息运用SVR方法开展亚热带针叶林蓄积量估算效果评价研究,决定系数R2=0.58;蒙诗栎等[16]基于WorldView-2多光谱影像中提取的植被指数、纹理信息等遥感因子,采用SVR方法进行森林地上生物量建模,决定系数R2=0.85;蒋馥根等[17]以Planet Labs影像为数据源,运用方差速率优化的kNN方法建立森林蓄积量反演模型,其R2=0.69,均方根误差(RMSE)=67.6m3·hm−2。以上研究大多基于单一数据源运用机器学习方法建模,难以充分发挥遥感技术在森林蓄积量反演中的潜力[18]。因此,潘磊等[19]提出联合光学与微波遥感数据构建蓄积量反演模型,基于Sentinel-1 SAR数据与Sentinel-2光学数据,采用多元线性逐步回归方法建模,反演结果的R2=0.575,RMSE=59.13mg·hm−2。然而,仅凭传统的回归方法难以获得满足实际生产应用要求,并不能完整有效表达遥感参数与森林蓄积量之间复杂非线性关系[3, 20]。此外,尽管上述研究获得了较好的森林蓄积量反演效果,但由于不同森林类型具有一定的空间和光谱异质性,暂无统一、有效的模型和数据组合方式。因此,森林蓄积量遥感反演方法在推广过程中仍存在一定的限制。明确各类机器学习算法和遥感数据组合在不同森林类型的蓄积量估测潜力的研究已亟需开展。本研究以旺业甸实验林场落叶松、油松人工林为研究对象,尝试联合Sentinel-1微波遥感与Sentinel-2光学遥感数据,充分利用影像光谱、纹理和极化信息,采用支持向量机回归(Support Vector Regression, SVR)、k最近邻(k-NearestNeighbor, kNN)、多层感知器(Multi-Layer Neural Network, MLP)及多元线性回归(Multiple Linear Regression, MLR)4种机器学习对研究区森林蓄积量进行估测,为提升森林蓄积量遥感估测模型精度与泛化能力提供理论支持。

      • 旺业甸实验林场位于赤峰市喀喇沁旗西南部,介于118°09'~118°30'E,41°21'~41°39'N之间,总面积约为500 km2(见图1)。受温带季风大陆性气候影响,年降水量400 mm左右,年平均气温4.2℃左右。林场地形地势西南高,东北低,形成了许多中低山地与丘陵。截至2016年底,旺业甸实验林场森林覆盖率约为93%,森林蓄积量152.7万m3。林场的主要林分起源方式为人工林,其主要树种包括落叶松(Larix gmelinii)、油松(Pinus tabuliformis),天然林优势树种为白桦和杨树等落叶阔叶树种。

        图  1  研究区位置图及样地分布

        Figure 1.  Location of the study area and plots distribution

      • 2017年9月至10月综合考虑树龄和空间分布情况,采用随机分层抽样,共调查样地81个,包含38个落叶松样地和43个油松样地,样地大小25 m×25 m。每个样地每木检尺,记录所有胸径大于5 cm的活立木参数,主要包括胸径、树高、冠幅等单木信息。在调查样木获取的树高和胸径基础上,结合依据研究区实际情况编制的材积模型(见表1)即可计算得出单木材积、样地林分蓄积量及单位面积蓄积量。

        表 1  落叶松、油松树木材积计算公式

        Table 1.  Formula of timber/tree volume calculation of Chinese pine and larch

        树种 Tree Species材积计算公式 Formula of timber/tree volume calculation
        落叶松V = −0.001498 + 0.00007 × D2 + 0.000901 × H + 0.000032 × H × D2
        油松V = 0.013464 − 0.001967 × D +×0.000089 D2 + 0.000628 × H × D + 0.000032 × H × D2 − 0.003173 × H
        注: V表示单木材积( m3); D代表胸径(m); H为树高(m)。
        Note: V represents the volume of single wood (m3); D stands for breast diameter (m); H is the tree height (m).

        通过分析研究区样地森林蓄积量统计结果可知(见表2),油松单位面积蓄积量比落叶松略高,落叶松的变异系数为39.27%,油松为44.51%。油松和落叶松样地的林龄和森林蓄积量在空间分布上具有一定异质性。

        表 2  样地蓄积量统计

        Table 2.  Volume statistics of sample plots

        树种
        Tree Species
        样地数
        Number of Plots
        蓄积量分布
        stock volume Range/(m3·hm−2)
        均值
        Mean/(m3·hm−2)
        标准差
        Standard Deviation
        变异系数
        Coefficient of variation/%
        落叶松3886.17~405.56208.3881.8439.27
        油松4391.97~514.96253.32112.7544.51
      • 影像数据源主要包括Sentinel-1及Sentinel-2数据。Sentinel-1卫星搭载C波段SAR传感器,有4种极化组合方式:HH、VV、HH+HV、VV+VH,数据获取模式有条带模式、干涉宽幅模式、超宽幅模式、波模式4种成像模式,重访周期为6 d [19, 21]。本文使用了干涉宽幅模式下的Senitinel-1影像,其极化方式为VV+VH。Sentinel-2卫星空间分辨率为10/20/60 m,时间分辨率为5 d,宽幅290 km。其多光谱信息丰富(含13个波段,光谱分辨率为15~180 nm),具有对植被敏感的独特 “红边”波段[19, 22]。所使用的Sentinel-1和Sentinel-2影像获取时间分别为2017年9月19日和2017年9月22日。

        Sentinel影像数据预处理在SNAP软件上进行。Sentinel-1影像预处理步骤主要包括轨道校正、辐射定标、辐射校正、多视处理以及地形校正。Sentinel-2数据属于L1C级别,已完成正射校正和几何精校正。后续处理只需在SNAP软件上完成大气校正。为了避免样地布设规格和影像数据分辨率不一致引起的尺度效应,将Sentinel影像重采样为25 m×25 m分辨率,并依据研究区矢量边界裁剪得到研究区影像。

      • 运用特征变量参与建模之前需要进行筛选,通常考虑两方面问题:(1)遥感影像数据中包含大量特征变量,如光谱信息、植被指数信息等等,并非所有变量的参与都能提高模型精度;(2)某些变量间会存在共线性问题,导致信息冗余,同时影响模型精度。参照以往研究并结合当前研究实际情况,本文参与特征变量筛选的遥感因子包含以下3组:Sentinel-2影像数据8个单波段反射率及其相应单波段的8种二阶纹理特征值、6种常用植被指数共78个遥感因子;Sentinel-1影像中2种极化方式数据(VV、VH)及其相应的8种二阶纹理特征值、VH/VV的极化比值数据共19个遥感因子;Sentinel-1数据联合Sentinel-2数据共97个特征变量因子。其中6种植被指数包括:归一化植被指数(NDVI)、标准植被指数(SVI)、土壤调节植被指数(SAVI)、比值植被指数(RVI)、增强植被指数(EVI)及增强植被指数-2(EVI-2)。纹理分析中,本文采用典型代表方法:灰度共生矩阵(Gray level co-occurrence matrix,GLCM ),提取窗口大小为3×3,8种二阶纹理变量包括:均值(mean)、方差( variance)、相关(correlation)、对比度( contrast)、差异(dissimilarity)、均质性(homogeneity)、角二阶矩(angular second moment)、熵(entropy)[16, 19, 23, 24]

        特征变量的重要性通过在给定模型中观察每个预测变量的随机重排对模型的影响来衡量。随机森林基于袋外数据(OOB)误分率的增加量和基于分裂时的基尼(GINI)下降量,可以得到变量重要性的排序,从而有利于选取适合反演的特征变量。本文使用了Python的scikit-learn包中的Random Forest Regressor函数,求得特征变量的重要性排序。在此排序基础上,采用前向选择法,让每个特征变量按顺序逐一进入模型,第n+1个变量若满足以下2个条件,即予以保留:①通过共线性诊断,与前n各变量均保持较低相关性(n $ \in $ 0, 1, 2, 3…);②观测特征变量是否有利于模型精度的提高,否则,予以剔除[25-27]。最终,通过各组筛选出的特征变量进行蓄积量模型构建和反演精度对比。

      • SVR算法通过选用合适的核函数将低维数据映射到高维数据。本文以样地数据和相应的遥感因子作为训练数据,使用SVR算法,建立以SVM函数进行回归分析的模型﹐可得出经交叉验证后模型精度最高时核函数RBF的参数γ、惩罚系数C,并利用该最优模型实现对森林蓄积量的估测和反演。

      • kNN是一种分类与回归的典型的非参数方法,不依赖于特定的函数分布,在样本数量较少的情况下易于估算缺失值,已成为森林蓄积量反演的常用方法[28]。k-最近邻算法通过测量不同特征值之间的距离来分类,对于一个新输入的样本数据,如果其在特征空间中的k个最邻近的样本数据大部分属于某一个类别,则将该样本数据也划分为这个类别。该算法涉及3个重要因素:k的大小、距离的度量和训练集。

      • MLP是多层感知器,使用的是前馈神经网络。MLP模型是在单层感知器基础上增加隐藏层而形成的一种多层前馈网络,一般由输入层﹑隐藏层和输出层构成。相比于一些更复杂的神经网络模型,MLP神经网络由于引入了激活函数,因而比起传统的线性模型,除了能够表达线性映射,还具备了分层的非线性映射学习能力。

      • MLR模型是对森林蓄积量进行估测时常用的的传统建模方法。它将遥感影像与样地各波段值和波段比值的相应实地测量值相结合,并结合其他多种相关变量因子。以提取的遥感因子为自变量,样地调查获取的蓄积量实测值为因变量,进行多元线性回归拟合,得到参数,构建最佳多元线性回归方程,最终估算林分总蓄积量。

      • 选用决定系数(R2)、均方根误差(root mean square error,RMSE)、相对均方根误差(relative root mean square error,rRMSE)作为精度评价的指标,计算公式见式(1)—(3)。较高的R2和较低的RMSErRMSE表明更好的建模和预测性能。各模型的精度检验采用留一法交叉验证(leave-one-out cross validation)[27],该方法假设有k个样本,将每一个样本作为验证样本,其他k-1个样本作为训练样本,从而得到k个训练结果,有利于从有限的数据中获得尽可能多的有效信息。

        $$ {R^2} = 1 - \dfrac{{\displaystyle\sum\nolimits_{i = 1}^n {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} }}{{\displaystyle\sum\nolimits_{i = 1}^n {{{\left( {{y_i} - {{\bar y}_i}} \right)}^2}} }} $$ (1)
        $$ RMSE = \sqrt {\dfrac{{\displaystyle\sum\nolimits_{i = 1}^n {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} }}{{n - 1}}} $$ (2)
        $$ rRMSE = \frac{{RMSE}}{{\bar y}} $$ (3)
      • 为了降低模型过拟合的风险,在进行回归模型构建前,使用随机森林算法对变量因子进行特征筛选。经随机森林法对变量进行重要性排序、再利用前向选择法同时考虑共线性与估测精度来依次对3组特征变量进行筛选后,最终最优变量组合用于蓄积量模型反演与方法比较,特征变量筛选结果如表3所示。由表可知,不同树种、数据源以及不同模型相应筛选出的特征变量组合不同。但各组合大多包含:(1)Sentinel-1极化特征因子;(2)Sentinel-2中的植被指数变量,如EVI、SVI、SAVI、RVI;(3)光谱信息和部分纹理信息等。可见,上述因子对森林蓄积量估测较为敏感。

        表 3  特征变量筛选结果

        Table 3.  Selected feature variables

        树种
        Tree Species
        数据源
        Data Source
        特征变量
        Feature Variables
        SVRKNNMLPMLR
        S1AVV, VHVV, VHVV, VV_D, VV_HVV, VH, VH_E, VV_M, VV_V
        油松
        Pinus tabuliformis
        S2AEVI, S2A_B, RVI, SVI, S2A_R_M, S2A_G_Cor, S2A_VRE_V, S2A_NIR_V, S2A_G_M, S2A_NIR_EB, SVI, S2A_R_M, S2A_R_Cor, S2A_NIR_V, EVI_2, S2A_G, S2A_VRE_Cor, S2A_NIR_H, S2A_VRE_V, S2A_B_V, S2A_G_ASMSVI, EVI, S2A_R, NDVI, S2A_NIR_ASMEVI, S2A_B, RVI, S2A_VRE_M, S2A_G_Cor, S2A_R_Cor, S2A_R, S2A_G_H, S2A_NIR_Cor, S2A_G_Con, S2A_B_ASM
        S12AVV, SVI, EVI, NDVI, VH_V, S2A_R_V, SAVI, S2A_NIR_S, S2A_NIR_E, VH_M, S2A_VRE_EVV, SVI, S2AB, S2A_G_Cor, VH_V, S2A_R_V, SAVI, VV_DSVI, EVI, VH, RVI, S2A_VREVV, SVI, S2A_B, S2A_G_Cor, RVI, VH_V, SAVI, S2A_R, S2A_R_ASM, VH_E, S2A_VRE_H, VH_ASM, S2A_VRE_Con, S2A_VRE_Con, VH_Con, S2A_VRE_E, VV_M
        S1AVH_CorVH_Cor, VH_M, VH, VH_ASMVH_Cor, VV_MVH_Cor
        落叶松
        Larix gmelinii
        S2ASVI, EVI, S2A_G_H, S2A_G_E, S2A_NIR_Cor, S2A_NIR_D, S2A_G_ASMSVI, S2A_B, S2A_G, EVI, S2A_VRE_VSVI, EVI_2, NDVI, S2A_G, S2A_VRE, S2A_NIR_MSVI, SAVI, EVI_2
        S12ASVI, RVI, S2AG_ASM, S2A_VRE_Con, S2ANIR_Cor, S2ANIR_H, S2AG_E, VV_V,SVI, S2AB, S2AG, S2AR, SAVI, VH, S2AG_Con, S2AVRE_D, S2AR_M, S2AVRE_MSVI, NDVI, EVISVI, RVI, S2A_G, S2A_NIR_M, S2A_VRE_V, S2A_VRE_E, S2A_VRE_Con, S2A_VRE_H, S2A_VRE_E, S2A_NIR_H, S2A_VRE_M
        注:S1A—Sentinel-1A影像,S2A—Sentinel-2A影像,B—Blue,G—Green,R—Red,VRE—Vegetation Red Edge,M—mean, V—variance, H—homogeneity, Con—contrast, D—dissimilarity, E—entropy, ASM—angular second moment, Cor—correlation
      • 以Sentinel-1和Sentinel-2影像数据为遥感数据源,结合旺业甸林场样地实测数据,分别采用最优模型对研究区油松(SVR模型)和落叶松林(kNN模型)进行蓄积量反演,反演结果如图2所示。由图可见,油松蓄积量总体水平高于落叶松,同时比落叶松树种分布更为集中。油松在研究区中部、中偏南部、中偏北部、东部地区蓄积量较高,西部地区尤其西南部分布较为分散,数量分布少、蓄积量较低;落叶松东南部、西部及西偏北部区域蓄积量相对较高,中部、西北角、东北角蓄积量较低。反演得出蓄积量分布结果与实际情况基本一致,表明蓄积量模型的估测结果较为可靠。

        图  2  研究区油松与落叶松蓄积量反演结果

        Figure 2.  Inversion results of Pinus tabuliformis and Larix gmelinii volume in the study area

        为对比不同遥感数据源和机器学习模型对蓄积量反演结果的影响,分别利用Sentinel-1数据(S1A)、Sentinel-2数据(S2A)、Sentinel-1和Sentinel-2相结合的数据(S12A)共三种数据源中筛选出的最优变量组合,通过SVR、kNN、MLP和MLR模型对研究区进行蓄积量反演,其精度验证结果如表4所示。

        表 4  蓄积量反演模型精度评价

        Table 4.  Accuracy Evaluation of forest volume inversion models

        树种
        Tree Species
        数据源
        Data Scenarios
        4种模型的精度评价
        Performance Evaluation of 4 Models
        SVRKNNMLPMLR
        R2RMSE/
        (m3·hm−2)
        rRMSE
        /%
        R2RMSE/
        (m3·hm−2)
        rRMSE
        /%
        R2RMSE/
        (m3·hm−2)
        rRMSE
        /%
        R2RMSE/
        (m3·hm−2)
        rRMSE
        /%
        油松
        Pinus tabuliformis
        S1A0.4385.1433.610.3491.6236.170.3690.1435.580.3094.1737.18
        S2A0.7654.8621.660.6468.0626.870.6765.0525.680.5972.1328.47
        S12A0.8444.5817.600.7753.5621.140.7061.5124.280.6566.8626.40
        落叶松
        Larix gmelinii
        S1A0.0479.9938.390.0778.9737.900.1177.1137.000.0779.0137.92
        S2A0.6747.0222.560.6945.9222.030.5256.8027.260.3764.7731.08
        S12A0.7342.7520.520.7441.4119.870.5356.3427.040.4858.9128.27

        在油松蓄积量反演中,当数据源为S12A时,在SVR模型中,R2达到最大,为0.84,显著高于其他情况估测精度,同时指标RMSErRMSE均达到最小,分别为44.58 m3·hm−2、17.60%;当数据源为S12A时,在kNN模型中,R2达0.77,rRMSE较小,为21.14%;当数据源为S2A时,在SVR模型中,R2为0.76,rRMSE为21.66%。落叶松蓄积量反演:当数据源使用S12A时,在kNN模型中,R2达到最大,为0.74,同时RMSErRMSE均达到最小,分别为41.41 m3·hm−2、19.87%;当数据源为S12A时,在SVR模型中,R2达到较大,为0.73,同时RMSE较小,为42.75 m3·hm−2rRMSE为20.52%。

        综合表中验证结果可知,S12A影像组合的蓄积量反演效果最佳,表明联合Sentinel-1和Sentinel-2数据可以提高反演森林蓄积量精度;S2A影像反演效果次之,而仅使用S1A影像的蓄积量估测精度最低。此外,SVR模型与kNN模型拟合效果较好。SVR模型在油松蓄积量反演时R2=0.84,显著高于其他模型的估测精度;kNN模型在落叶松蓄积量反演时精度最优。利用S12A数据组合和MLP模型时,油松蓄积量反演结果R2=0.70,其余数据组合下R2均低于0.70;传统MLR模型拟合精度最低,模型稳定性相对较差。

        图3散点图分析可知,基于S12A多源数据集和SVR模型的油松蓄积量反演结果与实测值最接近,估计误差最小,而基于S12A多源数据源和kNN模型的落叶松蓄积量反演结果最好。总的来看,对于不同树种的林分蓄积量反演,S12A多源数据组合均比单一数据源(S1A/S2A)具有更高的反演精度。传统MLR模型与其余3种机器学习算法相比,其样本预测值与真实值之间偏差更大,模型预测结果较差。SVR模型与kNN模型反演效果较优。

        图  3  蓄积量估测精度对比

        Figure 3.  Accuracy comparison of forest volume inversion

        根据残差分析结果(见图4)可知,基于S12A多源数据组合的SVR和kNN油松蓄积量反演结果残差呈对称分布,所有残差点均匀分布于在0值线两旁区域,表明模型反演效果较好。此外,其残差所在带状区域的较窄,说明模型的拟合精度较高,未出现过拟合现象。基于S12A多源数据组合的SVR和kNN落叶松蓄积量反演模型残差分布相对更合理,均位于x轴两端,基本随机均匀无规律分布于较窄的水平带状区域,绝大部分样地残差值的绝对值落在100 m3·hm−2以内。在油松和落叶松蓄积量反演时,MLR模型残差分布随机性均较差,分布带状区域宽,残差值较大的样地较多,效果较差;MLP模型存在过高或过低估计现象,有较多大于100 m3·hm−2残差绝对值出现,模型拟合精度稍显不足。以上残差分析均与模型估测结果相符:基于S12A多源数据的油松SVR蓄积量反演模型和基于S12A多源数据的kNN落叶松蓄积量反演模型,两者残差分布合理,模型拟合度高,预测值与真实值偏差最小,预测精度最好,分属两树种的最优蓄积量反演模型。

        图  4  蓄积量反演结果残差对比

        Figure 4.  Residuals comparison of forest volume inversion

      • 以内蒙古自治区赤峰市旺业甸实验林场为研究区,联合Sentinel-1微波遥感数据和Sentinel-2光学影像,利用机器学习模型估算了研究区森林蓄积量,并探讨了不同数据源和建模算法在森林蓄积量的估测潜力,其主要结论如下:

        (1)随机森林算法可有效筛选最优特征组合,通过消除变量间共线性和减少信息冗余,从而提高蓄积量估测精度和效率。特征组合筛选结果表明Sentinel-2数据的植被指数(如EVI、SVI、RVI)及光谱、纹理信息,Sentinel-1 SAR数据提取的变量因子,如VV/VH极化特征等对森林三维结构参数敏感,有助于森林蓄积量反演。

        (2)提取了Sentinel-1影像的极化特征因子及其纹理特征值和Sentinel-2影像的植被指数,光谱、纹理信息用于构建森林蓄积量估测模型。Sentinel-2卫星数据可有效估测森林蓄积量(油松R2=0.59~0.76,RMSE=54.86~72.13 m3·hm−2;落叶松R2=0.37~0.69,RMSE=45.92~64.77 m3·hm−2)。加入Sentinel-1 SAR影像数据可提升了蓄积量估测精度(油松R2提高0.08,RMSE提高10.28 m3·hm−2;落叶松R2提高0.05,RMSE提高4.51 m3·hm−2),与潘磊等[19]的研究结论一致。综上,联合Sentinel-2与Sentinel-1数据可充分利用Sentinel-2光谱信息和Sentinel-1极化信息,有助于提高估测森林蓄积量的精度。

        (3)不同蓄积量反演模型在不同树种下的蓄积量估测效果不同。SVR、kNN和MLP三种机器学习模型蓄积量反演结果均优于传统的MLR模型,其中SVR和kNN模型估测性能较好。基于S12A多源数据的油松SVR蓄积量反演模型和基于S12A多源数据的kNN落叶松蓄积量反演模型,分属两树种的最优蓄积量反演模型。

    参考文献 (29)

    目录

      /

      返回文章
      返回