植物生态学报  2016 , 40 (2): 102-115 https://doi.org/10.17521/cjpe.2014.0366

Orginal Article

结合机载LiDAR和LANDSAT ETM+数据的温带森林郁闭度估测

张瑞英12, 庞勇2, 李增元2**, 包玉海1

1内蒙古师范大学地理科学学院, 呼和浩特 010010
2中国林业科学研究院资源信息研究所, 北京 100091

Canopy closure estimation in a temperate forest using airborne LiDAR and LANDSAT ETM+ data

ZHANG Rui-Ying12, PANG Yong2, LI Zeng-Yuan2*, BAO Yu-Hai1

1College of Geographical Science, Inner Mongolia Normal University, Hohhot 010010, China
and 2Institute of Forest Resource Information Technique, Chinese Academy of Forestry, Beijing 100091, China

通讯作者:  通信作者Author for correspondence (E-mail: zengyuan.li@caf.ac.cn)

版权声明:  2016 植物生态学报编辑部 本文是遵循CCAL协议的开放存取期刊,引用请务必标明出处。

展开

摘要

森林郁闭度是森林资源调查中的一个重要因子, 在森林生态系统管理中具有重要作用.研究如何有效地将激光雷达数据应用于森林郁闭度遥感估测具有重大意义.激光雷达数据的应用能够有效地弥补传统地面调查耗时,费力等不足, 不仅可以快速,准确地获取郁闭度遥感估测的模型训练数据和验证数据, 还有助于进一步推广应用于大区域的森林郁闭度反演, 为林业资源调查提供有力的依据.该研究结合激光雷达数据和LANDSAT ETM+数据估测温带森林郁闭度.以高密度机载激光雷达(ALS)点云数据估算的郁闭度作为模型训练数据和验证数据, 通过LANDSAT ETM+影像数据计算得到的8种植被指数作为自变量, 使用多元逐步回归(MSR),随机森林(RF)和Cubist 3种模型, 对内蒙古大兴安岭根河林区森林郁闭度进行估测.经验证, Cubist模型的效果比较好(决定系数R2 = 0.722, 均方根误差RMSE = 0.126, 相对均方根误差rRMSE = 0.209, 估计精度EA = 79.883%).结果表明, 结合激光雷达数据和LANDSAT ETM+影像数据估算温带森林郁闭度非常有潜力.但要将其推广应用于更大区域尺度的森林郁闭度遥感估测, 模型的预测能力还有待进一步改进和提高; 自变量应尝试加入更多种类遥感数据和其他遥感因子参与建模, 例如采用地形因子,高分辨率遥感影像提取纹理特征等, 最大可能地减少光学影像,植被指数,地形阴影等带来的影响, 提高反演精度; 激光雷达数据计算得到的郁闭度的准确性和可靠性还需进一步验证.

关键词: LANDSAT ETM+ ; 机载激光雷达 ; 森林郁闭度 ; 植被指数 ; 多元逐步回归 ; 随机森林 ; Cubist

Abstract

Aims Forest canopy closure is one of the essential factors in forest survey, and plays an important role in forest ecosystem management. It is of great significance to study how to apply LiDAR (light detection and ranging) data efficiently in remote sensing estimation of forest canopy closure. LiDAR can be used to obtain data fast and accurately and therefore be used as training and validation data to estimate forest canopy closure in large spatial scale. It can compensate for the insufficiency (e.g. labor-intensive, time-consuming) of conventional ground survey, and provide foundations to forest inventory.Methods In this study, we estimated canopy closure of a temperate forest in Genhe forest of Da Hinggan Ling area, Nei Mongol, China, using LiDAR and LANDSAT ETM+ data. Firstly, we calculated the canopy closure from ALS (Airborne Laser Scanning) high density point cloud data. Then, the estimated canopy closure from ALS data was used as training and validation data to modeling and inversion from eight vegetation indices computed from LANDSAT ETM+ data. Three approaches, multi-variable stepwise regression (MSR), random forest (RF) and Cubist, were developed and tested to estimate canopy closure from these vegetation indices, respectively.Important findings The validation results showed that the Cubist model yielded the highest accuracy compared to the other two models (determination coefficient (R2) = 0.722, root mean square error (RMSE) = 0.126, relative root mean square error (rRMSE) = 0.209, estimation accuracy (EA) = 79.883%). The combination of LiDAR data and LANDSAT ETM+ showed great potential to accurately estimate the canopy closure of the temperate forest. However, the model prediction capability needs to be further improved in order to be applied in larger spatial scale. More independent variables from other remotely sensed datasets, e.g. topographic data, texture information from high-resolution imagery, should be added into the model. These variables can help to reduce the influence of optical image, vegetation indices, terrain and shadow and so on. Moreover, the accuracy of the LiDAR-derived canopy closure needs to be further validated in future studies.

Keywords: LANDSAT ETM+ ; airborne laser scanning (ALS) ; forest canopy closure ; vegetation index ; multi- variable stepwise regression ; random forest ; Cubist

0

PDF (1724KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

张瑞英, 庞勇, 李增元, 包玉海. 结合机载LiDAR和LANDSAT ETM+数据的温带森林郁闭度估测[J]. 植物生态学报, 2016, 40(2): 102-115 https://doi.org/10.17521/cjpe.2014.0366

ZHANG Rui-Ying, PANG Yong, LI Zeng-Yuan, BAO Yu-Hai. Canopy closure estimation in a temperate forest using airborne LiDAR and LANDSAT ETM+ data[J]. Chinese Journal of Plant Ecology, 2016, 40(2): 102-115 https://doi.org/10.17521/cjpe.2014.0366

森林因其面积最大,分布最广,组成结构复杂,物质资源丰富而成为陆地生态系统的主体, 不仅为人类的生存发展提供物质资源, 在保护脆弱的生态系统,水域和淡水资源方面也起着关键作用, 对人类的可持续发展极为重要(付甜等, 2011; 庞勇等, 2011; 庞勇和李增元, 2012).森林郁闭度是指林冠垂直投影面积与林地面积之比, 是反映林分中林冠郁闭程度的指标(邹杰和诸葛祥东, 2011).传统上郁闭度用十分法表示时, 由于其应用范围的扩大和对准确性要求的增加, 郁闭度可保留两位小数, 也可以用百分数表示(李永宁等, 2008).作为森林资源调查中的一个重要调查因子, 郁闭度是地类划分,林分类型划分,小班区划和林分质量评价等方面的主要指标(杜文峰等, 1999), 可以反映森林结构,森林生长状况, 衡量森林资源优劣, 在森林生态系统管理中具有重要作用.

传统的郁闭度测定方法主要包括目测法,树冠投影法,样线法,样点法,抬头望法,观测管法,照片法,冠层分析仪法等(李永宁等, 2008; 邹杰和诸葛祥东, 2011).这些方法费时费力, 而获取的只是小范围的一些具有代表性的数据, 不利于研究大范围或区域尺度上的森林郁闭度空间分布及变化.遥感技术的发展为有效解决区域内郁闭度调查难的问题提供了新的途径, 越来越多的学者开始关注并研究森林郁闭度的遥感估算.目前, 森林郁闭度遥感估算主要是基于遥感光学影像数据及地面实测样地数据进行的.遥感光学影像数据常用的有LAN- DSAT TM (thematic mapper)/ETM+ (enhanced thematic mapper plus)数据,SPOT影像数据,高光谱遥感数据及CCD影像数据等, 地面实测样地数据包括野外测量样地数据和国家森林一类清查资料等; 遥感估算方法可以分为三大类: 经验模型法,像元分解模型法和基于数据挖掘技术的估算方法, 逐步回归,最小二乘回归,主分量回归,偏最小二乘回归,像元二分模型,人工神经网络(BP)等建模方法是比较多见的; 参与建模的自变量主要包括基于遥感光学影像数据提取的波段DN值,波段反射率,归一化植被指数(NDVI),缨帽变换后的亮度,绿度和湿度,纹理特征等遥感因子及地形因子等(刘大伟等, 2006; 谭炳香等, 2006; 杜晓明等, 2008; 曾涛等, 2010; 陈崇等, 2011; Lei et al., 2012; 高云飞等, 2012; 吴飏等, 2012; 徐定和彭道黎, 2013; 郑冬梅等, 2013).

近几年来, 国内外学者在森林参数反演研究方面也有了一些新的进展, 张瑾等(2014)以多时相环境星CCD数据为主要数据源, 利用分类树回归方法对密云水库上游的森林覆盖度进行了遥感估算.Gleason和Im (2012)基于机载激光雷达数据, 对比分析了4种回归方法--线性混合效应回归(linear mixed effects regression, LME),随机森林(random forest, RF),Cunbist方法和支持向量回归(support vecter regression, SVR)的样地和单木森林生物量反演效果.Breiman (2001)和Powell等(2010)认为随机森林能够减小误差和改善过拟合现象, 在某些情况下比用简单的回归方法估算森林生物量更加准确.王云飞等(2013)利用随机森林的方法估算了云南景洪市橡胶林的生物量.Sexton等(2014)利用Cubist方法建模, 结合激光雷达数据,LANDSAT数据和MODIS数据反演了全球的森林覆盖情况.Coulston等(2012)在5个不同的试点地区, 利用两种不同陆地卫星图像归一化和8种不同抽样强度的方法, 对两种不同的模型技术(随机森林和β回归)进行评价, 结果表明随机森林优于β回归, 而基于两种不同归一化技术建立的模型并没有太大差别, 并基于这些结果提出了一个原型研究设计, 将应用于更大区域的调查树冠覆盖的建模方法.

激光雷达(light detection and ranging, LiDAR)是一项通过由传感器所发出的激光脉冲来测定传感器与目标物之间距离的主动遥感技术.它应用于林业研究始于20世纪80年代中期, 早期的研究发现激光脉冲的穿透能力与冠层郁闭高度相关, 并指出激光雷达系统可以用于遥感森林垂直结构并估测林木高度(Nelson et al., 1984, 1988).由于激光雷达极高的角分辨能力,距离分辨能力,抗干扰能力等独特的优点, 使得激光雷达可以高精度地获取地表物体的高度信息, 尤其在林木高度测量与林分垂直结构信息获取方面具有其他遥感技术无可比拟的优势.研究综合应用其他遥感数据和激光雷达数据的森林参数定量反演技术, 将有利于发展完全基于遥感手段的定量遥感技术, 在遥感技术更广泛深入地用于森林资源调查上有所突破.同时, 利用高精度的激光雷达反演的森林参数还可以用作其他遥感手段的训练数据和验证数据(庞勇等, 2005).庞勇等(2011)利用样地数据标定的机载激光雷达反演结果作为训练样本进行星载大脚印激光雷达森林地上生物量模型的构建, 得到了比较好的结果.Moeser等(2014)利用机载激光雷达数据合成半球照片估算森林郁闭度和叶面积指数.Sexton等(2014),Korhonen等(2011)则通过计算回波大于某一特定高度的数量来估算森林覆盖度.Sexton等(2014)利用激光雷达计算的森林覆盖度作为训练和验证数据, 结合LANDSAT数据和MODIS数据对全球的森林覆盖进行估算并制图, 认为随着激光雷达数据的可用性,实用性和有效性的逐渐加强, 大区域的森林覆盖监测与制图的精度将会大大提高.可见, 激光雷达对大范围森林高度,林下地形和截面的垂直分布的直接测量为森林调查和经营管理提供了丰富的数据.这些参数与其他生物物理参数(如郁闭度,地上生物量等)具有很好的关系, 为森林生态系统的功能和生产力的建模提供了参数.

本研究利用机载激光雷达(ALS)数据的冠层高度模型(CHM)计算森林郁闭度, 作为训练和验证数据, 与LANDSAT ETM+影像数据计算的8种植被指数共同构建多元逐步回归(MSR),RF和Cubist 3种模型, 并对模型精度进行评价分析, 最后反演研究区的森林郁闭度并制图.本研究的创新之处在于结合了激光雷达数据及LANDSAT ETM+影像数据估算根河林区的森林郁闭度.由于激光雷达具有高效率,高精度地获取森林垂直结构信息的能力, 近年来被广泛应用于森林结构参数(地上生物量,郁闭度,植被覆盖度等)的遥感估测研究中, 而在国内, 激光雷达应用于森林郁闭度的遥感估测方面还没有相关的应用研究.因此, 研究如何有效地将激光雷达数据应用于森林郁闭度遥感估测具有重大意义.激光雷达数据的应用不仅能够有效地弥补传统地面调查的不足, 快速,准确地获取郁闭度遥感估测的模型训练数据和验证数据, 还有助于进一步推广应用于大区域的森林郁闭度反演, 为林业资源调查提供有力的依据.

1 研究区和数据

1.1 研究区概况

研究区位于内蒙古呼伦贝尔东北部的根河市, 120.20°-122.92° E, 50.33°-52.50° N, 是高纬度,高寒冷地区, 地处大兴安岭北段西坡, 地势起伏相对较缓, 东北高,西南低, 坡度15°以内的缓坡在80%以上, 海拔高度多在700-1300 m, 河网密布, 河谷开阔.气候属寒温带湿润型森林气候, 并具有大陆季风性气候的某些特征, 特点是寒冷湿润, 冬长夏短, 春秋相连.生长季在5-9月, 5-6月树木,牧草和喜凉作物正值生长期, 叶面积指数尚小; 7-9月正逢雨季, 为植物生长茂盛期; 从10月到次年3月, 全市低温严寒,百草皆枯, 处于休眠期.森林资源是主体资源, 森林覆盖率75%左右, 主要树种为落叶松(Larix gmelinii),白桦(Betula platyphylla),山杨(Populus davidiana),樟子松(Pinus sylvestris var. mongolica)等.

1.2 光学遥感影像数据

本研究采用的是Hansen等(2013)基于2012年生长季时间序列LANDSAT ETM+数据合成的产品, 合成后的产品基本上为无云影像数据, 空间分辨率为30 m.合成算法采用逐像元判识的高质量可用像元合成法, 对LANDSAT ETM+机载扫描行校正器(scan lines corrector, SLC)导致的条带也有很好的填补.合成产品包括4个波段(红,近红,短波红外1和短波红外2), 如表1所示.根据Hansen等发布的LANDSAT ETM+数据使用说明, 对数据进行辐射定标, 将灰度值转为反射率(reflectance), 定标公式如下:

R = p × g + 1 (1)

式中, R为反射率, 偏移系数为1, 增益系数(g)针对不同波段分别对应不同的值, p为波段DN值, 如表1所示.

表1   LANDSAT ETM+数据的光谱信息及辐射定标参数

Table 1   The spectrum information and radiometric calibration parameters of LANDSAT ETM+ data

波段名称
Band name
波段号
Band number
波长范围
Wavelength range (µm)
对应的原始波段号
Corresponding original band number
增益系数
Gain
红 Red10.63-0.693508
近红外 Near infrared20.75-0.904254
短波红外1 Short wave infrared 131.55-1.755363
短波红外2 Short wave infrared 242.09-2.357423

新窗口打开

1.3 机载激光雷达(ALS)数据

ALS数据于2012年8月30日到9月14日在研究区由运五飞机搭载激光雷达系统飞行获取, 飞行高度为1800 m.激光雷达系统为Leica ALS60, 波长1064 nm, 光束发散度0.22 mrad, 激光发射频率166 kHz, 获取的激光点云密度为平均每m2 2-4个, 回波信息4次.冠层高度模型(CHM)是由通过TerraScan软件(Soininen, 2009)对地面点云数据进行点云分类而生成的数字表面模型(DSM)和数字高程模型(DEM)高程差值运算得到的, 空间分辨率为1 m, 能够准确地反应植被高度信息.

2 研究方法

本研究基于LANDSAT ETM+数据和ALS的冠层高度模型(CHM), 通过构建MSR,RF和Cubist 3种模型, 反演根河林区森林郁闭度, 总体技术流程如图1所示, 分为样本数据提取,回归建模及分析和模型精度评价及反演制图3个部分.

图1   基于LANDSAT ETM+影像的森林郁闭度反演流程图.

Fig. 1   The flowchart of forest canopy closure inversion based on LANDSAT ETM+ image.

首先, 通过CHM计算得到郁闭度参考数据, 基于LANDSAT ETM+影像合成的产品提取8种植被指数, 利用影像分割得到模型训练样本及验证样本, 然后采用MSR,RF和Cubist 3种回归方法进行建模, 评价并分析模型的建模精度, 最后利用3种模型反演根河林区的森林郁闭度并制图, 对模型的预测能力进行评价和对比分析.

2.1 样本数据提取

2.1.1 CHM的郁闭度计算

CHM空间分辨率为1 m, 根据LANDSAT影像像元坐标, 提取每一个LANDSAT像元对应的CHM数据.每一个30 m × 30 m分辨率的LANDSAT像元对应着900个1 m × 1 m分辨率的CHM像元.根据CHM像元值, 采用固定阈值判断是否为郁闭单元, 参考森林调查中传统的郁闭度测定方法, 本研究选用2 m作为阈值.如果CHM的像元值大于等于2 m, 则为郁闭单元, 反之像元值小于2 m, 则为未郁闭单元.然后统计每一个30 m × 30 m像元内900个CHM像元中郁闭的像元数, 最后用郁闭的像元总数除以总像元数(900个), 得到郁闭度, 即公式(2):

CC = ∑Pixel_c/900 (2)

式中, CC为待计算的郁闭度, Pixel_c为郁闭的像元.

CHM数据处理和郁闭度计算使用IDL语言编写程序处理.如图2所示为根河林区的郁闭度计算结果, 左图为CHM影像, 右图为计算得到的郁闭度结果.本研究将通过CHM计算得到的郁闭度分为训练样本和验证样本, 分别构建并评价MSR,RF和Cubist 3种模型.

图2   郁闭度计算结果图.A, 冠层高度模型(m).B, 计算得到的郁闭度结果.

Fig. 2   The calculation result of canopy closure. A, Canopy height model (m). B, Canopy closure result from calculation.

2.1.2 植被指数计算

利用ENVI 5.0的波段运算工具对LANDSAT ETM+影像的前两个波段(红,近红外)进行运算, 得到8种植被指数: 比值植被指数(RVI),差值植被指数(DVI),归一化植被指数(NDVI),土壤调整植被指数(SAVI),改进型土壤调整植被指数(MSAVI),重归一植被指数(RDVI),简单比值指数(SR)和垂直植被指数(PVI), 如表2所示:

表2   植被指数计算方程

Table 2   The calculation formula of vegetation indices

新窗口打开

SR在植被茂密时灵敏度会降低; RDVI可用于高,低不同植被覆盖情况下的植被指数; PVI可以较好地滤除土壤背景的影响, 且对大气效应的敏感程度小于其他植被指数; SAVI降低了植被指数与叶面积指数的线性关系; NDVI是植被生长状态及植被覆盖度的最佳指示因子, 可以部分消除太阳高度角,卫星观测角,地形变化,云/阴影和大气衰减等的影响, 云,水,雪, 岩石,裸土和植被在大尺度NDVI图像上区分明显, 植被可以得到有效的区别, 应用于全球和大陆等大尺度的植被动态监测; MSAVI可以适用于不同的土壤背景, 受冠层参数变化和土壤光谱性质的影响最小; DVI对土壤背景的变化敏感, 有利于对植被生态环境的监测, 因此又被称为环境植被指数(EVI); RVI是植被长势,丰度灵敏的指示参数, 能增强植被与土壤背景之间的辐射差异.因此, 综合利用8种植被指数可以有效地提高森林郁闭度的反演精度.

2.1.3 影像分割

利用ENVI 5.0的面向对象分割工具(feature extraction)对LANDSAT ETM+影像进行分割, 目的是以分割对象为单元确定植被指数与郁闭度之间的回归关系, 进而提高模型反演精度.利用影像分割, 可以在一定程度上减少地理偏差带来的影响, 且能够更好地将同类地物合并为一个分割对象作为一个单元, 更具代表性, 便于样本选取, 进行有效建模, 进一步提高模型精度, 更精确地估算森林郁闭度.将分割后生成的矢量文件加载于郁闭度参考数据和植被指数数据, 利用IDL统计每个分割块内所有像元的平均值, 作为该分割块的统计值, 从而得到模型训练样本和模型精度验证样本及其相对应的植被指数数据.经统计, 影像分割得到2755个分割单元, 在影像上选取具有代表性的区域(郁闭度有高有低)进行建模及验证, 如图3所示, 最终得到1777个训练样本(红色区域)和694个独立验证样本(黄色区域).图4为影像局部分割效果, 左图为LANDSAT ETM+影像分割结果, 右图为郁闭度分割结果.

图3   样本选择范围图(红色区域为训练样本, 黄色区域为验证样本).

Fig. 3   The image of sample selecting range (the red area is the training sample and the yellow area is the validation sample).

图4   LANDSAT ETM+影像及郁闭度分割结果(局部效果).A, LANDSAT ETM+影像分割结果.B, 郁闭度分割结果.

Fig. 4   The segmentation results of LANDSAT ETM+ image and canopy closure. A, The segmentation result of LANDSAT ETM+ image. B, The segmentation result of canopy closure.

2.2 回归建模及分析

本研究构建MSR,RF和Cubist 3种模型反演郁闭度, 参与建模反演的因子及样本数量都是一样的.参与3种模型构建及反演的遥感因子为8种植被指数, 模型训练样本1777个, 模型验证样本694个, 因而3种模型的反演结果及模型精度具有可比性.

2.2.1 MSR

利用IBM SPSS Statistics 20软件进行多元逐步回归建模及分析, 输入经影像分割得到的1777个训练样本, 因变量为由CHM模型计算得到的郁闭度, 自变量为SR,RDVI,PVI,SAVI,NDVI,MSAVI,DVIRVI 8种植被指数, 置信水平为95%.根据8种植被指数对郁闭度作用的显著程度大小(贡献大小), 由大到小逐步引入回归方程, 对郁闭度作用不显著的植被指数可能始终不被引入回归方程, 而已被引入回归方程的植被指数在引入新植被指数后也可能失去重要性, 从而从回归方程中剔除出去.引入一种植被指数或者从回归方程中剔除一种植被指数成为逐步回归的一步, 每一步都要进行f检验, 以保证在引入新变量前回归方程中只含有对郁闭度影响显著的植被指数, 而不显著的植被指数已被剔除.最终, 经过多次筛选和回归得到最优回归方程.

2.2.2 RF

RF是建立在决策树基础上, 通过多次bootstrap抽样获得多个随机样本, 并通过这些样本分别建立相对应的决策树, 从而构成随机森林, 适用于解决分类和回归问题.对于分类问题, 由所有决策树的投票结果决定分类对象类别; 对于回归问题, 取所有决策树预测结果的均值作为最终的预测结果.由于随机森林方法在回归时使用多个决策树的预测结果平均后得到最终预测值, 因此, 不会产生一个具体的回归方程.在回归过程中, 由于随机森林选取样本的方法有放回随机抽样, 因此, 建立回归树时有一部分样本数据不会被选中, 而作为检验样本出现, 起到了样本内部交叉验证的作用, 两个随机性的引入, 可减少过拟合情况的出现(Breiman, 2001; 方匡南等, 2011; Gleason & Im, 2012; 王云飞等, 2013).

本研究利用R软件调用random forest数据包来实现随机森林的回归建模, 并完成根河林区的森林郁闭度反演.进行随机森林回归建模的关键是确定ntree和mtry两个参数.ntree为随机森林决策树的数量, 即使用bootstrap重抽样的次数, 根据经验, 回归误差在回归树的数量达到500以后趋于稳定, 为确保结果的可信度, 在不影响计算效率的情况下选择使用1000作为回归树的数量; mtry为随机特征的数量, 即每次建立决策树时随机入选的自变量数量,其大小在回归分析中通常为输入变量的1/3, 当变量小于3时, 取1.

2.2.3 Cubist

Cubist是一个基于规则的模型, 该模型是M5模型树的扩展.这种技术在预测连续值方面很成功(Kuhn et al., 2012).模型树表示一种分段线性函数, 在模型树的每个内部节点测试特定的自变量, 在每个叶节点给出预测模型, 这些模型都是基于前期节点测试的自变量.Cubist模型M5模型树的扩展在于能够通过创建有序的迭代模型树来建立推进式的模型树组.组中的第一棵树遵循M5模型树的规则, 随后的树是训练集结果的调整版本: 如果模型过高预测了一个值, 那么下一个模型响应为向下调整, 以此类推.与传统的推进式不同, 最终的预测仅是每个模型树预测结果的平均, 每个组的阶段权重不会用于每个模型树预测结果的平均.Cubist的另一个特点是使用最近邻样本来调整规则模型的预测结果.首先建立模型树, 一旦有样本被这个模型预测, Cubist会找到与它最接近的样本并确定训练样本集的预测均值(王涛, 2010; Gleason & Im, 2012).

在R语言中Cubist回归方法主要需要确定的参数包括模型树组的数量参数committees和调整模型时使用到的最近邻样本的数量neighbors.参数选择是使用caret数据包中的train函数实现的, 通过给定参数变化范围和步长来循环尝试参数组合, 使用十折交叉验证选出最优参数组合.Committees的变化范围为1到10, 步长为1; neighbors的变化范围为0到9, 步长为1.根据模型参数组合中RMSE最小值对应的模型为最优模型的原则, 最终得到最优参数组合Committees为10, neighbors为0, RMSE为0.129.

2.3 模型精度评价及反演制图

2.3.1 模型精度评价

模型精度由R2,RMSE,rRMSEEA 4个指标进行评价.

R2是对回归直线拟合优度的检验, 反映了自变量与因变量之间的相关性.R2值越大, 表明自变量与因变量之间的相关性越高.计算公式如下:

RMSE为实测值与预测值之间的均方根误差(标准误差), 与所评价对象的数量级关系很大.RMSE值越小, 表明模型预测的效果越好.计算公式如下:

rRMSERMSE与估测结果算术平均值的比值, 与评价量本身的数量级水平无关, 能够更好地体现总体值域差别较大的模型的预测精度.rRMSE越小, 表明模型预测的效果越好.计算公式如下:

EA为估测精度.EA值越大, 表明模型的估测精度越高.计算公式如下:

2.3.2 反演制图

根据多元逐步回归得到的最优回归方程, 利用ENVI 5.0的波段运算工具, 对最优回归方程中选出的植被指数进行波段运算, 对根河林区森林郁闭度进行反演, 最终得到多元逐步回归模型估算的根河林区森林郁闭度图.

使用ENVI 5.0的Layer stacking工具将8种植被指数按建模时训练样本自变量的顺序进行影像叠加, 导出后输入R软件进行RF和Cubist两种模型的根河林区森林郁闭度反演, 得到反演结果的数值矩阵, 再利用ArcGIS10.0输出成图.

3 结果和分析

3.1 建模结果及精度对比

MSR得到的最优回归方程如下:

CC = 2.689 + 11.177 × NDVI - 0.256 × PVI - 7.477 × MSAVI + 0.176 × DVI (7)

从方程式中可以看出, 回归方程保留了NDVI,PVI,MSAVIDVI 4种植被指数, 而另外4种植被指数SR,RDVI,RVISAVI被剔除.

MSR,RF和Cubist 3种模型的建模结果及精度对比如表3所示.MSR,RF和Cubist 3种模型中, MSR模型精度最差, R2为0.672, RMSE为0.154, 拟合效果较差, 误差较大; Cubist模型优于MSR模型, R2为0.745, RMSE为0.136, 拟合效果较好, 误差较小; 而RF模型建模精度最高, R2高达0.940, RMSE为0.071, 拟合效果最好, 误差也最小.

3.2 反演结果及精度对比

通过构建的MSR,RF和Cubist 3种模型反演郁闭度, 利用694个完全独立的模型精度验证样本, 根据模型精度评价的R2,RMSE,rRMSEEA 4个指标, 对MSR,RF和Cubist模型进行精度评价, 并做对比分析, 具体模型评价指标对比见表4, 模型精度验证结果散点图如图5所示.

从MSR模型,RF模型到Cubist模型精度逐步提高, Cubist模型比较稳定, 精度最高, 为根河林区郁闭度反演的最优模型, 其预测能力最强, 反演效果最好, 建模精度R2 = 0.745, RMSE = 0.136, 模型验证精度R2 = 0.722, RMSE = 0.126, rRMSE = 0.209, EA (%) = 79.883.RF虽然建模精度最高, 但验证精度相差很多, R2从0.940降低到0.693, RMSE从0.071提高到0.132, 显然有过拟合现象; 预测郁闭度集中在0.15到0.85之间, 对于高郁闭度和低郁闭度的预测能力较差.模型的验证精度比建模精度高, 建模精度R2 = 0.672, RMSE = 0.154, 验证精度R² = 0.687, RMSE = 0.134, rRMSE = 0.221, EA (%) = 78.647, 而且预测结果存在异常值, 说明其稳定性不够, 泛化能力不强.

表3   建模精度结果对比

Table 3   The comparison of modeling accuracy

新窗口打开

表4   模型精度验证结果对比

Table 4   The comparison of model accuracy validation

新窗口打开

图5   模型精度验证结果散点图.A, 多元逐步回归(MSR)模型精度验证结果散点图.B, 随机森林(RF)模型精度验证结果散点图.C, Cubist模型精度验证结果散点图.CHM, 冠层高度模型; RMSE, 均方根误差.

Fig. 5   The scatterplot of model accuracy validation. A, multi-variable stepwise regret ssion (MSR) model-the scatterplot of model accuracy validation. B, Random forest (RF) model-the scatterplot of model accuracy validation. C, Cubist model-the scatterplot of model accuracy validation. CHM, canopy height model; RMSE, root mean square error.

本研究是基于激光雷达数据和LANDSAT ETM+对根河林区的森林郁闭度进行遥感估算, 将ALS,CHM计算的郁闭度作为参考数据, 通过构建MSR,RF和Cubist 3种模型反演郁闭度, 反演结果见图6.

对比MSR,RF和Cubist 3种模型反演的郁闭度结果图与ALS,CHM计算的郁闭度结果图, 我们发现: 由于自变量选取8种植被指数, 植被指数和光学影像存在一定的饱和现象, 而且没有考虑到地形,阴影等因子的影响, 再加上模型本身存在一定的误差, 因此导致3种模型都有低郁闭度区域高估和高郁闭度区域低估现象.MSR的低郁闭度高估现象较为严重, RF的高郁闭度低估现象较严重, 相对而言, Cubist虽然也存在这两种情况, 但都不是最为严重的, 可见其预测能力较强,较稳定, 整体反演结果较好, 能够用于较大范围或区域尺度的森林郁闭度遥感反演.结果表明, 结合LANDSAT ETM+影像和LiDAR数据反演森林郁闭度有很大的应用潜力.

4 结论和讨论

与传统郁闭度测定方法相比, 利用遥感估算模型能够更有效,更准确地获取大范围或区域的森林郁闭度, 有利于进一步的森林资源调查及管理工作的进行, 进而保护森林生态系统, 促进人类的可持续发展.而森林郁闭度的遥感估算精度与模型的好坏有着最直接的关系, 当然, 参与建模反演的遥感因子的选取也是很重要的.本研究用由ALS数据获取的CHM计算郁闭度作为训练数据, 与基于LANDSAT ETM+数据提取的8种植被指数共同构建MSR,RF和Cubist模型反演根河林区的森林郁闭度.通过对3种模型的反演结果进行精度验证及对比分析, 可以得到以下结论:

(1)就3种模型而言, 参与建模反演的因子及样本数量都是一样的, 因而从结果可以看出模型的好坏.综合来看, 3种模型中Cubist模型最优,最稳定, 其预测能力最强, 反演效果最好, R2 = 0.722, RMSE = 0.126, rRMSE = 0.209, EA (%) = 79.883.虽然Cubist存在低郁闭度高估和高郁闭度低估现象, 降低了模型反演精度, 但是与MSR和RF相比, 还是相对稳定一些.RF在建模过程中有明显的过拟合现象, R2高达0.940, 但从独立样本验证结果看, 精度优于MSR, 而从整体反演结果图可以看出, RF对高郁闭度区域的预测能力是最差的.MSR模型相对较差, 预测结果存在异常值, 反演精度高于建模精度, 而且低郁闭度高估的现象最为严重, 说明其稳定性不够, 泛化能力不强.3种模型算法都存在一定的不足, 也都有各自的优点.MSR算法成熟简单, 应用广泛, 但模型不稳定, 反演精度不高, 不适用于大区域的郁闭度估算; RF处理大数据速度快, 两个随机性的引入, 可减少过拟合情况的出现, 但是在本研究中由于样本数据存在噪声, 容易产生过拟合; Cubist在预测连续值方面很成功, 使用最近邻样本来调整规则预测结果, 但运算时间较长.

(2)从郁闭度反演结果可以看出, 3种模型均存在不同程度的低郁闭度高估和高郁闭度低估现象, 这也是目前森林参数遥感反演中普遍存在的问题.DVINDVI等植被指数对植被覆盖度较高的植被敏感度会下降, 导致在植被高覆盖区的植被指数趋近于饱和, 低植被覆盖区的植被指数被夸大, 高植被覆盖区的植被指数被压缩(赵英时, 2003).由于本研究参与建模的遥感因子选用的是从LANDSAT ETM+影像提取的8种植被指数, 在郁闭度较低的情况下, 如果树冠空隙处生长的灌草植被较多, 导致像元的植被指数掺入灌草植被指数的比例较大, 就会造成郁闭度估测值偏高, 这是植被指数和植被的光谱反射特点多决定的.徐定和彭道黎(2013)基于像元二分模型利用NDVI进行郁闭度估测时也出现了类似的情况.而在郁闭度较高的情况下, 由于遥感信号及植被指数的饱和问题, 郁闭度估测值偏低, 王云飞等(2013)基于随机森林算法估测橡胶(Hevea brasiliensis)林地上生物量也存在饱和问题, 对于生物量较高的地区反演结果偏低.另外, 在本研究中使用植被指数作为自变量参与建模反演, 并没有考虑到地形,阴影对植被指数的影响, 这可能也是导致误差的一个原因.因此, 下一步会尝试加入更多种类遥感数据和其他非遥感因子参与建模作为自变量, 例如采用地形因子,高分辨率遥感影像提取纹理特征等, 尽可能减少光学影像,植被指数,地形,阴影等带来的影响, 提高反演精度.这样对比不同模型的结果更有说服力, 同时, 尽可能选择不同的地域及不同植被类型也是很有必要的, 更适用于推广大区域的森林郁闭度反演.

(3)激光雷达能够弥补人工野外调查的不足, 有效地获取较大范围的精准数据, 提供高精度的林冠水平,垂直结构以及林冠覆盖的估算方法, 结合激光雷达数据和光学遥感数据可以大大提高区域尺度的森林参数遥感估测精度(Resette et al., 2008; Hudak et al., 2009; Sexton et al., 2014).因此, 从国内外研究进展及理论角度来看, 本研究以ALS,CHM计算的森林郁闭度作为模型训练数据和验证数据, 有效地弥补了传统郁闭度调查的不足, 结合LAND- SAT ETM+影像数据反演大区域森林郁闭度是很有潜力的一种郁闭度遥感估测方法.但由于缺乏地面实测郁闭度数据, 对ALS,CHM计算的森林郁闭度的可靠性和准确性没有进行验证, 在今后的研究中会尝试对激光雷达数据计算的郁闭度进行准确性和可靠性验证, 并对基于光学影像和地面实测数据及基于光学影像和LiDAR CHM计算数据进行定量评价, 将该方法推广应用于较大区域尺度或范围的森林郁闭度遥感估测, 为林业资源监测提供有力的依据.

致谢 感谢中国林业科学研究院资源信息研究所的老师和同学在本研究过程中给予的支持与帮助.

The authors have declared that no competing interests exist.

作者声明没有竞争性利益冲突.


参考文献

[1] Birth GS, McVey GR (1968).

Measuring the color of growing turf with a reflectance spectrophotometer.

Agronomy Journal, 60, 640-643.

[2] Breiman L (2001).

Random forests.

Machine Learning, 45, 5-32.

[本文引用: 1]     

[3] Chen C, Zhu YJ, Ju WM (2011).

Retrieval of subtropical forest canopy closure from remote sensing by using akaike information criterion and artificial neural network model.

Acta Agriculturae Jiangxi, 23(5), 149-153.(in Chinese with English abstract)
[陈崇, 朱延钧, 居为民 (2011).

基于赤池信息准则和人工神经网络的亚热带森林郁闭度遥感估算

. 江西农业学报, 23(5), 149-153.]

[本文引用: 1]     

[4] Colombo R, Bellingeri D, Fasolini D, Marino CM (2003).

Retrieval of leaf area index in different vegetation types using high resolution satellite data.

Remote Sensing of Environment, 86, 120-131.

[5] Coulston JW, Moisen GG, Wilson BT, Finco MV, Cohen WB, Brewer CK (2012).

Modeling percent tree canopy cover: A pilot study.

Photogrammetric Engineering & Remote Sensing, 78, 715-727.

[6] Deering DW, Rouse JW, Haas RH, Schell JA (1975).

Measuring 'Forage production' of grazing units from LANDSAT MSS data. International Symposium on Remote Sensing of Environment, 10th,

Ann Arbor, Mich, 1169-1178.

[7] Du WF, Wang FZ, Li Q (1999).

Some suggestions for increasing accuracy of canopy closure investigation.

Forest resources management, (3), 62-64(in Chinese).
[杜文峰, 王凤臻, 李庆 (1999).

提高郁闭度调查精度的几点建议

. 林业资源管理, (3), 62-64.]

[本文引用: 1]     

[8] Du XM, Cai TJ, Ju CY (2008).

Estimation of forest canopy closure by using parital least square regression.

Chinese Journal of Applied Ecology, 19, 273-277.(in Chinese with English abstract)
[杜晓明, 蔡体久, 琚存勇 (2008).

采用偏最小二乘回归方法估测森林郁闭度

. 应用生态学报, 19, 273-277.]

[本文引用: 1]     

[9] Fang KN, Wu JB, Zhu JP, Xie BC (2011).

A review of technologies on random forest.

Statistics & Information Tribune, 25(3), 32-37.(in Chinese with English abstract)
[方匡南, 吴见彬, 朱建平, 谢邦昌 (2011).

随机森林方法研究综述

. 统计与信息论坛,25(3), 32-37.]

[本文引用: 1]     

[10] Fu T, Pang Y, Huang QF, Liu QW, Xu GC (2011).

Prediction of subtropical forest parameters using airborne laser scanner.

Journal of Remote Sensing, 15, 1092-1104.(in English and Chinese)
[付甜, 庞勇, 黄庆丰, 刘清旺, 徐光彩 (2011).

亚热带森林参数的机载激光雷达估测

. 遥感学报, 15, 1092-1104.]

[本文引用: 1]     

[11] Gao YF, Li ZG, Yang ST, Liu XC, Cao Y (2012).

Study on canopy density retrieval method from SPOT5.

Research of Soil and Water Conservation, 19, 268-270.(in Chinese with English abstract)
[高云飞, 李智广, 杨胜天, 刘宪春, 曹勇 (2012).

基于SPOT5影像的郁闭度反演方法

. 水土保持研究, 19, 268-270.]

[本文引用: 1]     

[12] Gleason CJ, Im J (2012).

Forest biomass estimation from airborne LiDAR data using machine learning approaches.

Remote Sensing of Environment, 125, 80-91.

[本文引用: 2]     

[13] Hansen MC, Potapov PV, Moore R, Hancher M, Turubanova SA, Tyukavina A, Thau D, Stehman SV, Goetz SJ, Loveland TR, Kommareddy A, Egorov A, Chini L, Justice CO, Townshend JRG (2013).

High-resolution global maps of 21st-century forest cover change.

Science, 342, 850-853.

[本文引用: 1]     

[14] Hudak AT, Evans JS, Smith AMS (2009).

LiDAR utility for natural resource managers.

Remote Sensing, 1, 934-951.

[本文引用: 1]     

[15] Huete AR (1988).

A soil-adjusted vegetation index (SAVI).

Remote Sensing of Environment, 25, 295-309.

[16] Korhonen L, Korpela I, Heiskanen J, Maltamo M (2011).

Airborne discrete-return LiDAR data in the estimation of vertical canopy cover, angular canopy closure and leaf area index.

Remote Sensing of Environment, 115, 1065-1080.

[17] Kuhn M, Witson S, Keefer C, Coulter N (.

URL      [本文引用: 2]     

[18] Lei CL, Ju CY, Cai TJ, Jing X, Wei XH, Di XY (2012).

Estimating canopy closure density and above-ground tree biomass using partial least square methods in Chinese boreal forests.

Journal of Forestry Research, 23, 191-196.

[本文引用: 2]     

[19] Li YN, Zhang BL, Qin SY, Li SY, Huang XR (2008).

Review of research and application of forest canopy closure and its measuring methods.

World Forestry Research, 21(1), 41-46.(in Chinese with English abstract)
[李永宁, 张宾兰, 秦淑英, 李帅英, 黄选瑞 (2008).

郁闭度及其测定方法研究与应用

. 世界林业研究,21, 41-46.]

[本文引用: 1]     

[20] Liu DW, Sun GQ, Pang Y, Cai YL (2006).

Estimation of forest closure using LANDSAT TM data.

Remote Sensing Information, (1), 41-42.(in Chinese with English abstract)
[刘大伟, 孙国清, 庞勇, 蔡玉林 (2006).

利用LANDSAT TM数据对森林郁闭度进行遥感分级估测

. 遥感信息, (1), 41-42.]

[21] Moeser D, Roubinek J, Schleppi P, Morsdorf F, Jonas T (2014).

Canopy closure, LAI and radiation transfer from Airborne LiDAR synthetic images.

Agricultural and Forest Meteorology, 197(19), 158-168.

[本文引用: 1]     

[22] Nelson R, Krabill W, MacLean G (1984).

Determining forest canopy characteristics using airborne laser data.

Remote Sensing of Environment, 15, 201-212.

[本文引用: 1]     

[23] Nelson R, Krabill W, Tonelli J (1988).

Estimating forest biomass and volume using airborne laser data.

Remote Sensing of Environment, 24, 247-267.

[本文引用: 1]     

[24] Pang Y, Huang KB, Li ZY, Qin XL, Chen EX (2011).

Forest aboveground biomass analysis using remote sensing in the Greater Mekong Subregion.

Recourses Science, 33, 1863-1869.(in Chinese with English abstract)
[庞勇, 黄克标, 李增元, 覃先林, 陈尔学 (2011).

基于遥感的湄公河次区域森林地上生物量分析

. 资源科学,33, 1863-1869.]

[本文引用: 1]     

[25] Pang Y, Li ZY (2012).

Inversion of biomass components of the temperate forest using airborne LiDAR technology in Xiaoxing'an Mountains, Northeastern of China.

Chinese Journal of Plant Ecology, 36, 1095-1105.(in Chinese with English abstract)
[庞勇, 李增元 (2012).

基于机载激光雷达的小兴安岭温带森林组分生物量反演

. 植物生态学报,36, 1095-1105.]

[本文引用: 1]     

[26] Pang Y, Li ZY, Chen EX, Sun GQ (2005).

LiDAR remote sensing technology and its application in forestry.

Scientia Silvae Sinicae, 41(3), 129-136.(in Chinese with English abstract)
[庞勇, 李增元, 陈尔学, 孙国清 (2005).

激光雷达技术及其在林业上的应用

. 林业科学,41(3), 129-136.]

[27] Powell SL, Cohen WB, Healey SP, Kennedy RE, Moisen GG, Pierce KB, Ohmann JL (2010).

Quantification of live aboveground forest biomass dynamics with LANDSAT time-series and field inventory data: A comparison of empirical modeling approaches.

Remote Sensing of Environment, 114, 1053-1068.

[28] Qi J, Chehbouni A, Huete AR, Kerr YH, Sorooshian S (1994).

A modified soil adjusted vegetation index.

Remote Sensing of Environment, 48, 119-126.

[29] Richardson AJ, Wiegand CL (1977).

Distinguishing vegetation from soil background information.

Phote Engin & Remote Sense, 43, 1541-1552.

[30] Rosette JAB, North PRJ, Suárez JC (2008).

Vegetation height estimates for a mixed temperate forest using satellite laser altimetry.

International Journal of Remote Sensing, 29, 1475-1493.

[本文引用: 1]     

[31] Roujean JL, Breon FM (1995).

Estimating PAR absorbed by vegetation from bidirectional reflectance measurements.

Remote Sensing of Environment, 51, 375-384.

[32] Rouse JW, Haas RH, Schell JA, Deering DW (1974).

Monitoring vegetation systems in Great Plains with ERTS.

NASA Special Publication, 351, 309.

[本文引用: 1]     

[33] Sexton JO, Song XP, Feng M, Noojipady P, Anand A, Huang CQ, Kim D, Collins KM, Channan S, Dimiceli C, Townshend JR (2014).

Global, 30-m resolution continuous fields of tree cover: LANDSAT-based rescaling of MODIS vegetation continuous fields with LiDAR-based estimates of error.

International Journal of Digital Earth, 6, 427-448.

[本文引用: 1]     

[34] Soininen A (.

URL      [本文引用: 2]     

[35] Tan BX, Li ZY, Chen EX, Pang Y, Lei YC (2006).

Estimating forest crown closure using hyperion hyperspectral data.

Journal of Beijing Forestry University, 28(3), 95-101.(in Chinese with English abstract)
[谭炳香, 李增元, 陈尔学, 庞勇, 雷渊才 (2006).

Hyperion高光谱数据森林郁闭度定量估测研究

. 北京林业大学学报,28(3), 95-101.]

[本文引用: 1]     

[36] Wang T (2010).

Application on M5 algorithm in sensory evaluation.

Microcomputer Information, 26(11-3), 229-231.(in Chinese with English abstract)
[王涛 (2010).

M5算法在感觉评估中的应用

. 微计算机信息, 26(11-3), 229-231.]

[本文引用: 1]     

[37] Wang YF, Pang Y, Shu QT (2013).

Counter-estimation on aboveground biomass of Hevea brasiliensis plantation by remote sensing with random forest algorithm--A case study of Jinghong.

Journal of Southwest Forestry University, 33(6), 38-45.(in Chinese with English abstract)
[王云飞, 庞勇, 舒清态 (2013).

基于随机森林算法的橡胶林地上生物量遥感反演研究----以景洪市为例

. 西南林业大学学报,33(6), 38-45.]

[本文引用: 1]     

[38] Wu Y, Zhang DR, Zhang HK, Wu HG (2012).

Remote sensing estimation of canopy density combined with texture features.

Scientia Silvae Sinicae, 48(2), 48-53.(in Chinese with English abstract)
[吴飏, 张登荣, 张汉奎, 武红敢 (2012).

结合图像纹理特征的森林郁闭度遥感估测

. 林业科学, 48(2), 48-53.]

[本文引用: 1]     

[39] Xu D, Peng DL (2013).

Estimation of forest canopy closure based on dimidiate pixel model.

Journal of Northeast Forestry University, 41(2), 119-122.
(in Chinese with English abstract) [徐定, 彭道黎 (2013).

基于像元二分模型的森林郁闭度估测方法

. 东北林业大学学报,41(2), 119-122.]

[本文引用: 1]     

[40] Zeng T, Ju CY, Cai TJ, Liu WB, Yao YF (2010).

Selection of parameters for estimation canopy closure density using variable importance of projection criterion.

Journal of Beijing Forestry University, 32(6), 37-41.(in Chinese with English abstract)
[曾涛, 琚存勇, 蔡体久, 刘文彬, 姚月锋 (2010).

利用变量投影重要性准则筛选郁闭度估测参数

. 北京林业大学学报,32(6), 37-41.]

[41] Zhang J, Li XS, Wu BF (2014).

Forest cover estimation based on classification and regression trees of Miyun Reservoir upstream area.

Remote Sensing Technology and Application, 29, 394-400.(in Chinese with English abstract)
[张瑾, 李晓松, 吴炳方 (2014).

基于分类回归树的密云水库上游森林覆盖度遥感估算

. 遥感技术与应用,29, 394-400.]

[本文引用: 1]     

[42] Zhao YS (2003).Analysis Principle and Method of Remote Sensing Applications. 2nd edn. Science Press,Beijing. 368-380.(in Chinese) [赵英时 (2003). 遥感应用分析原理与方法(第二版). 科学出版社, 北京. 368-380.]

[本文引用: 3]     

[43] Zheng DM, Zeng WS, Zhi CG, Shi PC (2013).

Remote sensing estimation of forest canopy closure in forests of Three Gorges Reservoir Region.

Journal of Central South Forestry University, 33(9), 1-4.(in Chinese with English abstract)
[郑冬梅, 曾伟生, 智长贵, 施鹏程 (2013).

三峡库区森林郁闭度的遥感定量估测

. 中南林业科技大学学报, 33(9), 1-4.]

[44] Zou J, Zhuge XD (2011).

Forest canopy closure and the measured methodology.

Heilongjiang Science and Technology Information, 35, 290.
(in Chinese) [邹杰, 诸葛祥东 (2011).

森林郁闭度及其测定方法

. 黑龙江科技信息,35, 290.]

/