基于邻域最小生成树的半监督极化SAR图像分类方法

滑文强 王爽 郭岩河 谢雯

引用本文:
Citation:

基于邻域最小生成树的半监督极化SAR图像分类方法

    作者简介: 滑文强(1987–),男,陕西西安人,现为西安邮电大学计算机学院讲师,研究方向为极化SAR图像处理。E-mail: huawenqiang2013@163.com;王 爽(1978–),女,西安电子科技大学教授,博士生导师,智能信息处理研究所副所长,智能感知与图像理解教育部重点实验室成员,国家“111”计划创新引智基地成员,IEEE会员,IET会员,中国电子学会会员,中国计算机学会会员。主要从事SAR/PolSAR处理与分析、稀疏表示、机器学习等方面的研究工作。E-mail: shwang@mail.xidian.edu.cn;郭岩河(1990–),男,福建泉州人,西安电子科技大学博士研究生,主要研究方向为极化SAR图像处理、深度学习、机器学习等。E-mail: 1153603266@qq.com;谢 雯(1989–),陕西西安人,现为西安邮电大学通信工程学院讲师,主要研究方向为极化SAR图像处理。E-mail: xiewen236@163.com.
    通讯作者: 滑文强, huawenqiang2013@163.com
  • 基金项目:

    国家自然科学基金面上项目(61771379),陕西省普通高等学校重点学科专项

  • 中图分类号: TN958

Semi-supervised PolSAR Image Classification Based on the Neighborhood Minimum Spanning Tree

    Corresponding author: HUA Wenqiang, huawenqiang2013@163.com ;
  • Fund Project: The National Natural Science Foundation of China (61771379), Shaanxi Key Disciplines of Special Funds Projects

    CLC number: TN958

  • 摘要: 该文针对极化SAR图像分类中只有少量标记样本的问题,提出了一种基于邻域最小生成树的半监督极化SAR图像分类方法。该方法针对极化SAR图像以像素为分类对象的特点,结合自训练方法的思想,利用极化SAR图像像素点的空间信息,提出了基于邻域最小生成树辅助学习的样本选择策略,增加自训练过程中被选择无标记样本的可靠性,扩充标记样本数量,训练更好的分类器。最终用训练好的分类器对极化SAR图像进行测试。对3组真实的极化SAR图像进行测试,实验结果表明,该方法在只有少量标记样本的情况下能获得满意的分类结果,且分类正确率明显优于传统的分类算法。
  • 图 1  自训练方法

    Figure 1.  Self-training method

    图 2  极化SAR协方差矩阵中9个元素的灰度值

    Figure 2.  The gray value of 9 elements in PolSAR covariance matrix

    图 3  带权无向图G及其最小生成树

    Figure 3.  Weighted undirected graph G and its minimum spanning tree

    图 4  基于邻域的最小生成树生成过程

    Figure 4.  The spanning process of neighborhood minimum spanning tree

    图 5  基于邻域最小生成树的半监督极化SAR分类方法

    Figure 5.  Semi-supervised PolSAR classification based on the neighborhood minimum spanning tree

    图 6  Flevoland地区AIRSAR L波段数据不同方法的分类结果

    Figure 6.  Classification results of the Flevoland data acquired by AIRSAR

    图 7  Flevoland地区Radarsat-2 C波段数据不同方法的分类结果

    Figure 7.  Classification result of the Flevoland data acquired by Radarsat-2

    图 8  旧金山地区Radarsat-2 C波段数据不同方法的分类结果

    Figure 8.  Classification result of the San Francisco data acquired by Radarsat-2

    图 9  迭代次数对实验结果的影响

    Figure 9.  The effects of number of iterations in the proposed method

    表 1  AIRSAR L波段的Felvoland地区不同分类算法的分类精度(%)

    Table 1.  Classification accuracy of the Flevoland area acquired by AIRSAR L band (%)

    区域方法
    WishartSVMSelf-training本文方法
    Stembeans91.4870.0790.8298.75
    Rapeseed61.8338.0267.1459.58
    Bare soil97.5186.8970.9796.75
    Potatoes79.4758.3880.2781.99
    Beet92.3585.6195.0594.60
    Wheat 267.4371.8067.3989.86
    Peas93.1077.7095.2497.56
    Wheat 382.0882.4294.3397.05
    Lucerne84.5340.7781.6795.06
    Barley81.9698.2998.6298.39
    Wheat81.4668.2885.3485.41
    Grasses66.4965.0381.7580.08
    Forest84.2161.0377.6694.77
    Water46.8565.3269.3993.35
    Building81.7778.912.1885.58
    OA79.4070.3077.1989.92
    下载: 导出CSV

    表 2  AIRSAR L波段的Felvoland 地区不同训练样本的分类结果

    Table 2.  Classification results of the Flevoland area acquired by AIRSAR L band with different number of training samples

    方法训练样本数
    4 6 8 10
    OA (%)KappaOA (%)KappaOA (%)KappaOA (%)Kappa
    Wishart74.620.7215 76.190.7459 78.780.7656 80.260.7831
    SVM56.070.542358.120.561164.420.610270.300.6682
    Self-training63.360.602568.420.656973.890.714677.230.7489
    本文方法79.330.788883.060.809386.900.841689.920.8852
    下载: 导出CSV

    表 3  Radarsat-2 C波段的Felvoland地区不同分类算法的分类精度(%)

    Table 3.  Classification accuracy of the Flevoland area acquired by Radarsat-2 C band (%)

    区域方法
    WishartSVMSelf-training本文方法
    Urban69.6154.7563.9371.44
    Water98.7196.8399.1098.82
    Forest91.6565.2573.8383.63
    Cropland55.2778.9779.2382.24
    OA78.8173.9579.0284.03
    下载: 导出CSV

    表 4  Radarsat-2 C波段的Felvoland 地区不同训练样本的分类结果

    Table 4.  Classification results of the Flevoland area acquired by Radarsat-2 C band with different number of training samples

    方法训练样本数
    4 6 8 10
    OA (%)KappaOA (%)KappaOA (%)KappaOA (%)Kappa
    Wishart69.210.5803 73.650.6239 76.810.6854 78.810.7026
    SVM50.790.415364.790.547170.050.596873.950.6394
    Self-training65.690.523370.410.591174.400.660579.450.7144
    本文方法76.710.676879.290.723582.020.764484.030.7882
    下载: 导出CSV

    表 5  Radarsat-2 C波段的旧金山地区不同分类算法的分类结果(%)

    Table 5.  Classification accuracy of the San Francisco area acquired by radarsat-2 C Band (%)

    区域方法
    WishartSVMSelf-training本文方法
    Water98.7090.0498.0499.92
    Vegetation91.0378.5184.4591.50
    Low-Density Urban81.3042.3170.1875.05
    High-Density Urban42.5877.1533.0168.27
    Developed55.2624.0056.1658.81
    OA73.7762.4068.3778.71
    下载: 导出CSV

    表 6  Radarsat-2 C波段的旧金山地区不同训练样本的分类结果

    Table 6.  Classification results of the San Francisco area acquired by Radarsat-2 C band with different number of training samples

    方法训练样本数
    4 6 8 10
    OA (%)KappaOA (%)KappaOA (%)KappaOA (%)Kappa
    Wishart68.090.5181 70.440.5439 72.490.5867 73.770.6011
    SVM50.240.281751.250.290556.310.362862.400.4342
    Self-training52.340.312658.620.366963.270.435768.420.5308
    本文方法70.870.548273.150.598675.230.628478.710.6852
    下载: 导出CSV
  • [1] NUNZIATA F, MIGLIACCIO M, LI Xiaofeng, et al. Coastline extraction using dual-Polarimetric COSMO-SkyMed PingPong mode SAR data[J]. IEEE Geoscience and Remote Sensing Letters, 2014, 11(1): 104–108. doi: 10.1109/LGRS.2013.2247561
    [2] HE Jinglu, WANG Yinghua, LIU Hongwei, et al. A novel automatic PolSAR ship detection method based on superpixel-level local information measurement[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(3): 384–388. doi: 10.1109/LGRS.2017.2789204
    [3] BUONO A, NUNZIATA F, MIGLIACCIO M, et al. Classification of the yellow river delta area using fully polarimetric SAR measurements[J]. International Journal of Remote Sensing, 2017, 38(23): 6714–6734. doi: 10.1080/01431161.2017.1363437
    [4] RATHA D, BHATTACHARYA A, and FRERY A C. Unsupervised classification of PolSAR data using a scattering similarity measure derived from a geodesic distance[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(1): 151–155. doi: 10.1109/LGRS.2017.2778749
    [5] LI Dong and ZHANG Yunhua. Adaptive model-based classification of PolSAR data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(12): 6940–6955. doi: 10.1109/TGRS.2018.2845944
    [6] HUANG Xiayuan, ZHANG Bo, QIAO Hong, et al. Local discriminant canonical correlation analysis for supervised PolSAR image classification[J]. IEEE Geoscience and Remote Sensing Letters, 2017, 14(11): 2102–2106. doi: 10.1109/LGRS.2017.2752800
    [7] REDOLFI J, SÁNCHEZ J, and FLESIA A G. Fisher vectors for PolSAR image classification[J]. IEEE Geoscience and Remote Sensing Letters, 2017, 14(11): 2057–2061. doi: 10.1109/LGRS.2017.2750800
    [8] LIU Hongying, WANG Yikai, YANG Shuyuan, et al. Large polarimetric SAR data semi-supervised classification with spatial-anchor graph[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2016, 9(4): 1439–1458. doi: 10.1109/JSTARS.2016.2518675
    [9] HUA W Q, WANG S, YANG Zhao et al. Semi-supervised PolSAR image classification based on improved Tri-training[C]. 2017 IEEE International Geoscience and Remote Sensing Symposium, Fort Worth, USA, 2017:3937-3940.
    [10] ROSENBERG C, HEBERT M, and SCHNEIDERMAN H. Semi-supervised self-training of object detection models[C]. Proceedings of the 2005 7th IEEE Workshops on Applications of Computer Vision, Breckenridge, USA, 2005: 29–36.
    [11] BLUM A and MITCHELL T. Combining labeled and unlabeled data with co-training[C]. Proceedings of the 11th Conference on Computational Learning Theory, Madison, USA, 1998: 92–100.
    [12] ZHU Zhihua and LI Ming. Tri-training: Exploiting unlabeled data using three classifiers[J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(11): 1529–1541. doi: 10.1109/TKDE.2005.186
    [13] LIU Hongying, WANG Yikai, ZHU Dexiang, et al.. Semi-supervised classification based on anchor-spatial graph for large polarimetric SAR data[C]. Proceedings of 2015 IEEE International Geoscience and Remote Sensing Symposium, Milan, Italy, 2015: 1845–1848.
    [14] LIU Hongying, ZHU Dexiang, YANG Shuyuan, et al. Semisupervised feature extraction with neighborhood constraints for polarimetric SAR classification[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2016, 9(7): 3001–3015. doi: 10.1109/JSTARS.2016.2532922
    [15] WU Wenjin, LI Hailei, ZHANG Lu, et al. High-resolution PolSAR scene classification with pretrained deep convnets and manifold polarimetric parameters[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(10): 6159–6168. doi: 10.1109/TGRS.2018.2833156
    [16] RASMUS A, VALPOLA H, HONKALA M, et al. Semi-supervised learning with ladder networks[J]. arXiv: 1507.02672, 2015.
    [17] CHENG Yanhua, ZHAO Xin, CAI Rui, et al. Semi-supervised multimodal deep learning for RGB-D object recognition[C]. Proceedings of the 25th International Joint Conference on Artificial Intelligence, New York, USA, 2016: 3345–3351.
    [18] HÄNSCH R and HELLWICH O. Semi-supervised learning for classification of polarimetric SAR-data[C]. Proceedings of 2009 IEEE International Geoscience and Remote Sensing Symposium, Cape Town, South Africa, 2009: 987–990.
    [19] Liu H Y, Wang Y K, Zhua D X et al.. Semi-supervised classification based on anchor-spatial graph for large polarimetric SAR data[C]. 2015 IEEE International Geoscience and Remote Sensing Symposium, Milan, Italy, 2015:1845-1848.
    [20] HUA Wenqiang, WANG Shuang, LIU Hongying, et al. Semisupervised PolSAR image classification based on improved cotraining[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(11): 4971–4986. doi: 10.1109/JSTARS.2017.2728067
    [21] GENG Jie, MA Xiaorui, FAN Jianchao, et al. Semisupervised classification of polarimetric SAR image via superpixel restrained deep neural network[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(1): 122–126. doi: 10.1109/LGRS.2017.2777450
    [22] LASZLO M and MUKHERJEE S. Minimum spanning tree partitioning algorithm for microaggregation[J]. IEEE Transactions on Knowledge and Data Engineer, 2005, 17(7): 902–911. doi: 10.1109/TKDE.2005.112
    [23] 王晓东. 计算机算法设计与分析[M]. 第4版, 北京: 电子工业出版社, 2012: 103–104.WANG Xiaodong. Design and Analysis of Algorithms[M]. 4th Ed, Beijing: China, Electronic Industry Press, 2002: 103–104.
    [24] LEE J S, GRUNES M R, AINSWORTH T L, et al. Unsupervised classification using polarimetric decomposition and the complex Wishart classifier[J]. IEEE Transactions on Geoscience and Remote Sensing, 1999, 37(5): 2249–2258. doi: 10.1109/36.789621
    [25] LEE J S, GRUNES M R, and DE GRANDI G. Polarimetric SAR speckle filtering and its implication for classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 1999, 37(5): 363–373. doi: 10.1109/36.789635
    [26] LONG Y, and LIU X. SVM lithological classification of PolSAR image in yushigou Area, Qilian Mountain[J]. Scientific Journal of Earth Science, 2013, 3(4): 128–132.
    [27] LEE J S, GRUNES M R, and KWOK R. Classification of multi-look polarimetric SAR imagery based on complex Wishart distribution[J]. International Journal of Remote Sensing, 1994, 15(11): 2299–2311. doi: 10.1080/01431169408954244
  • [1] 钟能杨文杨祥立郭威 . 基于混合Wishart模型的极化SAR图像非监督分类. 雷达学报, doi: 10.12000/JR16133
    [2] 滑文强王爽侯彪 . 基于半监督学习的SVM-Wishart极化SAR图像分类方法. 雷达学报, doi: 10.12000/JR14138
    [3] 邢艳肖张毅李宁王宇胡桂香 . 一种联合特征值信息的全极化SAR图像监督分类方法. 雷达学报, doi: 10.12000/JR16019
    [4] 陶臣嵩陈思伟李永祯肖顺平 . 结合旋转域极化特征的极化SAR地物分类. 雷达学报, doi: 10.12000/JR16131
    [5] 徐丰王海鹏金亚秋 . 深度学习在SAR目标识别与地物分类中的应用. 雷达学报, doi: 10.12000/JR16130
    [6] 胡涛李卫华秦先祥王鹏余旺盛李军 . 基于深度卷积神经网络和条件随机场模型的PolSAR图像地物分类方法. 雷达学报, doi: 10.12000/JR18065
    [7] 张月邹焕新邵宁远周石琳计科峰 . 一种用于极化SAR图像的快速超像素分割算法. 雷达学报, doi: 10.12000/JR17018
    [8] 肖东凌刘畅 . 基于精调的膨胀编组-交叉CNN的PolSAR地物分类. 雷达学报, doi: 10.12000/JR19039
    [9] 邹焕新罗天成张月周石琳 . 基于组合条件随机场的极化SAR图像监督地物分类. 雷达学报, doi: 10.12000/JR16109
    [10] 折小强仇晓兰雷斌张薇卢晓军 . 一种极化熵结合混合GEV模型的全极化SAR潮间带区域地物分类方法. 雷达学报, doi: 10.12000/JR16149
    [11] 杨文钟能严天恒杨祥立 . 基于黎曼流形的极化SAR图像分类. 雷达学报, doi: 10.12000/JR17031
    [12] 孙勋黄平平涂尚坦杨祥立 . 利用多特征融合和集成学习的极化SAR图像分类. 雷达学报, doi: 10.12000/JR15132
    [13] 邵璐熠洪文 . 基于二维极化特征的PolSAR图像决策分类. 雷达学报, doi: 10.12000/JR16002
    [14] 赵娟萍郭炜炜柳彬崔世勇张增辉郁文贤 . 基于概率转移卷积神经网络的含噪标记SAR图像分类. 雷达学报, doi: 10.12000/JR16140
    [15] 黄晓菁杨祥立黄平平杨文 . 基于原型理论的极化SAR图像特征表达. 雷达学报, doi: 10.12000/JR15071
    [16] 胡丁晟仇晓兰雷斌徐丰 . 极化串扰对基于Cloude分解的地物散射机制特征量影响分析. 雷达学报, doi: 10.12000/JR16129
    [17] 吴佳妮陈永光代大海庞礴王雪松 . 基于人造目标极化HRRP的散射机理分类. 雷达学报, doi: 10.12000/JR16026
    [18] 韦顺军田博坤张晓玲师君 . 基于半正定规划的压缩感知线阵三维SAR自聚焦成像算法. 雷达学报, doi: 10.12000/JR17103
    [19] 李银伟韦立登向茂生 . 机载干涉SAR 运动补偿中地物目标定位误差的影响分析. 雷达学报, doi: 10.3724/SP.J.1300.2013.13040
    [20] 孙翔宋红军王宇李宁 . 基于高分辨率全极化SAR图像的取向角校正方法. 雷达学报, doi: 10.12000/JR18026
  • 加载中
图(9)表(6)
计量
  • 文章访问数:  311
  • HTML浏览量:  71
  • PDF下载量:  36
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-12-03
  • 录用日期:  2018-12-28
  • 网络出版日期:  2019-02-19

基于邻域最小生成树的半监督极化SAR图像分类方法

    通讯作者: 滑文强, huawenqiang2013@163.com
    作者简介: 滑文强(1987–),男,陕西西安人,现为西安邮电大学计算机学院讲师,研究方向为极化SAR图像处理。E-mail: huawenqiang2013@163.com;王 爽(1978–),女,西安电子科技大学教授,博士生导师,智能信息处理研究所副所长,智能感知与图像理解教育部重点实验室成员,国家“111”计划创新引智基地成员,IEEE会员,IET会员,中国电子学会会员,中国计算机学会会员。主要从事SAR/PolSAR处理与分析、稀疏表示、机器学习等方面的研究工作。E-mail: shwang@mail.xidian.edu.cn;郭岩河(1990–),男,福建泉州人,西安电子科技大学博士研究生,主要研究方向为极化SAR图像处理、深度学习、机器学习等。E-mail: 1153603266@qq.com;谢 雯(1989–),陕西西安人,现为西安邮电大学通信工程学院讲师,主要研究方向为极化SAR图像处理。E-mail: xiewen236@163.com
  • ①. 西安邮电大学计算机学院   西安   710121
  • ②. 西安邮电大学陕西省网络数据分析与智能处理重点实验室   西安   710121
  • ③. 智能感知与图像理解教育部重点实验室 国际智能感知与计算联合研究中心西安电子科技大学   西安   710071
基金项目:  国家自然科学基金面上项目(61771379),陕西省普通高等学校重点学科专项

摘要: 该文针对极化SAR图像分类中只有少量标记样本的问题,提出了一种基于邻域最小生成树的半监督极化SAR图像分类方法。该方法针对极化SAR图像以像素为分类对象的特点,结合自训练方法的思想,利用极化SAR图像像素点的空间信息,提出了基于邻域最小生成树辅助学习的样本选择策略,增加自训练过程中被选择无标记样本的可靠性,扩充标记样本数量,训练更好的分类器。最终用训练好的分类器对极化SAR图像进行测试。对3组真实的极化SAR图像进行测试,实验结果表明,该方法在只有少量标记样本的情况下能获得满意的分类结果,且分类正确率明显优于传统的分类算法。

English Abstract

    • 极化SAR图像分类作为极化SAR图像理解与解译的重要研究内容,近年来受到越来越多研究者的关注,并广泛应用到各个领域,如土地覆盖类型判别、地面目标检测、地质勘探、植被种类判别等[13]。根据分类方法中标记样本和无标记样本的利用方式,极化SAR地物分类方法主要可以分为3种类型:无监督分类方法[4,5]、监督分类方法[6,7]和半监督分类方法[8,9]

      对于极化SAR图像分类问题,监督分类方法通常比无监督分类更容易获得好的分类结果,但是监督分类方法通常需要充足的标记样本作为训练样本,而实际中标记样本的获取是非常困难,需要耗费大量的人力物力。而无标记数据获取相对容易,并且无标记的数据也能反映数据的某些信息,能够有效地帮助学习分类器。因此,如何利用大量的无标记样本对少量的标记样本进行补充辅助训练的半监督学习方法,引起了研究者的广泛关注,成为了当前研究的热点。近年来,很多半监督分类方法被提出来,如自训练(Self-training)方法[10]、协同训练方法(Co-training和Tri-training)[11,12]、标签传播聚类算法、基于图的半监督分类算法[13,14]和基于半监督的神经网络算法[1517]等。然而针对极化SAR图像分类问题的半监督方法研究较少,Hansch[18]提出了一种基于聚类算法的半监督极化SAR分类方法,将半监督思想同聚类方法相结合,通过被选择未标记样本对聚类中心进行约束,利用未标记样本的约束影响聚类中心,获得更好的分类结果。为利用极化SAR数据中的空间信息,Liu等人[19]提出了基于邻域约束半监督特征提取的极化SAR图像分类方法。为使半监督训练中选择的未标记样本具有更高的可靠性和多样性,Wang等人[20]提出了基于改进协同训练的半监督极化SAR图像分类方法,通过协同训练的方式选择多样性的样本,通过预选择的方法增加被选择样本的可靠性。此外,结合深度学习方法和半监督学习思想,Geng等人[21]提出了基于超像素约束的深度神经网络半监督极化SAR分类方法。但是这些半监督分类方法都需要一定的标记样本,在标记样本非常少,只有几个标记像素的条件下,很难获得较好的分类结果。因此,本文针对此问题,提出一种基于邻域最小生成树的半监督极化SAR图像分类方法。该方法利用邻域最小生成树方法辅助半监督学习,在自训练的过程中通过邻域最小生成树辅助的方式选择更可靠的无标记样本扩大训练样本集,改善分类器的性能。

      自训练学习方法是一种典型的半监督学习方法,该方法利用现有的标记数据训练得到的模型对无标记的样本进行预测,选择可靠性高的样本以及其被赋予的标签加入到标记样本集中,通过不断循环的自训练,逐渐增加训练集中的样本数量并逐步改善分类器性能,该方法的框架图如图1所示。由图1可以看出,自训练方法的关键是选择可靠性的样本,如果选择的样本不正确,使错误的样本加入到训练集中,不仅不能使分类器性能得到改善反而会降低分类器的性能。因此,如何选择高置信度的样本成为自训练算法的关键。而在极化SAR图像分类中,由于只有少量的标记样本,在少量标记样本下训练的分类器是一个弱分类器,直接在弱分类器的结果中选择的样本很难保证其可靠性。如果将错误标记的样本加入到标记样本集中,反而会使分类器的性能下降。因此,为增加被选择样本的可靠性,结合极化SAR图像像素间的空间信息,本文提出了基于邻域最小生成树的样本选择方法,通过邻域最小生成树辅助选择的方法增加被选择样本的可靠性。

      图  1  自训练方法

      Figure 1.  Self-training method

      因此,本文算法的主要贡献为:(1)针对极化SAR图像分类中标记样本非常少的问题,提出了一种新的基于邻域最小生成树的半监督极化SAR图像分类方法,该方法同时利用未标记样本和标记样本的信息有效地提高分类正确率;(2)为增加自训练过程中被选择样本的可靠性,结合极化SAR图像像素间的空间信息,在最小生成树的基础上针对极化SAR图像分类的特性,提出了基于邻域最小生成树样本选择方法。

    • 在极化SAR数据中,每个像素点都可以表示为一个相干矩阵T或协方差矩阵C

      $ [{C}] \!=\!\! \left[\!\!\!\! {\begin{array}{*{20}{c}} {\left\langle {{{\left| {{{S}_{\rm{HH}}}} \right|}^2}} \right\rangle }\!\!&\!\!{\sqrt 2 \left\langle {{{S}_{\rm{HH}}}{S}_{\rm{HV}}^*} \right\rangle }\!\!&\!\!{\left\langle {{{S}_{\rm{HH}}}{S}_{\rm{VV}}^*} \right\rangle }\\ {\sqrt 2 \left\langle {{{S}_{\rm{HV}}}{S}_{\rm{HH}}^*} \right\rangle }\!\!&\!\!{2\left\langle {{{\left| {{{S}_{\rm{HV}}}} \right|}^2}} \right\rangle }\!\!&\!\!{\sqrt 2 \left\langle {{{S}_{\rm{HV}}}{S}_{\rm{VV}}^*} \right\rangle }\\ {\left\langle {{{S}_{\rm{VV}}}{S}_{\rm{HH}}^*} \right\rangle }\!\!&\!\!{\sqrt 2 \left\langle {{{S}_{\rm{VV}}}{S}_{\rm{HV}}^*} \right\rangle }\!\!&\!\!{\left\langle {{{\left| {{{S}_{\rm{VV}}}} \right|}^2}} \right\rangle } \end{array}} \!\!\!\! \right] $

      (1)

      其中,HH表示水平发射水平接收,VV表示垂直发射垂直接收,HV表示水平发射垂直接收。由协方差矩阵C的矩阵表示形式可以看出,协方差矩阵是一个对角线为实数的复共轭对称矩阵,并且由协方差矩阵转换的9维特征向量通常可以作为极化SAR数据特征的一种表示,并在极化图像处理中取得良好的效果[9],该向量表示为

      $ \begin{align} {view} =& \! \bigr[{{C}\!_{11}},{{C}\!_{22}},{{C}\!_{33}},{\rm{real}}(\!{{C}\!_{12}}),{\rm{imag}}(\!{{C}\!_{12}}),\\ {\rm{}}& \quad{\rm{real}}(\!{{C}\!_{13}}),{\rm{imag}}(\!{{C}\!_{13}}),{\rm{real}}(\!{{C}\!_{23}}),{\rm{imag}}(\!{{C}\!_{23}})\bigr] \end{align} $

      (2)

      其中,real()表示实部,imag()表示虚部。

      图2(a)为美国旧金山地区的极化SAR数据,图2(b)图2(j)为由该数据的协方差矩阵转化的9维特征向量中每一元素增强10倍的灰度图。由9维特征向量每一元素的灰度图可以看出,每一元素都可以基本描述原始图像的大致信息,并且不同元素的灰度图都不相同,具有一定互补性,因此可以直接做为极化SAR图像的特征信息来描述极化SAR图像。

      图  2  极化SAR协方差矩阵中9个元素的灰度值

      Figure 2.  The gray value of 9 elements in PolSAR covariance matrix

    • 为增强自训练过程中被选样本的可靠性,在训练过程中逐步优化基分类器,结合极化SAR图像像素间的空间邻域信息,本文提出了基于邻域最小生成树的样本选择方法。

    • 在图论问题中,对于连通且没有环路的连通图称为树,在一个连通图里删除所有的环路而形成的树叫做该图的生成树,其中具有最小总权重的树,被称为最小生成 (Minimum Spanning Tree, MST)[22]。定义为:在无带权的无向连通图G中,$W({v_i},{v_j})$表示任意两个节点ij之间边的权重的大小,若无向图G中存在着权重之和最小的生成树,则该树就是无向图G的最小生成树。图3为带权值的连通图G和其最小生成树。

      图  3  带权无向图G及其最小生成树

      Figure 3.  Weighted undirected graph G and its minimum spanning tree

      图3(a)可以看出任意两个节点都通过带权重的边相连,对于无向图G来说,可以由不同的节点出发得到不同的生成树模型。图3(b)为由权重最小的边遍历所有节点得到的最小生成树,对于无向图G来说,图3(b)是其唯一的最小生成树。

      本文采用Prim算法[23]计算最小生成树,该算法是一种产生最小生成树的算法。该算法从给定的顶点开始,每次选择一个与当前顶点最近的一个点,将该点与顶点之间的边加入到树中。其形式描述如下:

      步骤1 输入:在一个加权无向图G中,顶点集合为V,权值边的集合为E

      步骤2 初始化:${{{V}}\! _r} = \{ x\} $,其中x为初始顶点,${{{E}} _r} = \{ \} $为空;

      步骤3 重复下列操作,直到所有的顶点都加入到集合${{{V}}\! _r}$中:(1)在集合E中选择权重最小的边[u, v],其中u${{{V}} \!_r}$中的元素,v为集合${{V}} $中的元素,且$v \notin {{{V}} \!_r}$; (2)将v加入到集合${{{V}} \!_r}$中,将边[u, v]加入到集合${{{E}} _r}$中;

      步骤4 输出:用集合${{{V}} \!_r}$${{{E}} _r}$表示所得到的最小生成树。

    • 通过对最小生成树算法分析可以看出,最小生成树的生成过程非常符合极化SAR图像的分类过程,极化SAR图像中每一像素点对应生成树中的节点,像素之间的相似性关系类似于生成树中节点间的边的权重,因此最小生成树方法非常适用于极化SAR图像的分类。然而要生成最小生成树,首先要构建无向图G,顶点的集合V和边的集合E,然而对大小为$N \times N$的极化SAR图像来说,需要计算${N^2}({N^2} - 1)/2$条边,需要耗费大量的时间。而极化SAR图像分类是对图像中每一个像素点分类,因此根据图像中像素点之间的空间关系,相邻的像素之间具有更高的相似性,提出了基于像素点空间邻域的Prim最小生成树算法,该算法描述如下:

      步骤1 构建无向图G(V, E),其中V为顶点(已标记像素点),用式(3)计算每一顶点于其8邻域边的集合E

      步骤2 选择顶点其8邻域内与其边的权值最小的边,并对与其权值最小的像素点进行标记,然后将其作为标记样本加入到顶点集合V中;

      步骤3 重复步骤1—步骤2过程直到选择完整幅图像中所有的像素点。

      该方法中需要计算各个顶点之间边的距离,由于极化SAR数据服从复Wishart分布,因此在极化SAR图像中,两个像素点之间的相似距离通常采用Wishart距离[24]表示

      $ {w_{i,j}} = \frac{1}{2}{\rm{Tr}}({({{T}\!_i})^{ - 1}}{{T}\!_j} + {({{T}\!_j})^{ - 1}}{{T}\!_i}) - q $

      其中,${\rm{Tr}}( \cdot )$表示矩阵的迹,${{T}\!_i}$${{T}\!_j}$分别表示像素点$i$$j$的相干矩阵,对于发射与接收是一体的雷达,由于其互易性,则$q = 3$,对于发射和接收不是一体的雷达,$q = 4$

      图4为该算法的生成过程,图中绿色的矩形表示初始的顶点,灰色的矩形表示其邻域的顶点,矩形中的数字表示中心像素点与邻域像素点的距离,距离越小越相似。第1次学习过程,选择初始顶点邻域边最小的顶点,距离为‘1’的点,如图4(b)所示,然后再在新的顶点集合的邻域内选择边最小的顶点,如图4(c)所示,添加到以初始顶点为根的树的集合中,依次循环,直到选择完所有的顶点为止。

      图  4  基于邻域的最小生成树生成过程

      Figure 4.  The spanning process of neighborhood minimum spanning tree

    • 本文针对极化SAR图像分类中只有少量标记样本的问题,为在少量标记样本的条件下获得较高的分类正确率,在传统自训练方法的基础上提出了基于邻域最小生成树的半监督极化SAR图像分类方法。该方法的核心是在自训练的过程中由大量的无标记样本中选择可靠的样本,将其添加到标记样本中,扩大标记样本的数量,逐渐优化分类器性能,最终实现提高分类正确率的目的。为此,结合最小生成树方法和极化SAR图像中像素点的空间信息,提出了基于邻域最小生成的样本选择方法,增加被选择样本的可靠性。本文所提方法的整个框架图如图5所示,具体步骤如下:

      图  5  基于邻域最小生成树的半监督极化SAR分类方法

      Figure 5.  Semi-supervised PolSAR classification based on the neighborhood minimum spanning tree

      步骤1 为降低斑点噪声对极化SAR数据的影响,采用精致Lee滤波[25]对极化SAR数据滤波,滤波窗口大小为$7 \times 7$

      步骤2 以初始的标记像素点为初始顶点,构建无向图G,生成多个邻域最小生成树,每一个树中的像素点具有相同的标记;

      步骤3 利用初始的标记样本点,以view为每一个像素点的特征信息训练SVM分类器,并用训练好的SVM分类器对邻域最小生成树标记的样本进行测试;

      步骤4 挑选由分类器测试得到的结果中与邻域最小生成树生成的结果中标记一致的样本,添加到初始的标记样本集中,更新标记样本集;

      步骤5 重复步骤2到步骤4过程t次,直到得到满意的分类器;

      步骤6 用训练好的分类器对剩余样本进行测试。

    • 本文采用3组真实的极化SAR数据:(1)荷兰Flevoland 地区1989年8月由L波段的NASA/JPI AIRSAR 获得,该数据包含有$750 \times 1024$个像素点,空间分辨率为6 m$ \times $12.1 m,主要包含15类农作物,如图6所示;(2)荷兰地区2008年4月由C波段的Radarsat-2获取的极化SAR数据,该数据主要包含$1400 \times 1200$个像素点,空间分辨率为12 m$ \times $8 m,主要包含城市、水域、深林和农田4种类别,如图7所示;(3)美国旧金山地区2008年由C波段的Radarsat-2获取的极化SAR数据,该数据主要包含$1300 \times 1300$个像素点,空间分辨率为12 m$ \times $8 m,主要包含高密度城市、低密度城区、水域、植被和开发区域5种类别,如图8所示。

      图  6  Flevoland地区AIRSAR L波段数据不同方法的分类结果

      Figure 6.  Classification results of the Flevoland data acquired by AIRSAR

      图  7  Flevoland地区Radarsat-2 C波段数据不同方法的分类结果

      Figure 7.  Classification result of the Flevoland data acquired by Radarsat-2

      图  8  旧金山地区Radarsat-2 C波段数据不同方法的分类结果

      Figure 8.  Classification result of the San Francisco data acquired by Radarsat-2

      本文以SVM为基本分类器,采用径向基核函数和5倍的交叉验证,为了验证本文算法的有效性,将本文方法与传统的基于自训练的半监督方法(Self-training)[10]、基于SVM分类器的监督分类方法(采用径向基核函数和5倍的交叉验证)[26]和监督Wishart方法[27]进行比较,并用总分类正确率和Kappa系数对实验结果进行评估,所有的实验进行10次,用平均值表示最终的分类结果。

    • 本实验中每类别选择不同数量的标记样本(10, 8, 6, 4)作为训练样本。图6(a)为Pauli分解的RGB图,图6(a1)为真实地物。实验结果如图6表1表2所示。图6(b)为本文方法的分类结果,图6(c)为传统Self-training算法的分类结果,图6(d)为监督Wishart方法的分类结果,图6(e)为SVM方法的分类结果。 表1为每类训练样本数量为10时不同方法的分类正确率。

      区域方法
      WishartSVMSelf-training本文方法
      Stembeans91.4870.0790.8298.75
      Rapeseed61.8338.0267.1459.58
      Bare soil97.5186.8970.9796.75
      Potatoes79.4758.3880.2781.99
      Beet92.3585.6195.0594.60
      Wheat 267.4371.8067.3989.86
      Peas93.1077.7095.2497.56
      Wheat 382.0882.4294.3397.05
      Lucerne84.5340.7781.6795.06
      Barley81.9698.2998.6298.39
      Wheat81.4668.2885.3485.41
      Grasses66.4965.0381.7580.08
      Forest84.2161.0377.6694.77
      Water46.8565.3269.3993.35
      Building81.7778.912.1885.58
      OA79.4070.3077.1989.92

      表 1  AIRSAR L波段的Felvoland地区不同分类算法的分类精度(%)

      Table 1.  Classification accuracy of the Flevoland area acquired by AIRSAR L band (%)

      方法训练样本数
      4 6 8 10
      OA (%)KappaOA (%)KappaOA (%)KappaOA (%)Kappa
      Wishart74.620.7215 76.190.7459 78.780.7656 80.260.7831
      SVM56.070.542358.120.561164.420.610270.300.6682
      Self-training63.360.602568.420.656973.890.714677.230.7489
      本文方法79.330.788883.060.809386.900.841689.920.8852

      表 2  AIRSAR L波段的Felvoland 地区不同训练样本的分类结果

      Table 2.  Classification results of the Flevoland area acquired by AIRSAR L band with different number of training samples

      表1可以看出,本文分类方法的分类正确率为89.92%,高于Self-training分类方法12.73%,高于SVM分类方法19.62%,高于监督Wishart方法10.52%,而且本文方法中大部分类别的分类正确率都高于其它的对比方法。这主要是因为本文所提出半监督分类算法能够有效地利用标记样本和无标记样本的信息,并采用邻域最小生成树的策略辅助选择高可靠性的样本,改善了基分类器的性能。但是本文方法在Rapeseed的分类正确率只有59.58%,低于Self-training方法7.56%。由图6(b)可以看出,在本文方法中一部分Rapeseed被分为了Wheat 2和Wheat 3,这主要是这几种农作物的叶子形状非常相近,很难区别。对比图6(c)可以看出,在Self-training方法中一部分Wheat 2和Wheat 3被错分为Rapeseed,因此虽然在Self-training方法中Rapeseed的分类正确率高,但是Wheat 2和Wheat 3分类正确率要低于本文方法的分类结果。此外本文方法在Bare soil区域的分类正确率虽然低于Wishart方法的分类正确率,但是分类正确率也已经大于96%。而且由图6(d)可以看出,Wishart方法将很大一部分Water区域错划分为Bare soil区域,使Water区域的分类正确率只有46.85%,远低于本文方法在该区域的分类正确率93.35%。由表2可以看出不同标记样本时本文方法的分类正确率都要高于对比方法的分类结果;本文方法的Kappa系数也高于对比方法的Kappa系数,而且通过对比图6中本文方法和对比方法的分类结果表示,也可以看出本文方法的分类结果的区域一致性也比其它的对比方法好。

    • 本实验中分别选择每类别为不同数量的标记样本(10, 8, 6, 4)作为训练样本。图7(a)为Pauli分解的RGB图,图7(a1)为真实地物。实验结果如图7表3表4所示。图7(b)为本文算法的分类结果,图7(c)为Self-training方法的分类结果,图7(d)为监督Wishart方法的分类结果,图7(e)为SVM方法的分类结果。 表3为每类选10个标记样本时,不同方法的分类正确率。

      区域方法
      WishartSVMSelf-training本文方法
      Urban69.6154.7563.9371.44
      Water98.7196.8399.1098.82
      Forest91.6565.2573.8383.63
      Cropland55.2778.9779.2382.24
      OA78.8173.9579.0284.03

      表 3  Radarsat-2 C波段的Felvoland地区不同分类算法的分类精度(%)

      Table 3.  Classification accuracy of the Flevoland area acquired by Radarsat-2 C band (%)

      方法训练样本数
      4 6 8 10
      OA (%)KappaOA (%)KappaOA (%)KappaOA (%)Kappa
      Wishart69.210.5803 73.650.6239 76.810.6854 78.810.7026
      SVM50.790.415364.790.547170.050.596873.950.6394
      Self-training65.690.523370.410.591174.400.660579.450.7144
      本文方法76.710.676879.290.723582.020.764484.030.7882

      表 4  Radarsat-2 C波段的Felvoland 地区不同训练样本的分类结果

      Table 4.  Classification results of the Flevoland area acquired by Radarsat-2 C band with different number of training samples

      表3表4可以看出,本文方法的分类结果明显高于传统的Self-training方法,SVM方法和Wishart分类方法。由表4可以看出当每类训练样本数量10时,本文分类方法的分类正确率为84.03%,高于Self-training分类方法4.58%,高于SVM分类方法10.08%,高于监督Wishart方法5.22%。由表3可以看出本文方法在Urban和Cropland区域的分类正确率都要高于对比方法,但是在Forest区域的分类正确率低于监督Wishart方法的分类正确率。由图7(d)可以看出,这主要是因为Wishart方法中一部分Cropland区域被分为了Forest类,虽然Wishart方法的Water区域分类正确率高,但是Cropland区域的分类正确率只有55.27%,明显低于本文所提方法,而且本文方法Forest和Cropland区域总的分类正确率也要高于Wishart方法。而由表4可以看出选择不同数量的标记样本时,本文方法的分类正确率都要高于对比方法;同时本文方法的Kappa系数也高于对比方法的Kappa系数,而且通过对比图7中本文方法和对比方法的分类结果图,也可以看出本文方法的分类结果的区域一致性也比其它的对比方法要好。因此可以得出相同的结论,本文所提方法要明显优于传统的分类方法,尤其是在标记样本较少的情况下。

    • 本实验分别选择每类别为不同数量的标记样本(10, 8, 6, 4)作为训练样本。图8(a)为Pauli分解的RGB图,图8(a1)为真实地物。实验结果如图8表5表6所示。图8(b)为本文方法的分类结果,图8(c)为Self-training方法的分类结果,图8(d)为监督Wishart方法的分类结果,图8(e)为SVM方法的分类结果。表5为每类选10个标记样本时,不同方法的分类正确率。

      区域方法
      WishartSVMSelf-training本文方法
      Water98.7090.0498.0499.92
      Vegetation91.0378.5184.4591.50
      Low-Density Urban81.3042.3170.1875.05
      High-Density Urban42.5877.1533.0168.27
      Developed55.2624.0056.1658.81
      OA73.7762.4068.3778.71

      表 5  Radarsat-2 C波段的旧金山地区不同分类算法的分类结果(%)

      Table 5.  Classification accuracy of the San Francisco area acquired by radarsat-2 C Band (%)

      方法训练样本数
      4 6 8 10
      OA (%)KappaOA (%)KappaOA (%)KappaOA (%)Kappa
      Wishart68.090.5181 70.440.5439 72.490.5867 73.770.6011
      SVM50.240.281751.250.290556.310.362862.400.4342
      Self-training52.340.312658.620.366963.270.435768.420.5308
      本文方法70.870.548273.150.598675.230.628478.710.6852

      表 6  Radarsat-2 C波段的旧金山地区不同训练样本的分类结果

      Table 6.  Classification results of the San Francisco area acquired by Radarsat-2 C band with different number of training samples

      表5表6可以看出,本文方法的分类结果明显高于传统的Self-training方法,SVM方法和Wishart分类方法。由表6可以看出当每类训练样本数量10时,本文分类方法的分类正确率为78.71%,高于Self-training分类方法10.29%,高于SVM分类方法16.31%,高于监督Wishart方法4.94%。由表5可以看出本文方法在大部分区域的分类正确率都要高于对比方法,但是在Low-Density Urban区域的分类正确率低于监督Wishart方法的分类正确率。由图8(d)可以看出,这主要是因为Wishart方法中Low-Density Urban区域和High-Density Urban区域没有被有效地区分开,一部分的High-Density Urban区域被错分为Low-Density Urban,导致虽然Wishart方法的Low-Density Urban区域分类正确率高,但是High-Density Urban区域的分类正确率只有42.58%,明显低于本文所提方法,而且在本文方法中这两个区域总的分类正确率也要高于Wishart方法。而由表6可以看出当标记样本数量不同时,本文方法的分类正确率都要高于对比方法;对比本文方法的Kappa系数和对比方法的Kappa系数,可以发现本文方法的Kappa系数要明显高于对比方法的,而且通过对比图8中本文方法和对比方法的分类结果图,也可以看出本文方法的分类结果的区域一致性也比其它的对比方法要好。因此我们可以得出相同的结论,本文所提方法要明显优于传统的分类方法,尤其是在标记样本较少的情况下。

    • 前面的实验已经验证了本文方法的有效性,本节分析迭代次数(自训练次数)对实验结果的影响。图9(a)为迭代次数对分类正确率的影响,由图9(a)可以看出随着迭代次数的增加分类正确率逐渐增加,当迭代次数大于8次的时候分类正确率的增长逐渐减小趋于平滑。图9(b)为迭代次数所消耗的时间成本,由图9(b)可以看出随着迭代次数的增加所耗费的时间迅速增加,这主要是因为随着迭代次数的增加,标记样本数量增加,最小生成树的种子点数量增加,最小生成树所需要的时间增加,自训练分类器的时间也增加。

      图  9  迭代次数对实验结果的影响

      Figure 9.  The effects of number of iterations in the proposed method

    • 本文提出了一种基于邻域最小生成树的半监督极化SAR图像分类方法。该方法能够有效地利用标记样本和无标记样本,通过邻域最小生成树辅助学习的方式选择高可靠性的样本,添加到标记样本集中,通过自训练的方式不断扩大标记样本集,优化分类器,使在只有少量标记样本时能够获得较高的分类正确率。并对3组真实极化SAR数据进行测试,实验结果表明本文方法能够获得满意的分类结果,尤其是在标记样本非常少的情况下。而且通过选择不同比例的训练样本实验表明相较于传统的方法本文方法获得的分类精度更高。此外,通过分析迭代次数对实验结果的影响实验表明,本文方法选择的无标记样本是可靠的,通过添加被选择的无标记样本扩大标记样本集逐渐改善分类器的性能。

参考文献 (27)

目录

    /

    返回文章
    返回