Volume 8 Issue 4
Aug.  2019
Article Contents
Turn off MathJax

Citation:

PolSAR Image Classification Method Based on Markov Discriminant Spectral Clustering

  • Corresponding author: ZHANG Xiangrong, xrzhang@mail.xidian.edu.cn
  • Received Date: 2019-06-01
    Accepted Date: 2019-07-22
    Fund Project:

    The National Natural Science Foundation of China (61772400), The Key Research and Development Plans of Shaanxi Province (2019ZDLGY03-08)

  • Due to the existing spectral clustering methods have low accuracy for PolSAR image classification, a Markov-based Discriminative Spectral Clustering(MDSC) method is proposed, which has the characteristics of low-rank and sparse decomposition. Firstly, a real low-rank probability transfer matrix is restored as an input to the standard Markov spectral clustering method to reduce the influence of noise on the classification result. Then the discriminative information is introduced into the objective function to make the polarimetric SAR image data can be more fully used. Finally, the augmented Lagrangian multiplier method is used to solve the objective function optimization problem under low-rank and probability simplex constraints. Experiments on three different data sets of Flevoland, Oberpfaffenhofen, and Xi’an show that our method has good accuracy and low sensitivity, which having a good classification performance.
  • 加载中
  • [1] 邹焕新, 罗天成, 张月, 等. 基于组合条件随机场的极化SAR图像监督地物分类[J]. 雷达学报, 2017, 6(5): 541–553. doi: 10.12000/JR16109ZOU Huanxin, LUO Tiancheng, ZHANG Yue, et al. Combined conditional random fields model for supervised PolSAR images classification[J]. Journal of Radars, 2017, 6(5): 541–553. doi: 10.12000/JR16109
    [2] FREEMAN A and DURDEN S L. A three-component scattering model for polarimetric SAR data[J]. IEEE Transactions on Geoscience and Remote Sensing, 1998, 36(3): 963–973. doi: 10.1109/36.673687
    [3] BUONO A, NUNZIATA F, MIGLIACCIO M, et al. Classification of the Yellow River delta area using fully polarimetric SAR measurements[J]. International Journal of Remote Sensing, 2017, 38(23): 6714–6734. doi: 10.1080/01431161.2017.1363437
    [4] JOULIN A, BACH F, and PONCE J. Discriminative clustering for image co-segmentation[C]. Proceedings of 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Francisco, USA, 2010: 1943–1950.
    [5] HARALICK R M, SHANMUGAM K, and DINSTEIN I. Textural features for image classification[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1973, SMC-3(6): 610–621. doi: 10.1109/TSMC.1973.4309314
    [6] RATHA D, BHATTACHARYA A, and FRERY A C. Unsupervised classification of PolSAR data using a scattering similarity measure derived from a geodesic distance[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(1): 151–155. doi: 10.1109/LGRS.2017.2778749
    [7] AHMED N and CAMPBELL M. Variational Bayesian learning of probabilistic discriminative models with latent softmax variables[J]. IEEE Transactions on Signal Processing, 2011, 59(7): 3143–3153. doi: 10.1109/TSP.2011.2144587
    [8] LIN Zhouchen, CHEN Minming, and MA Ya. The augmented Lagrange multiplier method for exact recovery of corrupted low-rank matrices[J]. Eprint Arxiv, 2010(9): 26.
    [9] XIA Rongkai, PAN Yan, DU Lei, et al. Robust multi-view spectral clustering via low-rank and sparse decomposition[C]. Proceedings of the Twenty-Eighth AAAI Conference on Artificial Intelligence, Québec City, 2014: 2149–2155.
    [10] CAI Jianfeng, CANDÈS E J, and SHEN Zuowei. A singular value thresholding algorithm for matrix completion[J]. SIAM Journal on Optimization, 2010, 20(4): 1956–1982. doi: 10.1137/080738970
    [11] ZHU Ciyou, BYRD R H, LU Peihuang, et al. Algorithm 778: L-BFGS-B: Fortran subroutines for large-scale bound-constrained optimization[J]. ACM Transactions on Mathematical Software, 1997, 23(4): 550–560. doi: 10.1145/279232.279236
    [12] KUMAR Y, MULLER U, BEN J, et al. spectral clustering MIT Press[C]. 24th Annual Conference on Neural Information Processing Systems, Vancouver, Canada, 2010.
    [13] MATSUGU M, MORI K, ISHII M, et al. Convolutional spiking neural network model for robust face detection[C]. Proceedings of the 9th International Conference on Neural Information Processing, Singapore, Singapore, 2002: 660–664.
  • 加载中
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

Figures(10) / Tables(4)

Article views(644) PDF downloads(136) Cited by()

Related
Proportional views

PolSAR Image Classification Method Based on Markov Discriminant Spectral Clustering

    Corresponding author: ZHANG Xiangrong, xrzhang@mail.xidian.edu.cn
  • Artificial Intelligence Institute, Xidian University, Key Laboratory of Intelligent Perception and Image Understanding of Ministry of Education, International Research Center for Intelligent Perception and Computation, Xi’an 710071, China
Fund Project:  The National Natural Science Foundation of China (61772400), The Key Research and Development Plans of Shaanxi Province (2019ZDLGY03-08)

Abstract: Due to the existing spectral clustering methods have low accuracy for PolSAR image classification, a Markov-based Discriminative Spectral Clustering(MDSC) method is proposed, which has the characteristics of low-rank and sparse decomposition. Firstly, a real low-rank probability transfer matrix is restored as an input to the standard Markov spectral clustering method to reduce the influence of noise on the classification result. Then the discriminative information is introduced into the objective function to make the polarimetric SAR image data can be more fully used. Finally, the augmented Lagrangian multiplier method is used to solve the objective function optimization problem under low-rank and probability simplex constraints. Experiments on three different data sets of Flevoland, Oberpfaffenhofen, and Xi’an show that our method has good accuracy and low sensitivity, which having a good classification performance.

    HTML

    1.   引言
    • 极化SAR (PolSAR) 图像地物分类在地质勘探、地形分析以及灾害监测等方面具有广泛的应用[1]。随着理论水平的逐年提高,加上图像处理领域的巨大需求,极化SAR图像的分类问题成为了研究领域的热点。

      根据算法是否依赖于数据的先验样本,极化SAR图像分类算法可以具体地分为有监督与无监督两大类。无监督分类方法主要是利用极化数据的统计特征对同类型像素进行分类,不需要进行训练,因此当训练样本严重不足的情况下,采用无监督分类方法的优势十分明显。且无监督方法的图像分类过程简单,充分利用了图像的有效信息,适用范围十分广泛。无监督的极化SAR分类主要分为两类:基于地物目标电磁散射特性和统计特性的分类法[2]以及基于聚类分析和图像处理技术的分类法[3]。然而目前基于无监督的方法大多从极化数据的统计特性和散射特性角度出发,很少从图像本身角度去考虑,不能充分利用极化数据的特征信息,无法全面地描述地面目标的物理属性。因此,如何深度挖掘极化SAR图像的特征信息,采用高效的处理方法提高分类精度,是当前极化SAR分类面临的挑战,同时也是本文重点关注的问题。

      谱聚类在分析复杂的数据结构信息时,通过得到数据点的不同相似图来预测聚类标签,往往能够显示出其较强的聚类能力。将判别聚类方法应用到极化SAR图像的分类中有两个优点:首先,判别聚类可以将有监督的判别能力引入无监督分类问题中,现有的监督学习工具在弱监督任务和无监督任务中具有良好的重要性能;其次,判别聚类是一个通用框架,它允许将不同的判别损失函数或其他特定领域的约束合并到一个单一的损失函数中,适用于不同的应用程序,并且具有很强的灵活性[4]

      但是,现有的聚类方法只是简单地将数据中的信息组合在一起,产生的噪声会大大降低聚类的性能。为了解决上述问题,本文提出一种基于马尔科夫的判别谱聚类方法(Markov Discriminative Spectral Clustering,MDSC),具有低秩和稀疏分解的特点。在应用本方法时,首先需要构造一个原始的概率转移矩阵,然后用其恢复一个真实的低秩概率转移矩阵作为标准马尔科夫谱聚类方法的关键输入。为了能够对极化SAR的数据信息进行多层次利用,本文在目标函数中引入了判别信息以提升聚类精度。

      对于本方法中的目标函数的优化问题,在概率转移矩阵上有一个低秩约束,同时在该矩阵的每一行上有一个概率单纯形约束,本文提出了一种基于增广拉格朗日乘子法的优化方法来解决这个有难度的优化问题。本文后续在各种实际数据集上进行实验,结果表明,本方法具有较好的准确率,表现出了良好的分类性能。

    2.   基于马尔科夫的判别谱聚类

      2.1.   标准马尔科夫谱聚类框架

    • 由随机游走理论分析,当随机游走到某个分类时,在该类中停留的概率较大,游走到其他类的概率较小。由此,Meila等人[5]提出,谱聚类可以用图结构上的马尔科夫随机游动框架来描述。马尔科夫链状态簇是根据每个状态到平稳态的距离进行聚类的,可以在拓扑图上的随机游走框架中连接,状态转移概率图可以看作是一个有向图。由此将谱聚类的图谱理论应用于马尔科夫链中,以达到聚类的目的。求解马尔科夫随机游动的转移概率矩阵的特征值问题可以用来确定图上的归一化分割。本文所用的标准马尔科夫谱聚类算法流程如下:

      步骤1 计算所有数据点的相似度,构建相似度矩阵S;

      步骤2 计算概率转移矩阵P=D–1S以及它的平稳分布π=Pπ;

      步骤3 构造拉普拉斯矩阵L=P–1/2(PP+PTP),其中P表示对角元素为π(i)的对角矩阵;

      步骤4 对L进行特征分解,得到前k个最小的特征向量;

      步骤5 将这前k个特征向量作为矩阵的列向量构建特征矩阵;

      步骤6 将特征矩阵的每一行作为数据点,利用k -均值算法对其进行聚类。

    • 2.2.   构造概率转移矩阵

    • 在马尔科夫判别谱聚类方法中,最为关键的一步是如何构造一个精确的概率转移矩阵。本文通过低秩和稀疏分解的方法,恢复真实的概率转移矩阵,并将其用作标准马尔科夫谱聚类方法的输入,以获得最终的聚类解决方案。

      该方法的基本假设有两个:

      (1) 无向加权图G的特征足以发现大部分聚类信息;

      (2) 提取的特征可能会被噪声破坏,即这些噪声可能会导致一小部分数据点被分配到错误的类。

      给定一组数据点$\left\{ {{x_1},{x_2},·\!·\!·,{x_n}} \right\}$,可以构造它们之间的相似度矩阵S和相应的加权图G=(V,E,S)。根据上述两个假设,原始概率转移矩阵P的构造形式可以被分解为如下两个部分:一个反映底层真正聚类信息的真实概率转移矩阵${\hat {{P}}}$,加上表示编码噪声的偏移误差矩阵E,如图1所示即

      Figure 1.  Real probability transfer matrix construction profile

      一旦${\hat {{P}}}$被给出,那么就可以直接使用${\hat {{P}}}$作为输入概率转移矩阵到马尔科夫链算法中进行谱聚类,得到最终的聚类解。

      在这一步中的一个关键问题是如何对潜在概率转移矩阵${\hat {{P}}}$和误差矩阵E进行建模。

      在现实的谱聚类问题中,可以假设同一簇内任意两点之间的转移概率较高,而不同簇内两点之间的转移概率较低且近似为0,从而导致概率转移矩阵的秩往往较低。综上所述,根据这些观察结果可以假设,反映潜在真实聚类信息的概率转移矩阵往往是低秩的。

      误差矩阵E表示了P${\hat {{P}}}$之间的差异。根据假设,提取的特征足以识别大多数集群结构,所以P中的元素与${\hat {{P}}}$中相应的元素只有一小部分显著不同,可以说误差矩阵E 趋于稀疏。

      综上所述,在低秩稀疏假设下,可以将真实的概率转移矩阵构造问题表示为,

      由于原始概率转移矩阵P的构建中只考虑了数据点之间的相似度,为了对数据信息进行多层次的充分利用,在目标函数中引入表示判别信息的判别损失函数Ec

      其中,Ec表示极化 SAR 图像分类的判别损失函数,1是全一向量,$\lambda $, $\beta $表示非负平衡参数,迹范数${\Big\| {\hat {{P}}} \Bigr\|_*}$${\hat {{P}}}$的秩在谱范数的单位球上的凸包络,在实际问题中,最小化迹范数能够得到理想的低秩结构[6]$\hat {{P}} \ge {{0}},\hat {{P}}{{1}} = {{1}}$表示${\hat {{P}}}$的每一行都是一个概率分布,这强制保证了${\hat {{P}}}$一定是一个概率转移矩阵。

    • 2.3.   引入判别信息

    • 判别聚类是一个将不同的判别损失函数或其他特定约束合并到一个损失函数中的通用框架。在进行聚类的过程中,可以通过分析不同类别的样本信息,得到各自的特点与规律,进而构建出更加准确的判别准则对数据进行分类。本节将一种新的基于判别聚类的模型引入马尔科夫谱聚类算法中,提高算法的信息利用率,改善分类精度。

      本节根据SR模型[7]重新设计了判别损失函数,它结合了判别聚类项和正则项。前一项负责利用判别信息构建softmax损失函数,后一项负责降低由噪声和异常值引起的过拟合。

      综上所述,在判别聚类的基础上,将判别损失函数定义为

      其中,W表示分类器矩阵,L(P,W|X)是softmax损失函数,R(W)表示正则项。引入softmax损失函数是为了解决由于不同类别的像素数不同而导致的样本不平衡问题,该函数度量了分类器W与原始的概率转移矩阵之间的一致性。用交叉熵来定义softmax损失函数L(P,W|X)

      其中,e是自然常数,k表示类的个数。

      引用正则项R(W)来降低由噪声和异常值引起的过拟合。R(W)定义如下

      其中,$ \xi$是正则项参数,由于$\xi $>0,因此损失函数Ec是严格凸的,并且一定有一个唯一解。本文固定$\xi $=5×10–6

      判别损失函数Ec(P,W|X)虽然遵循SR模型的式,但本质上是不同的。在softmax分类方法中,训练数据集中的ground-truth类标签为常量。而在判别方法中,类标是在无监督算法下需要通过聚类得到的变量。

    3.   模型优化求解
    • 在本节中将利用增广拉格朗日乘子法[8]来解决上一节中低秩和概率单纯形约束下的目标函数优化问题。与朴素拉格朗日方法相比,该方法提高了算法的鲁棒性,并放宽了函数的强凸约束,使变换后的问题更易于求解。

      下面根据 Xia 等人[9]提出的鲁棒多视角谱聚类(Robust Multi-view Spectral Clustering, RMSC)方法,对$\hat {{P}}$, E, Ec进行更新求解。

      首先假设Ec是已知的,式(2)对应的增广拉格朗日函数为

      其中,H是拉格朗日算子,μ>0是自适应惩罚参数。

      (1) 求解E 固定$\hat {{P}}$时,优化问题可以简化为

      利用奇异值阈值法[10]可以得到E的近似解

      其中,${S_\delta }\left( {{X}} \right) = \max ({{X}} - \delta ) + \min ({{X}} + \delta )$

      (2) 求解${ {\hat{ {P}}}}$:固定E后,优化问题可以表示为

      ${{{U}}{{∑}}{{V}}^{\rm{T}}}$$\left( {{{P}}- {{E}} - \dfrac{{{H}}}{\mu }} \right)$的SVD分解,可以得到$\hat {{P}}$的解为

      (3) 求解Ec:根据式(10),由于${\hat {{P}}}$可以通过迭代原始的概率转移矩阵P得到,因此可以通过固定的P来最小化分类器W,并使用迭代优化算法来解决这个问题。

      Ec进行求导,梯度可计算为

      根据这个求导式,使用L-BFGS优化算法[10]来最小化式。

      综上所述,真实的概率转移矩阵构建算法框架如下:

      步骤1 根据式(10)更新${\hat {{P}}}$

      步骤2 根据式(8)更新E

      步骤3 令${{H}} \leftarrow {{H}} + \mu \left( {{{P}} - \hat {{P}}} \right)$

      步骤4 令$\mu \leftarrow \min (\rho \mu ,\max {x_\mu })$

      步骤5 使用L-BFGS优化算法更新Ec;

      步骤6 达到终止条件$\min \left(\left\|\hat {{P}} \!+\! {{E}} \!-\! {{P}}\right\|_\infty ,\right.$$ \left\|{{{E}_{c}}}\right\|_\infty \Bigr) \le \omega$后停止迭代。

      得到真实的概率转移矩阵后,即可按照表标准马尔科夫谱聚类的算法流程,得到极化SAR图像的最终分类结果,如图2所示。

      Figure 2.  Algorithm frame diagram

    4.   实验结果与分析

      4.1.   实验数据与环境说明

    • 由于本文算法是在马尔科夫谱聚类算法基础上的改进模型,对目标函数的不足进行优化,并引入了判别信息。因此在实验中选取3个对比算法如下:

      (1) 联合正则谱聚类(Co-Regularized spectral clustering, Co-Reg) [11]:谱聚类的共正则化方法,Kumar于2011年提出;

      (2) 混合马尔科夫链(Mixture of Markov Chains, MMC)[12]:Zhou和Burges于 2007年提出的混合马尔科夫链方法,这是与本文所提基于马尔科夫链的判别谱聚类算法最相关的方法;

      (3) SR-MO算法[13]:Haixia Bi提出的无监督判别聚类方法,利用监督Softmax 逻辑回归 (Softmax logistic Regression, SR)模型和大量特征进行无监督分类并在分类过程中采用了马尔可夫随机场优化算法(Markov random field Optimization, MO),且考虑了空间关系。

      本节在荷兰Flevoland地区小农田和大农田、德国Oberpfaffenhofen地区和西安地区这4幅真实的极化SAR数据上进行实验,以上4种数据分别来自不同的成像系统,包含不同的波段与数据类型,通过以上数据证明本文算法的有效性。仿真实验均是在主频2.50 GHz的Intel(R) Core(TM) i5-7300HQ CPU, 8 G的内存环境和Windows10操作系统中编程实现的。实验结果均为MATLAB R2017a的软件环境中进行10次实验的平均值。

      本文实验主要用总体分类精度OA、平均分类精度AA以及Kappa系数作为分类的评价指标。

    • 4.2.   荷兰Flevoland地区农田小图实验结果

    • 本实验数据为NASA在1989年使用AIRSAR系统获得的荷兰Flevoland地区L波段的农田小图数据,该组图像的大小为300×270。图像主要包含裸土、马铃薯、甜菜、大麦、豌豆、小麦6种农作物。

      Co-Reg, MMC以及SR-MO 3种不同对比算法和本文算法对Flevoland地区小农田图的总体分类精度OA、平均分类精度AA以及Kappa系数如表1所示;分类结果图如图3所示。

      裸土土豆甜菜大麦豌豆小麦OAAAKappa
      Co-Reg0.88600.94520.75510.79060.82620.89600.84000.84980.8775
      MMC0.91800.95800.72420.96230.87560.69940.87080.83960.9005
      SR-MO0.90340.90490.88450.95610.83620.95540.91300.90670.9331
      本文算法0.90480.90880.88340.96040.89200.93820.92430.91460.9418

      Table 1.  Classification results of four algorithms for Flevoland small farmland map

      Figure 3.  Pseudo-color map, class diagram and classification results of different algorithms for farmland maps in the Flevoland region of the Netherlands

      图3中,图3(a)是荷兰Flevoland地区农田小图的Pauli分解伪彩图,图3(b)是地物类标图,图3(c)图3(e)分别是Co-Reg, MMC以及SR-MO算法的分类结果图,图3(f)是本文算法的分类结果图。

      从总体分类精度和平均分类精度来看,本文方法均为最高且总体分类精度达92.43%,分别比Co-Reg, MMC和SR-MO算法高出8.43%, 5.35%和1.13%。虽然MMC在马铃薯这一类的分类效果最好,对豌豆、小麦等大多数地物类别也更加准确,但这也导致了将部分甜菜等地物错分为马铃薯,影响分类精度。这也说明了与单纯马尔科夫谱聚类算法相比,本文提出的引入判别信息的马尔科夫谱聚类算法更有优势。并且在分类结果图中,可以看出本文算法对不同的地物分类比较均衡,边缘更清晰,孤立像素更少,显示出算法的平滑效果,Kappa系数也是最高的,验证了本文方法的有效性。

    • 4.3.   德国Oberpfaffenhofen地区实验结果

    • 本实验数据为德国国家宇航中心DLR使用ESAR系统拍摄的德国Oberpfaffenhofen地区L波段极化SAR数据的局部,400×450,分辨率为3×2.2 m。该区域主要分为农田、居民区、林地、道路和其它地物5类。

      Co-Reg, MMC和SR-MO 3种不同对比算法和本文算法对德国Oberpfaffenhofen地区的总体分类精度OA、平均分类精度AA以及Kappa系数如表2所示,分类的结果图如图4 所示。

      Co-RegMMCSR-MO本文算法
      农田0.61110.60180.68590.7016
      居民区0.60720.65210.73360.7389
      林地0.81620.79930.90550.9108
      道路0.53110.56810.60490.6418
      其他0.87910.87890.86730.8814
      OA0.73630.74710.78220.7974
      AA0.68890.70000.75940.7749
      Kappa0.61700.63480.69200.7205

      Table 2.  Classification results of four algorithms for the Oberpfaffenhofen region of Germany

      Figure 4.  Pseudo-color map, class diagram and data classification results of different algorithms in the Oberpfaffenhofen region of Germany

      图4中,图4(a)是德国Oberpfaffenhofen地区的Pauli分解伪彩图,图4(b)是地物类标图,图4(c)图4(e)分别是Co-Reg, MMC以及SR-MO算法的分类结果图,图4(f)是本文算法的分类结果图。

      图4中能够看出,图4(c)的杂点最多,区域一致性最差。图4(d)整体分类效果较好,但和本文算法相比,对边缘像素点的分类效果不太理想。图4(e)图4(f)相比,图4(e)将林地和开放型区域错分的像素点较多。图4(d)错分的杂点较多,将大部分林地区域错分为开放型区域。对比算法的实验结果图中,图4(e)分类效果最好。

      由实验结果表2可以得到本文算法的总体分类精度为79.74%,分别比Co-Reg, MMC和SR-MO方法高出6.11%, 5.03%和1.52%。Kappa系数和平均分类正确率也优于对比方法。这说明了本文算法对德国Oberpfaffenhofen地区的分类效果较好,地物之间的分界较为清晰,能够识别出农田和道路,以及大部分的林地区域。同时,可以看到本文算法在处理除过道路之外的区域时,分类效果很好,且更加稳定,尤其在图中间的农场区域,分类更为连贯平整,视觉效果好,杂点较少。Co-Reg方法对于道路的误分现象较为严重,大部分道路没有被识别。SR-MO方法能够有效识别大部分的道路、郊区、林地,以及农田,却将大部分的农田误分为郊区,分类效果也不够理想,这是由于仅仅基于判别信息进行分类,没有反映极化数据的统计特征。不过这4类算法对中间道路的分类效果都不是很好,还有很大的改进完善空间,但相对来说本文算法的道路边界更为清晰平滑,视觉效果更好。

    • 4.4.   西安地区实验结果

    • 本实验数据为由加拿大太空署RADARSAT-2系统获取的西安地区极化SAR图像,该图像大小为512×512,主要有河流、城区、植被3种地物分类。

      Co-Reg, MMC以及SR-MO 3种不同对比算法和本文算法对西安地区的总体分类精度OA、平均分类精度AA以及Kappa系数如表3所示;分类的结果图如图5所示。

      Co-RegMMCSR-MO本文算法
      河流0.93720.88760.91890.8890
      城区0.73000.66220.81280.8550
      植被0.68760.80520.80060.8555
      OA0.74000.76700.82270.8503
      AA0.72590.75840.81360.8436
      Kappa0.73410.77100.80710.8471

      Table 3.  Classification results of four algorithms for Xi’an area

      Figure 5.  Pseudo-color map, class diagram and data classification results of different algorithms in Xi’an area

      图5中,图5(a)是西安地区的Pauli分解伪彩图,图5(b)是地物类标图,图5(c)图5(e)分别是Co-Reg, MMC以及SR-MO算法的分类结果图,图5(f)是本文算法的分类结果图。

      表3可以看出本文算法的总体分类精度为85.03%,分别比Co-Reg, MMC和SR-MO高出11.03%, 8.33%和2.76%,尤其在城区和植被的分类中,本文算法均表现出了良好的性能。从图5的视觉效果上分析,Co-Reg和MMC算法的分类效果较差,通常情况下某一区域内的样本点应属于同一类地物,但这两幅结果图的整个图像充满斑点点,区域内杂点过多。相比之下,SR-MO和本文算法的两幅图视觉效果很好,杂点较少,河流区域分类较好。相比与SR-MO算法,本文算法的城区部分分类较好,能较好地保持区域一致性。

    • 4.5.   荷兰 Flevoland 地区大农田地区实验结果

    • 本节实验美国NASA/JPL AIRSAR系统于1989获得的Flevoland地区四视L波段的大图数据,图像大小为750×1024,分辨率为12.1×6.7 m。包含15类地物:蚕豆、油菜籽、裸地、土豆、甜菜、小麦2、豌豆、小麦3、苜蓿、大麦、小麦、草地、森林、水域和建筑物。设置Ns=15, K=9, 4种不同算法的总体分类精度OA、平均分类精度AA以及Kappa系数如表4所示,不同算法的结果图如图6所示。

      Co-RegMMCSR-MO本文算法
      蚕豆0.74590.89420.96140.9584
      油菜籽0.13930.71940.70940.8337
      裸地0.20560.96160.95410.9583
      土豆0.24790.89120.87960.9086
      甜菜0.10790.94810.96560.9515
      小麦20.24270.62510.85250.7941
      豌豆0.79320.95170.88870.9571
      小麦30.54120.92310.91800.9300
      苜蓿0.95410.89400.83910.9284
      大麦0.92260.63110.96600.8524
      小麦0.11580.84580.86600.8796
      草地0.39440.64590.74700.8773
      森林0.40410.88330.83290.9122
      水域0.54030.97570.90350.9620
      建筑物0.59540.77610.58650.7912
      OA0.42040.84410.85010.8923
      AA0.41650.83980.86970.9043
      Kappa0.42690.84090.84410.9136

      Table 4.  Classification results of four algorithms for large farmland maps in the Flevoland region of the Netherlands

      Figure 6.  Pseudo-color map, class diagram and classification results of different algorithms for large farmland data in the Flevoland region of the Netherlands

      图6中能够看出,图6(c)的杂点最多,区域一致性最差,油菜籽、甜菜和小麦等区域被大量误分为水域,区域之间没有明显区分,分类效果较差。图6(e)整体分类效果较好,但和本算法相比,对边缘像素点的分类效果不太理想。和图6(f)相比,图6(d)图6(e)区域错分的像素点较多,小麦、草地和建筑物等区域均有较多杂点。对比算法的实验结果图中,图6(e)分类效果最好。

      与对比算法相比,本文算法对Flevoland地区大农田的农作物分类的正确率都很高,稳定性很好,没有偏差,尤其在油菜籽、土豆、苜蓿、森林这几类上,分类正确率明显优于其它3种算法。但是本章算法在处理草地和小麦区域时,最终结果并没有达到理想状态,还有进一步提升的空间。但是整体来说,本文算法对比于其他对比算法的分类效果最好,区域一致性较好,边界更清晰,错分点更少。

    • 4.6.   参数敏感性分析

    • 在本文方法中有两个权衡参数λ, β和正则项参数ξ。通常的做法是在无监督聚类中根据经验设置参数。下面本节对荷兰Flevoland小农田、德国Oberpfaffenhofen和西安地区数据集进行实验,观察不同值和对总体分类精度的影响,如图7图10所示。可以观察到:

      Figure 7.  Classification results of different $\lambda $ and $\beta $ below in small Dutch farmland

      Figure 10.  Classification results of different regular item parameter $\xi $

      (1) 在4个不同的数据集中,$\lambda $$\beta $的变化对最终结果的影响曲线基本一致,说明本文算法对不同数据的参数选择较为一致,鲁棒性好。

      (2) 算法的性能在合适的范围只会有较小的变化,即$\lambda $$\beta $的范围都在0.005~1区间。

      (3) 在4组数据集的试验中,$\xi $的取值范围在5×10–4~5×10–6范围内对结果的影响都不大,说明算法对正则项参数$\xi $不敏感。

      综上所述,本文算法在合适的区间内对其参数相对不敏感,区间内参数的变化对分类总精度影响较小,且参数的可调节的范围较大。因此,本文所提方法有较好的参数稳定性。这使得本文算法易于使用,无需进行太多的权衡参数调优。

      Figure 8.  Classification results for different $\lambda $ and $\beta $ below in the German region

      Figure 9.  Classification results of different $\lambda $ and $\beta $ subordinates in Xi’an area

    5.   结束语
    • 本文提出一种基于马尔科夫的低秩稀疏的判别谱聚类方法。首先构造一个概率转移矩阵用于恢复一个真实的低秩转移概率矩阵作为标准马尔科夫聚类方法的关键输入。然后在目标函数中引入判别信息,达到对数据信息的充分利用。本文采用基于增广拉格朗日乘子法的优化方法来求解低秩和概率单纯形约束下的目标函数。通过应用4种典型的实验数据,证明了本文算法在分类精度、参数敏感性等方面具有优势,最终的分类效果也更好。

Reference (13)

Catalog

    /

    DownLoad:  Full-Size Img  PowerPoint