基于注意力机制和双向GRU模型的雷达HRRP目标识别

刘家麒 陈渤 介茜

刘家麒, 陈渤, 介茜. 基于注意力机制和双向GRU模型的雷达HRRP目标识别[J]. 雷达学报, 2019, 8(5): 589–597. doi:  10.12000/JR19014
引用本文: 刘家麒, 陈渤, 介茜. 基于注意力机制和双向GRU模型的雷达HRRP目标识别[J]. 雷达学报, 2019, 8(5): 589–597. doi:  10.12000/JR19014
LIU Jiaqi, CHEN Bo, and JIE Xi. Radar high-resolution range profile target recognition based on attention mechanism and bidirectional gated recurrent[J]. Journal of Radars, 2019, 8(5): 589–597. doi:  10.12000/JR19014
Citation: LIU Jiaqi, CHEN Bo, and JIE Xi. Radar high-resolution range profile target recognition based on attention mechanism and bidirectional gated recurrent[J]. Journal of Radars, 2019, 8(5): 589–597. doi:  10.12000/JR19014

基于注意力机制和双向GRU模型的雷达HRRP目标识别

doi: 10.12000/JR19014
基金项目: 国家自然科学基金(61771361, 61701379),国家杰出青年科学基金(61525105)
详细信息
    作者简介:

    刘家麒(1994–),男,河北人,西安电子科技大学在读硕士研究生,研究方向为雷达自动目标识别、机器学习、深度学习。E-mail: jqliu_2@stu.xidian.edu.cn

    陈 渤(1979–),男,河南人,博士,教授,博士生导师,主要研究方向为机器学习、统计信号处理、雷达目标识别与检测、深度学习网络、大规模数据处理。E-mail: bchen@mail.xidian.edu.cn

    介 茜(1993–),女,陕西人,西安电子科技大学在读硕士研究生,研究方向为大数据处理与机器学习。E-mail: xjie@stu.xidian.edu.cn

    通讯作者:

    陈渤 bchen@mail.xidian.edu.cn

  • 中图分类号: TN959.1; TP183

Radar High-resolution Range Profile Target Recognition Based on Attention Mechanism and Bidirectional Gated Recurrent

Funds: The National Natural Science Foundation of China (61771361, 61701379), The National Science Fund for Distinguished Young Scholars (61525105)
More Information
图(7) / 表 (3)
计量
  • 文章访问数:  1485
  • HTML全文浏览量:  467
  • PDF下载量:  172
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-01-29
  • 修回日期:  2019-04-07
  • 网络出版日期:  2019-05-24
  • 刊出日期:  2019-10-28

基于注意力机制和双向GRU模型的雷达HRRP目标识别

doi: 10.12000/JR19014
    基金项目:  国家自然科学基金(61771361, 61701379),国家杰出青年科学基金(61525105)
    作者简介:

    刘家麒(1994–),男,河北人,西安电子科技大学在读硕士研究生,研究方向为雷达自动目标识别、机器学习、深度学习。E-mail: jqliu_2@stu.xidian.edu.cn

    陈 渤(1979–),男,河南人,博士,教授,博士生导师,主要研究方向为机器学习、统计信号处理、雷达目标识别与检测、深度学习网络、大规模数据处理。E-mail: bchen@mail.xidian.edu.cn

    介 茜(1993–),女,陕西人,西安电子科技大学在读硕士研究生,研究方向为大数据处理与机器学习。E-mail: xjie@stu.xidian.edu.cn

    通讯作者: 陈渤 bchen@mail.xidian.edu.cn
  • 中图分类号: TN959.1; TP183

摘要: 针对雷达高分辨距离像(HRRP)目标识别问题,传统方法只考虑样本的包络信息而忽略了距离单元间的时序相关性,该文提出了一种基于注意力机制的双向自循环神经网络模型。该模型将时域的HRRP数据通过滑窗分为正反两个序列,并将其分别通过两个相互独立的GRU网络进行特征提取,然后将同时刻提取到的特征进行拼接,从而利用了距离像双向的时序信息。考虑到不同时刻的序列对目标分类的重要性不同,通过注意力机制自适应地对各时刻隐层特征赋予不同的权值,最后根据加权求和后的隐层特征进行目标的识别与分类。实测数据实验结果表明,该文所提方法可以有效完成高分辨距离像的目标识别问题,并且在数据发生一定的时序偏移情况下,仍然可以准确找到目标区域。

English Abstract

刘家麒, 陈渤, 介茜. 基于注意力机制和双向GRU模型的雷达HRRP目标识别[J]. 雷达学报, 2019, 8(5): 589–597. doi:  10.12000/JR19014
引用本文: 刘家麒, 陈渤, 介茜. 基于注意力机制和双向GRU模型的雷达HRRP目标识别[J]. 雷达学报, 2019, 8(5): 589–597. doi:  10.12000/JR19014
LIU Jiaqi, CHEN Bo, and JIE Xi. Radar high-resolution range profile target recognition based on attention mechanism and bidirectional gated recurrent[J]. Journal of Radars, 2019, 8(5): 589–597. doi:  10.12000/JR19014
Citation: LIU Jiaqi, CHEN Bo, and JIE Xi. Radar high-resolution range profile target recognition based on attention mechanism and bidirectional gated recurrent[J]. Journal of Radars, 2019, 8(5): 589–597. doi:  10.12000/JR19014
    • 雷达高分辨距离像(High-Resolution Range Profile, HRRP)是基于雷达宽带信号获取的目标散射点子回波在雷达射线方向(Radar line of sight, RLOS)上投影的向量和,它含有大量的目标结构、散射点分布和目标尺寸等可判别信息。相比2维的合成孔径雷达图像,1维的HRRP数据存储量较低,更易保存和计算,如今在雷达自动目标识别(Radar Automatic Target Recognition, RATR)领域中广泛应用。

      HRRP具有方位敏感性、幅度敏感性和平移敏感性[1],这对目标特征的提取造成了困难,而特征提取的好坏又直接影响了目标的识别性能。针对以上问题,大量学者进行了广泛的研究。文献[2]提取了HRRP数据的高阶谱特征,对所得谱特征使用模板匹配法进行识别。但这需要专业人员的经验,同时将时序数据映射到了其他域,破坏了HRRP距离单元之间的时序相关性。文献[3]基于字典学习的方式得到了噪声环境中HRRP的稀疏表示,并在此基础上进一步进行处理。文献[4]使用PPCA对HRRP数据进行特征的提取,用MPPCA按照方位角的不同进行了聚类,从而减少待匹配模板的数量。文献[5]认为HRRP数据服从混合Gamma分布,将HRRP的识别问题转化为概率统计模型。文献[6]使用了原始的复数HRRP数据,充分利用了相位角信息。虽然以上方法都取得了不错的识别性能,但是这些方法都将HRRP数据视为一个整体,仅关注了样本的包络信息,而忽略了HRRP数据内部不同距离单元之间的时序相关性。文献[7,8]考虑到不同距离单元之间的时序相关性,将HRRP转化为序列的形式并使用隐马尔科夫模型(Hidden Markov Models, HMM)建模。但由于方位敏感性的原因,需要对不同帧的数据分帧建模,具有较大的计算量。相比于HMM模型,循环神经网络(Recurrent Neural Network, RNN)由于其具有非线性的激活函数以及较大的隐空间范围,具有更强的表示能力。通过其独特的自循环机制,输入数据的隐层特征可以在不同时刻的隐状态间传递,可以有效的提取完整的样本特征。通过梯度下降算法(gradient descent)可以自动学习循环神经网络模型权矩阵的值,可以在不需要相关人员的先验经验的条件下完成数据的特征提取与分类。因此,被广泛应用于时序数据的建模[9,10]。由于平移敏感性问题的存在,HRRP样本目标区域两侧均会有一段数据冗余,而冗余数据对目标识别没有帮助。另一方面,传统的循环神经网络是单向的,分类时仅能利用当前及之前时刻的数据信息。另外由于传统的循环神经网络存在着梯度消失[11]等问题,使其对历史数据的记忆能力较差。

      针对上述问题,本文提出一种基于注意力机制的双向门控循环单元(Attention-based Bidirectional Gated Recurrent Unit, ABi-GRU)模型。门控循环单元(Gated Recurrent Unit, GRU)是一种对于循环神经网络的改进[12],通过在传统RNN基础上额外增加“重置门”和“更新门”操作,可以有效的保证可分性信息在网络自循环中的传递,从而缓解梯度消失带来的性能损失,相比于传统的循环网络模型,其记忆性更强。该模型首先使用双向GRU网络对HRRP数据的正向序列和反向序列分别建模,得到其正反向序列的隐层特征。再对正反向得到的隐层特征进行拼接,拼接后的隐层特征可以同时利用正反向的内容,有利于目标的识别与分类。最后考虑到不同时刻的样本数据对识别所起的作用是不同的,使用注意力机制对不同时刻的隐层特征进行加权处理得到最终的隐层,从而使模型可以自动关注并计算对识别有效的目标区域部分,更有利于目标的识别与分类。

      最后,通过实测数据进行相关实验,验证本文模型的正确性。实验结果表明,本文模型有效解决了HRRP的平移敏感性问题,具有较高的识别性能。

    • 门控循环单元是一种带有自循环结构的神经网络,它可以自动对多个时间的输入进行特征提取,而不同时刻的数据共享同一组权值矩阵。由于其独特的自循环机制,隐层特征可以在不同时刻间单向传递,从而记录下先前时刻的“历史数据”,再通过历史数据与新数据的融合得到当前时刻的隐层特征值。由于传统的循环神经网络存在着梯度消失问题[11],进而对识别的性能造成了影响。GRU模型在RNN的基础上增加了2个控制门结构,使得信息有选择性的在隐层中传递,在记忆重要信息的同时有效的减轻了梯度消失的问题。

      单向GRU网络的结构如图1所示,“${\left( \bullet \right)}$”表示多个权矩阵。任一时刻$t$包含了3个部分:当前时刻的输入数据${{\text{x}}_{t}}$、用于计算隐层状态${{\text{h}}_{t}}$的GRU单元(GRU-Unit)、依据当前隐层状态${{\text{h}}_{t}}$计算得到的识别分类结果${{\text{y}}_{t}}$。相邻时刻的GRU单元相互连接,从而使得先前时刻数据的隐层状态可以单向的传递到之后的隐状态,从而对完成了对时序数据的特征提取。每个GRU单元包括一个重置门(reset gate)和一个更新门(update gate):更新门${{\text{z}}_{t}}$用于计算历史信息${{\text{h}}_{{t} - 1}}$与当前时刻输入${{\text{x}}_{t}}$中哪些信息应该保留并最终作为t时刻门控单元的输出${{\text{h}}_{t}}$;而重置门${{\text{r}}_{t}}$是为了依照${{\text{x}}_{t}}$决定历史信息${{\text{h}}_{{t} - 1}}$中哪些信息需要遗忘。最终通过式(3)和式(4)计算得到此时刻新生成的记忆${\widetilde {\text{h}}_{t}}$以及经过重置门和更新门操作后的的最终隐状态${{\text{h}}_{t}}$。在时刻$t$时GRU单元的更新门${{\text{z}}_{t}}$、重置门${{\text{r}}_{t}}$ 、新记忆${\widetilde {\text{h}}_{t}}$、最终隐状态${{\text{h}}_{t}}$的计算为

      图  1  GRU网络结构示意图

      Figure 1.  GRU network architecture

      $$ {{\text{z}}_{t}} = \sigma \left( {{{\text{U}}^{\left( {\text{z}} \right)}}{{\text{x}}_{t}} + {{\text{W}}^{\left( {\text{z}} \right)}}{{\text{h}}_{{t} - 1}}{\rm{ + }}{{\text{b}}^{\left( {\text{z}} \right)}}} \right) \hspace{52pt} $$ (1)
      $$ {{\text{r}}_{t}} = \sigma \left( {{{\text{U}}^{\left( {\text{r}} \right)}}{{\text{x}}_{t}} + {{\text{W}}^{\left( {\text{r}} \right)}}{{\text{h}}_{{t} - 1}}{\rm{ + }}{{\text{b}}^{\left( {\text{r}} \right)}}} \right) \hspace{50pt} $$ (2)
      $$ {\tilde{{\text{h}}}_t} = \tanh \left\{ {{{\text{U}}^{\left( {\text{h}} \right)}}{{\text{x}}_{t}} + {{\text{W}}^{\left( {\text{h}} \right)}}\left( {{{\text{h}}_{{t} - 1}} \circ {{\text{r}}_{t}}} \right){\rm{ + }}{{\text{b}}^{\left( {\text{h}} \right)}}} \right\} $$ (3)
      $$ {{\text{h}}_{t}} = \left( {1 - {{\text{z}}_{t}}} \right) \circ {\tilde{{\text{h}}}_{t}} + {{\text{z}}_{t}} \circ {{\text{h}}_{{t} - 1}} \hspace{75pt} $$ (4)

      其中,$\sigma $$\rm{sigmoid} $非线性激活函数,用于增加模型对于非线性数据的处理能力,其表达式为$ \sigma \left( x \right) = $$1/\left( {1 + {{\rm e}^{ - x}}} \right)$。“$ \circ $”表示点乘。$\tanh \left( x \right) = {\left( {{{\rm{e}}^x} - {{\rm{e}}^{ - x}}} \right)}/ $${\left( {{{\rm{e}}^x} + {{\rm{e}}^{ - x}}} \right)}$为一非线性映射函数。${{\text{x}}_{t}} \in {{\text{R}}^{d \times 1}}$$t$时刻的输入,${{\text{U}}^{\left( \bullet \right)}} \in {{\text{R}}^{m{\rm{ \times }}d}}$${{\text{W}}^{\left( \bullet \right)}} \in {{\text{R}}^{m \times m}}$是模型的权值矩阵,${{\text{b}}^{\left( \bullet \right)}} \in {{\text{R}}^{{m} \times 1}}$表示模型的偏置项。$m$是隐层状态${{\text{h}}_{t}}$的维度,需要根据模型设定。重置门和更新门决定了哪些信息能最终作为GRU单元的输出,从而保证重要信息不会在网络自循环中消除。将一序列${\text{x}} = \left[ {{{\text{x}}_1}{\rm{,}}{{\text{x}}_2}{\rm{,}} ·\!·\!· {\rm{,}}{{\text{x}}_{T}}}\; \right]$作为网络输入,得到其对应的隐层状态${\text{h}} = \left[ {{{\text{h}}_1}{\rm{,}}{{\text{h}}_2}{\rm{,}} ·\!·\!·{\rm{,}}{{\text{h}}_{T}}}\; \right]$。由于自循环机制的存在,隐层状态${{\text{h}}_j}$会得到之前隐状态${{\text{h}}_i}$($1 \le i < j$)传递过来的隐层状态信息,从而产生了对于时序数据的记忆性。

      计算隐层状态${{\text{h}}_t}$经过$\rm{softmax} $得到的分类类别概率分布

      $$ {\text{p}}({{\text{y}}_{t}} = {k}|{{\text{h}}_{t}},{\text{V}}) = \exp ({{\text{V}}_{k}}{{\text{h}}_{t}})/\sum\limits_{j = 1}^{K} {\exp ({{\text{V}}_j}{{\text{h}}_{t}})} $$ (5)

      其中,${\text{p}}({{\text{y}}_{t}} = {k}|{{\text{h}}_{t}},{\text{V}})$表示由t时刻的隐层状态${{\text{h}}_{t}}$计算得到的识别分类为第$k$类的概率,${{\text{V}}_j} \in {{\text{R}}^{1 \times {m}}}$表示第$j$类识别目标所对应的权值向量。

    • 注意力机制(attention mechanism)源自人类大脑对新事物认知的特点,即对于重要的内容分配较多注意力,而对于不重要的部分分配较少的注意力[13]。对目标识别问题来讲,目标区域的价值远远大于两侧的冗余数据。在GRU模型中,样本通过滑窗操作后得到多个时刻的样本序列,不同时刻的序列进行类别预测的重要程度是不同的。这需要通过一种特殊的计算手段自动获得目标区域的范围,并对此范围赋予较大的权值。最后将不同时刻的隐层状态${{\text{h}}_{t}}$与权重进行加权求和,从而得到经过注意力模型处理后的隐层状态${\text{c}}$

      $${\text{c}} = \sum\limits_{t = 1}^{T} {{a_{t}}{{\text{h}}_{t}}} $$ (6)

      其中,${a_t}$表示$t$时刻分配的注意力权值,计算公式为

      $$ {e_i} = {\text{U}}_{{\rm{Att}}}^{\rm{T}}\tanh \left( {{{\text{W}}_{{\rm{Att}}}}{{\text{h}}_i}} \right)\hspace{8pt} $$ (7)
      $$ {a_j} = {{\exp \left( {{e_j}} \right)}/{\sum\limits_{i = 1}^{T} {\exp \left( {{e_i}} \right)} }} $$ (8)

      其中,${\text{U}}_{{\rm{Att}}}^{\rm{T}} \in {{\text{R}}^{1 \times {l}}}$, ${{\text{W}}_{{\rm{Att}}}} \in {{\text{R}}^{{l} \times {m}}}$, $m$为隐层${\text{h}}$的维度,$l$为注意力权值的长度,表示注意力可存储的范围。由式(7)可计算出隐层${{\text{h}}_i}$所具有的能量${e _i}$,当隐层${{\text{h}}_i}$比较重要时其对应的能量${e_i}$也会具有较大的值;${a_j}$${e_j}$经过$\rm{softmax} $函数归一化后的注意力系数。由式(7)和式(8)可知,注意力机制的权重系数${a_j}$是由注意力权重${{\text{W}}_{{\rm{Att}}}}{,}{{\text{U}}_{{\rm{Att}}}}$和隐层状态${{\text{h}}_i}$共同计算得到,当隐层状态${{\text{h}}_i}$变化时,其权值${a_i}$也会自动发生变化。对经过注意力机制计算得到的隐层状态${\text{c}}$,进行处理得到最终的分类结果${{\text{y}}_{\rm pred}}$

      $$ {\text{p}}\left( {\text{y}} \right) = {\rm softmax}\left( {{{\text{V}}^{\left( c \right)}}{\text{c}}} \right) $$ (9)
      $$ {{\text{y}}_{{\rm{pred}}}} = \mathop {\arg \max }\limits_{\text{k}} {\text{p}}\left( {\text{y}} \right)\quad $$ (10)

      其中,${{\text{V}}^{\left( c \right)}} \in {{\text{R}}^{{K} \times {m}}}$是隐层${\text{c}}$到输出类别${\text{y}}$向量的权值矩阵,${K}$是待预测目标类别的个数。

    • 图2所示,雷达HRRP数据反映了在一定的雷达视线方向上,目标散射点子回波的分布情况,其中每个距离单元${r_i}$等于所有散射点目标在这个距离单元内的回波叠加。HRRP数据包含了丰富的目标尺寸和相对结构等信息,可用来目标的识别与分类[14]。记HRRP数据为${\text{r}} = {[{r_1},{r_2}, ·\!·\!· ,{r_D}]^{\rm{T}}}$,其中${r_i}$表示第${i} $个距离单元的子回波;$D$表示距离单元总个数。对复向量${\text{r}}$取幅值,得到其幅值向量$ {\text{p}} = \left| {\text{r}} \right| = $${[{p_1},{p_2}, ·\!·\!·,{p_D}]^{\rm{T}}}$

      图  2  高分辨距离像生成示意图

      Figure 2.  Illustration of an HRRP sample

      本文使用能量归一化方法消除HRRP数据的强度敏感性问题,即限制不同HRRP数据的总能量相同。使用重心对齐法消除平移敏感性,将HRRP数据的重心位置$g$平移到距离像的中心位置${D/2}$处。HRRP数据的重心位置可由式(11)计算出。

      $$ {{g}} = \frac{{\displaystyle\sum\limits_j^D {j{\rm{p}}{{\left( j \right)}^2}} }}{{\displaystyle\sum\limits_j^D {{\rm{p}}{{\left( j \right)}^2}} }} $$ (11)

      经过能量归一化和重心对齐后的HRRP数据记为${\text{q}} = {[{q_1},{q_2}, ·\!·\!· ,{q_D}]^{\rm{T}}}$,通过滑窗的方式将HRRP数据转化为序列的形式,其中$d$为窗长。滑窗的滑动距离记为$b$,为了增加序列中数据段之间的相关性,设定$b < d$,从而使得相邻时刻的序列段有部分的重复数据[7]$D$表示原始HRRP数据距离单元个数,则经过滑窗后的序列段数(时刻数)为

      $$T = \frac{{D - b}}{{d - b}}$$ (12)

      ${\text{q}}$经过滑窗后可得序列${\text{x}} \!=\! {\left[ {{{\text{x}}_{1}},{{\text{x}}_{2}}, ·\!·\!· ,{{\text{x}}_{T}}} \,\right]^{\rm{T}}}$,其中,

      $${{\text{x}}_t} = {\text{q}}\left[ {1 + \left( {{d} - {b}} \right)\left( {{t} - 1} \right):{d} + \left( {{d} - {b}} \right)\left( {{t} - 1} \right)} \right]$$ (13)

      其中,${{\text{x}}_{t}} \in {{\text{R}}^{{d} \times 1}}$${t}$时刻的滑窗结果,并作为循环网络${t}$时刻的输入。

    • 传统的GRU模型是单向的,即数据只能沿着一个方向进行处理。网络只能结合当前时刻的输入数据${{\text{x}}_{t}}$及之前时刻的隐状态信息${{\text{h}}_{{t} - 1}}$计算新的隐状态${{\text{h}}_{t}}$,而之后的信息无法有效的利用。而HRRP本身并无特定的顺序,因此只考虑单向信息并不利于HRRP数据的识别。针对此问题,本文提出将双向GRU模型应用在HRRP序列的识别问题上,即将HRRP数据分正反双向分别输入2个独立的GRU模型,从而得到正反序列的隐层特征分别为$\overrightarrow {{{\text{h}}_{t}}} $$\overleftarrow {{{\text{h}}_{{T} - {t} + 1}}} $[15],其中${t} \in \left[ {1,{T}}\; \right]$表示序列的时刻数。将同时刻的隐层进行拼接,则拼接之后的隐层$\mathop {{{\text{h}}_{t}}}\limits^ \leftrightarrow {\rm{ = }}\left[ {\overrightarrow {{{\text{h}}_{t}}} ,\overleftarrow {{{\text{h}}_{{T} - {t} + 1}}} } \right]$可以充分利用前后两个方向上所有时刻的HRRP信息,有利于特征提取的进行。

      图 3 展示了模型的整体框架,其中正向序列$\overrightarrow {{{\text{x}}_t}} $和反向序列$\overleftarrow {{{\text{x}}_t}} $的计算为

      图  3  基于注意力机制的双向门控循环单元(ABi-GRU)模型结构

      Figure 3.  Structure of ABi-GRU model

      $$\overrightarrow {{{\text{x}}_{t}}} = {\text{q}}\left[ {1 + \left( {{d} - {b}} \right)\left( {{t} - 1} \right):{d} + \left( {{d} - {b}} \right)\left( {{t} - 1} \right)} \right]$$ (14)
      $$ \begin{align} \overleftarrow {{{\text{x}}_{t}}} =& {\text{q}}\left[ {D} - \left( {{d} - {b}} \right)\left( {{t} - 1} \right){\rm{:}}{D} - {d}\right. \hspace{51pt}\\ {\rm{}}& \left.- \left( {{d} - {b}} \right)\left( {{t} - 1} \right) + 1 \right] \end{align} $$ (15)

      其中,$\overrightarrow {\text{x}} = \left[ {\overrightarrow {{{\text{x}}_1}} ,\overrightarrow {{{\text{x}}_2}}, ·\!·\!· ,\overrightarrow {{{\text{x}}_{T}}} }\; \right]$为正向序列,$ \overleftarrow {\text{x}} =$$ \left[ {\overleftarrow {{{\text{x}}_1}} ,\overleftarrow {{{\text{x}}_2}}, ·\!·\!· ,\overleftarrow {{{\text{x}}_{T}}} }\; \right]$为反向序列。在任一时刻t,正反向序列经过2个独立的GRU模型后得到正反向的隐层特征$\overrightarrow {{{\text{h}}_{t}}} $$\overleftarrow {{{\text{h}}_{{T} - {t} + 1}}} $,其计算公式由式(1)—式(4)给出。再对同一时刻的隐层$\overrightarrow {{{\text{h}}_{t}}} $$\overleftarrow {{{\text{h}}_{{T} - {t} + 1}}} $进行拼接,得到拼接后的融合双向信息的隐层特征$\mathop {{{\text{h}}_{t}}}\limits^ \leftrightarrow \! =\! \left[ {\overrightarrow {{{\text{h}}_{t}}} ,\overleftarrow {{{\text{h}}_{{T} - {t} + 1}}} } \right]$

      单向的GPU模型在任一时刻${t}$只能对部分输入数据$\left[ {\overrightarrow {{{\text{x}}_1}} ,\overrightarrow {{{\text{x}}_2}}, ·\!·\!· ,\overrightarrow {{{\text{x}}_{t}}} } \right]$做特征提取,而无法有效利用之后的数据信息$\left[ {\overrightarrow {{{\text{x}}_{{t} + 1}}} ,\overrightarrow {{{\text{x}}_{{t} + 2}}}, ·\!·\!· ,\overrightarrow {{{\text{x}}_{T}}} } \;\right]$,从而所做出的判断是不准确的,甚至当${t}$较小时,已观察到的部分数据信息$\left[ {\overrightarrow {{{\text{x}}_1}} ,\overrightarrow {{{\text{x}}_2}}, ·\!·\!· ,\overrightarrow {{{\text{x}}_{t}}} } \right]$还不包含HRRP数据的目标区域,则相当于只使用前向的噪声数据对目标进行判别,这显然是不合理的。而双向GRU模型充分考虑到了双向的时序信息,前后向的网络分别利用了两方向的数据信息,从而拼接后利用了目标整体的分布信息,有利于目标特征的提取与识别。但是对于不同时刻的数据,其重要程度是不同的。因此,在以上模型的基础上,本文引入注意力机制,即对多个时刻的数据进行加权求和,其权值计算由式(6)—式(8)给出,其中用融合了双向信息的$\mathop {{{\text{h}}_{t}}}\limits^ \leftrightarrow $代替式(6)和式(7)中的隐层状态${{\text{h}}_{t}}$。加入注意力机制的模型可以自动选择HRRP数据中对目标识别有益的的目标区域,因而可以有效的解决HRRP数据的平移敏感性问题。设经过加权求和得到的最终融合双向信息的隐层特征为${\text{c}}$,依据式(9)和式(10)对其进行${\rm{softmax}}$归一化,并得到最终的分类结果${{\text{y}}_{\rm pred}}$

    • 实验数据为国内某研究所雷达实测飞行数据,其中雷达和飞机的参数如表1所示。所测数据共含有3类目标飞机,其时域特征如图4所示。其中“安26”为中型螺旋桨飞机,“奖状”为小型喷气式飞机,“雅克42”为中型喷气式飞机。其飞行轨迹图如图5所示。为了考虑尽可能完备的方位角数据,本文将飞机飞行轨迹分为数段,其中“安26”和“奖状”分为7段,“雅克42”分为5段。为了验证模型的普适性,本文选取方位角变化较大的几段作为训练数据,其他数据段作为测试数据。因此本文使用“安26”的第5,6段数据,“奖状”的第6,7段数据,“雅克42”的第2,5段数据作为模型的训练数据,其它段作为测试数据。以上训练数据段基本覆盖了测试数据可能的方位角信息,而且与测试数据段无重复数据,可以有效验证模型的性能。共得到7800个训练样本数据,5124个测试样本,每个距离像维度$D$为256维。

      表 1  雷达和飞机相关参数

      Table 1.  Parameters of planes and radar

      雷达参数数值飞机参数安26奖状雅克42
      中心频率5520 MHz机长(m)23.8014.4036.38
      信号带宽400 MHz机高(m)8.584.579.83
      机宽(m)29.2015.9034.88

      图  4  3类目标高分辨距离像的时域图

      Figure 4.  Measured HRRP examples of time domain for three airplanes

      图  5  实验数据飞行轨迹投影图

      Figure 5.  Projections of target trajectories onto the ground plane

      表2展示了本文提出的模型与多个现有模型对测试数据的识别性能,识别性能指分类正确的样本占全体测试样本的比例。现有模型包括:最大相关系数法[7](Maximum Cross Correlation, MCC),全连接神经网络(Full Connected Neural Network, FCNN), 自适应高斯分类器[16](Adaptive Gaussian Classifier, AGC),隐马尔科夫模型。除此之外,为了验证双向网络和注意力机制的有效性,还加入了融合注意力机制和仅用正向或反向数据的单向GRU模型(AGRU-for, AGRU-back)和无注意力机制的双向GRU模型(Bi-GRU)作为对比。在实验中,设置滑窗的窗长$d$为32,每次滑动的距离$b$为16,经过预处理后的高分辨距离像${\text{q}}$的维度为256,可计算得到总的序列数$T\;$为15。GRU网络的隐层状态的维度$m$大小为20,注意力权值的长度l为12。待训练的参数包括$ {\text{θ}}{\rm{ = }}\left[ {\overrightarrow {{{\text{U}}^{\left( \bullet \right)}}} ,\overrightarrow {{{\text{W}}^{\left( \bullet \right)}}} ,\overrightarrow {{{\text{b}}^{\left( \bullet \right)}}} ,\overleftarrow {{{\text{U}}^{\left( \bullet \right)}}},}\right.$$\left.{\overleftarrow {{{\text{W}}^{\left( \bullet \right)}}} ,\overleftarrow {{{\text{b}}^{\left( \bullet \right)}}} ,{{\text{U}}_{\rm{Att}}},{{\text{W}}_{\rm{Att}}},{{\text{V}}^{\left( c \right)}}} \right]$,其中带方向箭头的变量表示正向或反向GRU网络的相关权值,${{\text{U}}_{\rm{Att}}}, $${{\text{W}}_{\rm{Att}}}$是注意力机制的相关参数,${{\text{V}}^{\left( c \right)}}$是最终融合注意力机制和双向信息的隐层状态${\text{c}}$所经过$\rm{softmax} $分类器的相关参数。初始化时,所有待训练参数均从${\mathcal{N}}\left( {0,0.01} \right)$分布中采样。学习率设置为$ {\rm{l}}{{\rm{r}}^{\left( {{\rm{epoch}}} \right)}} =$$ {{0.017}/{\left( {1 + {\rm{epoch}}} \right)}}$, ${\rm{epoch}}$表示迭代次数。使用交叉熵作为模型的损失函数$L$,其定义为L=$ - \displaystyle\sum\nolimits_{{n} = 1}^{N} {\frac{1}{{N}}{\rm{labe}}{{\rm{l}}^{\left( {{i}} \right)}}{\rm{ln}}{\text{y}}_{{\rm{pred}}}^{\left( {{i}} \right)}} $,其中${\rm{labe}}{{\rm{l}}^{\left( {{i}} \right)}}$是第i个样本真实的类别向量(one-hot编码),${\text{y}}_{{\rm{pred}}}^{\left( {{i}} \right)}$是第i个样本网络预测的输出分布向量。采用随机梯度下降法对网络进行权值的训练,每次使用的mini-batch样本数设置为30。

      表 2  不同方法实验识别性能对比

      Table 2.  Performance comparison with different methods

      方法MCCAGCFCNHMMAGRU-forAGRU-backBi-GRUABi-GRU
      识别性能0.5900.8520.8440.8700.8950.8560.9000.907

      表2中可以看出,相比于传统的全连接神经网络模型,基于循环结构的GRU模型考虑到了高分辨距离像内部不同距离单元之间的时序相关性,从而有效的提高识别性能。而结合了双向信息的Bi-GRU由于在任一时刻$t$考虑到了样本的整体信息,比仅仅使用部分正向或反向序列的AGRU-for和AGRU-back模型性能更好。基于注意力机制的ABi-GRU模型则在考虑到双向时序性的前提下,又引入了注意力机制。在考虑样本整体信息的情况下,数据的目标区域含有最为丰富的可判别信息,因此是模型识别的重点区域。而引入注意力机制后的模型可以自动的对目标区域赋予较大的权值,增加了目标区域的权值比重。识别性能相比无注意力机制的Bi-GRU模型又提高了0.7%,取得了最佳的识别性能。

      图6给出了经预处理后的时域HRRP数据和经本模型(ABi-GRU)所提取得到的隐层特征${\text{c}}$的主成分分析(Principal Component Analysis, PCA)2维投影图。从中可知,ABi-GRU模型所提取到的隐层状态${\text{c}}$具有很高的可分性,所提特征整体可分性较好,投影图中只有部分红色星号(安26)与绿色圆圈(奖状)有重叠现象。

      图  6  预处理后的测试数据与经ABi-GRU所提特征的2维PCA投影图

      Figure 6.  Visualization of test data via two-dimensional PCA

      表3是其对应的分类混淆矩阵${\text{A}} \in {{\text{R}}^{{K}{\rm{ \times }}{K}}}$,其每个元素${\text{A}}\left( {i,j} \right)$表示分类器将所有测试样本分为第i类的样本个数占真实的第j类样本个数的比例,K是待预测目标类别的个数。平均识别性能表示混淆矩阵对角线元素的平均数,它表示分类正确的样本的平均识别性能。从表3中可以看出“安26”和“雅克42”的识别率均在90%以上,而“奖状”的识别率也达到了85.8%,其综合性能远远高于表2中的传统方法。其中“安26”与其他两类飞机的可分性较差,有12.7%的“奖状”和3.08%的“雅克42”被误分为了“安26”,也有8.11%的“安26”被误分为其他两类。这是因为“安26”是一种螺旋桨飞机,由于螺旋桨的调制作用,其回波变化起伏较大,导致所得到的HRRP数据分布范围很广,与其他两类喷气式飞机有重叠现象,从而容易发生错误的分类。相比而言,同为喷气式飞机的“奖状”和“雅克42”可分性较好,二者之间很少发生误分现象。

      表 3  ABi-GRU模型对时域HRRP数据的混淆矩阵

      Table 3.  Confusion matrix of ABi-GRU model for time domain HRRP data

      分类目标分类结果
      安26奖状雅克42
      安260.91890.12700.0308
      奖状0.01460.85800.0042
      雅克420.06650.01500.9650
      平均识别性能0.9140

      图7展示了不同样本不同时刻的注意力系数分配图。其中横轴表示不同的时刻,纵轴表示不同的样本,不同颜色代表着不同的注意力数值。对经过重心对齐处理的HRRP数据来说,1~5时刻和12~15时刻对应时域HRRP数据目标区域两侧的噪声区域,这部分数据不具备目标识别能力,因此其对应的注意力权值较低。而6~11时刻为数据的目标区域,这部分区域包含有大量目标结构信息,因此是目标识别的重点。图7(a)是已经经过重心对齐处理后样本的注意力系数图,可见较大的权值基本分布在中间时刻(时刻7~9)附近,这与实际情况相符。注意力机制可以自动找出目标区域,有效提高了识别性能。

      图  7  测试数据注意力权值系数

      Figure 7.  Attention coefficients of test data

      平移敏感性问题会对模型性能造成一定影响,但是注意力机制是数据相关的。当输入数据发生平移移动时,注意力系数会自动修正相应的权值。在模型已经训练完成的情况下,将测试数据整体平移一定的距离单元,此时HRRP数据的目标区域将不在位于6~11时刻所框定的范围内。如若将经过重心对齐后的HRRP数据整体向前平移50个距离单元并将其输入已训练好的模型中,可得此时的注意力系数如图7(b)所示。可见虽然距离像平移了一定单位,但是相对应的注意力权值也发生了变化,且此时注意力权值较大的区域与目标区域的位置依然吻合,模型依然可以有效从整个HRRP数据中提取目标区域并得到其隐层特征,可见基于注意力机制的双向GRU模型对于HRRP的目标识别非常稳健。

    • 本文针对雷达高分辨距离像的自动目标识别问题,提出了一种基于注意力机制的双向GRU网络的识别模型。基于GRU模型的循环机制,充分利用了高分辨距离像内部距离单元之间的时序相关性,有效捕捉了HRRP数据深层的隐含特征,提高了特征提取的效率与质量。并在此基础上引入了注意力机制,有效地从距离像中获取得到目标区域,降低了特征提取的难度。实验结果表明,本文模型可以有效地捕获HRRP数据的可分性信息,以及处理高分辨距离像的平移问题,而且不需要专业人员的先验经验,取得了较好的识别性能。

参考文献 (16)

目录

    /

    返回文章
    返回