云计算、AI、云原生、大数据等一站式技术学习平台

网站首页 > 教程文章 正文

浅谈ThunderNet

jxf315 2024-12-02 21:25:36 教程文章 36 ℃


ThunderNet 是旷视提出的轻量型目标检测框架,实现了 ARM 平台上的实时检测器,整体结构如下图所示。

ThunderNet 使用 320×320 像素作为网络的输入分辨率。整体的网络结构分为两部分:Backbone 部分和 Detection 部分。网络的骨干部分为 SNet(ShuffleNetV2 修改版)。 网络的检测部分,利用了压缩的 RPN 网络,既 Context Enhancement Module(CEM)整合局部和全局特征增强网络特征表达能力。并提出 Spatial Attention Module 空间注意模块,引入来自 RPN 的前后景信息用以优化特征分布。

FPN 的结合不同层语义信息,但是相对而言每层均有检测分支,对移动终端而言增加计算成本和运行时间。论文提出简单粗暴的 CEM(如下图所示 ),合并三个尺度特征图 C4,C5和 Cglb:

  • C4 1×1 卷积,通道数量压缩为 α×p×p = 245
  • C5 进行上采样 + 1×1 卷积,通道数量压缩为 α×p×p = 245
  • C5 全局平均池化得到 Cglb,Cglb 进行 Broadcast + 1×1 卷积,通道数量压缩为 α×p×p
  • = 245 。

通过利用局部和全局信息,CEM 有效地扩大了感受野,并细化了特征图的表示能力。与先前的 FPN 结构相比,CEM predict 预测及减少 fc 计算,提高模型运算效率。

Tags:

最近发表
标签列表