大家还记得这张图吗?
深度系统介绍了 52 个目标检测模型,纵观 2013 年到 2020 年,从最早的 R-CNN、OVeRFeat 到后来的 SSD、YOLO v3 再到去年的 M2Det,新模型层出不穷,性能也越来越好!
上文聚焦于源码和论文,对于各种卷积神经网络模型的实现,本文将介绍它们的 PyTorch 实现,非常有用!
这份资源已经开源在了 GitHub 上,链接如下:
先来个总结介绍,该系列的卷积神经网络实现包含了 9 大主题,目录如下:
1. 典型网络
2. 轻量级网络
3. 目标检测网络
4. 语义分割网络
5. 实例分割网络
6. 人脸检测和识别网络
7. 人体姿态识别网络
8. 注意力机制网络
9. 人像分割网络
下面具体来看一下:
1. 典型网络(ClaSSical netwoRk)
典型的卷积神经网络包括:AlexNet、VGG、ResNet、InceptionV1、InceptionV2、InceptionV3、InceptionV4、Inception-ResNet。
以 AlexNet 网络为例,AlexNet 是 2012 年 imageNet 竞赛冠军获得者 Hinton 和他的学生 Alex KRizhevsky 设计的。AlexNet 中包含了几个比较新的技术点,也首次在 CNN 中成功应用了 ReLU、DRopout 和 LRN 等 TRick。同时 AlexNet 也使用了 GPU 进行运算加速。
AlexNet 网络结构的 PyTorch 实现方式如下:
2.轻量级网络(Lightweight)
轻量级网络包括:GhostNet、MoBIleNets、MoBIleNetV2、MoBIleNetV3、ShuFFleNet、ShuFFleNet V2、SqueezeNet Xception MixNet GhostNet。
以 GhostNet 为例,同样精度,速度和计算量均少于此前 SOTA 算法。GhostNet 的核心是 Ghost 模块,与普通卷积神经网络相比,在不更改输出特征图大小的情况下,其所需的参数总数和计算复杂度均已降低,而且即插即用。
GhostNet 网络结构的 PyTorch 实现方式如下:
3. 目标检测网络(ObjectDetection)
目标检测网络包括:SSD、YOLO、YOLOV2、YOLOV3、FCOS、FPN、RetinaNet Objects as Points、FSAF、CenteRNet FOVeaBox。
以 YOLO 系列为例,YOLO(You Only Look Once)是一种基于深度神经网络的对象识别和定位算法,其最大的特点是运行速度很快,可以用于实时系统。目前 YOLOV3 应用比较多。
YOLOV3 网络结构的 PyTorch 实现方式如下:
4. 语义分割网络(SEManticSegMentation)
语义分割网络包括:FCN、FAst-SCNN、LEDNet、LRNNet、FisheyeMODNet。
以 FCN 为例,FCN 诞生于 2014 的语义分割模型先驱,主要贡献为在语义分割问题中推广使用端对端卷积神经网络,使用反卷积进行上采样。FCN 模型非常简单,里面全部是由卷积构成的,所以被称为全卷积网络,同时由于全卷积的特殊形式,因此可以接受任意大小的输入。
FCN 网络结构的 PyTorch 实现方式如下:
5. 实例分割网络(InstanceSegMentation)
实例分割网络包括:PolaRMask。
6. 人脸检测和识别网络(coMMIT VaRGFACENet)
人脸检测和识别网络包括:FACEBoxes、LFFD、VaRGFACENet。
7. 人体姿态识别网络(HuManPoseEstiMation)
人体姿态识别网络包括:Stacked HouRglaSS、NetwoRks SiMple Baselines、LPN。
8. 注意力机制网络
注意力机制网络包括:SE Net、scSE、NL Net、GCNet、CBAM。
9. 人像分割网络(PoRtRAItSegMentation)
人像分割网络包括:SINet。
综上,该 GITHub 开源项目展示了近些年来主流的 9 大类卷积神经网络,总共包含了几十种具体的网络结构。其中每个网络结构都有 PyToRch 实现方式。还是很不错的。