睿智的目标检测57——Tensorflow2 搭建YoloV5目标检测平台

时间：2023-12-23 13:37:05 2方型连接器连接器

智慧目标测试57——Tensorflow2 搭建YoloV5目标检测平台

学习前言
源码下载
YoloV5改进部分(不完全)
YoloV5实现思路
- 一、整体结构分析
- 二、网络结构分析
- - 1、主干网络Backbone介绍
  - 2、构建FPN特征金字塔加强特征提取
  - 3、利用Yolo Head获得预测结果
- 解码预测结果
- - 1.获得预测框和得分
  - 2.得分筛选和非极大抑制
- 四、训练部分
- - 1、计算loss所需内容
  - 2、正样本的匹配过程
  - - a、匹配先验框
    - b、匹配特征点
  - 3、计算Loss
训练自己的YoloV5模型
- 准备数据集
- 二、处理数据集
- 三、开始网络训练
- 四、预测训练结果

学习前言

这个很久没学了，最后决定看看。复现的是YoloV5的第5版，V5有很多版本，作者一直在更新。这次我选择了倒数第二个版本。

源码下载

https://github.com/bubbliiiing/yolov5-tf2
喜欢的可以点star噢。

YoloV5改进部分(不完全)

1.主要部分:使用Focus网络结构，具体操作是在图片中每隔一个像素获得一个值。此时，获得四个独立的特征层，然后堆叠四个独立的特征层。此时，宽度和高度信息集中在通道信息中，输入通道扩展了四倍。该结构在YoloV5第5版以前应用过，最新版本没有。

2.数据增强:Mosaic数据增强、Mosaic利用四张图片拼接实现数据增强。据论文介绍，它具有丰富检测对象背景的巨大优势！BN四张图片的数据会一下子计算出来！

3.多样本匹配:在之前Yolo系列里面，在训练时每一个真实框对应一个正样本，即在训练时，每一个真实框仅由一个先验框负责预测。YoloV为了加快模型的训练效率，增加了样本的数量，在训练过程中，可以预测每个真实的框架。

以上并不是所有的改进部分，还有一些其他的改进，这里只列出了一些我更感兴趣、非常有效的改进。

YoloV5实现思路

一、整体结构解析

在学习YoloV在此之前，我们需要正确YoloV5.对工作有一定的了解，有助于我们以后了解网络的细节。

以前版本Yolo类似，整个YoloV它仍然可以分为三个部分，即Backbone，FPN以及Yolo Head。

Backbone可以被称作YoloV5提取网络的主要特征，根据它的结构和以前的结构Yolo主干的名字，我一般叫它CSPDarknet，首先会输入图片CSPDarknet里面进行特征提取，提取的特征可称为特征层，输入图片的特征集合。在主干部分，我们获得三个特征层下一步网络建设，我称这三个特征层为有效特征层。

FPN可以被称作YoloV5强化特征提取网络，主干部获得的三个有效特征层在这一部分，特征融合的目的是结合不同尺度的特征信息。FPN已获得的部分有效特征层用于继续提取特征。在YoloV5里还在用Panet在结构上，我们不仅会采样特征，还会再次采样特征。

Yolo Head是YoloV5分类器和回归器，通过CSPDarknet和FPN，我们已经能够获得三个加强的有效特征层。每个特征层都有宽度、高度和通道数量此时，我们可以特征图被视为一个又一个特征点的集合，每个特征都有几个特征。Yolo Head其实我所做的工作就是判断特征点，判断特征点是否特征点的对象。以前的版本Yolo一样，YoloV5所用的解耦头是一起的，也就是分类和回归在一个1X1卷积实现。

因此，整个YoloV5网络的工作是 特征提取-特征增强-预测特征对应的物体情况。

二、网络结构分析

1、主干网络Backbone介绍

YoloV提取网络使用的征提取网络是CSPDarknet，它有五个重要特点：
1、使用了残差网络Residual，CSPDarknet残差卷积可分为两部分，主干部分为一次1X1卷积及一次3X3.卷积；残余边缘不做任何处理，主干的输入输出直接结合。整个YoloV5.主干部分由残差卷组成：

def Bottleneck(x, out_channels, shortcut=True, name = ""):     y = compose(             DarknetConv2D_BN_SiLU(out_channels, (1, 1), name = name + '.cv1'),
            DarknetConv2D_BN_SiLU(out_channels, (3, 3), name = name + '.cv2'))(x)
    if shortcut:
        y = Add()([x, y])
    return y

残差网络的特点是容易优化，并且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃连接，缓解了在深度神经网络中增加深度带来的梯度消失问题。

2、使用CSPnet网络结构，CSPnet结构并不算复杂，就是将原来的残差块的堆叠进行了一个拆分，拆成左右两部分：主干部分继续进行原来的残差块的堆叠；另一部分则像一个残差边一样，经过少量处理直接连接到最后。因此可以认为CSP中存在一个大的残差边。

def C3(x, num_filters, num_blocks, shortcut=True, expansion=0.5, name=""):
    hidden_channels = int(num_filters * expansion)  # hidden channels
    #----------------------------------------------------------------#
    # 主干部分会对num_blocks进行循环，循环内部是残差结构。
    #----------------------------------------------------------------#
    x_1 = DarknetConv2D_BN_SiLU(hidden_channels, (1, 1), name = name + '.cv1')(x)
    #--------------------------------------------------------------------#
    # 然后建立一个大的残差边shortconv、这个大残差边绕过了很多的残差结构
    #--------------------------------------------------------------------#
    x_2 = DarknetConv2D_BN_SiLU(hidden_channels, (1, 1), name = name + '.cv2')(x)
    for i in range(num_blocks):
        x_1 = Bottleneck(x_1, hidden_channels, shortcut=shortcut, name = name + '.m.' + str(i))
    #----------------------------------------------------------------#
    # 将大残差边再堆叠回来
    #----------------------------------------------------------------#
    route = Concatenate()([x_1, x_2])

    #----------------------------------------------------------------#
    # 最后对通道数进行整合
    #----------------------------------------------------------------#
    return DarknetConv2D_BN_SiLU(num_filters, (1, 1), name = name + '.cv3')(route)

3、使用了Focus网络结构，这个网络结构是在YoloV5里面使用到比较有趣的网络结构，具体操作是在一张图片中每隔一个像素拿到一个值，这个时候获得了四个独立的特征层，然后将四个独立的特征层进行堆叠，此时宽高信息就集中到了通道信息，输入通道扩充了四倍。拼接起来的特征层相对于原先的三通道变成了十二个通道，下图很好的展示了Focus结构，一看就能明白。

class Focus(Layer):
    def __init__(self):
        super(Focus, self).__init__()

    def compute_output_shape(self, input_shape):
        return (input_shape[0], input_shape[1] // 2 if input_shape[1] != None else input_shape[1], input_shape[2] // 2 if input_shape[2] != None else input_shape[2], input_shape[3] * 4)

    def call(self, x):
        return tf.concat(
            [x[...,  ::2,  ::2, :],
             x[..., 1::2,  ::2, :],
             x[...,  ::2, 1::2, :],
             x[..., 1::2, 1::2, :]],
             axis=-1
        )

4、使用了SiLU激活函数，SiLU是Sigmoid和ReLU的改进版。SiLU具备无上界有下界、平滑、非单调的特性。SiLU在深层模型上的效果优于 ReLU。可以看做是平滑的ReLU激活函数。
$\text{sigmoid}(x)$

class SiLU(Layer):
    def __init__(self, **kwargs):
        super(SiLU, self).__init__(**kwargs)
        self.supports_masking = True

    def call(self, inputs):
        return inputs * K.sigmoid(inputs)

    def get_config(self):
        config = super(SiLU, self).get_config()
        return config

    def compute_output_shape(self, input_shape):
        return input_shape

5、使用了SPP结构，通过不同池化核大小的最大池化进行特征提取，提高网络的感受野。在YoloV4中，SPP是用在FPN里面的，在YoloV5中，SPP模块被用在了主干特征提取网络中。

def SPPBottleneck(x, out_channels, name = ""):
    #---------------------------------------------------#
    # 使用了SPP结构，即不同尺度的最大池化后堆叠。
    #---------------------------------------------------#
    x = DarknetConv2D_BN_SiLU(out_channels // 2, (1, 1), name = name + '.cv1')(x)
    maxpool1 = MaxPooling2D(pool_size=(5, 5), strides=(1, 1), padding='same')(x)
    maxpool2 = MaxPooling2D(pool_size=(9, 9), strides=(1, 1), padding='same')(x)
    maxpool3 = MaxPooling2D(pool_size=(13, 13), strides=(1, 1), padding='same')(x)
    x = Concatenate()([x, maxpool1, maxpool2, maxpool3])
    x = DarknetConv2D_BN_SiLU(out_channels, (1, 1), name = name + '.cv2')(x)
    return x

整个主干实现代码为：

from functools import wraps

import tensorflow as tf
from tensorflow.keras import backend as K
from tensorflow.keras.initializers import RandomNormal
from tensorflow.keras.layers import (Add, BatchNormalization, Concatenate,
                                     Conv2D, Layer, MaxPooling2D,
                                     ZeroPadding2D)
from tensorflow.keras.regularizers import l2
from utils.utils import compose


class SiLU(Layer):
    def __init__(self, **kwargs):
        super(SiLU, self).__init__(**kwargs)
        self.supports_masking = True

    def call(self, inputs):
        return inputs * K.sigmoid(inputs)

    def get_config(self):
        config = super(SiLU, self).get_config()
        return config

    def compute_output_shape(self, input_shape):
        return input_shape

class Focus(Layer):
    def __init__(self):
        super(Focus, self).__init__()

    def compute_output_shape(self, input_shape):
        return (input_shape[0], input_shape[1] // 2 if input_shape[1] != None else input_shape[1], input_shape[2] // 2 if input_shape[2] != None else input_shape[2], input_shape[3] * 4)

    def call(self, x):
        return tf.concat(
            [x[...,  ::2,  ::2, :],
             x[..., 1::2,  ::2, :],
             x[...,  ::2, 1::2, :],
             x[..., 1::2, 1::2, :]],
             axis=-1
        )

#------------------------------------------------------#
# 单次卷积DarknetConv2D
# 如果步长为2则自己设定padding方式。
#------------------------------------------------------#
@wraps(Conv2D)
def DarknetConv2D(*args, **kwargs):
    darknet_conv_kwargs = { 
        'kernel_initializer' : RandomNormal(stddev=0.02), 'kernel_regularizer' : l2(kwargs.get('weight_decay', 5e-4))}
    darknet_conv_kwargs['padding'] = 'valid' if kwargs.get('strides')==(2, 2) else 'same'   
    try:
        del kwargs['weight_decay']
    except:
        pass
    darknet_conv_kwargs.update(kwargs)
    return Conv2D(*args, **darknet_conv_kwargs)

#---------------------------------------------------#
# 卷积块 -> 卷积 + 标准化 + 激活函数
# DarknetConv2D + BatchNormalization + SiLU
#---------------------------------------------------#
def DarknetConv2D_BN_SiLU(*args, **kwargs):
    no_bias_kwargs = { 
        'use_bias': False}
    no_bias_kwargs.update(kwargs)
    if "name" in kwargs.keys():
        no_bias_kwargs['name'] = kwargs['name'] + '.conv'
    return compose(
        DarknetConv2D(*args, **no_bias_kwargs),
        BatchNormalization(momentum = 0.97, epsilon = 0.001, name = kwargs['name'] + '.bn'),
        SiLU())

def Bottleneck(x, out_channels, shortcut=True, weight_decay=5e-4, name = ""):
    y = compose(
            DarknetConv2D_BN_SiLU(out_channels, (1, 1), weight_decay=weight_decay, name = name + '.cv1'),
            DarknetConv2D_BN_SiLU(out_channels, (3, 3), weight_decay=weight_decay, name = name + '.cv2'))(x)
    if shortcut:
        y = Add()([x, y])
    return y

def C3(x, num_filters, num_blocks, shortcut=True, expansion=0.5, weight_decay=5e-4, name=""):
    hidden_channels = int(num_filters * expansion)
    #----------------------------------------------------------------#
    # 主干部分会对num_blocks进行循环，循环内部是残差结构。
    #----------------------------------------------------------------#
    x_1 = DarknetConv2D_BN_SiLU(hidden_channels, (1, 1), weight_decay=weight_decay, name = name + '.cv1')(x)
    #--------------------------------------------------------------------#
    # 然后建立一个大的残差边shortconv、这个大残差边绕过了很多的残差结构
    #--------------------------------------------------------------------#
    x_2 = DarknetConv2D_BN_SiLU(hidden_channels, (1, 1), weight_decay=weight_decay, name = name + '.cv2')(x)
    for i in range(num_blocks):
        x_1 = Bottleneck(x_1, hidden_channels, shortcut=shortcut, weight_decay=weight_decay, name = name + '.m.' + str(i))
    #----------------------------------------------------------------#
    # 将大残差边再堆叠回来
    #----------------------------------------------------------------#
    route = Concatenate()([x_1, x_2])

    #----------------------------------------------------------------#
    # 最后对通道数进行整合
    #----------------------------------------------------------------#
    return DarknetConv2D_BN_SiLU(num_filters, (1, 1), weight_decay=weight_decay, name = name + '.cv3')(route)

def SPPBottleneck(x, out_channels, weight_decay=5e-4, name = ""):
    #---------------------------------------------------#
    # 使用了SPP结构，即不同尺度的最大池化后堆叠。
    #---------------------------------------------------#
    x = DarknetConv2D_BN_SiLU(out_channels // 2, (1, 1), weight_decay=weight_decay, name = name + '.cv1')(x)
    maxpool1 = MaxPooling2D(pool_size=(5, 5), strides=(1, 1), padding='same')(x)
    maxpool2 = MaxPooling2D(pool_size=(9, 9), strides=(1, 1), padding='same')(x)
    maxpool3 = MaxPooling2D(pool_size=(13, 13), strides=(1, 1), padding='same')(x)
    x = Concatenate()([x, maxpool1, maxpool2, maxpool3])
    x = DarknetConv2D_BN_SiLU(out_channels, (1, 1), weight_decay=weight_decay, name = name + '.cv2')(x)
    return x
    
def resblock_body(x, num_filters, num_blocks, expansion=0.5, shortcut=True, last=False, weight_decay=5e-4, name = ""):
    #----------------------------------------------------------------#
    # 利用ZeroPadding2D和一个步长为2x2的卷积块进行高和宽的压缩
    #----------------------------------------------------------------#

    # 320, 320, 64 => 160, 160, 128
    x = ZeroPadding2D(((1, 0),(1, 0)))(x)
    x = DarknetConv2D_BN_SiLU(num_filters, (3, 3), strides = (2, 2), weight_decay=weight_decay, name = name + '.0')(x)
    if last:
        x = SPPBottleneck(x, num_filters, weight_decay=weight_decay, name = name + '.1')
    return C3(x, num_filters, num_blocks, shortcut=shortcut, expansion=expansion, weight_decay=weight_decay, name = name + '.1' if not last else name

 
            锐单商城拥有海量元器件数据手册、IC替代型号，打造电子元器件IC百科大全！

 相关文章
 动力学技术KTU1121 USB Type-C 端口保护器的介绍、特性、及应用
Sensata PTE7300密封数字压力传感器的介绍、特性、及应用
PANJIT PBHV8110DA/PBHV9110DA低Vce(sat)晶体管的介绍、特性、及应用
ams OSRAM OSLON 黑色平板X LED器件的介绍、特性、及应用
Cree LED CLQ6A三合一贴片LED的介绍、特性、及应用
Cree LED CLQ6B 4-in-1 RGBW贴片LED的介绍、特性、及应用
NDK NX1210AB表面贴装晶体的介绍、特性、及应用
伊顿ACE2V3225共模芯片电感器的介绍、特性、及应用
意法半导体X040灵敏型栅可控硅和Z040可控硅的介绍、特性、及应用
ABLIC S-82Y1B电池保护芯片的介绍、特性、及应用
 动态
产品
新闻
电路图
方案
技术
公告
  详细介绍电流互感器功能区别3CT SR ZCT
雅特力携多款AT32 MCU新品与应用方案亮相2024慕尼黑上海电子展
AMEYA360 | 江苏润石RSR58x高压系列高精密基准源
断路器的常见故障和处理方法
普源精电（RIGOL）多通道材料应力测量系统
  亚马逊云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g实例正式可用
OPPO 与爱立信签署全球战略合作协议
英飞凌推出业界首款符合太空标准的并行接口1 Mb和2 Mb F-RAM，扩大其抗辐射存储器产品组合
2024慕尼黑上海电子展亮点：三款重点展品及解决方案的深度探索
前途未卜的AI个人助理
 让“节能”贯穿服务器全生命周期，英特尔至强6能效核处理器的出众之处
英特尔CEO帕特·基辛格：AI正推动业界进入创新黄金时代，影响力堪称空前
英飞凌推出适用于物联网设备进行非接触式验证及安全配置的NFC I2C 桥接标签
安森美推出提高数据中心能效的完整电源解决方案
Molex莫仕在中国荣获通用汽车供应商质量卓越奖
 整流二极管的应用电源
绝缘栅双极型晶体管应用电路
多位 LED 数码管
单向晶闸管构成的交流开关电路
压敏电阻器电路
 27 MHz 谐振转换器的直流输出
具有初级电压钳位的氮化镓 (GaN) FET 可显著实现交流适配器的小型化
栅极驱动器电路设计
现代电磁炉烹饪需要紧凑而高效的解决方案
工业辅助电源中的 SiC
 动力学技术KTU1121 USB Type-C 端口保护器的介绍、特性、及应用
Sensata PTE7300密封数字压力传感器的介绍、特性、及应用
PANJIT PBHV8110DA/PBHV9110DA低Vce(sat)晶体管的介绍、特性、及应用
ams OSRAM OSLON 黑色平板X LED器件的介绍、特性、及应用
Cree LED CLQ6A三合一贴片LED的介绍、特性、及应用
 2025年春节放假通知
锐单2024年51劳动节放假通知
锐单商城2024年清明节放假通知
2024年春节锐单商城放假安排
【通知】2024年元旦锐单商城放假安排

  品牌专区
 
  热销 替代 pdf库 ic百科
 MRS25000C4303FCT00
WK73R2HTTE393J
PR02000208203JA100
CMF5512K400FHEB
RR02J36RTB
RS73F2BTTD71R5B
RS73F1JTTD6343F
PR01000102201JA100
MP9100-0.15-1%
SG73S2ATTD1242F
RC14JB750R
RS73F2BTTD8450B
CFM14JT47R0
273-12-RC
RS73F1JTTD2701C
RS73F2ATTD2430D
H81M0BYA
FMP200JR-52-3R9
MRS25000C2101FCT00
WK73S3ATTE68LJ
PR02000208203JA100
RR02J3R3TB
RS73F1JTTD3001D
PR01000102201JA100
MP9100-0.20-1%
RNMF14FTC18R0
SG73S2ATTD11R8F
273-180K-RC
RN73H1JTTD1141D100
H84K99BYA
 GRM0335C1E560JD01D
02015A6R8CAT2A
0201ZC332KAT7A
0201ZD103KAT2A
0201YA820GAT2A
CL03B152KP3NNNC
ECJ-ZEB0J472K
ECJ-ZEB0J472K
0201ZD472KAT4A
0201ZD392KAT4A
0201ZD392KAT2A
04023A151FA77A
04023A180GAT2A
04023A180GA79A
04023A180GAT7A
04023A101KA72A
04023J2R1ABSTR
748642-1
04023A101KA72A
C1005C0G1H300J
04025A200GAT2A
04023C152KAJ2A
04026D104KAT2A
05085C103KAT2W
06035A121JAT2A
0508YC104KAT2V
LD031A180FAB9A
06031A180FA79A
101R14N100GV4T
101R14N100GV4T
 ESM22DTBN-S664
ESM22DTAT-S273
ESM22DSUI
ESM22DTAH-S189
ESM22DSEH
ESM22DTAT-S664
ESM22DRYN
ESM22DRYI
ESM22DSUN
ESM22DSEH-S13
ESM22DTAI
ESM22DTAT-S189
ESM22DTAI-S189
ESM22DTBD
ESM22DSEH-S243
ESM22DRYI-S13
ESM22DTBD-S189
ESM22DTBT
ESM22DSEI
ESM22DTAN-S189
ESM22DTBS
ESM22DTKS
ESM22DSEI-S13
ESM22DTBD-S273
ESM22DSXI
ESM22DTBD-S664
ESM22DTAN-S273
ESM22DTBT-S273
ESM22DTBS-S189
ESM22DTBH
 ECJ.0B.309.CYC
ECJ.2B.310.CLA
ECJ.2B.319.CYC
ECJ.1B.200.LC
ECJ.2B.310.CLD
ECJ.3B.318.CYG
ECJ.2B.436.CJL
ECJ.2B.316.CLA
ECJ.1B.304.CLA
ECJ.3B.320.CLA
ECJ.2B.310.CYB
ECJ.3B.304.CYC
ECJ.1B.305.CYC
ECJ.3B.320.CYB
ECJ.1B.308.CLA
ECJ.2B.314.CLD
ECJ.2B.310.CYG
ECJ.2B.310.CYB
ECJ.3B.322.CYB
ECJ.3B.307.CYC
ECJ.2B.314.CLV
ECJ.3B.302.CYC
ECJ.3B.324.CYB
ECG.1B.306.KLN
ECJ.3B.308.CLA
ECG.4B.879.CLL1
ECJ.2B.310.CYG
ECJ.3B.330.CYC
ECG.4B.856.CYM1
ECJ.2B.314.CYC
  热门文章
 详细介绍电流互感器功能区别3CT SR ZCT
雅特力携多款AT32 MCU新品与应用方案亮相2024慕尼黑上海电子展
AMEYA360 | 江苏润石RSR58x高压系列高精密基准源
断路器的常见故障和处理方法
普源精电（RIGOL）多通道材料应力测量系统
艾迈斯欧司朗最新推出的DURIS® LED将引领柔性多变照明新时代
在线式一氧化碳检测仪XKCON-G600-DCO具有防爆功能，使用于冶金行业场所应用
电容补偿柜频繁投入退出的影响
有源滤波器补偿需不需要带电抗器
紫光同芯发布新一代汽车MCU THA6206，助力汽车产业腾飞
电子设备振动环境试验(8) —— 噪声试验
扎堆印度的半导体大厂们，能有光明的未来吗？
为什么80%的芯片采用硅晶圆制造？
全球锂电大退潮｜深度
芯流独家：改革尾声，OPPO已陆续清退华为系员工