锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

移动和嵌入式人体姿态估计(Mobile and Embedded Human Pose Estimation)

时间:2023-05-27 00:07:00 红外成像传感器bs412

估计移动和嵌入式人体姿势

  • 1. 背景
    • 1.1 获取小网络的方法
    • 1.2 判断模型的指标
    • 1.3 经典网络结构
    • 1.4 源码
    • 1.5 正确阅读论文的方法
    • 1.6 分组卷积(Group Convolution)
  • 2. 移动应用模型
    • 2.1 MobileNet -V1 (2017 Google)
      • 2.1.1 卷积概念可以深度分离
      • 2.1.2 卷积过程可以深度分离
      • 2.1.3 可分离卷积计算成本深度
      • 2.1.4 网络结构
      • 2.1.5 超参
      • 2.1.6 实验结果
      • 2.1.7 局限性
    • 2.2 MobileNetV2
      • 2.2.1 卷积可分离深度
      • 2.2.2 线性瓶颈 (Linear Bottlenecks)
      • 2.2.3 卷块的变体
      • 2.2.4 反向残差(Inverted residuals)
      • 2.2.5 网络结构
        • 2.2.5.1 线性瓶颈深度可分离卷积结构 (bottleneck depth-separable convolution)
        • 2.2.5.2 不同架构的卷积块比较
        • 2.2.5.3 最大通道数/内存比较
      • 2.2.6 实验结果
        • 2.2.6.1 不同网络的性能曲线
        • 2.2.6.2 线性瓶颈和反向残差Top 1 Accuracy的影响
        • 2.2.6.3 性能比较(基于COCO数据集)
        • 2.2.6.4 性能比较(基于ImageNet数据集)
    • 2.3 MobileNetV3
      • 2.3.1 在Pexel 手机上的性能
      • 2.3.2 高效移动构建块(Efficient Mobile Building Blocks)
      • 2.3.3 网络搜索(Network Search)
        • 2.3.3.1 增强探索空间
        • 2.3.3.2 SENet (Squeeze-and-Excitation Networks)
      • 2.3.4 感知平台的NAS用于逐块搜索 (Block-wise Search)
      • 2.3.5 NetAdapt用于逐层搜索(Layer-wise Search)
      • 2.3.6 网络改善
        • 2.3.6.1 重新设计耗时的层
        • 2.3.6.2 非线性(激活)函数
      • 2.3.7 网络模型
      • 2.3.8 实验结果
        • 2.3.8.1 分类(Classification)
        • 2.3.8.2 检测 (Detection)
        • 2.3.8.3 语义分割 (Semantic Segmentation)
    • 2.4 网络设计空间的设计 (DNDS)
      • 2.4.1 网络设计进化史
      • 2.4.2 设计设计空间 (Design Space Design)
        • 2.4.2.1 设计空间设计的工具(Tools for Design Space Design)
        • 2.4.2.2 AnyNet设计空间(The AnyNet Design Space)
        • 2.4.2.3 RegNet设计空间
      • 2.4.3 比较移动设备的性能
  • 3. 估计基于深度图的位置
    • 3.1 数据集
    • 3.2 估计基于单深度图的有效人体姿势
      • 3.2.1 数据
      • 3.2.2 实现方案
        • 3.2.2.1 深度图像特征(Depth image features)
        • 3.2.2.2 随机森林( Randomized forests)
        • 3.2.2.3 叶节点预测模型(Leaf node prediction models)
        • 3.2.2.4 汇总预测(Aggregating predictions)
    • 3.3 基于推理嵌入多任务学习的深度图像人体姿势估计
      • 3.3.1 框架
      • 3.3.2 网络结构
        • 3.3.2.1 全连接网络 (FCN: Fully Convolutional Network)
        • 3.3.2.2 内置推理MatchNet (Inference Built-in MatchNet)
        • 3.3.2.3 训练
        • 3.3.2.4 实验结果
    • 3.4 基于单个深度图的实时3D位置估计
      • 3.4.1 方法
        • 3.4.1.1 第一阶段(估计2D位置)
        • 3.4.1.2 第二阶段(估计3D位置)
      • 3.4.1.3 实现流程
      • 3.4.2 Slim Hourglass Block (SHB) for Faster Inference
      • 3.4.3 堆叠沙漏网络用于人体姿势估计
        • 3.4.3.1 相关工作
        • 3.4.3.2 网络结构
        • 3.4.3.3 有中间监督的堆叠沙漏
        • 3.4.3.4 训练细节
        • 3.4.3.5 实验结果
        • 3.4.3.6 不同网络的训练过程
    • 3.5 基于RGB-D的地面检测
      • 3.5.1 基于RGB-D的新型地面检测方法
        • 3.5.1.1 数据预处理
        • 3.5.1.2 图像坐标系变为世界坐标系
        • 3.5.1.3 地面检测算法
        • 3.5.1.4 实验结果
        • 3.5.1.5 结论
      • 3.5.2 基于RGB-D Sensor的地面检测
        • 3.5.2.1 提供的解决方案
        • 3.5.2.2 俯仰角(Pitch)在不变场景下检测地平面
        • 3..2.3 俯仰角(Pitch)和翻滚角(Roll)变化场景下检测地平面
        • 3.5.2.4 实验结果
    • 3.6 基于单个深度图精确位姿估计
    • 3.7 基于超像素聚类人体姿态识别 (深度图)
      • 3.7.1 深度图像中的人体特征点提取
        • 3.7.1.1 点云数据的超像素处理
        • 3.7.1.2 人体肢端点的提取
        • 3.7.1.3 人体部位的提取
        • 3.7.1.4 聚类特征点的提取
      • 3.7.2 基于稀疏回归模型的骨骼点提取
        • 3.7.2.1 基于拉格朗日乘子法的约束问题求解
        • 3.7.2.2 稀疏回归模型的求解
  • 参考

1. 背景

相关文章