锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

FUTR3D:一个统一的传感器融合3D检测框架

时间:2022-12-04 06:30:00 3d影像传感器ar0331传感器两线一体化传感器

点击上方“3D视觉车间,选择星标

第一时间送达干货

b0330c1b6c019ae342ee838a81b28fc8.png

来源丨黄浴

作者,计算机视觉深度学习和自动驾驶

arXiv论文“FUTR3D: A Unified Sensor Fusion Framework for 3D Detection,来自复旦,CMU、MIT、Stanford(李想汽车工作)和清华。

自动驾驶和机器人技术是许多感知系统中的一个重要课题。现有多模态3D根据传感器组合或设置,检测模型通常涉及定制设计。这项工作是统一的,用于3D端到端传感器集成框架FUTR3D,它可以用于(几乎)任何传感器配置。FUTR3D基于查询的不可知模态特征采样器(Modality-Agnostic Feature Sampler,MAFS),还有一个用于3D检测集合-集合损失函数transformer解码器,避免后融合的启发方法和后处理。该框架的有效性得到了相机、低分辨率激光雷达、高分辨率激光雷达和雷达的验证。FUTR3D通过不同的传感器配置,实现了极大的灵活性和低成本的自动驾驶。

如图所示:FUTR3D可用于任何传感器配置,包括2D摄像机、3D激光雷达、3D雷达和4D成像雷达。


如图是FUTR3D概述:每个传感器模态使用模态特定特征编码器在自己的坐标中单独编码。然后,基于查询MAFS根据每个查询3D参考点从所有可用模式中提取特征。transformer解码器根据查询预测3D边框。可迭代反馈预测框MAFS和transformer优化解码器中的预测。

使用激光雷达点云VoxelNet(0.1m体素大小)或0.2m柱大小的PointPillar编码激光雷达点云。D主干和FPN之后 ,获得多尺度BEV特征图。

位置、速度和强度采用N个雷达点向量。MLP雷达特征的编码。

用ResNet和FPN提取多个图像的特征,为每个图像输出多尺度特征图。

融合的insight是这样的:在不同的模式中,目标属性并不是同样可识别的。因此,寻求利用不同的模式,并从中提取补充信息。从所有模式中采样点特征后,融合特征并更新查询。

首先,连接所有模式的采样特征,并使用以下公式给出MLP网络对其进行编码:

其中

这里,MAFS通过线性变换和sigmoid从每个目标查询中解码3D参考点如下

查询更新:

采用自注机制建模查询中的交互,如下:

采用迭代细化边框的方法:

在损失函数中,计算预测和真实值之间的一对一损失涉及两个步骤:第一,使用bipartie-matching在预测和真实边框之间进行一对一匹配。然后,在一对一匹配的情况下,计算回归损失和分类损失。特别是,一对一的匹配问题可以通过Hungarian解决算法。


实验结果如下:

nuScenes数据中有6个环视摄像头,激光雷达采用32线,模拟可生成4线数据,从笛卡尔坐标到极坐标,然后在pitch坐标转换公式如下:

此外,5个雷达数据聚集在一起,成为200-300点云。

左:1-线 LiDAR cameras, 中:4-线 LiDAR cameras,右:32-线 LiDAR cameras

本文仅进行学术分享。如有侵权行为,请联系删除。

3D视觉车间精品课程官网:3dcver.com

1.自动驾驶领域的多传感器数据集成技术

2.自动驾驶领域3D点云目标检测全栈学习路线!(单模态 多模态/数据 代码)
3.彻底了解视觉三维重建:原理分析、代码解释、优化和改进
4.中国第一门面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码解释
6.彻底理解视觉-惯性-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 从源代码分析到算法优化
8.室内外激光彻底分析SLAM关键算法原理、代码和实战(cartographer LOAM LIO-SAM)

9.从零开始建造一套结构光3D重建系统[理论 源码 实践]

10.单目深度估计方法:算法梳理和代码实现

11.在自动驾驶中部署深度学习模型

12.相机模型及标定(单目) 双目 鱼眼)

13.重磅!四旋翼飞机:算法与实战

14.ROS2从入门到精通:理论与实战:

重磅!3DCVer-提交学术论文写作交流群已成立

扫码添加小助手微信,可申请加入3D视觉研讨会-学术论文写作和提交微信交流群旨在交流顶会、顶刊、SCI、EI等待写作和提交。

同时也可以申请加入我们的细分交流群。目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶,多传感器集成,CV入门,三维测量,VR/AR、3D人脸识别、医学影像、缺陷检测、行人重识别、目标跟踪、视觉产品着陆、视觉竞赛、车牌识别、硬件选择、学术交流、求职交流、ORB-SLAM系列源码交流,深度估计等微信群。

注:研究方向 学校/公司 昵称,例如:”3D视觉 上海交大 安静。请按格式备注,可快速通过并邀请进入群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注微信官方账号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列手眼标定相机标定、激光/视觉SLAM、自动驾驶等)、总结知识点,进入高级学习路线,最新paper分享,回答问题深耕五个方面,各大厂的算法工程师进行技术指导。同时,星球将与知名企业合作发布3家D视觉相关算法开发岗位和项目对接信息,打造集技术与就业于一体的铁杆粉丝聚集区,近4000星球成员打造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈子里有高质量的教程资料,可以回答问题,帮助你有效地解决问题

觉得有用,麻烦给个赞和在看~  

锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章