锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

Pedestrian Collision Avoidance System for Scenarios with Occlusions--有遮挡情况下的行人避让系统

时间:2023-07-19 08:07:00 pc5n位移传感器

文章目录

  • 行人在遮挡的情况下避开系统 --Pedestrian Collision Avoidance System for Scenarios with Occlusions
    • 介绍了一些观察马尔可夫的过程
    • 介绍Introduction
    • 问题建模
      • 熟悉基本概念
        • 1 首先,了解以后将使用的内容__贝叶斯公式__。
        • 2 了解一下无人驾驶的决策
      • A . 背景
      • B. 场景建模
      • C.求解多行人情况
    • 自动紧急制动系统 AEB
    • 总结
    • 参考资料

行人在遮挡的情况下避开系统 --Pedestrian Collision Avoidance System for Scenarios with Occlusions

摘要:马尔可夫的过程被描述为马尔可夫决策过程的一部分POMDP, 导出鲁棒对行人位置不确定性的策略。本文的目的将是AEB(自动紧急制动)和上述策略结合起来,获得一个强大的自主制动系统。

AEB系统介绍: 车辆在非自适应巡航的情况下正常行驶,如车辆遇到紧急危险或与前方车辆和行人距离小于安全距离(但具有此功能的车辆不一定能完全制动车辆),以避免或减少碰撞事故,从而提高驾驶安全

介绍了一些观察马尔可夫的过程

马尔可夫的特点是,下一刻与过去无关,只取决于现在。

POMDP模型是机器人对当前状态的判断,因为在实际问题上,机器人对环境观测有一定的局限性,并不完全准确。因此,根据传感器获得的信息进行判断是有一定偏差的,这可以用一个概率来表示机器人有多确定。

  • MDP 该模型旨在解决机器决策中下一个动作带来的结果不确定性
  • POMDO 该模型旨在解决环境观测中机器的不确定性。

介绍Introduction

对于传感器和环境中的不确定性,将场景建模可观测的马尔可夫决策过程POMDPs。

此前研究的POMDP该策略适用于实现安全驾驶速度的稳定预测和计算,没有提供杰克规划和部分可观测的原则框架。

本论文结合AEB系统和POMDP。AEB该系统可以使用车辆的所有制动功率。POMDP考虑到遮挡造成的不确定性,规划期用于中速范围内的舒适机动。

AEB系统主要有以下功能:

  • 当道路一侧堵塞时,该策略将调整车速
  • 当车辆高速行驶时,行人出现在障碍物后面,碰撞是不可避免的,AEB系统负责强有力的干预
  • 当能见度低时,AEB系统无法避免或减少碰撞

POMDP不确定性可以在规划期内预测,紧急制动可以防止。两者的结合可以在封闭区域保持合理的驾驶速度。AEB系统比较,安全性能提高,事故率不会增加。

问题建模

将问题建模为马尔可夫决策过程的一部分,以寻求最佳近似解。

熟悉基本概念

1 首先,了解以后将使用的内容__贝叶斯公式__。

采用离散贝叶斯更新方法。

贝叶斯公式是一个逆概率问题,即知道结果,找出解决这个问题的原因。

在这里插入图片描述

就像病人做疾病检测一样,假设检测方法的成功率是100%,但正常人误检的概率是5%,发病率很低,1万。假设一个已知患病的人去检查,第一次检查出患病的概率是0.002。然后第二次检测是0.0385。这实际上是一个更新过程。说明复检的必要性。

这个例子隐藏着贝叶斯更新模式。当你对一件事有主观判断时,给出一个猜测或历史确定的概率,你可以通过使用先验信息和贝叶斯公式来推断更新的概率(后验信息)。

2 了解无人驾驶决策

自动驾驶的决策是分析感知模块传输的数据,然后操作汽车的行为以实现驾驶目标。例如,决策模块的工作是决定汽车何时左转、右转、变道等。决策应首先考虑汽车司机的安全性,然后考虑舒适性,并尽快到达设定的目的地。

常用的决策算法有:

  • 决策状态机
  • 决策树模型
  • 基于知识的推理决策模型
  • 如基于价值的决策模型POMDP

回到论文本身。

A . 背景

在不确定条件下,可以将序列决策问题建模部分可观测的马尔可夫决策过程(POMDPs)。他由元一七元组成。

其中S代表状态空间A–动作空间O–观测空间T是过度模型O是观测模型R是奖励函数γ是折扣因素

在一个POMDP因此,智能体对环境有不确定性,agent保持对其内部情况的信念。这个信念b可以在执行一个动作a和一个观察o后更新当前状态。它被使用离散贝叶斯更新模型

POMDP目的是找到最佳策略,最大限度地提高任何信念下的及时期望折扣报告。

很难直接解决最佳策略,因此需要采取类似的方法。本文采用离线方法QMDP解决最佳效用函数的方法。QMDP解决问题的方法是在假设状态在一段时间后完全可观察。通过这个假设,值迭代函数可以解决最佳状态效应函数U*(s,a)。

B. 场景建模

先介绍一个小概念:Frenet坐标系

下图显示了自动驾驶车辆的全局坐标系Frenet坐标系中的位置示意图。Frenet坐标系的建立是基于给定的参考线(记为 T r e f T_{ref} Tref/span>), T r e f T_{ref} Tref可以是任意曲线,一般情况下都是定位为道路的中心线。假设自动驾驶车辆在全局坐标系下的坐标为(x, y),从车辆的位置(x,y)向参考线 T r e f T_{ref} Tref做投影,投影点为F, 则点F与车辆位置(x,y)的距离即为横向位移d; 从参考线的起始点到投影点F的曲线举例就是纵向位移s。用(s,d)描述Frenet坐标系下自动驾驶车辆的坐标值,构建如下映射关系:
( x , y ) , T r e f − − ( s , d ) (x,y),T_{ref}--(s,d) (x,y),Tref(s,d)
基于Frenet坐标系,将自动驾驶车辆每时每刻的位置状态分解在s和d两个方向来描述车辆的运动状态,从而在轨迹曲线拟合时,减少处理坐标信息的工作量。

下面继续分析一下论文。

论文中道路在Frenet框架中表示,通过适当的坐标变换,我们的规划期可以直接应用于不同的道路配置。分块说一下QMDP中的一些状态参数。

  1. 动作空间

首先定义了横向控制的有限动作空间 { 0 m / s 2 , 1 m / s 2 , − 1 m / s 2 } \{0 m/s^2, 1 m/s^2, -1 m/s^2\} { 0m/s2,1m/s2,1m/s2},无加速度,加速,减速。

纵向上定义了不同强度的一组加速减速动作: { 1 m / s 2 , 0 m / s 2 , − 1 m / s 2 , − 2 m / s 2 , − 4 m / s 2 } \{1 m/s^2, 0 m/s^2, -1 m/s^2, -2 m/s^2, -4 m/s^2\} { 1m/s2,0m/s2,1m/s2,2m/s2,4m/s2}

  1. 状态空间

状态空间就是在解决问题时候考虑的所有变量,这里表示对行人和车辆的信息的一个编码。为了处理复杂的道路路线,道路用Frenet表示。下面说明一下设定的车辆和行人的状态。

车辆:纵向速度(0 km/h- 50 km/h) 和车道内横向位置(+1 m)在状态空间中表示。

行人:位置s纵向(0m -50m) 横向t(正负5米)。速度:(0 km/h- 7.2 km/h)和方向(正负90°)。

下图以一个过街行人来说明状态表示。状态空间中所有变量都被离散化,结果是ego车辆的29个速度和车道上5个位置。然后行人27个纵向位置、11个横向位置、5个速度水平和7个可能的方向。

通过 车辆和行人的状态组合有 1.5 ∗ 1 0 6 1.5*10^6 1.5106.

  1. 过渡模型

ego车辆的过渡模型取决于ego车辆的当前动作和状态。对于行人的过渡模型,我们使用一个简单的可达模型,改模型取决于当前行人状态,并根据一组可能的加速度来计算行人的位置。

  1. 观察模型

观察模型描述了ego车辆对状态空间的感知,现在假设ego车辆的位置和速度都是完全可观测的。观察空间与实际状态空间相似。观察模型可以描述为如下:

  • 始终可以检测到非遮挡区域的物体
  • 障碍物后面遮挡的物体不会被检测到
  • 果如检测到物体,行人的速度、位置和方向等测量数据在真实状态下符合正态分布。分布的参数取决于感知系统模型。
  1. 奖励模型

奖励模型定义了可观测马尔可夫模型的目标。

ego车辆和行人发生碰撞受到处罚。我们额外定义了一个奖励信号,以让车保持足够的速度并且保持在车道的中心。

如果车辆保持住,则不会收到任何奖励。奖罚项回随速度差和车道中心的横向偏移量线性减小。

POMDP规划的最终行为可以通过选择不同的惩罚和奖励值来修改。这些惩罚和奖励可以通过模拟定义的场景来调整,以平衡避免碰撞和效率。

C.求解多行人情况

上面描述的POMDP模型针对的是一个行人。为了拓展最终策略的功能,我们使用了效用分解方法。每个行人都是独立考虑,全局效用函数近似为每个行人的最小信念-行动效益。

这里的 U s i n g l e U_{single} Usingle是通过求解考虑单个行人的POMDP得到的效用函数。采取最低限度将导致采取与最关键行人相关的活动。

自动紧急刹车系统 AEB

AEB系统和POMDP规划期一起工作。它使用了POMDP规划器生成的驾驶轨迹来计算碰撞风险。如果碰撞不可避免会发生,AEB系统就会触发,进行紧急刹车,紧急停止具有最高优先级,并能够否决掉POMDP的计划。

AEB系统以高更新的频率运行,便于快速检测出风险。与POMDP一样,这个系统使用了Frenet框架将问题概述为一条直线,下面的伪码描述了这个算法。AEB系统的输入是Frenet帧中的行人位置和速度以及更高级规划器给出的ego车辆轨迹。

首先在第一部中,输入行人的位置速度,以及ego车辆的轨迹。然后以此来计算TTB也就是车辆制动时间。

然后预测模型给出行人未来可能状态的分布,改分布以及未来ego车辆状态信息用于计算碰撞概率 P c P_c Pc,这是未来行人状态与ego车辆状态重叠的估计分数。下面模拟图中的t=2.5s时候的红色圈圈就代表预测模型给出来的未来可能状态的分布。算法的性能直接关系到预测的质量。如果PCI高于阈值,将使用下面的风险度量来进行额外检查:

这里的TTB是发生碰撞的时间。当风险高于阈值的时候,出发紧急刹车。

上图是道路右侧有障碍物的过街行人可视化场景。在道路左右两个行人静止不动。状态用蓝色表示。在这种情况下POMDP规划器与AEB系统结合使用。在上图,1s的时候,车辆没有检测到行人。但是系统对于这种障碍物情况保持一定的警惕性。POMDP规划利用这个信念降低了速度。在t=2.5s的时候,检测到了过街的行人,在执行信念更新以后,行人出现的概率增加,红色圈圈表示AEB系统预测行人的位置,此时触发紧急干预刹车,避免碰撞。在最后一张图的时候,ego车辆停止,行人横穿了马路。

这里我们用了多种指标来评估绩效,计算了所有EuroNCAP情境下的平均速度,碰撞次数和紧急干预量。

POMDP规划器的行为受到奖励函数的影响。必须调整奖励函数,来满足安全和效率要求。为奖励函数确定好的参数,具有挑战性。我们进行了参数搜索,并使用定义的场景评估了结果策略,目的是比较碰撞率、紧急制动和车辆的平均速度。调整了一下参数。

  • 纵向行动惩罚(油门/刹车)
  • 保持50km/h的速度奖励
  • 行人出现的概率(这个是过渡模型的一个参数)

下图显示了不同奖励函数下的结果。这里最关键的情况是侧面有障碍物的情况,因为需要降低速度来避免以50km/h发生碰撞。另外,行人出现在障碍物后面的概率对碰撞量和紧急制动干预以及平均速度有重大影响。随着行人出现概率增加,其减少。

总结

在比较不同方法的结果之前,我们分析了不同的奖励配置。图6显示了POMDP planner在使用和不使用AEB系统时的不同奖励参数设置。在这个实验中,保持车道的奖励和纵向行为的惩罚是固定的,行人出现的概率是不同的。下图显示了碰撞和平均速度之间的关系。两种方法都可以实现无碰撞配置。

由于AEB系统有能力请求更强的制动干预,因此将POMDP计划器与AEB系统相结合会产生更高的平均速度。下图显示了紧急制动干预的数量,当行人出现的概率较高时,紧急制动干预的数量会减少。随着干预次数的减少,当通过闭塞区域时,系统表现得更加保守。

配备AEB系统的POMDP planner能够更快地驾驶,但需要紧急制动干预以避免碰撞。POMDP计划器在闭塞区域前方减速。以低于50公里/小时的速度行驶,可避免与堵塞的行人发生碰撞。在这种情况下,AEB系统无法避免速度为50 km/h的碰撞。高速行驶时,反应时间不足以停止车辆。图8显示了带有停用AEB系统的POMDP规划器的速度曲线,我们称其为未调整。在这种情况下,障碍物前的速度太高,减速不够,这说明了基础AEB系统的优点。表三总结了这三种方法的性能。AEB系统无法避免所有碰撞,但两个POMDP计划器可以避免所有碰撞。POMDP规划器和AEB系统相结合的实现能够更快地通过障碍物。平均速度较高,但会触发四次紧急制动干预。

参考资料

M. Schratter, M. Bouton, M. J. Kochenderfer and D. Watzenig, “Pedestrian Collision Avoidance System for Scenarios with Occlusions,” 2019 IEEE Intelligent Vehicles Symposium (IV), 2019, pp. 1054-1060, doi: 10.1109/IVS.2019.8814076.

chenderfer and D. Watzenig, “Pedestrian Collision Avoidance System for Scenarios with Occlusions,” 2019 IEEE Intelligent Vehicles Symposium (IV), 2019, pp. 1054-1060, doi: 10.1109/IVS.2019.8814076.

博客:David-Chow

锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章