协同控制中的共识算法概述

时间：2022-09-01 20:30:00 微型可伸缩传感器 y27a2024tj圆形连接器 1212s2to接近传感器 j95组合式连接器

第一章协同控制中共识算法概述

本章主要内容：
本章总结了协同控制中的共识算法；
2.在协同控制中实现信息共识的动机；
文献综述了共识算法；
4.总结了在通信拓扑时间和动态变化下寻求共识的理论结果；
本文介绍了多车协同控制中共识算法的一些具体应用；
6.介绍了专门的组织结构。

1.1.引言部分

多辆自动驾驶汽车的协同控制提出了重大的理论和现实挑战；
1.研究的目标是开发子系统而不是单一系统；
2.团队的通信带宽和连通性往往有限，车辆之间的信息交换可能不可靠。也很难决定什么时候和谁沟通；
3.团队目标团队目标和个人目标；
4.每辆车的计算资源总是有限的。

??近年来，自主车辆协调领域的大部分研究都建立了全球团队知识的可用性，以集中的方式规划了团队性能的能力和车辆之间几乎完美无限的通信。集中协调方案依赖于假设每个子系统可以通过完全连接的网络与中心未知的信息进行通信或共享。通信拓扑在现实世界中通常不完全连接。在许多情况下，它们取决于车辆的相对位置和其他环境因素，因此在时间上发生动态变化。此外，无线通信道还有多路径、衰落和退出。因此，在现实通信约束下的合作控制成为一个重大挑战。为了了解协同控制中所有固有的基本问题，我们提供了以下直观而有吸引力的基本公理。

公理1：共享信息是合作的必要条件。
公理1.1的直接结果之一是，合作要求车辆组就协调变量的实例化达成一致，或将协调变量的实例化差异收敛到预指定值。合作控制的一个关键问题是确定算法，这样一组车辆就协调变量的实例化达成协议，或者协调变量的实例化之间的差异(i)不完善的传感器、(ii)通信中断、(iii)稀疏通信拓扑和(iv)存在噪声和不可靠的通信链路时，收敛于预定值。

1.2.文献综述:共识算法

??当多辆车就一个感兴趣的变量的价值达成一致时，据说它们达成了共识。信息共识确保在网络拓扑上共享信息的车辆具有一致的信息视图，对协调任务至关重要。为了达成共识，必须有一个共同感兴趣的变量，称为信息状态和适当的算法方法来协商变量的价值，称为共识算法。信息状态是团队协调变量的实例。例子包括编队的中心和形状的局部表、会合时间、监测周长、多车群运动方向、军事目标被摧毁的概率。因此，假设车辆之间只有邻居之间的相互作用，共识算法之间的相互作用。车辆将根据邻居的信息状态更新其信息状态的值。目的是设计更新定律，将网络中所有车辆的信息状态收敛到公共值。
??共识算法具有多辆自动驾驶车辆协同控制的背景，在稳定连接的背景下，已应用于交会、编队控制、集群、姿态对准、周长监控、分散任务分配（6、143）和传感器网络。

1.21、基本共识算法

??共识算法的基本思想是对每辆车的信息状态施加类似的动力学。如果车辆之间的通信网络允许连续通信，或者如果通信带宽足够大，则使用微分方程更新每辆车的信息状态。另一方面，如果通信数据以离散数据包的形式到达，则使用差异方程来建模信息状态更新。本节总结了一些基本的共识算法，每辆车使用一阶微分方程和一阶差分方程来更新标量信息状态。
??假设团队中有 $n$ 车辆，团队通信拓扑从有向图表示 $\mathcal{G}_{n} \triangleq\left(\mathcal{V}_{n}, \mathcal{E}_{n}\right)$ ，其中 $\mathcal{V}=\{1,2,...,n\}$ 是节点集合， $\mathcal{E}_{n} \subseteq \mathcal{V}_{n} \times \mathcal{V}_{n}$ 表示边的集合。通讯拓扑图可能是时变的，由于无人机编队可能飞过郊区，飞过峡谷。最常见的连续时间共识算法如下：
$\dot{x}_{i}(t)=-\sum_{j=1}^{n} a_{i j}(t)\left[x_{i}(t)-x_{j}(t)\right], \quad i=1, \ldots, n \tag{1.1} \color{red}{为什么是这个形式，文献 {69,97}}$
其中 $a_{i j}(t)$ 是在时刻 $t$ 与 $\mathcal{G}_n$ 相关联邻接矩阵 $\mathcal{A}_n \in \mathbb{R}^{n \times n}$ 的第 $(i, j)$ 个输入并且 $x_i{t}$ 是第 $i$ 辆车的信息状态。设定 $a_{i j}=0$ 表示车辆 $i$ 不能接收到第 $j$ 个车辆传输到的信息。(1)的一个结果是车辆 $i$ 的信息状态 $x_i(t)$ 被驱动靠近其邻居的信息状态。关键的收敛问题是什么时候所有车辆的信息状态都收敛到一个共同的值？(1) 式并不指定所期望的特点信息状态，如果通讯拓扑是固定的，且 $a_{i j}(t)$ 是时不变的，那么公共渐近值是所有初始信息状态的线性组合。一般来说，只能保证公共值是初始信息状态的凸组合。
共识算法（1）可写成如下的矩阵形式：
$\dot{x}(t)=-\mathcal{L}_n(t)x(t)$
其中 $x=[x_1,x_2,...,x_n]^T$ 是信息状态且 $\mathcal{L}_n(t)=[\mathcal{l}_{i j}(t)] \in \mathbb{R}^{n \times n}$ 是与 $\mathcal{G}_n$ 相关的非对称拉普拉斯矩阵。多车辆完成或者达到共识状态是如果对于所有的 $x_i(0)$ 和所有的 $i, j = 1, 2, . . ., n$ ，当 $\rightarrow \infty$ 时， $|x_i(t)-x_j(t)| \rightarrow 0$ 。
当车辆间的通信发生在离散时刻时，将使用差分方程来更新信息状态，最常见的离散时间共识算法的形式是这样：
$x_{i}[k+1]=\sum_{j=1}^{n} d_{i j}[k] x_{j}[k], \quad i=1, \ldots, n \tag{1.2} \color{red}{为什么是这个形式文献{97,145}}$
其中 $k$ 定义通信事件； $d_{i j}[k]$ 是在离散时刻指示 $k$ 下的约随机矩阵 $\mathcal{D}=[d_{i j}] \in \mathbb{R}^{n \times n}$ 且对于所有的 $i = 1, 2, . . ., n$ 而言，假定 $d_{i i}[k]>0$ 并且 $d_{i j}[k]>0$ 如果信息流从车辆 $j$ 到达车辆 $i$ 并且否则 $d_{i j}[k]=0$ 。直观地说，每辆车的信息状态被更新为其当前状态和相邻车辆当前状态的加权平均值。请注意，如果车辆在那一刻不与其他车辆交换信息，则它会保持其当前的信息状态。离散时间一致算法以矩阵形式写为:
$x[k+1]=\mathcal{D}[k] x[k]$
与连续时间情况类似，如果对于所有 $x_i[0]$ 和所有 $i ， j = 1 ， . . . ， n$ ，当 $k \to \infty$ 时， $x_i[k]−x_j[k]|→0$

锐单商城拥有海量元器件数据手册、IC替代型号，打造电子元器件IC百科大全！

协同控制中的共识算法概述

相关文章