9-axis sensor计算角位移调研资料

时间：2022-11-07 23:00:00 1836n5to接近传感器

#基础知识

搜索:刚体运动的描述

搜索：
基于陀螺仪及加速度计信号融合的姿态角度测量.pdf
卡尔曼滤波学习及应用.pdf

http://www.docin.com/p-270671133.html
基于MEMS设计和实现加速度传感器的空间运动轨迹系统

如何用MCU可穿戴电子产品的设计
http://www.eet-china.com/ART_8800704371_865371_TA_3fd1ad3a_3.HTM

#手势识别调研

模式识别
pattern recognization

----------------------------------------------------------------------------------
指环指势指令的输入模式
1. 识别动态平面轨迹，类似于鼠标手势识别
2. 识别静态手指的姿势

平面轨迹的手势识别，或使用Android GestureDetector(触摸屏手势)或完全实现识别算法

----------------------------------------------------------------------------------
识别率

隐马尔可夫模型是人工智能的决策模型
http://zh.wikipedia.org/wiki/隐马尔可夫模型
模式识别
http://zh.wikipedia.org/wiki/模式识别

---------------------------------------------------------------------------
手势识别技术综述
http://wenku.baidu.com/link?url=lmSmzDfksPSbMlJG2Z5FX1Qtyk4AH3TlEgBn4A5FejoP566kQU-9jnVwf2xYg2yQKrXOgiYbCQPz7OMDq6jcOOOuoH4EoMqTVfmlyCMtx9a

不同的手势识别方法：
1. 基于鼠标/笔（2D），基于sensors（3D）
2. 基于数据手套
3. 基于计算机视觉

手势识别方法(一种模式识别技术):
1. 模板匹配技术通过比较采样数据和预存储模板的相似性
2. 神经网络技术具有自组织和自学能力
3. 一种基于概率的分类方法，通过统计样本特征向量来确定分类器。
(如分类函数采用贝叶斯极大似然理论确定)

手势识别的几个部分：
图像预处理(计算机图形学问题)
特征提取、识别算法(模式识别问题)

--------------------------------------------------------------------
基于计算机视觉的手势识别方法有两种
1. 提取和识别基于形状特征的特征
在基于形状特征的特征提取和识别中，本文首先根据手势图像中手指的方向和数量进行粗分类，然后从边界图像和二值图像中提取周长、面积、重心距等形状特征向量，然后根据相似度匹配模板，实现字母手势的细分

2. 基于傅立叶描述子的特征提取和识别

根据傅立叶描述子的特征提取和识别，本文提出并分析了具有旋转、平移和尺度变换不变性、与边界起点位置无关的傅立叶描述子，并将傅立叶描述子和欧洲距离应用于字母手势的识别，通过计算输入手势的欧洲距离，确定输入图像与样本图像之间的匹配程度

Conception

极坐标：二位坐标系的表示

方向：direction，在3D一个方向可以用两个数字来表示。我的理解，比如用圆珠笔指向某个空间的方向，首先在水平面(极坐标系中)确定水平面角度a（0 - 360度)，然后以圆珠笔的末端为原点，在垂直于水平面的垂直平面上确定垂直角度b(0-360度)b空间中的任何方向都可以通过两个参数来确定。

方位：orientation，需要三个数字来确定。基于对方向的理解，只有两个参数a和b当时，虽然方向已经确定，但同一方向上有无数平行的直线。因此，当添加第三个参数时，只能确定空间的任何方向，即物体的具体姿势。

物体坐标轴：物体本身的坐标轴随物体的旋转而变化

惯性坐标轴：旋转的起始坐标轴方向固定不变

欧拉角：将角位移分解成绕三个垂直轴的三个旋转序列，即章动角θ、旋进角(即进角)ψ与自转角j组成；JC：有时我们用这三个名字：roll(滚角)，Pitch(俯仰角)和yaw(偏航角)

方向余弦：在几何分析中，三个向量方向余弦这个向量和三个坐标轴之间的角度是余弦；见：http://zh.wikipedia.org/wiki/方向余弦

正交矩阵：AA'=E（E单位矩阵，A'表示“矩阵A的转置矩阵”。）或A′A=E，n阶实矩阵A称为正交矩阵

牛顿-柯特斯(Newton-Cotes)求积公式:包含复化simpson求积公式

http://wenku.baidu.com/link?url=EfRyCeVL7AVKVKdNOkL4TvW75RHwem11VCWTHNGC5UMPiIiPbYXLmXYYcRylO0Xjop8T-AHK4q6uoQJAxOooFjppQlQLqCFNKx-7_JqdRI7

矢量坐标由欧拉角计算

From

http://wenku.baidu.com/link?url=FInh-biTGegI7gUcVOx4N5mcsanIVOSNuejDiDlZ5i878Av8nlCTqcSeND_VmpFTF22dFzmYRIJrBd1cFccxx6n2btSOuYqEi6xL3zD3Lk3

SR: 当坐标轴尺度/比例不变，原点不变时，△x,△y,△z都为0，λ公式(1)简化为矢量在惯性坐标系中的坐标值，等于旋转矩阵乘以物理坐标系的坐标值

详解几何变换

2012-10-23 10:59:44|分类：图形学|举报|字号订阅

在三维图形学中，几何变换大致分为三种，平移变换（Translation），缩放变换（Scaling），旋转变换（Rotation）。针对以下讨论DirectX，所以使用左手坐标系。

平移变换

三维空间中的一个点[x, y, z, 1]移动到另一个点[x', y', z', 1]span style="color:#333333;">，三个坐标轴的移动分量分别为dx=Tx, dy=Ty, dz=Tz, 即

x' = x + Tx

y' = y + Ty

z' = z + Tz

平移变换的矩阵如下。

缩放变换

将模型放大或者缩小，本质也是对模型上每个顶点进行放大和缩小（顶点坐标值变大或变小），假设变换前的点是[x, y, z, 1]，变换后的点是[x', y', z', 1]，那么

x' = x * Sx

y' = y * Sy

z' = z * Sz

缩放变换的矩阵如下。

旋转变换

这是三种变换中最复杂的变换，这里只讨论最简单的情况，绕坐标轴旋转，关于绕任意轴旋转，在后续的随笔中介绍。

绕X轴旋转

绕X轴旋转时，顶点的x坐标不发生变化，y坐标和z坐标绕X轴旋转θ度，旋转的正方向为顺时针方向（沿着旋转轴负方向向原点看）。[x, y, z, 1]表示变换前的点，[x', y', z', 1]表示变换后的点。变换矩阵如下。

关于旋转的正方向，OpenGL与多数图形学书籍规定旋转正方向为逆时针方向（沿着坐标轴负方向向原点看），比如Computer Graphics C Version，p409。

绕Y轴旋转

绕Y轴旋转时，顶点的y坐标不发生变化，x坐标和z坐标绕Y轴旋转θ度。[x, y, z, 1]表示变换前的点，[x', y', z', 1]表示变换后的点。变换矩阵如下。

绕Z轴旋转

绕Z轴旋转时，顶点的z坐标不发生变化，x坐标和y坐标绕Z轴旋转θ度。[x, y, z, 1]表示变换前的点，[x', y', z', 1]表示变换后的点。变换矩阵如下。

绕坐标轴旋转的矩阵推导

上面三个旋转矩阵是如何得来的呢？我们推导一下，首先看一下二维的情况，再扩展到三维即可。实际上上面三种绕坐标轴旋转的情况属于特殊的二维旋转，比如绕Z轴旋转，相当于在与XOY平面上绕原点做二维旋转。

假设点P(x, y)是平面直角坐标系内一点，其到原点的距离为r，其与X轴的夹角为A，现将点P绕原点旋转θ度，得到点P'(x', y')，P'与X轴的夹角为B，则A = B - θ。（注意，在二维坐标中，逆时针旋转时角度为正，顺时针旋转时角度为负，下图中由P旋转到P'，角度为θ，若是由P'转到P，则角度为-θ）。

于是可得下面的转换方程

（式一）

写成矩阵的形式就是

求得旋转矩阵为

由于这里使用齐次坐标，所以还需加上一维，最终变成

和前面给出的绕Z轴旋转矩阵完全吻合。

对于绕X轴旋转的情况，我们只需将式一中的x用y替换，y用z替换，z用x替换即可。替换后得到

(式二)

对应的旋转矩阵为

对于绕Y轴旋转的情况，只需对式二做一次同样的替换即可，的到的变换方程为

对应的变换矩阵为

== Happy Coding ==

3D中的方位和角位移(1) - (8)

From http://www.cppblog.com/lovedday/archive/2008/02/16/42801.html

Recommand book:　《3D.Math.Primer.for.Graphics.and.Game.Development》writtenby Fletcher.Dunn Chapter 10 Orientationand Angular Displacement in 3D

Original articles:

3D中的方位和角位移（1）

什么是方位

直观地说，我们知道物体的“方位”主要描述的是物体的朝向。然而“方向”和“方位”并不完全一样。向量有“方向”但没有“方位”，区别在于，当一个向量指向特定方向时，可以让向量自转（如图10.1所示），但向量（或者说它的方向）却不会有任何变化，因为向量的属性只有“大小”，而没有“厚度”和 “宽度”。

然而，当一个物体朝向特定的方向时，让它和上面的向量一样自转，你会发现物体的方位改变了，如图10.2所示：

从技术角度来讲，这就说明在3D中，只要用两个数字（例如：极坐标），就能用参数表示一个方向（direction）。但是，要确定一个方位（orientation），却至少需要需要三个数字。

我们知道不能用绝对坐标来描述物体的位置，要描述物体的位置，必须把物体放置于特定的参考系中。描述位置实际上就是描述相对于给定参考点（通常是坐标系的原点）的位移。

同样，描述物体方位时，也不能使用绝对量。与位置只是相对已知点的位移一样，方位是通过与相对已知方位（通常称为"单位"方位或"源"方位）的旋转来描述的。旋转的量称作角位移。换句话说，在数学上描述方位就等价于描述角位移。

"方位"和"角位移"的区别就像"点"和"向量"的区别 ---- 两个术语都只是在数学上等价而在概念上是不同的。方位和点主要用来描述一个单一的状态，而角位移和向量描述的是两个状态间的差别。具体来说，我们用矩阵和四元数来表示"角位移"，用欧拉角来表示" 方位"。

矩阵形式

3D中，描述坐标系中方位的一种方法就是列出这个坐标系的基向量，这些基向量是用其他的坐标系来描述的。用这些基向量构成一个3x3矩阵，然后就能用矩阵形式来描述方位。换句话说，能用一个旋转矩阵来描述这两个坐标系之间的相对方位，这个旋转矩阵用于把一个坐标系中的向量转换到另外一个坐标系中，如图10.3所示：

我们通过描述一个坐标系到另一个坐标系的旋转（无论采用哪种变换）来确定一个方位。矩阵变换的具体方向是一个实现细节，因为旋转矩阵是正交的，如果必要的话，只需简单的转置就可求得逆变换。

矩阵形式的优点

矩阵是一种非常直接的描述方位的形式，这种直接性带来了如下优点：

（1）可以立即进行向量的旋转。矩阵形式最重要的性质就是利用矩阵能在物体和惯性坐标系间旋转向量，这是其他描述方位所做不到的。为了旋转向量，必须将方位转换成矩阵形式。

（2）矩阵形式被图形API所采用。图形API使用矩阵来描述方位。（API就是应用程序接口，基本上它们就是实现你和显卡交流的代码。）当你和图形API交流时，最终必须用矩阵来描述所需的变换。程序中怎样保存方位由你决定，但如果选择了其他形式，则必须在渲染管道的某处将其转换为矩阵。

（3）多个角位移连接。矩阵形式的第二个优点就是可以 “打破”嵌套坐标系间的关系。例如，如果知道A关于B的方位，又知道B关于C的方位，使用矩阵可以求得A关于C的方位。

（4）矩阵的逆。用矩阵形式表达角位移时，逆矩阵就是"反" 角位移。因为旋转矩阵是正交的，所以这个计算只是简单的矩阵转置运算。

矩阵形式的缺点

（1）矩阵占用了更多的内存。如果需要保存大量方位，如动画序列中的关键帧，9个数会导致数目可观的额外空间损失。举一个或许不太合适的例子，假设现在做的是一个人的模型动画，该模型被分解为15块。动画的完成实际是严格地控制子块和父块之间的相对方位。假设每一帧为每一块保存一个方位，动画频率是15HZ ，这意味这每秒需要保存225个方位。使用矩阵和32位浮点数，每一帧有8100字节，而使用欧拉角，同样的数据只需2700字节。对于30s的动画数据，矩阵就比欧拉角多占用162k字节。

（2）难以使用。矩阵对人类来说并不直观，有太多的数，并且它们都在-1到1之间。人类考虑方位的直观方法是角度，而矩阵使用的是向量。通过实践，我们能从一个给定的矩阵中得到它所表示的方位。但这仍比欧拉角困难得多，其他方面也不尽如人意。用手算来构造描述任意方位的矩阵几乎是不可能的。总之，矩阵不是人类思考方位的直观方法。

（3）矩阵可能是病态的。矩阵使用9个数，其实只有3个数是必须的。也就是说，矩阵带有6阶冗余。描述方位的矩阵必须满足6个限制条件。行必须是单位向量，而且它们互相垂直。

病态矩阵是怎样出现的呢？有多种原因：

1、矩阵可能包含缩放、切变或镜像操作，这些操作会对物体的"方位"产生什么影响呢？确实，对此没有一个清晰的定义。任何非正交的矩阵都不是一个定义良好的旋转矩阵。虽然镜像矩阵也是正交的，但它不是有效的旋转矩阵。

2、可能从外部数据源获得"坏"数据。例如，使用物体数据获取设备（如动作捕捉器）时，捕获过程中可能产生错误。许多建模包就是因为会产生病态矩阵而变得声名狼藉。

3、可能因为浮点数的舍入错误产生"坏"数据。例如，对一个方位作大量的加运算，这在允许人们手动控制物体方位的游戏中是很常见的。由于浮点精度的限制，大量的矩阵乘法最终可能导致病态矩阵，这种现象称作"矩阵蠕变"。

3D中的方位和角位移（2）

另一种描述方位的常用方法是欧拉角，这项技术以著名的数学家LeonhardEuler(1707 - 1783)的名字命名，他证明了角位移序列等价于单个角位移。

什么是欧拉角

欧拉角的基本思想是将角位移分解为绕三个互相垂直轴的三个旋转组成的序列。这听起来很复杂，其实它是非常直观的（事实上，易于使用正是它的主要优点之一）。之所以有"角位移"的说法正是因为欧拉角能用来描述任意旋转。

欧拉角将方位分解为绕三个互相垂直轴的旋转，那么是哪三个轴？按什么顺序？其实，任意三个轴和任意顺序都可以，但最有意义的是使用笛卡尔坐标系并按一定顺序所组成的旋转序列。最常用的约定是所谓的"heading - pitch - bank"约定。在这个系统中，一个方位被定义为一个heading角，一个pitch角，一个bank角。它的基本思想是让物体开始于"标准"方位 --- 就是物体坐标轴和惯性坐标轴对齐。在标准方位上，让物体作heading、pitch、bank旋转，最后物体到达我们想要描述的方位。

如图10.4所示，此时物体坐标系和惯性坐标系重合，heading为绕y轴的旋转量，向右旋转为正（如果从上面看，旋转正方向就是顺时针方向）。

经过heading旋转后，pitch为绕x轴的旋转量，注意是物体坐标系的x轴，不是原惯性坐标系的x轴。依然遵守左手法则，向下旋转为正，如图10.5所示：

最后，经过了heading和pitch，bank为绕z轴的旋转量。再次提醒，是物体坐标系的z轴，不是原惯性坐标系的z轴。依据左手法则，从原点向+z看，逆时针方向为正。如图10.6所示：

记住，当我们说旋转的顺序是heading-pitch-bank时，是指从惯性坐标系到物体坐标系。如果从物体坐标系变换到惯性坐标系，旋转的顺序就是相反的。"heading-pitch-bank"也叫作"roll-pitch-yaw"，roll类似于bank，yaw类似于 heading（事实上，yaw并不严格等于heading）。注意，在roll-pitch-yaw系统中，角度的命名顺序与从物体坐标系到惯性坐标系的旋转顺序一致的。

关于欧拉角的其他约定

heading-pitch-bank系统不是唯一的欧拉角系统。绕任意三个互相垂直轴的任意旋转都能定义一个方位，所以多种选择导致了欧拉角约定的多样性：

（1）heading-pitch-bank系统有多个名称。当然，不同的名字并不代表不同的约定，这其实并不重要。一组常用的术语是roll-pitch-yaw，其中的roll等价于bank，yaw基本上等价于heading。注意，它的顺序和heading-pitch-bank的顺序相反，这只是语义上的。它定义了向量从物体坐标系变换到惯性坐标系的旋转顺序。（事实上，yaw和heading还是有技术上的差别，yaw是绕物体坐标系 y轴的旋转，heading是绕惯性坐标系y轴的旋转。因为这里的旋转是在物体坐标系y轴和惯性坐标系y轴重合时进行的，所以这个区别并不重要。）JC:旋转坐标系实质上是反方向旋转物体

（2）任意三个轴都能作为旋转轴，不一定必须是笛卡尔轴，但使用笛卡尔轴最有意义。

（3）决定每个旋转的正方向时不一定必须遵守左手或右手法则。例如，完全可以定义pitch的正方向是向上的，并且这种定义方法非常常见。

（4）也是最重要的，旋转可以以不同的顺序进行。顺序并不重要，任何系统都能用来定义一个方位，但heading-pitch-bank顺序最为实用。heading度量绕竖直轴的旋转，它之所以有意义主要是因为我们所在的环境经常有某种形式的"地面"。一般来讲绕惯性坐标系的x或z轴的旋转没有什么意义。heading-pitch-bank顺序下的另外两个角的意义是：pitch度量水平方向的倾角，bank度量的是绕z轴的旋转量。

欧拉角的优点

欧拉角仅使用三个数来表达方位，并且这三个数都是角度。这两个特点使欧拉角具有其他形式所没有的优点：

（1）欧拉角对我们来说很容易使用。它比矩阵和四元数简单得多，这可能是因为欧拉角中的数都是角度，符合人们思考方位的方式。如果我们选择了与所要处理的情况最符合的约定，那么就能直接描述出最重要的角度，例如，用heading-pitch-bank系统就能直接地描述出偏差角度。便于使用是其最大的优点，当需要显示方位或用键盘输入方位时，欧拉角是唯一的选择。

（2）最简洁的表达方式。欧拉角用三个数来表达方位。在3D中，表达方位不能少于三个数，如果要考虑内存的因素，欧拉角是最合适的描述方位的方法。

（3）任意三个数都是合法的。取任意三个数，它们都能构成合法的欧拉角，而且可以把它看成一个对方位的描述。从另一方面说，没有"不合法"的欧拉角。当然数值可能不对，但至少它们是合法的。可矩阵和四元数就不一定是这样了。

欧拉角的缺点

用欧拉角表达方位时的缺点主要有：

（1）给定方位的表达方式不唯一。

（2）两个角度间求插值非常困难。

让我们仔细讨论这些问题。第一个问题是对于一个给定方位，存在多个欧拉角可以描述它。这称作别名问题，有时候会引起麻烦。因为这个原因，连一些基本的问题（如"两组欧拉角代表的角位移相同吗？"）都很难回答。

第一种，在将一个角度加上360度的倍数时，我们就会遇到形式最简单的别名问题。显然，加上360度并不会改变方位，尽管它的数值改变了。

第二种，更加麻烦的别名问题是由三个角度不互相独立而导致的。例如，pitch135度等价于heading180度，pitch45度，然后 bank180度。为了保证任意方位都只有独一无二的表示，必须限制角度的范围。一种常用的技术是将heading和bank限制在+180度到-180度之间，pitch限制在+90度到-90度之间。这就建立了欧拉角的一个"限制范围"。对于任意方位，仅存在一个限制欧拉角能代表这个方位（事实上，还有一个违反唯一性的现象需要处理。）

欧拉角最著名的别名问题是这样的：先heading45度再pitch90度，这与先pitch90度再bank45度是等价的。事实上，一旦选择+(-)90度为pitch角，就被限制在只能绕竖直轴旋转。这种现象，角度为+(-)90度的第二次旋转使得第一次和第三次旋转的旋转轴相同，称作万向锁。为了消除限制欧拉角的这种别名现象，规定万向锁情况下由heading完成绕竖直轴的全部旋转。换句话说，在限制欧拉角中，如果pitch为+(-)90度，则bank为0。

如果是为了描述方位，特别是在使用了限制欧拉角的情况下，别名是不会造成太大的问题的。现在来看两个方位A和B间求插值的问题，也就是说，给定参数t，0 ≤ t ≤ 1，计算临时方位C，当t从0变化到1时，C也平滑地从A变化到B。

这个问题的简单解法是分别对三个角度作标准线性插值，公式如下：

但这里面有很多问题。

第一，如果没有使用限制欧拉角，将得到很大的角度差。例如，方位A的heading为720度，方位B的heading为45度，720 = 360 x2，也就是0度。所以heading值只相差45度，但简单的插值会在错误的方向上绕将近两周。如图10.7所示：

解决问题的方法是使用限制欧拉角，然而，即使是限制欧拉角也不能完全解决问题。插值的第二个问题是由旋转角度的周期性引起的。设A的heading 为-170度，B的heading为170度。这些值在heading的限制范围内，都在-180度到180度之间。这两个值只相差20度，但插值操作又一次发生了错误，旋转是沿 "长弧"绕了340度而不是更短的20度，如图10.8所示：

解决这类问题的方法是将插值的"差"角度折到-180度到180度之间，以找到最短弧。

即使使用了这两个角度限制，欧拉角插值仍然可能碰到万向锁的问题，它在大多数情况下会产生抖动、路径错误等现象，物体会突然飘起来像是"挂"在某个地方。根本问题是插值过程中角速度不是恒定的。

欧拉角插值的前两个问题虽然烦人，但并不是不可克服的。限制欧拉角和将角度差限制在一定范围内提供了简单的解决方法。而对于万向锁，非常不幸，它非常令人讨厌，是一个底层的问题。你可能会考虑重新规划旋转，发明一种不会遭遇这些问题的系统。不幸的是，这不可能。这是一个用3个数表达3D方位的方法与生俱来的问题。我们可以改变问题，但不能消灭它们。任何使用三个数来表达3D方位的系统，若能保证空间的唯一性，就都会遇到这些问题，如万向锁。

3D中的方位和角位移（3）

四元数记法

一个四元数包含一个标量和一个3D向量分量，经常记标量分量为w，记向量分量为单一的 v 或分开的x、y、z。两种记法分别如下:

[w v ]

[w, (x, y, z)]

在某些情况下，用 v 这样的短记法更方便，但在另一些情况下，"扩展"的记法会更清楚。

也可以将四元数竖着写，有时这会使等式的格式一目了然，"行"或"列"四元数没有明显的区别。

四元数和复数

复数对(a, b)定义了数a+bi，i是所谓的虚数，满足i2= -1：a称作实部，b称作虚部。任意实数k都能表示为复数(k, 0)=k + 0i。

复数能够相加、相减、相乘，如公式10.1所示:

通过使虚部变负，还能够计算复数的共轭，记法如公式10.2：

还能够计算复数的模。这个运算的记法和解释与实数的绝对值类似，实际上，如果将实数表示成复数，它们将产生相同的结果。公式10.3是计算复数大小的公式：

复数集存在于一个2D平面上，可以认为这个平面有两个轴：实轴和虚轴。这样，就能将复数（x,y）解释为2D向量。用这种方法解释复数时，它们能用来表达平面中的旋转。看看复数p绕原点旋转角度θ的情况，如图10.9所示：

为进行这个旋转，引入第二个复数 q = (cosθ, sinθ)。现在，旋转后的复数p'能用复数乘法计算出来：

p = x + yi

q = cosθ + i sinθ

p' = pq = (x + yi)(cosθ + i sinθ) =(xcosθ - ysinθ) + (xsinθ + ycosθ)i

JC：以上公式正是复数乘法的几何意义，暂时记住就好

引入复数q和用2x2旋转矩阵达到的效果是一样的，但复数提供了另一种有趣的记法。

四元数扩展了复数系统，它使用三个虚部i, j, k。它们的关系如下：

一个四元数[w, (x, y, z)]定义了复数 w+xi+yj+zk，很多标准复数的性质都能应用到四元数上。更重要的是，和复数能用来旋转2D中的向量类似，四元数也能用来旋转3D中的向量。

四元数和轴-角对

欧拉证明了一个旋转序列等价于单个旋转。因此，3D中的任意角位移都能表示为绕单一轴的单一旋转（这里的轴是一般意义上的旋转轴，不要和笛卡尔坐标轴混淆。显然，旋转轴的方向是任意的）。当一个方位用这种形式来描述时称作轴-角描述法（实际上，能将轴-角形式作为描述方位的第四种表达方式。但是，轴-角对很少用到，经常被欧拉角或四元数替代）。

设 n为旋转轴，对于旋转轴来说长度并不重要，将 n 定义为单位长度会比较方便。根据左手或右手法则， n 的方向定义了哪边将被认为是旋转"正"方向。设θ为绕轴旋转的量，因此，轴-角对（ n , θ）定义了一个角位移：绕 n 指定的轴旋转θ角。

四元数能被解释为角位移的轴-角对方式。然而， n 和θ不是直接存储在四元数的四个数中，它们的确在四元数里，但不是那么直接。公式10.4列出了四元数中的数和 n ，θ的关系，两种四元数加法都被使用了。

记住， q的w分量和θ有关系，但它们不是一回事。同样， v 和 n 也有关系但不完全相同。

负四元数

四元数能求负，做法很直接，将每个分量对变负，见公式10.5：

- q= -[w (x y z)] = [-w (-x -y -z)] = -[w v ] = [-w - v]

公式10.5 四元数求负

q 和- q代表的实际角位移是相同的，很奇怪吧！如果我们将θ加上360度的倍数，不会改变 q 代表的角位移，但它使 q 的四个分量都变负了。因此，3D中的任意角位移都有两种不同的四元数表示方法，它们互相为负。

单位四元数

几何上，存在两个"单位"四元数，它们代表没有角位移，[1, 0 ]和[-1, 0]（注意粗体 0，它们代表零向量）。当θ是360度的偶数倍时，有第一种形式，cos(θ/2)=1；θ是360度的奇数倍时，cos( θ /2)=-1。在两种情况下，都有sin(θ/2)=0，所以 n的值无关紧要。它的意义在于：

当旋转角θ是360度的整数倍时，方位并没有改变，并且旋转轴也是无关紧要的。

数学上，实际只有一个单位四元数：[1, 0 ]。用任意四元数 q乘以单位四元数[1, 0 ]，结果仍是 q 。任意四元数 q乘以另一个"几何单位"[-1,0 ]时得到- q。几何上，因为 q 和- q 代表的角位移相同，可认为结果是相同的。但在数学上， q 和- q不相等，所以[-1,0 ]并不是"真正"的单位四元数。

四元数的模

和复数一样，四元数也有模。记法和公式都和向量类似，如公式10.6所示：

让我们看看它的几何意义，代入 θ 和 n ，可得到：

n 为单位向量，所以：

应用三角公式sin2x + cos2x =1，得到：

如果为了用四元数来表示方位，我们仅使用符合这个规则的单位四元数。

四元数共轭和逆

四元数的共轭记作 q *，可通过让四元数的向量部分变负来获得，见公式10.7：

四元数的逆记作 q ^-1，定义为四元数的共轭除以它的模，见公式10.8：

四元数的逆和实数的倒数有着有趣的对应关系。对于实数a，它的逆a-1为1/a，从另一方面说，aa-1= a-1a = 1。四元数的逆也有着同样的性质，一个四元数 q 乘以它的逆 q-1，即可得到单位四元数[1,0 ]。

公式10.8是四元数逆的正式定义，但我们只使用单位四元数，所以四元数的逆和共轭是相等的。

共轭非常有趣，因为 q 和 q *代表相反的角位移。很容易验证这种说法，使 v 变负，也就是使旋转轴反向，它颠倒了我们所认为的旋转正方向。因此， q 绕轴旋转θ角，而 q *沿相反的方向旋转相同的角度。

3D中的方位和角位移（4）

四元数乘法（叉乘）

四元数能根据复数乘法解释来相乘，如下：

这导出了四元数乘法的标准定义，下面以两种四元数记法给出，见公式10.9：

不用为四元数叉乘使用乘号，"行"或 "列"四元数也没有什么区别。

四元数叉乘满足结合律，但不满足交换律，如公式10.10所示：

现在看看两个四元数叉乘的模:

展开合并同类项:

最后应用四元数模的定义得到公式 10.11:

因此，四元数乘积的模等于模的乘积。这个结论非常重要，因为它保证了两个单位四元数相乘的结果还是单位四元数。

四元数乘积的逆等于各个四元数的逆以相反的顺序相乘，如公式10.12所示：

现在到了四元数非常有用的性质。让我们"扩展"一个标准3D点(x, y, z)到四元数空间，通过定义四元数p=[0, (x, y, z)]即可（当然，在一般情况下，p不会是单位四元数）。设q为我们讨论的旋转四元数形式[cos(θ/2),nsin(θ/2)]，n为旋转轴，单位向量；θ为旋转角。你会惊奇地发现，执行下面的乘法可以使3D点p绕n旋转：

已经证明，四元数乘法和3D向量旋转的对应关系，更多的是理论上的意义，不是实践上的。实际上，它几乎和把四元数转换到矩阵形式然后再用矩阵乘以向量所用的时间一样。

让我们看多次旋转的情况，将点p用一个四元数a旋转然后再用另一个四元数b旋转：

注意，先进行a旋转再进行b旋转等价于执行乘积ba代表的单一旋转。因此，四元数乘法能用来连接多次旋转，这和矩阵乘法的效果一样。根据四元数乘法的标准定义，这个旋转是以从右向左的顺序发生的。这非常不幸，因为它迫使我们以 "由里向外"的顺序连接多次旋转，这和以矩阵形式作同样的运算是不同的（至少在使用行向量时是不同的）。

针对公式10.9所导致的"顺序颠倒"问题，我们将违背标准定义，以相反的运算顺序来定义四元数乘法。注意，仅仅向量叉乘部分受到了影响，见公式10.13：

这并没有改变四元数的基本性质和用v、θ的几何解释，仍然能用四元数乘法来直接旋转向量，唯一不同的是，根据我们的定义，将四元数放在向量右边，而把它的逆放在向量的左边：

能看到下面这个表达了多个旋转连接的等式，它是自左向右的，与旋转发生的顺序一致：

对于我们来说，让四元数代表角位移的"高级"能力，使其易于使用，这比坚持正式标准更加重要。我们的目的在于理解四元数的本质和它提供给我们的操作，设计一个类将直接引出这些操作，在需要的地方使用这个类，永远不需要再去摆弄里面的数。

四元数的"差"

利用四元数的乘法和逆，就能够计算两个四元数的"差"。"差"被定义为一个方位到另一个方位的角位移。换句话说，给定方位a和b，能够计算从a旋转到b的角位移d。用四元数等式更加紧凑地表示为：ad=b。

两边同时左乘a-1:

现在，我们就有了求得代表一个方位到另一个方位角位移的四元数的方法。

数学上，两个四元数之间的角度"差"更类似于"除"，而不是真正的"差"（减法）。

四元数点乘

四元数也有点乘运算，它的记法、定义和向量点乘非常类似，如公式10.14所示：

注意，和向量点乘一样，其结果是标量。对于单位四元数a和b，有-1 ≤ a.b ≤ 1。通常我们只关心 a . b 的绝对值，因为a.b = -(a . -b)，所以b和-b代表相同的角位移。

四元数点乘的几何解释类似于向量点乘的几何解释，四元数点乘 a. b 的绝对值越大，a和b代表的角位移越"相似"。

3D中的方位和角位移（5）

四元数的对数、指数和标量乘运算

首先，让我们重写四元数的定义，引入一个新的变量α，等于半角θ/2：

α = θ/2

|| n || = 1

q = [cosα n sinα] =[cosα xsinα ysinα zsinα]

q 的对数定义为公式10.15：

log q = log([cosα n sinα]) ≡ [0 α n ]

公式10.15 四元数的对数

≡表示"恒等于"，注意log q 的结果，它一般不是单位四元数。

指数以严格相反的方式定义，首先，设四元数 p 的形式为[0 α n ]， n 为单位向量：

p = [0 α n ] = [0 (αx αy αz)]

|| n || = 1

接着，指数定义为公式10.16:

exp p = exp([0 α n ]) = [cosα n sinα]

公式10.16 四元数的指数

根据定义，exp p 总是返回单位四元数。

四元数的对数和指数类似于它们的标量形式，回忆一下，对于标量α，有下列关系成立:

同样，四元数指数运算为四元数对数运算的逆运算：

exp(log q ) = q

最后，四元数能与一个标量相乘。其计算方法非常直接：每个分量都乘以这个标量，给定标量k和四元数 q，有公式 10.17：

k q= k[w v] = [kw k v] = k[w (x y z)] = [kw kx ky kz]

公式10.17 四元数和标量相乘

一般不会得到单位四元数，这也是为什么在表达角位移的场合中标量乘不是那么有用的原因。

四元数求幂

四元数能作为底数，记作 qt （不要和指数运算混淆，指数运算只接受一个四元数作为参数，而四元数求幂有两个参数---- 四元数和指数）。四元数求幂的意义类似于实数求幂。回忆一下，a0= 1， a1 = a，a为非零标量。当t从0变到1时，at从1到a。四元数求幂有类似的结论：当t从0变到1， qt从[1,0]到 q。

这对四元数求幂非常有用，因为它可以从角位移中抽取"一部分"。例如，四元数 q 代表一个角位移，现在想要得到代表1/3这个角位移的四元数，可以这样计算： q1/3。

指数超出[0, 1]范围外的几何行为和预期的一样（但有一个重要的注意事项）。例如， q2代表的角位移是 q的两倍。假设 q代表绕x轴顺时针旋转30度，那么 q2代表绕x轴顺时针旋转60度， q-1/3代表绕x轴逆时针旋转10度。

上面提到的注意事项是，四元数表达角位移时使用最短圆弧，不能"绕圈"。继续上面的例子， q4不是预期的绕x轴顺时针旋转240度，而是逆时针80度。显然，向一个方向旋转240度等价于向相反的方向旋转80度，都能得到正确的"最终结果"。但是，在此基础上的进一步运算，产生的就可能不是预期的结果了。例如，(q4)1/2不是 q2，尽管我们感觉应该是这样。一般来说，凡是涉及到指数运算的代数公式，如(as)t= a(st)，对四元数都不适用。

现在，我们已经理解四元数求幂可以为我们做什么了。让我们看看它的数学定义，四元数求幂定义在前一节讨论的"有用"运算上，定义如公式10.18：

注意，对于标量求幂，也有类似结论：

不难理解为什么当t从0变到1时 q'从单位四元数变到 q。注意到对数运算只是提取了轴 n 和角度θ；接着，和指数t进行标量乘时，结果是θ乘以t；最后，指数运算"撤销"了对数运算，从tθ和 n重新计算w和 v 。上面给出的定义就是标准数学定义，在理论上非常完美，但直接转换到代码却是很复杂的。程序清单10.1所示的代码展示了怎样计算 q'的值。

Listing 10.1: Code to raise a quaternion to a power

// Quaternion (input and output)
float w,x,y,z;

// Input exponent
float exponent;

// Check for the case of an identity quaternion.
// This will protect against divide by zero
if (fabs(w) < .9999f)
{
  // Extract the half angle alpha (alpha = theta/2)
  float alpha = acos(w);

  // Compute new alpha value
  float newAlpha = alpha * exponent;

  // Compute new w value
  w = cos(newAlpha);

  // Compute new xyz values
  float mult = sin(newAlpha) / sin(alpha);

  x *= mult;
  y *= mult;
  z *= mult;
}

关于这些代码，需要注意的地方有:

（1）有必要做单位四元数的检查。因为w=+(-)1会导致mult的计算中出现除零现象。单位四元数的任意次方还是单位四元数。因此，如果检测到输入是单位四元数，忽略指数直接返回原四元数即可。

（2）计算alpha时，使用了acos函数，它的返回值是正的角度。这并不会违背一般性，任何四元数都能解释成有正方向的旋转角度，因为绕某轴的负旋转等价于绕指向相反方向的轴的正旋转。

四元数插值 ---- "slerp"

当今3D数学中四元数存在的理由是由于一种称作slerp的运算，它是球面线性插值的缩写（Spherical Linear Interpolation）。slerp运算非常有用，因为它可以在两个四元数间平滑插值。slerp运算避免了欧拉角插值的所有问题。

slerp是一种三元运算，这意味着它有三个操作数。前两个操作数是两个四元数，将在它们中间插值。设这两个"开始"和"结束"四元数分别为 q0和 q1。插值参数设为变量t，t在0到1之间变化，slerp函数：slerp( q0,q1, t)，将返回 q 0到 q1之间的插值方位。

能否利用现有的数学工具推导出slerp公式呢？如果是在两个标量a0和a1间插值，我们会使用下面的标准线性插值公式：

Δa = a1 - a0

lerp(a0, a1, t) =a0 + tΔa

标准线性插值公式从a0开始，并加上a0和a1差的t倍，有三个基本步骤：

（1）计算两个值的差。

（2）取得差的一部分。

（3）在初始值上加上差的一部分。

可以使用同样的步骤在四元数间插值：

（1）计算两个值的差， q 0到 q1的角位移由Δ q =q 0-1 q 1给出。

（2）计算差的一部分，四元数求幂可以做到，差的一部分由(Δ q )t给出。

（3）在开始值上加上差的一部分，方法是用四元数乘法来组合角位移： q 0(Δ q )t

这样，得到slerp的公式如公式10.19所示：

这是理论上的slerp计算过程，实践中，将使用一种更加有效的方法。

我们在4D空间中解释四元数，因为所有我们感兴趣的四元数都是单位四元数，所以它们都"存在"于一个 4D"球面"上。

slerp的基本思想是沿着4D球面上连接两个四元数的弧插值(这就是球面线性插值这个名称的由来)。

可以把这种思想表现在平面上，设两个2D向量 v0和 v 1，都是单位向量。我们要计算 v 1，它是沿 v 0到 v1弧的平滑插值。设w是 v0到 v1弧所截的角，那么 vt就是绕 v 1沿弧旋转tw的结果，如图10.10所示：

将 vt表达成 v 0和 v1的线性组合，从另一方面说，存在两个非零常数k0和k1，使得：

v t = k0 v 0 + k1 v1

可以用基本几何学求出k0和k1，图10.11展示了计算的方法：

对以k1 v1为斜边的直角三角形应用三角公式得：

这里有两点需要考虑。第一，四元数 q 和- q代表相同的方位，但它们作为slerp的参数时可能导致不一样的结果，这是因为4D球面不是欧式空间的直接扩展。而这种现象在2D和3D中不会发生。解决方法是选择 q 0和 q1的符号使得点乘 q 0 .q1的结果是非负。第二个要考虑的是如果 q 0和 q1非常接近，sinθ会非常小，这时除法可能会出现问题。为了避免这样的问题，当sinθ非常小时使用简单的线性插值。程序清单10.2把所有的建议都应用到了计算四元数的slerp中：

Listing 10.2: How slerp is computed in practice

// The two input quaternions
float w0,x0,y0,z0;
float w1,x1,y1,z1;

// The interpolation parameter
float t;

// The output quaternion will be computed here
float w,x,y,z;

// Compute the "cosine of the angle" between the
// quaternions, using the dot product
float cosOmega = w0*w1 + x0*x1 + y0*y1 + z0*z1;

// If negative dot, negate one of the input
// quaternions to take the shorter 4D "arc"
if (cosOmega < 0.0f) {
  w1 = –w1;
  x1 = –x1;
  y1 = –y1;
  z1 = –z1;
  cosOmega = –cosOmega;
}

// Check if they are very close together to protect
// against divide-by-zero
float k0, k1;

if (cosOmega > 0.9999f) {
  // Very close - just use linear interpolation
  k0 = 1.0f–t;
  k1 = t;
} else {
  // Compute the sin of the angle using the
  // trig identity sin^2(omega) + cos^2(omega) = 1
  float sinOmega = sqrt(1.0f – cosOmega*cosOmega);

  // Compute the angle from its sin and cosine
  float omega = atan2(sinOmega, cosOmega);

  // Compute inverse of denominator, so we only have
  // to divide once
  float oneOverSinOmega = 1.0f / sinOmega;

  // Compute interpolation parameters

  k0 = sin((1.0f – t) * omega) * oneOverSinOmega;
  k1 = sin(t * omega) * oneOverSinOmega;
}

// Interpolate
w = w0*k0 + w1*k1;
x = x0*k0 + x1*k1;
y = y0*k0 + y1*k1;
z = z0*k0 + z1*k1;

3D中的方位和角位移（6）

四元数样条 ---- “squad”

Slerp提供了两个方位间的插值，当有多于两个的方位序列（它描述了我们想要经过的插值“路径”）时怎么办？我们可以在”控制点“之间使用slerp。类似于基本几何学中的线性插值，控制点之间是以直线连接的。显然，控制点上会有不连续性 ---- 这是我们想要避免的，我们给出squad(Spherical and Quadrangle)的公式，用来描绘控制点间的路径。

设控制点由四元数序列所定义：

q1，q2，q3，…qn-2，qn-1，qn

另外，引进一个辅助四元数si，将它作为临时控制点：

注意，qi-1至qi+1计算出si，所以s1和sn是未定义的。换句话说，曲线从q2延伸到qn-1，第一个和最后一个控制点仅用于控制中间的曲线。如果曲线一定要经过这两点，必须在头部和尾部增加虚控制点，一个显而易见的方法就是复制这两个控制点。

给定四个相邻的控制点，squad用于计算中间两点间的插值，这点非常像三次样条。

设四个控制点为：qi-1，qi，qi+1，qi+2

还要引入一个插值变量h，h从0变化到1时，squad描绘qi到qi+1之间的曲线。

整条插值曲线能够分段应用squad方法来获得，如公式10.12所示：

四元数的优点和缺点

四元数有一些其他角位移表示方法所没有的优点：

（1）平滑插值。slerp和squad提供了方位间的平滑插值，没有其他方法能提供平滑插值。

（2）快速连接和角位移求逆。四元数叉乘能将角位移序列转换为单个角位移，用矩阵作同样的操作明显会慢一些。四元数共轭提供了一种有效计算反角位移的方法，通过转置旋转矩阵也能达到同样的目的，但不如四元数来得容易。

（3）能和矩阵形式快速转换。四元数和矩阵间的转换比欧拉角与矩阵之间的转换稍微快一点。

（4）仅用四个数。四元数仅包含4个数，而矩阵用了9个数，它比矩阵"经济"得多（当然仍然比欧拉角多33%）。

要获得这些优点是要付出代价的，四元数也有和矩阵相似的问题，只不过问题程度较轻：

（1）比欧拉角稍微大一些。这个额外的数似乎没有太大关系，但在需要保存大量角位移时，如存储动画数据，这额外的33%也是数量可观的。

（2）四元数可能不合法。坏的输入数据或浮点数舍入误差积累都可能使四元数不合法（能通过四元数标准化解决这个问题，确保四元数为单位大小）。

（3）难于使用。在所有三种形式中，四元数是最难于直接使用的。

各方法比较

不同的方位表示方法适用于不同的情况，下面是我们对合理选择格式的一些建议：

（1）欧拉角最容易使用。当需要为世界中的物体指定方位时，欧拉角能大大简化人机交互，包括直接的键盘输入方位、在代码中指定方位（如为渲染设定摄像机）、在调试中测试。这个优点不应被忽视，不要以优化为名义而牺牲易用性，除非你确定这种优化的确有效果。

（2）如果需要在坐标系间转换向量，那么就选择矩阵形式。当然，这并不意味着你就不能用其他格式来保存方位，并在需要的时候转换到矩阵形式。另一种方法是用欧拉角作为方位的主拷贝，但同时维护一个旋转矩阵，当欧拉角发生改变时矩阵也要同时进行更新。

（3）当需要大量保存方位数据（如动画）时，就使用欧拉角或四元数。欧拉角将少占用25%的内存，但它在转换到矩阵时要稍微慢一些。如果动画数据需要嵌套坐标系之间的连接，四元数可能是最好的选择。

（4）平滑的插值只能用四元数完成。如果你用其他格式，也可以先转换到四元数然后再插值，插值完毕后再转换回原来的形式。

从欧拉角转换到矩阵

欧拉角描述了一个旋转序列。分别计算出每个旋转的矩阵再将它们连接成一个矩阵，这个矩阵就代表了整个角位移。当然，它和我们是想要物体到惯性坐标的变换矩阵还是惯性到物体坐标的变换矩阵是相关的。

我们对欧拉角的定义是一个旋转序列，该旋转序列将物体（和它的坐标空间）从惯性坐标空间转换到物体坐标空间。因此，可以用欧拉角定义的直接转换来直接产生惯性---- 物体旋转矩阵的一般形式：

M惯性--> 物体 = HPB

H、P、B分别为heading、pitch、bank的旋转矩阵，它们分别绕y、x、z轴旋转，仅仅旋转"坐标空间"就是旋转"点"的严格相反操作。可以想象这些旋转发生时点是固定在空间中不变的，例如，pitch使坐标空间向下，点实际上关于坐标空间向上。欧拉角公式明确指明是物体和它的坐标空间旋转，但我们需要的是变换"点"的矩阵，所以计算矩阵H、P、B时，用相反的旋转量来旋转。设heading、pitch、bank的旋转角分别为变量h、p、b:

以适当的顺序连接这些矩阵得到公式10.21：

如果要从物体坐标空间变换到惯性坐标空间，应该使用惯性----物体旋转矩阵的逆。因为旋转矩阵是正交的，所以求它的逆就是求它的转置，下面验证这一点。

为了从物体坐标空间变换到惯性坐标空间，顺序应该为"un-bank"、"un-pitch"、"un-heading"，公式表示为：

M物体->惯性 = （M惯性->物体）-1= （HPB）-1=B-1P-1H-1

注意，可以认为旋转矩阵B-1、P-1、H-1为它们对应矩阵的逆，或者是使用相反旋转角b、p、h的一般旋转矩阵。（惯性--- 物体矩阵中，使用负的旋转角，因此这里的角不用变负。）

以适当的顺序连接这些矩阵得到公式10.22:

比较公式10.21和公式10.22，可以看到物体---惯性矩阵确实惯性---物体矩阵的转置。

从矩阵转换到欧拉角

将角位移从矩阵形式转换到欧拉角需要考虑以下几点：

（1）必须清楚矩阵代表什么旋转：物体 -- 惯性还是惯性 -- 物体，这里讨论使用惯性 -- 物体矩阵的技术，物体 -- 惯性矩阵转换成欧拉角的过程与之类似。

（2）对任意给定角位移

锐单商城拥有海量元器件数据手册、IC替代型号，打造电子元器件IC百科大全！

9-axis sensor计算角位移 调研资料