Diagonalization and powers of A
本讲主要介绍了如何对角化具有n个线性无关特征向量的矩阵,以及如何利用对角化简化计算过程。
如果一个矩阵A具有n个线性无关的特征向量,我们可以将它们作为列向量构成一个可逆方阵S,并得到以下等式:
[公式]
其中,矩阵Λ为对角阵,其非零元素是矩阵A的特征值。由于矩阵S的列向量线性无关,因此逆矩阵 [公式] 存在。在等式两侧左乘逆矩阵,可以得到 [公式]。同样地,[公式]。
消元法中的矩阵有LU分解,施密特正交法中的矩阵有QR分解,而上述推导提供了一种新的矩阵分解方法。
之前提到的消元法进行行操作和列操作最后会得到“相抵标准型”。现在我们得到的则是矩阵的“相似标准形”,它保留了矩阵操作的基本性质——特征值,而相抵标准型则只剩下最内核的秩信息。
特征值可以提供矩阵幂计算的方法。
如果[公式] ,则有 [公式]。这表明矩阵 [公式] 具有和A一样的特征向量,而特征值为 [公式]。写成对角化形式则有:[公式]。进行相同的处理可以得到:[公式]。这说明 [公式] 具有和A一样的特征向量,而特征值为 [公式]。
如果矩阵A具有n个线性无关的特征向量,并且所有的特征值都满足[公式] <1,那么当k→∞时,[公式] →0。
如果矩阵A没有重特征值,则它一定具有n个线性无关的特征向量。
如果矩阵A有重特征值,它有可能具有n个线性无关的特征向量,也可能没有。例如,单位阵的特征值为重特征值1,但它具有n个线性无关的特征向量。
对于如A= [公式] 的三角矩阵,特征值就是矩阵对角线上的元素2。其特征向量在 [公式] 的零空间中,满足 [公式]。求解可得x= [公式],而没有第二个特征向量。
从给定的一个向量u0出发,我们可以通过对前一项乘以矩阵A得到下一项的方式,得到一个向量序列:[公式]。
[公式] 为一阶差分方程,[公式] 是方程的解。但这种简洁形式并没有给出足够的信息,我们需要通过特征向量和矩阵的幂运算给出真实解的结构。
将u0写成特征向量的线性组合:
[公式]
[公式]
[公式]
下面用斐波那契数列进行举例。
斐波那契数列为0,1,1,2,3,4,8,13……其通项公式为[公式]。求 [公式]?
如果我们以矩阵的方式来理解数列,则矩阵的特征值可以告诉我们数列中数值的增长速度。
为了凑成矩阵形式,需要用一个比较巧妙的技巧。令[公式],则有:
[公式] 写成矩阵形式为 [公式]
观察矩阵A= [公式] 的特征值和特征向量,因为其为对称矩阵,特征值为实数,且特征向量正交。
[公式]
解得[公式],[公式],绝对值大于1的 [公式] 控制着在斐波那契数列的增长。[公式],因为 [公式] <1,所以当乘方次数较高时有k→∞, [公式] →0。
从特征值可以求得对应的特征向量x1= [公式] 和x2= [公式]。
在这里G. Strang 用了个小技巧,因为是二阶方程,而且矩阵[公式] 是奇异矩阵,所以只要符合[公式] 两个方程其中的一个即可,选取下面的方程,则立刻可以看出方程的解。
从[公式],可以求得 [公式]。
[公式]
可知[公式]。
很多人会问矩阵的特征值特征向量为什么这么神奇,可以把矩阵的操作变成一个简单的参数。还有人会问道为什么特征值在物理中出现非常频繁。对此我只能简单解释一下,物理中常见的被研究物体都有一个自身的内禀结构,这个内在结构的方向往往和观察者也就是外场的坐标有区别。当我们给物体施加一个外场刺激的时候,比如说外力或者电场极化等等,物体沿着其内在结构的取向来响应外场,但是观察者从外场坐标下采集反馈。实际上矩阵在不同坐标之间实现变换,特征向量显示了物体内结构的方向,特征值则是在这个主方向上物体对外场的响应参数。在有的领域直接将特征值称为伸缩系数,实际上它反应了在其所对应的特征向量方向上,内结构与外场之间的相互关系。特征值还有一个应用是作为降维的判据,比如在图像压缩过程中,极小的特征值会被赋值为0,以此节省存储空间,也便于其它操作。反应在图像上,降维后的图像基本轮廓依旧清晰,图像细节有所牺牲。