
矩阵是线性变换的便利表达法;矩阵的特征值和特征向量可以揭示线性变换的深层特性。
矩阵乘法的本质在联系到线性变换的时候最能体现,因为矩阵乘法和线性变换的合成有以下的联系:
 |
|---|
 |
| 矩阵的秩是指矩阵中线性无关的行/列向量的最大个数,同时也是矩阵对应的线性变换的像空间的维度。秩-零化度定理说明矩阵的列数量等于矩阵的秩与零空间维度之和。 |
以下是一些典型的二维实平面上的线性变换对平面向量(图形)造成的效果,以及它们对应的二维矩阵。其中每个线性变换将蓝色图形映射成绿色图形;平面的原点(0, 0)用黑点表示。

设Vn,Um 分别是n维和m维线性空间,T是一个从Vn 到Um 的映射,如果映射T满足:
- 任给α1,α2∈Vn(从而α1+α2∈Vn),有T(α1+α2)=T(α1)+T(α2)
- 任给α∈Vn,λ∈R(从而λα∈Vn),有T(λα)=λT(α)
那么,T就称为从Vn到Um的线性映射,或称为线性变换。简言之,线性变换就是保持线性组合的对应的映射。
给定一个向量空间V,从V到V自身的线性变换T是一个保持向量加法和标量乘向量这两种运算的函数,例如旋转、反射、拉伸、压缩,或者这些变换的组合等等。
与矩阵的对应:
- 假设V和U是有限维的,并且在这些空间中有选择好的基,则从V到U的所有线性映射可以被表示为矩阵;反过来说,矩阵生成线性映射的例子。如果A是实数的m×n矩阵,则规定f(x)=Ax描述一个线性映射Rn→Rm (欧氏空间)。
- 设{v1,…,vn}是V的一个基,则在V中所有向量v都可由c1v1+⋯+cnvn 中的系数c1,⋯,cn 唯一确定。如果f:V→U是线性映射,则有f(c1v1+⋯+cnvn)=c1f(v1)+⋯+cnf(vn),这表明这个函数f是完全由f(v1),⋯,f(vn)的值确定的。现在设{u1,…,um}是U的基,则每个f(vj)的值可表示为f(vj)=a1ju1+⋯+amjum,因此函数f是完全由ai,j 的值确定的。如果把这些值放置到一个m×n的矩阵A中,则可以方便地使用它来计算f对V中任何向量的映射。
用矩阵表示线性变换的好处:
- 把线性映射写成具体而简明的二维矩阵形式后,则由线性映射的加法规则和复合规则来分别定义矩阵的加法规则和乘法规则就是很自然的想法。当空间的基变化(坐标系变换)时,线性映射的矩阵也会有规律地变化,在特定的基上研究线性映射,就转化为对矩阵的研究。利用矩阵的乘法,可以把一些线性系统的方程表达得更紧凑,也使几何意义更明显。
- 遇到y=x+3这样的加上了一个常量的非线性映射可以通过增加一个维度的方法,把变换映射写成2×2的方形矩阵形式,从而在形式上把这一类特殊的非线性映射转化为线性映射。这个办法也适用于处理在高维线性变换上多加了一个常向量的情形。
给定有限维的情况,在基确定的情况下,线性映射的复合对应于矩阵乘法,线性映射的加法对应于矩阵加法,线性映射与标量的乘积对应于矩阵与标量的乘法。
一次函数y=f(x)=x+b仅在b=0时才是一种线性变换。容易验证一次函数仅在b=0时,线性变换的基本性质f(0)=0才能成立(尽管b=0时其图像也是一条直线,但这里所说的线性不是指函数图像为直线)。同理,平移变换一般也不是线性变换(平移距离为零时才是线性变换)。
方块矩阵A的行列式是一个将其映射到标量的函数,记作det(A)或∣A∣,反映了矩阵自身的一定特性。
一个方阵的行列式等于0当且仅当该方阵不可逆。系数是实数的时候,二维(三维)方阵A的行列式的绝对值表示单位面积(体积)的图形经过A对应的线性变换后得到的图形的面积(体积),而它的正负则代表了对应的线性变换是否改变空间的定向:行列式为正说明它保持空间定向,行列式为负则说明它逆转空间定向。

两个矩阵相乘,乘积的行列式等于它们的行列式的乘积:det(AB)=det(A)⋅det(B)
行列式的一个自然起源是n维平等体的体积。行列式的定义和n维平行体的体积有着本质的关联:
一个线性变换可以通过它们在向量上的作用来可视化。
对于一个给定的方阵A,它的特征向量v(非零向量)经过这个线性变换之后,得到的新向量仍然与原来的v保持在同一条直线上,但其长度或方向可能会发生改变,即
Av=λv
其中λ为标量,即特征向量的长度在该线性变换下缩放的比例,称λ为其特征值(如果特征值为正,则表示经过线性变换的作用后方向也不变;如果特征值为负,说明方向会反转;如果特征值为0,则是表示缩回零点。但无论怎样,仍在同一条直线上)。

Av=λv可写作(A−λE)v=0,故等价于求解线性方程组的非零解,而它有非零解的充分必要条件是系数行列式
det(A−λE)=∣A−λE∣=0
上式为以λ为未知数的一元n次方程,称为矩阵A的特征方程,其左端可记作f(λ),称为矩阵A的特征多项式。特征方程在复数范围内恒有n个解(重根按重数计算),因此n阶矩阵A在复数范围内恒有n个特征值,设其分别为λ1,λ2,…,λn,不难证明:
λ1+λ2+⋯+λn=a11+a22+⋯+annλ1λ2...λn=∣A∣=det(A)
一般来说,一个向量在经过映射之后可以变为任何可能的向量,而特征向量具有更好的性质。
在一定条件下(如对应实对称矩阵的线性变换),一个变换可以由其特征值和特征向量完全表述,也就是说:所有的特征向量组成了这向量空间的一组基底。
所有具有相同的特征值λ的特征向量和零向量一起,组成了一个向量空间,称为线性变换T的一个特征空间,一般记作Vλ(T)。这个特征空间如果是有限维的,那么它的维数叫做λ的几何重数。
一种主对角线之外的元素皆为0的方阵。对象线上的元素可以为任意值。
一种特殊的对角矩阵,其主对角线元素为1,其余元素为0。一个m×n的矩阵A和单位矩阵的乘积等于其本身:
AIn=ImA=A
其转置等于自身的矩阵,即A=AT 。对称矩阵必然是方阵。
对于一个n×n的方块矩阵A,若存在另一方块矩阵B使得AB=BA=In,其中In 为单位矩阵,则称A是可逆的。矩阵A,B互为逆矩阵。一个矩阵A的逆矩阵记作A−1 。
- 一个方阵A可逆的充要条件是det(A)=0
- 可逆矩阵⇔非奇异矩阵⇔满秩矩阵
其逆矩阵等于其转置矩阵的方阵:AT=A−1 。等价于ATA=AAT=In 。
- 正交矩阵的行向量与列向量皆为正交的单位向量
- 对于正交矩阵A,det(A)=±1
- 从线性变换的角度看,正交矩阵对应正交变换,其保持距离不变,是一种保矩映射,如旋转与镜射。
设A,B都是n阶矩阵,若有可逆矩阵P,使
P−1AP=B
则称A与B相似,A和B互为彼此的相似矩阵。对A进行P−1AP称为对A进行相似变换,可逆矩阵P称为把A变成B的相似变换矩阵,可逆矩阵P−1称为把B变成A的相似变换矩阵。
若n阶矩阵A与B相似,则A与B的特征多项式相同,从而A与B的特征值亦相同。
两个相似的矩阵可以看做是同一个线性变换的“两面”,即在两个不同的基下的表现:
- 设线性空间Vn 中取定两个基α1,α2,⋯,αn;β1,β2,⋯,βn,由基α1,α2,⋯,αn 到基 β1,β2,⋯,βn 的过渡矩阵为P
- Vn 中的线性变换T在这两个基下的矩阵依次为A和B,那么B=P−1AP
一种对称矩阵,在线性代数的含义里,正定矩阵的性质类似于复数中的正实数。对于一个n×n的对称矩阵A,如果对于所有非零向量x∈Rn,都有
xTAx>0
则称A为正定矩阵。类似地有:
| 条件 | 类型 |
|---|
| xTAx>0 | 正定矩阵 |
| xTAx⩾0 | 半正定矩阵 |
| xTAx<0 | 负定矩阵 |
| xTAx⩽0 | 半负定矩阵 |
| 剩余情况 | 不定矩阵 |
向量空间中一组向量v1,v2⋯,vn 的Gram矩阵G定义为这组向量内积的对称矩阵,即
Gij=viTvj
应用:一组向量线性无关当且仅当其Gram矩阵的行列式不等于零,即
det(G(v1,...,vn))=0
译作海塞矩阵、海森矩阵、黑塞矩阵等,是一个由多变量实值函数的所有二阶偏导数组成的方块矩阵。
假设有一实值函数f(x1,x2,…,xn),如果f的所有二阶偏导数都存在并在定义域内连续,那么函数f的海塞矩阵为Hij=∂xi∂xj∂2f,即:
H=∂x12∂2f∂x2∂x1∂2f⋮∂xn∂x1∂2f∂x1∂x2∂2f∂x22∂2f⋮∂xn∂x2∂2f⋯⋯⋱⋯∂x1∂xn∂2f∂x2∂xn∂2f⋮∂xn2∂2f
雅可比矩阵(Jacobi矩阵):假设某函数f为从向量到向量的映射,f:Rn→Rm,其雅可比矩阵为m×n的一阶偏导数矩阵Jij=∂xj∂fi,即:
J=[∂x1∂f⋯∂xn∂f]=∂x1∂f1⋮∂x1∂fm⋯⋱⋯∂xn∂f1⋮∂xn∂fm