秩
行秩列秩相等性
矩阵的行秩与列秩相等,是线性代数基本定理的重要组成部分. 其基本证明思路是,矩阵可以看作线性映射的变换矩阵,列秩为像空间的维度,行秩为非零原像空间的维度,因此列秩与行秩相等,即像空间的维度与非零原像空间的维度相等(这里的非零原像空间是指约去了零空间后的商空间:原像空间)。这从矩阵的奇异值分解就可以看出来。
给出这一结果的两种证明. 第一个证明是简短的,仅用到向量的线性组合的基本性质. 第二个证明利用了正交性. 第一个证明利用了列空间的基, 第二个证明利用了行向量空间的基. 第一个证明适用于定义在标量域上的矩阵,第二个证明适用于内积空间。二者都适用于实或复的欧氏空间,也都易于修改去证明当A是线性变换的情形.
证明一
令A{\displaystyle A}是一个m× × -->n{\displaystyle m\times n}的矩阵,其列秩为r{\displaystyle r}. 因此矩阵A{\displaystyle A}的列空间的维度是r{\displaystyle r}. 令c1,c2,… … -->,cr{\displaystyle c_{1},c_{2},\ldots ,c_{r}}是A{\displaystyle A}的列空间的一组基,构成m× × -->r{\displaystyle m\times r}矩阵C{\displaystyle C}的列向量C=[c1,c2,… … -->,cr]{\displaystyle C=[c_{1},c_{2},\ldots ,c_{r}]},并使得A{\displaystyle A}的每个列向量是C{\displaystyle C}的r{\displaystyle r}个列向量的线性组合. 由矩阵乘法的定义,存在一个r× × -->n{\displaystyle r\times n}矩阵R{\displaystyle R}, 使得A=CR{\displaystyle A=CR}. (A{\displaystyle A}的(i,j){\displaystyle (i,j)}元素是ci{\displaystyle c_{i}}与R{\displaystyle R}的第j{\displaystyle j}个列向量的点积.)
现在,由于A=CR{\displaystyle A=CR}, A{\displaystyle A}的每个行向量是R{\displaystyle R}的行向量的线性组合,这意味着A{\displaystyle A}的行向量空间被包含于R{\displaystyle R}的行向量空间之中. 因此A{\displaystyle A}的行秩 ≤ R{\displaystyle R}的行秩. 但R{\displaystyle R}仅有r{\displaystyle r}行, 所以R{\displaystyle R}的行秩 ≤ r{\displaystyle r} = A{\displaystyle A}的列秩. 这就证明了A{\displaystyle A}的行秩 ≤ A{\displaystyle A}的列秩.
把上述证明过程中的“行”与“列”交换,利用对偶性质同样可证A{\displaystyle A}的列秩 ≤ A{\displaystyle A}的行秩。更简单的方法是考虑A{\displaystyle A}的转置矩阵AT{\displaystyle A^{\mathrm {T} }},则A{\displaystyle A}的列秩 = AT{\displaystyle A^{\mathrm {T} }}的行秩 ≤ AT{\displaystyle A^{\mathrm {T} }}的列秩 = A{\displaystyle A}的行秩. 这证明了A{\displaystyle A}的列秩等于A{\displaystyle A}的行秩. 证毕.
证明二
令A{\displaystyle A}是m× × -->n{\displaystyle m\times n}矩阵,其行秩是r{\displaystyle r}. 因此A{\displaystyle A}的行向量空间的维度是r{\displaystyle r},设x1,x2,… … -->,xr{\displaystyle x_{1},x_{2},\ldots ,x_{r}}是A{\displaystyle A}的行向量空间的一组基. 如果把这组基当作原像列向量看待,则向量集Ax1,Ax2,… … -->,Axr{\displaystyle Ax_{1},Ax_{2},\ldots ,Ax_{r}}是线性独立的。 这是因为对一组标量系数c1,c2,… … -->,cr{\displaystyle c_{1},c_{2},\ldots ,c_{r}},如果:
其中v=c1x1+c2x2+… … -->,crxr{\displaystyle v=c_{1}x_{1}+c_{2}x_{2}+\ldots ,c_{r}x_{r}}. 则可以推出有两个事实: (a) v{\displaystyle v}是A{\displaystyle A}行向量空间的线性组合, 即v{\displaystyle v}属于A{\displaystyle A}的行向量空间;(b) 由于Av{\displaystyle Av} = 0, v{\displaystyle v}正交于A{\displaystyle A}的所有行向量,从而正交于A{\displaystyle A}的行向量空间的所有向量. 事实(a)与(b)结合起来,则v{\displaystyle v}正交于自身,这意味着v{\displaystyle v} = 0. 由v{\displaystyle v}的定义:
再由xi{\displaystyle x_{i}}是A{\displaystyle A}的行向量空间的一组线性独立的基,可知c1=c2=⋯ ⋯ -->=cr=0{\displaystyle c_{1}=c_{2}=\cdots =c_{r}=0}. Ax1,Ax2,… … -->,Axr{\displaystyle Ax_{1},Ax_{2},\ldots ,Ax_{r}}因而是线性独立的.
Axi{\displaystyle Ax_{i}}是A{\displaystyle A}的列空间中的向量. 因此Ax1,Ax2,… … -->,Axr{\displaystyle Ax_{1},Ax_{2},\ldots ,Ax_{r}}是A{\displaystyle A}的列空间中r{\displaystyle r}个线性独立的向量. 所以A{\displaystyle A}的列向量空间的维数(A{\displaystyle A}的列秩)必然不小于r{\displaystyle r}. 这证明了A{\displaystyle A}的行秩r ≤ A{\displaystyle A}的列秩. 把这一结果应用于A{\displaystyle A}的转置矩阵可以得到: A{\displaystyle A}的列秩 = AT{\displaystyle A^{\mathrm {T} }}的行秩 ≤ AT{\displaystyle A^{\mathrm {T} }}列秩 = A{\displaystyle A}的行秩. 这证明了A{\displaystyle A}的列秩等于A{\displaystyle A}的行秩,证毕.
最后, 还可以证明rk(A) = rk(A), 其中A是A的共轭转置或称施密特转置. 当A的元素都是实数, 这一结果变为rk(A) = rk(A). 然而对于复系数矩阵,rk(A) = rk(A)并不等价于行秩等于列秩, 需要用到上述两个证明.
证明三
令A是一个m×n矩阵. 定义rk(A)为A的列秩,A为A的共轭转置或称施密特转置. 首先可知AAx = 0当且仅当Ax = 0.
其中‖·‖是欧氏范数. 这说明A的零空间与AA的零空间相同. 由秩-零化度定理, 可得rk(A) = rk(AA). AA的每一个列向量是A的列向量的线性组合. 所以AA的列空间是A的列空间的子空间. 从而rk(AA) ≤ rk(A). 即: rk(A) = rk(AA) ≤ rk(A). 应用这一结果于A可或得不等式: since (A) = A, 可写作rk(A) ≤ rk((A)) = rk(A). 这证明了rk(A) = rk(A). 证毕.
可替代定义
用向量组的秩定义
向量组的秩:在一个 m 维线性空间E 中,一个向量组 F=(C1,C2,⋯ ⋯ -->,Cn){\displaystyle F=(C_{1},C_{2},\cdots ,C_{n})} 的秩表示的是其生成的子空间的维度。考虑 m × n 矩阵 A=[C1,C2,⋯ ⋯ -->,Cn]{\displaystyle A=[C_{1},C_{2},\cdots ,C_{n}]},将 A 的秩定义为向量组 F 的秩,则可以看到如此定义的 A 的秩就是矩阵 A 的线性无关列向量的极大数目,即 A 的列空间的维度(列空间是由A的纵列生成的F的子空间)。因为列秩和行秩是相等的,我们也可以定义A的秩为A的行空间的维度。
用线性映射定义
考虑线性映射:
对于每个矩阵A,fA{\displaystyle f_{A}}都是一个线性映射,同时,对每个Fn→ → -->Fm{\displaystyle F^{n}\to F^{m}}的 线性映射f,都存在矩阵A使得f=fA{\displaystyle f=f_{A}}。也就是说,映射
是一个同构映射。所以一个矩阵A的秩还可定义为fA{\displaystyle f_{A}}的像的维度(像与核的讨论参见线性映射)。矩阵A称为fA{\displaystyle f_{A}}的变换矩阵。这个定义的好处是适用于任何线性映射而不需要指定矩阵,因为每个线性映射有且仅有一个矩阵与其对应。秩还可以定义为n减f的核的维度;秩-零化度定理声称它等于 f的像的维度。
性质
我们假定A是在域F上的m × n矩阵并描述了上述线性映射。
m × n矩阵的秩不大于m或n的一个非负整数,表示为 rk(A) ≤ min(m, n)。有尽可能大的秩的矩阵被称为有满秩;类似的,否则矩阵是秩不足(或称为“欠秩”)的。
只有零矩阵有秩0
A的秩最大为min(m,n)
f是单射,当且仅当A有秩n(在这种情况下,我们称A有“列满秩”)。
f是满射,当且仅当A有秩m(在这种情况下,我们称A有“行满秩”)。
在方块矩阵A (就是m = n)的情况下,则A是可逆的,当且仅当A有秩n(也就是A有满秩)。
如果B是任何n × k矩阵,则AB的秩最大为A的秩和B的秩的小者。即:
A的秩等于r,当且仅当存在一个可逆m × m矩阵X和一个可逆的n × n矩阵Y使得
西尔维斯特不等式: 如果 A 是一个 m × n 的矩阵且 B 是 n × k 的, 则
这个不等式是由Frobenius提出的: 如果 AB, ABC 和 BC 有定义, 则
子加性: rank(A + B) ≤ rank(A) + rank(B) when A and B are of the same dimension. As a consequence, a rank-k matrix can be written as the sum of k rank-1 matrices, but not fewer.
矩阵的秩加上矩阵的零化度等于矩阵的纵列数(这就是秩-零化度定理)。
如果 A 是实数上的矩阵,那么 A 的秩和它对应格拉姆矩阵的秩相等。于是,对于实矩阵
如果 A 是复数上的矩阵且 A* 表示 A 的共轭转置(i.e., A 的伴随), 则
向量组的线性相关性
将m{\displaystyle m}个n{\displaystyle n}维列向量排列成n× × -->m{\displaystyle n\times m}的矩阵A,这个对应矩阵的秩即为原向量组的秩。
原向量组线性相关的充分必要条件为:
如果
则向量组线性无关。另外,不存在
特殊的,若向量的个数m{\displaystyle m}大于向量的维数n{\displaystyle n},则根据:
这个向量组必然线性相关。
计算
计算矩阵A的秩的最容易的方式是高斯消去法,即利用矩阵的初等变换生成一个行阶梯形矩阵,由于矩阵的初等变换不改变矩阵的秩,因此A的行梯阵形式有同A一样的秩。经过初等变换的矩阵的非零行的数目就是原矩阵的秩。
例如考虑4 × 4矩阵
我们看到第2纵列是第1纵列的两倍,而第4纵列等于第1和第3纵列的总和。第1和第3纵列是线性无关的,所以A的秩是2。这可以用高斯算法验证。它生成下列A的行梯阵形式:
它有两个非零的横行。
在应用在计算机上的浮点数的时候,基本高斯消去(LU分解)可能是不稳定的,应当使用秩启示(revealing)分解。一个有效的替代者是奇异值分解(SVD),但还有更少代价的选择,比如有支点(pivoting)的QR分解,它也比高斯消去在数值上更强壮。秩的数值判定要求对一个值比如来自SVD的一个奇异值是否为零的依据,实际选择依赖于矩阵和应用二者。
应用
计算矩阵的秩的一个有用应用是计算线性方程组解的数目。如果系数矩阵的秩等于增广矩阵的秩,则方程组只要有一个解。在这种情况下,它有精确的一个解,如果它的秩等于方程的数目。如果增广矩阵的秩大于系数矩阵的秩,则通解有k个自由参量,这里的 k是在方程的数目和秩的差。否则方程组是不一致的。
在控制论中,矩阵的秩可以用来确定线性系统是否为可控制的,或可观察的。
注解
^证明: 对这个不等式使用秩-零化度定理dim -->ker -->(AB)≤ ≤ -->dim -->ker -->(A)+dim -->ker -->(B){\displaystyle \dim \operatorname {ker} (AB)\leq \dim \operatorname {ker} (A)+\dim \operatorname {ker} (B)}.
^Proof: The mapC:ker -->(ABC)/ker -->(BC)→ → -->ker -->(AB)/ker -->(B){\displaystyle C:\operatorname {ker} (ABC)/\operatorname {ker} (BC)\to \operatorname {ker} (AB)/\operatorname {ker} (B)}is well-defined and injective. We thus obtain the inequality in terms of dimensions of kernel, which can then be converted to the inequality in terms of ranks by the rank–nullity theorem. Alternatively, if M is a linear subspace then dim(AM) ≤ dim(M); apply this inequality to the subspace defined by the (orthogonal) complement of the image of BC in the image of B, whose dimension is rk(B) – rk(BC); its image under A has dimension rk(AB) – rk(ABC)
参考文献
Horn, Roger A. and Johnson, Charles R. Matrix Analysis. Cambridge University Press, 1985. ISBN 978-0-521-38632-6.
Kaw, Autar K. Two Chapters from the book Introduction to Matrix Algebra: 1. Vectors[1]and System of Equations[2]
参见
向量组的秩
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
- 有价值
- 一般般
- 没价值