迹
例子
设有矩阵:
A=[351092764]{\displaystyle \mathbf {A} ={\begin{bmatrix}3&5&1\\0&9&2\\7&6&4\end{bmatrix}}}
它的迹是:
tr -->(A)=tr -->[351092764]{\displaystyle \operatorname {tr} (\mathbf {A} )=\operatorname {tr} {\begin{bmatrix}3&5&1\\0&9&2\\7&6&4\end{bmatrix}}} = 3 + 9 + 4 = 16
性质
线性函数
给定一个环R{\displaystyle \mathbb {R} },迹是一个从系数在环中的n× × -->n{\displaystyle n\times n}矩阵的空间Mn(R){\displaystyle {\mathcal {M}}_{n}(\mathbb {R} )}射到环R{\displaystyle \mathbb {R} }之上的线性算子。也就是说,对于任两个n× × -->n{\displaystyle n\times n}的矩阵A{\displaystyle \mathbf {A} }、B{\displaystyle \mathbf {B} }和标量r{\displaystyle r},都有:
更进一步来说,当R{\displaystyle \mathbb {R} }是一个域时,迹数函数tr{\displaystyle \mathrm {tr} }是n× × -->n{\displaystyle n\times n}矩阵的空间Mn(R){\displaystyle {\mathcal {M}}_{n}(\mathbb {R} )}上的一个线性泛函。
由于一个矩阵A{\displaystyle \mathbf {A} }的转置矩阵AT{\displaystyle \mathbf {A} ^{T}}的主对角线元素和原来矩阵的主对角线元素是一样的,所以任意一个矩阵和其转置矩阵都会有相同的迹:
矩阵乘积的迹数
设A是一个n× × -->m{\displaystyle n\times m}矩阵,B是个m× × -->n{\displaystyle m\times n}矩阵,则:
其中AB{\displaystyle \mathbf {AB} }是一个n× × -->n{\displaystyle n\times n}矩阵,而BA{\displaystyle \mathbf {BA} }是一个m× × -->m{\displaystyle m\times m}矩阵。
上述的性质可以由矩阵乘法的定义证明:
如果A{\displaystyle \mathbf {A} }和B{\displaystyle \mathbf {B} }都是n× × -->n{\displaystyle n\times n}的方形矩阵,那么它们的乘积AB{\displaystyle \mathbf {AB} }和BA{\displaystyle \mathbf {BA} }也会是方形矩阵。因此,利用这个结果,可以推导出:计算若干个同样大小的方形矩阵的乘积的迹数时,可以循环改变乘积中方形矩阵相乘的顺序,而最终的结果不变。例如,有三个方形矩阵A{\displaystyle \mathbf {A} }、B{\displaystyle \mathbf {B} }和C{\displaystyle \mathbf {C} },则:
但是要注意:
更一般地,乘积中的矩阵不一定要是方形矩阵,只要某一个循环改变后的乘积依然存在,那么得到的迹数依然会和原来的迹数相同。
另外,如果A{\displaystyle \mathbf {A} }、B{\displaystyle \mathbf {B} }和C{\displaystyle \mathbf {C} }是同样大小的方阵而且还是对称矩阵的话,那么其乘积的迹数不只在循环置换下不会改变,而且在所有的置换下都不会改变:
迹数的相似不变性
迹数拥有相似不变性。如果矩阵A{\displaystyle \mathbf {A} }和B{\displaystyle \mathbf {B} }相似的话,它们会有相同的迹。这一性质可使上面讲过的循环性质来证明:
矩阵迹数和特征多项式
一个n× × -->n{\displaystyle n\times n}的方形矩阵A{\displaystyle \mathbf {A} }的特征多项式PA(λ λ -->){\displaystyle P_{A}(\lambda )}定义为A{\displaystyle \mathbf {A} }减去λ λ -->{\displaystyle \lambda }倍的单位矩阵后所得到的矩阵的行列式:
特征多项式是一个关于λ λ -->{\displaystyle \lambda }的n次多项式,它的常数项是A{\displaystyle \mathbf {A} }的行列式的值,最高次项是(− − -->1)nλ λ -->n{\displaystyle (-1)^{n}\lambda ^{n}},而接下来的n-1次项就是(− − -->1)n− − -->1tr(A)λ λ -->n− − -->1{\displaystyle (-1)^{n-1}\mathrm {tr} (\mathbf {A} )\lambda ^{n-1}},也就是说:
矩阵迹数与特征值
当系数域是代数闭域时(否则可以将系数域扩展到其代数闭包上来看),特征多项式PA(λ λ -->){\displaystyle P_{A}(\lambda )}有n个根,它可以表达成:
其中的r1,r2⋯ ⋯ -->rk{\displaystyle r_{1},r_{2}\cdots r_{k}}是特征多项式的不同的根,而α α -->1,α α -->2⋯ ⋯ -->α α -->k{\displaystyle \alpha _{1},\alpha _{2}\cdots \alpha _{k}}是这些根在特征多项式里的重数,称为代数重数。显然,所有代数重数加起来等于n。一方面,特征多项式的根就是矩阵的特征值,而另一方面,借由根与多项式系数的关系可以知道:特征多项式的所有的根加起来等于矩阵的迹数。所以矩阵的迹数是矩阵的所有特征值(按照代数重数计算)的和。
如果将矩阵写成它的若尔当标准型的话,也可以看出这一点,因为若尔当标准型的特征多项式的所有的根(包括重根)就是对角线上的所有元素。
如果不区分相同或不同的特征值的话,上述关系也可以写成:
其中的λ λ -->1,λ λ -->2⋯ ⋯ -->λ λ -->n{\displaystyle \lambda _{1},\lambda _{2}\cdots \lambda _{n}}是矩阵的特征值。 而且有:
线性映射的迹数
设系数域为K{\displaystyle \mathbb {K} }的V{\displaystyle \mathbb {V} }是一个有限维的向量空间,维数是n。给定任一线性映射f:V→ → -->V{\displaystyle f:\mathbb {V} \rightarrow \mathbb {V} },可以定义此一映射的迹数为其变换矩阵的迹,即选定V{\displaystyle \mathbb {V} }的一个基底并用对应于此基底的一个方形矩阵描述f{\displaystyle f},再定义这个方形矩阵的迹数为f{\displaystyle f}的迹数。这个定义下f{\displaystyle f}的迹数和所选取的基无关:只需要注意到不同的基底的选取实际上等价于对变换矩阵做一次相似变换,而两个相似的矩阵的迹数是一样的。因此这样的定义是自洽的。
另外一种定义涉及到行列式的性质。考虑V{\displaystyle \mathbb {V} }的一个基底B=(e1,e2,⋯ ⋯ -->,en){\displaystyle {\mathcal {B}}=(e_{1},e_{2},\cdots ,e_{n})},以及函数:
根据行列式理论,这个函数也是一个行列式型的函数,也就是说存在一个只取决于f{\displaystyle f}的量Sp(f){\displaystyle \mathrm {Sp} (f)},使得
可以证明,这个纯量Sp(f){\displaystyle \mathrm {Sp} (f)}就等于之前定义的f{\displaystyle f}的迹数。
迹的梯度
由迹的定义可知迹可以看作是矩阵的实标量函数,所以我们可以通过求实标量函数的梯度来求迹的梯度。
单个矩阵
A是m×m矩阵时,有∂ ∂ -->tr(A)∂ ∂ -->A=Im{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} )}{\partial \mathbf {A} }}={\mathbf {I} }_{m}}
m×m矩阵A可逆时,有∂ ∂ -->tr(A− − -->1)∂ ∂ -->A=− − -->(A− − -->2)T{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{-1})}{\partial \mathbf {A} }}=-(\mathbf {A} ^{-2})^{T}}
对于两个向量x和y的外积,有∂ ∂ -->tr(xyT)∂ ∂ -->x=∂ ∂ -->tr(yxT)∂ ∂ -->x=y{\displaystyle {\frac {\partial \mathrm {tr} ({\boldsymbol {xy}}^{T})}{\partial {\boldsymbol {x}}}}={\frac {\partial \mathrm {tr} ({\boldsymbol {yx}}^{T})}{\partial {\boldsymbol {x}}}}={\boldsymbol {y}}}
两个矩阵
若A为m×n矩阵,有∂ ∂ -->tr(AAT)∂ ∂ -->A=∂ ∂ -->tr(ATA)∂ ∂ -->A=2A{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {A} ^{T})}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {A} ^{T}\mathbf {A} )}{\partial \mathbf {A} }}=2\mathbf {A} }
若A为m×m矩阵,有∂ ∂ -->tr(A2)∂ ∂ -->A=∂ ∂ -->tr(AA)∂ ∂ -->A=2AT{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{2})}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {A} )}{\partial \mathbf {A} }}=2\mathbf {A} ^{T}}
若A为m×n矩阵,B是m×n矩阵,有∂ ∂ -->tr(ATB)∂ ∂ -->A=∂ ∂ -->tr(BAT)∂ ∂ -->A=B{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{T}\mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} ^{T})}{\partial \mathbf {A} }}=\mathbf {B} }
若A为m×n矩阵,B是n×m矩阵,有∂ ∂ -->tr(AB)∂ ∂ -->A=∂ ∂ -->tr(BA)∂ ∂ -->A=BT{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} )}{\partial \mathbf {A} }}=\mathbf {B} ^{T}}
当A和B均为对称矩阵时,有∂ ∂ -->tr(AB)∂ ∂ -->A=∂ ∂ -->tr(BA)∂ ∂ -->A=B+BT− − -->diag(B){\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} )}{\partial \mathbf {A} }}=\mathbf {B} +\mathbf {B} ^{T}-diag(\mathbf {B} )}
若A和B都是m×m矩阵,并且B是非奇异矩阵,有∂ ∂ -->tr(BA− − -->1)∂ ∂ -->A=− − -->(A− − -->1BTA− − -->1)T{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} ^{-1})}{\partial \mathbf {A} }}=-(\mathbf {A} ^{-1}\mathbf {B} ^{T}\mathbf {A} ^{-1})^{T}}
参见
行列式
若尔当标准型
对角矩阵
三角矩阵
特征多项式
参考书籍
(中文)张贤达. 矩阵分析与应用. 清华大学出版社. 2008. ISBN 9787302092711.
(英文)Strang Gilbert. Linear algebra and its applications. Thomson, Brooks/Cole, Belmont, CA. 2006. ISBN 9780534422004.
(中文)居余马、林翠琴. 线性代数. 清华大学出版社. 2002. ISBN 978-7-302-06507-4.
(英文)Werner Hildbert Greub. linear algebra. Springer Verlag. 1975. ISBN 978-0-387-90110-7.
(英文)Steven Roman. Advanced Linear Algebra. Springer. 2005. ISBN 0-387-24766-1.
(英文)Carl Dean Meyer. Matrix Analysis and Applied Linear Algebra Book and Solutions Manual. Society for Industrial and Applied Mathematics. 2001. ISBN 978-0898714548.
(英文)Karim M. Abadir,Jan R. Magnus. Matrix algebra. Cambridge University Press. 2005. ISBN 978-0521537469.
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
- 有价值
- 一般般
- 没价值