线性映射
定义和基本性质
设 V 和 W 是在相同域 K 上的向量空间。法则 f : V → W 被称为是线性映射,如果对于 V 中任何两个向量 x 和 y 与 K 中任何标量 a ,满足下列两个条件:
这等价于要求对于任何向量 x 1 , ..., x m 和标量 a 1 , ..., a m ,方程
成立。
偶尔的, V 和 W 可被看作在不同域上的向量空间。那么必须指定哪些基础域要被用在“线性”的定义中。如果 V 和 W 被看作前面的域 K 上的空间,我们谈论的就是 K -线性映射。例如,复数的共轭是 R -线性映射 C → C ,而不是 C -线性映射。
从向量空间 V 到数域 K 的线性映射有一个特别的名字,叫做“线性泛函”。线性泛函分析就是将空间维度增加到无穷维(包括不可数无穷维)的高等线性代数。泛函分析最早研究的是有关向量空间 V 上的实值函数(不过它们一般是非线性映射)的变分学问题。
从定义立即得出 f (0) = 0。因此线性映射有时叫做 均匀线性映射 (参见线性泛函)。
不同作者的术语差异
“线性变换”和“线性算子”是与“线性映射”有关的名称。但不同作者会按个人喜好对“线性变换”和“线性算子”下不同的定义。这导致这2个概念与“线性映射”的关系比较乱,没有统一的标准。
从向量空间A内的向量映射到同一个空间A内的线性映射是一类重要的线性映射,而且是一种自同态。是否给它一个特殊的术语作为名称就导致了不同作者做法的分歧。比如Axler的书将“线性映射”和“线性变换”当做同义词 ,但“线性算子”则用于定义这种线性映射中特殊的自同态映射 。龚昇的书也将“线性算子”定义为线性的自同态映射。 李尚志的书则将线性自同态映射称为“线性变换”。 而泛函分析教材中一般将“线性变换”和“线性算子”都当做“线性映射”的别称,彼此不加区别。
为避免词义混乱,本条目暂将“线性算子”视作在同一空间内的“线性映射”(即认为二者存在区别),并将“线性变换”当做“线性映射”的同义词。认定“线性算子”仅指从向量空间A内的向量映射到同一个空间A内的线性映射。即“线性算子”只是“线性映射”的其中一种。“线性算子”是从向量空间到其自身的线性映射(自同态),而“线性映射”则只是一般的同态(不一定是自同态)。
注意
本条目所定义的“线性”与“函数图像是一条直线”是有区别的(可见下文的举例说明)。请勿混淆。
同一空间内不同的线性算子(注意本条目将线性算子定义为将向量映射到原空间内的线性映射)可以复合,但一般不能随便交换算子(哪怕是线性的算子)复合的先后顺序。即线性算子的代数不满足乘法交换律。比如“给函数乘上 x 2 {\displaystyle x^{2}} ”和“对函数进行微分”都是线性算子(可见下文的举例说明),但对一个函数“先乘上 x 2 {\displaystyle x^{2}} 再进行微分”和“先进行微分再乘上 x 2 {\displaystyle x^{2}} ”所得到的结果一般是不一样的。
由“可加性”不可能推导出“齐次性”,由“齐次性”也不可能推导出“可加性”,所以这2条件对于“线性”的定义缺一不可。
例子
恒等映射和零映射是线性的。
对于实数,映射 x ↦ ↦ --> x 2 {\displaystyle x\mapsto x^{2}} 不是线性的。
如果 A 是 m × n 实矩阵,则 A 定义了一个从 R 到 R 的线性映射,这个映射将列向量 x ∈ R 映射到列向量 Ax ∈ R 。反过来说,在有限维向量空间之间的任何线性映射都可以用这种方式表示;参见后面章节。
积分生成从在某个区间上所有可积分实函数的空间到 R 的线性映射。这只是把积分的基本性质(“积分的可加性”和“可从积分号内提出常数倍数”)用另一种说法表述出来。
微分是从所有可微分函数的空间到所有函数的空间的线性映射。
“给函数乘上 x 2 {\displaystyle x^{2}} ”是一种线性映射。 设C是由全体连续函数所组成的函数空间,则此运算也是空间C中的算子。
后向移位(backward shift)运算是一种线性映射。即把无穷维向量 ( x 1 , x 2 , x 3 , x 4 , . . . ) {\displaystyle (x_{1},x_{2},x_{3},x_{4},...)} 的第一个坐标划去: T --> ( x 1 , x 2 , x 3 , x 4 , . . . ) = ( x 2 , x 3 , x 4 , . . . ) {\displaystyle \operatorname {T} (x_{1},x_{2},x_{3},x_{4},...)=(x_{2},x_{3},x_{4},...)} 。
如果 V 和 W 为在域 F 上的有限维向量空间,则从线性映射 f : V → W 到在后面所描述的 dim F ( W ) × dim F ( V ) 矩阵的函数也是线性映射。
一次函数 y = f ( x ) = x + b {\displaystyle y=f(x)=x+b} 仅在b=0时才是一种线性变换。容易验证一次函数仅在b=0时,线性变换的基本性质f(0)=0才能成立。(尽管b≠0时其图像也是一条直线,但 这里所说的线性不是指函数图像为直线 。)同理,平移变换一般也不是线性变换(平移距离为零时才是线性变换)。
矩阵
如果 V 和 W 是有限维的,并且在这些空间中有选择好的基,则从 V 到 W 的所有线性映射可以被表示为矩阵。反过来说,矩阵生成线性映射的例子: 如果 A 是实数的 m × n 矩阵,则规定 f ( x ) = Ax 描述一个线性映射 R → R (参见欧几里得空间)。
设 { v 1 , ⋯ ⋯ --> , v n } {\displaystyle \{v_{1},\cdots ,v_{n}\}} 是 V 的一个基。则在 V 中所有向量 v 是唯一的由在
的系数 c 1 , ⋯ ⋯ --> , c n {\displaystyle c_{1},\cdots ,c_{n}} 确定的。 如果 f : V → W 是线性映射,
这蕴涵了这个函数 f 是完全由
的值确定的。
现在设 { w 1 , … … --> , w m } {\displaystyle \{w_{1},\dots ,w_{m}\}} 是 W 的基。则可以表示每个 f ( v j ) {\displaystyle f(v_{j})} 的值为
因此函数 f 是完全由 a i , j {\displaystyle a_{i,j}} 的值确定的。
如果把这些值放置到 m × n 矩阵 M 中,则可以方便的使用它来计算 f 对在 V 中任何向量的值。如果我放置 c 1 , ⋯ ⋯ --> , c n {\displaystyle c_{1},\cdots ,c_{n}} 的值到 n × 1 矩阵 C ,我们有 MC = f( v )。
一个单一的线性映射可以由很多矩阵表示。这是因为矩阵的元素的值依赖于选择的基。
用矩阵表示线性映射的原因和好处
把线性映射写成具体而简明的2维数阵形式后,就成了一种矩阵。进而由线性映射的加法规则和复合规则来分别定义矩阵的加法规则和乘法规则是很自然的想法。 当空间的基变化(坐标系变换)时,线性映射的矩阵也会有规律地变化。在特定的基上研究线性映射,就转化为对矩阵的研究。利用矩阵的乘法,可以把一些线性系统的方程表达得更紧凑(比如把线性方程组用矩阵表达和研究),也使几何意义更明显。矩阵可以分块计算,可以通过适当的变换以“解耦”(把复杂的变换分解为一些简单变换的组合)。要求出一个线性变换的秩,先写出其矩阵形式几乎是不可避免的一个步骤。
遇到y=x+3这样的加上了1个常量的非线性映射可以通过增加1个维度的方法,把变换映射写成2×2维的方形矩阵形式,从而在形式上把这一类特殊的非线性映射转化为线性映射。这个办法也适用于处理在高维线性变换上多加了一个常向量的情形。这在计算机图形学和刚体理论(及其相关机械制造和机器人学)中都有大量应用。
对角化的矩阵具有诸多优点。线性映射在写成矩阵后可以进行对角化(不能对角化的矩阵可以化简成接近对角矩阵的准对角矩阵),从而可以获得对角化矩阵拥有的独特优势(极大地简化乘法运算,易于分块,容易看出与基的选取无关的不变量)。比如,对于作用于同一个空间的可对角化的方形矩阵A,要求出A自乘n次后的结果 A n {\displaystyle A^{n}} ,一个一个慢慢地乘是很麻烦的事情。而知道对角化技巧的人会发现,在将这矩阵对角化后,其乘法运算会变得格外简单。实际应用中有很多有意思的问题或解题方法都会涉及到矩阵自乘n次的计算,如1阶非齐次线性递推数列通项公式的线性代数求解法和马尔可夫链的极限状态(极限分布)的求解。线性代数及矩阵论的一个主要问题就是寻找可使矩阵对角化的条件或者可使矩阵化简到含很多个0的条件 ,以便简化计算(这是主要原因之一)。
线性映射的矩阵的例子
二维空间 R 的线性变换的一些特殊情况有:
逆时针旋转90 度: A = [ 0 − − --> 1 1 0 ] {\displaystyle A={\begin{bmatrix}0&-1\\1&0\end{bmatrix}}}
逆时针旋转θ 度 : A = [ cos --> ( θ θ --> ) − − --> sin --> ( θ θ --> ) sin --> ( θ θ --> ) cos --> ( θ θ --> ) ] {\displaystyle A={\begin{bmatrix}\cos(\theta )&-\sin(\theta )\\\sin(\theta )&\cos(\theta )\end{bmatrix}}}
针对 x 轴反射: A = [ 1 0 0 − − --> 1 ] {\displaystyle A={\begin{bmatrix}1&0\\0&-1\end{bmatrix}}}
在所有方向上放大2 倍: A = [ 2 0 0 2 ] {\displaystyle A={\begin{bmatrix}2&0\\0&2\end{bmatrix}}}
垂直错切: A = [ 1 m 0 1 ] {\displaystyle A={\begin{bmatrix}1&m\\0&1\end{bmatrix}}}
挤压: A = [ k 0 0 1 / k ] {\displaystyle A={\begin{bmatrix}k&0\\0&1/k\end{bmatrix}}}
向 y 轴投影: A = [ 0 0 0 1 ] {\displaystyle A={\begin{bmatrix}0&0\\0&1\end{bmatrix}}}
从给定线性映射构造新的线性映射
两个线性映射的复合映射是线性的: 如果 f : V → W 和 g : W → Z 是线性的,则 g o f : V → Z 也是线性的。
若线性映射可逆,则该线性映射的逆也是线性映射。
如果 f 1 : V → W 和 f 2 : V → W 是线性的,则它们的和 f 1 + f 2 也是线性的(这是由 ( f 1 + f 2 )( x ) = f 1 ( x ) + f 2 ( x ) 定义的)。
如果 f : V → W 是线性的,而 a 是基础域 K 的一个元素,则定义自 ( af )( x ) = a ( f ( x )) 的映射 af 也是线性的。
所以从 V 到 W 的线性映射的集合 L ( V , W ) 自身形成在 K 上的向量空间,有时指示为 Hom( V , W )。进一步的说,在 V = W 的情况中,这个向量空间(指示为 End( V ))是在映射复合下的结合代数,因为两个线性映射的复合再次是线性映射,所以映射的复合总是结合律的。
给定有限维的情况,如果基已经选择好了,则线性映射的复合对应于矩阵乘法,线性映射的加法对应于矩阵加法,而线性映射与标量的乘法对应于矩阵与标量的乘法。
自同态线性映射
自同态的线性映射在泛函分析和量子力学中都有很重要的地位。按前文约定,我们用“线性算子”来简称它。(注意泛函分析中所说的“线性算子”不一定是自同态(endomorphism)映射,但我们为了照顾不同书籍的差异以及叙述的方便,暂用“线性算子”来称呼这种自同态。)
自同态和自同构
线性算子 f : V → V 是 V 的自同态;所有这种自同态的集合 End( V ) 与如上定义的加法、复合和标量乘法一起形成一个结合代数,带有在域 K 上的单位元(特别是一个环)。这个代数的乘法单位元是恒等映射id : V → V 。
若 V 的自同态也刚好是同构则称之为自同构。两个自同构的复合再次是自同构,所以 V 的所有的自同构的集合形成一个群, V 的自同构群可表为 Aut( V ) 或 GL( V )。因为自同构正好是那些在复合运算下拥有逆元的自同态,所以Aut( V ) 也就是在环 End( V ) 中的可逆元群。
如果 V 之维度 n 有限,则 End( V )同构于带有在 K 中元素的所有 n × n 矩阵构成的结合代数,且 V 的自同态群同构于带有在 K 中元素的所有 n × n 可逆矩阵构成的一般线性群GL( n , K ) 。
量子力学应用
核、像和秩-零化度定理
如果 f : V → W 是线性的,我们定义 f 的 核 和 像 (或称 值域 )为
ker( f ) 是 V 的子空间,而 im( f ) 是 W 的子空间。下面的叫做秩-零化度定理的维度公式经常是有用的:
dim(im( f )) 的数也叫做“f 的秩”(rank)并写为 rk( f ),有时写为 ρ( f );dim(ker( f )) 的数也叫做“f 的零化度”(nullity)并写为 ν( f )。如果 V 和 W 是有限维的,基已经选择好并且 f 被表示为矩阵 A ,则 f 的秩和零化度分别等于矩阵 A 的秩和零化度。
推广
多重线性映射是线性映射最重要的推广,它也是格拉斯曼代数和张量分析的数学基础。其特例为双线性映射。
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
- 有价值
- 一般般
- 没价值