1-1线性空间

第一专题线性空间和线性变换

矩阵是研究线性模型最基本的工具之一。根据本书的性质，我们假定读者已具备了这方面的基础知识。本书的目的是对本科《线性代数》教材中没有论及或讨论不够充分，而在线性模型讨论中经常用到的一些矩阵知识，给予系统而扼要地叙述。

§1 线性空间

一、线性空间的概念与性质

线性空间是由具体的几何平面和空间的特征经过抽象提炼出来的一个数学概念。粗略地说，在一个非空集合上定义了线性运算，并且这种运算满足一定的规则，那么这个非空集合就成为一个线性空间。因此，一个线性空间必须有由线性运算规定的代数结构(由集合与满足一定运算规律的一些代数运算合在一起组成的系统) ，以便于用数学方法对它研究。为了说明它的来源，在引入定义之前，先看几个熟知的例子。

例1 在解析几何中，我们讨论过三维空间中的向量。向量的基本属性是可以按平行四边形规律相加，也可以与实数作数量乘法。我们看到，不少几何和力学对象的性质是可以通过向量的这两种运算来描述的。

例2 为了解线性方程组，我们讨论过以n 元有序数组(a 1,a 2, ,a n ) 作为元素的n 维向量空间。对于它们，也有加法和数量乘法，那就是：

(a 1,a 2, ,a n ) +(b 1,b 2, ,b n ) =(a 1+b 1,a 2+b 2, ,a n +b n ), k (a 1,a 2, ,a n ) =(ka 1,ka 2, ,ka n ).

从这些例子中我们可以看到，所考虑的对象虽然不同，但它们有一个共同点，那就是它们都有加法和数量乘法这两种运算。抽取它们的共同点，把它们统一起来加以研究，我们可以引入线性空间的概念。

在第一个例子中，我们用实数和向量相乘。在第二个例子中用什么数和向量相乘，就要看具体情况。例如，在有理数域中解线性方程组时，用有理数去作数量乘法就足够了，而在复数域中解线性方程组时，就需要用复数去作运算。可见，不同的对象与不同的数域相联系。当我们引入抽象的线性空间的概念时，也必须选定一个确定的数域作为基础。

定义1 设F 是一个数集，其中包含0和1。如果F 中任意两个数（它们可以相同）的和、差、积、商（除数不是0）仍是F 中的数，那么称F 为数域。

显然，全体实数集R 、全体复数集C 、全体有理数集Q 等都是数域。而全体正实数集R +，全体整数集Z 等都不是数域。

定义2 设V 是一非空集合, F 是数域（本书特指实数域）, 对V 中任意两个元α, β, 定义一个加法运算, 记为“+”:α+β∈V （元α+β称为α与β的和）；定义一个数乘运算:k α∈V , k ∈F （元k α称为k 与α的数积）。这两种运算（也称为V 的线性运算）, 满足下列规则, 则称V 为数域F 上的线性空间（或向量空间）。加法满足下面四条规则：

(1) α+β=β+α；

(2) (α+β) +γ=α+(β+γ) ；

(3) 在V 中存在零元素0；对任何α∈V ，都有α+0=α；

(4) 对任何α∈V ，都有α的负元素β∈V ，使α+β=0，记β=-α；

数量乘法满足下面两条规则：

(5) 1α=α；

(6) λ(μα) =(λμ) α；

数量乘法与加法满足下面两条规则；

(7) (λ+μ) α=λα+μα；

(8) λ(α+β) =λα+λβ，

在以上运算中，λ, μ等表示数域F 中的数，α, β, γ等表示集合V 中的元素。数域F 上的线性空间V ，记为V (F ) ，V 中的元称为向量；当F 是实数域时，称V 为实线性空间；当F 是复数域时，称V 为复线性空间。在不需要强调数域时，就称V 为线性空间。

下面再举几个例子。

例3 按照矩阵的加法及数与矩阵的乘法，由数域F 上的元素构成的全体m ⨯n 矩阵所成的集合，在数域F 上构成一个线性空间，称为矩阵空间，记为F m ⨯n ，其中R m ⨯n 为由一切m ⨯n 实矩阵构成的实线性空间。但秩为r (r >0) 的全体矩阵所构成的集合F m ⨯n 不构成线性空间。事实上，零矩阵0∉F m ⨯n 。

例4 区间[a,b ]上的连续函数的全体，对于通常意义的函数加法和数乘函数，构成线性空间，记为C [a,b ]，而C 1[a,b ]表示由区间[a,b ]上的连续可微函数的全体，对于通常的函数加法和数乘函数所构成的线性空间。

例5实数域R 上的多项式全体，按通常意义的多项式加法及数与多项式乘法，构成线性空间，记为p (t ) 。如果只考虑次数不大于n 的多项式全体，再添加零多项式（系数全是零的多项式）所构成的集，则对于通常意义的多项式加法及数与多项式乘法，构成线性空间，记为p n (t ) 。

例6数域F 按照本身的加法与乘法，即构成一个自身上的线性空间。全体实n 维向量组成的集合，对于通常意义下的向量加法和数乘向量，构成一个实线性空间，记为R n 。全体复n 维向量组成的集合，对于通常的向量加法和数乘向量，也构成线性空间。这时既可用实数乘向量，从而构成实线性空间；又可以用复数乘

向量，构成复线性空间，记为C n 。

由定义2可以证明线性空间的一些简单性质。

性质1 零向量是唯一的。

性质2 负向量是唯一的。

(-1) α=-α； k 0=0。性质3 0α=0；

性质4 若k α=0, 则k =0或α=0。

注：

（1）线性空间V 是一个集合（向量），它满足一定条件。

（2）线性空间中的加法运算和乘法运算可以有不同的定义。例如：在正实数集R +中，F 为实数域R ，定义加法和数乘运算为： a ⊕b =ab ，k a =a k

其中a , b ∈R +, k ∈R , “⊕”表示加法，“ 。”表示数乘。那么R +构成实线性空间。R +中元素a 此时加法零元素是R +中的数1，

的负元素是a -1。

二、线性空间的基、维数与坐标

定义3 设V 是线性空间，若存在n 个向量α1, α2, , αn 满足

(1)α1, α2, , αn 线性无关；

(2)V 中任一向量α总可有α1, α2, , αn 线性表示，

则α1, α2, , αn 称为线性空间V 的一个基，n 称为线性空间V 的维数，记为dim V , 并称该线性空间为n 维线性空间，记作V n 。

按照这个定义，不难看出，几何空间中向量所构成的线性空间是3维的，n 元数组构成的空间是n 维，例3所述的线性空间

F m ⨯n 是m ⨯n 维的。因为F m ⨯n 中的任一矩阵A =(a ij ) 可表示为

A =(a ij ) =∑∑a ij E ij

i =1j =1m n

其中E ij 表示第i 行第j 列处的元素为1，其余元素为0的m ⨯n 矩阵，并且E ij , i =1, , m , j =1, , n 显然是线性无关的，是F m ⨯n 的一个基。而例5中的p (t ) 则是无限维的。

注:

(1)基就是线性空间V n 的最大无关组，因为最大无关组不唯一，所以基不唯一，但基与基之间是等价的。基可以看成空间直角坐标系的推广，从而线性空间V n 的维数n 是唯一的。

(2)线性空间V n 可用基α1, α2, , αn 表示： {}

V n ={α=x 1α1+x 2α2+ +x n αn |x 1, x 2, , x n ∈R }，从而显示出V n 的构造。

定义4 若α1, α2, , αn 是线性空间V n 的一个基，∀β∈V n ，

⎛x 1⎫ x ⎪β=x 1α1+x 2α2+ +x n αn =∑x i αi =(α1 α2 αn ) 2⎪， i =1 x ⎪⎪⎝n ⎭n

则称数x 1, x 2, , x n 是β在基α1, α2, , αn 下的坐标向量(或坐标) ，记为x =(x 1, x 2, , x n ) T ，x i (1≤i ≤n ) 称为β在基α1, α2, , αn 下的第i 个坐标。

⎛32⎫例7 求R 2⨯2中向量 15⎪⎪在基E 11, E 12, E 21, E 22下的坐标。 ⎝⎭

解

⎛32⎫=3⎛10⎫+2⎛01⎫+⎛00⎫+5⎛00⎫ 15⎪ 00⎪ 00⎪ 10⎪ 01⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭

⎛3⎫ ⎪ 2⎪=3E 11+2E 12+E 21+5E 22=(E 11 E 12 E 21 E 22) ⎪， 1 ⎪ 5⎪⎝⎭

故该向量在所给基下的坐标为(3, 2, 1, 5)T 。

一般地R 2⨯2⎛a 11a 12⎫⎪中向量 a ⎪在所给基E ij 下的坐标为a ⎝2122⎭{}

(a 11, a 12, a 21, a 22) T 。

例8 求R 3中向量a =(1, 2, 1) T 在基

α1=(1, 1, 1) T , α2=(1, 1, -1) T , α3=(1, -1, -1) T 下的坐标。解设所求的坐标是x 1, x 2, x 3，则

a =x 1α1+x 2α2+x 3α3

即

1⎫⎛x 1⎫⎛1⎫⎛x 1⎫⎛11 ⎪ ⎪ ⎪ ⎪()2=αααx =11-1 ⎪ ⎪ x 2⎪ 123 2⎪ 1⎪ x ⎪ 1-1-1⎪ x ⎪⎝⎭⎝3⎭⎝⎭⎝3⎭

解得

x 1=1, x 2=11, x 3=- 22

11于是所求的坐标是(1, , -) T 22

例9 在p 2(t ) 中取基1, t , t 2，则多项式p (t ) =2t 2-t +1在基{}

下的坐标是(1, -1, 2)T ，因为

⎛1⎫ ⎪222 2t -t +1=1⋅1+(-1) ⋅t +2⋅t =(1 t t ) -1⎪。

2⎪⎝⎭

若另取一个基t +1, t +2, t 2，则由

⎛-3⎫ ⎪2t 2-t +1=-3⋅(t +1) +2⋅(t +2) +2⋅t 2=(t +1 t +2 t 2) 2⎪

2⎪⎝⎭{}

知p 2(t ) 在t +1, t +2, t 2的坐标为(-3, 2, 2)T 。

注：

坐标是与基有关的，同一个向量在不同基底下有不同的坐标。

建立了坐标以后，就把抽象的向量与具体的数组向量{}(x 1, x 2, , x n ) T 联系起来，并把V n 中抽象的线性运算与数组向量的线性运算联系起来。

设α , β∈ V n ，有

α=x 1a 1+x 2a 2+ +x n a n , β=y 1a 1+y 2a 2+ +y n a n ，于是

α+β=(x 1+y 1) a 1+(x 2+y 2) a 2+ +(x n +y n ) a n ，

λα=(λx 1) a 1+(λx 2) a 2+ +(λx n ) a n ，

即α+β的坐标是

λα的坐标(x 1+y 1, , x n +y n ) T =(x 1, , x n ) T +(y 1, , y n ) T ，

是(λx 1, , λx n ) T =λ(x 1, , x n ) T 。

总之，当在n 维线性空间V n 的取定一个基α1, α2, , αn 时，V n

中的向量α与n 维数组向量空间R n 中的向量(x 1, x 2, , x n ) 之间存在着一一对应关系，且这个对应关系具有下述性质：设α(x 1, , x n ) T , β(y 1, , y n ) T ，则

1. α+β(x 1, , x n ) T +(y 1, , y n ) T ;

2. λαλ(x 1, , x n ) T ,

也就是说，这个对应关系保持线性组合的对应。因此，我们可以说V n 与R n 有相同的结构，我们称V n 与R n 同构。

定义5 一般地，设V 与U 是两个线性空间，如果在它们的元素之间有一一对应关系，且这个对应关系保持线性组合的对应，那么就说线性空间V 与U 同构。

显然，任何n 维线性空间都与R n 同构，即维数相等的线性空间都同构，从而可知线性空间的结构完全被它的维数所决定。

同构的概念除元素一一对应外，主要是保持线性运算的对应关系，因此，V n 中的抽象的线性运算就可转化为与R n 中的线性运算，并且R n 中凡是只涉及线性运算的性质就都适用于V n 。但R n 中超出线性运算的性质，在V n 中就不一定具备，例如R n 中的内积概念在V n 中就不一定有意义。

三、基变换与坐标变换

由例9可以看出，坐标是与基有关的，同一个向量在不同的基下有不同的坐标，那么不同的基与不同的坐标之间有怎样的关系呢？

定义6 设α1, α2, , αn 及β1, β2, , βn 是线性空间V n 的两个基，且

⎧β1=p 11α1+p 21α2+ +p n 1αn ⎪β=p α+p α+ +p α⎪2121222n 2n ⎨ (1)

⎪

⎪⎩βn =p 1n α1+p 2n α2+ +p nn αn

则

⎛p 11 p 21 (β1, β2, , βn ) =(α1, α2, , αn ) p ⎝n 1p 12 p 22 p n 2 p 1n ⎫⎪p 21⎪ ⎪ ⎪p nn ⎪⎭

或

(β1, β2, , βn ) =(α1, α2, , αn ) P (2) 其中n 阶方阵P =(p ij ) 称为由基α1, α2, , αn 到基β1, β2, , βn 的变换矩阵（或过渡矩阵），(1)或(2)式称为相应的基变换公式。注：

(1)由于α1, α2, , αn 线性无关, β1, β2, , βn 线性无关, 易得过渡矩阵P 可逆。

T (2)基变换公式P 中的第j 个列向量P j =(P 1j , P 2j , , P nj ) 就是第

二组基的第j 个基向量βj 在第一组基下的坐标。

(3)由(β1, β2, , βn ) =(α1, α2, , αn ) P ，P 可逆，易得 (α1, α2, , αn ) =(β1, β2, , βn ) P -1

所以由基β1, β2, , βn 到基α1, α2, , αn 的过渡矩阵是P -1。

定理1 设V n 中的向量α，在基α1, α2, , αn 下的坐标为x =(x 1, x 2, , x n ) T ，在基β1, β2, , βn 下的坐标为

若基α1, α2, , αn 到基β1, β2, , βn 的过渡矩y =(y 1, y 2, , y n ) T 。

阵为P 。则有坐标变换公式

x =Py 或 y =P -1x (3) 证明

由

α=x 1α1+x 2α2+ +x n αn =(α1, α2, , αn ) x α=y 1β1+y 2β2+ +y n βn =(β1, β2, , βn ) y 所以

(α1, α2, , αn ) x =(β1, β2, , βn ) y =(α1, α2, , αn ) Py 因为α1, α2, , αn 线性无关，故(3)式成立，定理得证。

容易证明这个定理的逆命题也成立。即若任意向量的两种坐标满足坐标变换公式(3)，则两个基满足基坐标变换公式(2)。

例10 设R 3的两组基分别为

α1=(1, 0, -1) T , α2=(2, 1, 1) T , α3=(1, 1, 1) T

和

β1=(0, 1, 1) T , β2=(-1, 1, 0) T , β3=(1, 2, 1) T 。

(1)求从基α1, α2, α3到基β1, β2, β3的过渡矩阵P 。

(2)求向量α=α1+2α2-3α3在基β1, β2, β3下的坐标。

(3)求在这两个基下有相同坐标的所有向量。

解 (1)由基过渡公式(2)给出

⎛0-11⎫⎛121⎫ ⎪ ⎪ 112⎪= 011⎪P

101⎪ -111⎪⎝⎭⎝⎭

从中可求得

⎛121⎫ ⎪ P = 011⎪ -111⎪⎝⎭-1⎛0-11⎫⎛011⎫ ⎪ ⎪ 112⎪= -1-3-2⎪. 101⎪ 244⎪⎝⎭⎝⎭

(2)由α=α1+2α2-3α3, 得α在基α1, α2, , αn 下的坐标为x =(1, 2, -3) T , 由y =P -1x , 得 ⎛011⎫⎛1⎫⎛-7⎫ ⎪ ⎪1 ⎪-1 y =P x = -1-3-2⎪ 2⎪= -1⎪.

244⎪ -3⎪2 3⎪⎝⎭⎝⎭⎝⎭

(3)设γ=(γ1, γ2, γ3) T 是所求的向量，它在基α1, α2, α3和基-1β1, β2, β3下的坐标下相同，不妨设为x =(x 1, x 2, x 3) T 。由题意容易得出：

(α1, α2, α3) x =γ=(β1, β2, β3) x =(α1, α2, α3) Px 又因为α1, α2, α3线性无关，所以 x =Px ，即

⎛1-1-1⎫ 142⎪x =0 -2-4-3⎪⎝⎭

解得

x =(0, 0, 0) T ，从而得到 γ=(0, 0, 0) T . 例11 在所有2⨯2矩阵构成的4维线性空间P 2⨯2中，证明 α1= 11⎪⎪, α2= -1-1⎪⎪, α3= 1-1⎪⎪, α4= 1⎝⎭⎝⎭⎝⎭⎝⎛11⎫⎛11⎫⎛1-1⎫⎛-11⎫⎪, 构成一-1⎪⎭

⎛12⎫个基，并求矩阵β= 34⎪⎪在这个基下的坐标。 ⎝⎭

解

由例7易知E 11, E 12, E 21, E 22 是P 2⨯2的一个基，因此有

(α1, α2, α3, α4) =(E 11, E 12, E 21, E 22) P (4) 其中

⎛111-1⎫ ⎪11-11 ⎪ P = 1-111⎪ ⎪ 1-1-1-1⎪⎝⎭

经计算P =16≠0，故P 可逆，从而α1, α2, α3, α4线性无关，因此它构成一个基, 且(4)式就是由基E 11, E 12, E 21, E 22 到基α1, α2, α3, α4的基变换矩阵。

设β在基α1, α2, α3, α4下的坐标为(y 1, y 2, y 3, y 4) T ，而已知β在基E 11, E 12, E 21, E 22 下的坐标为(1, 2, 3, 4) T ，由坐标变换公式得

⎛5⎫⎛y 1⎫⎛1⎫⎛1111⎫⎛1⎫ ⎪ ⎪ ⎪ ⎪ ⎪ 2⎪1 11-1-1⎪ 2⎪ -1⎪ y 2⎪-1 2⎪=P = y ⎪ 3⎪4 1-11-1⎪ 3⎪= 1⎪

3⎪ ⎪ ⎪ ⎪ -⎪ ⎪ ⎪ ⎪ y ⎪2⎝4⎭⎝-111-1⎭⎝4⎭ 0⎪⎝4⎭⎝⎭另解

设β在基α1, α2, α3, α4下的坐标为y =(y 1, y 2, y 3, y 4) T ，则

β= 34⎪⎪=y 1α1+y 2 α2+y 3α3+y 4 α4 ⎝⎭

⎛11⎫⎛11⎫⎛1-1⎫⎛-11⎫ ⎪ ⎪ ⎪⎪=y 1 +y 2 +y 3 +y 4 ⎪⎪⎪ ⎪ 11-1-11-11-1⎝⎭⎝⎭⎝⎭⎝⎭⎛12⎫

⎛y 1+y 2+y 3+y 4= y -y +y +y 234⎝1

得到 y 1+y 2-y 3+y 4⎫⎪ ⎪y 1-y 2-y 3-y 4⎭

11⎫⎛y 1⎫⎛1⎫⎛11 ⎪ ⎪ ⎪211-11 ⎪ ⎪ y 2⎪ ⎪= 31-111⎪ y 3⎪ ⎪ ⎪ ⎪ 4⎪ 1-1-1-1⎪ y ⎪⎝⎭⎝⎭⎝4⎭

所以

1⎛5⎫y = -1-0⎪. 2⎝2⎭T