§5 多项式矩阵的互质性与既约性
一、多项式矩阵的最大公因子
定义3-10 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一个
右公因子,如果存在多项式矩阵(λ) 和(λ) 使得:
N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)。
类似地可以定义左公因子。
定义3-11 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一
个最大右公因子(记为gcrd ),如果:
(1)R (λ)是N (λ), D (λ)的右公因子;
(2)N (λ), D (λ)的任一右公因子R 1(λ),都是R (λ)的右乘因子,即存在多项式矩阵
W (λ),使得R (λ)=W (λ)R 1(λ)。
对任意的n ⨯n 与m ⨯n 的多项式矩阵D (λ) 与N (λ) ,它们的gcrd 都存在。因为
R (λ) =(D T (λ), N T (λ)) T
便是一个。
定理3-13 (gcrd的构造定理) 对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ),如果能找到一个(n +m ) ⨯(n +m ) 的单模矩阵G (λ),使得
⎡D (λ)⎤⎡G 11(λ)G 12(λ)⎤⎡D (λ)⎤⎡R (λ)⎤
3-13 G (λ)⎢=⎢=⎢⎥⎥⎢⎥⎥
⎣N (λ)⎦⎣G 21(λ)G 22(λ)⎦⎣N (λ)⎦⎣0⎦
则n ⨯n 多项式矩阵R (λ),即为N (λ)和D (λ)的gcrd 。
证明:(1)证明R (λ)是右公因子。
设G -1(λ)=⎢
⎡F 11(λ)F 12(λ)⎤⎡D (λ)⎤⎡F 11(λ)F 12(λ)⎤⎡R (λ)⎤⎡F 11(λ)R (λ)⎤
,则。 =⎢=⎢⎥⎥⎥⎢⎥⎢⎥
⎣N (λ)⎦⎣F 21(λ)F 22(λ)⎦⎣0⎦⎣F 21(λ)R (λ)⎦⎣F 21(λ)F 22(λ)⎦
(2)证明R (λ)是gcrd 。
设R 1(λ)也是N (λ), D (λ)的右公因子,故有
N (λ)=N 1(λ)R 1(λ), D (λ)=D 1(λ)R 1(λ)。由3-13式,
R (λ)=G 11(λ)D (λ)+G 12(λ)N (λ)
=[G 11(λ)D 1(λ)+G 12(λ)N 1(λ)]R 1(λ)=W (λ)R 1(λ)
□
⎡D (λ)⎤⎡R (λ)⎤
gcrd 的求法:对矩阵M (λ)=⎢⎥进行初等行变换,化成⎢0⎥即可。而相应的
()N λ⎣⎦⎣⎦
初等矩阵的乘积,即是G (λ)。
例3-13 设D (λ)=⎢解:
3λ+1⎤⎡λ
,N (λ)=-1, λ2+2λ-1,求grcd R (λ). ⎥2
⎣-1λ+λ-2⎦
()
⎡0λ3+λ2+λ+11λ0⎤3λ+1100⎤⎡λ
⎡D (λ) ⎤⎢⎥⎥→⎢-122
E =-1λ+λ-2010λ+λ-2010⎢N (λ) ⎥⎢⎢⎥⎥
⎣⎦⎢-1λ2+2λ-1001⎥⎢0λ+10-11⎥⎣⎦⎣⎦
22
⎡1-λ-λ+2010⎤⎡1-λ-λ+2010⎤⎢⎥⎢⎥→⎢0λ+10-11⎥→⎢0λ+10-11⎥
22⎢0λ3+λ2+λ+11λ0⎥⎢001λ+λ+1-λ-1⎥⎣⎦⎣⎦
gcrd 的基本性质:
(1)不唯一性。若R (λ)是列数为n 的多项式矩阵N (λ), D (λ)的gcrd ,而W (λ)是任
一单模矩阵,则W (λ)R (λ)也是N (λ), D (λ)的gcrd 。
(2)若N (λ), D (λ)的gcrd 是满秩矩阵或单模矩阵,则其它的gcrd 皆为满秩矩阵或
单模矩阵。
(3)对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ),当rank ⎢
⎡D (λ)⎤
⎥=n 时,它()N λ⎣⎦
们所有的gcrd 都是满秩矩阵。
,N (λ)的一个gcrd ,则R (λ)可表示为(4)若R (λ)是n ⨯n 和m ⨯n 多项式矩阵D (λ)
R (λ)=X (λ)D (λ)+Y (λ)N (λ),这里X (λ)和Y (λ)分别是n ×n 和n ×m 多项式矩阵。
注:可以类似建立两个多项式矩阵的最大左公因子(gcld )的概念。
二、多项式矩阵的互质性
定义3-12 两个具有相同列数的多项式矩阵D (λ),N (λ)是右(左)互质的,是指它们
的最大右(左)公因子为单模矩阵。
定理3-14(贝佐特(Bezout )判别准则)两个n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ)为
右互质的充分必要条件,是存在两个n ⨯n 和m ⨯n 多项式矩阵X (λ)和Y (λ),使得下面的贝佐特等式成立:X (λ)D (λ)+Y (λ)N (λ)=E 。 3-14
证明:(1)必要性:设R (λ)是D (λ),N (λ)的一个gcrd 。由于D (λ),N (λ)为右互质,
所以R (λ)为单模矩阵。在式子R (λ)=X 1(λ)D (λ)+Y 1(λ)N (λ)两端同乘以R -1(λ)即得所证。
(2)充分性:将N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)代入3-14式,得
[X (λ)(λ)+Y (λ)(λ)]R (λ)=E ,即R (λ)是一个单模矩阵。□
定理3-15 两个n ⨯n 和m ⨯n 多项式矩阵D (λ)是矩,N (λ)为右互质的充分必要条件,
阵⎢
⎡E ⎤⎡D (λ)⎤
的Smith 标准形是;而两个m ⨯m 和m ⨯n 多项式矩阵A (λ),B (λ)为左互质⎢⎥⎥
⎣0⎦⎣N (λ)⎦
的充分必要条件,是矩阵(A (λ), B (λ))的Smith 标准形是(E , 0)。
,N (λ)为右互质的。则由构造定理,存在单模矩阵G (λ),证明:(1)必要性:设D (λ)
使得
⎡D (λ)⎤⎡R (λ)⎤⎡E ⎤G (λ)⎢=⎢=⎢⎥R (λ), ⎥⎥
⎣N (λ)⎦⎣0⎦⎣0⎦
且R (λ)也是单模矩阵。于是有
⎡D (λ)⎤-1⎡E ⎤
。 3-20 ()G (λ)⎢R λ=⎥⎢⎥
⎣N (λ)⎦⎣0⎦
⎡D (λ)⎤⎡R (λ)⎤
(2)充分性:由3-20式成立,即得G (λ)⎢⎥=⎢0⎥。
()N λ⎣⎦⎣⎦三、多项式矩阵的既约性
多项式矩阵的行次数和列次数:设M (λ)=m ij (λ)
1≤j ≤q
()
p ⨯q
,则M (λ)的第i 行次数是
K ri =max {deg (m ij (λ))},记为δri M (λ);第j 列次数是K cj =max {deg (m ij (λ))},记为
1≤i ≤p
δcj M (λ)。
⎡λ2+4λ+22λ2+5λλ+6⎤
例3-14 若M (λ) =⎢⎥,则有 3
λ-2λ4⎦⎣λ+3
K r 1=2,K r 2=3;K c 1=2,K c 2=3,K c 3=1。
M (λ)的列次表示式:M (λ)=M kc H c (λ)+M lc (λ),
这里H c (λ)=diag λ
{
K c 1
, λK c 2, , λ
K cq
},M
K cj
kc 为
p ⨯q 的数字矩阵,称为列次系数矩阵。
它的第j 列为M (λ)的第j 列中相应于λ阵,满足δcj M lc (λ)
的系数组成的列;M lc (λ)为低次剩余多项式矩
(j =1, 2, , q )。
⎡λ2+4λ+12λ2λ+4⎤
例3-15 设M (λ)=⎢⎥, 3
4λ-2λ3λ+1⎦⎣λ+3
⎡λ2
⎡101⎤⎢
M (λ) =⎢⎥⎢
⎣043⎦⎢
⎣
⎤2
4⎤⎥⎡4λ+12λ
+⎥⎢λ+3-2λ1⎥ ⎣⎦λ⎥⎦
K cj
则其列次表示式为
λ3
注:M (λ)的行列式表示:M (λ)=M kc λ∑
+次数低于
∑K
cj
的各项。
M (λ)的行次表示式:M (λ)=H r (λ)M kr +M lr (λ),
这里H r (λ)=diag λ
{
K r 1
, λK r 2, , λ
K rp
},M
K ri
hr
为p ⨯q 的数字矩阵,称为行次系数矩阵。
它的第i 行为M (λ)的第i 行中相应于λ
的系数组成的行;M lr (λ)为低次剩余多项式矩
阵,满足δri M lr (λ)
(i =1, 2, , p )。
K ri
注:M (λ)的行列式表示:M (λ)=M kr λ∑
+次数低于
∑K
ri
的各项。
定义3-13 设M (λ)为满秩p 阶多项式矩阵,如果
deg M (λ)=∑δcj M (λ)=∑K cj ,
j =1
j =1
p p
则称M (λ)是列既约的;如果deg M (λ)=
例3-16 设有满秩多项式矩阵
∑δ
i =1
p
ri
M (λ)=∑K ri ,则称M (λ)是行既约的。
i =1
p
⎡3λ2+2λ2λ+4⎤
M (λ)=⎢2⎥
7λ⎦⎣λ+λ-3
则有deg |M (λ) |=3,K c 1=2, K c 2=1,
∑K
j =1
2
cj
=3,K r 1=2, K r 2=2, ∑K ri =4
i =1
2
因此这个多项式矩阵是列既约的,但不是行既约的。
定理3-16 若M (λ)为满秩p 阶多项式矩阵,则 (1)M (λ)是列既约的充分必要条件是M kc 为满秩的; (2)M (λ)是行既约的充分必要条件是M kr 为满秩的。 证明 由于|M (λ) |=|M kc |⋅λ∑
K cj
+低次项
故当且仅当|M (λ) |≠0即M kc 为满秩时,始有deg |M (λ) |=亦即M (λ) 为列既约的。因而(1)得证。同理可证(2)。
∑K
cj
,
例3-17 对于例3-16的矩阵M (λ) ,可求得其列次表示及行次表示为:
⎡32⎤⎡λ2
列次表示M (λ) =⎢⎥⎢
⎣17⎦⎣0⎡λ2
行次表示M (λ) =⎢
⎣0
0⎤⎡2λ4⎤⎥+⎢⎥; λ⎦⎣λ-30⎦
0⎤⎡30⎤⎡2λ2λ+4⎤
+⎢⎥⎥2⎥⎢λ⎦⎣10⎦⎣λ-37λ⎦
⎡32⎤⎡30⎤
因此有M kc =⎢⎥,M kr =⎢10⎥
17⎣⎦⎣⎦
故由M kc 满秩知M (λ) 是列既约的,但因M kr 不是满秩的,故M (λ) 不是行既约的。 注:利用初等变换的方法,即右乘或左乘一个单模矩阵,可以将非既约多项式矩阵化
成既约的。
⎡(λ+2) 2(λ+3) 2
例3-18 设M (λ)=⎢
0⎣-(λ+2) 2(λ+3) ⎤
⎥,
λ+3⎦
则M (λ) 满秩但非既约。
⎡1(λ+2) 2⎤0⎤⎡1
取单模矩阵G (λ) =⎢⎥ ⎥,F (λ) =⎢0λ+311⎣⎦⎣⎦
而使得
及
⎡0
M (λ) G (λ) =⎢2
⎣(λ+3) -(λ+2) 2(λ+3) ⎤
⎥
λ+3⎦
0⎤
⎥ λ+3⎦
⎡(λ+2) 2(λ+3) 2
F (λ) M (λ)=⎢
0⎣
都是列既约的。
§6 有理分式矩阵的标准形及其仿分式分解
即
1.有理分式矩阵(简称为分式矩阵):矩阵G (λ)=g ij (λ)的元素都是有理分式,
m ⨯n
()
g ij (λ)=
a ij (λ)b ij λ, i =1, 2, , m , j =1, 2, , n
其中a ij (λ) 与b ij (λ) 都是λ的多项式。
注:有理分式组成的空间对于四则运算封闭,所以可以类似于数字矩阵那样定义有理分式矩阵的各种运算及概念。在这里矩阵可逆与矩阵满秩就是等价的概念。 2.有理分式矩阵的标准形
定理3-17 设有理分式矩阵G (λ)=g ij (λ)≠0的秩为r (≥1) ,则存在m ⨯m 及m ⨯n
()
n ⨯n 单模多项式矩阵P (λ)及Q (λ),使得
⎡T (λ)⎤
, P (λ)G (λ)Q (λ)=M (λ)=⎢⎥0⎦⎣
其中T (λ)=diag
⎛ϕ1(λ)ϕ(λ)⎫
,ϕi (λ), t i (λ)都是首一多项式,且满足条件: , , r ⎪⎪t r λ⎭⎝t 1λ1)t i (λ)和ϕi (λ)互质;2)ϕi (λ)|ϕi +1(λ);3)t i +1(λ)|t i (λ)。
注:M (λ)叫做G (λ)的史密斯—麦克米伦(Smith-Mcmillan )标准形。它的意义在于
为系统分析,特别是分析多变量系统的极点和零点提供了一种重要的工具。
证明:1)的证明:
(1)用G (λ)各元素的分母多项式的最小公倍式b (λ)乘以矩阵,得到多项式矩阵
b (λ)G (λ)。
(2)b (λ)G (λ)的秩为r ,所以存在m ⨯m 及n ⨯n 单模多项式矩阵P (λ)及Q (λ),可
把b (λ)G (λ)化为Smith 标准形:
⎡T (λ)⎤
, P (λ)(b (λ)G (λ))Q (λ)=⎢1
⎥0⎦⎣
这里T 1(λ)=diag (d 1(λ), , d r (λ)),而且d i (λ)|d i +1(λ)。于是
⎡T 1(λ)⎤⎥。 P (λ)G (λ)Q (λ)=⎢b λ⎢⎥
0⎦⎣
(3)把
ϕ(λ)d (λ)T 1(λ)中的每个分式i (i =1, , r )化成既约分式i (i =1, , r ),且
b λb λt i λϕi (λ)和t i (λ)都是首一多项式,即得
⎡T (λ) ⎤
。 P (λ)G (λ)Q (λ)=⎢⎥0⎦⎣
(2)及(3)的证明源于ϕi (λ)和t i (λ)的构造方式。□
说明:若有理分式的分子和分母没有公因子,则称这个有理分式是既约的。 例3-19 求有理分式矩阵的标准形
⎡1-λ⎢λ(λ+1) ⎢
1
G (λ)=⎢
⎢λ+1⎢λ2+1⎢
⎣λ(λ+1)
得
1⎤
λ+1λ+1⎥
⎥
11⎥
。 -
λ+1λ+1⎥λλ⎥
-⎥λ+1λ+1⎦
λ
解:将G (λ) 乘以其元素分母多项式的最小公倍式λ(λ+1)后,再化为Simith 标准形,
⎡1-λλ2
⎢
b (λ)G (λ)=⎢λλ
⎢λ2+1λ2⎣λ⎤⎡1⎤⎥⎥。 -λ⎥≅⎢λ⎢⎥2⎥-λ⎦⎢λ(λ+1) ⎥⎣⎦
⎡1
⎢λ(λ+1) ⎢
于是,G (λ)≅⎢
⎢⎢⎢⎣
⎤⎥⎥1⎥。 λ+1⎥
1⎥⎥⎦
3.有理分式矩阵的分解
定义3-14 设G (λ)是m ⨯n 有理分式矩阵。如果存在m ⨯m 满秩(多项式)矩阵P 1(λ)
和m ⨯n 多项式矩阵Q 1(λ),使得
-1G (λ)=P 1(λ)Q 1(λ) 3-26
则式3-26称为G (λ)的一个左分解,或G (λ)的一个左矩阵分式描述。当P 1(λ)和
Q 1(λ)为左互质时,式3-26称为G (λ)的一个左既约分解。
如果存在n ⨯n 满秩(多项式)矩阵P 2(λ)和m ⨯n 多项式矩阵Q 2(λ),使得
G (λ)=Q 2(λ)P 2-1(λ) 3-27
则3-27式称为G (λ)的一个右分解,或G (λ)的一个右矩阵分式描述。当P 2(λ)和Q 2(λ)为右互质时,3-27式称为G (λ)的一个右既约分解。
-1-1
注意 这里的P 1(λ) 与P 2是指有理分式范围内的逆。
定理3-18 任何m ⨯n 有理分式矩阵G (λ)都存在左分解、右分解、左既约分解及右
既约分解。
证明 证法一 思路源于定理3-17中G (λ)的标准形的构造过程。
⎡T 0(λ)⎤⎡ϕ(λ)⎤-1⎡T (λ)⎤-1-1
()()G (λ)=P -1(λ)⎢Q λ=P λQ (λ) ⎢⎥⎥⎢⎥E m -r ⎦⎣0⎦0⎦⎣⎣
-1
其中T 0(λ)=diag t 1(λ), , t r -1(λ),ϕ(λ)=diag ϕ1(λ), , ϕr (λ)。取
()
()
⎡T 0-1(λ)⎤⎡ϕ(λ)⎤-1
()P 1(λ)=⎢P λ,()Q λ=Q (λ), ⎥1⎢⎥E m -r ⎦0⎦⎣⎣
-1
就得到G (λ)的一个左分解G (λ)=P 1(λ)Q 1(λ)。
进一步地,令R (λ)是P 1(λ)和Q 1(λ)的最大左公因式,则有
P 1(λ)=R (λ)P (λ), Q 1(λ)=R (λ)Q (λ)。
即有P (λ)和Q (λ)是左互质的。由于R (λ)可逆,得G (λ)=P 1□ 有理分式矩阵的左、右分解是不唯一的。 说明左、右分解的存在性可使用下列证法。
证法二 对m ⨯n 有理分式矩阵G (λ) ,记第i 行分母的最小公倍式为b i (λ) ,则
-1
(λ)Q 1(λ)=P -1(λ)Q (λ)。
b i (λ) ≠0(i =1, 2, , m )。取P {b 1(λ), , b m (λ)},则P 1(λ) 满秩,1(λ) =diag
-1Q 1(λ) =P 1(λ) G (λ) 为多项式矩阵,从而有G (λ) =P 1(λ) Q 1(λ) 为一个左分解。
同理,可证右分解的存在性。 例3-20 求传递函数矩阵
s +1⎡
⎢(s +2) 2(s +3) 2
G (s )=⎢
⎢-s +1⎢(s +3) 2⎣
的一个右分解及一个左分解。
解 容易求出G (s ) 的列最小公分母依次为
s ⎤
(s +3) 2⎥
⎥ s ⎥-
(s +3) 2⎥⎦
d c 1(s ) =(s +2) 2(s +3) 2,d c 2(s ) =(s +3) 2
因此得G (s ) 的一个右分解
s +1⎡
G (s )=⎢22
()()-s +1s +2⎣
又G (s ) 的行的最小公分母为
s ⎤⎡(s +2)2(s +3)2
⎢-s ⎥⎦⎣
⎤
2⎥
(s +3)⎦
-1
d r 1(s ) =(s +2) 2(s +3) 2,d r 2(s ) =(s +3) 2
所以G (s ) 的一个左分解为
⎡(s +2)2(s +3)2
G (s ) =⎢
⎣2
⎤⎡s +1s (s +2)⎤
⎥ 2⎥⎢
(s +3)⎦⎣-(s +1)-s ⎦
-1
§8 舒尔定理和矩阵的QR 分解
一、舒尔定理
定理3-19(舒尔定理)对于A ∈C
n ⨯n
,存在酉矩阵U ,使得U
H
AU =T 。这里T 是
上三角矩阵,且对角线上的元素都是A 的特征值。
证明:设A 的特征值为λ1, λ2, , λn 。
(1)设ε1为A 的属于特征值λ1的单位特征向量。把ε1扩充为C 的一组标准正交基
n
ε1, η2, , ηn ,并设酉矩阵U 1=(ε1, η2, , ηn ) 。则
⎡1T ⎤⎢⎥T
⎡λ⎢2⎥H
U 1AU 1=⎢⎥(λ1ε1, A η2, , A ηn )=⎢1
⎣0⎢ ⎥
⎢T ⎥⎣n ⎦
*⎤。 ⎥A 1⎦
由于相似矩阵具有相同的特征值,所以A 1的特征值是λ2, , λn 。
(2)设ε2∈C n -1为A 1的属于特征值λ2的单位特征向量。重复(1)的步骤,可得,
存在n -1阶酉矩阵V 2,使得
V 2H
⎡1⎣
⎡λ2
A 1V 2=⎢
⎣0*⎤
。 A 2⎥⎦
令U 2=⎢
⎤
,则U 2和U 1U 2都是n 阶酉矩阵,并且 ⎥V 2⎦
⎡λ1
H H U 2U 1AU 1U 2=⎢⎢
⎢⎣
λ2
*⎤
⎥。 ⎥A 2⎥⎦
(3)继续重复过程(2)n -3次,可以依次得到n -k (k =2, 3, , n -2) 阶的酉矩阵V k
及相应的n 阶酉矩阵U k ,并令U =U 1 U n -1,即得所证。□
注1 若A 是实矩阵,且A 的特征值恰好全为实数时,则特征向量可选为实向量,而
上述步骤可以在实数域内进行,因而U 可选为(实)正交矩阵。 注2 舒尔定理可概括为任一复方阵可酉相似于上三角矩阵。类似地有,任一复方阵可酉相似于下三角矩阵。 注3 定理中的酉矩阵和上三角矩阵不是唯一的。这是因为单位特征向量的选择不唯一。
n ⨯n
定理3-20 ∀ε>0,对于A ∈C ,存在可逆矩阵P ,使得
⎡λ1b 12 b 1n ⎤
⎢λ2 b 2n ⎥-1⎥, P AP =⎢0 ⎢⎥⎢λn ⎥⎣⎦
而且
i , j =∑b ij
n
证明:由舒尔定理,知存在酉矩阵Q ,使得
⎡λ1⎢
-1
Q AQ =⎢
⎢0⎢⎣
ρ12 ρ1n ⎤λ2 ρ2n ⎥
⎥。 ⎥λn ⎥⎦
令F =diag r , r 2, , r n ,其中r 为非零常数。取T =QF ,即有
()
⎡λ1
⎢
-1-1⎢T AT =F
⎢0⎢⎣
ρ12 ρ1n ⎤λ2 ρ2n ⎥
⎡λ1⎢⎥F =⎢ ⎥⎢0
⎢
λn ⎥⎦⎢⎣r ρ12 r n -1ρ1n ⎤
⎥
λ2 r n -1ρ2n ⎥
。 ⎥
⎥λn ⎥⎦
选取适当地r ,即得定理的结论。□
二、矩阵的正交三角(QR )分解
定理3-21(QR 分解定理)设A 为n 阶复数矩阵,则存在酉矩阵Q 及上三角矩阵R ,
使得A =QR 。
证明:得到矩阵A 的QR 分解的方法,类似于施密特正交化过程。 (1)设A =(α1, α2, , αn )。
若α1=0,则取β1=0;若α1≠0,则取β1=
α1
。 1
γ2
。 γ2
γ2=α2-(α2, β1)β1。若γ2=0,则取β2=0;若γ2≠0,则取β2=
若γ3=0,则取β3=0;若β3≠0,则取β3=γ3=α3-(α3, β1)β1-(α3, β2)β2。………………………………………………
γ3
。 γ3
γn =αn -∑(αn , βi )βi 。若γn =0,则取βn =0;若γn ≠0,则取βn =
i =1
n -1
γn
。 n
β1, β2, , βn 两两正交,并且或者为单位向量,或者为零向量。
(2)反过来,有
α1=r 11β1,
当α1=0时,r 11=0;当α1≠0时,r 11=1。
α2=r 12β1+r 22β2,
当β1=0时,r 12=0;当β2=0时,r 22=0;当β2≠0时,r 22=
………………………………………………
β2。
αn =r 1n β1+r 2n β2+ +r nn βn ,
当βi =0时,r in =0, (i =1, , n -1);当βn =0时,r nn =0;当βn ≠0时,r nn =
于是
βn 。
⎡r 11
⎢
A =(α1, α2, , αn )=(β1, β2, , βn )⎢
⎢⎢⎣
r 12r 22
r 1n ⎤ r 2n ⎥⎥=Q R 。
1
⎥
⎥r nn ⎦
n
(3)取出Q 1中的所有非零列向量βi 1, βi 2, , βi s ,将其扩充为C 中的一组标准正交
基βi 1, βi 2, , βi s , η1, , ηn -s 。将ηi (i =1, , n -s )取代Q 1中出现的第i 个零列向量,产生矩阵Q ,则Q 是酉矩阵。注意到若βi =0,则R 中第i 个行向量为0,所以QR =Q 1R 。定理得证。□
注:当A 是可逆矩阵时,R 的对角线上的元素都是正的。此时的Q 和R 是唯一的。
§9 矩阵的奇异值分解
定理1 设A ∈C
m ⨯n
,则存在酉矩阵P 和Q ,使得
⎡D 0⎤
。 P H AQ =⎢⎥
⎣00⎦
这里D =diag (d 1, d 2, , d r ),且d 1≥d 2≥ ≥d r >0。d i (i =1, 2, , r )是A A 的正
H
特征值的平方根,称为A 的奇异值。而
⎡D 0⎤H
A =P ⎢Q ⎥
⎣00⎦
称为A 的奇异值分解。
证明:(1)矩阵B =A A 是Hermite 矩阵,且特征值非负。
设x 是A A 的属于特征值λ的特征向量,则(Ax , Ax )=x H A H Ax =λx H x ≥0,而
H
H
x H x =(x , x )>0,所以λ≥0。
(2)寻找Q
222设A A 的特征值为d 1,其中d 1≥d 2≥ ≥d r >0,其余皆为零。 , d 2, , d n
H
由于A A 是Hermite 矩阵,所以存在n 阶酉矩阵Q ,使得
H
Q
H
(
⎡D 2
A A Q =⎢
⎢⎣0
H
)
0⎤
⎥。 (1) 0⎥⎦
n ⨯r n ⨯(n -r )将Q 分块为Q =[Q 1 Q 2],Q 1∈C r 。将(1)式写成 , Q 2∈C n -r
(
2
则有A H AQ =Q D , 11H 注意到Q 1Q 1
⎡D 2
A A Q =Q ⎢
⎢⎣0
H
)
0⎤
⎥, 0⎥⎦
(2) A H AQ 2=0。
=
H H
E r ,所以有Q 1A AQ 1
=D ,或写成AQ 1D
2
(
-1H
)(AQ D )=E
1
-1
r 。
H H
由(2)中的第二式,得Q 2A AQ 2=0,即AQ 2=0。
(3)寻找P
-1H
令P ,则=AQ D P 1的r 个列是两两正交的单位向量,记做111P 1=E r ,即P
m P 的标准正交基,记增添的向量为1=(p 1, p 2, , p r )。将p 1, p 2, , p r 扩充为C
p r +1, , p m ,构造矩阵P 2=(p r +1, , p m ),则P =(P 1 P 2)是m 阶酉矩阵,于是可得
H ⎤⎡P ⎡D 0⎤1P AQ =P (AQ 1 AQ 2)=⎢H ⎥(P 1D , 0)=⎢⎥。□
00⎢⎣⎦⎣P 2⎥⎦H
H
注:A 的奇异值由A 唯一确定,但P 和Q 一般不是唯一的。
⎡101⎤
⎢⎥例 求矩阵A =011的奇异值分解。 ⎢⎥⎢⎣000⎥⎦
⎡1⎤
⎢⎥H
解 B =A A 的特征值为3,1,0,对应的特征向量分别为1, ⎢⎥
⎢⎣2⎥⎦
⎡1⎤
⎢-1⎥, ⎢⎥⎢⎣0⎥⎦
⎡1⎤
⎢1⎥。 ⎢⎥⎢⎣-1⎥⎦
⎡3⎤
Rank A =2,D =⎢⎥。
1⎦⎣
⎡
⎢⎢Q =⎢
⎢⎢⎢⎣
161626
-
12120
1⎤⎥3⎥1⎥
。 ⎥31⎥-⎥3⎦
-1
P 1=AQ 1D
⎡
⎢⎢=⎢⎢⎢⎢⎣
12120
1⎤⎡
⎢2⎥0⎡⎤⎥⎢
1⎥⎢⎥,P 2=0,P =⎢-⎢⎥⎢2⎥
⎢⎥1⎢⎣⎦0⎥
⎥⎢⎦⎣
12
120
-
12102
⎤0⎥⎥0⎥。 ⎥1⎥⎥⎦
§5 多项式矩阵的互质性与既约性
一、多项式矩阵的最大公因子
定义3-10 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一个
右公因子,如果存在多项式矩阵(λ) 和(λ) 使得:
N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)。
类似地可以定义左公因子。
定义3-11 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一
个最大右公因子(记为gcrd ),如果:
(1)R (λ)是N (λ), D (λ)的右公因子;
(2)N (λ), D (λ)的任一右公因子R 1(λ),都是R (λ)的右乘因子,即存在多项式矩阵
W (λ),使得R (λ)=W (λ)R 1(λ)。
对任意的n ⨯n 与m ⨯n 的多项式矩阵D (λ) 与N (λ) ,它们的gcrd 都存在。因为
R (λ) =(D T (λ), N T (λ)) T
便是一个。
定理3-13 (gcrd的构造定理) 对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ),如果能找到一个(n +m ) ⨯(n +m ) 的单模矩阵G (λ),使得
⎡D (λ)⎤⎡G 11(λ)G 12(λ)⎤⎡D (λ)⎤⎡R (λ)⎤
3-13 G (λ)⎢=⎢=⎢⎥⎥⎢⎥⎥
⎣N (λ)⎦⎣G 21(λ)G 22(λ)⎦⎣N (λ)⎦⎣0⎦
则n ⨯n 多项式矩阵R (λ),即为N (λ)和D (λ)的gcrd 。
证明:(1)证明R (λ)是右公因子。
设G -1(λ)=⎢
⎡F 11(λ)F 12(λ)⎤⎡D (λ)⎤⎡F 11(λ)F 12(λ)⎤⎡R (λ)⎤⎡F 11(λ)R (λ)⎤
,则。 =⎢=⎢⎥⎥⎥⎢⎥⎢⎥
⎣N (λ)⎦⎣F 21(λ)F 22(λ)⎦⎣0⎦⎣F 21(λ)R (λ)⎦⎣F 21(λ)F 22(λ)⎦
(2)证明R (λ)是gcrd 。
设R 1(λ)也是N (λ), D (λ)的右公因子,故有
N (λ)=N 1(λ)R 1(λ), D (λ)=D 1(λ)R 1(λ)。由3-13式,
R (λ)=G 11(λ)D (λ)+G 12(λ)N (λ)
=[G 11(λ)D 1(λ)+G 12(λ)N 1(λ)]R 1(λ)=W (λ)R 1(λ)
□
⎡D (λ)⎤⎡R (λ)⎤
gcrd 的求法:对矩阵M (λ)=⎢⎥进行初等行变换,化成⎢0⎥即可。而相应的
()N λ⎣⎦⎣⎦
初等矩阵的乘积,即是G (λ)。
例3-13 设D (λ)=⎢解:
3λ+1⎤⎡λ
,N (λ)=-1, λ2+2λ-1,求grcd R (λ). ⎥2
⎣-1λ+λ-2⎦
()
⎡0λ3+λ2+λ+11λ0⎤3λ+1100⎤⎡λ
⎡D (λ) ⎤⎢⎥⎥→⎢-122
E =-1λ+λ-2010λ+λ-2010⎢N (λ) ⎥⎢⎢⎥⎥
⎣⎦⎢-1λ2+2λ-1001⎥⎢0λ+10-11⎥⎣⎦⎣⎦
22
⎡1-λ-λ+2010⎤⎡1-λ-λ+2010⎤⎢⎥⎢⎥→⎢0λ+10-11⎥→⎢0λ+10-11⎥
22⎢0λ3+λ2+λ+11λ0⎥⎢001λ+λ+1-λ-1⎥⎣⎦⎣⎦
gcrd 的基本性质:
(1)不唯一性。若R (λ)是列数为n 的多项式矩阵N (λ), D (λ)的gcrd ,而W (λ)是任
一单模矩阵,则W (λ)R (λ)也是N (λ), D (λ)的gcrd 。
(2)若N (λ), D (λ)的gcrd 是满秩矩阵或单模矩阵,则其它的gcrd 皆为满秩矩阵或
单模矩阵。
(3)对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ),当rank ⎢
⎡D (λ)⎤
⎥=n 时,它()N λ⎣⎦
们所有的gcrd 都是满秩矩阵。
,N (λ)的一个gcrd ,则R (λ)可表示为(4)若R (λ)是n ⨯n 和m ⨯n 多项式矩阵D (λ)
R (λ)=X (λ)D (λ)+Y (λ)N (λ),这里X (λ)和Y (λ)分别是n ×n 和n ×m 多项式矩阵。
注:可以类似建立两个多项式矩阵的最大左公因子(gcld )的概念。
二、多项式矩阵的互质性
定义3-12 两个具有相同列数的多项式矩阵D (λ),N (λ)是右(左)互质的,是指它们
的最大右(左)公因子为单模矩阵。
定理3-14(贝佐特(Bezout )判别准则)两个n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ)为
右互质的充分必要条件,是存在两个n ⨯n 和m ⨯n 多项式矩阵X (λ)和Y (λ),使得下面的贝佐特等式成立:X (λ)D (λ)+Y (λ)N (λ)=E 。 3-14
证明:(1)必要性:设R (λ)是D (λ),N (λ)的一个gcrd 。由于D (λ),N (λ)为右互质,
所以R (λ)为单模矩阵。在式子R (λ)=X 1(λ)D (λ)+Y 1(λ)N (λ)两端同乘以R -1(λ)即得所证。
(2)充分性:将N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)代入3-14式,得
[X (λ)(λ)+Y (λ)(λ)]R (λ)=E ,即R (λ)是一个单模矩阵。□
定理3-15 两个n ⨯n 和m ⨯n 多项式矩阵D (λ)是矩,N (λ)为右互质的充分必要条件,
阵⎢
⎡E ⎤⎡D (λ)⎤
的Smith 标准形是;而两个m ⨯m 和m ⨯n 多项式矩阵A (λ),B (λ)为左互质⎢⎥⎥
⎣0⎦⎣N (λ)⎦
的充分必要条件,是矩阵(A (λ), B (λ))的Smith 标准形是(E , 0)。
,N (λ)为右互质的。则由构造定理,存在单模矩阵G (λ),证明:(1)必要性:设D (λ)
使得
⎡D (λ)⎤⎡R (λ)⎤⎡E ⎤G (λ)⎢=⎢=⎢⎥R (λ), ⎥⎥
⎣N (λ)⎦⎣0⎦⎣0⎦
且R (λ)也是单模矩阵。于是有
⎡D (λ)⎤-1⎡E ⎤
。 3-20 ()G (λ)⎢R λ=⎥⎢⎥
⎣N (λ)⎦⎣0⎦
⎡D (λ)⎤⎡R (λ)⎤
(2)充分性:由3-20式成立,即得G (λ)⎢⎥=⎢0⎥。
()N λ⎣⎦⎣⎦三、多项式矩阵的既约性
多项式矩阵的行次数和列次数:设M (λ)=m ij (λ)
1≤j ≤q
()
p ⨯q
,则M (λ)的第i 行次数是
K ri =max {deg (m ij (λ))},记为δri M (λ);第j 列次数是K cj =max {deg (m ij (λ))},记为
1≤i ≤p
δcj M (λ)。
⎡λ2+4λ+22λ2+5λλ+6⎤
例3-14 若M (λ) =⎢⎥,则有 3
λ-2λ4⎦⎣λ+3
K r 1=2,K r 2=3;K c 1=2,K c 2=3,K c 3=1。
M (λ)的列次表示式:M (λ)=M kc H c (λ)+M lc (λ),
这里H c (λ)=diag λ
{
K c 1
, λK c 2, , λ
K cq
},M
K cj
kc 为
p ⨯q 的数字矩阵,称为列次系数矩阵。
它的第j 列为M (λ)的第j 列中相应于λ阵,满足δcj M lc (λ)
的系数组成的列;M lc (λ)为低次剩余多项式矩
(j =1, 2, , q )。
⎡λ2+4λ+12λ2λ+4⎤
例3-15 设M (λ)=⎢⎥, 3
4λ-2λ3λ+1⎦⎣λ+3
⎡λ2
⎡101⎤⎢
M (λ) =⎢⎥⎢
⎣043⎦⎢
⎣
⎤2
4⎤⎥⎡4λ+12λ
+⎥⎢λ+3-2λ1⎥ ⎣⎦λ⎥⎦
K cj
则其列次表示式为
λ3
注:M (λ)的行列式表示:M (λ)=M kc λ∑
+次数低于
∑K
cj
的各项。
M (λ)的行次表示式:M (λ)=H r (λ)M kr +M lr (λ),
这里H r (λ)=diag λ
{
K r 1
, λK r 2, , λ
K rp
},M
K ri
hr
为p ⨯q 的数字矩阵,称为行次系数矩阵。
它的第i 行为M (λ)的第i 行中相应于λ
的系数组成的行;M lr (λ)为低次剩余多项式矩
阵,满足δri M lr (λ)
(i =1, 2, , p )。
K ri
注:M (λ)的行列式表示:M (λ)=M kr λ∑
+次数低于
∑K
ri
的各项。
定义3-13 设M (λ)为满秩p 阶多项式矩阵,如果
deg M (λ)=∑δcj M (λ)=∑K cj ,
j =1
j =1
p p
则称M (λ)是列既约的;如果deg M (λ)=
例3-16 设有满秩多项式矩阵
∑δ
i =1
p
ri
M (λ)=∑K ri ,则称M (λ)是行既约的。
i =1
p
⎡3λ2+2λ2λ+4⎤
M (λ)=⎢2⎥
7λ⎦⎣λ+λ-3
则有deg |M (λ) |=3,K c 1=2, K c 2=1,
∑K
j =1
2
cj
=3,K r 1=2, K r 2=2, ∑K ri =4
i =1
2
因此这个多项式矩阵是列既约的,但不是行既约的。
定理3-16 若M (λ)为满秩p 阶多项式矩阵,则 (1)M (λ)是列既约的充分必要条件是M kc 为满秩的; (2)M (λ)是行既约的充分必要条件是M kr 为满秩的。 证明 由于|M (λ) |=|M kc |⋅λ∑
K cj
+低次项
故当且仅当|M (λ) |≠0即M kc 为满秩时,始有deg |M (λ) |=亦即M (λ) 为列既约的。因而(1)得证。同理可证(2)。
∑K
cj
,
例3-17 对于例3-16的矩阵M (λ) ,可求得其列次表示及行次表示为:
⎡32⎤⎡λ2
列次表示M (λ) =⎢⎥⎢
⎣17⎦⎣0⎡λ2
行次表示M (λ) =⎢
⎣0
0⎤⎡2λ4⎤⎥+⎢⎥; λ⎦⎣λ-30⎦
0⎤⎡30⎤⎡2λ2λ+4⎤
+⎢⎥⎥2⎥⎢λ⎦⎣10⎦⎣λ-37λ⎦
⎡32⎤⎡30⎤
因此有M kc =⎢⎥,M kr =⎢10⎥
17⎣⎦⎣⎦
故由M kc 满秩知M (λ) 是列既约的,但因M kr 不是满秩的,故M (λ) 不是行既约的。 注:利用初等变换的方法,即右乘或左乘一个单模矩阵,可以将非既约多项式矩阵化
成既约的。
⎡(λ+2) 2(λ+3) 2
例3-18 设M (λ)=⎢
0⎣-(λ+2) 2(λ+3) ⎤
⎥,
λ+3⎦
则M (λ) 满秩但非既约。
⎡1(λ+2) 2⎤0⎤⎡1
取单模矩阵G (λ) =⎢⎥ ⎥,F (λ) =⎢0λ+311⎣⎦⎣⎦
而使得
及
⎡0
M (λ) G (λ) =⎢2
⎣(λ+3) -(λ+2) 2(λ+3) ⎤
⎥
λ+3⎦
0⎤
⎥ λ+3⎦
⎡(λ+2) 2(λ+3) 2
F (λ) M (λ)=⎢
0⎣
都是列既约的。
§6 有理分式矩阵的标准形及其仿分式分解
即
1.有理分式矩阵(简称为分式矩阵):矩阵G (λ)=g ij (λ)的元素都是有理分式,
m ⨯n
()
g ij (λ)=
a ij (λ)b ij λ, i =1, 2, , m , j =1, 2, , n
其中a ij (λ) 与b ij (λ) 都是λ的多项式。
注:有理分式组成的空间对于四则运算封闭,所以可以类似于数字矩阵那样定义有理分式矩阵的各种运算及概念。在这里矩阵可逆与矩阵满秩就是等价的概念。 2.有理分式矩阵的标准形
定理3-17 设有理分式矩阵G (λ)=g ij (λ)≠0的秩为r (≥1) ,则存在m ⨯m 及m ⨯n
()
n ⨯n 单模多项式矩阵P (λ)及Q (λ),使得
⎡T (λ)⎤
, P (λ)G (λ)Q (λ)=M (λ)=⎢⎥0⎦⎣
其中T (λ)=diag
⎛ϕ1(λ)ϕ(λ)⎫
,ϕi (λ), t i (λ)都是首一多项式,且满足条件: , , r ⎪⎪t r λ⎭⎝t 1λ1)t i (λ)和ϕi (λ)互质;2)ϕi (λ)|ϕi +1(λ);3)t i +1(λ)|t i (λ)。
注:M (λ)叫做G (λ)的史密斯—麦克米伦(Smith-Mcmillan )标准形。它的意义在于
为系统分析,特别是分析多变量系统的极点和零点提供了一种重要的工具。
证明:1)的证明:
(1)用G (λ)各元素的分母多项式的最小公倍式b (λ)乘以矩阵,得到多项式矩阵
b (λ)G (λ)。
(2)b (λ)G (λ)的秩为r ,所以存在m ⨯m 及n ⨯n 单模多项式矩阵P (λ)及Q (λ),可
把b (λ)G (λ)化为Smith 标准形:
⎡T (λ)⎤
, P (λ)(b (λ)G (λ))Q (λ)=⎢1
⎥0⎦⎣
这里T 1(λ)=diag (d 1(λ), , d r (λ)),而且d i (λ)|d i +1(λ)。于是
⎡T 1(λ)⎤⎥。 P (λ)G (λ)Q (λ)=⎢b λ⎢⎥
0⎦⎣
(3)把
ϕ(λ)d (λ)T 1(λ)中的每个分式i (i =1, , r )化成既约分式i (i =1, , r ),且
b λb λt i λϕi (λ)和t i (λ)都是首一多项式,即得
⎡T (λ) ⎤
。 P (λ)G (λ)Q (λ)=⎢⎥0⎦⎣
(2)及(3)的证明源于ϕi (λ)和t i (λ)的构造方式。□
说明:若有理分式的分子和分母没有公因子,则称这个有理分式是既约的。 例3-19 求有理分式矩阵的标准形
⎡1-λ⎢λ(λ+1) ⎢
1
G (λ)=⎢
⎢λ+1⎢λ2+1⎢
⎣λ(λ+1)
得
1⎤
λ+1λ+1⎥
⎥
11⎥
。 -
λ+1λ+1⎥λλ⎥
-⎥λ+1λ+1⎦
λ
解:将G (λ) 乘以其元素分母多项式的最小公倍式λ(λ+1)后,再化为Simith 标准形,
⎡1-λλ2
⎢
b (λ)G (λ)=⎢λλ
⎢λ2+1λ2⎣λ⎤⎡1⎤⎥⎥。 -λ⎥≅⎢λ⎢⎥2⎥-λ⎦⎢λ(λ+1) ⎥⎣⎦
⎡1
⎢λ(λ+1) ⎢
于是,G (λ)≅⎢
⎢⎢⎢⎣
⎤⎥⎥1⎥。 λ+1⎥
1⎥⎥⎦
3.有理分式矩阵的分解
定义3-14 设G (λ)是m ⨯n 有理分式矩阵。如果存在m ⨯m 满秩(多项式)矩阵P 1(λ)
和m ⨯n 多项式矩阵Q 1(λ),使得
-1G (λ)=P 1(λ)Q 1(λ) 3-26
则式3-26称为G (λ)的一个左分解,或G (λ)的一个左矩阵分式描述。当P 1(λ)和
Q 1(λ)为左互质时,式3-26称为G (λ)的一个左既约分解。
如果存在n ⨯n 满秩(多项式)矩阵P 2(λ)和m ⨯n 多项式矩阵Q 2(λ),使得
G (λ)=Q 2(λ)P 2-1(λ) 3-27
则3-27式称为G (λ)的一个右分解,或G (λ)的一个右矩阵分式描述。当P 2(λ)和Q 2(λ)为右互质时,3-27式称为G (λ)的一个右既约分解。
-1-1
注意 这里的P 1(λ) 与P 2是指有理分式范围内的逆。
定理3-18 任何m ⨯n 有理分式矩阵G (λ)都存在左分解、右分解、左既约分解及右
既约分解。
证明 证法一 思路源于定理3-17中G (λ)的标准形的构造过程。
⎡T 0(λ)⎤⎡ϕ(λ)⎤-1⎡T (λ)⎤-1-1
()()G (λ)=P -1(λ)⎢Q λ=P λQ (λ) ⎢⎥⎥⎢⎥E m -r ⎦⎣0⎦0⎦⎣⎣
-1
其中T 0(λ)=diag t 1(λ), , t r -1(λ),ϕ(λ)=diag ϕ1(λ), , ϕr (λ)。取
()
()
⎡T 0-1(λ)⎤⎡ϕ(λ)⎤-1
()P 1(λ)=⎢P λ,()Q λ=Q (λ), ⎥1⎢⎥E m -r ⎦0⎦⎣⎣
-1
就得到G (λ)的一个左分解G (λ)=P 1(λ)Q 1(λ)。
进一步地,令R (λ)是P 1(λ)和Q 1(λ)的最大左公因式,则有
P 1(λ)=R (λ)P (λ), Q 1(λ)=R (λ)Q (λ)。
即有P (λ)和Q (λ)是左互质的。由于R (λ)可逆,得G (λ)=P 1□ 有理分式矩阵的左、右分解是不唯一的。 说明左、右分解的存在性可使用下列证法。
证法二 对m ⨯n 有理分式矩阵G (λ) ,记第i 行分母的最小公倍式为b i (λ) ,则
-1
(λ)Q 1(λ)=P -1(λ)Q (λ)。
b i (λ) ≠0(i =1, 2, , m )。取P {b 1(λ), , b m (λ)},则P 1(λ) 满秩,1(λ) =diag
-1Q 1(λ) =P 1(λ) G (λ) 为多项式矩阵,从而有G (λ) =P 1(λ) Q 1(λ) 为一个左分解。
同理,可证右分解的存在性。 例3-20 求传递函数矩阵
s +1⎡
⎢(s +2) 2(s +3) 2
G (s )=⎢
⎢-s +1⎢(s +3) 2⎣
的一个右分解及一个左分解。
解 容易求出G (s ) 的列最小公分母依次为
s ⎤
(s +3) 2⎥
⎥ s ⎥-
(s +3) 2⎥⎦
d c 1(s ) =(s +2) 2(s +3) 2,d c 2(s ) =(s +3) 2
因此得G (s ) 的一个右分解
s +1⎡
G (s )=⎢22
()()-s +1s +2⎣
又G (s ) 的行的最小公分母为
s ⎤⎡(s +2)2(s +3)2
⎢-s ⎥⎦⎣
⎤
2⎥
(s +3)⎦
-1
d r 1(s ) =(s +2) 2(s +3) 2,d r 2(s ) =(s +3) 2
所以G (s ) 的一个左分解为
⎡(s +2)2(s +3)2
G (s ) =⎢
⎣2
⎤⎡s +1s (s +2)⎤
⎥ 2⎥⎢
(s +3)⎦⎣-(s +1)-s ⎦
-1
§8 舒尔定理和矩阵的QR 分解
一、舒尔定理
定理3-19(舒尔定理)对于A ∈C
n ⨯n
,存在酉矩阵U ,使得U
H
AU =T 。这里T 是
上三角矩阵,且对角线上的元素都是A 的特征值。
证明:设A 的特征值为λ1, λ2, , λn 。
(1)设ε1为A 的属于特征值λ1的单位特征向量。把ε1扩充为C 的一组标准正交基
n
ε1, η2, , ηn ,并设酉矩阵U 1=(ε1, η2, , ηn ) 。则
⎡1T ⎤⎢⎥T
⎡λ⎢2⎥H
U 1AU 1=⎢⎥(λ1ε1, A η2, , A ηn )=⎢1
⎣0⎢ ⎥
⎢T ⎥⎣n ⎦
*⎤。 ⎥A 1⎦
由于相似矩阵具有相同的特征值,所以A 1的特征值是λ2, , λn 。
(2)设ε2∈C n -1为A 1的属于特征值λ2的单位特征向量。重复(1)的步骤,可得,
存在n -1阶酉矩阵V 2,使得
V 2H
⎡1⎣
⎡λ2
A 1V 2=⎢
⎣0*⎤
。 A 2⎥⎦
令U 2=⎢
⎤
,则U 2和U 1U 2都是n 阶酉矩阵,并且 ⎥V 2⎦
⎡λ1
H H U 2U 1AU 1U 2=⎢⎢
⎢⎣
λ2
*⎤
⎥。 ⎥A 2⎥⎦
(3)继续重复过程(2)n -3次,可以依次得到n -k (k =2, 3, , n -2) 阶的酉矩阵V k
及相应的n 阶酉矩阵U k ,并令U =U 1 U n -1,即得所证。□
注1 若A 是实矩阵,且A 的特征值恰好全为实数时,则特征向量可选为实向量,而
上述步骤可以在实数域内进行,因而U 可选为(实)正交矩阵。 注2 舒尔定理可概括为任一复方阵可酉相似于上三角矩阵。类似地有,任一复方阵可酉相似于下三角矩阵。 注3 定理中的酉矩阵和上三角矩阵不是唯一的。这是因为单位特征向量的选择不唯一。
n ⨯n
定理3-20 ∀ε>0,对于A ∈C ,存在可逆矩阵P ,使得
⎡λ1b 12 b 1n ⎤
⎢λ2 b 2n ⎥-1⎥, P AP =⎢0 ⎢⎥⎢λn ⎥⎣⎦
而且
i , j =∑b ij
n
证明:由舒尔定理,知存在酉矩阵Q ,使得
⎡λ1⎢
-1
Q AQ =⎢
⎢0⎢⎣
ρ12 ρ1n ⎤λ2 ρ2n ⎥
⎥。 ⎥λn ⎥⎦
令F =diag r , r 2, , r n ,其中r 为非零常数。取T =QF ,即有
()
⎡λ1
⎢
-1-1⎢T AT =F
⎢0⎢⎣
ρ12 ρ1n ⎤λ2 ρ2n ⎥
⎡λ1⎢⎥F =⎢ ⎥⎢0
⎢
λn ⎥⎦⎢⎣r ρ12 r n -1ρ1n ⎤
⎥
λ2 r n -1ρ2n ⎥
。 ⎥
⎥λn ⎥⎦
选取适当地r ,即得定理的结论。□
二、矩阵的正交三角(QR )分解
定理3-21(QR 分解定理)设A 为n 阶复数矩阵,则存在酉矩阵Q 及上三角矩阵R ,
使得A =QR 。
证明:得到矩阵A 的QR 分解的方法,类似于施密特正交化过程。 (1)设A =(α1, α2, , αn )。
若α1=0,则取β1=0;若α1≠0,则取β1=
α1
。 1
γ2
。 γ2
γ2=α2-(α2, β1)β1。若γ2=0,则取β2=0;若γ2≠0,则取β2=
若γ3=0,则取β3=0;若β3≠0,则取β3=γ3=α3-(α3, β1)β1-(α3, β2)β2。………………………………………………
γ3
。 γ3
γn =αn -∑(αn , βi )βi 。若γn =0,则取βn =0;若γn ≠0,则取βn =
i =1
n -1
γn
。 n
β1, β2, , βn 两两正交,并且或者为单位向量,或者为零向量。
(2)反过来,有
α1=r 11β1,
当α1=0时,r 11=0;当α1≠0时,r 11=1。
α2=r 12β1+r 22β2,
当β1=0时,r 12=0;当β2=0时,r 22=0;当β2≠0时,r 22=
………………………………………………
β2。
αn =r 1n β1+r 2n β2+ +r nn βn ,
当βi =0时,r in =0, (i =1, , n -1);当βn =0时,r nn =0;当βn ≠0时,r nn =
于是
βn 。
⎡r 11
⎢
A =(α1, α2, , αn )=(β1, β2, , βn )⎢
⎢⎢⎣
r 12r 22
r 1n ⎤ r 2n ⎥⎥=Q R 。
1
⎥
⎥r nn ⎦
n
(3)取出Q 1中的所有非零列向量βi 1, βi 2, , βi s ,将其扩充为C 中的一组标准正交
基βi 1, βi 2, , βi s , η1, , ηn -s 。将ηi (i =1, , n -s )取代Q 1中出现的第i 个零列向量,产生矩阵Q ,则Q 是酉矩阵。注意到若βi =0,则R 中第i 个行向量为0,所以QR =Q 1R 。定理得证。□
注:当A 是可逆矩阵时,R 的对角线上的元素都是正的。此时的Q 和R 是唯一的。
§9 矩阵的奇异值分解
定理1 设A ∈C
m ⨯n
,则存在酉矩阵P 和Q ,使得
⎡D 0⎤
。 P H AQ =⎢⎥
⎣00⎦
这里D =diag (d 1, d 2, , d r ),且d 1≥d 2≥ ≥d r >0。d i (i =1, 2, , r )是A A 的正
H
特征值的平方根,称为A 的奇异值。而
⎡D 0⎤H
A =P ⎢Q ⎥
⎣00⎦
称为A 的奇异值分解。
证明:(1)矩阵B =A A 是Hermite 矩阵,且特征值非负。
设x 是A A 的属于特征值λ的特征向量,则(Ax , Ax )=x H A H Ax =λx H x ≥0,而
H
H
x H x =(x , x )>0,所以λ≥0。
(2)寻找Q
222设A A 的特征值为d 1,其中d 1≥d 2≥ ≥d r >0,其余皆为零。 , d 2, , d n
H
由于A A 是Hermite 矩阵,所以存在n 阶酉矩阵Q ,使得
H
Q
H
(
⎡D 2
A A Q =⎢
⎢⎣0
H
)
0⎤
⎥。 (1) 0⎥⎦
n ⨯r n ⨯(n -r )将Q 分块为Q =[Q 1 Q 2],Q 1∈C r 。将(1)式写成 , Q 2∈C n -r
(
2
则有A H AQ =Q D , 11H 注意到Q 1Q 1
⎡D 2
A A Q =Q ⎢
⎢⎣0
H
)
0⎤
⎥, 0⎥⎦
(2) A H AQ 2=0。
=
H H
E r ,所以有Q 1A AQ 1
=D ,或写成AQ 1D
2
(
-1H
)(AQ D )=E
1
-1
r 。
H H
由(2)中的第二式,得Q 2A AQ 2=0,即AQ 2=0。
(3)寻找P
-1H
令P ,则=AQ D P 1的r 个列是两两正交的单位向量,记做111P 1=E r ,即P
m P 的标准正交基,记增添的向量为1=(p 1, p 2, , p r )。将p 1, p 2, , p r 扩充为C
p r +1, , p m ,构造矩阵P 2=(p r +1, , p m ),则P =(P 1 P 2)是m 阶酉矩阵,于是可得
H ⎤⎡P ⎡D 0⎤1P AQ =P (AQ 1 AQ 2)=⎢H ⎥(P 1D , 0)=⎢⎥。□
00⎢⎣⎦⎣P 2⎥⎦H
H
注:A 的奇异值由A 唯一确定,但P 和Q 一般不是唯一的。
⎡101⎤
⎢⎥例 求矩阵A =011的奇异值分解。 ⎢⎥⎢⎣000⎥⎦
⎡1⎤
⎢⎥H
解 B =A A 的特征值为3,1,0,对应的特征向量分别为1, ⎢⎥
⎢⎣2⎥⎦
⎡1⎤
⎢-1⎥, ⎢⎥⎢⎣0⎥⎦
⎡1⎤
⎢1⎥。 ⎢⎥⎢⎣-1⎥⎦
⎡3⎤
Rank A =2,D =⎢⎥。
1⎦⎣
⎡
⎢⎢Q =⎢
⎢⎢⎢⎣
161626
-
12120
1⎤⎥3⎥1⎥
。 ⎥31⎥-⎥3⎦
-1
P 1=AQ 1D
⎡
⎢⎢=⎢⎢⎢⎢⎣
12120
1⎤⎡
⎢2⎥0⎡⎤⎥⎢
1⎥⎢⎥,P 2=0,P =⎢-⎢⎥⎢2⎥
⎢⎥1⎢⎣⎦0⎥
⎥⎢⎦⎣
12
120
-
12102
⎤0⎥⎥0⎥。 ⎥1⎥⎥⎦