第三章 矩阵的标准形与若干分解形式-2

§5 多项式矩阵的互质性与既约性

一、多项式矩阵的最大公因子

定义3-10 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一个

右公因子,如果存在多项式矩阵(λ) 和(λ) 使得:

N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)。

类似地可以定义左公因子。

定义3-11 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一

个最大右公因子(记为gcrd ),如果:

(1)R (λ)是N (λ), D (λ)的右公因子;

(2)N (λ), D (λ)的任一右公因子R 1(λ),都是R (λ)的右乘因子,即存在多项式矩阵

W (λ),使得R (λ)=W (λ)R 1(λ)。

对任意的n ⨯n 与m ⨯n 的多项式矩阵D (λ) 与N (λ) ,它们的gcrd 都存在。因为

R (λ) =(D T (λ), N T (λ)) T

便是一个。

定理3-13 (gcrd的构造定理) 对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ),如果能找到一个(n +m ) ⨯(n +m ) 的单模矩阵G (λ),使得

⎡D (λ)⎤⎡G 11(λ)G 12(λ)⎤⎡D (λ)⎤⎡R (λ)⎤

3-13 G (λ)⎢=⎢=⎢⎥⎥⎢⎥⎥

⎣N (λ)⎦⎣G 21(λ)G 22(λ)⎦⎣N (λ)⎦⎣0⎦

则n ⨯n 多项式矩阵R (λ),即为N (λ)和D (λ)的gcrd 。

证明:(1)证明R (λ)是右公因子。

设G -1(λ)=⎢

⎡F 11(λ)F 12(λ)⎤⎡D (λ)⎤⎡F 11(λ)F 12(λ)⎤⎡R (λ)⎤⎡F 11(λ)R (λ)⎤

,则。 =⎢=⎢⎥⎥⎥⎢⎥⎢⎥

⎣N (λ)⎦⎣F 21(λ)F 22(λ)⎦⎣0⎦⎣F 21(λ)R (λ)⎦⎣F 21(λ)F 22(λ)⎦

(2)证明R (λ)是gcrd 。

设R 1(λ)也是N (λ), D (λ)的右公因子,故有

N (λ)=N 1(λ)R 1(λ), D (λ)=D 1(λ)R 1(λ)。由3-13式,

R (λ)=G 11(λ)D (λ)+G 12(λ)N (λ)

=[G 11(λ)D 1(λ)+G 12(λ)N 1(λ)]R 1(λ)=W (λ)R 1(λ)

⎡D (λ)⎤⎡R (λ)⎤

gcrd 的求法:对矩阵M (λ)=⎢⎥进行初等行变换,化成⎢0⎥即可。而相应的

()N λ⎣⎦⎣⎦

初等矩阵的乘积,即是G (λ)。

例3-13 设D (λ)=⎢解:

3λ+1⎤⎡λ

,N (λ)=-1, λ2+2λ-1,求grcd R (λ). ⎥2

⎣-1λ+λ-2⎦

()

⎡0λ3+λ2+λ+11λ0⎤3λ+1100⎤⎡λ

⎡D (λ) ⎤⎢⎥⎥→⎢-122

E =-1λ+λ-2010λ+λ-2010⎢N (λ) ⎥⎢⎢⎥⎥

⎣⎦⎢-1λ2+2λ-1001⎥⎢0λ+10-11⎥⎣⎦⎣⎦

22

⎡1-λ-λ+2010⎤⎡1-λ-λ+2010⎤⎢⎥⎢⎥→⎢0λ+10-11⎥→⎢0λ+10-11⎥

22⎢0λ3+λ2+λ+11λ0⎥⎢001λ+λ+1-λ-1⎥⎣⎦⎣⎦

gcrd 的基本性质:

(1)不唯一性。若R (λ)是列数为n 的多项式矩阵N (λ), D (λ)的gcrd ,而W (λ)是任

一单模矩阵,则W (λ)R (λ)也是N (λ), D (λ)的gcrd 。

(2)若N (λ), D (λ)的gcrd 是满秩矩阵或单模矩阵,则其它的gcrd 皆为满秩矩阵或

单模矩阵。

(3)对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ),当rank ⎢

⎡D (λ)⎤

⎥=n 时,它()N λ⎣⎦

们所有的gcrd 都是满秩矩阵。

,N (λ)的一个gcrd ,则R (λ)可表示为(4)若R (λ)是n ⨯n 和m ⨯n 多项式矩阵D (λ)

R (λ)=X (λ)D (λ)+Y (λ)N (λ),这里X (λ)和Y (λ)分别是n ×n 和n ×m 多项式矩阵。

注:可以类似建立两个多项式矩阵的最大左公因子(gcld )的概念。

二、多项式矩阵的互质性

定义3-12 两个具有相同列数的多项式矩阵D (λ),N (λ)是右(左)互质的,是指它们

的最大右(左)公因子为单模矩阵。

定理3-14(贝佐特(Bezout )判别准则)两个n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ)为

右互质的充分必要条件,是存在两个n ⨯n 和m ⨯n 多项式矩阵X (λ)和Y (λ),使得下面的贝佐特等式成立:X (λ)D (λ)+Y (λ)N (λ)=E 。 3-14

证明:(1)必要性:设R (λ)是D (λ),N (λ)的一个gcrd 。由于D (λ),N (λ)为右互质,

所以R (λ)为单模矩阵。在式子R (λ)=X 1(λ)D (λ)+Y 1(λ)N (λ)两端同乘以R -1(λ)即得所证。

(2)充分性:将N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)代入3-14式,得

[X (λ)(λ)+Y (λ)(λ)]R (λ)=E ,即R (λ)是一个单模矩阵。□

定理3-15 两个n ⨯n 和m ⨯n 多项式矩阵D (λ)是矩,N (λ)为右互质的充分必要条件,

阵⎢

⎡E ⎤⎡D (λ)⎤

的Smith 标准形是;而两个m ⨯m 和m ⨯n 多项式矩阵A (λ),B (λ)为左互质⎢⎥⎥

⎣0⎦⎣N (λ)⎦

的充分必要条件,是矩阵(A (λ), B (λ))的Smith 标准形是(E , 0)。

,N (λ)为右互质的。则由构造定理,存在单模矩阵G (λ),证明:(1)必要性:设D (λ)

使得

⎡D (λ)⎤⎡R (λ)⎤⎡E ⎤G (λ)⎢=⎢=⎢⎥R (λ), ⎥⎥

⎣N (λ)⎦⎣0⎦⎣0⎦

且R (λ)也是单模矩阵。于是有

⎡D (λ)⎤-1⎡E ⎤

。 3-20 ()G (λ)⎢R λ=⎥⎢⎥

⎣N (λ)⎦⎣0⎦

⎡D (λ)⎤⎡R (λ)⎤

(2)充分性:由3-20式成立,即得G (λ)⎢⎥=⎢0⎥。

()N λ⎣⎦⎣⎦三、多项式矩阵的既约性

多项式矩阵的行次数和列次数:设M (λ)=m ij (λ)

1≤j ≤q

()

p ⨯q

,则M (λ)的第i 行次数是

K ri =max {deg (m ij (λ))},记为δri M (λ);第j 列次数是K cj =max {deg (m ij (λ))},记为

1≤i ≤p

δcj M (λ)。

⎡λ2+4λ+22λ2+5λλ+6⎤

例3-14 若M (λ) =⎢⎥,则有 3

λ-2λ4⎦⎣λ+3

K r 1=2,K r 2=3;K c 1=2,K c 2=3,K c 3=1。

M (λ)的列次表示式:M (λ)=M kc H c (λ)+M lc (λ),

这里H c (λ)=diag λ

{

K c 1

, λK c 2, , λ

K cq

},M

K cj

kc 为

p ⨯q 的数字矩阵,称为列次系数矩阵。

它的第j 列为M (λ)的第j 列中相应于λ阵,满足δcj M lc (λ)

的系数组成的列;M lc (λ)为低次剩余多项式矩

(j =1, 2, , q )。

⎡λ2+4λ+12λ2λ+4⎤

例3-15 设M (λ)=⎢⎥, 3

4λ-2λ3λ+1⎦⎣λ+3

⎡λ2

⎡101⎤⎢

M (λ) =⎢⎥⎢

⎣043⎦⎢

⎤2

4⎤⎥⎡4λ+12λ

+⎥⎢λ+3-2λ1⎥ ⎣⎦λ⎥⎦

K cj

则其列次表示式为

λ3

注:M (λ)的行列式表示:M (λ)=M kc λ∑

+次数低于

∑K

cj

的各项。

M (λ)的行次表示式:M (λ)=H r (λ)M kr +M lr (λ),

这里H r (λ)=diag λ

{

K r 1

, λK r 2, , λ

K rp

},M

K ri

hr

为p ⨯q 的数字矩阵,称为行次系数矩阵。

它的第i 行为M (λ)的第i 行中相应于λ

的系数组成的行;M lr (λ)为低次剩余多项式矩

阵,满足δri M lr (λ)

(i =1, 2, , p )。

K ri

注:M (λ)的行列式表示:M (λ)=M kr λ∑

+次数低于

∑K

ri

的各项。

定义3-13 设M (λ)为满秩p 阶多项式矩阵,如果

deg M (λ)=∑δcj M (λ)=∑K cj ,

j =1

j =1

p p

则称M (λ)是列既约的;如果deg M (λ)=

例3-16 设有满秩多项式矩阵

∑δ

i =1

p

ri

M (λ)=∑K ri ,则称M (λ)是行既约的。

i =1

p

⎡3λ2+2λ2λ+4⎤

M (λ)=⎢2⎥

7λ⎦⎣λ+λ-3

则有deg |M (λ) |=3,K c 1=2, K c 2=1,

∑K

j =1

2

cj

=3,K r 1=2, K r 2=2, ∑K ri =4

i =1

2

因此这个多项式矩阵是列既约的,但不是行既约的。

定理3-16 若M (λ)为满秩p 阶多项式矩阵,则 (1)M (λ)是列既约的充分必要条件是M kc 为满秩的; (2)M (λ)是行既约的充分必要条件是M kr 为满秩的。 证明 由于|M (λ) |=|M kc |⋅λ∑

K cj

+低次项

故当且仅当|M (λ) |≠0即M kc 为满秩时,始有deg |M (λ) |=亦即M (λ) 为列既约的。因而(1)得证。同理可证(2)。

∑K

cj

例3-17 对于例3-16的矩阵M (λ) ,可求得其列次表示及行次表示为:

⎡32⎤⎡λ2

列次表示M (λ) =⎢⎥⎢

⎣17⎦⎣0⎡λ2

行次表示M (λ) =⎢

⎣0

0⎤⎡2λ4⎤⎥+⎢⎥; λ⎦⎣λ-30⎦

0⎤⎡30⎤⎡2λ2λ+4⎤

+⎢⎥⎥2⎥⎢λ⎦⎣10⎦⎣λ-37λ⎦

⎡32⎤⎡30⎤

因此有M kc =⎢⎥,M kr =⎢10⎥

17⎣⎦⎣⎦

故由M kc 满秩知M (λ) 是列既约的,但因M kr 不是满秩的,故M (λ) 不是行既约的。 注:利用初等变换的方法,即右乘或左乘一个单模矩阵,可以将非既约多项式矩阵化

成既约的。

⎡(λ+2) 2(λ+3) 2

例3-18 设M (λ)=⎢

0⎣-(λ+2) 2(λ+3) ⎤

⎥,

λ+3⎦

则M (λ) 满秩但非既约。

⎡1(λ+2) 2⎤0⎤⎡1

取单模矩阵G (λ) =⎢⎥ ⎥,F (λ) =⎢0λ+311⎣⎦⎣⎦

而使得

⎡0

M (λ) G (λ) =⎢2

⎣(λ+3) -(λ+2) 2(λ+3) ⎤

λ+3⎦

0⎤

⎥ λ+3⎦

⎡(λ+2) 2(λ+3) 2

F (λ) M (λ)=⎢

0⎣

都是列既约的。

§6 有理分式矩阵的标准形及其仿分式分解

1.有理分式矩阵(简称为分式矩阵):矩阵G (λ)=g ij (λ)的元素都是有理分式,

m ⨯n

()

g ij (λ)=

a ij (λ)b ij λ, i =1, 2, , m , j =1, 2, , n

其中a ij (λ) 与b ij (λ) 都是λ的多项式。

注:有理分式组成的空间对于四则运算封闭,所以可以类似于数字矩阵那样定义有理分式矩阵的各种运算及概念。在这里矩阵可逆与矩阵满秩就是等价的概念。 2.有理分式矩阵的标准形

定理3-17 设有理分式矩阵G (λ)=g ij (λ)≠0的秩为r (≥1) ,则存在m ⨯m 及m ⨯n

()

n ⨯n 单模多项式矩阵P (λ)及Q (λ),使得

⎡T (λ)⎤

, P (λ)G (λ)Q (λ)=M (λ)=⎢⎥0⎦⎣

其中T (λ)=diag

⎛ϕ1(λ)ϕ(λ)⎫

,ϕi (λ), t i (λ)都是首一多项式,且满足条件: , , r ⎪⎪t r λ⎭⎝t 1λ1)t i (λ)和ϕi (λ)互质;2)ϕi (λ)|ϕi +1(λ);3)t i +1(λ)|t i (λ)。

注:M (λ)叫做G (λ)的史密斯—麦克米伦(Smith-Mcmillan )标准形。它的意义在于

为系统分析,特别是分析多变量系统的极点和零点提供了一种重要的工具。

证明:1)的证明:

(1)用G (λ)各元素的分母多项式的最小公倍式b (λ)乘以矩阵,得到多项式矩阵

b (λ)G (λ)。

(2)b (λ)G (λ)的秩为r ,所以存在m ⨯m 及n ⨯n 单模多项式矩阵P (λ)及Q (λ),可

把b (λ)G (λ)化为Smith 标准形:

⎡T (λ)⎤

, P (λ)(b (λ)G (λ))Q (λ)=⎢1

⎥0⎦⎣

这里T 1(λ)=diag (d 1(λ), , d r (λ)),而且d i (λ)|d i +1(λ)。于是

⎡T 1(λ)⎤⎥。 P (λ)G (λ)Q (λ)=⎢b λ⎢⎥

0⎦⎣

(3)把

ϕ(λ)d (λ)T 1(λ)中的每个分式i (i =1, , r )化成既约分式i (i =1, , r ),且

b λb λt i λϕi (λ)和t i (λ)都是首一多项式,即得

⎡T (λ) ⎤

。 P (λ)G (λ)Q (λ)=⎢⎥0⎦⎣

(2)及(3)的证明源于ϕi (λ)和t i (λ)的构造方式。□

说明:若有理分式的分子和分母没有公因子,则称这个有理分式是既约的。 例3-19 求有理分式矩阵的标准形

⎡1-λ⎢λ(λ+1) ⎢

1

G (λ)=⎢

⎢λ+1⎢λ2+1⎢

⎣λ(λ+1)

1⎤

λ+1λ+1⎥

11⎥

。 -

λ+1λ+1⎥λλ⎥

-⎥λ+1λ+1⎦

λ

解:将G (λ) 乘以其元素分母多项式的最小公倍式λ(λ+1)后,再化为Simith 标准形,

⎡1-λλ2

b (λ)G (λ)=⎢λλ

⎢λ2+1λ2⎣λ⎤⎡1⎤⎥⎥。 -λ⎥≅⎢λ⎢⎥2⎥-λ⎦⎢λ(λ+1) ⎥⎣⎦

⎡1

⎢λ(λ+1) ⎢

于是,G (λ)≅⎢

⎢⎢⎢⎣

⎤⎥⎥1⎥。 λ+1⎥

1⎥⎥⎦

3.有理分式矩阵的分解

定义3-14 设G (λ)是m ⨯n 有理分式矩阵。如果存在m ⨯m 满秩(多项式)矩阵P 1(λ)

和m ⨯n 多项式矩阵Q 1(λ),使得

-1G (λ)=P 1(λ)Q 1(λ) 3-26

则式3-26称为G (λ)的一个左分解,或G (λ)的一个左矩阵分式描述。当P 1(λ)和

Q 1(λ)为左互质时,式3-26称为G (λ)的一个左既约分解。

如果存在n ⨯n 满秩(多项式)矩阵P 2(λ)和m ⨯n 多项式矩阵Q 2(λ),使得

G (λ)=Q 2(λ)P 2-1(λ) 3-27

则3-27式称为G (λ)的一个右分解,或G (λ)的一个右矩阵分式描述。当P 2(λ)和Q 2(λ)为右互质时,3-27式称为G (λ)的一个右既约分解。

-1-1

注意 这里的P 1(λ) 与P 2是指有理分式范围内的逆。

定理3-18 任何m ⨯n 有理分式矩阵G (λ)都存在左分解、右分解、左既约分解及右

既约分解。

证明 证法一 思路源于定理3-17中G (λ)的标准形的构造过程。

⎡T 0(λ)⎤⎡ϕ(λ)⎤-1⎡T (λ)⎤-1-1

()()G (λ)=P -1(λ)⎢Q λ=P λQ (λ) ⎢⎥⎥⎢⎥E m -r ⎦⎣0⎦0⎦⎣⎣

-1

其中T 0(λ)=diag t 1(λ), , t r -1(λ),ϕ(λ)=diag ϕ1(λ), , ϕr (λ)。取

()

()

⎡T 0-1(λ)⎤⎡ϕ(λ)⎤-1

()P 1(λ)=⎢P λ,()Q λ=Q (λ), ⎥1⎢⎥E m -r ⎦0⎦⎣⎣

-1

就得到G (λ)的一个左分解G (λ)=P 1(λ)Q 1(λ)。

进一步地,令R (λ)是P 1(λ)和Q 1(λ)的最大左公因式,则有

P 1(λ)=R (λ)P (λ), Q 1(λ)=R (λ)Q (λ)。

即有P (λ)和Q (λ)是左互质的。由于R (λ)可逆,得G (λ)=P 1□ 有理分式矩阵的左、右分解是不唯一的。 说明左、右分解的存在性可使用下列证法。

证法二 对m ⨯n 有理分式矩阵G (λ) ,记第i 行分母的最小公倍式为b i (λ) ,则

-1

(λ)Q 1(λ)=P -1(λ)Q (λ)。

b i (λ) ≠0(i =1, 2, , m )。取P {b 1(λ), , b m (λ)},则P 1(λ) 满秩,1(λ) =diag

-1Q 1(λ) =P 1(λ) G (λ) 为多项式矩阵,从而有G (λ) =P 1(λ) Q 1(λ) 为一个左分解。

同理,可证右分解的存在性。 例3-20 求传递函数矩阵

s +1⎡

⎢(s +2) 2(s +3) 2

G (s )=⎢

⎢-s +1⎢(s +3) 2⎣

的一个右分解及一个左分解。

解 容易求出G (s ) 的列最小公分母依次为

s ⎤

(s +3) 2⎥

⎥ s ⎥-

(s +3) 2⎥⎦

d c 1(s ) =(s +2) 2(s +3) 2,d c 2(s ) =(s +3) 2

因此得G (s ) 的一个右分解

s +1⎡

G (s )=⎢22

()()-s +1s +2⎣

又G (s ) 的行的最小公分母为

s ⎤⎡(s +2)2(s +3)2

⎢-s ⎥⎦⎣

2⎥

(s +3)⎦

-1

d r 1(s ) =(s +2) 2(s +3) 2,d r 2(s ) =(s +3) 2

所以G (s ) 的一个左分解为

⎡(s +2)2(s +3)2

G (s ) =⎢

⎣2

⎤⎡s +1s (s +2)⎤

⎥ 2⎥⎢

(s +3)⎦⎣-(s +1)-s ⎦

-1

§8 舒尔定理和矩阵的QR 分解

一、舒尔定理

定理3-19(舒尔定理)对于A ∈C

n ⨯n

,存在酉矩阵U ,使得U

H

AU =T 。这里T 是

上三角矩阵,且对角线上的元素都是A 的特征值。

证明:设A 的特征值为λ1, λ2, , λn 。

(1)设ε1为A 的属于特征值λ1的单位特征向量。把ε1扩充为C 的一组标准正交基

n

ε1, η2, , ηn ,并设酉矩阵U 1=(ε1, η2, , ηn ) 。则

⎡1T ⎤⎢⎥T

⎡λ⎢2⎥H

U 1AU 1=⎢⎥(λ1ε1, A η2, , A ηn )=⎢1

⎣0⎢ ⎥

⎢T ⎥⎣n ⎦

*⎤。 ⎥A 1⎦

由于相似矩阵具有相同的特征值,所以A 1的特征值是λ2, , λn 。

(2)设ε2∈C n -1为A 1的属于特征值λ2的单位特征向量。重复(1)的步骤,可得,

存在n -1阶酉矩阵V 2,使得

V 2H

⎡1⎣

⎡λ2

A 1V 2=⎢

⎣0*⎤

。 A 2⎥⎦

令U 2=⎢

,则U 2和U 1U 2都是n 阶酉矩阵,并且 ⎥V 2⎦

⎡λ1

H H U 2U 1AU 1U 2=⎢⎢

⎢⎣

λ2

*⎤

⎥。 ⎥A 2⎥⎦

(3)继续重复过程(2)n -3次,可以依次得到n -k (k =2, 3, , n -2) 阶的酉矩阵V k

及相应的n 阶酉矩阵U k ,并令U =U 1 U n -1,即得所证。□

注1 若A 是实矩阵,且A 的特征值恰好全为实数时,则特征向量可选为实向量,而

上述步骤可以在实数域内进行,因而U 可选为(实)正交矩阵。 注2 舒尔定理可概括为任一复方阵可酉相似于上三角矩阵。类似地有,任一复方阵可酉相似于下三角矩阵。 注3 定理中的酉矩阵和上三角矩阵不是唯一的。这是因为单位特征向量的选择不唯一。

n ⨯n

定理3-20 ∀ε>0,对于A ∈C ,存在可逆矩阵P ,使得

⎡λ1b 12 b 1n ⎤

⎢λ2 b 2n ⎥-1⎥, P AP =⎢0 ⎢⎥⎢λn ⎥⎣⎦

而且

i , j =∑b ij

n

证明:由舒尔定理,知存在酉矩阵Q ,使得

⎡λ1⎢

-1

Q AQ =⎢

⎢0⎢⎣

ρ12 ρ1n ⎤λ2 ρ2n ⎥

⎥。 ⎥λn ⎥⎦

令F =diag r , r 2, , r n ,其中r 为非零常数。取T =QF ,即有

()

⎡λ1

-1-1⎢T AT =F

⎢0⎢⎣

ρ12 ρ1n ⎤λ2 ρ2n ⎥

⎡λ1⎢⎥F =⎢ ⎥⎢0

λn ⎥⎦⎢⎣r ρ12 r n -1ρ1n ⎤

λ2 r n -1ρ2n ⎥

。 ⎥

⎥λn ⎥⎦

选取适当地r ,即得定理的结论。□

二、矩阵的正交三角(QR )分解

定理3-21(QR 分解定理)设A 为n 阶复数矩阵,则存在酉矩阵Q 及上三角矩阵R ,

使得A =QR 。

证明:得到矩阵A 的QR 分解的方法,类似于施密特正交化过程。 (1)设A =(α1, α2, , αn )。

若α1=0,则取β1=0;若α1≠0,则取β1=

α1

。 1

γ2

。 γ2

γ2=α2-(α2, β1)β1。若γ2=0,则取β2=0;若γ2≠0,则取β2=

若γ3=0,则取β3=0;若β3≠0,则取β3=γ3=α3-(α3, β1)β1-(α3, β2)β2。………………………………………………

γ3

。 γ3

γn =αn -∑(αn , βi )βi 。若γn =0,则取βn =0;若γn ≠0,则取βn =

i =1

n -1

γn

。 n

β1, β2, , βn 两两正交,并且或者为单位向量,或者为零向量。

(2)反过来,有

α1=r 11β1,

当α1=0时,r 11=0;当α1≠0时,r 11=1。

α2=r 12β1+r 22β2,

当β1=0时,r 12=0;当β2=0时,r 22=0;当β2≠0时,r 22=

………………………………………………

β2。

αn =r 1n β1+r 2n β2+ +r nn βn ,

当βi =0时,r in =0, (i =1, , n -1);当βn =0时,r nn =0;当βn ≠0时,r nn =

于是

βn 。

⎡r 11

A =(α1, α2, , αn )=(β1, β2, , βn )⎢

⎢⎢⎣

r 12r 22

r 1n ⎤ r 2n ⎥⎥=Q R 。

1

⎥r nn ⎦

n

(3)取出Q 1中的所有非零列向量βi 1, βi 2, , βi s ,将其扩充为C 中的一组标准正交

基βi 1, βi 2, , βi s , η1, , ηn -s 。将ηi (i =1, , n -s )取代Q 1中出现的第i 个零列向量,产生矩阵Q ,则Q 是酉矩阵。注意到若βi =0,则R 中第i 个行向量为0,所以QR =Q 1R 。定理得证。□

注:当A 是可逆矩阵时,R 的对角线上的元素都是正的。此时的Q 和R 是唯一的。

§9 矩阵的奇异值分解

定理1 设A ∈C

m ⨯n

,则存在酉矩阵P 和Q ,使得

⎡D 0⎤

。 P H AQ =⎢⎥

⎣00⎦

这里D =diag (d 1, d 2, , d r ),且d 1≥d 2≥ ≥d r >0。d i (i =1, 2, , r )是A A 的正

H

特征值的平方根,称为A 的奇异值。而

⎡D 0⎤H

A =P ⎢Q ⎥

⎣00⎦

称为A 的奇异值分解。

证明:(1)矩阵B =A A 是Hermite 矩阵,且特征值非负。

设x 是A A 的属于特征值λ的特征向量,则(Ax , Ax )=x H A H Ax =λx H x ≥0,而

H

H

x H x =(x , x )>0,所以λ≥0。

(2)寻找Q

222设A A 的特征值为d 1,其中d 1≥d 2≥ ≥d r >0,其余皆为零。 , d 2, , d n

H

由于A A 是Hermite 矩阵,所以存在n 阶酉矩阵Q ,使得

H

Q

H

(

⎡D 2

A A Q =⎢

⎢⎣0

H

)

0⎤

⎥。 (1) 0⎥⎦

n ⨯r n ⨯(n -r )将Q 分块为Q =[Q 1 Q 2],Q 1∈C r 。将(1)式写成 , Q 2∈C n -r

(

2

则有A H AQ =Q D , 11H 注意到Q 1Q 1

⎡D 2

A A Q =Q ⎢

⎢⎣0

H

)

0⎤

⎥, 0⎥⎦

(2) A H AQ 2=0。

=

H H

E r ,所以有Q 1A AQ 1

=D ,或写成AQ 1D

2

(

-1H

)(AQ D )=E

1

-1

r 。

H H

由(2)中的第二式,得Q 2A AQ 2=0,即AQ 2=0。

(3)寻找P

-1H

令P ,则=AQ D P 1的r 个列是两两正交的单位向量,记做111P 1=E r ,即P

m P 的标准正交基,记增添的向量为1=(p 1, p 2, , p r )。将p 1, p 2, , p r 扩充为C

p r +1, , p m ,构造矩阵P 2=(p r +1, , p m ),则P =(P 1 P 2)是m 阶酉矩阵,于是可得

H ⎤⎡P ⎡D 0⎤1P AQ =P (AQ 1 AQ 2)=⎢H ⎥(P 1D , 0)=⎢⎥。□

00⎢⎣⎦⎣P 2⎥⎦H

H

注:A 的奇异值由A 唯一确定,但P 和Q 一般不是唯一的。

⎡101⎤

⎢⎥例 求矩阵A =011的奇异值分解。 ⎢⎥⎢⎣000⎥⎦

⎡1⎤

⎢⎥H

解 B =A A 的特征值为3,1,0,对应的特征向量分别为1, ⎢⎥

⎢⎣2⎥⎦

⎡1⎤

⎢-1⎥, ⎢⎥⎢⎣0⎥⎦

⎡1⎤

⎢1⎥。 ⎢⎥⎢⎣-1⎥⎦

⎡3⎤

Rank A =2,D =⎢⎥。

1⎦⎣

⎢⎢Q =⎢

⎢⎢⎢⎣

161626

-

12120

1⎤⎥3⎥1⎥

。 ⎥31⎥-⎥3⎦

-1

P 1=AQ 1D

⎢⎢=⎢⎢⎢⎢⎣

12120

1⎤⎡

⎢2⎥0⎡⎤⎥⎢

1⎥⎢⎥,P 2=0,P =⎢-⎢⎥⎢2⎥

⎢⎥1⎢⎣⎦0⎥

⎥⎢⎦⎣

12

120

-

12102

⎤0⎥⎥0⎥。 ⎥1⎥⎥⎦

§5 多项式矩阵的互质性与既约性

一、多项式矩阵的最大公因子

定义3-10 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一个

右公因子,如果存在多项式矩阵(λ) 和(λ) 使得:

N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)。

类似地可以定义左公因子。

定义3-11 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一

个最大右公因子(记为gcrd ),如果:

(1)R (λ)是N (λ), D (λ)的右公因子;

(2)N (λ), D (λ)的任一右公因子R 1(λ),都是R (λ)的右乘因子,即存在多项式矩阵

W (λ),使得R (λ)=W (λ)R 1(λ)。

对任意的n ⨯n 与m ⨯n 的多项式矩阵D (λ) 与N (λ) ,它们的gcrd 都存在。因为

R (λ) =(D T (λ), N T (λ)) T

便是一个。

定理3-13 (gcrd的构造定理) 对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ),如果能找到一个(n +m ) ⨯(n +m ) 的单模矩阵G (λ),使得

⎡D (λ)⎤⎡G 11(λ)G 12(λ)⎤⎡D (λ)⎤⎡R (λ)⎤

3-13 G (λ)⎢=⎢=⎢⎥⎥⎢⎥⎥

⎣N (λ)⎦⎣G 21(λ)G 22(λ)⎦⎣N (λ)⎦⎣0⎦

则n ⨯n 多项式矩阵R (λ),即为N (λ)和D (λ)的gcrd 。

证明:(1)证明R (λ)是右公因子。

设G -1(λ)=⎢

⎡F 11(λ)F 12(λ)⎤⎡D (λ)⎤⎡F 11(λ)F 12(λ)⎤⎡R (λ)⎤⎡F 11(λ)R (λ)⎤

,则。 =⎢=⎢⎥⎥⎥⎢⎥⎢⎥

⎣N (λ)⎦⎣F 21(λ)F 22(λ)⎦⎣0⎦⎣F 21(λ)R (λ)⎦⎣F 21(λ)F 22(λ)⎦

(2)证明R (λ)是gcrd 。

设R 1(λ)也是N (λ), D (λ)的右公因子,故有

N (λ)=N 1(λ)R 1(λ), D (λ)=D 1(λ)R 1(λ)。由3-13式,

R (λ)=G 11(λ)D (λ)+G 12(λ)N (λ)

=[G 11(λ)D 1(λ)+G 12(λ)N 1(λ)]R 1(λ)=W (λ)R 1(λ)

⎡D (λ)⎤⎡R (λ)⎤

gcrd 的求法:对矩阵M (λ)=⎢⎥进行初等行变换,化成⎢0⎥即可。而相应的

()N λ⎣⎦⎣⎦

初等矩阵的乘积,即是G (λ)。

例3-13 设D (λ)=⎢解:

3λ+1⎤⎡λ

,N (λ)=-1, λ2+2λ-1,求grcd R (λ). ⎥2

⎣-1λ+λ-2⎦

()

⎡0λ3+λ2+λ+11λ0⎤3λ+1100⎤⎡λ

⎡D (λ) ⎤⎢⎥⎥→⎢-122

E =-1λ+λ-2010λ+λ-2010⎢N (λ) ⎥⎢⎢⎥⎥

⎣⎦⎢-1λ2+2λ-1001⎥⎢0λ+10-11⎥⎣⎦⎣⎦

22

⎡1-λ-λ+2010⎤⎡1-λ-λ+2010⎤⎢⎥⎢⎥→⎢0λ+10-11⎥→⎢0λ+10-11⎥

22⎢0λ3+λ2+λ+11λ0⎥⎢001λ+λ+1-λ-1⎥⎣⎦⎣⎦

gcrd 的基本性质:

(1)不唯一性。若R (λ)是列数为n 的多项式矩阵N (λ), D (λ)的gcrd ,而W (λ)是任

一单模矩阵,则W (λ)R (λ)也是N (λ), D (λ)的gcrd 。

(2)若N (λ), D (λ)的gcrd 是满秩矩阵或单模矩阵,则其它的gcrd 皆为满秩矩阵或

单模矩阵。

(3)对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ),当rank ⎢

⎡D (λ)⎤

⎥=n 时,它()N λ⎣⎦

们所有的gcrd 都是满秩矩阵。

,N (λ)的一个gcrd ,则R (λ)可表示为(4)若R (λ)是n ⨯n 和m ⨯n 多项式矩阵D (λ)

R (λ)=X (λ)D (λ)+Y (λ)N (λ),这里X (λ)和Y (λ)分别是n ×n 和n ×m 多项式矩阵。

注:可以类似建立两个多项式矩阵的最大左公因子(gcld )的概念。

二、多项式矩阵的互质性

定义3-12 两个具有相同列数的多项式矩阵D (λ),N (λ)是右(左)互质的,是指它们

的最大右(左)公因子为单模矩阵。

定理3-14(贝佐特(Bezout )判别准则)两个n ⨯n 和m ⨯n 多项式矩阵D (λ),N (λ)为

右互质的充分必要条件,是存在两个n ⨯n 和m ⨯n 多项式矩阵X (λ)和Y (λ),使得下面的贝佐特等式成立:X (λ)D (λ)+Y (λ)N (λ)=E 。 3-14

证明:(1)必要性:设R (λ)是D (λ),N (λ)的一个gcrd 。由于D (λ),N (λ)为右互质,

所以R (λ)为单模矩阵。在式子R (λ)=X 1(λ)D (λ)+Y 1(λ)N (λ)两端同乘以R -1(λ)即得所证。

(2)充分性:将N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)代入3-14式,得

[X (λ)(λ)+Y (λ)(λ)]R (λ)=E ,即R (λ)是一个单模矩阵。□

定理3-15 两个n ⨯n 和m ⨯n 多项式矩阵D (λ)是矩,N (λ)为右互质的充分必要条件,

阵⎢

⎡E ⎤⎡D (λ)⎤

的Smith 标准形是;而两个m ⨯m 和m ⨯n 多项式矩阵A (λ),B (λ)为左互质⎢⎥⎥

⎣0⎦⎣N (λ)⎦

的充分必要条件,是矩阵(A (λ), B (λ))的Smith 标准形是(E , 0)。

,N (λ)为右互质的。则由构造定理,存在单模矩阵G (λ),证明:(1)必要性:设D (λ)

使得

⎡D (λ)⎤⎡R (λ)⎤⎡E ⎤G (λ)⎢=⎢=⎢⎥R (λ), ⎥⎥

⎣N (λ)⎦⎣0⎦⎣0⎦

且R (λ)也是单模矩阵。于是有

⎡D (λ)⎤-1⎡E ⎤

。 3-20 ()G (λ)⎢R λ=⎥⎢⎥

⎣N (λ)⎦⎣0⎦

⎡D (λ)⎤⎡R (λ)⎤

(2)充分性:由3-20式成立,即得G (λ)⎢⎥=⎢0⎥。

()N λ⎣⎦⎣⎦三、多项式矩阵的既约性

多项式矩阵的行次数和列次数:设M (λ)=m ij (λ)

1≤j ≤q

()

p ⨯q

,则M (λ)的第i 行次数是

K ri =max {deg (m ij (λ))},记为δri M (λ);第j 列次数是K cj =max {deg (m ij (λ))},记为

1≤i ≤p

δcj M (λ)。

⎡λ2+4λ+22λ2+5λλ+6⎤

例3-14 若M (λ) =⎢⎥,则有 3

λ-2λ4⎦⎣λ+3

K r 1=2,K r 2=3;K c 1=2,K c 2=3,K c 3=1。

M (λ)的列次表示式:M (λ)=M kc H c (λ)+M lc (λ),

这里H c (λ)=diag λ

{

K c 1

, λK c 2, , λ

K cq

},M

K cj

kc 为

p ⨯q 的数字矩阵,称为列次系数矩阵。

它的第j 列为M (λ)的第j 列中相应于λ阵,满足δcj M lc (λ)

的系数组成的列;M lc (λ)为低次剩余多项式矩

(j =1, 2, , q )。

⎡λ2+4λ+12λ2λ+4⎤

例3-15 设M (λ)=⎢⎥, 3

4λ-2λ3λ+1⎦⎣λ+3

⎡λ2

⎡101⎤⎢

M (λ) =⎢⎥⎢

⎣043⎦⎢

⎤2

4⎤⎥⎡4λ+12λ

+⎥⎢λ+3-2λ1⎥ ⎣⎦λ⎥⎦

K cj

则其列次表示式为

λ3

注:M (λ)的行列式表示:M (λ)=M kc λ∑

+次数低于

∑K

cj

的各项。

M (λ)的行次表示式:M (λ)=H r (λ)M kr +M lr (λ),

这里H r (λ)=diag λ

{

K r 1

, λK r 2, , λ

K rp

},M

K ri

hr

为p ⨯q 的数字矩阵,称为行次系数矩阵。

它的第i 行为M (λ)的第i 行中相应于λ

的系数组成的行;M lr (λ)为低次剩余多项式矩

阵,满足δri M lr (λ)

(i =1, 2, , p )。

K ri

注:M (λ)的行列式表示:M (λ)=M kr λ∑

+次数低于

∑K

ri

的各项。

定义3-13 设M (λ)为满秩p 阶多项式矩阵,如果

deg M (λ)=∑δcj M (λ)=∑K cj ,

j =1

j =1

p p

则称M (λ)是列既约的;如果deg M (λ)=

例3-16 设有满秩多项式矩阵

∑δ

i =1

p

ri

M (λ)=∑K ri ,则称M (λ)是行既约的。

i =1

p

⎡3λ2+2λ2λ+4⎤

M (λ)=⎢2⎥

7λ⎦⎣λ+λ-3

则有deg |M (λ) |=3,K c 1=2, K c 2=1,

∑K

j =1

2

cj

=3,K r 1=2, K r 2=2, ∑K ri =4

i =1

2

因此这个多项式矩阵是列既约的,但不是行既约的。

定理3-16 若M (λ)为满秩p 阶多项式矩阵,则 (1)M (λ)是列既约的充分必要条件是M kc 为满秩的; (2)M (λ)是行既约的充分必要条件是M kr 为满秩的。 证明 由于|M (λ) |=|M kc |⋅λ∑

K cj

+低次项

故当且仅当|M (λ) |≠0即M kc 为满秩时,始有deg |M (λ) |=亦即M (λ) 为列既约的。因而(1)得证。同理可证(2)。

∑K

cj

例3-17 对于例3-16的矩阵M (λ) ,可求得其列次表示及行次表示为:

⎡32⎤⎡λ2

列次表示M (λ) =⎢⎥⎢

⎣17⎦⎣0⎡λ2

行次表示M (λ) =⎢

⎣0

0⎤⎡2λ4⎤⎥+⎢⎥; λ⎦⎣λ-30⎦

0⎤⎡30⎤⎡2λ2λ+4⎤

+⎢⎥⎥2⎥⎢λ⎦⎣10⎦⎣λ-37λ⎦

⎡32⎤⎡30⎤

因此有M kc =⎢⎥,M kr =⎢10⎥

17⎣⎦⎣⎦

故由M kc 满秩知M (λ) 是列既约的,但因M kr 不是满秩的,故M (λ) 不是行既约的。 注:利用初等变换的方法,即右乘或左乘一个单模矩阵,可以将非既约多项式矩阵化

成既约的。

⎡(λ+2) 2(λ+3) 2

例3-18 设M (λ)=⎢

0⎣-(λ+2) 2(λ+3) ⎤

⎥,

λ+3⎦

则M (λ) 满秩但非既约。

⎡1(λ+2) 2⎤0⎤⎡1

取单模矩阵G (λ) =⎢⎥ ⎥,F (λ) =⎢0λ+311⎣⎦⎣⎦

而使得

⎡0

M (λ) G (λ) =⎢2

⎣(λ+3) -(λ+2) 2(λ+3) ⎤

λ+3⎦

0⎤

⎥ λ+3⎦

⎡(λ+2) 2(λ+3) 2

F (λ) M (λ)=⎢

0⎣

都是列既约的。

§6 有理分式矩阵的标准形及其仿分式分解

1.有理分式矩阵(简称为分式矩阵):矩阵G (λ)=g ij (λ)的元素都是有理分式,

m ⨯n

()

g ij (λ)=

a ij (λ)b ij λ, i =1, 2, , m , j =1, 2, , n

其中a ij (λ) 与b ij (λ) 都是λ的多项式。

注:有理分式组成的空间对于四则运算封闭,所以可以类似于数字矩阵那样定义有理分式矩阵的各种运算及概念。在这里矩阵可逆与矩阵满秩就是等价的概念。 2.有理分式矩阵的标准形

定理3-17 设有理分式矩阵G (λ)=g ij (λ)≠0的秩为r (≥1) ,则存在m ⨯m 及m ⨯n

()

n ⨯n 单模多项式矩阵P (λ)及Q (λ),使得

⎡T (λ)⎤

, P (λ)G (λ)Q (λ)=M (λ)=⎢⎥0⎦⎣

其中T (λ)=diag

⎛ϕ1(λ)ϕ(λ)⎫

,ϕi (λ), t i (λ)都是首一多项式,且满足条件: , , r ⎪⎪t r λ⎭⎝t 1λ1)t i (λ)和ϕi (λ)互质;2)ϕi (λ)|ϕi +1(λ);3)t i +1(λ)|t i (λ)。

注:M (λ)叫做G (λ)的史密斯—麦克米伦(Smith-Mcmillan )标准形。它的意义在于

为系统分析,特别是分析多变量系统的极点和零点提供了一种重要的工具。

证明:1)的证明:

(1)用G (λ)各元素的分母多项式的最小公倍式b (λ)乘以矩阵,得到多项式矩阵

b (λ)G (λ)。

(2)b (λ)G (λ)的秩为r ,所以存在m ⨯m 及n ⨯n 单模多项式矩阵P (λ)及Q (λ),可

把b (λ)G (λ)化为Smith 标准形:

⎡T (λ)⎤

, P (λ)(b (λ)G (λ))Q (λ)=⎢1

⎥0⎦⎣

这里T 1(λ)=diag (d 1(λ), , d r (λ)),而且d i (λ)|d i +1(λ)。于是

⎡T 1(λ)⎤⎥。 P (λ)G (λ)Q (λ)=⎢b λ⎢⎥

0⎦⎣

(3)把

ϕ(λ)d (λ)T 1(λ)中的每个分式i (i =1, , r )化成既约分式i (i =1, , r ),且

b λb λt i λϕi (λ)和t i (λ)都是首一多项式,即得

⎡T (λ) ⎤

。 P (λ)G (λ)Q (λ)=⎢⎥0⎦⎣

(2)及(3)的证明源于ϕi (λ)和t i (λ)的构造方式。□

说明:若有理分式的分子和分母没有公因子,则称这个有理分式是既约的。 例3-19 求有理分式矩阵的标准形

⎡1-λ⎢λ(λ+1) ⎢

1

G (λ)=⎢

⎢λ+1⎢λ2+1⎢

⎣λ(λ+1)

1⎤

λ+1λ+1⎥

11⎥

。 -

λ+1λ+1⎥λλ⎥

-⎥λ+1λ+1⎦

λ

解:将G (λ) 乘以其元素分母多项式的最小公倍式λ(λ+1)后,再化为Simith 标准形,

⎡1-λλ2

b (λ)G (λ)=⎢λλ

⎢λ2+1λ2⎣λ⎤⎡1⎤⎥⎥。 -λ⎥≅⎢λ⎢⎥2⎥-λ⎦⎢λ(λ+1) ⎥⎣⎦

⎡1

⎢λ(λ+1) ⎢

于是,G (λ)≅⎢

⎢⎢⎢⎣

⎤⎥⎥1⎥。 λ+1⎥

1⎥⎥⎦

3.有理分式矩阵的分解

定义3-14 设G (λ)是m ⨯n 有理分式矩阵。如果存在m ⨯m 满秩(多项式)矩阵P 1(λ)

和m ⨯n 多项式矩阵Q 1(λ),使得

-1G (λ)=P 1(λ)Q 1(λ) 3-26

则式3-26称为G (λ)的一个左分解,或G (λ)的一个左矩阵分式描述。当P 1(λ)和

Q 1(λ)为左互质时,式3-26称为G (λ)的一个左既约分解。

如果存在n ⨯n 满秩(多项式)矩阵P 2(λ)和m ⨯n 多项式矩阵Q 2(λ),使得

G (λ)=Q 2(λ)P 2-1(λ) 3-27

则3-27式称为G (λ)的一个右分解,或G (λ)的一个右矩阵分式描述。当P 2(λ)和Q 2(λ)为右互质时,3-27式称为G (λ)的一个右既约分解。

-1-1

注意 这里的P 1(λ) 与P 2是指有理分式范围内的逆。

定理3-18 任何m ⨯n 有理分式矩阵G (λ)都存在左分解、右分解、左既约分解及右

既约分解。

证明 证法一 思路源于定理3-17中G (λ)的标准形的构造过程。

⎡T 0(λ)⎤⎡ϕ(λ)⎤-1⎡T (λ)⎤-1-1

()()G (λ)=P -1(λ)⎢Q λ=P λQ (λ) ⎢⎥⎥⎢⎥E m -r ⎦⎣0⎦0⎦⎣⎣

-1

其中T 0(λ)=diag t 1(λ), , t r -1(λ),ϕ(λ)=diag ϕ1(λ), , ϕr (λ)。取

()

()

⎡T 0-1(λ)⎤⎡ϕ(λ)⎤-1

()P 1(λ)=⎢P λ,()Q λ=Q (λ), ⎥1⎢⎥E m -r ⎦0⎦⎣⎣

-1

就得到G (λ)的一个左分解G (λ)=P 1(λ)Q 1(λ)。

进一步地,令R (λ)是P 1(λ)和Q 1(λ)的最大左公因式,则有

P 1(λ)=R (λ)P (λ), Q 1(λ)=R (λ)Q (λ)。

即有P (λ)和Q (λ)是左互质的。由于R (λ)可逆,得G (λ)=P 1□ 有理分式矩阵的左、右分解是不唯一的。 说明左、右分解的存在性可使用下列证法。

证法二 对m ⨯n 有理分式矩阵G (λ) ,记第i 行分母的最小公倍式为b i (λ) ,则

-1

(λ)Q 1(λ)=P -1(λ)Q (λ)。

b i (λ) ≠0(i =1, 2, , m )。取P {b 1(λ), , b m (λ)},则P 1(λ) 满秩,1(λ) =diag

-1Q 1(λ) =P 1(λ) G (λ) 为多项式矩阵,从而有G (λ) =P 1(λ) Q 1(λ) 为一个左分解。

同理,可证右分解的存在性。 例3-20 求传递函数矩阵

s +1⎡

⎢(s +2) 2(s +3) 2

G (s )=⎢

⎢-s +1⎢(s +3) 2⎣

的一个右分解及一个左分解。

解 容易求出G (s ) 的列最小公分母依次为

s ⎤

(s +3) 2⎥

⎥ s ⎥-

(s +3) 2⎥⎦

d c 1(s ) =(s +2) 2(s +3) 2,d c 2(s ) =(s +3) 2

因此得G (s ) 的一个右分解

s +1⎡

G (s )=⎢22

()()-s +1s +2⎣

又G (s ) 的行的最小公分母为

s ⎤⎡(s +2)2(s +3)2

⎢-s ⎥⎦⎣

2⎥

(s +3)⎦

-1

d r 1(s ) =(s +2) 2(s +3) 2,d r 2(s ) =(s +3) 2

所以G (s ) 的一个左分解为

⎡(s +2)2(s +3)2

G (s ) =⎢

⎣2

⎤⎡s +1s (s +2)⎤

⎥ 2⎥⎢

(s +3)⎦⎣-(s +1)-s ⎦

-1

§8 舒尔定理和矩阵的QR 分解

一、舒尔定理

定理3-19(舒尔定理)对于A ∈C

n ⨯n

,存在酉矩阵U ,使得U

H

AU =T 。这里T 是

上三角矩阵,且对角线上的元素都是A 的特征值。

证明:设A 的特征值为λ1, λ2, , λn 。

(1)设ε1为A 的属于特征值λ1的单位特征向量。把ε1扩充为C 的一组标准正交基

n

ε1, η2, , ηn ,并设酉矩阵U 1=(ε1, η2, , ηn ) 。则

⎡1T ⎤⎢⎥T

⎡λ⎢2⎥H

U 1AU 1=⎢⎥(λ1ε1, A η2, , A ηn )=⎢1

⎣0⎢ ⎥

⎢T ⎥⎣n ⎦

*⎤。 ⎥A 1⎦

由于相似矩阵具有相同的特征值,所以A 1的特征值是λ2, , λn 。

(2)设ε2∈C n -1为A 1的属于特征值λ2的单位特征向量。重复(1)的步骤,可得,

存在n -1阶酉矩阵V 2,使得

V 2H

⎡1⎣

⎡λ2

A 1V 2=⎢

⎣0*⎤

。 A 2⎥⎦

令U 2=⎢

,则U 2和U 1U 2都是n 阶酉矩阵,并且 ⎥V 2⎦

⎡λ1

H H U 2U 1AU 1U 2=⎢⎢

⎢⎣

λ2

*⎤

⎥。 ⎥A 2⎥⎦

(3)继续重复过程(2)n -3次,可以依次得到n -k (k =2, 3, , n -2) 阶的酉矩阵V k

及相应的n 阶酉矩阵U k ,并令U =U 1 U n -1,即得所证。□

注1 若A 是实矩阵,且A 的特征值恰好全为实数时,则特征向量可选为实向量,而

上述步骤可以在实数域内进行,因而U 可选为(实)正交矩阵。 注2 舒尔定理可概括为任一复方阵可酉相似于上三角矩阵。类似地有,任一复方阵可酉相似于下三角矩阵。 注3 定理中的酉矩阵和上三角矩阵不是唯一的。这是因为单位特征向量的选择不唯一。

n ⨯n

定理3-20 ∀ε>0,对于A ∈C ,存在可逆矩阵P ,使得

⎡λ1b 12 b 1n ⎤

⎢λ2 b 2n ⎥-1⎥, P AP =⎢0 ⎢⎥⎢λn ⎥⎣⎦

而且

i , j =∑b ij

n

证明:由舒尔定理,知存在酉矩阵Q ,使得

⎡λ1⎢

-1

Q AQ =⎢

⎢0⎢⎣

ρ12 ρ1n ⎤λ2 ρ2n ⎥

⎥。 ⎥λn ⎥⎦

令F =diag r , r 2, , r n ,其中r 为非零常数。取T =QF ,即有

()

⎡λ1

-1-1⎢T AT =F

⎢0⎢⎣

ρ12 ρ1n ⎤λ2 ρ2n ⎥

⎡λ1⎢⎥F =⎢ ⎥⎢0

λn ⎥⎦⎢⎣r ρ12 r n -1ρ1n ⎤

λ2 r n -1ρ2n ⎥

。 ⎥

⎥λn ⎥⎦

选取适当地r ,即得定理的结论。□

二、矩阵的正交三角(QR )分解

定理3-21(QR 分解定理)设A 为n 阶复数矩阵,则存在酉矩阵Q 及上三角矩阵R ,

使得A =QR 。

证明:得到矩阵A 的QR 分解的方法,类似于施密特正交化过程。 (1)设A =(α1, α2, , αn )。

若α1=0,则取β1=0;若α1≠0,则取β1=

α1

。 1

γ2

。 γ2

γ2=α2-(α2, β1)β1。若γ2=0,则取β2=0;若γ2≠0,则取β2=

若γ3=0,则取β3=0;若β3≠0,则取β3=γ3=α3-(α3, β1)β1-(α3, β2)β2。………………………………………………

γ3

。 γ3

γn =αn -∑(αn , βi )βi 。若γn =0,则取βn =0;若γn ≠0,则取βn =

i =1

n -1

γn

。 n

β1, β2, , βn 两两正交,并且或者为单位向量,或者为零向量。

(2)反过来,有

α1=r 11β1,

当α1=0时,r 11=0;当α1≠0时,r 11=1。

α2=r 12β1+r 22β2,

当β1=0时,r 12=0;当β2=0时,r 22=0;当β2≠0时,r 22=

………………………………………………

β2。

αn =r 1n β1+r 2n β2+ +r nn βn ,

当βi =0时,r in =0, (i =1, , n -1);当βn =0时,r nn =0;当βn ≠0时,r nn =

于是

βn 。

⎡r 11

A =(α1, α2, , αn )=(β1, β2, , βn )⎢

⎢⎢⎣

r 12r 22

r 1n ⎤ r 2n ⎥⎥=Q R 。

1

⎥r nn ⎦

n

(3)取出Q 1中的所有非零列向量βi 1, βi 2, , βi s ,将其扩充为C 中的一组标准正交

基βi 1, βi 2, , βi s , η1, , ηn -s 。将ηi (i =1, , n -s )取代Q 1中出现的第i 个零列向量,产生矩阵Q ,则Q 是酉矩阵。注意到若βi =0,则R 中第i 个行向量为0,所以QR =Q 1R 。定理得证。□

注:当A 是可逆矩阵时,R 的对角线上的元素都是正的。此时的Q 和R 是唯一的。

§9 矩阵的奇异值分解

定理1 设A ∈C

m ⨯n

,则存在酉矩阵P 和Q ,使得

⎡D 0⎤

。 P H AQ =⎢⎥

⎣00⎦

这里D =diag (d 1, d 2, , d r ),且d 1≥d 2≥ ≥d r >0。d i (i =1, 2, , r )是A A 的正

H

特征值的平方根,称为A 的奇异值。而

⎡D 0⎤H

A =P ⎢Q ⎥

⎣00⎦

称为A 的奇异值分解。

证明:(1)矩阵B =A A 是Hermite 矩阵,且特征值非负。

设x 是A A 的属于特征值λ的特征向量,则(Ax , Ax )=x H A H Ax =λx H x ≥0,而

H

H

x H x =(x , x )>0,所以λ≥0。

(2)寻找Q

222设A A 的特征值为d 1,其中d 1≥d 2≥ ≥d r >0,其余皆为零。 , d 2, , d n

H

由于A A 是Hermite 矩阵,所以存在n 阶酉矩阵Q ,使得

H

Q

H

(

⎡D 2

A A Q =⎢

⎢⎣0

H

)

0⎤

⎥。 (1) 0⎥⎦

n ⨯r n ⨯(n -r )将Q 分块为Q =[Q 1 Q 2],Q 1∈C r 。将(1)式写成 , Q 2∈C n -r

(

2

则有A H AQ =Q D , 11H 注意到Q 1Q 1

⎡D 2

A A Q =Q ⎢

⎢⎣0

H

)

0⎤

⎥, 0⎥⎦

(2) A H AQ 2=0。

=

H H

E r ,所以有Q 1A AQ 1

=D ,或写成AQ 1D

2

(

-1H

)(AQ D )=E

1

-1

r 。

H H

由(2)中的第二式,得Q 2A AQ 2=0,即AQ 2=0。

(3)寻找P

-1H

令P ,则=AQ D P 1的r 个列是两两正交的单位向量,记做111P 1=E r ,即P

m P 的标准正交基,记增添的向量为1=(p 1, p 2, , p r )。将p 1, p 2, , p r 扩充为C

p r +1, , p m ,构造矩阵P 2=(p r +1, , p m ),则P =(P 1 P 2)是m 阶酉矩阵,于是可得

H ⎤⎡P ⎡D 0⎤1P AQ =P (AQ 1 AQ 2)=⎢H ⎥(P 1D , 0)=⎢⎥。□

00⎢⎣⎦⎣P 2⎥⎦H

H

注:A 的奇异值由A 唯一确定,但P 和Q 一般不是唯一的。

⎡101⎤

⎢⎥例 求矩阵A =011的奇异值分解。 ⎢⎥⎢⎣000⎥⎦

⎡1⎤

⎢⎥H

解 B =A A 的特征值为3,1,0,对应的特征向量分别为1, ⎢⎥

⎢⎣2⎥⎦

⎡1⎤

⎢-1⎥, ⎢⎥⎢⎣0⎥⎦

⎡1⎤

⎢1⎥。 ⎢⎥⎢⎣-1⎥⎦

⎡3⎤

Rank A =2,D =⎢⎥。

1⎦⎣

⎢⎢Q =⎢

⎢⎢⎢⎣

161626

-

12120

1⎤⎥3⎥1⎥

。 ⎥31⎥-⎥3⎦

-1

P 1=AQ 1D

⎢⎢=⎢⎢⎢⎢⎣

12120

1⎤⎡

⎢2⎥0⎡⎤⎥⎢

1⎥⎢⎥,P 2=0,P =⎢-⎢⎥⎢2⎥

⎢⎥1⎢⎣⎦0⎥

⎥⎢⎦⎣

12

120

-

12102

⎤0⎥⎥0⎥。 ⎥1⎥⎥⎦


相关内容

  • 不变子空间.若当.最小多项式(简介)
  • §7 不变子空间 ◎ 本节重点:不变子空间的定义与"限制". 已知可对角化对应于对角矩阵,但是并不是每个都能对角化的.退一步,对应于准对角形也好:虽然比对角形复杂,但也算简单.这个问题的研究需要用到不变子空间的概念. 一.定义与例子 1.定义:σ∈L(Vn),W是σ的不变子空间⇔ ...

  • 三角矩阵求逆的一种方法
  • 2003年9月渭南师范学院学报Sept.200:j------------------_---------^---------------_------------__----------------------一----_-_-------_-----------------一第18卷第5期Jou ...

  • 矩阵分析习题
  • 研究生矩阵分析习题 第一部份 内容 第一章 线性空间与线性换 1.概念与性质 (1)线性空间.线性子空间.向量有关概念(线性相关.线性无关.线性表出,向量组的秩.基.维数.坐标).过渡矩阵.基坐标关系 (2)子空间:和.交.直和.维数公式 (3)线性空间同构,同构性质 (4)线性变换.线性变换空间. ...

  • 质量功能展开
  • 第五章 质量功能展开 质量功能展开(Quality Function Deployment, QFD) 是一种立足于在产品开发过程中最大限度地满足顾客需求的系统化.用户驱动式的质量保证与改进方法.它于七十年代初起源于日本,由日本东京技术学院的Shigeru Mizuno 博士提出.进入八十年代以后逐 ...

  • 注水定理和矩阵分解
  • 随机信号.非周期信号.准周期信号和周期信号,由于其时间是无限的,总为功率信号 能量信号只可能是有限时间内存在的确定性信号 1 AWGN 信道 离散事件加性高斯白噪声信道:y [i]=x [i]+n [i] ,信道容量由香农公式得出: C =B log 2(1+γ) 接收信噪比定义为x [i ]的功率 ...

  • 自动化专业06级[现代控制理论]试卷答案
  • 自动化专业06级<现代控制理论>试卷答案 一.(10分,每小题1分)试判断以下结论的正确性,若结论是正确的,则在其左边的括号里 打√,反之打×. ( √ )1. 相比于经典控制理论,现代控制理论的一个显著优点是可以用时域法直接进行系统的 分析和设计. ( √ )2. 传递函数的状态空间实 ...

  • 广义逆矩阵的计算方法本科毕业论文
  • 广义逆矩阵的计算方法 摘 要:上世纪兴起的广义逆矩阵经过几十年的发展,已经成为现代数学研究中一个活跃的领域.作为逆矩阵的推广,广义逆矩阵的理论已成为数理统计.最优化理论.现代化控制理论和网络理论等学科的重要工具.在科学研究和工程应用中,很多问题都可以归结为求解矩阵广义逆(特别是伪逆)的数学问题. 本 ...

  • 现代控制理论
  • 现代控制理论知识结构 (研究的顺序符合控制理论的一般步骤:系统建模.模型求解.提出性能指标.系统设计校正.) 一.系统的状态空间建模 1. 从2个角度4种方法建立状态空间表达式. 2. 状态空间表达式的线性变换 3. 由状态空间表达式反推传递函数 4. 建立离散系统的状态空间表达式 5. 需要注意的 ...

  • 对称矩阵与反对称矩阵的若干性质
  • 第19卷 第6期 牡丹江大学学报 Vol.19 No.6 2010年6月 Journal of Mudanjiang University Jun. 2010 文章编号:1008-8717(2010)06-0110-02 对称矩阵与反对称矩阵的若干性质 武 秀 美 (菏泽学院数学系,山东 菏泽 27 ...