第三章矩阵的标准形与若干分解形式-2

§5 多项式矩阵的互质性与既约性

一、多项式矩阵的最大公因子

定义3-10 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一个

右公因子，如果存在多项式矩阵(λ) 和(λ) 使得：

N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)。

类似地可以定义左公因子。

定义3－11 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一

个最大右公因子（记为gcrd ），如果：

（1）R (λ)是N (λ), D (λ)的右公因子；

（2）N (λ), D (λ)的任一右公因子R 1(λ)，都是R (λ)的右乘因子，即存在多项式矩阵

W (λ)，使得R (λ)=W (λ)R 1(λ)。

对任意的n ⨯n 与m ⨯n 的多项式矩阵D (λ) 与N (λ) ，它们的gcrd 都存在。因为

R (λ) =(D T (λ), N T (λ)) T

便是一个。

定理3－13 (gcrd的构造定理) 对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ)，N (λ)，如果能找到一个(n +m ) ⨯(n +m ) 的单模矩阵G (λ)，使得

⎡D (λ)⎤⎡G 11(λ)G 12(λ)⎤⎡D (λ)⎤⎡R (λ)⎤

3-13 G (λ)⎢=⎢=⎢⎥⎥⎢⎥⎥

⎣N (λ)⎦⎣G 21(λ)G 22(λ)⎦⎣N (λ)⎦⎣0⎦

则n ⨯n 多项式矩阵R (λ)，即为N (λ)和D (λ)的gcrd 。

证明：（1）证明R (λ)是右公因子。

设G -1(λ)=⎢

⎡F 11(λ)F 12(λ)⎤⎡D (λ)⎤⎡F 11(λ)F 12(λ)⎤⎡R (λ)⎤⎡F 11(λ)R (λ)⎤

，则。 =⎢=⎢⎥⎥⎥⎢⎥⎢⎥

⎣N (λ)⎦⎣F 21(λ)F 22(λ)⎦⎣0⎦⎣F 21(λ)R (λ)⎦⎣F 21(λ)F 22(λ)⎦

（2）证明R (λ)是gcrd 。

设R 1(λ)也是N (λ), D (λ)的右公因子，故有

N (λ)=N 1(λ)R 1(λ), D (λ)=D 1(λ)R 1(λ)。由3-13式，

R (λ)=G 11(λ)D (λ)+G 12(λ)N (λ)

=[G 11(λ)D 1(λ)+G 12(λ)N 1(λ)]R 1(λ)=W (λ)R 1(λ)

□

⎡D (λ)⎤⎡R (λ)⎤

gcrd 的求法：对矩阵M (λ)=⎢⎥进行初等行变换，化成⎢0⎥即可。而相应的

()N λ⎣⎦⎣⎦

初等矩阵的乘积，即是G (λ)。

例3-13 设D (λ)=⎢解：

3λ+1⎤⎡λ

，N (λ)=-1, λ2+2λ-1，求grcd R (λ). ⎥2

⎣-1λ+λ-2⎦

()

⎡0λ3+λ2+λ+11λ0⎤3λ+1100⎤⎡λ

⎡D (λ) ⎤⎢⎥⎥→⎢-122

E =-1λ+λ-2010λ+λ-2010⎢N (λ) ⎥⎢⎢⎥⎥

⎣⎦⎢-1λ2+2λ-1001⎥⎢0λ+10-11⎥⎣⎦⎣⎦

⎡1-λ-λ+2010⎤⎡1-λ-λ+2010⎤⎢⎥⎢⎥→⎢0λ+10-11⎥→⎢0λ+10-11⎥

22⎢0λ3+λ2+λ+11λ0⎥⎢001λ+λ+1-λ-1⎥⎣⎦⎣⎦

gcrd 的基本性质：

（1）不唯一性。若R (λ)是列数为n 的多项式矩阵N (λ), D (λ)的gcrd ，而W (λ)是任

一单模矩阵，则W (λ)R (λ)也是N (λ), D (λ)的gcrd 。

（2）若N (λ), D (λ)的gcrd 是满秩矩阵或单模矩阵，则其它的gcrd 皆为满秩矩阵或

单模矩阵。

（3）对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ)，N (λ)，当rank ⎢

⎡D (λ)⎤

⎥=n 时，它()N λ⎣⎦

们所有的gcrd 都是满秩矩阵。

，N (λ)的一个gcrd ，则R (λ)可表示为（4）若R (λ)是n ⨯n 和m ⨯n 多项式矩阵D (λ)

R (λ)=X (λ)D (λ)+Y (λ)N (λ)，这里X (λ)和Y (λ)分别是n ×n 和n ×m 多项式矩阵。

注：可以类似建立两个多项式矩阵的最大左公因子（gcld ）的概念。

二、多项式矩阵的互质性

定义3-12 两个具有相同列数的多项式矩阵D (λ)，N (λ)是右（左）互质的，是指它们

的最大右（左）公因子为单模矩阵。

定理3-14（贝佐特（Bezout ）判别准则）两个n ⨯n 和m ⨯n 多项式矩阵D (λ)，N (λ)为

右互质的充分必要条件，是存在两个n ⨯n 和m ⨯n 多项式矩阵X (λ)和Y (λ)，使得下面的贝佐特等式成立：X (λ)D (λ)+Y (λ)N (λ)=E 。 3-14

证明：（1）必要性：设R (λ)是D (λ)，N (λ)的一个gcrd 。由于D (λ)，N (λ)为右互质，

所以R (λ)为单模矩阵。在式子R (λ)=X 1(λ)D (λ)+Y 1(λ)N (λ)两端同乘以R -1(λ)即得所证。

（2）充分性：将N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)代入3-14式，得

[X (λ)(λ)+Y (λ)(λ)]R (λ)=E ，即R (λ)是一个单模矩阵。□

定理3-15 两个n ⨯n 和m ⨯n 多项式矩阵D (λ)是矩，N (λ)为右互质的充分必要条件，

阵⎢

⎡E ⎤⎡D (λ)⎤

的Smith 标准形是；而两个m ⨯m 和m ⨯n 多项式矩阵A (λ)，B (λ)为左互质⎢⎥⎥

⎣0⎦⎣N (λ)⎦

的充分必要条件，是矩阵(A (λ), B (λ))的Smith 标准形是(E , 0)。

，N (λ)为右互质的。则由构造定理，存在单模矩阵G (λ)，证明：（1）必要性：设D (λ)

使得

⎡D (λ)⎤⎡R (λ)⎤⎡E ⎤G (λ)⎢=⎢=⎢⎥R (λ)， ⎥⎥

⎣N (λ)⎦⎣0⎦⎣0⎦

且R (λ)也是单模矩阵。于是有

⎡D (λ)⎤-1⎡E ⎤

。 3-20 ()G (λ)⎢R λ=⎥⎢⎥

⎣N (λ)⎦⎣0⎦

⎡D (λ)⎤⎡R (λ)⎤

（2）充分性：由3-20式成立，即得G (λ)⎢⎥=⎢0⎥。

()N λ⎣⎦⎣⎦三、多项式矩阵的既约性

多项式矩阵的行次数和列次数：设M (λ)=m ij (λ)

1≤j ≤q

()

p ⨯q

，则M (λ)的第i 行次数是

K ri =max {deg (m ij (λ))}，记为δri M (λ)；第j 列次数是K cj =max {deg (m ij (λ))}，记为

1≤i ≤p

δcj M (λ)。

⎡λ2+4λ+22λ2+5λλ+6⎤

例3－14 若M (λ) =⎢⎥，则有 3

λ-2λ4⎦⎣λ+3

K r 1=2，K r 2=3；K c 1=2，K c 2=3，K c 3=1。

M (λ)的列次表示式：M (λ)=M kc H c (λ)+M lc (λ)，

这里H c (λ)=diag λ

{

K c 1

, λK c 2, , λ

K cq

}，M

K cj

kc 为

p ⨯q 的数字矩阵，称为列次系数矩阵。

它的第j 列为M (λ)的第j 列中相应于λ阵，满足δcj M lc (λ)

的系数组成的列；M lc (λ)为低次剩余多项式矩

(j =1, 2, , q )。

⎡λ2+4λ+12λ2λ+4⎤

例3－15 设M (λ)=⎢⎥， 3

4λ-2λ3λ+1⎦⎣λ+3

⎡λ2

⎡101⎤⎢

M (λ) =⎢⎥⎢

⎣043⎦⎢

⎣

⎤2

4⎤⎥⎡4λ+12λ

+⎥⎢λ+3-2λ1⎥ ⎣⎦λ⎥⎦

K cj

则其列次表示式为

λ3

注：M (λ)的行列式表示：M (λ)=M kc λ∑

＋次数低于

∑K

的各项。

M (λ)的行次表示式：M (λ)=H r (λ)M kr +M lr (λ)，

这里H r (λ)=diag λ

{

K r 1

, λK r 2, , λ

K rp

}，M

K ri

为p ⨯q 的数字矩阵，称为行次系数矩阵。

它的第i 行为M (λ)的第i 行中相应于λ

的系数组成的行；M lr (λ)为低次剩余多项式矩

阵，满足δri M lr (λ)

(i =1, 2, , p )。

K ri

注：M (λ)的行列式表示：M (λ)=M kr λ∑

＋次数低于

∑K

的各项。

定义3－13 设M (λ)为满秩p 阶多项式矩阵，如果

deg M (λ)=∑δcj M (λ)=∑K cj ，

j =1

p p

则称M (λ)是列既约的；如果deg M (λ)=

例3－16 设有满秩多项式矩阵

∑δ

i =1

M (λ)=∑K ri ，则称M (λ)是行既约的。

i =1

⎡3λ2+2λ2λ+4⎤

M (λ)=⎢2⎥

7λ⎦⎣λ+λ-3

则有deg |M (λ) |=3，K c 1=2, K c 2=1,

∑K

j =1

=3，K r 1=2, K r 2=2, ∑K ri =4

i =1

因此这个多项式矩阵是列既约的，但不是行既约的。

定理3－16 若M (λ)为满秩p 阶多项式矩阵，则（1）M (λ)是列既约的充分必要条件是M kc 为满秩的；（2）M (λ)是行既约的充分必要条件是M kr 为满秩的。证明由于|M (λ) |=|M kc |⋅λ∑

K cj

+低次项

故当且仅当|M (λ) |≠0即M kc 为满秩时，始有deg |M (λ) |=亦即M (λ) 为列既约的。因而（1）得证。同理可证（2）。

∑K

，

例3－17 对于例3－16的矩阵M (λ) ，可求得其列次表示及行次表示为：

⎡32⎤⎡λ2

列次表示M (λ) =⎢⎥⎢

⎣17⎦⎣0⎡λ2

行次表示M (λ) =⎢

⎣0

0⎤⎡2λ4⎤⎥+⎢⎥； λ⎦⎣λ-30⎦

0⎤⎡30⎤⎡2λ2λ+4⎤

+⎢⎥⎥2⎥⎢λ⎦⎣10⎦⎣λ-37λ⎦

⎡32⎤⎡30⎤

因此有M kc =⎢⎥，M kr =⎢10⎥

17⎣⎦⎣⎦

故由M kc 满秩知M (λ) 是列既约的，但因M kr 不是满秩的，故M (λ) 不是行既约的。注：利用初等变换的方法，即右乘或左乘一个单模矩阵，可以将非既约多项式矩阵化

成既约的。

⎡(λ+2) 2(λ+3) 2

例3－18 设M (λ)=⎢

0⎣-(λ+2) 2(λ+3) ⎤

⎥，

λ+3⎦

则M (λ) 满秩但非既约。

⎡1(λ+2) 2⎤0⎤⎡1

取单模矩阵G (λ) =⎢⎥ ⎥，F (λ) =⎢0λ+311⎣⎦⎣⎦

而使得

及

⎡0

M (λ) G (λ) =⎢2

⎣(λ+3) -(λ+2) 2(λ+3) ⎤

⎥

λ+3⎦

0⎤

⎥ λ+3⎦

⎡(λ+2) 2(λ+3) 2

F (λ) M (λ)=⎢

0⎣

都是列既约的。

§6 有理分式矩阵的标准形及其仿分式分解

即

1．有理分式矩阵（简称为分式矩阵）：矩阵G (λ)=g ij (λ)的元素都是有理分式，

m ⨯n

()

g ij (λ)=

a ij (λ)b ij λ, i =1, 2, , m , j =1, 2, , n

其中a ij (λ) 与b ij (λ) 都是λ的多项式。

注：有理分式组成的空间对于四则运算封闭，所以可以类似于数字矩阵那样定义有理分式矩阵的各种运算及概念。在这里矩阵可逆与矩阵满秩就是等价的概念。 2．有理分式矩阵的标准形

定理3－17 设有理分式矩阵G (λ)=g ij (λ)≠0的秩为r (≥1) ，则存在m ⨯m 及m ⨯n

()

n ⨯n 单模多项式矩阵P (λ)及Q (λ)，使得

⎡T (λ)⎤

， P (λ)G (λ)Q (λ)=M (λ)=⎢⎥0⎦⎣

其中T (λ)=diag

⎛ϕ1(λ)ϕ(λ)⎫

，ϕi (λ), t i (λ)都是首一多项式，且满足条件： , , r ⎪⎪t r λ⎭⎝t 1λ1）t i (λ)和ϕi (λ)互质；2）ϕi (λ)|ϕi +1(λ)；3）t i +1(λ)|t i (λ)。

注：M (λ)叫做G (λ)的史密斯—麦克米伦（Smith-Mcmillan ）标准形。它的意义在于

为系统分析，特别是分析多变量系统的极点和零点提供了一种重要的工具。

证明：1）的证明：

（1）用G (λ)各元素的分母多项式的最小公倍式b (λ)乘以矩阵，得到多项式矩阵

b (λ)G (λ)。

（2）b (λ)G (λ)的秩为r ，所以存在m ⨯m 及n ⨯n 单模多项式矩阵P (λ)及Q (λ)，可

把b (λ)G (λ)化为Smith 标准形：

⎡T (λ)⎤

， P (λ)(b (λ)G (λ))Q (λ)=⎢1

⎥0⎦⎣

这里T 1(λ)=diag (d 1(λ), , d r (λ))，而且d i (λ)|d i +1(λ)。于是

⎡T 1(λ)⎤⎥。 P (λ)G (λ)Q (λ)=⎢b λ⎢⎥

0⎦⎣

（3）把

ϕ(λ)d (λ)T 1(λ)中的每个分式i (i =1, , r )化成既约分式i (i =1, , r )，且

b λb λt i λϕi (λ)和t i (λ)都是首一多项式，即得

⎡T (λ) ⎤

。 P (λ)G (λ)Q (λ)=⎢⎥0⎦⎣

（2）及（3）的证明源于ϕi (λ)和t i (λ)的构造方式。□

说明：若有理分式的分子和分母没有公因子，则称这个有理分式是既约的。例3－19 求有理分式矩阵的标准形

⎡1-λ⎢λ(λ+1) ⎢

G (λ)=⎢

⎢λ+1⎢λ2+1⎢

⎣λ(λ+1)

得

1⎤

λ+1λ+1⎥

⎥

11⎥

。 -

λ+1λ+1⎥λλ⎥

-⎥λ+1λ+1⎦

解：将G (λ) 乘以其元素分母多项式的最小公倍式λ(λ+1)后，再化为Simith 标准形，

⎡1-λλ2

⎢

b (λ)G (λ)=⎢λλ

⎢λ2+1λ2⎣λ⎤⎡1⎤⎥⎥。 -λ⎥≅⎢λ⎢⎥2⎥-λ⎦⎢λ(λ+1) ⎥⎣⎦

⎡1

⎢λ(λ+1) ⎢

于是，G (λ)≅⎢

⎢⎢⎢⎣

⎤⎥⎥1⎥。 λ+1⎥

1⎥⎥⎦

3．有理分式矩阵的分解

定义3－14 设G (λ)是m ⨯n 有理分式矩阵。如果存在m ⨯m 满秩（多项式）矩阵P 1(λ)

和m ⨯n 多项式矩阵Q 1(λ)，使得

-1G (λ)=P 1(λ)Q 1(λ) 3－26

则式3－26称为G (λ)的一个左分解，或G (λ)的一个左矩阵分式描述。当P 1(λ)和

Q 1(λ)为左互质时，式3－26称为G (λ)的一个左既约分解。

如果存在n ⨯n 满秩（多项式）矩阵P 2(λ)和m ⨯n 多项式矩阵Q 2(λ)，使得

G (λ)=Q 2(λ)P 2-1(λ) 3－27

则3－27式称为G (λ)的一个右分解，或G (λ)的一个右矩阵分式描述。当P 2(λ)和Q 2(λ)为右互质时，3－27式称为G (λ)的一个右既约分解。

-1-1

注意这里的P 1(λ) 与P 2是指有理分式范围内的逆。

定理3－18 任何m ⨯n 有理分式矩阵G (λ)都存在左分解、右分解、左既约分解及右

既约分解。

证明证法一思路源于定理3－17中G (λ)的标准形的构造过程。

⎡T 0(λ)⎤⎡ϕ(λ)⎤-1⎡T (λ)⎤-1-1

()()G (λ)=P -1(λ)⎢Q λ=P λQ (λ) ⎢⎥⎥⎢⎥E m -r ⎦⎣0⎦0⎦⎣⎣

-1

其中T 0(λ)=diag t 1(λ), , t r -1(λ)，ϕ(λ)=diag ϕ1(λ), , ϕr (λ)。取

()

⎡T 0-1(λ)⎤⎡ϕ(λ)⎤-1

()P 1(λ)=⎢P λ，()Q λ=Q (λ)， ⎥1⎢⎥E m -r ⎦0⎦⎣⎣

-1

就得到G (λ)的一个左分解G (λ)=P 1(λ)Q 1(λ)。

进一步地，令R (λ)是P 1(λ)和Q 1(λ)的最大左公因式，则有

P 1(λ)=R (λ)P (λ), Q 1(λ)=R (λ)Q (λ)。

即有P (λ)和Q (λ)是左互质的。由于R (λ)可逆，得G (λ)=P 1□ 有理分式矩阵的左、右分解是不唯一的。说明左、右分解的存在性可使用下列证法。

证法二对m ⨯n 有理分式矩阵G (λ) ，记第i 行分母的最小公倍式为b i (λ) ，则

-1

(λ)Q 1(λ)=P -1(λ)Q (λ)。

b i (λ) ≠0（i =1, 2, , m ）。取P {b 1(λ), , b m (λ)}，则P 1(λ) 满秩，1(λ) =diag

-1Q 1(λ) =P 1(λ) G (λ) 为多项式矩阵，从而有G (λ) =P 1(λ) Q 1(λ) 为一个左分解。

同理，可证右分解的存在性。例3-20 求传递函数矩阵

s +1⎡

⎢(s +2) 2(s +3) 2

G (s )=⎢

⎢-s +1⎢(s +3) 2⎣

的一个右分解及一个左分解。

解容易求出G (s ) 的列最小公分母依次为

s ⎤

(s +3) 2⎥

⎥ s ⎥-

(s +3) 2⎥⎦

d c 1(s ) =(s +2) 2(s +3) 2，d c 2(s ) =(s +3) 2

因此得G (s ) 的一个右分解

s +1⎡

G (s )=⎢22

()()-s +1s +2⎣

又G (s ) 的行的最小公分母为

s ⎤⎡(s +2)2(s +3)2

⎢-s ⎥⎦⎣

⎤

2⎥

(s +3)⎦

-1

d r 1(s ) =(s +2) 2(s +3) 2，d r 2(s ) =(s +3) 2

所以G (s ) 的一个左分解为

⎡(s +2)2(s +3)2

G (s ) =⎢

⎣2

⎤⎡s +1s (s +2)⎤

⎥ 2⎥⎢

(s +3)⎦⎣-(s +1)-s ⎦

-1

§8 舒尔定理和矩阵的QR 分解

一、舒尔定理

定理3－19（舒尔定理）对于A ∈C

n ⨯n

，存在酉矩阵U ，使得U

AU =T 。这里T 是

上三角矩阵，且对角线上的元素都是A 的特征值。

证明：设A 的特征值为λ1, λ2, , λn 。

（1）设ε1为A 的属于特征值λ1的单位特征向量。把ε1扩充为C 的一组标准正交基

ε1, η2, , ηn ，并设酉矩阵U 1=(ε1, η2, , ηn ) 。则

⎡1T ⎤⎢⎥T

⎡λ⎢2⎥H

U 1AU 1=⎢⎥(λ1ε1, A η2, , A ηn )=⎢1

⎣0⎢ ⎥

⎢T ⎥⎣n ⎦

*⎤。 ⎥A 1⎦

由于相似矩阵具有相同的特征值，所以A 1的特征值是λ2, , λn 。

（2）设ε2∈C n -1为A 1的属于特征值λ2的单位特征向量。重复（1）的步骤，可得，

存在n -1阶酉矩阵V 2，使得

V 2H

⎡1⎣

⎡λ2

A 1V 2=⎢

⎣0*⎤

。 A 2⎥⎦

令U 2=⎢

⎤

，则U 2和U 1U 2都是n 阶酉矩阵，并且 ⎥V 2⎦

⎡λ1

H H U 2U 1AU 1U 2=⎢⎢

⎢⎣

λ2

*⎤

⎥。 ⎥A 2⎥⎦

（3）继续重复过程（2）n -3次，可以依次得到n -k (k =2, 3, , n -2) 阶的酉矩阵V k

及相应的n 阶酉矩阵U k ，并令U =U 1 U n -1，即得所证。□

注1 若A 是实矩阵，且A 的特征值恰好全为实数时，则特征向量可选为实向量，而

上述步骤可以在实数域内进行，因而U 可选为（实）正交矩阵。注2 舒尔定理可概括为任一复方阵可酉相似于上三角矩阵。类似地有，任一复方阵可酉相似于下三角矩阵。注3 定理中的酉矩阵和上三角矩阵不是唯一的。这是因为单位特征向量的选择不唯一。

n ⨯n

定理3－20 ∀ε>0，对于A ∈C ，存在可逆矩阵P ，使得

⎡λ1b 12 b 1n ⎤

⎢λ2 b 2n ⎥-1⎥， P AP =⎢0 ⎢⎥⎢λn ⎥⎣⎦

而且

i , j =∑b ij

证明：由舒尔定理，知存在酉矩阵Q ，使得

⎡λ1⎢

-1

Q AQ =⎢

⎢0⎢⎣

ρ12 ρ1n ⎤λ2 ρ2n ⎥

⎥。 ⎥λn ⎥⎦

令F =diag r , r 2, , r n ，其中r 为非零常数。取T =QF ，即有

()

⎡λ1

⎢

-1-1⎢T AT =F

⎢0⎢⎣

ρ12 ρ1n ⎤λ2 ρ2n ⎥

⎡λ1⎢⎥F =⎢ ⎥⎢0

⎢

λn ⎥⎦⎢⎣r ρ12 r n -1ρ1n ⎤

⎥

λ2 r n -1ρ2n ⎥

。 ⎥

⎥λn ⎥⎦

选取适当地r ，即得定理的结论。□

二、矩阵的正交三角（QR ）分解

定理3－21（QR 分解定理）设A 为n 阶复数矩阵，则存在酉矩阵Q 及上三角矩阵R ，

使得A =QR 。

证明：得到矩阵A 的QR 分解的方法，类似于施密特正交化过程。（1）设A =(α1, α2, , αn )。

若α1=0，则取β1=0；若α1≠0，则取β1=

α1

。 1

γ2

。 γ2

γ2=α2-(α2, β1)β1。若γ2=0，则取β2=0；若γ2≠0，则取β2=

若γ3=0，则取β3=0；若β3≠0，则取β3=γ3=α3-(α3, β1)β1-(α3, β2)β2。………………………………………………

γ3

。 γ3

γn =αn -∑(αn , βi )βi 。若γn =0，则取βn =0；若γn ≠0，则取βn =

i =1

n -1

γn

。 n

β1, β2, , βn 两两正交，并且或者为单位向量，或者为零向量。

（2）反过来，有

α1=r 11β1，

当α1=0时，r 11=0；当α1≠0时，r 11=1。

α2=r 12β1+r 22β2，

当β1=0时，r 12=0；当β2=0时，r 22=0；当β2≠0时，r 22=

………………………………………………

β2。

αn =r 1n β1+r 2n β2+ +r nn βn ，

当βi =0时，r in =0, (i =1, , n -1)；当βn =0时，r nn =0；当βn ≠0时，r nn =

于是

βn 。

⎡r 11

⎢

A =(α1, α2, , αn )=(β1, β2, , βn )⎢

⎢⎢⎣

r 12r 22

r 1n ⎤ r 2n ⎥⎥=Q R 。

⎥

⎥r nn ⎦

（3）取出Q 1中的所有非零列向量βi 1, βi 2, , βi s ，将其扩充为C 中的一组标准正交

基βi 1, βi 2, , βi s , η1, , ηn -s 。将ηi (i =1, , n -s )取代Q 1中出现的第i 个零列向量，产生矩阵Q ，则Q 是酉矩阵。注意到若βi =0，则R 中第i 个行向量为0，所以QR =Q 1R 。定理得证。□

注：当A 是可逆矩阵时，R 的对角线上的元素都是正的。此时的Q 和R 是唯一的。

§9 矩阵的奇异值分解

定理1 设A ∈C

m ⨯n

，则存在酉矩阵P 和Q ，使得

⎡D 0⎤

。 P H AQ =⎢⎥

⎣00⎦

这里D =diag (d 1, d 2, , d r )，且d 1≥d 2≥ ≥d r >0。d i (i =1, 2, , r )是A A 的正

特征值的平方根，称为A 的奇异值。而

⎡D 0⎤H

A =P ⎢Q ⎥

⎣00⎦

称为A 的奇异值分解。

证明：（1）矩阵B =A A 是Hermite 矩阵，且特征值非负。

设x 是A A 的属于特征值λ的特征向量，则(Ax , Ax )=x H A H Ax =λx H x ≥0，而

x H x =(x , x )>0，所以λ≥0。

（2）寻找Q

222设A A 的特征值为d 1，其中d 1≥d 2≥ ≥d r >0，其余皆为零。 , d 2, , d n

由于A A 是Hermite 矩阵，所以存在n 阶酉矩阵Q ，使得

(

⎡D 2

A A Q =⎢

⎢⎣0

)

0⎤

⎥。（1） 0⎥⎦

n ⨯r n ⨯(n -r )将Q 分块为Q =[Q 1 Q 2]，Q 1∈C r 。将（1）式写成 , Q 2∈C n -r

(

则有A H AQ =Q D , 11H 注意到Q 1Q 1

⎡D 2

A A Q =Q ⎢

⎢⎣0

)

0⎤

⎥， 0⎥⎦

（2） A H AQ 2=0。

H H

E r ，所以有Q 1A AQ 1

=D ，或写成AQ 1D

(

-1H

)(AQ D )=E

-1

r 。

H H

由（2）中的第二式，得Q 2A AQ 2=0，即AQ 2=0。

（3）寻找P

-1H

令P ，则=AQ D P 1的r 个列是两两正交的单位向量，记做111P 1=E r ，即P

m P 的标准正交基，记增添的向量为1=(p 1, p 2, , p r )。将p 1, p 2, , p r 扩充为C

p r +1, , p m ，构造矩阵P 2=(p r +1, , p m )，则P =(P 1 P 2)是m 阶酉矩阵，于是可得

H ⎤⎡P ⎡D 0⎤1P AQ =P (AQ 1 AQ 2)=⎢H ⎥(P 1D , 0)=⎢⎥。□

00⎢⎣⎦⎣P 2⎥⎦H

注：A 的奇异值由A 唯一确定，但P 和Q 一般不是唯一的。

⎡101⎤

⎢⎥例求矩阵A =011的奇异值分解。 ⎢⎥⎢⎣000⎥⎦

⎡1⎤

⎢⎥H

解 B =A A 的特征值为3，1，0，对应的特征向量分别为1, ⎢⎥

⎢⎣2⎥⎦

⎡1⎤

⎢-1⎥, ⎢⎥⎢⎣0⎥⎦

⎡1⎤

⎢1⎥。 ⎢⎥⎢⎣-1⎥⎦

⎡3⎤

Rank A =2，D =⎢⎥。

1⎦⎣

⎡

⎢⎢Q =⎢

⎢⎢⎢⎣

161626

12120

1⎤⎥3⎥1⎥

。 ⎥31⎥-⎥3⎦

-1

P 1=AQ 1D

⎡

⎢⎢=⎢⎢⎢⎢⎣

12120

1⎤⎡

⎢2⎥0⎡⎤⎥⎢

1⎥⎢⎥，P 2=0，P =⎢-⎢⎥⎢2⎥

⎢⎥1⎢⎣⎦0⎥

⎥⎢⎦⎣

120

12102

⎤0⎥⎥0⎥。 ⎥1⎥⎥⎦

§5 多项式矩阵的互质性与既约性

一、多项式矩阵的最大公因子

定义3-10 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一个

右公因子，如果存在多项式矩阵(λ) 和(λ) 使得：

N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)。

类似地可以定义左公因子。

定义3－11 多项式矩阵R (λ)称为具有相同列数的两个多项式矩阵N (λ), D (λ)的一

个最大右公因子（记为gcrd ），如果：

（1）R (λ)是N (λ), D (λ)的右公因子；

（2）N (λ), D (λ)的任一右公因子R 1(λ)，都是R (λ)的右乘因子，即存在多项式矩阵

W (λ)，使得R (λ)=W (λ)R 1(λ)。

对任意的n ⨯n 与m ⨯n 的多项式矩阵D (λ) 与N (λ) ，它们的gcrd 都存在。因为

R (λ) =(D T (λ), N T (λ)) T

便是一个。

定理3－13 (gcrd的构造定理) 对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ)，N (λ)，如果能找到一个(n +m ) ⨯(n +m ) 的单模矩阵G (λ)，使得

⎡D (λ)⎤⎡G 11(λ)G 12(λ)⎤⎡D (λ)⎤⎡R (λ)⎤

3-13 G (λ)⎢=⎢=⎢⎥⎥⎢⎥⎥

⎣N (λ)⎦⎣G 21(λ)G 22(λ)⎦⎣N (λ)⎦⎣0⎦

则n ⨯n 多项式矩阵R (λ)，即为N (λ)和D (λ)的gcrd 。

证明：（1）证明R (λ)是右公因子。

设G -1(λ)=⎢

⎡F 11(λ)F 12(λ)⎤⎡D (λ)⎤⎡F 11(λ)F 12(λ)⎤⎡R (λ)⎤⎡F 11(λ)R (λ)⎤

，则。 =⎢=⎢⎥⎥⎥⎢⎥⎢⎥

⎣N (λ)⎦⎣F 21(λ)F 22(λ)⎦⎣0⎦⎣F 21(λ)R (λ)⎦⎣F 21(λ)F 22(λ)⎦

（2）证明R (λ)是gcrd 。

设R 1(λ)也是N (λ), D (λ)的右公因子，故有

N (λ)=N 1(λ)R 1(λ), D (λ)=D 1(λ)R 1(λ)。由3-13式，

R (λ)=G 11(λ)D (λ)+G 12(λ)N (λ)

=[G 11(λ)D 1(λ)+G 12(λ)N 1(λ)]R 1(λ)=W (λ)R 1(λ)

□

⎡D (λ)⎤⎡R (λ)⎤

gcrd 的求法：对矩阵M (λ)=⎢⎥进行初等行变换，化成⎢0⎥即可。而相应的

()N λ⎣⎦⎣⎦

初等矩阵的乘积，即是G (λ)。

例3-13 设D (λ)=⎢解：

3λ+1⎤⎡λ

，N (λ)=-1, λ2+2λ-1，求grcd R (λ). ⎥2

⎣-1λ+λ-2⎦

()

⎡0λ3+λ2+λ+11λ0⎤3λ+1100⎤⎡λ

⎡D (λ) ⎤⎢⎥⎥→⎢-122

E =-1λ+λ-2010λ+λ-2010⎢N (λ) ⎥⎢⎢⎥⎥

⎣⎦⎢-1λ2+2λ-1001⎥⎢0λ+10-11⎥⎣⎦⎣⎦

⎡1-λ-λ+2010⎤⎡1-λ-λ+2010⎤⎢⎥⎢⎥→⎢0λ+10-11⎥→⎢0λ+10-11⎥

22⎢0λ3+λ2+λ+11λ0⎥⎢001λ+λ+1-λ-1⎥⎣⎦⎣⎦

gcrd 的基本性质：

（1）不唯一性。若R (λ)是列数为n 的多项式矩阵N (λ), D (λ)的gcrd ，而W (λ)是任

一单模矩阵，则W (λ)R (λ)也是N (λ), D (λ)的gcrd 。

（2）若N (λ), D (λ)的gcrd 是满秩矩阵或单模矩阵，则其它的gcrd 皆为满秩矩阵或

单模矩阵。

（3）对于给定的n ⨯n 和m ⨯n 多项式矩阵D (λ)，N (λ)，当rank ⎢

⎡D (λ)⎤

⎥=n 时，它()N λ⎣⎦

们所有的gcrd 都是满秩矩阵。

，N (λ)的一个gcrd ，则R (λ)可表示为（4）若R (λ)是n ⨯n 和m ⨯n 多项式矩阵D (λ)

R (λ)=X (λ)D (λ)+Y (λ)N (λ)，这里X (λ)和Y (λ)分别是n ×n 和n ×m 多项式矩阵。

注：可以类似建立两个多项式矩阵的最大左公因子（gcld ）的概念。

二、多项式矩阵的互质性

定义3-12 两个具有相同列数的多项式矩阵D (λ)，N (λ)是右（左）互质的，是指它们

的最大右（左）公因子为单模矩阵。

定理3-14（贝佐特（Bezout ）判别准则）两个n ⨯n 和m ⨯n 多项式矩阵D (λ)，N (λ)为

右互质的充分必要条件，是存在两个n ⨯n 和m ⨯n 多项式矩阵X (λ)和Y (λ)，使得下面的贝佐特等式成立：X (λ)D (λ)+Y (λ)N (λ)=E 。 3-14

证明：（1）必要性：设R (λ)是D (λ)，N (λ)的一个gcrd 。由于D (λ)，N (λ)为右互质，

所以R (λ)为单模矩阵。在式子R (λ)=X 1(λ)D (λ)+Y 1(λ)N (λ)两端同乘以R -1(λ)即得所证。

（2）充分性：将N (λ)=(λ)R (λ), D (λ)=(λ)R (λ)代入3-14式，得

[X (λ)(λ)+Y (λ)(λ)]R (λ)=E ，即R (λ)是一个单模矩阵。□

定理3-15 两个n ⨯n 和m ⨯n 多项式矩阵D (λ)是矩，N (λ)为右互质的充分必要条件，

阵⎢

⎡E ⎤⎡D (λ)⎤

的Smith 标准形是；而两个m ⨯m 和m ⨯n 多项式矩阵A (λ)，B (λ)为左互质⎢⎥⎥

⎣0⎦⎣N (λ)⎦

的充分必要条件，是矩阵(A (λ), B (λ))的Smith 标准形是(E , 0)。

，N (λ)为右互质的。则由构造定理，存在单模矩阵G (λ)，证明：（1）必要性：设D (λ)

使得

⎡D (λ)⎤⎡R (λ)⎤⎡E ⎤G (λ)⎢=⎢=⎢⎥R (λ)， ⎥⎥

⎣N (λ)⎦⎣0⎦⎣0⎦

且R (λ)也是单模矩阵。于是有

⎡D (λ)⎤-1⎡E ⎤

。 3-20 ()G (λ)⎢R λ=⎥⎢⎥

⎣N (λ)⎦⎣0⎦

⎡D (λ)⎤⎡R (λ)⎤

（2）充分性：由3-20式成立，即得G (λ)⎢⎥=⎢0⎥。

()N λ⎣⎦⎣⎦三、多项式矩阵的既约性

多项式矩阵的行次数和列次数：设M (λ)=m ij (λ)

1≤j ≤q

()

p ⨯q

，则M (λ)的第i 行次数是

K ri =max {deg (m ij (λ))}，记为δri M (λ)；第j 列次数是K cj =max {deg (m ij (λ))}，记为

1≤i ≤p

δcj M (λ)。

⎡λ2+4λ+22λ2+5λλ+6⎤

例3－14 若M (λ) =⎢⎥，则有 3

λ-2λ4⎦⎣λ+3

K r 1=2，K r 2=3；K c 1=2，K c 2=3，K c 3=1。

M (λ)的列次表示式：M (λ)=M kc H c (λ)+M lc (λ)，

这里H c (λ)=diag λ

{

K c 1

, λK c 2, , λ

K cq

}，M

K cj

kc 为

p ⨯q 的数字矩阵，称为列次系数矩阵。

它的第j 列为M (λ)的第j 列中相应于λ阵，满足δcj M lc (λ)

的系数组成的列；M lc (λ)为低次剩余多项式矩

(j =1, 2, , q )。

⎡λ2+4λ+12λ2λ+4⎤

例3－15 设M (λ)=⎢⎥， 3

4λ-2λ3λ+1⎦⎣λ+3

⎡λ2

⎡101⎤⎢

M (λ) =⎢⎥⎢

⎣043⎦⎢

⎣

⎤2

4⎤⎥⎡4λ+12λ

+⎥⎢λ+3-2λ1⎥ ⎣⎦λ⎥⎦

K cj

则其列次表示式为

λ3

注：M (λ)的行列式表示：M (λ)=M kc λ∑

＋次数低于

∑K

的各项。

M (λ)的行次表示式：M (λ)=H r (λ)M kr +M lr (λ)，

这里H r (λ)=diag λ

{

K r 1

, λK r 2, , λ

K rp

}，M

K ri

为p ⨯q 的数字矩阵，称为行次系数矩阵。

它的第i 行为M (λ)的第i 行中相应于λ

的系数组成的行；M lr (λ)为低次剩余多项式矩

阵，满足δri M lr (λ)

(i =1, 2, , p )。

K ri

注：M (λ)的行列式表示：M (λ)=M kr λ∑

＋次数低于

∑K

的各项。

定义3－13 设M (λ)为满秩p 阶多项式矩阵，如果

deg M (λ)=∑δcj M (λ)=∑K cj ，

j =1

p p

则称M (λ)是列既约的；如果deg M (λ)=

例3－16 设有满秩多项式矩阵

∑δ

i =1

M (λ)=∑K ri ，则称M (λ)是行既约的。

i =1

⎡3λ2+2λ2λ+4⎤

M (λ)=⎢2⎥

7λ⎦⎣λ+λ-3

则有deg |M (λ) |=3，K c 1=2, K c 2=1,

∑K

j =1

=3，K r 1=2, K r 2=2, ∑K ri =4

i =1

因此这个多项式矩阵是列既约的，但不是行既约的。

K cj

+低次项

故当且仅当|M (λ) |≠0即M kc 为满秩时，始有deg |M (λ) |=亦即M (λ) 为列既约的。因而（1）得证。同理可证（2）。

∑K

，

例3－17 对于例3－16的矩阵M (λ) ，可求得其列次表示及行次表示为：

⎡32⎤⎡λ2

列次表示M (λ) =⎢⎥⎢

⎣17⎦⎣0⎡λ2

行次表示M (λ) =⎢

⎣0

0⎤⎡2λ4⎤⎥+⎢⎥； λ⎦⎣λ-30⎦

0⎤⎡30⎤⎡2λ2λ+4⎤

+⎢⎥⎥2⎥⎢λ⎦⎣10⎦⎣λ-37λ⎦

⎡32⎤⎡30⎤

因此有M kc =⎢⎥，M kr =⎢10⎥

17⎣⎦⎣⎦

成既约的。

⎡(λ+2) 2(λ+3) 2

例3－18 设M (λ)=⎢

0⎣-(λ+2) 2(λ+3) ⎤

⎥，

λ+3⎦

则M (λ) 满秩但非既约。

⎡1(λ+2) 2⎤0⎤⎡1

取单模矩阵G (λ) =⎢⎥ ⎥，F (λ) =⎢0λ+311⎣⎦⎣⎦

而使得

及

⎡0

M (λ) G (λ) =⎢2

⎣(λ+3) -(λ+2) 2(λ+3) ⎤

⎥

λ+3⎦

0⎤

⎥ λ+3⎦

⎡(λ+2) 2(λ+3) 2

F (λ) M (λ)=⎢

0⎣

都是列既约的。

§6 有理分式矩阵的标准形及其仿分式分解

即

1．有理分式矩阵（简称为分式矩阵）：矩阵G (λ)=g ij (λ)的元素都是有理分式，

m ⨯n

()

g ij (λ)=

a ij (λ)b ij λ, i =1, 2, , m , j =1, 2, , n

其中a ij (λ) 与b ij (λ) 都是λ的多项式。

定理3－17 设有理分式矩阵G (λ)=g ij (λ)≠0的秩为r (≥1) ，则存在m ⨯m 及m ⨯n

()

n ⨯n 单模多项式矩阵P (λ)及Q (λ)，使得

⎡T (λ)⎤

， P (λ)G (λ)Q (λ)=M (λ)=⎢⎥0⎦⎣

其中T (λ)=diag

⎛ϕ1(λ)ϕ(λ)⎫

，ϕi (λ), t i (λ)都是首一多项式，且满足条件： , , r ⎪⎪t r λ⎭⎝t 1λ1）t i (λ)和ϕi (λ)互质；2）ϕi (λ)|ϕi +1(λ)；3）t i +1(λ)|t i (λ)。

注：M (λ)叫做G (λ)的史密斯—麦克米伦（Smith-Mcmillan ）标准形。它的意义在于

为系统分析，特别是分析多变量系统的极点和零点提供了一种重要的工具。

证明：1）的证明：

（1）用G (λ)各元素的分母多项式的最小公倍式b (λ)乘以矩阵，得到多项式矩阵

b (λ)G (λ)。

（2）b (λ)G (λ)的秩为r ，所以存在m ⨯m 及n ⨯n 单模多项式矩阵P (λ)及Q (λ)，可

把b (λ)G (λ)化为Smith 标准形：

⎡T (λ)⎤

， P (λ)(b (λ)G (λ))Q (λ)=⎢1

⎥0⎦⎣

这里T 1(λ)=diag (d 1(λ), , d r (λ))，而且d i (λ)|d i +1(λ)。于是

⎡T 1(λ)⎤⎥。 P (λ)G (λ)Q (λ)=⎢b λ⎢⎥

0⎦⎣

（3）把

ϕ(λ)d (λ)T 1(λ)中的每个分式i (i =1, , r )化成既约分式i (i =1, , r )，且

b λb λt i λϕi (λ)和t i (λ)都是首一多项式，即得

⎡T (λ) ⎤

。 P (λ)G (λ)Q (λ)=⎢⎥0⎦⎣

（2）及（3）的证明源于ϕi (λ)和t i (λ)的构造方式。□

说明：若有理分式的分子和分母没有公因子，则称这个有理分式是既约的。例3－19 求有理分式矩阵的标准形

⎡1-λ⎢λ(λ+1) ⎢

G (λ)=⎢

⎢λ+1⎢λ2+1⎢

⎣λ(λ+1)

得

1⎤

λ+1λ+1⎥

⎥

11⎥

。 -

λ+1λ+1⎥λλ⎥

-⎥λ+1λ+1⎦

解：将G (λ) 乘以其元素分母多项式的最小公倍式λ(λ+1)后，再化为Simith 标准形，

⎡1-λλ2

⎢

b (λ)G (λ)=⎢λλ

⎢λ2+1λ2⎣λ⎤⎡1⎤⎥⎥。 -λ⎥≅⎢λ⎢⎥2⎥-λ⎦⎢λ(λ+1) ⎥⎣⎦

⎡1

⎢λ(λ+1) ⎢

于是，G (λ)≅⎢

⎢⎢⎢⎣

⎤⎥⎥1⎥。 λ+1⎥

1⎥⎥⎦

3．有理分式矩阵的分解

定义3－14 设G (λ)是m ⨯n 有理分式矩阵。如果存在m ⨯m 满秩（多项式）矩阵P 1(λ)

和m ⨯n 多项式矩阵Q 1(λ)，使得

-1G (λ)=P 1(λ)Q 1(λ) 3－26

则式3－26称为G (λ)的一个左分解，或G (λ)的一个左矩阵分式描述。当P 1(λ)和

Q 1(λ)为左互质时，式3－26称为G (λ)的一个左既约分解。

如果存在n ⨯n 满秩（多项式）矩阵P 2(λ)和m ⨯n 多项式矩阵Q 2(λ)，使得

G (λ)=Q 2(λ)P 2-1(λ) 3－27

则3－27式称为G (λ)的一个右分解，或G (λ)的一个右矩阵分式描述。当P 2(λ)和Q 2(λ)为右互质时，3－27式称为G (λ)的一个右既约分解。

-1-1

注意这里的P 1(λ) 与P 2是指有理分式范围内的逆。

定理3－18 任何m ⨯n 有理分式矩阵G (λ)都存在左分解、右分解、左既约分解及右

既约分解。

证明证法一思路源于定理3－17中G (λ)的标准形的构造过程。

⎡T 0(λ)⎤⎡ϕ(λ)⎤-1⎡T (λ)⎤-1-1

()()G (λ)=P -1(λ)⎢Q λ=P λQ (λ) ⎢⎥⎥⎢⎥E m -r ⎦⎣0⎦0⎦⎣⎣

-1

其中T 0(λ)=diag t 1(λ), , t r -1(λ)，ϕ(λ)=diag ϕ1(λ), , ϕr (λ)。取

()

⎡T 0-1(λ)⎤⎡ϕ(λ)⎤-1

()P 1(λ)=⎢P λ，()Q λ=Q (λ)， ⎥1⎢⎥E m -r ⎦0⎦⎣⎣

-1

就得到G (λ)的一个左分解G (λ)=P 1(λ)Q 1(λ)。

进一步地，令R (λ)是P 1(λ)和Q 1(λ)的最大左公因式，则有

P 1(λ)=R (λ)P (λ), Q 1(λ)=R (λ)Q (λ)。

即有P (λ)和Q (λ)是左互质的。由于R (λ)可逆，得G (λ)=P 1□ 有理分式矩阵的左、右分解是不唯一的。说明左、右分解的存在性可使用下列证法。

证法二对m ⨯n 有理分式矩阵G (λ) ，记第i 行分母的最小公倍式为b i (λ) ，则

-1

(λ)Q 1(λ)=P -1(λ)Q (λ)。

b i (λ) ≠0（i =1, 2, , m ）。取P {b 1(λ), , b m (λ)}，则P 1(λ) 满秩，1(λ) =diag

-1Q 1(λ) =P 1(λ) G (λ) 为多项式矩阵，从而有G (λ) =P 1(λ) Q 1(λ) 为一个左分解。

同理，可证右分解的存在性。例3-20 求传递函数矩阵

s +1⎡

⎢(s +2) 2(s +3) 2

G (s )=⎢

⎢-s +1⎢(s +3) 2⎣

的一个右分解及一个左分解。

解容易求出G (s ) 的列最小公分母依次为

s ⎤

(s +3) 2⎥

⎥ s ⎥-

(s +3) 2⎥⎦

d c 1(s ) =(s +2) 2(s +3) 2，d c 2(s ) =(s +3) 2

因此得G (s ) 的一个右分解

s +1⎡

G (s )=⎢22

()()-s +1s +2⎣

又G (s ) 的行的最小公分母为

s ⎤⎡(s +2)2(s +3)2

⎢-s ⎥⎦⎣

⎤

2⎥

(s +3)⎦

-1

d r 1(s ) =(s +2) 2(s +3) 2，d r 2(s ) =(s +3) 2

所以G (s ) 的一个左分解为

⎡(s +2)2(s +3)2

G (s ) =⎢

⎣2

⎤⎡s +1s (s +2)⎤

⎥ 2⎥⎢

(s +3)⎦⎣-(s +1)-s ⎦

-1

§8 舒尔定理和矩阵的QR 分解

一、舒尔定理

定理3－19（舒尔定理）对于A ∈C

n ⨯n

，存在酉矩阵U ，使得U

AU =T 。这里T 是

上三角矩阵，且对角线上的元素都是A 的特征值。

证明：设A 的特征值为λ1, λ2, , λn 。

（1）设ε1为A 的属于特征值λ1的单位特征向量。把ε1扩充为C 的一组标准正交基

ε1, η2, , ηn ，并设酉矩阵U 1=(ε1, η2, , ηn ) 。则

⎡1T ⎤⎢⎥T

⎡λ⎢2⎥H

U 1AU 1=⎢⎥(λ1ε1, A η2, , A ηn )=⎢1

⎣0⎢ ⎥

⎢T ⎥⎣n ⎦

*⎤。 ⎥A 1⎦

由于相似矩阵具有相同的特征值，所以A 1的特征值是λ2, , λn 。

（2）设ε2∈C n -1为A 1的属于特征值λ2的单位特征向量。重复（1）的步骤，可得，

存在n -1阶酉矩阵V 2，使得

V 2H

⎡1⎣

⎡λ2

A 1V 2=⎢

⎣0*⎤

。 A 2⎥⎦

令U 2=⎢

⎤

，则U 2和U 1U 2都是n 阶酉矩阵，并且 ⎥V 2⎦

⎡λ1

H H U 2U 1AU 1U 2=⎢⎢

⎢⎣

λ2

*⎤

⎥。 ⎥A 2⎥⎦

（3）继续重复过程（2）n -3次，可以依次得到n -k (k =2, 3, , n -2) 阶的酉矩阵V k

及相应的n 阶酉矩阵U k ，并令U =U 1 U n -1，即得所证。□

注1 若A 是实矩阵，且A 的特征值恰好全为实数时，则特征向量可选为实向量，而

n ⨯n

定理3－20 ∀ε>0，对于A ∈C ，存在可逆矩阵P ，使得

⎡λ1b 12 b 1n ⎤

⎢λ2 b 2n ⎥-1⎥， P AP =⎢0 ⎢⎥⎢λn ⎥⎣⎦

而且

i , j =∑b ij

证明：由舒尔定理，知存在酉矩阵Q ，使得

⎡λ1⎢

-1

Q AQ =⎢

⎢0⎢⎣

ρ12 ρ1n ⎤λ2 ρ2n ⎥

⎥。 ⎥λn ⎥⎦

令F =diag r , r 2, , r n ，其中r 为非零常数。取T =QF ，即有

()

⎡λ1

⎢

-1-1⎢T AT =F

⎢0⎢⎣

ρ12 ρ1n ⎤λ2 ρ2n ⎥

⎡λ1⎢⎥F =⎢ ⎥⎢0

⎢

λn ⎥⎦⎢⎣r ρ12 r n -1ρ1n ⎤

⎥

λ2 r n -1ρ2n ⎥

。 ⎥

⎥λn ⎥⎦

选取适当地r ，即得定理的结论。□

二、矩阵的正交三角（QR ）分解

定理3－21（QR 分解定理）设A 为n 阶复数矩阵，则存在酉矩阵Q 及上三角矩阵R ，

使得A =QR 。

证明：得到矩阵A 的QR 分解的方法，类似于施密特正交化过程。（1）设A =(α1, α2, , αn )。

若α1=0，则取β1=0；若α1≠0，则取β1=

α1

。 1

γ2

。 γ2

γ2=α2-(α2, β1)β1。若γ2=0，则取β2=0；若γ2≠0，则取β2=

若γ3=0，则取β3=0；若β3≠0，则取β3=γ3=α3-(α3, β1)β1-(α3, β2)β2。………………………………………………

γ3

。 γ3

γn =αn -∑(αn , βi )βi 。若γn =0，则取βn =0；若γn ≠0，则取βn =

i =1

n -1

γn

。 n

β1, β2, , βn 两两正交，并且或者为单位向量，或者为零向量。

（2）反过来，有

α1=r 11β1，

当α1=0时，r 11=0；当α1≠0时，r 11=1。

α2=r 12β1+r 22β2，

当β1=0时，r 12=0；当β2=0时，r 22=0；当β2≠0时，r 22=

………………………………………………

β2。

αn =r 1n β1+r 2n β2+ +r nn βn ，

当βi =0时，r in =0, (i =1, , n -1)；当βn =0时，r nn =0；当βn ≠0时，r nn =

于是

βn 。

⎡r 11

⎢

A =(α1, α2, , αn )=(β1, β2, , βn )⎢

⎢⎢⎣

r 12r 22

r 1n ⎤ r 2n ⎥⎥=Q R 。

⎥

⎥r nn ⎦

（3）取出Q 1中的所有非零列向量βi 1, βi 2, , βi s ，将其扩充为C 中的一组标准正交

注：当A 是可逆矩阵时，R 的对角线上的元素都是正的。此时的Q 和R 是唯一的。

§9 矩阵的奇异值分解

定理1 设A ∈C

m ⨯n

，则存在酉矩阵P 和Q ，使得

⎡D 0⎤

。 P H AQ =⎢⎥

⎣00⎦

这里D =diag (d 1, d 2, , d r )，且d 1≥d 2≥ ≥d r >0。d i (i =1, 2, , r )是A A 的正

特征值的平方根，称为A 的奇异值。而

⎡D 0⎤H

A =P ⎢Q ⎥

⎣00⎦

称为A 的奇异值分解。

证明：（1）矩阵B =A A 是Hermite 矩阵，且特征值非负。

设x 是A A 的属于特征值λ的特征向量，则(Ax , Ax )=x H A H Ax =λx H x ≥0，而

x H x =(x , x )>0，所以λ≥0。

（2）寻找Q

222设A A 的特征值为d 1，其中d 1≥d 2≥ ≥d r >0，其余皆为零。 , d 2, , d n

由于A A 是Hermite 矩阵，所以存在n 阶酉矩阵Q ，使得

(

⎡D 2

A A Q =⎢

⎢⎣0

)

0⎤

⎥。（1） 0⎥⎦

n ⨯r n ⨯(n -r )将Q 分块为Q =[Q 1 Q 2]，Q 1∈C r 。将（1）式写成 , Q 2∈C n -r

(

则有A H AQ =Q D , 11H 注意到Q 1Q 1

⎡D 2

A A Q =Q ⎢

⎢⎣0

)

0⎤

⎥， 0⎥⎦

（2） A H AQ 2=0。

H H

E r ，所以有Q 1A AQ 1

=D ，或写成AQ 1D

(

-1H

)(AQ D )=E

-1

r 。

H H

由（2）中的第二式，得Q 2A AQ 2=0，即AQ 2=0。

（3）寻找P

-1H

令P ，则=AQ D P 1的r 个列是两两正交的单位向量，记做111P 1=E r ，即P

m P 的标准正交基，记增添的向量为1=(p 1, p 2, , p r )。将p 1, p 2, , p r 扩充为C

p r +1, , p m ，构造矩阵P 2=(p r +1, , p m )，则P =(P 1 P 2)是m 阶酉矩阵，于是可得

H ⎤⎡P ⎡D 0⎤1P AQ =P (AQ 1 AQ 2)=⎢H ⎥(P 1D , 0)=⎢⎥。□

00⎢⎣⎦⎣P 2⎥⎦H

注：A 的奇异值由A 唯一确定，但P 和Q 一般不是唯一的。

⎡101⎤

⎢⎥例求矩阵A =011的奇异值分解。 ⎢⎥⎢⎣000⎥⎦

⎡1⎤

⎢⎥H

解 B =A A 的特征值为3，1，0，对应的特征向量分别为1, ⎢⎥

⎢⎣2⎥⎦

⎡1⎤

⎢-1⎥, ⎢⎥⎢⎣0⎥⎦

⎡1⎤

⎢1⎥。 ⎢⎥⎢⎣-1⎥⎦

⎡3⎤

Rank A =2，D =⎢⎥。

1⎦⎣

⎡

⎢⎢Q =⎢

⎢⎢⎢⎣

161626

12120

1⎤⎥3⎥1⎥

。 ⎥31⎥-⎥3⎦

-1

P 1=AQ 1D

⎡

⎢⎢=⎢⎢⎢⎢⎣

12120

1⎤⎡

⎢2⎥0⎡⎤⎥⎢

1⎥⎢⎥，P 2=0，P =⎢-⎢⎥⎢2⎥

⎢⎥1⎢⎣⎦0⎥

⎥⎢⎦⎣

120

12102

⎤0⎥⎥0⎥。 ⎥1⎥⎥⎦

第三章矩阵的标准形与若干分解形式-2

相关内容

热门内容

标签