不等式知识
目录:
三道小题
(一)一些基础。。。
(二)不等式的一些直观解释。。。 (三)谈谈放缩法。。。 (四)杂谈 关于配方法。。。 (五)杂谈 差分代换。。。
(六)杂谈 谈谈切线法及其推广 (七)介绍几个重要的不等式①。。。 (八)介绍几个重要的不等式②。。。 (九)杂谈 再谈配方法。。。。
(十)关于函数实根分别和不等式解集问题。。。。。。。
(十一)谈谈齐次形式不等式的程序化处理①对称整理类。。。 (十二)谈谈齐次形式不等式的程序化处理②Schur 拆分法。。。 (十三)细化赫尔德(Hölder) 不等式&引入闵可夫斯基(Minkowski)不等式。。。。 (十四)幂平均函数及其他。。。。。。。 (十五)SOS 定理。。。
(十六)凸函数理论及受控理论。。。
(十七)杂谈 克劳修斯(Clausius )不等式与热力学第二定律。。。。 (十八)关于机械化方法的历史。。。 (十九)多元函数极值的偏导方法。。。。 (二十)解析——几何与代数的桥梁 小测试 A (轮换不等式) 小测试 B (含参情况) 小测试 C (对称破缺)
出三道小题,作为你们的自我检测,如果做不上来,你你还需要多练习练习。如果可以,那我们继续看:
①对于实数 x , y , z 证明:
②求 f(x) = x^x 的最小值。
③对于正数 a , b , c 满足 a + b + c = 1 , 证明:
感觉如何?一般来说都可以做出来,我们继续。
一) 一些基础。。。
因为懒,我们发明了这么两个符号:
sss. 这是懒到cyc 都不写了。。。 之后不引人sym ,(写起来)太麻烦。。。
因为懒,再引入逻辑符号:且& ,或|| ,推出=> ,逆推出 ,当且仅当iff 我总说的sss. 是“事实上”的意思。。。 说说基本性质:
三分律:任何两个实数都有确定的序关系。
对逆性:a > b b
传递性:a > b || b > c => a > c.
单调性:a > b => a + c > b + c. 完事了。。简单吧。。。
谈谈“加糖原理”(糖水不等式,糖水更甜原理and more...):
这个式子看似简单,到IMO 上去也能用得着。。。例如IMO46: 对于正数 x , y , z 满足xyz ≥ 1证明:
证明:设x = k a , y = k b , z = k c使得abc = 1
(这样就完成了齐次化工作,根据后面点知识很容易证明下式)
sss. 我们经常用加糖原理证明一类条件上带有不等号的结论。 加糖原理可推广至“溶液混合原理”:
更广泛的是“加权混合原理”:
这些式子可以通过他们的名字去简单的理解。
对于(很多高端的)不等式来说,绝对值既基础又高端。。 二元形式的(绝对值)三角不等式: 对于实数a , b(可推广至复数或向量),有: n 元形式的(绝对值)三角不等式: 对于实数a_k(可推广至复数或向量),有:
三角不等式是度量空间的基本性质,无论对那种度量来说,三角不等式都是成立的。
对许多中学生来说度量即: 这很好。。sss. 非负性,同一性,对称性,三角不等式是度量空间的四条腿。。。在很多时候将式子放到其他度量空间中研究,会事半功倍。
二) 不等式的一些直观解释。。。
有人说:“什么是不等式, 我看不懂代数结构啊。”
众所周知,你看的书要是有图,自己要是不板着点,过一会你就变成看图不看字了。。。 所以我就要你看图。。。 为什么f(x) = x^2≥0?
OK,
看明白了。。
为什么68 - 120 x + 40 x^2 + 10 x^8 + 2 x^9 + x^10 ≥ 60 x^3 - 124 x^4 + 40 x^5 - 9 x^6 + 34 x^7 68 - 120 x + 40 x^2 + 10 x^8 + 2 x^9 + x^10 -(60 x^3 - 124 x^4 + 40 x^5 - 9 x^6 + 34 x^7) = (x - 1)^2 (x^2 + 4 x + 17) (x^3 - 2)^2 ≥ 0. 我上哪知道去!!! 看看图吧。。
大于1那部分真是相当紧。。。
也不是那么紧吗。。。这就是画图的劣势。。 二元的也一样:
为什么(a + b)/2 ≥ sqrt(ab)呢? 如图:
对于三元形式,我们可以用动态规划的方法理解: 对于条件a^2+b^2+c^2=2 , a+b+c
的最小值如何?
看出a+b+c=√6时,两图像相切。所以根据高中线性规划的知识可知a+b+c≥√6,当且仅当a=b=c=√6/3时取等。
(三)谈谈放缩法。。。
原则上没有一个绝对的最强不等式,只有满足一定条件限制的最强情况。 就比如说三元三次完全对称形整式中最强的为三次Schur
不等式: 对于正数a , b , c有:
但是去掉条件整式,我们提出来这个式子: 对于正数a , b , c有:
可见,我们传说的Schur 也被放缩了。。。
所以说,一切不等式原则上都可以用放缩法解决。。。只是简不简单了。。。 为了形象的理解,我们用一元不等式作图解释: 利用公切线y = x放缩证明:exp(x)-1 ≥ x ≥ ln(x+1).
放缩是无穷无尽的:
1+x ≤ 1+x+x^2/2 ≤ 1+x+x^2/2+x^3/6 ≤ 1+x+x^2/2+x^3/6+x^4/24 ≤ 1+x+x^2/2+x^3/6+x^4/24+x^5/120 1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720 ≤ 1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720+x^7/5040 1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720
+x^7/5040+x^8/40320
1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720+x^7/5040+x^8/40320+x^9/362880
1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720+x^7/5040+x^8/40320+x^9/362880+x^10/3628800 ≤ ... ≤ exp(x)
≤ ≤ ≤ ≤
推广(包括证明方法)与紧化是不等式专家们不懈追求的东西,更是他们的乐趣所在。事实上,发现问题比解决它
更为重要,漂亮的解决一个问题,是不等式爱好者们喜欢追求的东西,提出一个漂亮的问题,是不等式专家们热衷的话题。
四次Schur 是一个强度一般的结论,我们提出了一些补充: 三元四次完全对称不等式中,最强的为:
可转化为基本对称多项式的形式:
附带说一下:
三元四次轮换对称不等式中,最强的为:
容易看出,这里面出现了参数p ,而三次Schur 却是被固定的参数,这是因为不等式的自由度增加了,自由度这个词我从分析力学中借用过来,可能有更规范的说法,我不去探寻了。 为了方便,先设:
三元三次完全对称最强不等式,要满足
1. 完全对称,所以根据对称多项式基本定理,不妨设: 2. 均值取等: 27 + 9 x + y = 0. 3. 最强:
证明得到:x = -1 , y = 6 化简得到熟悉的三次Schur 。。。
但是四次的就不好办了。。。还是这三个条件,到最后还有一个是自由变量。。。 同样的n 次情况有n - 3个自由变量,非常难办。。。不信可以试试。。。。
连续放缩条件:
对于F(x_1,x_2,...,x_n) ≥ G(x_1,x_2,...,x_n)的证明过程中涉及到放缩f 且能取得等号,则
一般的,对于一组连续放缩: 可以取等,则有:
这给了放缩法最重要的参考条件——根据取等条件放缩。
(四)杂谈 关于配方法。。。
(这讲里面说的是关于变量在整个实数域上的配方,而不是条件配方)
上面说的都是初等不等式,事实上,还有什么微分不等式,积分不等式,图论不等式等等等等。。。一个人一辈子要是能都有研究,那可真是太厉害了。。。。反正我是做不到也不想做到。。第一,我没兴趣。第二,这最重要,我可是学化学的!!!
举几个有关配方的例子:
对于初等不等式,最重要的原理就是: 对于实数x ,x^2 ≥ 0.
举个例子,对于实数x , y ,证明x^2 + y^2 ≥ 2 x y . 显而易见x^2 + y^2 - 2 x y = (x - y)^2 ≥ 0 . 这个例子真是太简单了,你快要笑话我了。。。 再举一个,对于实数x , y,证明x^2 + y^2 ≥ x y . 证明一:x^2 + y^2 - x y = (x - 1/2 y)^2 + 3/4 y^2 ≥ 0 .
证明二:x^2 + y^2 - x y =
一看就霸气侧露。。。 证明三
:x^2 + y^2 -
x y
=
这是由“自由度”引出的无穷个小证明,事实上,配方常常是多种多样的。。。 再举个栗子:对于实数x , y ,-2 ≤ k ≤ 2 ,证明x^2 + y^2 ≥ k x y . x^2 + y^2 - k x y =
当然,你可能觉得这都太无聊了。。。我也是,我考场上证明绝对不用这种损招。。 配方的方法呢,我认为有三个:基础流配方,直觉配方,综合配方。。 事实上还有SOS 定理,那是一种不够直截了当的方法,所以后面再说。
所谓基础流,就是老老实实算,老老实实配,应用一些基础的东西,比如拉格朗日(Lagrange)恒等式:
给出它的二元形式和三元形式:
二元:(a^2 + b^2)(c^2 + d^2) - (a c + b d)^2 = (b c - a d)^2 三元:(a^2 + b^2 + c^2)(x^2 + y^2 + z^2) - (a x + b y + c z)^2
= (a y - b x)^2 + (a z - c x)^2 + (b x - a y)^2 + (b z - c y)^2 + (c x - a z)^2 + (c y - b z)^2 待定系数法配方:
以上面证明证明x^2 + y^2 ≥ 2 x y的第二种方法为例,设:
x^2 + y^2 - x y = (a x - b y)^2 + (a y - b x)^2 = (a^2 + b^2) x^2 - 4 a b x y + (a^2 + b^2) y^2 则有:a^2 + b^2 = 1 & - 4 a b = -1,一共有四组解,其中一组就是上面那个。。。 待定系数配方还会在后面讲到。在此分散难度,只做介绍。
小Q
代数变换提取因式配凑方法,那是小Q 等人的绝技,我学不来。。。
利用矩阵方法半定规划。。。。我讲了你能明白吗。。
。更重要的是,我能讲明白吗。。。。。
直觉配方,就是一种传说中的神秘方法,只可意会不可言传,持有配方直觉的神秘之人,可以凭空配方,百步穿杨,无一失手,堪称奇迹!
比如说:
虽说是直觉配方,但也是有一定方向,第一,这种差分配方法,若是能取等,那么:
这对初中生也是很显然的。。。
第二,对于一个齐k 次式,配出来的结果也应该是齐k 次式。 这两个原理虽说简单,但是很基本,也很好用。。。。
综合配方就是先直觉猜出点什么东西,再基础配方优化。。。 这个举不了例子。。。我好像没怎么用过。。。
比如说证明拉格朗日恒等式时,将式子逐步调整成熟悉的平方和形式(只能靠经验):
今天讨论的都是定义在R 上的变量,对于有限制的变量,比较复杂, 1. 配方法的理论基础在希尔伯特(Hilbert )第十七问题:
为实系数多项式,且对每个
都有
,
则 可以表成实系数有理函数的平方和。
这个问题在1927被阿廷(Emil Artin)解决,他的证明是简洁但高深的。。。我们这个定理知道就好。。。 2. 利用矩阵方法配方。
实多项式F(x)可以表达成:
F(x) = z^T Q z
Q = L^T L
我们还是举例说明吧。
。。
根据一点线性代数的方法可以求得:
所以:
我们试图证明这样一个式子来说明点什么:
对于实数 x , y , z ,证明:
x^2 + y^2 + z^2 - x y - y z - x z ≥ 0. 注意到:
这是这样来的: >> pvar x y z;
>> p = x^2 + y^2 + z^2 - x*y - y*z - x*z; >> [Q,Z,D]=findsos(p,'R'); Size: 9 6
SeDuMi 1.3 by AdvOL, 2005-2008 and Jos F. Sturm, 1998-2003.
Alg = 2: xz-corrector, Adaptive Step-Differentiation, theta = 0.250, beta = 0.500 eqs m = 6, order n = 4, dim = 10, blocks = 2 nnz(A) = 6 + 0, nnz(ADA) = 36, nnz(L) = 21 it : b*y gap delta rate t/tP* t/tD* feas cg cg prec 0 : 3.13E+00 0.000
1 : 1.11E-02 1.70E-02 0.000 0.0055 0.9990 0.9990 1.35 1 1 1.4E-02 2 : -6.72E-10 5.05E-09 0.000 0.0000 1.0000 1.0000 1.00 1 1 5.6E-07 3 : -9.25E-16 1.05E-14 0.000 0.0000 1.0000 1.0000 1.00 1 1 1.0E-12
iter seconds digits c*x b*y
3 0.1 14.9 0.0000000000e+00 -9.2518588107e-16
|Ax-b| = 6.6e-15, [Ay-c]_+ = 0.0E+00, |x|= 2.1e+00, |y|= 6.8e-01
Detailed timing (sec) Pre IPM Post
4.003E-03 2.200E-02 1.006E-03 Max-norms: ||b||=1, ||c|| = 0,
Cholesky |add|=0, |skip| = 1, ||L.L|| = 2.
Residual norm: 6.6075e-15
iter: 3
feasratio: 1.0000 pinf: 0 dinf: 0 numerr: 0
timing: [0.0040 0.0220 0.0010] wallsec: 0.0270 cpusec: 0.0625
>> D D =
[ 0.8165*x - 0.40825*y - 0.40825*z] [ -0.40825*x + 0.8165*y - 0.40825*z]
[ -0.40825*x - 0.40825*y + 0.8165*z]
这个比较容易,仔细看看0.8165就是\sqrt{\frac{2}{3}},0.40825就是\frac{1}{\sqrt{6}}。。。 当然,我可不知道老先生是怎么优化的。。。MATLAB 毕竟是数值软件,用的是浮点数,能变成他的那一串漂亮的配方也真是需要点技术。。。。。否则啊,比如第一个:
真让人无处下手。。。。
有很多人,认为陈计先生的证明都是索然无味的,没有技术的,只要用软件就可以完成。这是完全错误的,诚然,陈计先生的证明多数依靠了计算机,但不是你有计算机,我有计算机就可以实现的。他有许多精巧的想法是可贵的,值得我们学习研究。
五)差分代换。。。
提到差分,我们觉得不太熟悉,但是微分我们很熟悉。。。这事实上有点本末倒置的感觉。差分,又名差分函数或差
分运算,是数学中的一个概念。它将原函数f(x)映射到 f(x+z)-f(x+b)。它和微分之间千丝万缕的联系不言而喻。。。 比起风姿卓越的差分配方,差分代换就好像一个破落户,一个大恶魔,大家看到了就想骂街。。。他惨无人道的破坏人见人爱的轮换性,非常符合鲁迅给悲剧的定义:“悲剧就是把美好的东西撕碎给你看,然而,把已经撕碎的东西再从新拼回给你看,那种不可名状的淡淡忧伤令人彷徨不安。
” 但是,差分代换很多时候十分有效且简洁明了,应当了解。
看看这种差分代换(增量代换)方法的基本步骤,暂且以三元为例: 1. 分类①x ≥ y ≥ z②y ≥ z ≥ x③z ≥ x ≥ y④x ≥ z ≥ y⑤y ≥ x ≥ z⑥z ≥ y ≥ x.
常常可以根据对称性少讨论几个,轮换对称时可以设最大变量,从而固定一个只需讨论①x ≥ y ≥ z②y ≥ z ≥ x,完全对称时,可以完全设序,只讨论一个就够了。
2. 记每一种情况为a ≥ b ≥ c,则设b = c + s , a = c + s + t ,其中s ≥ 0 , t ≥ 0. 3. 代换,f(a , b , c) = f(c + s + t , c + s , c).
4. 整理,一般为合并同类项,若合并之后还有减号,试着配方,或者再差分一次试试。 差分代换的适用范围也比配方小,代换之后不一定行,没准还是带减号的,这很麻烦。。。 不过这不妨碍我们用它,要有信念,行! 举个例子:
证明三元三次形式的Schur 不等式:
当然,Schur 不等式的普遍形式的证明也是差分代换的思想。。。 证明三元形式的Schur 不等式: 对于正数x , y , z , t 有: 证明:
对于带参数的不等式,若利用差分代换方法求k 的范围(即求解系数列表),结果是充分的,必要性需要另外证明。。。比如说上面的三元四次轮换对称型,求解就是充分不必要的。。但是这毕竟是一个不错的方法,现在举一个用差分代换求k 范围的简单例子:
对于正数a , b , c 和 k ≥ 1/2 ,证明:
k(a^3+b^3+c^3)+3(1-k)abc ≥ a^2b+b^2c+c^2a
证明:设a ≤ b ≤ c,b=a+s
,c=a+s+t
若
p > q ,则显然 f(a,b,c,p) ≥ 0 可由 f(a,b,c,q) ≥ 0 推出。 由红字部分推出, f(a,b,c,k) ≥ 0 的充分条件是 k ≥ 1/2 。 事实上,如果2k-1
这种情况是类似的。
再加一个例子:
对于正数
a , b , c 求满足下式的k 的最小值:
设a ≤ b ≤ c
求解所有含k 系数A - B k ≥ 0,找出最小值k ≥ 199/39 = 5.10256…,得到不等式成立的充分条件。
设b = c + s , a = c + t ,其中s ≥ 0 , t ≥ 0,f(a , b , c) = f(c + t , c + s , c).
这可以避免仅轮换对称的式子的讨论,但往往需要后续处理。这种方法当然也适用于完全对称,减小了运算量,甚至在完全对称时收到比f(a , b , c) = f(c + s + t , c + s , c)更好的效果,这是很神奇的。。。 类似还有f(a , b , c) = f(q p c , p c , c) , p ≥ 1 , q ≥ 1有时能有收效。。。 比如证明三元三次形式的Schur 不等式:
用mathematica 求解这个三次函数
f(p) = p^3 q^3-p^3 q^2-p^3 q+p^3-p^2 q^2+3 p^2 q-p^2-p q-p+1 ≥ 0.
In[18]:= Reduce[p^3 q^3-p^3 q^2-p^3 q+p^3-p^2 q^2+3 p^2 q-p^2-p q-p+1>=0,p] Out[18]= p\[Element]Reals&&((q=Root[1+(-1-q) #1+(-1+3 q-q^2) #1^2+(1-q-q^2+q^3) #1^3&,3]))||(0=Root[1+(-1-q) #1+(-1+3 q-q^2) #1^2+(1-q-q^2+q^3) #1^3&,1])||q==1||(q>1&&p>=Root[1+(-1-q) #1+(-1+3 q-q^2) #1^2+(1-q-q^2+q^3) #1^3&,1]))
仔细看看,这对于 p ≥ 1 , q ≥ 1是显然的。。。即:
In[19]:= Reduce[{p^3 q^3-p^3 q^2-p^3 q+p^3-p^2 q^2+3 p^2 q-p^2-p q-p+1>=0,p>=1,q>=1},p]
Out[19]= q>=1&&p>=1
暂时这样吧,事实上没人真的看得进去差分的结果。。
。
(六)谈谈切线法及其推广
切线法是个人见人爱小妖精,她不破坏漂亮的轮换结构,却打破了齐次式。。。这注定她与配方的贵族气概还有一定的差距。。。不过因为不经大脑,所以我比较喜欢。。。。
经典的切线法,旨在解决一种条件轮换对称型:
取等条件为均值取等。
切线法的核心在于分离出单一变量的函数。
证明切线和原曲线位置关系常用分解因式的方法,这是因为:
求等条件处为切点,对于单元函数,一定可以得到一种分解因式的表达形式。
有人问,为什么不用凸函数性质说明问题,第一,凸函数很高深,不容易理解,第二,不是凸函数也可以用切线法,例如:
然而:(x^4 + 13 x^2 - 6 x^3)'' = 12 x^2 - 36 x +26
并非恒大于零。 切线法很多人讲过,我不说了,美利坚的那三道题是切线法的典例。。。 说一说推广:
①在对称性上推广,并非只有轮换性才能切线,非轮换型也可以: 对于f_i的切线g_i和g_i的和为C ,则证明
不对称情况也可以用切线法,例如:
对于实数 x , y , z 满足x + y + z ≥ 7 证明:
x^2+(y+2)^2+(z+2)^2≥3. 证明:
x^2+(y-2)^2+(z-2)^2≥2(x-1)+1+2(y-3)+1+2(z-3)+1=2(x+y+z)-11≥3. 我们常常使用待定系数的方法来证明这类问题。
对于实数 x , y , z 满足x + y + z ≥ C ,求f(x)+g(y)+h(z)的最小值:
求f'(x0)=g'(y0)=h'(z0)&x0+y0+z0=C.验证切线与原函数的位置关系,若满足: f(x)≥f'(x0)(x-x0)+f(x0),g(y)≥g'(y0)(y-y0)+g(y0),h(z)≥h'(z0)(z-z0)+h(z0). 则f(x)+g(y)+h(z)≥f'(x0)C+f(x0)+g(y0)+h(z0). 推广看:
k1 x+k2 y+k3 z=C
当然可以进一步推广——化直为曲:
有时不要试图用双切线条件,会死人的。。。例如:
证明:不妨设x + y + z = 1
原不等式等价于:
所以:
后一段仍然不易证明。
当然切线法设x + y + z = 1的思路可以使用:
分三类情况讨论可得上式等价于:
显然成立。
②在线上推广——直变曲
因为过去的题找不到了,就用上面说的现编一道:
证明:
③借来指对省运算: 有时:
这个变换会使证明豁然开朗,但是不能乱用,因为分解因式已经失效了,证明切线和曲线位置关系变得复杂起来。。。。 另一种情况,已知x y z = a , g(t) ≥ k t + b.
④在线上推广——线变面
世界上不仅有切线,还有切面(一般不是平的,平的直接看切线就行了),这是人类形象思维能力的极限。。。。 比如说已知p(x , y) + p(y , z) + p(z , x) = a.曲面z = f(x , y) ≥ p(x , y). 求证F(x , y , z) ≥ a就可以转化成:
⑤向大师靠拢——建立新的有效不等式。
人类活在三维世界里面,注定只能理解到三维立体,但是不妨碍代数研究更高的东西。。。 思路即为:
(七)介绍几个重要的不等式①。。。
借助已有的不等式往往需要很好的变形能力,这一点是我难以学会的。
。。。 不过总得知道,没准什么时候就用上了呢。。。 最重要的不等式——赫尔德(Hölder )不等式
设S 为测度空间,0
≤ p , q ≤ ∞,及1/p +
1/q = 1,设f 在L^p(S)内,g 在L^q(S)内。则f g 在L^1(S)内,且有。
若S
取作{1 , ... , n}附计数测度,便得赫尔德不等式的特殊情形: 对所有实数(或复数)x_i,y_i,有:
.
现在我们有两个方向: ①推广
②看明白什么玩应这是!!!!
sss. 赫尔德这个基本形式真的很难用,我们常用的都是它的几种变形: 对于正数
x_i , y_i , p > 1 , 1/p + 1/q = 1
这种形式里面最常用的又是p = 2/3 , q = 3的三元形式:
sss. 这个形式更像卡尔松(Carlson )不等式。。。
。 最经典的例子在IMO42
。。。。 对于正实数a , b ,c,证明:
证明自行百度。。。。
举一个其他的说明一下:
对于正数x , y , z 满足 x y z = 1 , 证明:
证明:设a^3 = x , b^3 = y , c^3 = z , 所以a b c = 1 由赫尔德不等式和米尔黑得(Muirhead )定理可知:
所以说,使用赫尔德不等式需要将\sqrt[3]{ax^2}凑成整式。 一个非常经典的例子:
对于正数a , b , c 满足 a + b + c = 1 ,证明: 证明:
(证明属于arqady )
(八)介绍几个重要的不等式②。。。
把他们三个一起说了,但是不代表最重要的那个只说一次。。。 万式之源,不等式中的王者——代数平均-几何平均不等式。 以及令人闹心的Schur 不等式和
Muirhead 不等式。。。 先说一说:
第一个谁都知道。。。。
Schur 不等式山没说过,再磨叽一遍。。。 对于正数x , y , z , t 有:
三元形式最强,四元形式常常就不够了。。。 还有几个Schur 不等式的推广:
①对于正数 a , b , c . 如果 (a,b,c) 和
(x,y,z) 有相似的排序,那么:
②对于实数a , b , c , x , y , z & a ≥ b ≥ c & ( x ≥ y ≥ z || x ≤ y ≤ z ) & k > 0 & (f:R->R_{0}^{+}是凸函数或单调函数) ,则有:
这是罗马尼亚数学家Valentin Vornicu于2007年证明的。
上面的结论直接建立了Schur 拆分的理论基础。
一个比较弱的结论,Muirhead 定理,常常与Schur 不等式联用,也常常单独使用(这时不等式一般比较弱),但是形式简单,不需要什么特别的智商,所以懒人都喜欢。。。所以,现在我们来看看他的形式: 对于正数x , y , z , a1 ≥ a2 ≥ a3 , b1 ≥ b2 ≥ b3 ,满足:
a1 ≥ b1 & a1 + a2 ≥ b1 + b2 , a1 + a2 + a3 ≥ b1 + b2 + b3 ,则有:
sym 太烦人而且不常用,所以我给出了cyc 的形式。。。 看看单用Muirhead ,一般比较简单:
对于对于正数 a , b , c 满足 a + b + c = 1 ,证明:
证明:
这里面有一个推广形式。。。。
然后举例说说联用Schur 和Muirhead : ①对于正数 x , y , z ,证明:
证明:由Schur 不等式和Muirhead 定理可知:
②对于正数 a , b , c , 0
证明:由Schur 不等式和Muirhead 定理可知:
这都是直接用Schur 的,但是舒尔拆分有所不同,是一种更加程序化的操作,日后再谈。。
。
上面根本就没提到代数平均-几何平均不等式,你可能觉得奇怪,我为什么把他们放一块。。
。。事实上,一切可以用Schur 不等式和Muirhead 定理解决的问题原则上都可以用代数平均-几何平均不等式解决,但是配成代数平均-几何平均不等式结构比较困难,所以懒人是不会做的。。。。 首先明确一下加权形式的代数平均-几何平均不等式:
严格的讲,这是一个概率不等式。。。 可以推广为:
举个栗子:
对于正数 x , y , z ,证明:
证明:由代数平均-几何平均不等式可知:
这道题完全可以用Muirhead 定理解决。。。即:
凑成代数平均-几何平均不等式往往需要待定系数,比如: 对于正数a , b , c , p , q , r , n 满足 p + q + r = n,证明:
证明:由加权形式的代数平均-几何平均不等式可知:
上面这个很好猜,但是对于一般的就很困难了。。。
利用这个证明Muirhead 定理是一种挑战,详细的可以参考《代数不等式》P96。。。事实上,Muirhead 定理反应的是函数的一种优超关系,可以通过每一个双重随机矩阵是置换矩阵的加权平均(伯克霍夫-冯·诺依曼(Birkhoff-von Neumann )定理)证明。。。。
(九)再谈配方法。。。。
配方就是解决多项式不等式的通天之法,因为原则上,一切正定多项式都可以化成二次型。但是往往不易配得,所以这一般用线性代数的方法,不过有一点是:手开矩阵是个很闹心的事情。。。于是我们有待定系数的方法。。。 但是应该配成几项呢?这要是不知道就很困难了。。。比如说: 对于实数 a , b , c ,证明:
竟然配出了27个平方项才解决。
。。这已经令人无法接受了。。。。 所以说,也不要贸然配方,不过对于这样的情况(现在对于实数),你可以直接想待定系数配方: ①一切二元或二次整式,可以整理成两个或n 个平方和
②二次或四次三元整式,可以整理成3个平方和
例如:对于实数 a , b , c ,证明:
2 x^4 + 2 y^4 + 2 z^4 - (x + y) z^3 - (x + z) y^3 -
(y + z) x^3 ≥ 0. 证明:
不要觉得神奇,这都是根据基础流配方得到的。。。
(对于三元四次,只说轮换型的解决方案,不轮换时可以类比,不过就是比较麻烦罢了) 二元二次型:
对应系数相等可以解得:
当t = 0时:
具体情况具体分析,寻找一个使得总体更美观的参数。。。当然,对于二元二次型都很简单,一般只配成t=0的形式,事实上大家都会,不要被我吓到了。。。写出来那个带自由变量p 的只是为了说明配方的多样性。。。 若可以取等,则二元二次型必能配成: 三元二次型:
对于任意情况的求解极为艰深。。。在这里不给出了(latex
命令已经超过2M ),
但需要注意到这个方程是无穷多解的,且自由度为2。。。 三元四次轮换型:
这是两个自由度的。。。
常常可以用的均值取等条件: a_1+a_2+a_3+b_1+b_2+b_3=0 这样只剩下一个自由度。。之后的就是寻找一个漂亮的参数了。。。a3=0时在给出a1:
其他项就容易配得了。。。
关于漂亮的参数的一点解释,例如上面的例子:a1=0时:
虽然也说明了问题,但是看起来很不舒服。。。 对于三元六次不等式,配方常常很困难。。。例如三次平均值不等式: 对于实数x , y , z ,证明: x^6+y^6+z^6\geq 3x^2y^2z^2. 由于人懒,交给软件解决了。。。反正他配出来是10项,这已经可以让你想要四处骂人了。。。。
但是我们遇到的问题常常是定义在正数集上的。。。这增加了配方的变化,即:
其中f(x,y,z) ≥ 0,另外如果等号能够取得,那么在满足取等条件g 的解集{(x.y.z)|g(x,y,z)=0}中的元素亦满足p_i(x,y,z)=0
对于三元齐n 次整式来说:
例如:
对于正数x , y , z ,证明:
x^3+y^3+z^3 ≥ x^2 y +y^2 z+z^2 x. 证明:
对于定义在正数集上的三元三次轮换整式:
补充一个均值取等条件b_1+b_2+b_3=0
再利用规划方法求得{(a_1,a_2,a_3,b_1,b_2,b_3)|a_1>0&a_2&a_3} 也可能一组也求不到。
。。例如三次Schur ,令a_2=m>0,a_3=n>0
这时候只好用SOS 定理(后面会证明)解决。。。 用两个或三个f_i组提高自由度仍是失败的。。。这一定程度说明轮换性配方对于三次Schur 失效了,可以试着打破轮换性,或者将x 换成a^2,根据希尔伯特-阿廷定理,这是一定的这很麻烦我不试了。。。。
(十)关于函数实根分别和不等式解集问题。。。。。。。 现在我感觉好害怕。。。事实上你也应该这么觉得,这一讲背后有传说中的代数几何。。。 但是现在,我们讨论很简单。。。。 一次型为正: a x + b ≥ 0 ①a0 & x ≥ -b/a
对于x ∈[m,n],a x + b>0成立的的(a,b): 现设f(x)=a x + b ①a>0 & f(m)≥0 ②a=0 & b≥0 ③a
①a=0,转化成一次型
②a>0, △ ≥ 0 || x ≥ -b/(2 a) + 1/2 △^(1/2)/a} || △ ≤ 0
③a
|| △ ≥ 0 & -b/(2 a) + 1/2△^(1/2)/a ≤ x ≤ -b/(2 a) - 1/2△^(1/2)/a 对于x 非负成立的的(a,b,c): 现设f(x)=a x^2 + b x + c. ①a>0
1.-b/(2a)
2.-b/(2a)≥0 & f(-b/(2a))≥0 ②a=0 转化成一次型 ③a
关于三次函数的杨路判别定理:
十一)谈谈齐次形式不等式的程序化处理①对称整理类。。。
(上面讲到的关于函数实根分别和不等式解集问题和后面讲到的TTK 条件是PQR 方法的得力助手) 现在说这些方法适用于八次以下,只是因为八次以上的情况处理起来有点麻烦。。。不是不能用,甚至齐次都可以放宽,具体的自己试试。。。。
主要是PQR 代换,类似的还有uvw 法,还有什么什么什么什么都差不多。。。。 涉及这样一种东西——对称多项式——可以用sym 符号表达的式子:
事实上,对称多项式是一种特殊的多元多项式。假设一个n 元多项式P(X1, X2, ..., Xn) ,当其中的n 个不定元任意交换后,多项式仍维持不变,就称其为对称多项式。严格的说法是,如果对任意的n 元置换σ,都有P(Xσ(1), Xσ(2), ..., Xσ(n)) = P(X1, X2, ..., Xn),就说P 是对称多项式。
容易证明,这种多项式都可以化成“基本对称多项式”,我们暂时只看三元形式: 设p = x + y + z , q = xy + yz + zx , r = xyz
则对称多项式可以表达为:
例如:
对于五次以下的对称多项式,可以化成关于r 的一次函数,即 F(x , y , z) = G(p , q , r) = k r + b
这时利用你的一次函数知识和 p^2 ≥ 3 q , q^3 ≥ 27r^2 , p^3 ≥ 27r 即可证明。。。 对于五次及以上八次及以下的对称多项式,可以化成关于r 的二次函数,即 F(x , y , z) = G(p , q , r) = a r^2 + b r + c
这时利用你的二次函数知识和 p^2 ≥ 3 q , q^3 ≥ 27r^2 , p^3 ≥ 27r 即可证明。。。 对于八次以上的式子,往往需要(不是一定)需要高次函数的知识,这就很麻烦。。。而且超过四次的方程就不一定有解析解了,这时讨论步履维艰。。。
试试用PQR 方法证明三次Schur 不等式: 设p = x + y + z , q = xy + yz + zx , r = xyz 则有p^2 ≥ 3 q , q^3 ≥ 27r^2 , p^3 ≥ 27r
更细化的证明用到了TTK 条件,后面介绍,这里仅以图像说明问题:
可以看出红色是绿色的子集。 更多的举例就免了。。。可以看看密闭房间做过的不少题,他是这方面的专家。。。。
事实上我不怎么喜欢PQR 代换这种方法,他既破坏了对称性,又破坏了轮换性,更加符合鲁迅老人家的悲剧定义了。。。而且简洁性也失去了,这才是我不能接受的。。。
PQR 代换使得原不等式面目全非,vuw 法稍好一些,比较容易看出原式的某些性质(比如取等性质)它的代换形式是:
3u = x + y + z , 3v^2 = xy + yz + zx , w^3 = xyz
即:u 是xyz 的代数平均,v 是xyz 的半代数平均,w 是xyz 是几何平均。。。 可以去看看Knudsen 写的那篇The uvw method.
(十二)谈谈齐次形式不等式的程序化处理②Schur 拆分法。。。
这是一种不错的处理三元六次以下对称多项式的方法,原则上可以证明一切齐n 次对称式,但是还是因为上面的原因——麻烦——所以一般不用,其基本思路是:
每一个齐n 次对称多形式F(a , b , c),都有唯一的“Schur拆分”结构,这可以通过上面提到的对称多项式基本定理进行证明。记:
F(x , y , z) ≥ 0等价于:
其理论基础是下面四个不等式:
这通过上面的广义Schur 不等式是显然的,事实上,通过Schur 不等式的证明思路,这些式子也很容易证明。。。。 对于六次以下不等式,其拆分可见(百度文库):
记三元齐n 次式为F(n),p = x + y + z , q = xy + yz + zx , r = xyz
举例说明:
对于三角形abc ,证明:
证明:设a = y + z , b = z + x , c = x + y ,原式等价于:
事实上,Schur 拆分是
基于Schp 算法的机械证明。。。不是给我们手算的。。。。
(十三)细化赫尔德(Hölder) 不等式&引入闵可夫斯基(Minkowski)不等式。。。。
哈代(Hardy )等人认为,这两个无论何时都是最重要的不等式,甚至在代数平均-几何平均不等式之上,虽然我们觉得用不上。。。。。
闵可夫斯基(Minkowski)不等式: 对于p>1,有:
事实上这个东西很高级,很高级,很高级。。。。只是我们没有必要深究罢了。。。 赫尔德不等式可以做出一个很重要的推广: 1/p + 1/q ≥ 1&p > 1&q > 1,仍然有:
赫尔德不等式的一个重要的退化形式柯西-布尼亚科夫斯基-施瓦茨(Cauchy-Buniakowsky-Schwarz )不等式,就是常说的柯西不等式,为了纪念后两位数学家的贡献,我们还是记住他们的名字吧。。。 赫尔德不等式的相似形式——卡尔松(Carlson )不等式(矩阵长方形不等式)
(卡尔松不等式)m×n 的非负实数矩阵中,n 列每列元素之和的几何平均值大于等于矩阵中m 行每行元素的几何平均值之和:
在前人的帖子里面讨论的很详细了:做出一个更正,很像Carlson 不等式的一个是:
(微微对偶不等式)对于每一个j ,a_{j,i}是正的递增序列,b_{j,i}是a_{j,i}的一个排序,则:
但是他们之间的差距还是比较大的,但是上面那个帖子认为是一个东西。。。
看过很多重要不等式之后,我们发现,这些比较强的不等式之间经常可以互推,这很神奇,很有趣,你们自己去发现吧。。。
(十四)幂平均函数及其他。。。。。。。
高中刚刚开始,学到三个毕达哥拉斯平均时,你有没有想过把
推广成:
或者:
相信很多人有过这样的想法。所以说,幂平均函数是一个容易想到推广的函数,我过去学三个毕达哥拉斯平均时自己已经想到和赫尔德完全一样的平均值函数了。。。
定义幂平均函数为:
其中x_i ≥ 0 , p ≠ 0. 因为:
即几何平均,所以可以补充 p = 0 时的定义。 幂平均函数有这样几个重要的性质(单调有界):
对于
p ≤ q ,(ω_i为权重,在非加权形式时等于1/p),
有:
对于 p ≤ 0 ≤ q 有:
幂平均函数的单调递增性称为幂平均单调性定理。这个定理的证明可以先取对数,
再通过Jensen 不等式证明,幂平均函数的引入是一个很方便的东西,这样闵可夫斯基不等式可以表述成“对于
p≥1,幂平均的和大于和的幂平均”即: M_p(x1)+M_p(x2)≥M_p(x1+x2) 或:
切比雪夫不等式可以表示为:“对于同增或同减的两个序列a_i,b_i,其幂平均的积小于积的幂平均”。 对于凸函数,还有幂凸函数,是用幂平均形式定义的。当然除此之外还有很多,我就想不起来或者忘了。。。
(十五)SOS 定理。。。
这是一种某些人很喜欢的东西,虽然我不怎么喜欢了。。。。毕竟不够直接了当,不符合我的性格。。。 对于三元二次以上轮换整式可以唯一整理成: 以下五种情况即称为SOS 定理。
试着用SOS 定理解决三次Schur 不等式。。。 根据SOS 第二定理:
通过SOS 定理的证明(自己找)过程很容易看出,第一定理和第五定理在任何一种整理:
都成立,而中间三个不一定成立。
。。但适用于整理:
非完全配方会遇到永远规划不到SOS-1的情况(但事实上这种情况并不多),这时SOS 定理就有用了。。。。
(十六)凸函数理论及受控理论。。。
f
是定义在凸集C 上的实变函数,对于x,y ∈C ,1 ≤ t ≤ 1 则称f 为D 上的(下)凸函数。
注意:y = x^2才是凸函数!!!y = x^0.5是凹函数。 最开始的定义(Jensen )是:
现称之为Jensen 凸函数。
第一个定义显然可以推出第二个,在①C 为拓扑向量空间②f 在C 上连续,则可以互推。
凸函数还有许多推广和类比,例如幂平均凸函数,伪凸函数等等,我见过的不下十种,在此不介绍了。
g 是区间D 上的连续凸函数等价于 任意x_0∈D ,存在h(x_0)满足哈代(Hardy )不等式:
从而推出二阶导数非负,函数为凸函数的结论。
凸函数中最重要的,也是最基本的就是Jensen 不等式: 对于凸函数φ,a_i∈[0,1]
反之,φ是凹函数,不等式反号。iff x_1=x_2=...=x_i或φ为直线时等号成立。
事实上,这更像一个概率不等式。。。积分形式有类似的结论。 哈达玛(Hadamard )不等式:
对于定义在[a,b]上的凸函数φ,a ≤ x
控制不等式(Schur 凸函数):
我们知道对于多元函数,其凸性是一个比较强的性质,需要一个更广泛的东西来推广凸性,使我们能够用类似凸函数方法“宏观上’’来推导不等式。于是控制不等式应运而生,由于控制不等式本身也是由一系列不等式来定义的,我们也就可以由控制不等式的一些性质来证明不等式。1923年德国数学家
Issai Schur率先系统研究了受控(Majorization)理论中函数的保序性,为纪念其贡献,将他所研究的这类函数命名为Schur 凸函数。随着受控理论研究的深入,Schur 凸函数已经在解析不等式、矩阵论、广义平均值、概率统计、图论、数值分析、可靠性、信息安全和其它相关领域发挥着愈来愈重要的作用。
综上,Schur 凸性是证明不等式的强有力的手段(可以证明许多你见都没见过的复杂的很强的结论),限于知识水平和篇幅,我不能说的过于详细,有兴趣的可以看石焕南先生的《受控理论与解析不等式》或王伯英先生的《控制不等式基础》。。。
现在,我们看看控制不等式的定义:
控制不等式同样具有传递性。
严格控制:不存在任何转置矩阵A 使得x = y A , 则称x 被y 严格控制。记为x\prec\prec y 哈代等人书中就给出的关于控制不等式的基本结论:
另一个重要的结论是:
对于g:I-->R,φ:R^n
-->R,复合函数ψ=φ(g(xi)有:
(1)若g 是凸的,φ是增且Schur 凸的,则
ψ是Schur 凸的; (2)若g 是凹的,φ是增且Schur 凹的,则ψ是Schur 凹的; (3)若g 是凹的,φ是减且Schur 凸的,则ψ是Schur 凸的; (4)若g 是凸的,φ是减且Schur 凹的,则ψ是Schur 凹的;
(5)若g 是减且凸的,φ是增且Schur 凸的,则ψ是减且Schur 凸的; (6)若g 是减且凸的,φ是减且Schur 凹的,则ψ是增且Schur 凹的。 对于严格凹凸性有同样结论。
对于三元对称形式,我们有这样一些基本结论:
试着用控制不等式做一道小题: 对于△ABC 和p ≥ 2 , k ≥ 0 , 证明:
证明:当t
令csc^k A = x , csc^k B = y , csc^k C = z ,则在(0,π)上,-ρ1,-ρ2是严格Schur 凸函数,故上式成立且在x = y = z△ABC 是正三角形时取等。
利用控制不等式证明代数或几何不等式时的基本思路即: ①证明一个函数的Schur 凸性。
②构造一个有Schur 凸性的函数。
从例子中我们可以看出,控制不等式可以解决许多含参不等式特别是指数含参的问题,这用其他方法往往是十分困难的。。。。。而且,相比整式上的诸多业已定型方法,控制不等式今日方兴未艾,尚有巨大的潜力,让我们慢慢期待!
(十七)杂谈 克劳修斯(Clausius )不等式与热力学第二定律。。。。
(这是我的本行嘛,比较熟悉,但是我不能从很基础的热力学概念讲起,太长了,虽然基础概念非常非常重要,所以就是给你们看看娱乐一下的。。。)
我们生活在一个被统计规律所描述的世界里面,正如薛定谔(Schrödinger )先生所说:“我们的一切物理学规律都是统计规律。” 统计力学是宏观与微观的桥梁,宏观体系因为数量的积累产生了质的飞跃,使之获得了微观体现不具有的东西,比如说——熵。
熵是一个神秘的概念,她不肯揭下那神秘的面纱,我们只能依稀的窥探她的容颜,熵,定义于热力学第二定律,但更给人一种可望不可即的飘渺之感,她已超越了原本的热力学概念,牵动着我们的情思。
我向来不鼓励大家直接去接触玻尔兹曼(Boltzmann )给出的伟大解释,虽然那看起来更容易理解,因为熵概念被克劳修斯提出到玻尔兹曼提出玻耳兹曼关系式用了27年,这27年,经典热力学基本建立完毕,并未用到统计诠释,所以要更好地理解这个概念,就要尊重历史发展啦。。。
卡诺(carnot )在热力学第二定律创建以前就提出了carnot 定理,并用自己都不认同的热质论给予了证明。。。但是天妒英才,卡诺英年早逝,连热二都没看着就驾鹤西去了,很可怜啊。。。理想气体顺时针经历两个等温可逆过程和两个绝热可逆过程,如图所示:
容易得出:
所以:
即卡诺效率定理引出熵的概念:可逆过程的热温商是熵。
熵是克劳修斯提出的热力学第二定律的量化描述,热力学第二定律一般有三种说法: 1. 克劳修斯(1850):不可能把热量从低温物体传递到高温物体而不产生其他影响。 2. 开尔文(1851):不可能从单一热源吸收能量,使之完全变为有用功而不产生其他影响。 3. 第二类永动机是不可能实现的。(废话。。。) 两种说法是等价的:
如果开尔文表述不真,那么克劳修斯表述不真:假设存在违反开尔文表述的热机A ,可以从低温热源T2吸收热量Q 并将其全部转化为有用功W 。假设存在热机B ,可以把功W 完全转化为热量Q 并传递给高温热源T1(这在现实中可实现)。此时若让A 、B 联合工作,则可以看到Q 从低温热源T2流向高温热源T1,而并未产生任何其他影响,即克劳修斯表述不真。反之亦然。 据此,容易得出克劳修斯不等式:
可以理解为循环过程中依次与n 个热源发生热相互作用。
熵是状态函数,是广度量,是宏观参量,不是守恒量。在经典隔离系统中,熵只会不断地增加,没有减少的机会,我们常常去将两个因变量相同的物理量类比,希望找出某种内在的关系,所以说,熵的方向,是时间的方向。能量虽然永生不灭,但是品味不同,随着时间推移,能量降退不断进行,孤立系统向着一种毫无生机的方向发展,最后一切大的变动,“这时宇宙将处于某种惰性的死的状态中”。当然,宇宙没有这样发展,但是对于我们的太阳系——可以看做经典隔离体系的小世界——这种发展是确确实实发生着的,所以请我们珍惜,不要浪费宝贵的自由能。 不等式的思想在现实世界中是一种方向的指示,热力学第二定律是经典理论中第一个不遵循时间反演可逆性的定律揭示了某种极为深刻的道理,要我们用一生去理解。
薛定谔在他那本名扬天下的小册子(生命是什么)中这样说过:
“在我们的食物中,到底有什么样的宝贵东西能使我们免于死亡呢?这是很容易回答的。每一个过程、事件、突发事变——你叫它什么都可以,一句话,自然界中正在进行着的每一事件,都意味着这件事在其中进行的那部分世界的熵在增加。因此,一个生命有机体在不断地产生熵——或者说是在增加正熵——并逐步趋近最大熵的危险状态,即死亡。要摆脱死亡,要活着,唯一的办法就是从环境中不断地汲取负熵(自由能)。有机体就是靠负熵为生的。或者说,新陈代谢的本质就在于使有机体成功的消除了当它活着时不得不产生的全部的熵。”
我们试着用非平衡态热力学去理解上述内容,对于近平衡态(扰动不大,分子碰撞传能速率大于某些不可逆过程的速率,反应活化能Ea>5k_B T等)采用局部平衡假设——将偏离平衡不远的系统划分为宏观小,微观大的元胞,则t 时刻该元胞的状态可代表t+dt时刻。 热力学第二定律便可以推广至任意体系:
deS 称为熵流,是系统与环境通过边界时增加的熵(可正可负),diS 称为熵产生,是系统内部不可逆过程带来的熵变(恒为正)。可用平衡方程描述熵变:
其中L 为任意广度量,此方程适用于任何系统。 熵流为热流和物质流贡献,所以:
Sj 为物质j 的偏摩尔熵。
进一步定义熵密度(单位体积熵产生率):σ=diS/(Vdt)=dis/dt 对于定态(dS/dt=0)有:σ=dis/dt=-des/dt
一般来说,近平衡态时,傅里叶(Fourier ,就是傅里叶变换那个傅里叶)线性热导定律成立,费克(Fick )扩散定律成立,但是反应亲和势A=-△rGm
研究不可逆过程时,常将势函数称为热力学力X ,由此引起的不可逆过程称为流J ,实践证明,X 较小时,J=LX,L 称为唯象系数。对于电势梯度,即为欧姆定律;对于温度梯度,则为傅里叶定律;对于浓度梯度,即为费克定律;对于化学反应,即为一级动力学规律。 于是熵产生率可描述为:
若系统中有多个不可逆过程,则有昂色格(
Onsager )倒易关系: 不可逆过程的线性表达:
中,L_{k,l}=L_{l,k}.此关系可由微观可逆性原理导出。
对于唯象系数恒定的体系,有最小熵产生原理:非平衡态的不可逆过程熵产生率随降低并趋于定值。由此可见,近平衡态的涨落行为随时间衰减,不会出现时空有序结构。所以说,当某些参量或约束条件超过限度,不同组分之间产生非线性关系,从无序到时空有序,即形成了耗散结构。
我们的每个生物分子,每个人,以及社会成分,都是时空有序的结构。BZ 震荡,Bénard 流,酶促反应,物种起源,生命进化都是耗散结构。一个耗散结构,要具备以下几个特征:①靠外界供应能量和物质才得以维持。②某些参量或约束条件超过阀值。③具有时空有序结构。④不受任何微小扰动的破坏。耗散结构的研究又包含于混沌理论之中,它将为更复杂的自然与社会问题提供更一般的规律和认识,应当给予关注。
最后说说热二的统计诠释:通过类比,即S 和Ω同样决定于(N,U,V)所以去寻找它们的关系,玻尔兹曼首先提出: S ∝ln Ω
普朗克求出了比例系数,称为玻尔兹曼常数k_B=R/L=1.3806488×10^-23J/K
这种定义下的熵称为统计熵,统计熵不局限于平衡态,是普遍使用的。所以说,热二的统计解释为:对于绝热或隔离系统,系统的可及微观状态数在不可逆过程中不断增大,趋近于最大值。但是统计解释又提出了更深刻的观点,即复原(熵减小)是有一定概率的,但是概率太小,所以表现出宏观上的方向性,但是方向中又伴随着涨落。这可以通过经典力学系统的亥姆霍兹函数理解。
熵的概念已经从热力学扩展到控制论、概率论、数论、天体物理、生命科学等领域。麦克斯韦提出了麦克斯韦妖,讨论就开始了。最后,信息熵被提出,并且与经典的热力学熵建立了定量的联系:
(十八)关于机械化方法的历史。。。
代数和几何从笛卡尔(Descartes )开始就再也没有分过家,笛卡尔曾经设想:一切问题化为数学问题,一切数学问题化为代数问题,一切代数问题化为代数方程求解问题。他把问题想得太简单了,如果他的设想真能实现,那就不仅是数学的机械化,而是全部科学的机械化。因为代数方程求解是可以机械化的。但Descartes 没有停留在空想,他所创立的解析几何,在空间形式和数量关系之间架起了一座桥梁,实现了初等几何问题的代数化。
之后,莱布尼茨(Leibniz )的努力促进了布尔(Boole )代数、数理逻辑以及计算机科学的研究,正是沿着这一方向,经后人的努力,形成了机器定理证明的逻辑方法。
随着集合论的诞生,近代数学的发展获得了有力的工具,之后希尔伯特开始形式数学的研究,但不出三年,哥德尔提出不完全性定理,这个著名的定理指出一个不弱于初等数论的形式系统如果是无矛盾的,则是不完全的,即存在形式系统的一个命题,它和它的否定都不能由形式系统证明。因此, Hilbert 的要求太高了。上述的Gödel 不完全性定理断言:即使在初等数论的范围内,T arski 提出:对所有命题进行判定的机械化方法也是不存在的!但是在初等数学的领域,一切初等几何和初等代数范围的命题,都可以用机械方法判定。
1959年,王浩设计了一个程序,用计算机证明了 Russell 、 Whitehead 的巨著《数学原理》中的几百条有关命题逻辑的定理,仅用了 9 分钟。王浩工作的意义在于宣告了用计算机进行定理证明的可能性。柱形代数分解(CAD )的提出,从理论上解决了一切正定多项式判别的问题,Mathematica 中的Reduce 命令约化不等式时采用的即是CAD ,我们可以试着去感受一下。但是它依靠实代数,求解复杂的将是几何级数式的增长。。。。这个CAD 以多项式代数和代数几何为基础的,理论异常艰深。。。之后,吴文俊提出吴方法,翻开了机器证明领域的新的一页。至此,世界范围内,这两类问题的机械证明都在蓬勃发展中。 对实代数和实几何的一些发展可以参见:
杨路负责,张景中、符红光、冯勇、曾振柄、侯晓荣、曾广兴、夏壁灿等参与的课题“实几何与实代数的高效能算法”(2004CB318003) (973项目“数学机械化方法及其在信息技术中的应用”的子项目之一)结题报告:
(十九)多元函数极值的偏导方法。。。。
对于多元函数f(x1,x2,...,xn)在某一区间上有连续的一二阶导数,定义黑塞(Hessian )矩阵为 其中
,即:
当函数二阶连续可导时,Hessian 矩阵
H 在驻点x 上是一个n×n
阶的对称矩阵。
当H 是正定矩阵时,驻点x 是一个局部的极小值。 当H
是负定矩阵时,驻点x 是一个局部的极大值。 当H=0,需要更高阶的导数来帮助判断。
H 的正定性一般通过所有特征根大于0来判定
求解所有f_{x_i}(x_1,x_2,...,x_n)=0可得出驻点。再用上述矩阵判定,最后比较得出最值。 拉格朗日(Lagrange )乘因子法:
若f(x)的约束条件为g_k(x) = 0。定义拉格朗日函数为:
的解即为可能的极值。
TTK (卡罗需-库恩-塔克,Karush-Kuhn-Tucker Conditions)条件:
这是一种推广的拉格朗日(Lagrange )乘因子法,将等式约束条件推广至不等式约束条件, f(x)在x*处取得最值的必要条件,对于最大值:
对于最小值:
其中:
另外,充分条件为Fritz John条件:
包含于FONC 条件中。。。
有很多人学了拉格朗日乘因子法就看不起初等不等式了,但是,由上面的内容可见,将初等不等式证明完全归结于高等数学方法往往是不划算的,甚至是相当困难,以已掌握的理论无法解决的。。。
(二十)解析——几何与代数的桥梁
几何定理主要包括等量关系定理(如勾股定理,九点圆定理)和不等关系定理(如三角不等式,佩多不等式)。一般来说,狭义的几何定理是等量关系定理。等量关系的定理可以通过化成代数等式的方法解决,这时,欧几里得几何的构造通常不是通过公理化方法,而是通过解析几何。通过这种方法,可以像证明定理一样证明欧几里得几何(或非欧几里得几何)中的公理。这一方法没有公理方法那么漂亮,但绝对简练。 例如使用吴方法证明“三角形三条高线交于一点” 证明:设O(0,0),A(x1,0),B(x2,0),C(0,x3),D(x4,x5)
证明:
我们常常用高等几何(射影几何)用于解析证明,其中属仿射性质(对合)最为常用。仿射几何是欧氏几何在较高层面上的推广和延伸在初等几何中的应用范畴比较广泛, 是应用高等几何知识解决初等几何问题的一条重要通道在初等几何中有大量的命题是研究图形的仿射性质的,即并不涉及到距离、角度、面积的具体度量,而仅涉及到点线结
合关系、直线的平行性、共线或平行线段之比、两封闭图形面积之比以及中点等概念对于这类命题,可以运用仿射的有关性质,借助于仿射变换,由特殊到一般,化繁为简地加以解决,从而达到事半功倍的效果。
对于几何不等式,当然也可以用到上面的结论,但是几何不等式相对等量关系定理过于广泛,所以一般只研究较简单的几何量,例如三角形边长,角度,面积相关圆半径等。我们可以用等量关系定理将之化为条件代数不等式。 常用的代换等量关系(以边长a,b,c 为例,设半周长p ,面积S )
S=√[p(p-a)(p-b)(p-c)] 内切圆半径
r=S/p
外接圆半径R=abc/(4S) sin A=a/2R
cos A=(b^2+c^2-a^2)/(2bc)
中线m_a=1/2 √[2(b^2+c^2)-a^2] 角平分线t_a=2/(b+c) √[bcp(p-a)] 高线h_a=2S/a
这可以将关于许多三角形的几何不等式站变成代数不等式证明。 举个栗子:
关于三角形的一个著名结果——欧拉不等式: 三角形外接圆半径大于等于内接圆直径。
这是一个漂亮的几何不等式,纯几何证法可证,但实为艰深,一种方法通过欧拉定理: 三角形的外心与内心之间的距离d 可表示为d^2 = R(R - 2r).
当然利用代数方法就比较简单了:
这个不等式的推广——厄多斯(Erdos )不等式: 对于三角形内部一点P ,到一边距离成为d ,则有:
可由不等式:
推出。此定理亦存在纯几何证明(参见N·D·Kazarinoff 的《几何不等式》),但是要用到帕普斯推广的勾股定理。对于代数方法,我们可以设ABCP 的坐标为: A(x1,0),B(x2,0),C(0,x3),P(x4,x5) 之后利用解析几何工具解决。 当然,我们也可以令:
A=x1,B=x2,C=x3 i,P=x4+x5 i 建立复数平面解决。。。
小测试 A (轮换不等式):
对于正数 x , y , z 满足x + y + z = 1 , 证明:
①②③
④
对于正数 x , y , z 满足x y z = 1 ,
证明: ①②
③ 对于正数 x , y , z 满足x^2 y+y^2 z+z^2 x=3 , 证明: ①
②
对于正数 x , y , z 满足x^y+z^x+y^z=3 , 证明:
小测试 B (含参情况):
①对于实数 n ,正数a , b , c 满足:
则有:
②对于正数a ,b ,c ,d 满足a + b + c + d = 1, 函数
其中| |表示复数的模。
③正数x , y , z , w满足x^2 + y^2 + z^2 + w^2≤4 , x + y + z + w≥2 , k≥3,则:
.
④正数 x , y , z 满足 x + y + z = 3 , 函数:
则有:
⑤正数 x , y , z 满足 x + y + z = 1 , t≥9/32 ,证明:
⑥对于实数
a_i,证明:
其中
⑦对于正数
a , b , c 满足a + b + c = 1, -∞
小测试 C (对称破缺):
①对于正数
x , y , z 满足x + y + z = 1 , 证明:
②对于正数 x , y , z 满足x + y + z = 1 , 证明:
m=6.51758...是12 x^7-136 x^6+436 x^5-436 x^4+612 x^3-1760 x^2-900 x-125的唯一零点。 ③对于正数
a , b , c 满足a + b + c = 1 , 证明:
M 是5 x^3-7 x^2-33 x+31的第二零点。
不等式知识
目录:
三道小题
(一)一些基础。。。
(二)不等式的一些直观解释。。。 (三)谈谈放缩法。。。 (四)杂谈 关于配方法。。。 (五)杂谈 差分代换。。。
(六)杂谈 谈谈切线法及其推广 (七)介绍几个重要的不等式①。。。 (八)介绍几个重要的不等式②。。。 (九)杂谈 再谈配方法。。。。
(十)关于函数实根分别和不等式解集问题。。。。。。。
(十一)谈谈齐次形式不等式的程序化处理①对称整理类。。。 (十二)谈谈齐次形式不等式的程序化处理②Schur 拆分法。。。 (十三)细化赫尔德(Hölder) 不等式&引入闵可夫斯基(Minkowski)不等式。。。。 (十四)幂平均函数及其他。。。。。。。 (十五)SOS 定理。。。
(十六)凸函数理论及受控理论。。。
(十七)杂谈 克劳修斯(Clausius )不等式与热力学第二定律。。。。 (十八)关于机械化方法的历史。。。 (十九)多元函数极值的偏导方法。。。。 (二十)解析——几何与代数的桥梁 小测试 A (轮换不等式) 小测试 B (含参情况) 小测试 C (对称破缺)
出三道小题,作为你们的自我检测,如果做不上来,你你还需要多练习练习。如果可以,那我们继续看:
①对于实数 x , y , z 证明:
②求 f(x) = x^x 的最小值。
③对于正数 a , b , c 满足 a + b + c = 1 , 证明:
感觉如何?一般来说都可以做出来,我们继续。
一) 一些基础。。。
因为懒,我们发明了这么两个符号:
sss. 这是懒到cyc 都不写了。。。 之后不引人sym ,(写起来)太麻烦。。。
因为懒,再引入逻辑符号:且& ,或|| ,推出=> ,逆推出 ,当且仅当iff 我总说的sss. 是“事实上”的意思。。。 说说基本性质:
三分律:任何两个实数都有确定的序关系。
对逆性:a > b b
传递性:a > b || b > c => a > c.
单调性:a > b => a + c > b + c. 完事了。。简单吧。。。
谈谈“加糖原理”(糖水不等式,糖水更甜原理and more...):
这个式子看似简单,到IMO 上去也能用得着。。。例如IMO46: 对于正数 x , y , z 满足xyz ≥ 1证明:
证明:设x = k a , y = k b , z = k c使得abc = 1
(这样就完成了齐次化工作,根据后面点知识很容易证明下式)
sss. 我们经常用加糖原理证明一类条件上带有不等号的结论。 加糖原理可推广至“溶液混合原理”:
更广泛的是“加权混合原理”:
这些式子可以通过他们的名字去简单的理解。
对于(很多高端的)不等式来说,绝对值既基础又高端。。 二元形式的(绝对值)三角不等式: 对于实数a , b(可推广至复数或向量),有: n 元形式的(绝对值)三角不等式: 对于实数a_k(可推广至复数或向量),有:
三角不等式是度量空间的基本性质,无论对那种度量来说,三角不等式都是成立的。
对许多中学生来说度量即: 这很好。。sss. 非负性,同一性,对称性,三角不等式是度量空间的四条腿。。。在很多时候将式子放到其他度量空间中研究,会事半功倍。
二) 不等式的一些直观解释。。。
有人说:“什么是不等式, 我看不懂代数结构啊。”
众所周知,你看的书要是有图,自己要是不板着点,过一会你就变成看图不看字了。。。 所以我就要你看图。。。 为什么f(x) = x^2≥0?
OK,
看明白了。。
为什么68 - 120 x + 40 x^2 + 10 x^8 + 2 x^9 + x^10 ≥ 60 x^3 - 124 x^4 + 40 x^5 - 9 x^6 + 34 x^7 68 - 120 x + 40 x^2 + 10 x^8 + 2 x^9 + x^10 -(60 x^3 - 124 x^4 + 40 x^5 - 9 x^6 + 34 x^7) = (x - 1)^2 (x^2 + 4 x + 17) (x^3 - 2)^2 ≥ 0. 我上哪知道去!!! 看看图吧。。
大于1那部分真是相当紧。。。
也不是那么紧吗。。。这就是画图的劣势。。 二元的也一样:
为什么(a + b)/2 ≥ sqrt(ab)呢? 如图:
对于三元形式,我们可以用动态规划的方法理解: 对于条件a^2+b^2+c^2=2 , a+b+c
的最小值如何?
看出a+b+c=√6时,两图像相切。所以根据高中线性规划的知识可知a+b+c≥√6,当且仅当a=b=c=√6/3时取等。
(三)谈谈放缩法。。。
原则上没有一个绝对的最强不等式,只有满足一定条件限制的最强情况。 就比如说三元三次完全对称形整式中最强的为三次Schur
不等式: 对于正数a , b , c有:
但是去掉条件整式,我们提出来这个式子: 对于正数a , b , c有:
可见,我们传说的Schur 也被放缩了。。。
所以说,一切不等式原则上都可以用放缩法解决。。。只是简不简单了。。。 为了形象的理解,我们用一元不等式作图解释: 利用公切线y = x放缩证明:exp(x)-1 ≥ x ≥ ln(x+1).
放缩是无穷无尽的:
1+x ≤ 1+x+x^2/2 ≤ 1+x+x^2/2+x^3/6 ≤ 1+x+x^2/2+x^3/6+x^4/24 ≤ 1+x+x^2/2+x^3/6+x^4/24+x^5/120 1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720 ≤ 1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720+x^7/5040 1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720
+x^7/5040+x^8/40320
1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720+x^7/5040+x^8/40320+x^9/362880
1+x+x^2/2+x^3/6+x^4/24+x^5/120+x^6/720+x^7/5040+x^8/40320+x^9/362880+x^10/3628800 ≤ ... ≤ exp(x)
≤ ≤ ≤ ≤
推广(包括证明方法)与紧化是不等式专家们不懈追求的东西,更是他们的乐趣所在。事实上,发现问题比解决它
更为重要,漂亮的解决一个问题,是不等式爱好者们喜欢追求的东西,提出一个漂亮的问题,是不等式专家们热衷的话题。
四次Schur 是一个强度一般的结论,我们提出了一些补充: 三元四次完全对称不等式中,最强的为:
可转化为基本对称多项式的形式:
附带说一下:
三元四次轮换对称不等式中,最强的为:
容易看出,这里面出现了参数p ,而三次Schur 却是被固定的参数,这是因为不等式的自由度增加了,自由度这个词我从分析力学中借用过来,可能有更规范的说法,我不去探寻了。 为了方便,先设:
三元三次完全对称最强不等式,要满足
1. 完全对称,所以根据对称多项式基本定理,不妨设: 2. 均值取等: 27 + 9 x + y = 0. 3. 最强:
证明得到:x = -1 , y = 6 化简得到熟悉的三次Schur 。。。
但是四次的就不好办了。。。还是这三个条件,到最后还有一个是自由变量。。。 同样的n 次情况有n - 3个自由变量,非常难办。。。不信可以试试。。。。
连续放缩条件:
对于F(x_1,x_2,...,x_n) ≥ G(x_1,x_2,...,x_n)的证明过程中涉及到放缩f 且能取得等号,则
一般的,对于一组连续放缩: 可以取等,则有:
这给了放缩法最重要的参考条件——根据取等条件放缩。
(四)杂谈 关于配方法。。。
(这讲里面说的是关于变量在整个实数域上的配方,而不是条件配方)
上面说的都是初等不等式,事实上,还有什么微分不等式,积分不等式,图论不等式等等等等。。。一个人一辈子要是能都有研究,那可真是太厉害了。。。。反正我是做不到也不想做到。。第一,我没兴趣。第二,这最重要,我可是学化学的!!!
举几个有关配方的例子:
对于初等不等式,最重要的原理就是: 对于实数x ,x^2 ≥ 0.
举个例子,对于实数x , y ,证明x^2 + y^2 ≥ 2 x y . 显而易见x^2 + y^2 - 2 x y = (x - y)^2 ≥ 0 . 这个例子真是太简单了,你快要笑话我了。。。 再举一个,对于实数x , y,证明x^2 + y^2 ≥ x y . 证明一:x^2 + y^2 - x y = (x - 1/2 y)^2 + 3/4 y^2 ≥ 0 .
证明二:x^2 + y^2 - x y =
一看就霸气侧露。。。 证明三
:x^2 + y^2 -
x y
=
这是由“自由度”引出的无穷个小证明,事实上,配方常常是多种多样的。。。 再举个栗子:对于实数x , y ,-2 ≤ k ≤ 2 ,证明x^2 + y^2 ≥ k x y . x^2 + y^2 - k x y =
当然,你可能觉得这都太无聊了。。。我也是,我考场上证明绝对不用这种损招。。 配方的方法呢,我认为有三个:基础流配方,直觉配方,综合配方。。 事实上还有SOS 定理,那是一种不够直截了当的方法,所以后面再说。
所谓基础流,就是老老实实算,老老实实配,应用一些基础的东西,比如拉格朗日(Lagrange)恒等式:
给出它的二元形式和三元形式:
二元:(a^2 + b^2)(c^2 + d^2) - (a c + b d)^2 = (b c - a d)^2 三元:(a^2 + b^2 + c^2)(x^2 + y^2 + z^2) - (a x + b y + c z)^2
= (a y - b x)^2 + (a z - c x)^2 + (b x - a y)^2 + (b z - c y)^2 + (c x - a z)^2 + (c y - b z)^2 待定系数法配方:
以上面证明证明x^2 + y^2 ≥ 2 x y的第二种方法为例,设:
x^2 + y^2 - x y = (a x - b y)^2 + (a y - b x)^2 = (a^2 + b^2) x^2 - 4 a b x y + (a^2 + b^2) y^2 则有:a^2 + b^2 = 1 & - 4 a b = -1,一共有四组解,其中一组就是上面那个。。。 待定系数配方还会在后面讲到。在此分散难度,只做介绍。
小Q
代数变换提取因式配凑方法,那是小Q 等人的绝技,我学不来。。。
利用矩阵方法半定规划。。。。我讲了你能明白吗。。
。更重要的是,我能讲明白吗。。。。。
直觉配方,就是一种传说中的神秘方法,只可意会不可言传,持有配方直觉的神秘之人,可以凭空配方,百步穿杨,无一失手,堪称奇迹!
比如说:
虽说是直觉配方,但也是有一定方向,第一,这种差分配方法,若是能取等,那么:
这对初中生也是很显然的。。。
第二,对于一个齐k 次式,配出来的结果也应该是齐k 次式。 这两个原理虽说简单,但是很基本,也很好用。。。。
综合配方就是先直觉猜出点什么东西,再基础配方优化。。。 这个举不了例子。。。我好像没怎么用过。。。
比如说证明拉格朗日恒等式时,将式子逐步调整成熟悉的平方和形式(只能靠经验):
今天讨论的都是定义在R 上的变量,对于有限制的变量,比较复杂, 1. 配方法的理论基础在希尔伯特(Hilbert )第十七问题:
为实系数多项式,且对每个
都有
,
则 可以表成实系数有理函数的平方和。
这个问题在1927被阿廷(Emil Artin)解决,他的证明是简洁但高深的。。。我们这个定理知道就好。。。 2. 利用矩阵方法配方。
实多项式F(x)可以表达成:
F(x) = z^T Q z
Q = L^T L
我们还是举例说明吧。
。。
根据一点线性代数的方法可以求得:
所以:
我们试图证明这样一个式子来说明点什么:
对于实数 x , y , z ,证明:
x^2 + y^2 + z^2 - x y - y z - x z ≥ 0. 注意到:
这是这样来的: >> pvar x y z;
>> p = x^2 + y^2 + z^2 - x*y - y*z - x*z; >> [Q,Z,D]=findsos(p,'R'); Size: 9 6
SeDuMi 1.3 by AdvOL, 2005-2008 and Jos F. Sturm, 1998-2003.
Alg = 2: xz-corrector, Adaptive Step-Differentiation, theta = 0.250, beta = 0.500 eqs m = 6, order n = 4, dim = 10, blocks = 2 nnz(A) = 6 + 0, nnz(ADA) = 36, nnz(L) = 21 it : b*y gap delta rate t/tP* t/tD* feas cg cg prec 0 : 3.13E+00 0.000
1 : 1.11E-02 1.70E-02 0.000 0.0055 0.9990 0.9990 1.35 1 1 1.4E-02 2 : -6.72E-10 5.05E-09 0.000 0.0000 1.0000 1.0000 1.00 1 1 5.6E-07 3 : -9.25E-16 1.05E-14 0.000 0.0000 1.0000 1.0000 1.00 1 1 1.0E-12
iter seconds digits c*x b*y
3 0.1 14.9 0.0000000000e+00 -9.2518588107e-16
|Ax-b| = 6.6e-15, [Ay-c]_+ = 0.0E+00, |x|= 2.1e+00, |y|= 6.8e-01
Detailed timing (sec) Pre IPM Post
4.003E-03 2.200E-02 1.006E-03 Max-norms: ||b||=1, ||c|| = 0,
Cholesky |add|=0, |skip| = 1, ||L.L|| = 2.
Residual norm: 6.6075e-15
iter: 3
feasratio: 1.0000 pinf: 0 dinf: 0 numerr: 0
timing: [0.0040 0.0220 0.0010] wallsec: 0.0270 cpusec: 0.0625
>> D D =
[ 0.8165*x - 0.40825*y - 0.40825*z] [ -0.40825*x + 0.8165*y - 0.40825*z]
[ -0.40825*x - 0.40825*y + 0.8165*z]
这个比较容易,仔细看看0.8165就是\sqrt{\frac{2}{3}},0.40825就是\frac{1}{\sqrt{6}}。。。 当然,我可不知道老先生是怎么优化的。。。MATLAB 毕竟是数值软件,用的是浮点数,能变成他的那一串漂亮的配方也真是需要点技术。。。。。否则啊,比如第一个:
真让人无处下手。。。。
有很多人,认为陈计先生的证明都是索然无味的,没有技术的,只要用软件就可以完成。这是完全错误的,诚然,陈计先生的证明多数依靠了计算机,但不是你有计算机,我有计算机就可以实现的。他有许多精巧的想法是可贵的,值得我们学习研究。
五)差分代换。。。
提到差分,我们觉得不太熟悉,但是微分我们很熟悉。。。这事实上有点本末倒置的感觉。差分,又名差分函数或差
分运算,是数学中的一个概念。它将原函数f(x)映射到 f(x+z)-f(x+b)。它和微分之间千丝万缕的联系不言而喻。。。 比起风姿卓越的差分配方,差分代换就好像一个破落户,一个大恶魔,大家看到了就想骂街。。。他惨无人道的破坏人见人爱的轮换性,非常符合鲁迅给悲剧的定义:“悲剧就是把美好的东西撕碎给你看,然而,把已经撕碎的东西再从新拼回给你看,那种不可名状的淡淡忧伤令人彷徨不安。
” 但是,差分代换很多时候十分有效且简洁明了,应当了解。
看看这种差分代换(增量代换)方法的基本步骤,暂且以三元为例: 1. 分类①x ≥ y ≥ z②y ≥ z ≥ x③z ≥ x ≥ y④x ≥ z ≥ y⑤y ≥ x ≥ z⑥z ≥ y ≥ x.
常常可以根据对称性少讨论几个,轮换对称时可以设最大变量,从而固定一个只需讨论①x ≥ y ≥ z②y ≥ z ≥ x,完全对称时,可以完全设序,只讨论一个就够了。
2. 记每一种情况为a ≥ b ≥ c,则设b = c + s , a = c + s + t ,其中s ≥ 0 , t ≥ 0. 3. 代换,f(a , b , c) = f(c + s + t , c + s , c).
4. 整理,一般为合并同类项,若合并之后还有减号,试着配方,或者再差分一次试试。 差分代换的适用范围也比配方小,代换之后不一定行,没准还是带减号的,这很麻烦。。。 不过这不妨碍我们用它,要有信念,行! 举个例子:
证明三元三次形式的Schur 不等式:
当然,Schur 不等式的普遍形式的证明也是差分代换的思想。。。 证明三元形式的Schur 不等式: 对于正数x , y , z , t 有: 证明:
对于带参数的不等式,若利用差分代换方法求k 的范围(即求解系数列表),结果是充分的,必要性需要另外证明。。。比如说上面的三元四次轮换对称型,求解就是充分不必要的。。但是这毕竟是一个不错的方法,现在举一个用差分代换求k 范围的简单例子:
对于正数a , b , c 和 k ≥ 1/2 ,证明:
k(a^3+b^3+c^3)+3(1-k)abc ≥ a^2b+b^2c+c^2a
证明:设a ≤ b ≤ c,b=a+s
,c=a+s+t
若
p > q ,则显然 f(a,b,c,p) ≥ 0 可由 f(a,b,c,q) ≥ 0 推出。 由红字部分推出, f(a,b,c,k) ≥ 0 的充分条件是 k ≥ 1/2 。 事实上,如果2k-1
这种情况是类似的。
再加一个例子:
对于正数
a , b , c 求满足下式的k 的最小值:
设a ≤ b ≤ c
求解所有含k 系数A - B k ≥ 0,找出最小值k ≥ 199/39 = 5.10256…,得到不等式成立的充分条件。
设b = c + s , a = c + t ,其中s ≥ 0 , t ≥ 0,f(a , b , c) = f(c + t , c + s , c).
这可以避免仅轮换对称的式子的讨论,但往往需要后续处理。这种方法当然也适用于完全对称,减小了运算量,甚至在完全对称时收到比f(a , b , c) = f(c + s + t , c + s , c)更好的效果,这是很神奇的。。。 类似还有f(a , b , c) = f(q p c , p c , c) , p ≥ 1 , q ≥ 1有时能有收效。。。 比如证明三元三次形式的Schur 不等式:
用mathematica 求解这个三次函数
f(p) = p^3 q^3-p^3 q^2-p^3 q+p^3-p^2 q^2+3 p^2 q-p^2-p q-p+1 ≥ 0.
In[18]:= Reduce[p^3 q^3-p^3 q^2-p^3 q+p^3-p^2 q^2+3 p^2 q-p^2-p q-p+1>=0,p] Out[18]= p\[Element]Reals&&((q=Root[1+(-1-q) #1+(-1+3 q-q^2) #1^2+(1-q-q^2+q^3) #1^3&,3]))||(0=Root[1+(-1-q) #1+(-1+3 q-q^2) #1^2+(1-q-q^2+q^3) #1^3&,1])||q==1||(q>1&&p>=Root[1+(-1-q) #1+(-1+3 q-q^2) #1^2+(1-q-q^2+q^3) #1^3&,1]))
仔细看看,这对于 p ≥ 1 , q ≥ 1是显然的。。。即:
In[19]:= Reduce[{p^3 q^3-p^3 q^2-p^3 q+p^3-p^2 q^2+3 p^2 q-p^2-p q-p+1>=0,p>=1,q>=1},p]
Out[19]= q>=1&&p>=1
暂时这样吧,事实上没人真的看得进去差分的结果。。
。
(六)谈谈切线法及其推广
切线法是个人见人爱小妖精,她不破坏漂亮的轮换结构,却打破了齐次式。。。这注定她与配方的贵族气概还有一定的差距。。。不过因为不经大脑,所以我比较喜欢。。。。
经典的切线法,旨在解决一种条件轮换对称型:
取等条件为均值取等。
切线法的核心在于分离出单一变量的函数。
证明切线和原曲线位置关系常用分解因式的方法,这是因为:
求等条件处为切点,对于单元函数,一定可以得到一种分解因式的表达形式。
有人问,为什么不用凸函数性质说明问题,第一,凸函数很高深,不容易理解,第二,不是凸函数也可以用切线法,例如:
然而:(x^4 + 13 x^2 - 6 x^3)'' = 12 x^2 - 36 x +26
并非恒大于零。 切线法很多人讲过,我不说了,美利坚的那三道题是切线法的典例。。。 说一说推广:
①在对称性上推广,并非只有轮换性才能切线,非轮换型也可以: 对于f_i的切线g_i和g_i的和为C ,则证明
不对称情况也可以用切线法,例如:
对于实数 x , y , z 满足x + y + z ≥ 7 证明:
x^2+(y+2)^2+(z+2)^2≥3. 证明:
x^2+(y-2)^2+(z-2)^2≥2(x-1)+1+2(y-3)+1+2(z-3)+1=2(x+y+z)-11≥3. 我们常常使用待定系数的方法来证明这类问题。
对于实数 x , y , z 满足x + y + z ≥ C ,求f(x)+g(y)+h(z)的最小值:
求f'(x0)=g'(y0)=h'(z0)&x0+y0+z0=C.验证切线与原函数的位置关系,若满足: f(x)≥f'(x0)(x-x0)+f(x0),g(y)≥g'(y0)(y-y0)+g(y0),h(z)≥h'(z0)(z-z0)+h(z0). 则f(x)+g(y)+h(z)≥f'(x0)C+f(x0)+g(y0)+h(z0). 推广看:
k1 x+k2 y+k3 z=C
当然可以进一步推广——化直为曲:
有时不要试图用双切线条件,会死人的。。。例如:
证明:不妨设x + y + z = 1
原不等式等价于:
所以:
后一段仍然不易证明。
当然切线法设x + y + z = 1的思路可以使用:
分三类情况讨论可得上式等价于:
显然成立。
②在线上推广——直变曲
因为过去的题找不到了,就用上面说的现编一道:
证明:
③借来指对省运算: 有时:
这个变换会使证明豁然开朗,但是不能乱用,因为分解因式已经失效了,证明切线和曲线位置关系变得复杂起来。。。。 另一种情况,已知x y z = a , g(t) ≥ k t + b.
④在线上推广——线变面
世界上不仅有切线,还有切面(一般不是平的,平的直接看切线就行了),这是人类形象思维能力的极限。。。。 比如说已知p(x , y) + p(y , z) + p(z , x) = a.曲面z = f(x , y) ≥ p(x , y). 求证F(x , y , z) ≥ a就可以转化成:
⑤向大师靠拢——建立新的有效不等式。
人类活在三维世界里面,注定只能理解到三维立体,但是不妨碍代数研究更高的东西。。。 思路即为:
(七)介绍几个重要的不等式①。。。
借助已有的不等式往往需要很好的变形能力,这一点是我难以学会的。
。。。 不过总得知道,没准什么时候就用上了呢。。。 最重要的不等式——赫尔德(Hölder )不等式
设S 为测度空间,0
≤ p , q ≤ ∞,及1/p +
1/q = 1,设f 在L^p(S)内,g 在L^q(S)内。则f g 在L^1(S)内,且有。
若S
取作{1 , ... , n}附计数测度,便得赫尔德不等式的特殊情形: 对所有实数(或复数)x_i,y_i,有:
.
现在我们有两个方向: ①推广
②看明白什么玩应这是!!!!
sss. 赫尔德这个基本形式真的很难用,我们常用的都是它的几种变形: 对于正数
x_i , y_i , p > 1 , 1/p + 1/q = 1
这种形式里面最常用的又是p = 2/3 , q = 3的三元形式:
sss. 这个形式更像卡尔松(Carlson )不等式。。。
。 最经典的例子在IMO42
。。。。 对于正实数a , b ,c,证明:
证明自行百度。。。。
举一个其他的说明一下:
对于正数x , y , z 满足 x y z = 1 , 证明:
证明:设a^3 = x , b^3 = y , c^3 = z , 所以a b c = 1 由赫尔德不等式和米尔黑得(Muirhead )定理可知:
所以说,使用赫尔德不等式需要将\sqrt[3]{ax^2}凑成整式。 一个非常经典的例子:
对于正数a , b , c 满足 a + b + c = 1 ,证明: 证明:
(证明属于arqady )
(八)介绍几个重要的不等式②。。。
把他们三个一起说了,但是不代表最重要的那个只说一次。。。 万式之源,不等式中的王者——代数平均-几何平均不等式。 以及令人闹心的Schur 不等式和
Muirhead 不等式。。。 先说一说:
第一个谁都知道。。。。
Schur 不等式山没说过,再磨叽一遍。。。 对于正数x , y , z , t 有:
三元形式最强,四元形式常常就不够了。。。 还有几个Schur 不等式的推广:
①对于正数 a , b , c . 如果 (a,b,c) 和
(x,y,z) 有相似的排序,那么:
②对于实数a , b , c , x , y , z & a ≥ b ≥ c & ( x ≥ y ≥ z || x ≤ y ≤ z ) & k > 0 & (f:R->R_{0}^{+}是凸函数或单调函数) ,则有:
这是罗马尼亚数学家Valentin Vornicu于2007年证明的。
上面的结论直接建立了Schur 拆分的理论基础。
一个比较弱的结论,Muirhead 定理,常常与Schur 不等式联用,也常常单独使用(这时不等式一般比较弱),但是形式简单,不需要什么特别的智商,所以懒人都喜欢。。。所以,现在我们来看看他的形式: 对于正数x , y , z , a1 ≥ a2 ≥ a3 , b1 ≥ b2 ≥ b3 ,满足:
a1 ≥ b1 & a1 + a2 ≥ b1 + b2 , a1 + a2 + a3 ≥ b1 + b2 + b3 ,则有:
sym 太烦人而且不常用,所以我给出了cyc 的形式。。。 看看单用Muirhead ,一般比较简单:
对于对于正数 a , b , c 满足 a + b + c = 1 ,证明:
证明:
这里面有一个推广形式。。。。
然后举例说说联用Schur 和Muirhead : ①对于正数 x , y , z ,证明:
证明:由Schur 不等式和Muirhead 定理可知:
②对于正数 a , b , c , 0
证明:由Schur 不等式和Muirhead 定理可知:
这都是直接用Schur 的,但是舒尔拆分有所不同,是一种更加程序化的操作,日后再谈。。
。
上面根本就没提到代数平均-几何平均不等式,你可能觉得奇怪,我为什么把他们放一块。。
。。事实上,一切可以用Schur 不等式和Muirhead 定理解决的问题原则上都可以用代数平均-几何平均不等式解决,但是配成代数平均-几何平均不等式结构比较困难,所以懒人是不会做的。。。。 首先明确一下加权形式的代数平均-几何平均不等式:
严格的讲,这是一个概率不等式。。。 可以推广为:
举个栗子:
对于正数 x , y , z ,证明:
证明:由代数平均-几何平均不等式可知:
这道题完全可以用Muirhead 定理解决。。。即:
凑成代数平均-几何平均不等式往往需要待定系数,比如: 对于正数a , b , c , p , q , r , n 满足 p + q + r = n,证明:
证明:由加权形式的代数平均-几何平均不等式可知:
上面这个很好猜,但是对于一般的就很困难了。。。
利用这个证明Muirhead 定理是一种挑战,详细的可以参考《代数不等式》P96。。。事实上,Muirhead 定理反应的是函数的一种优超关系,可以通过每一个双重随机矩阵是置换矩阵的加权平均(伯克霍夫-冯·诺依曼(Birkhoff-von Neumann )定理)证明。。。。
(九)再谈配方法。。。。
配方就是解决多项式不等式的通天之法,因为原则上,一切正定多项式都可以化成二次型。但是往往不易配得,所以这一般用线性代数的方法,不过有一点是:手开矩阵是个很闹心的事情。。。于是我们有待定系数的方法。。。 但是应该配成几项呢?这要是不知道就很困难了。。。比如说: 对于实数 a , b , c ,证明:
竟然配出了27个平方项才解决。
。。这已经令人无法接受了。。。。 所以说,也不要贸然配方,不过对于这样的情况(现在对于实数),你可以直接想待定系数配方: ①一切二元或二次整式,可以整理成两个或n 个平方和
②二次或四次三元整式,可以整理成3个平方和
例如:对于实数 a , b , c ,证明:
2 x^4 + 2 y^4 + 2 z^4 - (x + y) z^3 - (x + z) y^3 -
(y + z) x^3 ≥ 0. 证明:
不要觉得神奇,这都是根据基础流配方得到的。。。
(对于三元四次,只说轮换型的解决方案,不轮换时可以类比,不过就是比较麻烦罢了) 二元二次型:
对应系数相等可以解得:
当t = 0时:
具体情况具体分析,寻找一个使得总体更美观的参数。。。当然,对于二元二次型都很简单,一般只配成t=0的形式,事实上大家都会,不要被我吓到了。。。写出来那个带自由变量p 的只是为了说明配方的多样性。。。 若可以取等,则二元二次型必能配成: 三元二次型:
对于任意情况的求解极为艰深。。。在这里不给出了(latex
命令已经超过2M ),
但需要注意到这个方程是无穷多解的,且自由度为2。。。 三元四次轮换型:
这是两个自由度的。。。
常常可以用的均值取等条件: a_1+a_2+a_3+b_1+b_2+b_3=0 这样只剩下一个自由度。。之后的就是寻找一个漂亮的参数了。。。a3=0时在给出a1:
其他项就容易配得了。。。
关于漂亮的参数的一点解释,例如上面的例子:a1=0时:
虽然也说明了问题,但是看起来很不舒服。。。 对于三元六次不等式,配方常常很困难。。。例如三次平均值不等式: 对于实数x , y , z ,证明: x^6+y^6+z^6\geq 3x^2y^2z^2. 由于人懒,交给软件解决了。。。反正他配出来是10项,这已经可以让你想要四处骂人了。。。。
但是我们遇到的问题常常是定义在正数集上的。。。这增加了配方的变化,即:
其中f(x,y,z) ≥ 0,另外如果等号能够取得,那么在满足取等条件g 的解集{(x.y.z)|g(x,y,z)=0}中的元素亦满足p_i(x,y,z)=0
对于三元齐n 次整式来说:
例如:
对于正数x , y , z ,证明:
x^3+y^3+z^3 ≥ x^2 y +y^2 z+z^2 x. 证明:
对于定义在正数集上的三元三次轮换整式:
补充一个均值取等条件b_1+b_2+b_3=0
再利用规划方法求得{(a_1,a_2,a_3,b_1,b_2,b_3)|a_1>0&a_2&a_3} 也可能一组也求不到。
。。例如三次Schur ,令a_2=m>0,a_3=n>0
这时候只好用SOS 定理(后面会证明)解决。。。 用两个或三个f_i组提高自由度仍是失败的。。。这一定程度说明轮换性配方对于三次Schur 失效了,可以试着打破轮换性,或者将x 换成a^2,根据希尔伯特-阿廷定理,这是一定的这很麻烦我不试了。。。。
(十)关于函数实根分别和不等式解集问题。。。。。。。 现在我感觉好害怕。。。事实上你也应该这么觉得,这一讲背后有传说中的代数几何。。。 但是现在,我们讨论很简单。。。。 一次型为正: a x + b ≥ 0 ①a0 & x ≥ -b/a
对于x ∈[m,n],a x + b>0成立的的(a,b): 现设f(x)=a x + b ①a>0 & f(m)≥0 ②a=0 & b≥0 ③a
①a=0,转化成一次型
②a>0, △ ≥ 0 || x ≥ -b/(2 a) + 1/2 △^(1/2)/a} || △ ≤ 0
③a
|| △ ≥ 0 & -b/(2 a) + 1/2△^(1/2)/a ≤ x ≤ -b/(2 a) - 1/2△^(1/2)/a 对于x 非负成立的的(a,b,c): 现设f(x)=a x^2 + b x + c. ①a>0
1.-b/(2a)
2.-b/(2a)≥0 & f(-b/(2a))≥0 ②a=0 转化成一次型 ③a
关于三次函数的杨路判别定理:
十一)谈谈齐次形式不等式的程序化处理①对称整理类。。。
(上面讲到的关于函数实根分别和不等式解集问题和后面讲到的TTK 条件是PQR 方法的得力助手) 现在说这些方法适用于八次以下,只是因为八次以上的情况处理起来有点麻烦。。。不是不能用,甚至齐次都可以放宽,具体的自己试试。。。。
主要是PQR 代换,类似的还有uvw 法,还有什么什么什么什么都差不多。。。。 涉及这样一种东西——对称多项式——可以用sym 符号表达的式子:
事实上,对称多项式是一种特殊的多元多项式。假设一个n 元多项式P(X1, X2, ..., Xn) ,当其中的n 个不定元任意交换后,多项式仍维持不变,就称其为对称多项式。严格的说法是,如果对任意的n 元置换σ,都有P(Xσ(1), Xσ(2), ..., Xσ(n)) = P(X1, X2, ..., Xn),就说P 是对称多项式。
容易证明,这种多项式都可以化成“基本对称多项式”,我们暂时只看三元形式: 设p = x + y + z , q = xy + yz + zx , r = xyz
则对称多项式可以表达为:
例如:
对于五次以下的对称多项式,可以化成关于r 的一次函数,即 F(x , y , z) = G(p , q , r) = k r + b
这时利用你的一次函数知识和 p^2 ≥ 3 q , q^3 ≥ 27r^2 , p^3 ≥ 27r 即可证明。。。 对于五次及以上八次及以下的对称多项式,可以化成关于r 的二次函数,即 F(x , y , z) = G(p , q , r) = a r^2 + b r + c
这时利用你的二次函数知识和 p^2 ≥ 3 q , q^3 ≥ 27r^2 , p^3 ≥ 27r 即可证明。。。 对于八次以上的式子,往往需要(不是一定)需要高次函数的知识,这就很麻烦。。。而且超过四次的方程就不一定有解析解了,这时讨论步履维艰。。。
试试用PQR 方法证明三次Schur 不等式: 设p = x + y + z , q = xy + yz + zx , r = xyz 则有p^2 ≥ 3 q , q^3 ≥ 27r^2 , p^3 ≥ 27r
更细化的证明用到了TTK 条件,后面介绍,这里仅以图像说明问题:
可以看出红色是绿色的子集。 更多的举例就免了。。。可以看看密闭房间做过的不少题,他是这方面的专家。。。。
事实上我不怎么喜欢PQR 代换这种方法,他既破坏了对称性,又破坏了轮换性,更加符合鲁迅老人家的悲剧定义了。。。而且简洁性也失去了,这才是我不能接受的。。。
PQR 代换使得原不等式面目全非,vuw 法稍好一些,比较容易看出原式的某些性质(比如取等性质)它的代换形式是:
3u = x + y + z , 3v^2 = xy + yz + zx , w^3 = xyz
即:u 是xyz 的代数平均,v 是xyz 的半代数平均,w 是xyz 是几何平均。。。 可以去看看Knudsen 写的那篇The uvw method.
(十二)谈谈齐次形式不等式的程序化处理②Schur 拆分法。。。
这是一种不错的处理三元六次以下对称多项式的方法,原则上可以证明一切齐n 次对称式,但是还是因为上面的原因——麻烦——所以一般不用,其基本思路是:
每一个齐n 次对称多形式F(a , b , c),都有唯一的“Schur拆分”结构,这可以通过上面提到的对称多项式基本定理进行证明。记:
F(x , y , z) ≥ 0等价于:
其理论基础是下面四个不等式:
这通过上面的广义Schur 不等式是显然的,事实上,通过Schur 不等式的证明思路,这些式子也很容易证明。。。。 对于六次以下不等式,其拆分可见(百度文库):
记三元齐n 次式为F(n),p = x + y + z , q = xy + yz + zx , r = xyz
举例说明:
对于三角形abc ,证明:
证明:设a = y + z , b = z + x , c = x + y ,原式等价于:
事实上,Schur 拆分是
基于Schp 算法的机械证明。。。不是给我们手算的。。。。
(十三)细化赫尔德(Hölder) 不等式&引入闵可夫斯基(Minkowski)不等式。。。。
哈代(Hardy )等人认为,这两个无论何时都是最重要的不等式,甚至在代数平均-几何平均不等式之上,虽然我们觉得用不上。。。。。
闵可夫斯基(Minkowski)不等式: 对于p>1,有:
事实上这个东西很高级,很高级,很高级。。。。只是我们没有必要深究罢了。。。 赫尔德不等式可以做出一个很重要的推广: 1/p + 1/q ≥ 1&p > 1&q > 1,仍然有:
赫尔德不等式的一个重要的退化形式柯西-布尼亚科夫斯基-施瓦茨(Cauchy-Buniakowsky-Schwarz )不等式,就是常说的柯西不等式,为了纪念后两位数学家的贡献,我们还是记住他们的名字吧。。。 赫尔德不等式的相似形式——卡尔松(Carlson )不等式(矩阵长方形不等式)
(卡尔松不等式)m×n 的非负实数矩阵中,n 列每列元素之和的几何平均值大于等于矩阵中m 行每行元素的几何平均值之和:
在前人的帖子里面讨论的很详细了:做出一个更正,很像Carlson 不等式的一个是:
(微微对偶不等式)对于每一个j ,a_{j,i}是正的递增序列,b_{j,i}是a_{j,i}的一个排序,则:
但是他们之间的差距还是比较大的,但是上面那个帖子认为是一个东西。。。
看过很多重要不等式之后,我们发现,这些比较强的不等式之间经常可以互推,这很神奇,很有趣,你们自己去发现吧。。。
(十四)幂平均函数及其他。。。。。。。
高中刚刚开始,学到三个毕达哥拉斯平均时,你有没有想过把
推广成:
或者:
相信很多人有过这样的想法。所以说,幂平均函数是一个容易想到推广的函数,我过去学三个毕达哥拉斯平均时自己已经想到和赫尔德完全一样的平均值函数了。。。
定义幂平均函数为:
其中x_i ≥ 0 , p ≠ 0. 因为:
即几何平均,所以可以补充 p = 0 时的定义。 幂平均函数有这样几个重要的性质(单调有界):
对于
p ≤ q ,(ω_i为权重,在非加权形式时等于1/p),
有:
对于 p ≤ 0 ≤ q 有:
幂平均函数的单调递增性称为幂平均单调性定理。这个定理的证明可以先取对数,
再通过Jensen 不等式证明,幂平均函数的引入是一个很方便的东西,这样闵可夫斯基不等式可以表述成“对于
p≥1,幂平均的和大于和的幂平均”即: M_p(x1)+M_p(x2)≥M_p(x1+x2) 或:
切比雪夫不等式可以表示为:“对于同增或同减的两个序列a_i,b_i,其幂平均的积小于积的幂平均”。 对于凸函数,还有幂凸函数,是用幂平均形式定义的。当然除此之外还有很多,我就想不起来或者忘了。。。
(十五)SOS 定理。。。
这是一种某些人很喜欢的东西,虽然我不怎么喜欢了。。。。毕竟不够直接了当,不符合我的性格。。。 对于三元二次以上轮换整式可以唯一整理成: 以下五种情况即称为SOS 定理。
试着用SOS 定理解决三次Schur 不等式。。。 根据SOS 第二定理:
通过SOS 定理的证明(自己找)过程很容易看出,第一定理和第五定理在任何一种整理:
都成立,而中间三个不一定成立。
。。但适用于整理:
非完全配方会遇到永远规划不到SOS-1的情况(但事实上这种情况并不多),这时SOS 定理就有用了。。。。
(十六)凸函数理论及受控理论。。。
f
是定义在凸集C 上的实变函数,对于x,y ∈C ,1 ≤ t ≤ 1 则称f 为D 上的(下)凸函数。
注意:y = x^2才是凸函数!!!y = x^0.5是凹函数。 最开始的定义(Jensen )是:
现称之为Jensen 凸函数。
第一个定义显然可以推出第二个,在①C 为拓扑向量空间②f 在C 上连续,则可以互推。
凸函数还有许多推广和类比,例如幂平均凸函数,伪凸函数等等,我见过的不下十种,在此不介绍了。
g 是区间D 上的连续凸函数等价于 任意x_0∈D ,存在h(x_0)满足哈代(Hardy )不等式:
从而推出二阶导数非负,函数为凸函数的结论。
凸函数中最重要的,也是最基本的就是Jensen 不等式: 对于凸函数φ,a_i∈[0,1]
反之,φ是凹函数,不等式反号。iff x_1=x_2=...=x_i或φ为直线时等号成立。
事实上,这更像一个概率不等式。。。积分形式有类似的结论。 哈达玛(Hadamard )不等式:
对于定义在[a,b]上的凸函数φ,a ≤ x
控制不等式(Schur 凸函数):
我们知道对于多元函数,其凸性是一个比较强的性质,需要一个更广泛的东西来推广凸性,使我们能够用类似凸函数方法“宏观上’’来推导不等式。于是控制不等式应运而生,由于控制不等式本身也是由一系列不等式来定义的,我们也就可以由控制不等式的一些性质来证明不等式。1923年德国数学家
Issai Schur率先系统研究了受控(Majorization)理论中函数的保序性,为纪念其贡献,将他所研究的这类函数命名为Schur 凸函数。随着受控理论研究的深入,Schur 凸函数已经在解析不等式、矩阵论、广义平均值、概率统计、图论、数值分析、可靠性、信息安全和其它相关领域发挥着愈来愈重要的作用。
综上,Schur 凸性是证明不等式的强有力的手段(可以证明许多你见都没见过的复杂的很强的结论),限于知识水平和篇幅,我不能说的过于详细,有兴趣的可以看石焕南先生的《受控理论与解析不等式》或王伯英先生的《控制不等式基础》。。。
现在,我们看看控制不等式的定义:
控制不等式同样具有传递性。
严格控制:不存在任何转置矩阵A 使得x = y A , 则称x 被y 严格控制。记为x\prec\prec y 哈代等人书中就给出的关于控制不等式的基本结论:
另一个重要的结论是:
对于g:I-->R,φ:R^n
-->R,复合函数ψ=φ(g(xi)有:
(1)若g 是凸的,φ是增且Schur 凸的,则
ψ是Schur 凸的; (2)若g 是凹的,φ是增且Schur 凹的,则ψ是Schur 凹的; (3)若g 是凹的,φ是减且Schur 凸的,则ψ是Schur 凸的; (4)若g 是凸的,φ是减且Schur 凹的,则ψ是Schur 凹的;
(5)若g 是减且凸的,φ是增且Schur 凸的,则ψ是减且Schur 凸的; (6)若g 是减且凸的,φ是减且Schur 凹的,则ψ是增且Schur 凹的。 对于严格凹凸性有同样结论。
对于三元对称形式,我们有这样一些基本结论:
试着用控制不等式做一道小题: 对于△ABC 和p ≥ 2 , k ≥ 0 , 证明:
证明:当t
令csc^k A = x , csc^k B = y , csc^k C = z ,则在(0,π)上,-ρ1,-ρ2是严格Schur 凸函数,故上式成立且在x = y = z△ABC 是正三角形时取等。
利用控制不等式证明代数或几何不等式时的基本思路即: ①证明一个函数的Schur 凸性。
②构造一个有Schur 凸性的函数。
从例子中我们可以看出,控制不等式可以解决许多含参不等式特别是指数含参的问题,这用其他方法往往是十分困难的。。。。。而且,相比整式上的诸多业已定型方法,控制不等式今日方兴未艾,尚有巨大的潜力,让我们慢慢期待!
(十七)杂谈 克劳修斯(Clausius )不等式与热力学第二定律。。。。
(这是我的本行嘛,比较熟悉,但是我不能从很基础的热力学概念讲起,太长了,虽然基础概念非常非常重要,所以就是给你们看看娱乐一下的。。。)
我们生活在一个被统计规律所描述的世界里面,正如薛定谔(Schrödinger )先生所说:“我们的一切物理学规律都是统计规律。” 统计力学是宏观与微观的桥梁,宏观体系因为数量的积累产生了质的飞跃,使之获得了微观体现不具有的东西,比如说——熵。
熵是一个神秘的概念,她不肯揭下那神秘的面纱,我们只能依稀的窥探她的容颜,熵,定义于热力学第二定律,但更给人一种可望不可即的飘渺之感,她已超越了原本的热力学概念,牵动着我们的情思。
我向来不鼓励大家直接去接触玻尔兹曼(Boltzmann )给出的伟大解释,虽然那看起来更容易理解,因为熵概念被克劳修斯提出到玻尔兹曼提出玻耳兹曼关系式用了27年,这27年,经典热力学基本建立完毕,并未用到统计诠释,所以要更好地理解这个概念,就要尊重历史发展啦。。。
卡诺(carnot )在热力学第二定律创建以前就提出了carnot 定理,并用自己都不认同的热质论给予了证明。。。但是天妒英才,卡诺英年早逝,连热二都没看着就驾鹤西去了,很可怜啊。。。理想气体顺时针经历两个等温可逆过程和两个绝热可逆过程,如图所示:
容易得出:
所以:
即卡诺效率定理引出熵的概念:可逆过程的热温商是熵。
熵是克劳修斯提出的热力学第二定律的量化描述,热力学第二定律一般有三种说法: 1. 克劳修斯(1850):不可能把热量从低温物体传递到高温物体而不产生其他影响。 2. 开尔文(1851):不可能从单一热源吸收能量,使之完全变为有用功而不产生其他影响。 3. 第二类永动机是不可能实现的。(废话。。。) 两种说法是等价的:
如果开尔文表述不真,那么克劳修斯表述不真:假设存在违反开尔文表述的热机A ,可以从低温热源T2吸收热量Q 并将其全部转化为有用功W 。假设存在热机B ,可以把功W 完全转化为热量Q 并传递给高温热源T1(这在现实中可实现)。此时若让A 、B 联合工作,则可以看到Q 从低温热源T2流向高温热源T1,而并未产生任何其他影响,即克劳修斯表述不真。反之亦然。 据此,容易得出克劳修斯不等式:
可以理解为循环过程中依次与n 个热源发生热相互作用。
熵是状态函数,是广度量,是宏观参量,不是守恒量。在经典隔离系统中,熵只会不断地增加,没有减少的机会,我们常常去将两个因变量相同的物理量类比,希望找出某种内在的关系,所以说,熵的方向,是时间的方向。能量虽然永生不灭,但是品味不同,随着时间推移,能量降退不断进行,孤立系统向着一种毫无生机的方向发展,最后一切大的变动,“这时宇宙将处于某种惰性的死的状态中”。当然,宇宙没有这样发展,但是对于我们的太阳系——可以看做经典隔离体系的小世界——这种发展是确确实实发生着的,所以请我们珍惜,不要浪费宝贵的自由能。 不等式的思想在现实世界中是一种方向的指示,热力学第二定律是经典理论中第一个不遵循时间反演可逆性的定律揭示了某种极为深刻的道理,要我们用一生去理解。
薛定谔在他那本名扬天下的小册子(生命是什么)中这样说过:
“在我们的食物中,到底有什么样的宝贵东西能使我们免于死亡呢?这是很容易回答的。每一个过程、事件、突发事变——你叫它什么都可以,一句话,自然界中正在进行着的每一事件,都意味着这件事在其中进行的那部分世界的熵在增加。因此,一个生命有机体在不断地产生熵——或者说是在增加正熵——并逐步趋近最大熵的危险状态,即死亡。要摆脱死亡,要活着,唯一的办法就是从环境中不断地汲取负熵(自由能)。有机体就是靠负熵为生的。或者说,新陈代谢的本质就在于使有机体成功的消除了当它活着时不得不产生的全部的熵。”
我们试着用非平衡态热力学去理解上述内容,对于近平衡态(扰动不大,分子碰撞传能速率大于某些不可逆过程的速率,反应活化能Ea>5k_B T等)采用局部平衡假设——将偏离平衡不远的系统划分为宏观小,微观大的元胞,则t 时刻该元胞的状态可代表t+dt时刻。 热力学第二定律便可以推广至任意体系:
deS 称为熵流,是系统与环境通过边界时增加的熵(可正可负),diS 称为熵产生,是系统内部不可逆过程带来的熵变(恒为正)。可用平衡方程描述熵变:
其中L 为任意广度量,此方程适用于任何系统。 熵流为热流和物质流贡献,所以:
Sj 为物质j 的偏摩尔熵。
进一步定义熵密度(单位体积熵产生率):σ=diS/(Vdt)=dis/dt 对于定态(dS/dt=0)有:σ=dis/dt=-des/dt
一般来说,近平衡态时,傅里叶(Fourier ,就是傅里叶变换那个傅里叶)线性热导定律成立,费克(Fick )扩散定律成立,但是反应亲和势A=-△rGm
研究不可逆过程时,常将势函数称为热力学力X ,由此引起的不可逆过程称为流J ,实践证明,X 较小时,J=LX,L 称为唯象系数。对于电势梯度,即为欧姆定律;对于温度梯度,则为傅里叶定律;对于浓度梯度,即为费克定律;对于化学反应,即为一级动力学规律。 于是熵产生率可描述为:
若系统中有多个不可逆过程,则有昂色格(
Onsager )倒易关系: 不可逆过程的线性表达:
中,L_{k,l}=L_{l,k}.此关系可由微观可逆性原理导出。
对于唯象系数恒定的体系,有最小熵产生原理:非平衡态的不可逆过程熵产生率随降低并趋于定值。由此可见,近平衡态的涨落行为随时间衰减,不会出现时空有序结构。所以说,当某些参量或约束条件超过限度,不同组分之间产生非线性关系,从无序到时空有序,即形成了耗散结构。
我们的每个生物分子,每个人,以及社会成分,都是时空有序的结构。BZ 震荡,Bénard 流,酶促反应,物种起源,生命进化都是耗散结构。一个耗散结构,要具备以下几个特征:①靠外界供应能量和物质才得以维持。②某些参量或约束条件超过阀值。③具有时空有序结构。④不受任何微小扰动的破坏。耗散结构的研究又包含于混沌理论之中,它将为更复杂的自然与社会问题提供更一般的规律和认识,应当给予关注。
最后说说热二的统计诠释:通过类比,即S 和Ω同样决定于(N,U,V)所以去寻找它们的关系,玻尔兹曼首先提出: S ∝ln Ω
普朗克求出了比例系数,称为玻尔兹曼常数k_B=R/L=1.3806488×10^-23J/K
这种定义下的熵称为统计熵,统计熵不局限于平衡态,是普遍使用的。所以说,热二的统计解释为:对于绝热或隔离系统,系统的可及微观状态数在不可逆过程中不断增大,趋近于最大值。但是统计解释又提出了更深刻的观点,即复原(熵减小)是有一定概率的,但是概率太小,所以表现出宏观上的方向性,但是方向中又伴随着涨落。这可以通过经典力学系统的亥姆霍兹函数理解。
熵的概念已经从热力学扩展到控制论、概率论、数论、天体物理、生命科学等领域。麦克斯韦提出了麦克斯韦妖,讨论就开始了。最后,信息熵被提出,并且与经典的热力学熵建立了定量的联系:
(十八)关于机械化方法的历史。。。
代数和几何从笛卡尔(Descartes )开始就再也没有分过家,笛卡尔曾经设想:一切问题化为数学问题,一切数学问题化为代数问题,一切代数问题化为代数方程求解问题。他把问题想得太简单了,如果他的设想真能实现,那就不仅是数学的机械化,而是全部科学的机械化。因为代数方程求解是可以机械化的。但Descartes 没有停留在空想,他所创立的解析几何,在空间形式和数量关系之间架起了一座桥梁,实现了初等几何问题的代数化。
之后,莱布尼茨(Leibniz )的努力促进了布尔(Boole )代数、数理逻辑以及计算机科学的研究,正是沿着这一方向,经后人的努力,形成了机器定理证明的逻辑方法。
随着集合论的诞生,近代数学的发展获得了有力的工具,之后希尔伯特开始形式数学的研究,但不出三年,哥德尔提出不完全性定理,这个著名的定理指出一个不弱于初等数论的形式系统如果是无矛盾的,则是不完全的,即存在形式系统的一个命题,它和它的否定都不能由形式系统证明。因此, Hilbert 的要求太高了。上述的Gödel 不完全性定理断言:即使在初等数论的范围内,T arski 提出:对所有命题进行判定的机械化方法也是不存在的!但是在初等数学的领域,一切初等几何和初等代数范围的命题,都可以用机械方法判定。
1959年,王浩设计了一个程序,用计算机证明了 Russell 、 Whitehead 的巨著《数学原理》中的几百条有关命题逻辑的定理,仅用了 9 分钟。王浩工作的意义在于宣告了用计算机进行定理证明的可能性。柱形代数分解(CAD )的提出,从理论上解决了一切正定多项式判别的问题,Mathematica 中的Reduce 命令约化不等式时采用的即是CAD ,我们可以试着去感受一下。但是它依靠实代数,求解复杂的将是几何级数式的增长。。。。这个CAD 以多项式代数和代数几何为基础的,理论异常艰深。。。之后,吴文俊提出吴方法,翻开了机器证明领域的新的一页。至此,世界范围内,这两类问题的机械证明都在蓬勃发展中。 对实代数和实几何的一些发展可以参见:
杨路负责,张景中、符红光、冯勇、曾振柄、侯晓荣、曾广兴、夏壁灿等参与的课题“实几何与实代数的高效能算法”(2004CB318003) (973项目“数学机械化方法及其在信息技术中的应用”的子项目之一)结题报告:
(十九)多元函数极值的偏导方法。。。。
对于多元函数f(x1,x2,...,xn)在某一区间上有连续的一二阶导数,定义黑塞(Hessian )矩阵为 其中
,即:
当函数二阶连续可导时,Hessian 矩阵
H 在驻点x 上是一个n×n
阶的对称矩阵。
当H 是正定矩阵时,驻点x 是一个局部的极小值。 当H
是负定矩阵时,驻点x 是一个局部的极大值。 当H=0,需要更高阶的导数来帮助判断。
H 的正定性一般通过所有特征根大于0来判定
求解所有f_{x_i}(x_1,x_2,...,x_n)=0可得出驻点。再用上述矩阵判定,最后比较得出最值。 拉格朗日(Lagrange )乘因子法:
若f(x)的约束条件为g_k(x) = 0。定义拉格朗日函数为:
的解即为可能的极值。
TTK (卡罗需-库恩-塔克,Karush-Kuhn-Tucker Conditions)条件:
这是一种推广的拉格朗日(Lagrange )乘因子法,将等式约束条件推广至不等式约束条件, f(x)在x*处取得最值的必要条件,对于最大值:
对于最小值:
其中:
另外,充分条件为Fritz John条件:
包含于FONC 条件中。。。
有很多人学了拉格朗日乘因子法就看不起初等不等式了,但是,由上面的内容可见,将初等不等式证明完全归结于高等数学方法往往是不划算的,甚至是相当困难,以已掌握的理论无法解决的。。。
(二十)解析——几何与代数的桥梁
几何定理主要包括等量关系定理(如勾股定理,九点圆定理)和不等关系定理(如三角不等式,佩多不等式)。一般来说,狭义的几何定理是等量关系定理。等量关系的定理可以通过化成代数等式的方法解决,这时,欧几里得几何的构造通常不是通过公理化方法,而是通过解析几何。通过这种方法,可以像证明定理一样证明欧几里得几何(或非欧几里得几何)中的公理。这一方法没有公理方法那么漂亮,但绝对简练。 例如使用吴方法证明“三角形三条高线交于一点” 证明:设O(0,0),A(x1,0),B(x2,0),C(0,x3),D(x4,x5)
证明:
我们常常用高等几何(射影几何)用于解析证明,其中属仿射性质(对合)最为常用。仿射几何是欧氏几何在较高层面上的推广和延伸在初等几何中的应用范畴比较广泛, 是应用高等几何知识解决初等几何问题的一条重要通道在初等几何中有大量的命题是研究图形的仿射性质的,即并不涉及到距离、角度、面积的具体度量,而仅涉及到点线结
合关系、直线的平行性、共线或平行线段之比、两封闭图形面积之比以及中点等概念对于这类命题,可以运用仿射的有关性质,借助于仿射变换,由特殊到一般,化繁为简地加以解决,从而达到事半功倍的效果。
对于几何不等式,当然也可以用到上面的结论,但是几何不等式相对等量关系定理过于广泛,所以一般只研究较简单的几何量,例如三角形边长,角度,面积相关圆半径等。我们可以用等量关系定理将之化为条件代数不等式。 常用的代换等量关系(以边长a,b,c 为例,设半周长p ,面积S )
S=√[p(p-a)(p-b)(p-c)] 内切圆半径
r=S/p
外接圆半径R=abc/(4S) sin A=a/2R
cos A=(b^2+c^2-a^2)/(2bc)
中线m_a=1/2 √[2(b^2+c^2)-a^2] 角平分线t_a=2/(b+c) √[bcp(p-a)] 高线h_a=2S/a
这可以将关于许多三角形的几何不等式站变成代数不等式证明。 举个栗子:
关于三角形的一个著名结果——欧拉不等式: 三角形外接圆半径大于等于内接圆直径。
这是一个漂亮的几何不等式,纯几何证法可证,但实为艰深,一种方法通过欧拉定理: 三角形的外心与内心之间的距离d 可表示为d^2 = R(R - 2r).
当然利用代数方法就比较简单了:
这个不等式的推广——厄多斯(Erdos )不等式: 对于三角形内部一点P ,到一边距离成为d ,则有:
可由不等式:
推出。此定理亦存在纯几何证明(参见N·D·Kazarinoff 的《几何不等式》),但是要用到帕普斯推广的勾股定理。对于代数方法,我们可以设ABCP 的坐标为: A(x1,0),B(x2,0),C(0,x3),P(x4,x5) 之后利用解析几何工具解决。 当然,我们也可以令:
A=x1,B=x2,C=x3 i,P=x4+x5 i 建立复数平面解决。。。
小测试 A (轮换不等式):
对于正数 x , y , z 满足x + y + z = 1 , 证明:
①②③
④
对于正数 x , y , z 满足x y z = 1 ,
证明: ①②
③ 对于正数 x , y , z 满足x^2 y+y^2 z+z^2 x=3 , 证明: ①
②
对于正数 x , y , z 满足x^y+z^x+y^z=3 , 证明:
小测试 B (含参情况):
①对于实数 n ,正数a , b , c 满足:
则有:
②对于正数a ,b ,c ,d 满足a + b + c + d = 1, 函数
其中| |表示复数的模。
③正数x , y , z , w满足x^2 + y^2 + z^2 + w^2≤4 , x + y + z + w≥2 , k≥3,则:
.
④正数 x , y , z 满足 x + y + z = 3 , 函数:
则有:
⑤正数 x , y , z 满足 x + y + z = 1 , t≥9/32 ,证明:
⑥对于实数
a_i,证明:
其中
⑦对于正数
a , b , c 满足a + b + c = 1, -∞
小测试 C (对称破缺):
①对于正数
x , y , z 满足x + y + z = 1 , 证明:
②对于正数 x , y , z 满足x + y + z = 1 , 证明:
m=6.51758...是12 x^7-136 x^6+436 x^5-436 x^4+612 x^3-1760 x^2-900 x-125的唯一零点。 ③对于正数
a , b , c 满足a + b + c = 1 , 证明:
M 是5 x^3-7 x^2-33 x+31的第二零点。