琴生不等式(Jensen Inequality)

(38) 2024-09-15 19:01:01

目录

不同表述形式

有限形式

测度与概率形式

在概率论中的广义形式

不等式证明

有限形式

测度和概率形式

概率论中的广义形式

不等式应用

在概率密度函数中的形式

随机变量的偶次矩

其他有限形式

统计物理

信息论

Rao–Blackwell定理


在数学中,琴生不等式(Jensen Inequality)以丹麦数学家 Johan Jensen 的名字命名,又称詹森不等式。它将积分的凸函数的值与凸函数的积分联系起来,Jensen在 1906 年证明了这一点。

鉴于其普遍性,不等式根据上下文以多种形式出现,最简单的不等式表示均值的凸变换小于或等于凸变换后的均值。而凹变换的情况正好相反。

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第1张

Jensen不等式概括了凸函数的割线位于函数图上方的陈述,这是Jensen对两点的不等式:割线由凸函数的加权均值组成(对于 t∈[0,1]):

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第2张

函数的图形是加权均值的凸函数:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第3张

因此,Jensen 不等式是 :

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第4张

在概率论的语境中,一般用以下形式表述:如果 X 是随机变量且 φ 是凸函数,则:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第5张

不等式两边的差琴生不等式(Jensen Inequality) (https://mushiming.com/)  第6张,称为 Jensen 间隙(Jensen gap)。

不同表述形式

Jensen 不等式的经典形式涉及多个数字和权重。 不等式可以用测度论的语言或(等价的)概率来表述。 在概率定义中,不等式可以进一步推广到其全部强度(full strength)。

有限形式

对于一个实凸函数琴生不等式(Jensen Inequality) (https://mushiming.com/)  第7张,定义域中的数字琴生不等式(Jensen Inequality) (https://mushiming.com/)  第8张,和正权重琴生不等式(Jensen Inequality) (https://mushiming.com/)  第9张,Jensen不等式可以表示为:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第10张

如果琴生不等式(Jensen Inequality) (https://mushiming.com/)  第7张为凹函数,则:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第12张

当且仅当琴生不等式(Jensen Inequality) (https://mushiming.com/)  第13张时等号成立,或者琴生不等式(Jensen Inequality) (https://mushiming.com/)  第7张为线性函数。

作为特殊情况,当正权重琴生不等式(Jensen Inequality) (https://mushiming.com/)  第9张都相等时,上述等式可以表示为:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第16张

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第17张

琴生不等式可以用作证明一般情况的平均不等式:

1)">

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第19张

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第20张

其中前面两个取琴生不等式(Jensen Inequality) (https://mushiming.com/)  第21张,后面一个取琴生不等式(Jensen Inequality) (https://mushiming.com/)  第22张

一个常见的应用是将 x 作为另一个变量(或一组变量)t的函数琴生不等式(Jensen Inequality) (https://mushiming.com/)  第23张。 所有这些都直接适用于一般连续情况:权重琴生不等式(Jensen Inequality) (https://mushiming.com/)  第9张被非负可积函数f(x)代替,例如概率分布,并且总和被积分代替。

测度与概率形式

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第25张是一个概率空间,琴生不等式(Jensen Inequality) (https://mushiming.com/)  第26张。如果g是一个实数函数,且对于琴生不等式(Jensen Inequality) (https://mushiming.com/)  第27张可积,另外如果琴生不等式(Jensen Inequality) (https://mushiming.com/)  第7张是一个在实线域上是凸函数,则:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第29张

在实分析中,我们可能需要对下式做一个估计:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第30张

其中琴生不等式(Jensen Inequality) (https://mushiming.com/)  第31张琴生不等式(Jensen Inequality) (https://mushiming.com/)  第32张是非负勒贝格积分函数。在这种情况下,勒贝格测度[a,b]不用是统一的。但是,通过作代换积分,可以重新调整区间以使其具有度量单位,那么可以应用Jensen不等式得到:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第33张

通过简单的符号变化,可以在概率论中等效地陈述相同的结果。 令琴生不等式(Jensen Inequality) (https://mushiming.com/)  第34张为概率空间,X为可积实值随机变量,φ为凸函数。 则:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第5张

在这个概率定义中,测度μ的目的是作为概率P,关于μ作为期望值的积分,以及作为随机变量X的函数g。

注意等式成立当且仅当 φ 是某个凸集A上的线性函数,使得琴生不等式(Jensen Inequality) (https://mushiming.com/)  第36张

在概率论中的广义形式

更一般地,设T为实拓扑向量空间,X为T值可积随机变量。在这个一般设置中,可积意味着在T中存在一个元素E[X],使得对于T的对偶空间(dual space)中的任何元素 z: 琴生不等式(Jensen Inequality) (https://mushiming.com/)  第37张琴生不等式(Jensen Inequality) (https://mushiming.com/)  第38张。然后,对于任何可测凸函数 φ 和F的任何子 σ-代数琴生不等式(Jensen Inequality) (https://mushiming.com/)  第39张

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第40张

这里琴生不等式(Jensen Inequality) (https://mushiming.com/)  第41张代表以 σ-代数琴生不等式(Jensen Inequality) (https://mushiming.com/)  第39张为条件的期望。当拓扑向量空间T是实轴,并且琴生不等式(Jensen Inequality) (https://mushiming.com/)  第39张是平凡的σ-代数 {∅, Ω}(其中∅是空集,Ω是样本空间),这个一般性陈述简化为以前的陈述。

一种锐化和概括的形式

设X是一维随机变量,均值为琴生不等式(Jensen Inequality) (https://mushiming.com/)  第27张,方差为琴生不等式(Jensen Inequality) (https://mushiming.com/)  第45张。令琴生不等式(Jensen Inequality) (https://mushiming.com/)  第46张为二次可微函数,并定义函数:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第47张

然后:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第48张

特别地,当琴生不等式(Jensen Inequality) (https://mushiming.com/)  第46张是凸的,那么琴生不等式(Jensen Inequality) (https://mushiming.com/)  第50张。对于琴生不等式(Jensen Inequality) (https://mushiming.com/)  第46张被另外假设为二次可微的情况,自然而然能够得出标准的Jensen 不等式的形式。

不等式证明

Jensen 不等式可以通过多种方式证明,并且将提供对应于上述不同陈述的三种不同证明。

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第52张

然而,在开始这些数学推导之前,有必要分析基于概率情况的直观图形论证,其中X是实数(见上图)。假设X值的分布,人们可以立即确定E[X]及其图像φ(E[X])在图中的位置。注意到对于凸映射Y = φ(X),随着X值的增加,Y值的相应分布越来越“伸展”,很容易看出Y的分布在对应于X_{0}">的区间中更宽,并且对于任何琴生不等式(Jensen Inequality) (https://mushiming.com/)  第54张,在琴生不等式(Jensen Inequality) (https://mushiming.com/)  第55张处更窄;特别是,对于琴生不等式(Jensen Inequality) (https://mushiming.com/)  第56张也是如此。因此,在这张图片中,Y的期望总是相对于琴生不等式(Jensen Inequality) (https://mushiming.com/)  第57张的位置向上移动。如果X的分布覆盖了凸函数的递减部分,或者同时覆盖了凸函数的递减部分和递增部分,则类似的推理成立。这“证明”了不等式:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第58张

等式成立仅当 φ(X) 不是严格凸的时,例如当它是一条直线时,或者当 X 遵循退化分布(即是一个常数)时。

有限形式

测度和概率形式

概率论中的广义形式

 

不等式应用

在概率密度函数中的形式

假设琴生不等式(Jensen Inequality) (https://mushiming.com/)  第59张是实线的可测子集,f(x)是一个非负函数:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第60张

在概率论中f(x)是概率密度函数。利用Jensen不等式的加权形式,可以写出f(x)形式下的公式。

如果g是任何实值可测函数且琴生不等式(Jensen Inequality) (https://mushiming.com/)  第7张在g的范围内是凸的,那么:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第62张

如果g(x)=x,那么这种不等式的形式可以简化为一个常用的特例:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第63张

这个结果一般被应用于变分贝叶斯方法(Variational Bayesian methods)。

随机变量的偶次矩

如果琴生不等式(Jensen Inequality) (https://mushiming.com/)  第64张,X是一个随机变量,g是一个凸函数:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第65张

二阶导数大于0,为凸函数,于是有:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第66张

特别的,如果X的偶次矩是有限的,X具有有限的均值。这个结论可以推广为:X的琴生不等式(Jensen Inequality) (https://mushiming.com/)  第67张次矩是有限的。

其他有限形式

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第68张,取琴生不等式(Jensen Inequality) (https://mushiming.com/)  第27张为其上的测度,则一般的形式可以化简为求和的形式:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第70张

前提是:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第71张

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第72张

这里也有无限的离散形式。

统计物理

在统计物理中考虑一个指数型的凸函数:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第73张

其中期望值为某个分布下的随机变量X的值。

上述公式证明比较简单,首先:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第74张

然后利用已有公式琴生不等式(Jensen Inequality) (https://mushiming.com/)  第75张

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第76张

代入前式得:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第77张

信息论

如果p(x)是X的概率密度,q(x)是另一个概率密度,对随机变量Y(X)=q(X)/p(X)应用琴生不等式,则琴生不等式(Jensen Inequality) (https://mushiming.com/)  第78张

因而:

琴生不等式(Jensen Inequality) (https://mushiming.com/)  第79张

这个结果被称为吉布斯不等式(Gibbs' inequality)

它表明当基于真实概率p而不是任何其他分布q分配代码时,平均消息长度最小。非负的数量称为q与p的Kullback-Leibler散度。由于-log(x)是x>0的严格凸函数,因此当p(x)几乎处处等于q(x)时,等式成立。

Rao–Blackwell定理

 

 

 

 

 

 

 

 

 

 

 

 

 

 

THE END

发表回复