琴森不等式及其证明
Jensen's InequalityJensen’s Inequality中文译名琴森不等式,要想了解琴森不等式,首先需要知道凸函数(convex function)与凹函数(concave function)的概念。 由于凸函数和凹函数是相反的概念,因此这里只介绍凸函数即可。1 凸函数的概念如下图中的红色曲线就是一个凸函数(可能直观上来看这个曲线是凹的,别弄反了)。我们在高中就已经学习过相关知
Jensen's Inequality
Jensen’s Inequality中文译名琴森不等式,要想了解琴森不等式,首先需要知道凸函数(convex function)与凹函数(concave function)的概念。 由于凸函数和凹函数是相反的概念,因此这里只介绍凸函数即可。
1 凸函数的概念
如下图中的红色曲线就是一个凸函数(可能直观上来看这个曲线是凹的,别弄反了)。
我们在高中就已经学习过相关知识,这里仅温习一下,用数学的语言描述凸函数就是:
如果个函数具有如下性质:每条弦都位于函数上或函数上方,我们就说这个函数是凸函数。位于x=a到x=b之间的任何一个x值都可以写成 λ a + ( 1 − λ ) b \lambda a+(1-\lambda )b λa+(1−λ)b的形式,其中 0 ≤ λ ≤ 1 0 \le \lambda \le 1 0≤λ≤1,弦上的对应点可以写成: λ f ( a ) + ( 1 − λ ) f ( b ) \lambda f(a) + (1-\lambda )f(b) λf(a)+(1−λ)f(b),函数上的对应值为 f ( λ a + ( 1 − λ ) b ) f(\lambda a+(1-\lambda )b) f(λa+(1−λ)b),这样凸函数的性质就可以表示为:
f ( λ a + ( 1 − λ ) b ) ≤ λ f ( a ) + ( 1 − λ ) f ( b ) f(\lambda a+(1-\lambda )b) \le \lambda f(a) + (1-\lambda )f(b) f(λa+(1−λ)b)≤λf(a)+(1−λ)f(b)
这等价于要求函数的二阶导数处处为正。
2 琴森不等式
假设
f
(
x
)
f(x)
f(x)是区间
(
a
,
b
)
(a,b)
(a,b)上的凸函数,则对任意的
x
1
,
x
2
,
.
.
.
,
x
n
∈
(
a
,
b
)
x_1, x_2,...,x_n \in (a,b)
x1,x2,...,xn∈(a,b)有不等式:
f
(
x
1
+
x
2
+
.
.
.
+
x
n
n
)
≤
f
(
x
1
)
+
f
(
x
2
)
+
.
.
.
+
f
(
x
n
)
n
f(\frac{x_1+x_2+...+x_n}{n}) \le \frac{f(x_1)+f(x_2)+...+f(x_n)}{n}
f(nx1+x2+...+xn)≤nf(x1)+f(x2)+...+f(xn)
成立,当且仅当
x
1
=
x
2
=
.
.
.
=
x
n
x_1=x_2=...=x_n
x1=x2=...=xn时等号成立。
另外,假设
f
(
x
)
f(x)
f(x)是区间
(
a
,
b
)
(a,b)
(a,b)上的凸函数,则对任意的
x
1
,
x
2
,
.
.
.
,
x
n
∈
(
a
,
b
)
x_1, x_2,...,x_n \in (a,b)
x1,x2,...,xn∈(a,b),有
∑
i
=
1
n
a
i
=
1
\sum_{i=1}^n{a_i}=1
∑i=1nai=1,且
a
i
a_i
ai均大于0,则有:
f
(
a
1
x
1
+
a
2
x
2
+
.
.
.
+
a
n
x
n
)
≤
a
1
f
(
x
1
)
+
a
2
f
(
x
2
)
+
.
.
.
+
a
n
f
(
x
n
)
f(a_1x_1+a_2x_2+...+a_nx_n) \le a_1f(x_1)+a_2f(x_2)+...+a_nf(x_n)
f(a1x1+a2x2+...+anxn)≤a1f(x1)+a2f(x2)+...+anf(xn)
巧妙的是,由于有 ∑ i = 1 n a i = 1 \sum_{i=1}^n{a_i}=1 ∑i=1nai=1,且 a i a_i ai均大于0的约束,这样可以将 a i a_i ai看作是随机变量 x i x_i xi的概率,上式左侧就刚好是随机变量 X X X的期望 E ( X ) E(X) E(X),因此上式等价于:
f ( E ( X ) ) ≤ E ( f ( X ) ) f(E(X)) \le E(f(X)) f(E(X))≤E(f(X))
3 证明琴森不等式
那么琴森不等式的结论如何证明呢?下面使用数学归纳法证明。
证明:
已知当n=2的时候,琴森不等式成立,即:
f
(
λ
a
+
(
1
−
λ
)
b
)
≤
λ
f
(
a
)
+
(
1
−
λ
)
f
(
b
)
f(\lambda a+(1-\lambda )b) \le \lambda f(a) + (1-\lambda )f(b)
f(λa+(1−λ)b)≤λf(a)+(1−λ)f(b)
假设当n=N时该结论成立,有:
f
(
∑
i
=
1
n
a
i
x
i
)
≤
∑
i
=
1
n
a
i
f
(
x
i
)
f(\sum_{i=1}^n{a_ix_i}) \le \sum_{i=1}^n{a_if(x_i)}
f(i=1∑naixi)≤i=1∑naif(xi)
只需证明当n=N+1时该结论仍然成立即可,当n=N+1时,有:
因此,当n=N+1时,不等式仍然成立,即证。
----- 本文完 -----
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)