1. 导数

函数 y = f ( x ) y=f(x) y=f(x) 的导函数 f ′ ( x ) f'(x) f(x)的定义如下所示:
在这里插入图片描述
该公式是指,当 ∆ x ∆x x 无限接近0时, f ′ ( x ) f'(x) f(x)最接近的值是多少。

例如:

f ( x ) = 3 x f(x) = 3x f(x)=3x 时,
在这里插入图片描述

f ( x ) = x 2 f (x) = x^2 f(x)=x2 时,
在这里插入图片描述
常用的求导公式有:
( k ) ′ = 0 、 ( k x ) ′ = k 、 ( x k ) ′ = k x k − 1 、 ( e x ) ′ = e x 、 ( e − x ) ′ = − e − x (k)'=0、(kx)'=k、(x^k)'=kx^{k-1}、(e^x)'=e^x、(e^{-x})'=-e^{-x} (k)=0(kx)=k(xk)=kxk1(ex)=ex(ex)=ex(k为常数)

另一种表示方法:
f ′ ( x ) = d y d x f'(x) = \frac{dy}{dx} f(x)=dxdy

由于导函数 f ′ ( x ) f'(x) f(x) 表示切线斜率,故:当函数f(x)在x = a处取得最小值时,f’(a) = 0。

2 基本导数与微分表

(1) 𝑦 = 𝑐 𝑦 = 𝑐 y=c(常数) 则: 𝑦 ′ = 0 , 𝑑 𝑦 = 0 𝑦′=0,𝑑𝑦=0 y=0dy=0

(2) 𝑦 = x a 𝑦 = x^a y=xa ( a a a为实数) 则: 𝑦 ′ = a x a − 1 , d y = a x a − 1 d x 𝑦′ = ax^{a-1},dy = ax^{a-1}dx y=axa1dy=axa1dx

(3) y = a x y= a^x y=ax 则: y ′ = a x ln ⁡ a , d y = a x ln ⁡ a 𝑑 𝑥 y′ = a^x\ln{a},dy=a^x\ln{a}𝑑𝑥 y=axlnady=axlnadx
特例: ( e x ) ′ = e x , d ( e x ) = e x d x (e^x)' = e^x,d(e^x) = e^xdx (ex)=exd(ex)=exdx

(4) y = log ⁡ a x y=\log_ax y=logax 则: 𝑦 ′ = 1 𝑥 ln ⁡ 𝑎 , d y = 1 𝑥 ln ⁡ 𝑎 d x 𝑦′ = \frac1{𝑥\ln𝑎},dy=\frac1{𝑥\ln𝑎}dx y=xlna1dy=xlna1dx
特例: 𝑦 = ln ⁡ 𝑥 , y ′ = 1 x , d y = 1 x d x 𝑦 = \ln{𝑥},y′ = \frac1x,dy = \frac1xdx y=lnxy=x1dy=x1dx

(5) y = sin ⁡ x y=\sin x y=sinx 则: y ′ = cos ⁡ 𝑥 , d ( sin ⁡ 𝑥 ) = cos ⁡ x d x y' = \cos 𝑥,d(\sin 𝑥) = \cos xdx y=cosxd(sinx)=cosxdx

(6) 𝑦 = cos ⁡ 𝑥 𝑦 = \cos𝑥 y=cosx 则: 𝑦 ′ = − sin ⁡ 𝑥 , 𝑑 ( cos ⁡ 𝑥 ) = − sin ⁡ 𝑥 𝑑 𝑥 𝑦′ = −\sin𝑥,𝑑(\cos𝑥) = −\sin𝑥𝑑𝑥 y=sinxd(cosx)=sinxdx

(7) 𝑦 = tan ⁡ 𝑥 𝑦 = \tan𝑥 y=tanx 则: 𝑦 ′ = 1 c o s 2 𝑥 = s e c 2 𝑥 , 𝑑 ( tan ⁡ 𝑥 ) = sec ⁡ 2 𝑥 𝑑 𝑥 𝑦′ = \frac1{cos^2𝑥} = sec^2𝑥,𝑑(\tan𝑥) = \sec^2𝑥𝑑𝑥 y=cos2x1=sec2xd(tanx)=sec2xdx

(8) 𝑦 = cot ⁡ 𝑥 𝑦 = \cot𝑥 y=cotx 则: 𝑦 ′ = − 1 s i n 2 𝑥 = − c s c 2 𝑥 , 𝑑 ( cot ⁡ 𝑥 ) = − csc ⁡ 2 𝑥 𝑑 𝑥 𝑦′ = -\frac1{sin^2𝑥} = −csc^2𝑥,𝑑(\cot𝑥) = −\csc^2𝑥𝑑𝑥 y=sin2x1=csc2xd(cotx)=csc2xdx

(9) 𝑦 = sec ⁡ 𝑥 𝑦 = \sec𝑥 y=secx 则: 𝑦 ′ = sec ⁡ 𝑥 tan ⁡ 𝑥 , 𝑑 ( sec ⁡ 𝑥 ) = sec ⁡ 𝑥 tan ⁡ 𝑥 𝑑 𝑥 𝑦′ = \sec𝑥\tan𝑥,𝑑(\sec𝑥) = \sec𝑥\tan𝑥𝑑𝑥 y=secxtanxd(secx)=secxtanxdx

(10) 𝑦 = c s c 𝑥 𝑦 = csc𝑥 y=cscx 则: 𝑦 ′ = − csc ⁡ 𝑥 cot ⁡ 𝑥 , 𝑑 ( csc ⁡ 𝑥 ) = − csc ⁡ 𝑥 cot ⁡ 𝑥 𝑑 𝑥 𝑦′ = −\csc𝑥\cot𝑥,𝑑(\csc𝑥) = −\csc𝑥\cot𝑥𝑑𝑥 y=cscxcotxd(cscx)=cscxcotxdx

(11) 𝑦 = arcsin ⁡ 𝑥 𝑦 = \arcsin𝑥 y=arcsinx 则: 𝑦 ′ = 1 1 − x 2 , 𝑑 ( arcsin ⁡ 𝑥 ) = 1 1 − x 2 𝑑 𝑥 𝑦′ = \frac1{\sqrt{1-x^2}},𝑑(\arcsin𝑥) = \frac1{\sqrt{1-x^2}}𝑑𝑥 y=1x2 1d(arcsinx)=1x2 1dx

(12) 𝑦 = arccos ⁡ 𝑥 𝑦 = \arccos𝑥 y=arccosx 则: 𝑦 ′ = − 1 1 − x 2 , 𝑑 ( arccos ⁡ 𝑥 ) = − 1 1 − x 2 𝑑 𝑥 𝑦′ = -\frac1{\sqrt{1-x^2}},𝑑(\arccos𝑥) = -\frac1{\sqrt{1-x^2}}𝑑𝑥 y=1x2 1d(arccosx)=1x2 1dx

(13) 𝑦 = arctan ⁡ 𝑥 𝑦 = \arctan𝑥 y=arctanx 则: 𝑦 ′ = 1 1 + x 2 , 𝑑 ( arctan ⁡ 𝑥 ) = 1 1 + x 2 𝑑 𝑥 𝑦′ = \frac1{1+x^2},𝑑(\arctan𝑥) = \frac1{1+x^2} 𝑑𝑥 y=1+x21d(arctanx)=1+x21dx

(14) 𝑦 = arccot  𝑥 𝑦 = \text{arccot}\space𝑥 y=arccot x 则: 𝑦 ′ = − 1 1 + x 2 , 𝑑 ( arccot  x ) = − 1 1 + x 2 𝑑 𝑥 𝑦′ = -\frac1{1+x^2},𝑑(\text{arccot}\space x) =-\frac1{1+x^2} 𝑑𝑥 y=1+x21d(arccot x)=1+x21dx

(15) 𝑦 = sh ⁡ 𝑥 𝑦 = \sh𝑥 y=shx 则: 𝑦 ′ = ch ⁡ 𝑥 , 𝑑 ( sh ⁡ 𝑥 ) = ch ⁡ 𝑥 𝑑 𝑥 𝑦′ = \ch𝑥,𝑑(\sh𝑥) = \ch𝑥𝑑𝑥 y=chxd(shx)=chxdx

(16) 𝑦 = ch ⁡ 𝑥 𝑦 =\ch𝑥 y=chx 则: 𝑦 ′ = sh ⁡ 𝑥 , 𝑑 ( ch ⁡ 𝑥 ) = sh ⁡ 𝑥 𝑑 𝑥 𝑦′ = \sh𝑥,𝑑(\ch𝑥) = \sh𝑥𝑑𝑥 y=shxd(chx)=shxdx

3 偏导数

3.1 多变量函数

有两个以上的自变量的函数称为多变量函数。
在这里插入图片描述

3.2 偏导数

求导的方法也同样适用于多变量函数的情况。但是,由于有多个变量,所以必须指明对哪一个变量进行求导。在这个意义上,关于某个特定变量的导数就称为偏导数

例如,让我们来考虑有两个变量 x、y 的函数 z = f(x, y)。只看变量 x, 将 y 看作常数来求导,以此求得的导数称为“关于 x 的偏导数”

在这里插入图片描述

4 多变量函数的最小值条件

光滑的单变量函数 y = f (x) 在点 x 处取得最小值的必要条件是导函数在该点取值 0,这个事实对于多变量函数同样适用。例如对于有两个变量的函数,可以如下表示。在这里插入图片描述
在这里插入图片描述
根据上述 (1),函数取得最小值的必要条件是 x = 0,y = 0。此时函数值 z 为 0。由于 z = x 2 + y 2 ≥ 0 z = x^2 + y^2 ≥ 0 z=x2+y20,所以我们知道这个函数值 0 就是最小值。

5 参考资料

《深度学习的数学》
《AndrewNG机器学习笔记v5.4—黄海广》

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐