在向量分析中, 雅可比矩阵是
一阶偏导数以
一定方式排列成的
矩阵。其行列式称为雅可比行列式。
一、Jacobian矩阵
雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近. 因此, 雅可比矩阵类似于多元函数的导数。
![y_{m}=a_{m1}x_{1}+a_{m2}x_{2}+...+a_{mn}x_{n}](data/attach/1904/abmik0b64oephod1xm18xr6jxb547pev.jpg)
即:
![egin{bmatrix} a_{11}& a_{12}& ... & a_{1n}\ a_{21} & a_{22} &... &a_{2n} \ ...& ... & ... &... \ a_{m1}& a_{m2} &... & a_{mn} end{bmatrix} egin{bmatrix} x_{1}\ x_{2}\ ...\ x_{n} end{bmatrix} = egin{bmatrix} y_{1}\ y_{2}\ ...\ y_{m} end{bmatrix}](data/attach/1904/su3u7fz46485do6ksquvkssh7jswqgw3.jpg)
假设
F: Rn→Rm是一个从欧式n维空间转换到欧式m维空间的函数。这个函数
F由m个实函数组成:
y1(x1,…,xn), …, ym(x1,…,xn)。这些函数的偏导数(如果存在)可以组成一个m行n列的矩阵, 这就是所谓的雅可比矩阵(m*n),
对应一阶偏导数:
![](data/attach/1904/8tdqhtw4ath764vl28vwsangisb50ksu.jpg)
表示为:
![](data/attach/1904/z8j54g1u903t1dw53cmce8d39g9w0cnn.jpg)
如果p是Rn中的一点, F在p点可微分, 那么在这一点的导数由
JF(p)给出(这是求该点导数最简便的方法). 在此情况下, 由F(p)描述的线性算子即接近点p的F的最优线性逼近, x逼近于p:
二、海森矩阵
在
数学中,
海森矩阵(Hessian matrix 或 Hessian)是一个自变量为向量的实值函数的二阶
偏导数组成的
方块矩阵,此函数如下:
![f(x_1, x_2, dots, x_n),](data/attach/1904/qetdmxy6jzl39z3zguvvy3fdqkq29ag2.jpg)
如果
f 所有的二阶导数都存在,那么
f 的海森矩阵即:
![H(f)_{ij}(x) = D_i D_j f(x)](data/attach/1904/98pzsrrg3pp5fyi7kefubtb11sqfpdzu.jpg)
其中
![x = (x_1, x_2, dots, x_n)](data/attach/1904/3n8p2ma14a2wgu130qf60asdjotinnt2.jpg)
,即
三、梯度向量、Jacobian矩阵和Hessian矩阵
这里讨论的三个概念:梯度向量、Jacobian矩阵和Hessian矩阵
它的自变量:
![x=(x_{1},x_{2},...,x_{n})^{T}](https://private.codecogs.com/gif.latex?x%3D%28x_%7B1%7D%2Cx_%7B2%7D%2C...%2Cx_%7Bn%7D%29%5E%7BT%7D)
因变量有两种情况:
一维f(x):
此时的一阶导数构成的向量为
梯度向量g(x)
二阶导数构成的矩阵为
Hessian矩阵
多维
![f(x)=(f_{1}(x),f_{2}(x),...,f_{m}(x))^{T}](https://private.codecogs.com/gif.latex?f%28x%29%3D%28f_%7B1%7D%28x%29%2Cf_%7B2%7D%28x%29%2C...%2Cf_%7Bm%7D%28x%29%29%5E%7BT%7D)
:
此时的一阶导数构成的矩阵为
Jacobian矩阵