本文最后更新于:2023年8月2日 下午

本文属于二次型优化问题系列文章,主要介绍二次型参数的定义由来。

提出问题

  • 需要优化的函数二次型的形式:

(1)f(x)=12xTAxbTx+c

  • 而原始n元多项式为:

f(x1,x2,x3,,xn)=a1,1x12+a1,2x1x2+a1,3x1x3++a1,nx1xn+a2,1x2x1+a2,2x22+a2,3x2x3++a2,nx2xn++an,nxn2+b1x1+b2x2++bnxn+c

  • 其中,表示A

(3)A=[a1,1an,n]

  • A与多项式系数对应:

(4)ai,i=ai,i,1in 

(5)ai,j+aj,i=ai,j,1i<jn 

(6)ai,j=0,1j<in

  • 那么对应A中非对角线的元素,仅需要保证公式(5)成立即可,那么对于不相等的i,j,可以有无数种ai,j+aj,i的组合满足条件,A该如何确定?

二次型矩阵

  • 在定义实数空间内的二次型时,二次型矩阵被要求为对称的,也就是要求:

(7)ai,j=aj,i=12ai,j,1i<jn

  • 也就确定了唯一的A,来表示一个确定的多元二次函数。

为何如此

  • 定义的用处就是来确定问题,这种定义可以唯一确定二次函数,没有任何歧义和变化,用于统一数学术语
  • 我觉得很关键的问题是如此定义A会给求导带来很大方便
  • 我们略去一次项与常数项,得到纯粹的二次型:

(8)f(x)=12xAx

  • 即:

(9)f(x)=12i,j=1nai,jxixj

  • 仍用(3)表示A,对(8)中的向量x求导:

(10)f(xi)=12[j=1,jin(ai,j+aj,i)xj+2ai,ixi]

  • 如果A是对称阵,那么ai,j=aj,i,有:

(11)f(xi)=12j=1n2ai,jxj

(12)f(x)=Ax

  • 也就是说定义A为对称阵可以唯一确定二次型矩阵,也可以方便地对二次型进行求导。


文章链接:
https://www.zywvvd.com/notes/study/machine-learning/conjugate-gradient-algorithm/quadratic-cofficient/quadratic-cofficient/


“觉得不错的话,给点打赏吧 ୧(๑•̀⌄•́๑)૭”

微信二维码

微信支付

支付宝二维码

支付宝支付

二次型优化问题 - 2 - 二次型参数确定
https://www.zywvvd.com/notes/study/machine-learning/conjugate-gradient-algorithm/quadratic-cofficient/quadratic-cofficient/
作者
Yiwei Zhang
发布于
2020年12月12日
许可协议