机器学习算法整理(二)

论坛 期权论坛 脚本     
匿名技术用户   2020-12-27 05:40   685   0

LR算法

逻辑回归主要用于二元分类问题,逻辑函数为
f(x;θ)=11+eθTxf (x;\theta)= \frac{1}{1+e^{-{\theta}^Tx}}
推导损失函数:
P(y=1x;θ)=f(x;θ)=11+eθTxP(y = 1|x;\theta) = f(x;\theta)=\frac{1}{1+e^{-{\theta}^Tx}}P(y=0x;θ)=1P(y=1x;θ)P(y = 0|x;\theta) = 1-P(y = 1|x;\theta)
每个样本相互独立,则似然函数为:
L(θ)=i{1,,N}.y(i)=1P(y=1x(i);θ)i{1,,N}.y(i)=0P(y=0x(i);θ)L(\theta) = \prod_{i\in\{1,\ldots,N\}.y^{(i)}=1}P(y = 1|x^{(i)};\theta) \cdot\prod_{i\in\{1,\ldots,N\}.y^{(i)}=0}P(y = 0|x^{(i)};\theta)L(θ)=i{1,,N}.y(i)=1P(y=1x(i);θ)i1,,N}.y(i)=0(1P(y=1x(i);θ))L(\theta) = \prod_{i\in\{1,\ldots,N\}.y^{(i)}=1}P(y = 1|x^{(i)};\theta) \cdot\prod_{i\in{1,\ldots,N\}.y^{(i)}=0}}(1-P(y = 1|x^{(i)};\theta))对其取对数:
J(θ)=lnL(θ)=i=1Ny(i)ln(P(y=1x(i);θ))+(1y(i))ln(1P(y=1x(i);θ))J(\theta)= -lnL(\theta)=-\sum_{i=1}^Ny^{(i)}ln(P(y = 1|x^{(i)};\theta)) +(1-y^{(i)})ln(1-P(y = 1|x^{(i)};\theta))

梯度下降法:

对于f(z)=11+ezf (z)= \frac{1}{1+e^{z}}的导函数是f(z)=f(z)(1f(z))f'(z)=f(z)(1-f(z))
链式求导法则求得参数θ\theta
θ=θα(f(xi;θ)yi)xi\theta=\theta-\alpha\cdot(f(x_i;\theta)-y_i)x_i

算法优化:随机梯度下降法

当大数据量时,上述方法需要遍历所有样本,造成梯度下降缓慢。
随机梯度下降是根据步长选择一部分样本进行梯度下降,再向最优点前进,最终在最优点附近震荡。

实践

代码练习Titanic

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:7942463
帖子:1588486
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP