逻辑回归算法是最常用的二值分类机器学习算法之一,是一个相对简单的算法 。它可以用作性能基线,并且在许多任务中都表现得很好 。因此,每一个机器学习工程师都应该对它有所了解 。在这篇文章中,你将学习什么是逻辑回归算法,它是如何工作的,优点、缺点有哪些等等 。
文章插图
内容表:
- 什么是逻辑回归算法?
- 它是如何工作的
- 逻辑算法VS线性回归算法
- 什么情况下需要使用逻辑回归算法
- 多类分类(OVA,OVO)
- 其他分类算法
1,什么是逻辑回归
和许多其他机器学习技术一样,它是从统计领域借用来的 。尽管它的名称是回归算法,但它不是用于解决回归问题的算法 。因为在回归问题中,您需要的是一个连续的结果 。然而,逻辑回归算法是二元分类的一种算法,是0到1之间的离散二进制结果 。用简单的话来说,两者之间没有必然联系 。
以检测癌症为例,该算法通过筛选图片并输入,判断患者是否患有癌症(1)或不患癌症(0) 。
2,它是如何工作的
逻辑回归算法利用因变量(通常是标签,或我们想要预测的内容)和一个或多个自变量(通常指特征)之间的关系,利用它的基本逻辑函数来估计概率 。
然后,要进行实际预测,则需要将概率转换为二进制值 。这是逻辑函数的任务,也称为sigmoid函数 。Sigmoid函数是一条S形曲线,它可以取任何实数,并将其映射为0到1之间的值 。(但取值多不会取到0或1 。)然后通过阈值分类器将0到1之间的值转换为0或1 。
下图将为您提供逻辑回归所需的输出步骤 。
文章插图
下图是逻辑函数(Sigmoid函数)的函数图:
文章插图
我们把正确分类的(最大化)随机数据点的可能性,称为最大似然估计 。最大似然估计是统计模型中估计参数的一种通用方法 。当然还有其他算法,比如优化算法 。牛顿法就是这样一种算法,它多用来求不同函数的最大值(或极小值),包括似然函数 。除了牛顿法,您也可以使用梯度下降 。
3,逻辑算法VS线性回归算法
你可能会问自己,逻辑回归和线性回归的区别是什么?逻辑回归算法给你一个离散的结果,而线性回归算法给出一个连续的结果 。这就是不同,举一个结果是连续的例子,比如建立一个预测房屋价值的模型 。由于它的大小或位置等参数不同,它的最终值是不确定的 。而离散结果往往是确定的,即你得了癌症或你没有癌症 。
4,优缺点
它被人们广泛采用 。优势在于,它非常高效,不需要太多的计算资源 。它具有高度的可解释性,它不需要对输入的内容进行缩放 。它不需进行任何调试,就有较好的预测率 。
与线性回归相比 。当您删除与输出变量无关的属性或与输出变量相似的属性,逻辑回归确实工作得更好 。需要了解的是,特征工程对逻辑回归算法和线性回归算法的性能都有着重要的影响 。逻辑回归算法的优点是,它非常容易操作,并且可以进行针对性的训练 。
作者通常以逻辑回归算法模型作为基础,并尝试使用更复杂的算法 。
由于它操作简单,而且它相对容易、快速的落实 。逻辑回归算法可以作为您来衡量其他更复杂的算法性能的一条基线 。
它的缺点是由于它的决策面是线性的,而逻辑回归算法是不能求解非线性问题的 。只需看看下面的例子 。(它是两个包含二进制特点的例子 。)
文章插图
很明显,我们不能保证在不犯错误的情况下画出分隔这两类的线 。使用一个简单的决策树反而是更好的选择 。
文章插图
Logistic回归不是最强大的算法,它很容易被更复杂的算法所超越 。另一个缺点是它高度依赖于适当的数据表示 。这意味着,如果您没有确定了所有重要的自变量,不建议您使用 。因为Logistic回归只能预测一个绝对的结果 。作为一种算法,它太容易受到数据的影响 。
5,何时使用
正如我已经提到的,Logistic回归算法将您的输入通过一个线性边界划分为两个“区域”,每类都有一个 。所以,您的数据必须是线性可分的,就像下面图像中的数据点一样:
推荐阅读
- 2021年余额宝支付限额标准 余额宝支付上限限额是多少
- app产品如何运营APP产品运营的四个阶段
- 3个低学历也赚钱的工作 什么工作挣钱快又多还不要学历
- 石榴树的树皮和树叶有什么化学成分?
- 日本留学一年费用是多少钱 日本留学费用多少?
- 养鳄龟有什么禁忌,外来物种谨慎对待
- 号的偏旁部首是什么字 号的偏旁部首是什么
- 渔夫鞋是什么风格 渔夫鞋属于什么鞋
- 水最低温度是多少度,水的比热容是多少?单位都是什么?
- 现在 去日本留学 一年的费用 大概是多少