全站搜索
首页_赢咖4星辉-官方注册地址
首页_赢咖4星辉-官方注册地址
赢咖4最流行的用于预测的机器学习算法简介及其优缺点说明
作者:管理员    发布于:2021-10-28 11:06    文字:【】【】【

  预测问题一直是机器学习领域最重要的问题之一。很多算法包括回归、决策树等都是用来解决预测的常用算法。预测问题的核心是基于已有的有标签的数据来判断新数据的标签。一般来说,根据预测标签是离散的还是连续的可以分成分类问题和回归问题。注意,本篇博客主要是快速回顾描述各个模型的优缺点,因此不会对模型有很深的介绍。

  本文主要总结一下常见的六种预测算法,每一类算法都会简要地描述其概念及其优缺点。

  描述:线性回归是一种统计的方法,它尝试使用一个线性方程来拟合两个变量之间的关系。其中一个变量是解释变量,赢咖4另一个是因变量。在线性回归中,使用线性预测函数对关系进行建模,其未知的模型参数是根据数据估计的。

  优点:1、易于理解;2、可以看到哪个变量对模型影响最大。缺点:1、对于复杂的变量关系难以捕捉;2、容易过拟合。

  描述:逻辑回归其实算是线性回归的一种,但是其预测标签是只有0和1。所以它其实是一种分类模型。如下图所示,逻辑回归最终是由一个sigmoid函数将结果映射到0-1之间,并且一般会设置一个threshold,高于这个值的预测结果为1,低于这个值的结果为0。

  优点::易于理解缺点::与线性回归一样,有时候容易过拟合,且不能捕捉过于复杂的关系。

  描述:它使用树模型来描述观察特征到目标变量之间的路径。在这些树结构中,叶子代表类标签,树枝代表导致这些类标签的特征的连接。目标变量可以取连续值(通常为实数)的决策树被称为回归树。

  优点:容易理解且易于实现缺点:对于复杂数据的建模能力较差,现实使用较少。

  描述:随机森林或随机决策森林是一种用于分类、回归和其他任务的集合学习方法,它通过在训练时构建大量的决策树来操作。

  优点:使用多棵树群体决策,有时候会产生非常好的结果,同时训练的速度很快。缺点:与其它算法相比,产生预测结果可能比较慢。是一个相对黑盒的模型,不太容易理解预测结果。

  描述:梯度提升是一种用于回归、分类和其他任务的机器学习技术,它以弱预测模型(通常是决策树)的集合形式产生预测模型。当决策树是弱学习者时,产生的算法被称为梯度提升树,它通常优于随机森林。 它像其他提升方法一样以阶段性的方式建立模型,它通过允许优化任意可分损失函数对它们进行泛化。

  优点:预测性能很好。缺点:训练集或者是预测集微小的变化会导致模型巨大的改变。同时对于预测结果不太容易理解。

  描述:神经网络或者说深度学习是这几年很火的模型了,在预测领域它也有很好的表现,有不同的隐层组成的神经网络结构是预测很好的模型。

  优点:可以处理非常复杂的数据集,规模越大效果可能越好。缺点:训练过程很慢,赢咖4且需要很多的资源。几乎无法对结果理解。

相关推荐
  • 赢咖4昂立凯顿儿童成长中心引进丹麦KUBO少儿无屏编程推出“小凯编程+”
  • 赢咖4最流行的用于预测的机器学习算法简介及其优缺点说明
  • 赢咖4两江机器人展示中心荣获2021年度成渝地区十佳科普研学资源
  • 赢咖4娱乐深度学习迁移技术萨摩耶云AI决策新答案
  • 赢咖4玩转机器人 第六届四川省大学生机器人大赛精彩开赛
  • 赢咖4注册百融云创:自动机器学习领跑金融智能化 ORCA平台助力AI落地
  • 赢咖4娱乐雪球私募2021秋季策略会收官 私募大咖解码投资秘籍
  • 赢咖4娱乐清华大学出版!《机器学习导论》PDF下载
  • 赢咖42021年10月26日A股深证成指查询机器学习概念概念行情及资金流向查询
  • 赢咖4娱乐晋中信息学院在2021年华北五省大学生机器人大赛山西赛区中荣获佳绩
  • 脚注信息
    版权所有 Copyright(C)2020 星辉娱乐
    网站地图|xml地图|友情链接: 百度一下