全站搜索
首页_赢咖4星辉-官方注册地址
首页_赢咖4星辉-官方注册地址
赢咖4科普一下机器学习热门概念
作者:管理员    发布于:2021-06-28 15:46    文字:【】【】【

  而在建模过程中,又能听到炼丹爱好者时而念念有词“怎么又过拟合了?”,时而自我安慰“找到偏差和方差的平衡点是成功的诀窍”。

  所以为了能让非专业者也能愉快地玩(zhuang)耍(bi),今天就来科普一下机器学习的几个常见概念。

  这种对于训练集以外的数据也能进行良好的判别,或得到合适输出的能力,就称为机器学习模型的泛化(generalization)能力。

  类似一个高中生每天都拿着五三刷,但是始终找不到做题规律,模拟题做得拉跨,考试就更不用说。

  这种在训练集和测试集(实际样本)中都表现不好的情况,就叫做欠拟合(Underfitting)。

  这种在训练集上表现良好,但在测试集上表现很差的情况,就叫做过拟合(Overfitting)。

  训练集质量不高就可能导致过拟合,比如样本不足,或者训练数据中的噪声(干扰数据)过多。

  也有可能因为模型复杂度高于实际问题,只是死记硬背下了训练数据的信息,但完全无法推广到没见过的新数据上。

  不管菜到底有几种方式,对于一个机器模型来说,总归是在实际应用里表现不好,发生了泛化误差(Generalization Error)。

  在机器学习领域,偏差(bias)是指模型的预测值相对于真实结果的偏离程度。

  而方差(variance)与真实值没有关系,只描述通过模型得到的预测值之间的分布情况。

  如果模型过于简单且参数很少,那么它可能具有高偏差和低方差的特征,也就会造成欠拟合。

  而如果模型复杂而具有大量参数,那么它将具有高方差和低偏差的特征,造成过拟合。

  右边的模型明显比左边要复杂很多,也因此它的偏差更低,方差更高,与左边的模型相反。

  因此,我们需要找到一个合适的平衡点,既不会因为高偏差而造成欠拟合,也不会因为高方差而造成过拟合。

  这种偏差与方差之间的权衡(bias and variance trade-off),实际上也就是模型复杂度的权衡。

  比如,如果我们要通过某地房屋面积与房价之间的关系,进而帮助房屋售卖者选取更合适的售价,那么下面哪个函数最好呢?

  第一个明显欠拟合。都没有从给定的数据中找到一般规律,更不用说让函数去预测新房价面积可能对应的售价了。

  第三个就是过拟合,函数参数过多,想要抓住所变化,反而导致模型的通用性下降,预测效果大打折扣。

  而第二个函数基本拟合了样本数据,形成了一般规律,也保证了对新数据的预测能力。

  但就算是ANN(人工神经网络)这样优秀的机器学习模型,目前也还是受限于偏差与方差的权衡。

  算法工程师们提出了各种方法,如正则化(Regularization)、套袋法(Bagging)、贝叶斯法(Bayesian),使模型能够更好地概括旧数据,预测新数据。

  并期望着最终能构建一个机器学习模型,使其能力无限逼近目前最强的通用模型人类大脑。

  每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

  奇安信终端安全两项方案入选工信部“2020年信息技术应用创新解决方案”

  奇安信终端安全两项方案入选工信部“2020年信息技术应用创新解决方案”

  蚂蚁链发布BTN:可将区块链网络吞吐量提升186% 带宽成本降低80%

  蚂蚁自研数据库OceanBase宣布开源 300万行核心代码向社区开放

  高通推出全球首个10Gbps 5G M.2参考设计,加速推进5G在新兴细分市场中的普及赢咖4

相关推荐
  • 赢咖4机器学习上市公司有哪些2021年机器学习龙头上市公司名单
  • 赢咖4科普一下机器学习热门概念
  • 赢咖4注册机器学习入门到实践
  • 赢咖4NetApp收购Data Mechanics将加速Spot发展并优化云端数据分析和机器学习工作负载
  • 赢咖4又一个数据分析神器并行的计算库——dask横空出现!
  • 赢咖4注册谷歌组建新机器学习团队 欲将AI应用于旗舰产品
  • 赢咖4娱乐泄露小米新机:判赔100万美金; 鸿蒙新增识别功能; 中企加倍下单芯片设备年底5G用户将超5亿字节误删机器学习模型
  • 赢咖4大族机器人完成B1轮融资 引领协作机器人迈入20时代
  • 赢咖4娱乐机器学习概念上市公司2021年名单一览
  • 赢咖4娱乐《机器学习》(周志华)【摘要 书评 试读】- 京东图书
  • 脚注信息
    版权所有 Copyright(C)2020 星辉娱乐
    网站地图|xml地图|友情链接: 百度一下