全站搜索
首页_赢咖4星辉-官方注册地址
首页_赢咖4星辉-官方注册地址
赢咖4灌水论文为何泛滥?Reddit小哥揭露机器学习领域残酷现状
作者:管理员    发布于:2021-03-12 00:42    文字:【】【】【

  这几年,AI的趋势只增不减,每年各大机器学习会议开得那叫一个如火如荼,大家仿佛都对这个领域永远充满了旺盛的探索欲。

  不过最近,对于机器学习会议出版的各种论文出现了质疑的声音,并也获得了不小的关注:

  近日,Reddit上,一位出身于传统工程领域的小哥发布了一则帖子,上面记录了他对近期机器学习出版论文的观察:

  「 我注意到,有很多研究人员致力于诸如优化、控制、信号处理等“老”领域的交叉领域,他们会突然发表大量的声称要解决某个问题的论文。

  然而,经过仔细检查,这些论文唯一的新奇之处,是这个问题(通常是由其他不相关的团体提出的),而不是研究人员提出的旨在解决这个问题的方法。

  这些研究小组只会在机器学习会议上发表文章(而不会在优化和控制会议/期刊上发表文章,而这些可能是他们工作的核心)。

  例如,在一篇关于对抗机器学习的论文中,整篇论文实际上是关于解决一个优化问题的,但优化的算法基本上只是在其他前人优秀方法的基础上稍微变化了一点而已。

  此外,这位小哥赢咖4还注意到,如果一篇论文没有通过NeurIPS或ICLR,它们将被直接发送到AAAI和其他一些小型会议,在那里它们将被接受。

  通过openreview,国外小哥发现审稿人(不仅仅是研究人员)对他们的特定领域一无所知,而似乎只会评论论文的正确性,而不是新颖性。

  在这里所说的新颖性,是指某项技术的最新发展是多么新颖,尤其是当它与运筹学、优化、控制和信号处理相交叉时,而实际上,最先进的技术可能远远超乎了主流机器学习研究者的认知。

  偶尔,会有一条引用来自于几百年前的柯西、牛顿、傅里叶、古诺、图灵、冯诺伊曼等人,接着,又回向后跳跃几百年到2018年或者2019年。

  所以,他们可能想表达:“这个问题在1930年被一些「名人」研究过,然后在2018年又被「某个家伙」研究过很多次。”

  通常,会有大量的数学公式,来证明一些关于特征值、梯度、雅可比矩阵的深奥条件,以及关于他们研究问题的一些其他奇怪的事情(在其他深奥的假设下)。

  还会有几个定理,但是没有一个是适用的,因为在运行它们的高度非凸深度学习应用时,所有条件都被违反了。

  因此,从这些复杂的定理+堆砌的数学公式中得到的唯一东西是「一些微弱的直觉」(然而马上就会被违背),接着什么也没说。

  这位国外小哥发现,某些技术在作者声称它击败了许多基准测试之后,似乎将会被抛弃,并永远不会再使用。

  但是,通常情况下,在其他领域,一旦一项技术被提出,同一组研究人员就会用多年来改进它,有时甚至贯彻了研究人员的整个职业生涯。

  「在某些方面,这使得某些机器学习区域就像一个回音室,在那里,研究人员正做着一些几乎重复的事情,而这一点却被问题的新奇性所掩盖了。

  这些论文被接受,因为没有人可以检测论文本身真正的新颖性(或者,三个审稿人中只有一个会注意到)。

  “要么发表,要么灭亡”的心态根深蒂固。没有人会在头脑清醒的情况下尝试解决实际困难和有意义的问题。只需要在这里调整一个魔性的特征,在那里混合搭配一些方法,你的简历里就会有一堆出版的论文了。

  另外一个方面是,审查过程和所使用的方法缺少透明程度。比如一些半斤八两的评论,让学生替他们评论文章,以及一些政治原因等等。

  用几年的时间发表一篇可以实际解决科学问题的论文的时代已经一去不复返了。运气越来越成为一个几乎比努力工作更重要的因素。

  彼得希格斯(因提出希格斯玻色子的存在和粒子获得质量的机制而获得诺贝尔奖)多次说过,按照现在的标准,他永远不会成功。

  「我曾经的工作是有关CNN的应用,然而,我们后来被告知说,需要添加一些数学公式,因为这有助于在会议上被接受。

  但是,实际上,这些方程式根本没有任何作用,既证明不了什么新东西,也没有提供额外的见解,而仅仅只是基本描述了用矩阵表示的深度学习。

  在我度过的其他论文中,我经常看到非常复杂的数学公式,如果你花一个小时去理解它,最后的结果其实用一小行话就可以描述出来。这很可悲。

  「“堆砌的数学公式”是很普遍的一点。我们经常被明确告知,需要用希腊字母写出各种难以理解的数学公式,因为这样可以令论文看起来更好。

  「此外,略好一些的SOTA“之类的论文,除了一些参数调整或者向DNN添加额外的层之外,没有提出任何新颖的方法或者方面,并且阅读起来也非常累人,最后却被会议接受了。

  堆砌的数学公式的存在,只是为了提供一种严谨感和新奇感,并掩盖了缺乏实际创新能力的本质。

  当然,对已有方法进行迭代是正常的,但是在机器学习领域下,很多论文都感觉好像是在并没有完全理解所提出方法为何有效的情况下进行了边际的改进。」

  的确,每年大量的机器学习会议,接受着大量的论文投稿,而这每年数万篇描述「学术进展」的论文中,到底有多少真正的发现?

  每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网赢咖4打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

相关推荐
  • 赢咖4娱乐浅谈机器学习核心库应用领域与作用
  • 赢咖4灌水论文为何泛滥?Reddit小哥揭露机器学习领域残酷现状
  • 赢咖4注册美国开发新型无人机空战技术具有机器学习能力以及智能操作
  • 赢咖4注册人工智能43:因子观点融入机器学习
  • 赢咖4注册为了在AI和机器学习领域站稳脚跟你需要学习的五种语言
  • 赢咖4注册机器学习加持糖胺聚糖测序时间从数年缩短至几分钟
  • 赢咖4注册阿里云机器学习PAI同时入选 Gartner DSML 及 Cloud AI Developer Svices 全球魔力象限
  • 赢咖4注册机器学习探索复杂非平衡相变研究获进展
  • 赢咖4机器学习第2步:数据预处理的L1和L2正则化方法
  • 赢咖4注册新机器学习算法确认50颗系外行星
  • 脚注信息
    版权所有 Copyright(C)2020 星辉娱乐
    网站地图|xml地图|友情链接: 百度一下