马尔可夫|6篇杰出论文,普林斯顿获时间检验奖,NeurIPS 2021奖项出炉

机器之心报道
编辑:小舟、陈萍

NeurIPS 2021 奖项公布 , 6 篇论文获得杰出论文奖 , 1 篇获得时间检验奖 , 此外 , 今年新增数据集和基准 Track 最佳论文奖 , 分别由加州大学洛杉矶分校、斯坦福大学的研究者摘得 。
NeurIPS 2021 将于下周正式开幕 , 今年组委会提前公布了杰出论文奖、时间检验奖 , 以及一项新的奖项——数据集和基准 Track 最佳论文奖(Datasets and Benchmarks Track Best Paper Awards) 。
据大会官方统计 , 今年 NeurIPS 共有 9122 篇有效论文投稿 , 共接收 2344 篇 , 总接收率 26% , 有 3% 被接收为 Spotlight 论文 。 相比去年 , 论文接收率稍高了一些 , 达到了 2013 年以来的最高水平 。

马尔可夫|6篇杰出论文,普林斯顿获时间检验奖,NeurIPS 2021奖项出炉
文章图片

在投稿机构方面 , NeurIPS 2021 中稿量(Accepted)排名前三的公司分别是谷歌(177 篇)、微软(116 篇)和 DeepMind (81 篇) 。

马尔可夫|6篇杰出论文,普林斯顿获时间检验奖,NeurIPS 2021奖项出炉
文章图片

中稿量排名前三的学校分别是 MIT(142 篇)、斯坦福大学(139 篇)、CMU(117 篇) 。 加州大学伯克利分校以 1 篇之差(116 篇)排名第四 。 清华大学以 90 篇论文排名第五 , 北京大学以 63 篇论文排名第九 。

马尔可夫|6篇杰出论文,普林斯顿获时间检验奖,NeurIPS 2021奖项出炉
文章图片

从国家 / 地区的角度看 , 中稿量排名前三的分别是:美国(1431 篇)、中国(411 篇)、英国(268 篇) 。

马尔可夫|6篇杰出论文,普林斯顿获时间检验奖,NeurIPS 2021奖项出炉
文章图片

下面让我们来看一下杰出论文奖、时间检验奖、数据集和基准 Track 最佳论文奖的获奖情况 。
杰出论文奖
今年有六篇论文获选为杰出论文奖 。 分别由微软研究院、DeepMind 、谷歌、华盛顿大学 、巴黎科学艺术人文大学、魏茨曼科学研究所等机构研究者摘得 。
获奖论文 1:A Universal Law of Robustness via Isoperimetry
  • 作者:Sebastien Bubeck, Mark Sellke
  • 机构:微软研究院、斯坦福大学
  • 论文地址:https://openreview.net/pdf?id=z71OSKqTFh7
获奖理由:本文提出了一个理论模型来解释为什么具有 SOTA 性能的深度网络比平滑拟合训练数据所需的参数更多 。 特别是 , 在关于训练分布的某些规律性条件下 , O(1)-Lipschitz 函数在标签噪声尺度以下插值训练数据所需的参数数量为 nd , 其中 n 是训练示例的数量 , d 是数据的维度 。 这与传统结果形成了鲜明对比 , 传统结果表明一个函数需要 n 个参数来插值训练数据 , 为了平滑地插值 , 这个额外的因子 d 似乎是必要的 。 该理论简单而精炼 , 与经验观察到的模型大小一致 , 这些模型对 MNIST 分类具有较好的鲁棒泛化能力 。 这项工作还提供了关于为 ImageNet 分类开发稳健模型所需的模型大小的可测试预测 。
获奖论文 2:On the Expressivity of Markov Reward
  • 作者:David Abel、Will Dabney 、Anna Harutyunyan、Mark K. Ho、Michael L. Littman、Doina Precup、Satinder Singh
  • 机构:DeepMind 、普林斯顿大学、布朗大学
  • 论文地址:https://openreview.net/pdf?id=9DlCh34E1bN
获奖理由:马尔可夫奖励函数是不确定性和强化学习下顺序决策的主要框架 。 本文详细、清晰地阐述了马尔可夫奖励能够使系统设计者根据他们对行为偏好或对状态、动作序列偏好来指定任务。 作者通过简单、说明性的例子证明 , 目前还存在一些无法指定马尔可夫奖励函数来引发所需任务和结果的任务 。 这一研究还表明 , 可以在多项式时间内(polynomial time)确定所需设置是否存在兼容的马尔可夫奖励 , 如果存在 , 说明也存在多项式时间算法可以在有限决策过程设置中构建这样的马尔可夫奖励 。 这项工作阐明了奖励设计存在的挑战 , 并且为研究马尔可夫框架何时以及如何实现人类所期望的性能开辟了新的道路 。

推荐阅读