[编辑]

第134卷:学习理论会议 (COLT),2021年8月15-19日,美国科罗拉多州博尔德

[编辑]

编辑:Mikhail Belkin, Samory Kpotufe

[bib][citeproc]

2021年学习理论会议:会后前言

Mikhail Belkin, Kpotufe Samory; 第三十四届学习理论会议论文集, PMLR 134:i-iii

随机块模型熵与树上广播综述

Emmanuel Abbe, Elisabetta Cornacchia, Yuzhou Gu, Yury Polyanskiy; 第三十四届学习理论会议论文集, PMLR 134:1-25

重尾多臂老虎机中的悔值最小化

Shubhada Agrawal, Sandeep K. Juneja, Wouter M. Koolen; 第三十四届学习理论会议论文集, PMLR 134:26-62

SGD 泛化性优于 GD(且正则化没有帮助)

Idan Amir, Tomer Koren, Roi Livni; 第三十四届学习理论会议论文集, PMLR 134:63-92

低秩矩阵的 Bethe 和 Sinkhorn 积和式及其对剖面最大似然的启示

Nima Anari, Moses Charikar, Kirankumar Shiragur, Aaron Sidford; 第三十四届学习理论会议论文集, PMLR 134:93-158

矩阵博弈中的学习可能具有任意复杂度

Gabriel P. Andrade, Rafael Frongillo, Georgios Piliouras; 第三十四届学习理论会议论文集, PMLR 134:159-185

具有平均光滑性的函数:结构、算法与学习

Yair Ashlagi, Lee-Ad Gottlieb, Aryeh Kontorovich; 第三十四届学习理论会议论文集, PMLR 134:186-236

对抗鲁棒的低维表示

Pranjal Awasthi, Vaggos Chatziafratis, Xue Chen, Aravindan Vijayaraghavan; 第三十四届学习理论会议论文集, PMLR 134:237-325

随机变分不等式中乐观镜像下降的最后迭代收敛率

Waïss Azizian, Franck Iutzeler, Jérôme Malick, Panayotis Mertikopoulos; 第三十四届学习理论会议论文集, PMLR 134:326-358

指数凹在线学习中的最优动态悔值

Dheeraj Baby, Yu-Xiang Wang; 第三十四届学习理论会议论文集, PMLR 134:359-409

谱植入与随机图中反驳割、可着色性和社区的硬度

Afonso S. Bandeira, Jess Banks, Dmitriy Kunisky, Christopher Moore, Alex Wein; 第三十四届学习理论会议论文集, PMLR 134:410-473

非欧几里得差分隐私随机凸优化

Raef Bassily, Cristobal Guzman, Anupama Nandi; 第三十四届学习理论会议论文集, PMLR 134:474-499

根据其权力指数的部分信息重建加权投票方案

Huck Bennett, Anindya De, Rocco Servedio, Emmanouil Vasileios Vlatakis-Gkaragkounis; 第三十四届学习理论会议论文集, PMLR 134:500-565

确定性有限内存偏差估计

Tomer Berg, Or Ordentlich, Ofer Shayevitz; 第三十四届学习理论会议论文集, PMLR 134:566-585

从最优动作中学习在线学习

Omar Besbes, Yuri Fonseca, Ilan Lobel; 第三十四届学习理论会议论文集, PMLR 134:586-586

优控制测度、序列复杂性与在线学习

Adam Block, Yuval Dagan, Alexander Rakhlin; 第三十四届学习理论会议论文集, PMLR 134:587-590

洁净标签攻击下的鲁棒学习

Avrim Blum, Steve Hanneke, Jian Qian, Han Shao; 第三十四届学习理论会议论文集, PMLR 134:591-634

秩一矩阵估计:梯度下降动力学的解析时间演化

Antoine Bodin, Nicolas Macris; 第三十四届学习理论会议论文集, PMLR 134:635-678

多参与者老虎机学习:从竞争到合作

Simina Branzei, Yuval Peres; 第三十四届学习理论会议论文集, PMLR 134:679-723

双方近优分布式半空间学习

Mark Braverman, Gillat Kol, Shay Moran, Raghuvansh R. Saxena; 第三十四届学习理论会议论文集, PMLR 134:724-758

数值稀疏矩阵的近优逐项采样

Vladimir Braverman, Robert Krauthgamer, Aditya R. Krishnan, Shay Sapir; 第三十四届学习理论会议论文集, PMLR 134:759-773

统计查询算法与低阶测试几乎等价

Matthew S Brennan, Guy Bresler, Sam Hopkins, Jerry Li, Tselil Schramm; 第三十四届学习理论会议论文集, PMLR 134:774-774

使用预言机查询在有限度量空间中精确恢复聚类

Marco Bressan, Nicoló Cesa-Bianchi, Silvio Lattanzi, Andrea Paudice; 第三十四届学习理论会议论文集, PMLR 134:775-803

两层神经网络的鲁棒性法则

Sebastien Bubeck, Yuanzhi Li, Dheeraj M Nagaraj; 第三十四届学习理论会议论文集, PMLR 134:804-820

协作式随机多参与者多臂老虎机:无通信也无冲突的最优悔值

Sebastien Bubeck, Thomas Budzinski, Mark Sellke; 第三十四届学习理论会议论文集, PMLR 134:821-822

结构化预测的快速率

Vivien A Cabannes, Francis Bach, Alessandro Rudi; 第三十四届学习理论会议论文集, PMLR 134:823-865

球内思考:最大损失的近优最小化

Yair Carmon, Arun Jambulapati, Yujia Jin, Aaron Sidford; 第三十四届学习理论会议论文集, PMLR 134:866-882

优化优化器:悔值最优的梯度下降算法

Philippe Casgrain, Anastasis Kratsios; 第三十四届学习理论会议论文集, PMLR 134:883-926

逻辑损失梯度下降何时使用具有平滑 ReLU 激活的深度网络进行内插?

Niladri S. Chatterji, Philip M. Long, Peter Bartlett; 第三十四届学习理论会议论文集, PMLR 134:927-1027

打破通信限制下稀疏分布估计中的维度依赖

Wei-Ning Chen, Peter Kairouz, Ayfer Ozgur; 第三十四届学习理论会议论文集, PMLR 134:1028-1059

通过子立方体调节学习和测试 Junta 分布

Xi Chen, Rajesh Jayaram, Amit Levi, Erik Waingarten; 第三十四届学习理论会议论文集, PMLR 134:1060-1113

线性动力系统的黑盒控制

Xinyi Chen, Elad Hazan; 第三十四届学习理论会议论文集, PMLR 134:1114-1143

通过鲁棒均匀收敛实现最小绝对偏差回归的查询复杂度

Xue Chen, Michal Derezinski; 第三十四届学习理论会议论文集, PMLR 134:1144-1179

对抗性成本和已知转移的随机最短路径的极小极大悔值

Liyu Chen, Haipeng Luo, Chen-Yu Wei; 第三十四届学习理论会议论文集, PMLR 134:1180-1215

使不可能的调优成为可能:一种新的专家算法及其应用

Liyu Chen, Haipeng Luo, Chen-Yu Wei; 第三十四届学习理论会议论文集, PMLR 134:1216-1259

梅特罗波利斯调整朗之万算法 (MALA) 的最优维度依赖性

Sinho Chewi, Chen Lu, Kwangjun Ahn, Xiang Cheng, Thibaut Le Gouic, Philippe Rigollet; 第三十四届学习理论会议论文集, PMLR 134:1260-1300

具有聚合老虎机反馈的在线马尔可夫决策过程

Alon Cohen, Haim Kaplan, Tomer Koren, Yishay Mansour; 第三十四届学习理论会议论文集, PMLR 134:1301-1329

量化对数配分函数的变分近似

Romain Cosson, Devavrat Shah; 第三十四届学习理论会议论文集, PMLR 134:1330-1357

从局部伪随机生成器到学习硬度

Amit Daniely, Gal Vardi; 第三十四届学习理论会议论文集, PMLR 134:1358-1394

统计泰勒定理与截断密度的外推

Constantinos Daskalakis, Vasilis Kontonis, Christos Tzamos, Emmanouil Zampetakis; 第三十四届学习理论会议论文集, PMLR 134:1395-1398

正态分布下凸集的弱学习

Anindya De, Rocco Servedio; 第三十四届学习理论会议论文集, PMLR 134:1399-1428

从噪声信息中学习置换的稀疏混合

Anindya De, Ryan O’Donnell, Rocco Servedio; 第三十四届学习理论会议论文集, PMLR 134:1429-1466

具有小反演偏差的稀疏素描 (Sketch)

Michal Derezinski, Zhenyu Liao, Edgar Dobriban, Michael Mahoney; 第三十四届学习理论会议论文集, PMLR 134:1467-1510

鲁棒协方差测试的样本复杂度

Ilias Diakonikolas, Daniel M. Kane; 第三十四届学习理论会议论文集, PMLR 134:1511-1521

高斯边际下半空间的不确定性适当学习 (Agnostic Proper Learning)

Ilias Diakonikolas, Daniel M Kane, Vasilis Kontonis, Christos Tzamos, Nikos Zarifis; 第三十四届学习理论会议论文集, PMLR 134:1522-1551

SQ 模型中高斯边际下不确定性学习的多项式回归最优性

Ilias Diakonikolas, Daniel M. Kane, Thanasis Pittas, Nikos Zarifis; 第三十四届学习理论会议论文集, PMLR 134:1552-1584

Massart 噪声存在下的 Boosting

Ilias Diakonikolas, Russell Impagliazzo, Daniel M. Kane, Rex Lei, Jessica Sorrell, Christos Tzamos; 第三十四届学习理论会议论文集, PMLR 134:1585-1644

Dobrushin 条件下 Ising 模型的异常值鲁棒学习

Ilias Diakonikolas, Daniel M. Kane, Alistair Stewart, Yuxin Sun; 第三十四届学习理论会议论文集, PMLR 134:1645-1682

随机坐标朗之万蒙特卡罗

Zhiyan Ding, Qin Li, Jianfeng Lu, Stephen J Wright; 第三十四届学习理论会议论文集, PMLR 134:1683-1710

马尔可夫噪声下随机矩阵乘积的稳定性:在线性随机逼近和 TD 学习中的应用

Alain Durmus, Eric Moulines, Alexey Naumov, Sergey Samsonov, Hoi-To Wai; 第三十四届学习理论会议论文集, PMLR 134:1711-1752

核变薄 (Kernel Thinning)

Raaz Dwivedi, Lester Mackey; 第三十四届学习理论会议论文集, PMLR 134:1753-1753

高斯过程对神经网络的非渐近逼近

Ronen Eldan, Dan Mikulincer, Tselil Schramm; 第三十四届学习理论会议论文集, PMLR 134:1754-1775

关于朗之万蒙特卡罗的收敛性:尾部增长与光滑性的相互作用

Murat A Erdogdu, Rasa Hosseinzadeh; 第三十四届学习理论会议论文集, PMLR 134:1776-1822

自适应子模性中的自适应性

Hossein Esfandiari, Amin Karbasi, Vahab Mirrokni; 第三十四届学习理论会议论文集, PMLR 134:1823-1846

非各向同性随机张量的集中及其在学习和经验风险最小化中的应用

Mathieu Even, Laurent Massoulie; 第三十四届学习理论会议论文集, PMLR 134:1847-1886

从特征建模:过度参数化深度神经网络的平均场框架

Cong Fang, Jason Lee, Pengkun Yang, Tong Zhang; 第三十四届学习理论会议论文集, PMLR 134:1887-1936

对数损失和模型失配下的序列预测

Meir Feder, Yury Polyanskiy; 第三十四届学习理论会议论文集, PMLR 134:1937-1964

SGD 及其连续时间对应物的收敛率和逼近结果

Xavier Fontaine, Valentin De Bortoli, Alain Durmus; 第三十四届学习理论会议论文集, PMLR 134:1965-2058

上下文老虎机和强化学习的实例相关复杂度:基于分歧的视角

Dylan Foster, Alexander Rakhlin, David Simchi-Levi, Yunzong Xu; 第三十四届学习理论会议论文集, PMLR 134:2059-2059

从粗略标签学习的高效算法

Dimitris Fotakis, Alkis Kalavasis, Vasilis Kontonis, Christos Tzamos; 第三十四届学习理论会议论文集, PMLR 134:2060-2079

图对齐问题中部分恢复的不可能性

Luca Ganassali, Laurent Massoulie, Marc Lelarge; 第三十四届学习理论会议论文集, PMLR 134:2080-2102

具有最近极端点预言机的 Frank-Wolfe 算法

Dan Garber, Noam Wolf; 第三十四届学习理论会议论文集, PMLR 134:2103-2132

回答多个差分隐私查询时如何避免联合边界 (Union Bound)

Badih Ghazi, Ravi Kumar, Pasin Manurangsi; 第三十四届学习理论会议论文集, PMLR 134:2133-2146

最严苛者的生存:部分信息下正则化学习中的稳定与不稳定平衡

Angeliki Giannou, Emmanouil Vasileios Vlatakis-Gkaragkounis, Panayotis Mertikopoulos; 第三十四届学习理论会议论文集, PMLR 134:2147-2148

增长条件下差分隐私非参数回归

Noah Golowich; 第三十四届学习理论会议论文集, PMLR 134:2149-2192

乘积分布混合的源识别

Spencer Gordon, Bijan H Mazaheri, Yuval Rabani, Leonard Schulman; 第三十四届学习理论会议论文集, PMLR 134:2193-2216

PAC-Bayes、MAC-Bayes 和条件互信息:处理通用 VC 类的高速率界限

Peter Grunwald, Thomas Steinke, Lydia Zakynthinou; 第三十四届学习理论会议论文集, PMLR 134:2217-2247

乘积分布上复杂假设的泛化:拍卖、先知不等式和潘多拉问题

Chenghao Guo, Zhiyi Huang, Zhihao Gavin Tang, Xinzhi Zhang; 第三十四届学习理论会议论文集, PMLR 134:2248-2288

简单预测器的在线学习与 0/1 博弈中极小极大的组合表征

Steve Hanneke, Roi Livni, Shay Moran; 第三十四届学习理论会议论文集, PMLR 134:2289-2314

形状很重要:理解噪声协方差的隐式偏差

Jeff Z. HaoChen, Colin Wei, Jason Lee, Tengyu Ma; 第三十四届学习理论会议论文集, PMLR 134:2315-2357

通过丰富查询实现的有限内存主动学习

Max Hopkins, Daniel Kane, Shachar Lovett, Michal Moshkovitz; 第三十四届学习理论会议论文集, PMLR 134:2358-2387

连续博弈中的自适应学习:最优悔值界限与纳什均衡收敛

Yu-Guan Hsieh, Kimon Antonakopoulos, Panayotis Mertikopoulos; 第三十四届学习理论会议论文集, PMLR 134:2388-2422

随机 ReLU 两层网络的逼近能力研究

Daniel Hsu, Clayton H Sanford, Rocco Servedio, Emmanouil Vasileios Vlatakis-Gkaragkounis; 第三十四届学习理论会议论文集, PMLR 134:2423-2461

离线强化学习悔值的快速率

Yichun Hu, Nathan Kallus, Masatoshi Uehara; 第三十四届学习理论会议论文集, PMLR 134:2462-2462

流式 k-PCA:超越秩一更新的 Oja 算法的高效保证

De Huang, Jonathan Niles-Weed, Rachel Ward; 第三十四届学习理论会议论文集, PMLR 134:2463-2498

群体测试与局部搜索:是否存在计算统计差距?

Fotis Iliopoulos, Ilias Zadik; 第三十四届学习理论会议论文集, PMLR 134:2499-2551

具有混合数据相关悔值界限的无参数多臂老虎机算法

Shinji Ito; 第三十四届学习理论会议论文集, PMLR 134:2552-2583

双重先探索后承诺:渐近最优性及其他

Tianyuan Jin, Pan Xu, Xiaokui Xiao, Quanquan Gu; 第三十四届学习理论会议论文集, PMLR 134:2584-2633

用于不确定性估计的矩多校准

Christopher Jung, Changhwa Lee, Mallesh Pai, Aaron Roth, Rakesh Vohra; 第三十四届学习理论会议论文集, PMLR 134:2634-2678

具有算子范数误差的缩减秩回归

Praneeth Kacham, David Woodruff; 第三十四届学习理论会议论文集, PMLR 134:2679-2716

通过公开估计子空间实现(几乎)维度无关的隐私 ERM 与 AdaGrad 速率

Peter Kairouz, Monica Ribero Diaz, Keith Rush, Abhradeep Thakurta; 第三十四届学习理论会议论文集, PMLR 134:2717-2746

再谈稀疏向量技术

Haim Kaplan, Yishay Mansour, Uri Stemmer; 第三十四届学习理论会议论文集, PMLR 134:2747-2776

渐近最优的信息导向采样 (Information-Directed Sampling)

Johannes Kirschner, Tor Lattimore, Claire Vernade, Csaba Szepesvari; 第三十四届学习理论会议论文集, PMLR 134:2777-2821

指数族 Morris 类中低阶多项式的假设检验

Dmitriy Kunisky; 第三十四届学习理论会议论文集, PMLR 134:2822-2848

论经验风险最小化的最小误差

Gil Kur, Alexander Rakhlin; 第三十四届学习理论会议论文集, PMLR 134:2849-2852

**论文已应作者要求撤回(撤回说明请见 PDF)** 使用具有提前停止功能的 GD 训练浅层过度参数化神经网络进行非参数回归

Ilja Kuzborskij, Csaba Szepesvari; 第三十四届学习理论会议论文集, PMLR 134:2853-2890

约束采样和非凸学习的投影随机梯度朗之万算法

Andrew Lamperski; 第三十四届学习理论会议论文集, PMLR 134:2891-2937

零阶随机凸老虎机改进的悔值界限

Tor Lattimore, Andras Gyorgy; 第三十四届学习理论会议论文集, PMLR 134:2938-2964

镜像下降与信息比率

Tor Lattimore, Andras Gyorgy; 第三十四届学习理论会议论文集, PMLR 134:2965-2992

具有受限高斯预言机的结构化对数凹采样

Yin Tat Lee, Ruoqi Shen, Kevin Tian; 第三十四届学习理论会议论文集, PMLR 134:2993-3050

在线张量独立成分分析的随机逼近

Chris Junchi Li, Michael Jordan; 第三十四届学习理论会议论文集, PMLR 134:3051-3106

Softmax 策略梯度方法可能需要指数级时间才能收敛

Gen Li, Yuting Wei, Yuejie Chi, Yuantao Gu, Yuxin Chen; 第三十四届学习理论会议论文集, PMLR 134:3107-3110

l1 的指数级改进降维:子空间嵌入与独立性检验

Yi Li, David Woodruff, Taisuke Yasuda; 第三十四届学习理论会议论文集, PMLR 134:3111-3195

求解高维椭圆偏微分方程的 Deep Ritz 方法的先验泛化分析

Yulong Lu, Jianfeng Lu, Min Wang; 第三十四届学习理论会议论文集, PMLR 134:3196-3241

情节式强化学习中的鲁棒腐败探索

Thodoris Lykouris, Max Simchowitz, Alex Slivkins, Wen Sun; 第三十四届学习理论会议论文集, PMLR 134:3242-3245

社会公平聚类的逼近算法

Yury Makarychev, Ali Vakilian; 第三十四届学习理论会议论文集, PMLR 134:3246-3264

神经网络中逼近、深度分离与可学习性之间的联系

Eran Malach, Gilad Yehudai, Shai Shalev-Schwartz, Ohad Shamir; 第三十四届学习理论会议论文集, PMLR 134:3265-3295

具有改进噪声鲁棒性的随机图匹配

Cheng Mao, Mark Rudelson, Konstantin Tikhomirov; 第三十四届学习理论会议论文集, PMLR 134:3296-3329

随机约束对抗老虎机和具有对抗腐败的随机老虎机中 Tsallis-INF 算法的改进分析

Saeed Masoudian, Yevgeny Seldin; 第三十四届学习理论会议论文集, PMLR 134:3330-3350

随机特征和核模型中具有不变性的学习

Song Mei, Theodor Misiakiewicz, Andrea Montanari; 第三十四届学习理论会议论文集, PMLR 134:3351-3418

学习从受检审查的马尔可夫随机场中采样

Ankur Moitra, Elchanan Mossel, Colin P Sandon; 第三十四届学习理论会议论文集, PMLR 134:3419-3451

具有未知扰动集的对抗鲁棒学习

Omar Montasser, Steve Hanneke, Nathan Srebro; 第三十四届学习理论会议论文集, PMLR 134:3452-3482

启发式可学习性理论

Mikito Nanashima; 第三十四届学习理论会议论文集, PMLR 134:3483-3525

随机梯度下降的信息论泛化界限

Gergely Neu, Gintare Karolina Dziugaite, Mahdi Haghifam, Daniel M. Roy; 第三十四届学习理论会议论文集, PMLR 134:3526-3545

原本是“全”为了“无”:无噪声离散信道的尖锐相变

Jonathan Niles-Weed, Ilias Zadik; 第三十四届学习理论会议论文集, PMLR 134:3546-3547

大尺度 SGD:平均情况分析、渐近性与步长临界性

Courtney Paquette, Kiwon Lee, Fabian Pedregosa, Elliot Paquette; 第三十四届学习理论会议论文集, PMLR 134:3548-3626

通过使用次线性参数的深度神经网络实现可证明的记忆化

Sejun Park, Jaeho Lee, Chulhee Yun, Jinwoo Shin; 第三十四届学习理论会议论文集, PMLR 134:3627-3661

迈向具有故障预言机的聚类查询最优且时间高效的算法

Pan Peng, Jiapeng Zhang; 第三十四届学习理论会议论文集, PMLR 134:3662-3680

迈向自适应线性控制的维度自由理解

Juan C Perdomo, Max Simchowitz, Alekh Agarwal, Peter Bartlett; 第三十四届学习理论会议论文集, PMLR 134:3681-3770

从审查和相关数据中学习:线性动力学案例

Orestis Plevrakis; 第三十四届学习理论会议论文集, PMLR 134:3771-3787

对抗性 Lipschitz 老虎机的自适应离散化

Chara Podimata, Alex Slivkins; 第三十四届学习理论会议论文集, PMLR 134:3788-3805

通过弃权在不确定性主动学习中实现指数级节省

Nikita Puchkin, Nikita Zhivotovskiy; 第三十四届学习理论会议论文集, PMLR 134:3806-3832

选择性学习的指数权重算法

Mingda Qiao, Gregory Valiant; 第三十四届学习理论会议论文集, PMLR 134:3833-3858

统计问题的平均情况通信复杂度

Cyrus Rashtchian, David Woodruff, Peng Ye, Hanlin Zhu; 第三十四届学习理论会议论文集, PMLR 134:3859-3886

用出人意料的少量样本学习停止

Daniel Russo, Assaf Zeevi, Tianyi Zhang; 第三十四届学习理论会议论文集, PMLR 134:3887-3888

轻微过度参数化对浅层 ReLU 神经网络优化景观的影响

Itay M Safran, Gilad Yehudai, Ohad Shamir; 第三十四届学习理论会议论文集, PMLR 134:3889-3934

随机梯度下降和随机重球法 (Stochastic Heavy Ball) 的几乎处处收敛率

Othmane Sebbouh, Robert M Gower, Aaron Defazio; 第三十四届学习理论会议论文集, PMLR 134:3935-3971

懒惰 OCO:切换预算下的在线凸优化

Uri Sherman, Tomer Koren; 第三十四届学习理论会议论文集, PMLR 134:3972-3988

具有最佳置信度的 Johnson-Lindenstrauss 变换

Maciej Skorski; 第三十四届学习理论会议论文集, PMLR 134:3989-4007

高效老虎机凸优化:超越线性损失

Arun Sai Suggala, Pradeep Ravikumar, Praneeth Netrapalli; 第三十四届学习理论会议论文集, PMLR 134:4008-4067

论经验贝叶斯变分自编码器:一个过量风险界限

Rong Tang, Yun Yang; 第三十四届学习理论会议论文集, PMLR 134:4068-4125

通过算法稳定性实现的机器遗忘 (Machine Unlearning)

Enayat Ullah, Tung Mai, Anup Rao, Ryan A. Rossi, Raman Arora; 第三十四届学习理论会议论文集, PMLR 134:4126-4142

光滑最优传输估计的维度自由计算上限

Adrien Vacher, Boris Muzellec, Alessandro Rudi, Francis Bach, Francois-Xavier Vialard; 第三十四届学习理论会议论文集, PMLR 134:4143-4173

存在异常值情况下的鲁棒在线凸优化

Tim van Erven, Sarah Sachs, Wouter M Koolen, Wojciech Kotlowski; 第三十四届学习理论会议论文集, PMLR 134:4174-4194

神经网络逼近良性函数中的大小与深度分离

Gal Vardi, Daniel Reichman, Toniann Pitassi, Ohad Shamir; 第三十四届学习理论会议论文集, PMLR 134:4195-4223

具有平方损失的 ReLU 网络中的隐式正则化

Gal Vardi, Ohad Shamir; 第三十四届学习理论会议论文集, PMLR 134:4224-4258

无限期竞争性马尔可夫博弈中分散式乐观梯度下降/上升的最后迭代收敛

Chen-Yu Wei, Chung-Wei Lee, Mengxiao Zhang, Haipeng Luo; 第三十四届学习理论会议论文集, PMLR 134:4259-4299

无先验知识的非平稳强化学习:一种最优黑盒方法

Chen-Yu Wei, Haipeng Luo; 第三十四届学习理论会议论文集, PMLR 134:4300-4354

最优状态价值函数线性可实现下的 MDP 查询高效规划

Gellert Weisz, Philip Amortila, Barnabás Janzer, Yasin Abbasi-Yadkori, Nan Jiang, Csaba Szepesvari; 第三十四届学习理论会议论文集, PMLR 134:4355-4385

间歇性通信下分布式随机凸优化的极小极大复杂度

Blake E Woodworth, Brian Bullins, Ohad Shamir, Nathan Srebro; 第三十四届学习理论会议论文集, PMLR 134:4386-4437

通过自适应多步 Bootstrap 实现表格型 MDP 的细粒度间隙相关界限

Haike Xu, Tengyu Ma, Simon Du; 第三十四届学习理论会议论文集, PMLR 134:4438-4472

具有线性函数逼近的谨慎乐观策略优化与探索

Andrea Zanette, Ching-An Cheng, Alekh Agarwal; 第三十四届学习理论会议论文集, PMLR 134:4473-4525

具有 Massart 和 Tsybakov 噪声的高效主动学习半空间改进算法

Chicheng Zhang, Yinan Li; 第三十四届学习理论会议论文集, PMLR 134:4526-4527

强化学习比老虎机更难吗?一种摆脱视界诅咒的近优算法

Zihan Zhang, Xiangyang Ji, Simon Du; 第三十四届学习理论会议论文集, PMLR 134:4528-4531

线性混合马尔可夫决策过程的近极小极大最优强化学习

Dongruo Zhou, Quanquan Gu, Csaba Szepesvari; 第三十四届学习理论会议论文集, PMLR 134:4532-4576

轻微过度参数化两层网络的局部收敛理论

Mo Zhou, Rong Ge, Chi Jin; 第三十四届学习理论会议论文集, PMLR 134:4577-4632

线性回归中恒定步长 SGD 的良性过拟合

Difan Zou, Jingfeng Wu, Vladimir Braverman, Quanquan Gu, Sham Kakade; 第三十四届学习理论会议论文集, PMLR 134:4633-4635

公开问题:所有的 VC 类都是 CPAC 可学习的吗?

Sushant Agarwal, Nivasini Ananthakrishnan, Shai Ben-David, Tosca Lechner, Ruth Urner; 第三十四届学习理论会议论文集, PMLR 134:4636-4641

公开问题:是否存在一种只要在线学习可能就能够学习的在线学习算法?

Steve Hanneke; 第三十四届学习理论会议论文集, PMLR 134:4642-4646

公开问题:RKHS 元素的紧致在线置信区间

Sattar Vakili, Jonathan Scarlett, Tara Javidi; 第三十四届学习理论会议论文集, PMLR 134:4647-4652

未解问题:单次打乱 SGD 是否能优于多次打乱 SGD 和全梯度下降 (GD)?

Chulhee Yun, Suvrit Sra, Ali Jadbabaie; Proceedings of Thirty Fourth Conference on Learning Theory, PMLR 134:4653-4658

通过 RSS 订阅