[编辑]

第178卷:学习理论会议,2022年7月2日至5日,英国伦敦

[编辑]

编辑:Po-Ling Loh, Maxim Raginsky

[bib][citeproc]

2022年学习理论会议:前言

Po-Ling Loh, Maxim Raginsky; 第三十五届学习理论会议论文集, PMLR 178:i-ii

从庞加莱到洛格-索博列夫的朗之万蒙特卡洛分析

Sinho Chewi, Murat A Erdogdu, Mufan Li, Ruoqi Shen, Shunshi Zhang; 第三十五届学习理论会议论文集, PMLR 178:1-2

基于优化的神经网络分离

Itay Safran, Jason Lee; 第三十五届学习理论会议论文集, PMLR 178:3-64

镜像下降再次成功:无限噪声方差下的最优随机凸优化

Nuri Mert Vural, Lu Yu, Krishna Balasubramanian, Stanislav Volgushev, Murat A Erdogdu; 第三十五届学习理论会议论文集, PMLR 178:65-102

具有梯度惩罚的Wasserstein GAN计算拥塞传输

Tristan Milne, Adrian I Nachman; 第三十五届学习理论会议论文集, PMLR 178:103-129

随机图的鲁棒估计

Jayadev Acharya, Ayush Jain, Gautam Kamath, Ananda Theertha Suresh, Huanyu Zhang; 第三十五届学习理论会议论文集, PMLR 178:130-166

学习图分区查询复杂度的紧界

Xizhi Liu, Sayan Mukherjee; 第三十五届学习理论会议论文集, PMLR 178:167-181

推动在线投资组合和量子状态学习的效率-遗憾帕累托前沿

Julian Zimmert, Naman Agarwal, Satyen Kale; 第三十五届学习理论会议论文集, PMLR 178:182-226

使用高斯先验的聚合浅层神经网络的风险界限

Laura Tinsi, Arnak Dalalyan; 第三十五届学习理论会议论文集, PMLR 178:227-253

大学习率对核方法的益处

Gaspard Beugnot, Julien Mairal, Alessandro Rudi; 第三十五届学习理论会议论文集, PMLR 178:254-282

无偏学习半空间交集的统计查询下界

Daniel J Hsu, Clayton H Sanford, Rocco Servedio, Emmanouil Vasileios Vlatakis-Gkaragkounis; 第三十五届学习理论会议论文集, PMLR 178:283-312

自适应在SGD中的力量:具有无界梯度和仿射方差的自调步长

Matthew Faw, Isidoros Tziotis, Constantine Caramanis, Aryan Mokhtari, Sanjay Shakkottai, Rachel Ward; 第三十五届学习理论会议论文集, PMLR 178:313-355

无方差的均值估计

Yeshwanth Cherapanamjeri, Nilesh Tripuraneni, Peter Bartlett, Michael Jordan; 第三十五届学习理论会议论文集, PMLR 178:356-357

超越无遗憾:实例相关的PAC强化学习

Andrew J Wagenmaker, Max Simchowitz, Kevin Jamieson; 第三十五届学习理论会议论文集, PMLR 178:358-418

学习低度超图

Eric Balkanski, Oussama Hanguir, Shatian Wang; 第三十五届学习理论会议论文集, PMLR 178:419-420

深度和特征学习对神经网络判别器有益

Carles Domingo-Enrich; 第三十五届学习理论会议论文集, PMLR 178:421-447

良性过拟合的隐式偏见

Ohad Shamir; 第三十五届学习理论会议论文集, PMLR 178:448-478

具有界限损失的通用在线学习:简化为二元分类

Moise Blanchard, Romain Cosson; 第三十五届学习理论会议论文集, PMLR 178:479-495

负曲率阻碍了具有精确一阶或acular的强大地测地凸优化加速

Christopher Criscitiello, Nicolas Boumal; 第三十五届学习理论会议论文集, PMLR 178:496-542

多智能体学习用于迭代优势消除:形式障碍和新算法

Jibang Wu, Haifeng Xu, Fan Yao; 第三十五届学习理论会议论文集, PMLR 178:543-543

用于无界高斯分布的私密且计算高效的估计器

Gautam Kamath, Argyris Mouzakis, Vikrant Singhal, Thomas Steinke, Jonathan Ullman; 第三十五届学习理论会议论文集, PMLR 178:544-572

分布测试中的容忍代价

Clement L Canonne, Ayush Jain, Gautam Kamath, Jerry Li; 第三十五届学习理论会议论文集, PMLR 178:573-624

用于差分隐私的界限噪声机制

Yuval Dagan, Gil Kur; 第三十五届学习理论会议论文集, PMLR 178:625-661

使用度量损失的学习

Dan Tsir Cohen, Aryeh Kontorovich; 第三十五届学习理论会议论文集, PMLR 178:662-700

多项式网络收敛到高斯过程的速率

Adam Klukowski; 第三十五届学习理论会议论文集, PMLR 178:701-722

通过稳定凸松弛进行私密鲁棒估计

Pravesh Kothari, Pasin Manurangsi, Ameya Velingker; 第三十五届学习理论会议论文集, PMLR 178:723-777

变分不等式方法的随机方差缩减

Ahmet Alacaoglu, Yura Malitsky; 第三十五届学习理论会议论文集, PMLR 178:778-816

福克-普朗克方程的自洽性

Zebang Shen, Zhenfu Wang, Satyen Kale, Alejandro Ribeiro, Amin Karbasi, Hamed Hassani; 第三十五届学习理论会议论文集, PMLR 178:817-841

单调学习

Olivier J Bousquet, Amit Daniely, Haim Kaplan, Yishay Mansour, Shay Moran, Uri Stemmer; 第三十五届学习理论会议论文集, PMLR 178:842-866

用黑盒建议追踪凸体和函数

Nicolas Christianson, Tinashe Handina, Adam Wierman; 第三十五届学习理论会议论文集, PMLR 178:867-908

ROOT-SGD:单一算法中的尖锐非渐近性和渐近效率

Chris Junchi Li, Wenlong Mou, Martin Wainwright, Michael Jordan; 第三十五届学习理论会议论文集, PMLR 178:909-981

随机最短路径策略优化

Liyu Chen, Haipeng Luo, Aviv Rosenberg; 第三十五届学习理论会议论文集, PMLR 178:982-1046

学习半空间与Massart噪声的优化SQ下界

Rajai Nasser, Stefan Tiegel; 第三十五届学习理论会议论文集, PMLR 178:1047-1074

用于学习高斯及更高模型的隐私和多项式时间算法

Hassan Ashtiani, Christopher Liaw; 第三十五届学习理论会议论文集, PMLR 178:1075-1076

通用在线学习:一种乐观的通用学习规则

Moise Blanchard; 第三十五届学习理论会议论文集, PMLR 178:1077-1125

用于亚高斯数据的近乎最优隐私线性回归,通过自适应剪切

Prateek Varshney, Abhradeep Thakurta, Prateek Jain; 第三十五届学习理论会议论文集, PMLR 178:1126-1166

高维差分隐私和鲁棒统计

Xiyang Liu, Weihao Kong, Sewoong Oh; 第三十五届学习理论会议论文集, PMLR 178:1167-1246

基于格的方法在聚类中超越求和平方

Ilias Zadik, Min Jae Song, Alexander S Wein, Joan Bruna; 第三十五届学习理论会议论文集, PMLR 178:1247-1248

ReLU神经网络中宽度不如深度重要

Gal Vardi, Gilad Yehudai, Ohad Shamir; 第三十五届学习理论会议论文集, PMLR 178:1249-1281

强化学习中的计算-统计差距

Daniel Kane, Sihan Liu, Shachar Lovett, Gaurav Mahajan; 第三十五届学习理论会议论文集, PMLR 178:1282-1302

用于稀疏数据的多任务学习的迹范数正则化

Etienne Boursier, Mikhail Konobeev, Nicolas Flammarion; 第三十五届学习理论会议论文集, PMLR 178:1303-1327

结构化估计中交互的作用

Jayadev Acharya, Clement L. Canonne, Ziteng Sun, Himanshu Tyagi; 第三十五届学习理论会议论文集, PMLR 178:1328-1355

RKHS中梯度朗之万动力学的无量纲收敛速度

Boris Muzellec, Kanji Sato, Mathurin Massias, Taiji Suzuki; 第三十五届学习理论会议论文集, PMLR 178:1356-1420

具有方差相关后悔界限的对抗鲁棒多臂老虎机算法

Shinji Ito, Taira Tsuchiya, Junya Honda; 第三十五届学习理论会议论文集, PMLR 178:1421-1422

多路流老虎机的记忆-后悔权衡(近乎最优)

Arpit Agarwal, Sanjeev Khanna, Prathamesh Patil; 第三十五届学习理论会议论文集, PMLR 178:1423-1462

从噪声标签中近似聚类恢复

Buddhima Gamlath, Silvio Lattanzi, Ashkan Norouzi-Fard, Ola Svensson; 第三十五届学习理论会议论文集, PMLR 178:1463-1509

用于多变量凸回归的有效最小最大最优估计器

Gil Kur, Eli Putterman; 第三十五届学习理论会议论文集, PMLR 178:1510-1546

部分监控的最小最大后悔:无限结果和Rustichini的后悔

Tor Lattimore; 第三十五届学习理论会议论文集, PMLR 178:1547-1575

具有异质曲率的自适应老虎机凸优化

Haipeng Luo, Mengxiao Zhang, Peng Zhao; 第三十五届学习理论会议论文集, PMLR 178:1576-1612

通过局部SGD进行统计估计和在线推断

Xiang Li, Jiadong Liang, Xiangyu Chang, Zhihua Zhang; 第三十五届学习理论会议论文集, PMLR 178:1613-1661

度异构随机块模型中的社区恢复

Vincent Cohen-Addad, Frederik Mallmann-Trenn, David Saulpic; 第三十五届学习理论会议论文集, PMLR 178:1662-1692

随机向量和的强高斯逼近

Nazar Buzun, Nikolay Shvetsov, Dmitry V. Dylov; 第三十五届学习理论会议论文集, PMLR 178:1693-1715

平滑在线学习与统计学习一样容易

Adam Block, Yuval Dagan, Noah Golowich, Alexander Rakhlin; 第三十五届学习理论会议论文集, PMLR 178:1716-1786

小密度下Ising感知器模型的Gardner公式

Erwin Bolthausen, Shuta Nakajima, Nike Sun, Changji Xu; 第三十五届学习理论会议论文集, PMLR 178:1787-1911

正则化 M 估计量的导数和残差分布,及其在自适应调谐中的应用

Pierre C Bellec, Yiwei Shen; 第三十五届学习理论会议论文集, PMLR 178:1912-1947

通过指数机制实现私有凸优化

Sivakanth Gopi, Yin Tat Lee, Daogao Liu; 第三十五届学习理论会议论文集, PMLR 178:1948-1989

面向无碰撞感知信息的多玩家强盗问题的最优算法

Wei Huang, Richard Combes, Cindy Trinh; 第三十五届学习理论会议论文集, PMLR 178:1990-2012

数据驱动数值线性代数的泛化界限

Peter Bartlett, Piotr Indyk, Tal Wagner; 第三十五届学习理论会议论文集, PMLR 178:2013-2040

一维强对数凹分布采样的查询复杂度

Sinho Chewi, Patrik R Gerber, Chen Lu, Thibaut Le Gouic, Philippe Rigollet; 第三十五届学习理论会议论文集, PMLR 178:2041-2059

马尔可夫线性随机逼近的最优和实例相关保证

Wenlong Mou, Ashwin Pananjady, Martin Wainwright, Peter Bartlett; 第三十五届学习理论会议论文集, PMLR 178:2060-2061

非强凸最小二乘的加速 SGD

Aditya Varre, Nicolas Flammarion; 第三十五届学习理论会议论文集, PMLR 178:2062-2126

带有标签噪声(随机)梯度下降隐式求解二次参数化的 Lasso

Loucas Pillaud Vivien, Julien Reygner, Nicolas Flammarion; 第三十五届学习理论会议论文集, PMLR 178:2127-2159

跟踪强盗问题中最显著的臂切换

Joe Suk, Samory Kpotufe; 第三十五届学习理论会议论文集, PMLR 178:2160-2182

相关随机块模型中精确的社群恢复

Julia Gaudio, Miklos Z. Racz, Anirudh Sridhar; 第三十五届学习理论会议论文集, PMLR 178:2183-2241

具有平均场性质的非参数交互粒子系统估计

Rentian Yao, Xiaohui Chen, Yun Yang; 第三十五届学习理论会议论文集, PMLR 178:2242-2275

具有有界权重范数的多通道线性卷积网络的归纳偏差

Meena Jagadeesan, Ilya Razenshteyn, Suriya Gunasekar; 第三十五届学习理论会议论文集, PMLR 178:2276-2325

用于在线凸优化且具有自适应遗憾保证的新投影无关算法

Dan Garber, Ben Kretzu; 第三十五届学习理论会议论文集, PMLR 178:2326-2359

使 SGD 无需参数调整

Yair Carmon, Oliver Hinder; 第三十五届学习理论会议论文集, PMLR 178:2360-2389

高效凸优化需要超线性内存

Annie Marsden, Vatsal Sharan, Aaron Sidford, Gregory Valiant; 第三十五届学习理论会议论文集, PMLR 178:2390-2430

大步-小步:具有多尺度目标的高效梯度方法

Jonathan Kelner, Annie Marsden, Vatsal Sharan, Aaron Sidford, Gregory Valiant, Honglin Yuan; 第三十五届学习理论会议论文集, PMLR 178:2431-2540

面向具有不相干测量的状态认证的实例最优方法

Sitan Chen, Jerry Li, Ryan O’Donnell; 第三十五届学习理论会议论文集, PMLR 178:2541-2596

高斯潜在树模型中 EM 算法的收敛性

Yuval Dagan, Vardis Kandiros, Constantinos Daskalakis; 第三十五届学习理论会议论文集, PMLR 178:2597-2667

良性过拟合,无需线性化:由梯度下降训练的噪声线性数据的神经网络分类器

Spencer Frei, Niladri S Chatterji, Peter Bartlett; 第三十五届学习理论会议论文集, PMLR 178:2668-2703

分布偏移下鲁棒机器学习的最小最大遗憾优化

Alekh Agarwal, Tong Zhang; 第三十五届学习理论会议论文集, PMLR 178:2704-2729

具有可实现性和单策略集中度的离线强化学习

Wenhao Zhan, Baihe Huang, Audrey Huang, Nan Jiang, Jason Lee; 第三十五届学习理论会议论文集, PMLR 178:2730-2775

具有大量动作空间的大规模非线性强化学习:结构条件和后验采样的样本效率

Alekh Agarwal, Tong Zhang; 第三十五届学习理论会议论文集, PMLR 178:2776-2814

具有近优鲁棒性保证的高斯混合模型学习

Allen Liu, Ankur Moitra; 第三十五届学习理论会议论文集, PMLR 178:2815-2895

非凹采样理论:Langevin Monte Carlo 的一阶平稳性保证

Krishna Balasubramanian, Sinho Chewi, Murat A Erdogdu, Adil Salim, Shunshi Zhang; 第三十五届学习理论会议论文集, PMLR 178:2896-2923

通过近端外梯度框架理解黎曼加速

Jikai Jin, Suvrit Sra; 第三十五届学习理论会议论文集, PMLR 178:2924-2962

随机梯度方法几乎必然收敛速度

Jun Liu, Ye Yuan; 第三十五届学习理论会议论文集, PMLR 178:2963-2983

用于采样的近端算法改进分析

Yongxin Chen, Sinho Chewi, Adil Salim, Andre Wibisono; 第三十五届学习理论会议论文集, PMLR 178:2984-3014

可实现学习就是你所需要的

Max Hopkins, Daniel M. Kane, Shachar Lovett, Gaurav Mahajan; 第三十五届学习理论会议论文集, PMLR 178:3015-3069

用于凸多面体椭球体近似的流算法

Yury Makarychev, Naren Sarayu Manoj, Max Ovsiankin; 第三十五届学习理论会议论文集, PMLR 178:3070-3093

无通信多玩家多臂老虎机中实例相关保证的帕累托前沿

Allen X Liu, Mark Sellke; 第三十五届学习理论会议论文集, PMLR 178:3094-3094

使用 Kullback-Leibler 散度的覆盖进行模式的最小最大遗憾

Jennifer Tang; 第三十五届学习理论会议论文集, PMLR 178:3095-3112

通过 Huber 统计量进行一致性检验的尖锐常数

Shivam Gupta, Eric Price; 第三十五届学习理论会议论文集, PMLR 178:3113-3192

低阶多校准

Parikshit Gopalan, Michael P Kim, Mihir A Singhal, Shengjia Zhao; 第三十五届学习理论会议论文集, PMLR 178:3193-3234

Thompson 采样在线性二次控制中实现 $\tilde{O}(\sqrt{T})$ 遗憾

Taylan Kargin, Sahin Lale, Kamyar Azizzadenesheli, Animashree Anandkumar, Babak Hassibi; 第三十五届学习理论会议论文集, PMLR 178:3235-3284

偏差的回归:对抗线性老虎机的高概率最优界限

Julian Zimmert, Tor Lattimore; 第三十五届学习理论会议论文集, PMLR 178:3285-3312

一阶经验风险最小化的均匀稳定性

Amit Attia, Tomer Koren; 第三十五届学习理论会议论文集, PMLR 178:3313-3332

单轨迹非参数学习非线性动力学

Ingvar M Ziemann, Henrik Sandberg, Nikolai Matni; 第三十五届学习理论会议论文集, PMLR 178:3333-3364

可计算学习器的可学习性表征

Tom F. Sterkenburg; 第三十五届学习理论会议论文集, PMLR 178:3365-3379

梯度方法在可分离数据及其他情况下的稳定性与隐式偏差

Matan Schliserman, Tomer Koren; 第三十五届学习理论会议论文集, PMLR 178:3380-3394

来自池化数据的近乎最优高效解码

Max Hahn-Klimroth, Noela Müller; 第三十五届学习理论会议论文集, PMLR 178:3395-3409

Sobolev 空间中的核插值在低维情况下不一致

Simon Buchholz; 第三十五届学习理论会议论文集, PMLR 178:3410-3440

几何模型中随机图匹配:完全图的情况

Haoyu Wang, Yihong Wu, Jiaming Xu, Israel Yolou; 第三十五届学习理论会议论文集, PMLR 178:3441-3488

离线强化学习:价值函数逼近的基本障碍

Dylan J Foster, Akshay Krishnamurthy, David Simchi-Levi, Yunzong Xu; 第三十五届学习理论会议论文集, PMLR 178:3489-3489

用于最小成本次模覆盖问题的改进并行算法

Yingli Ran, Zhao Zhang, Shaojie Tang; 第三十五届学习理论会议论文集, PMLR 178:3490-3502

黎曼 Robbins-Monro 算法的动态

Mohammad Reza Karimi, Ya-Ping Hsieh, Panayotis Mertikopoulos, Andreas Krause; 第三十五届学习理论会议论文集, PMLR 178:3503-3503

通过密度更新实现抗破坏上下文搜索

Renato Paes Leme, Chara Podimata, Jon Schneider; 第三十五届学习理论会议论文集, PMLR 178:3504-3505

一致性检验的内存复杂度

Tomer Berg, Or Ordentlich, Ofer Shayevitz; 第三十五届学习理论会议论文集, PMLR 178:3506-3523

通过凸分析进行泛化界限

Gabor Lugosi, Gergely Neu; 第三十五届学习理论会议论文集, PMLR 178:3524-3546

私有矩阵逼近和酉轨道几何

Oren Mangoubi, Yikai Wu, Satyen Kale, Abhradeep Thakurta, Nisheeth K. Vishnoi; 第三十五届学习理论会议论文集, PMLR 178:3547-3588

具有随机凸成本和未知动态的有效在线线性控制

Asaf B Cassel, Alon Cohen, Tomer Koren; 第三十五届学习理论会议论文集, PMLR 178:3589-3604

用于基质约束优化和回归的双侧弱次模性

Theophile Thiery, Justin Ward; 第三十五届学习理论会议论文集, PMLR 178:3605-3634

驯服更大规模的强盗:线性强盗切换遗憾的案例研究

Haipeng Luo, Mengxiao Zhang, Peng Zhao, Zhi-Hua Zhou; 第三十五届学习理论会议论文集, PMLR 178:3635-3684

神经元集合学习对分离良好分布进行分类

Max Dabagia, Santosh S Vempala, Christos Papadimitriou; 第三十五届学习理论会议论文集, PMLR 178:3685-3717

结构化弃权问题和 Lovász 铰链

Jessica J Finocchiaro, Rafael Frongillo, Enrique B Nueve; 第三十五届学习理论会议论文集, PMLR 178:3718-3740

超完备三阶张量分解的快速算法

Jingqiu Ding, Tommaso d’Orsi, Chih-Hung Liu, David Steurer, Stefan Tiegel; 第三十五届学习理论会议论文集, PMLR 178:3741-3799

DPP 最大似然学习的困难性

Elena Grigorescu, Brendan Juba, Karl Wimmer, Ning Xie; 第三十五届学习理论会议论文集, PMLR 178:3800-3819

学习控制线性系统可能很困难

Anastasios Tsiamis, Ingvar M Ziemann, Manfred Morari, Nikolai Matni, George J. Pappas; 第三十五届学习理论会议论文集, PMLR 178:3820-3857

无视界限强化学习的强大力量:固定策略

Zihan Zhang, Xiangyang Ji, Simon Du; 第三十五届学习理论会议论文集, PMLR 178:3858-3904

关于良好分布属性及其与线性回归的关系

Hongjie Chen, Tommaso d’Orsi; 第三十五届学习理论会议论文集, PMLR 178:3905-3935

稳健学习离散乘积分布和 Ising 模型的最佳 SQ 下界

Ilias Diakonikolas, Daniel M. Kane, Yuxin Sun; 第三十五届学习理论会议论文集, PMLR 178:3936-3978

隐私保护的高维假设检验

Shyam Narayanan; 第三十五届学习理论会议论文集, PMLR 178:3979-4027

灾难性遗忘对线性回归的影响有多大?

Itay Evron, Edward Moroshko, Rachel Ward, Nathan Srebro, Daniel Soudry; 第三十五届学习理论会议论文集, PMLR 178:4028-4079

非对称排队系统中高效的去中心化多智能体学习

Daniel Freund, Thodoris Lykouris, Wentao Weng; 第三十五届学习理论会议论文集, PMLR 178:4080-4084

通过最小选择原则进行运输的在线学习

Wenxuan Guo, YoonHaeng Hur, Tengyuan Liang, Chris Ryan; 第三十五届学习理论会议论文集, PMLR 178:4085-4109

高斯混合模型学习中信道容量的作用

Elad Romanov, Tamir Bendory, Or Ordentlich; 第三十五届学习理论会议论文集, PMLR 178:4110-4159

无参数镜像下降法

Andrew Jacobsen, Ashok Cutkosky; 第三十五届学习理论会议论文集, PMLR 178:4160-4211

链式泛化界限

Eugenio Clerico, Amitis Shidani, George Deligiannidis, Arnaud Doucet; 第三十五届学习理论会议论文集, PMLR 178:4212-4257

学习半空间具有 Massart 噪声的近最优统计查询困难性

Ilias Diakonikolas, Daniel Kane; 第三十五届学习理论会议论文集, PMLR 178:4258-4282

更快的在线校准,无需随机化:区间预测和两个选择的力量

Chirag Gupta, Aaditya Ramdas; 第三十五届学习理论会议论文集, PMLR 178:4283-4309

经验风险最小化的普遍性

Andrea Montanari, Basil N. Saeed; 第三十五届学习理论会议论文集, PMLR 178:4310-4312

通过梯度下降学习单个神经元,对抗标签噪声

Ilias Diakonikolas, Vasilis Kontonis, Christos Tzamos, Nikos Zarifis; 第三十五届学习理论会议论文集, PMLR 178:4313-4361

通过原始对偶外梯度方法学习可分离最小最大值和有限和优化的更严格界限

Yujia Jin, Aaron Sidford, Kevin Tian; 第三十五届学习理论会议论文集, PMLR 178:4362-4415

随机学习算法的速率失真理论泛化界限

Milad Sefidgaran, Amin Gohari, Gaël Richard, Umut Simsekli; 第三十五届学习理论会议论文集, PMLR 178:4416-4463

无尺度约束的弯曲损失在线学习

Jack J. Mayo, Hedi Hadiji, Tim van Erven; 第三十五届学习理论会议论文集, PMLR 178:4464-4497

在中毒攻击下稳健可靠的学习者

Maria-Florina Balcan, Avrim Blum, Steve Hanneke, Dravyansh Sharma; 第三十五届学习理论会议论文集, PMLR 178:4498-4534

通过格基约简进行非高斯成分分析

Ilias Diakonikolas, Daniel Kane; 第三十五届学习理论会议论文集, PMLR 178:4535-4547

Q-learning 是否可以通过建议来改进?

Noah Golowich, Ankur Moitra; 第三十五届学习理论会议论文集, PMLR 178:4548-4619

带有证书和快速速率的非凸优化,通过核的平方和

Blake Woodworth, Francis Bach, Alessandro Rudi; 第三十五届学习理论会议论文集, PMLR 178:4620-4642

图流中的层次聚类:单次传递算法和空间下界

Sepehr Assadi, Vaggos Chatziafratis, Jakub \Lącki, Vahab Mirrokni, Chen Wang; 第三十五届学习理论会议论文集, PMLR 178:4643-4702

通过平方和进行鲁棒稀疏均值估计

Ilias Diakonikolas, Daniel M. Kane, Sushrut Karmalkar, Ankit Pensia, Thanasis Pittas; 第三十五届学习理论会议论文集, PMLR 178:4703-4763

群测试中的统计和计算相变

Amin Coja-Oghlan, Oliver Gebhard, Max Hahn-Klimroth, Alexander S Wein, Ilias Zadik; 第三十五届学习理论会议论文集, PMLR 178:4764-4781

合并阶梯属性:两层神经网络上稀疏函数SGD学习的必要且几乎充分的条件

Emmanuel Abbe, Enric Boix Adsera, Theodor Misiakiewicz; 第三十五届学习理论会议论文集, PMLR 178:4782-4887

特征空间重构:神经网络中的空间和频率原理

Lechao Xiao; 第三十五届学习理论会议论文集, PMLR 178:4888-4944

对近似低秩伊辛模型的采样:MCMC 与变分方法

Frederic Koehler, Holden Lee, Andrej Risteski; 第三十五届学习理论会议论文集, PMLR 178:4945-4988

学习自然模型的更好内存下界

Gavin Brown, Mark Bun, Adam Smith; 第三十五届学习理论会议论文集, PMLR 178:4989-5029

统计对抗中自适应性的力量

Guy Blanc, Jane Lange, Ali Malik, Li-Yang Tan; 第三十五届学习理论会议论文集, PMLR 178:5030-5061

外源信息存在时的样本高效强化学习

Yonathan Efroni, Dylan J Foster, Dipendra Misra, Akshay Krishnamurthy, John Langford; 第三十五届学习理论会议论文集, PMLR 178:5062-5127

局部搜索和 Brouwer 在轮次中的查询复杂度

Simina Branzei, Jiawei Li; 第三十五届学习理论会议论文集, PMLR 178:5128-5145

Tallying Bandits 的完整策略遗憾界限

Dhruv Malik, Yuanzhi Li, Aarti Singh; 第三十五届学习理论会议论文集, PMLR 178:5146-5174

部分可观察强化学习何时并不可怕?

Qinghua Liu, Alan Chung, Csaba Szepesvari, Chi Jin; 第三十五届学习理论会议论文集, PMLR 178:5175-5220

贝叶斯博弈中针对学习者的策略

Yishay Mansour, Mehryar Mohri, Jon Schneider, Balasubramanian Sivan; 第三十五届学习理论会议论文集, PMLR 178:5221-5252

带有自协变损失的正交统计学习

Lang Liu, Carlos Cinelli, Zaid Harchaoui; 第三十五届学习理论会议论文集, PMLR 178:5253-5277

半随机噪声下的查询聚类

Alberto Del Pia, Mingchen Ma, Christos Tzamos; 第三十五届学习理论会议论文集, PMLR 178:5278-5313

带有成员预言机的有效无投影在线凸优化

Zakaria Mhammedi; 第三十五届学习理论会议论文集, PMLR 178:5314-5390

用于相关聚类的更好的隐私算法

Daogao Liu; 第三十五届学习理论会议论文集, PMLR 178:5391-5412

神经网络可以通过梯度下降学习表示

Alexandru Damian, Jason Lee, Mahdi Soltanolkotabi; 第三十五届学习理论会议论文集, PMLR 178:5413-5452

具有二次有界损失的通用数据上,随机线性优化永远不会过拟合

Matus Telgarsky; 第三十五届学习理论会议论文集, PMLR 178:5453-5488

逆问题的多层优化

Simon Weissmann, Ashia Wilson, Jakob Zech; 第三十五届学习理论会议论文集, PMLR 178:5489-5524

高维投影追逐:外界限和对神经网络插值的应用

Kangjie Zhou, Andrea Montanari; 第三十五届学习理论会议论文集, PMLR 178:5525-5527

记住以泛化:关于高维线性回归中插值的必要性

Chen Cheng, John Duchi, Rohith Kuditipudi; 第三十五届学习理论会议论文集, PMLR 178:5528-5560

投资组合选择的阻尼在线牛顿步

Zakaria Mhammedi, Alexander Rakhlin; 第三十五届学习理论会议论文集, PMLR 178:5561-5595

从离散域的采样到优化,以及在行列式最大化中的应用

Nima Anari, Thuy-Duong Vuong; 第三十五届学习理论会议论文集, PMLR 178:5596-5618

开放问题:在多项式时间内正确学习决策树?

Guy Blanc, Jane Lange, Mingda Qiao, Li-Yang Tan; 第三十五届学习理论会议论文集, PMLR 178:5619-5623

开放问题:无噪声核带状赌博的后悔界限

Sattar Vakili; 第三十五届学习理论会议论文集, PMLR 178:5624-5629

开放问题:加速 $\ell_1$-正则化 PageRank 的运行时间复杂度

Kimon Fountoulakis, Shenghao Yang; 第三十五届学习理论会议论文集, PMLR 178:5630-5632

开放问题:在线学习中是否需要为隐私付费?

Amartya Sanyal, Giorgia Ramponi; 第三十五届学习理论会议论文集, PMLR 178:5633-5637

开放问题:具有边际保证的更好的差分隐私学习算法

Raef Bassily, Mehryar Mohri, Ananda Theertha Suresh; 第三十五届学习理论会议论文集, PMLR 178:5638-5643

开放问题:具有反馈图的随机在线学习的有限时间实例相关最优性

Teodor Vanislavov Marinov, Mehryar Mohri, Julian Zimmert; 第三十五届学习理论会议论文集, PMLR 178:5644-5649

开放问题:固定预算的最佳臂识别

Chao Qin; 第三十五届学习理论会议论文集, PMLR 178:5650-5654

订阅 通过 RSS