[编辑]

第199卷:终身学习智能体会议,2022年8月22日至24日,加拿大魁北克省蒙特利尔麦吉尔大学

[编辑]

编辑:Sarath Chandar、Razvan Pascanu、Doina Precup

[bib][citeproc]

用于持续学习的基于能量的模型

Shuang Li、Yilun Du、Gido van de Ven、Igor Mordatch; 第一届终身学习智能体会议论文集, PMLR 199:1-22

任务景观如何影响 MAML 性能?

Liam Collins、Aryan Mokhtari、Sanjay Shakkottai; 第一届终身学习智能体会议论文集, PMLR 199:23-59

使用基础模型进行持续学习:基于潜在重放的实证研究

Oleksiy Ostapenko、Timothee Lesort、Pau Rodriguez、Md Rifat Arefin、Arthur Douillard、Irina Rish、Laurent Charlin; 第一届终身学习智能体会议论文集, PMLR 199:60-91

EFL:非独立同分布数据上的弹性联邦学习

Zichen Ma、Yu Lu、Wenye Li、Shuguang Cui; 第一届终身学习智能体会议论文集, PMLR 199:92-115

在相关性偏移下进行解纠缠和泛化

Christina M. Funke、Paul Vicol、Kuan-chieh Wang、Matthias Kuemmerer、Richard Zemel、Matthias Bethge; 第一届终身学习智能体会议论文集, PMLR 199:116-141

学习优化器中内存、计算和性能之间的实际权衡

Luke Metz、C. Daniel Freeman、James Harrison、Niru Maheswaranathan、Jascha Sohl-dickstein; 第一届终身学习智能体会议论文集, PMLR 199:142-164

宏观尺度上的随时学习

Lucas Caccia、Jing Xu、Myle Ott、Marcaurelio Ranzato、Ludovic Denoyer; 第一届终身学习智能体会议论文集, PMLR 199:165-182

使用深度网络进行持续无监督学习的光流估计

Simone Marullo、Matteo Tiezzi、Alessandro Betti、Lapo Faggi、Enrico Meloni、Stefano Melacci; 第一届终身学习智能体会议论文集, PMLR 199:183-200

通过哈密顿方程进行持续学习

Alessandro Betti、Lapo Faggi、Marco Gori、Matteo Tiezzi、Simone Marullo、Enrico Meloni、Stefano Melacci; 第一届终身学习智能体会议论文集, PMLR 199:201-212

使用基于激活的提前停止改进元学习泛化

Simon Guiroy、Christopher Pal、Goncalo Mordido、Sarath Chandar; 第一届终身学习智能体会议论文集, PMLR 199:213-230

基于规则的盾牌:从灾难性动作效应中积累安全规则

Shahaf S. Shperberg、Bo Liu、Alessandro Allievi、Peter Stone; 第一届终身学习智能体会议论文集, PMLR 199:231-242

持续学习和隐私保护的取消学习

Bo Liu、Qiang Liu、Peter Stone; 第一届终身学习智能体会议论文集, PMLR 199:243-254

克服利用 GAN 进行小样本数据增强的挑战

Christopher Beckham、Issam H. Laradji、Pau Rodriguez、David Vazquez、Derek Nowrouzezahrai、Christopher Pal; 第一届终身学习智能体会议论文集, PMLR 199:255-280

提高无监督视觉领域自适应的模型泛化能力

Mohammad Rostami; 第一届终身学习智能体会议论文集, PMLR 199:281-293

使用离策略数据进行机器人终身学习中的遗忘和不平衡

Wenxuan Zhou、Steven Bohez、Jan Humplik、Nicolas Heess、Abbas Abdolmaleki、Dushyant Rao、Markus Wulfmeier、Tuomas Haarnoja; 第一届终身学习智能体会议论文集, PMLR 199:294-309

无限非平稳聚类的流式推理

Rylan Schaeffer、Gabrielle Kaili-may Liu、Yilun Du、Scott Linderman、Ila R. Fiete; 第一届终身学习智能体会议论文集, PMLR 199:310-326

经验不足的 RL 智能体无法做到:有限样本复杂度下的后悔下界

Maia Fraser、Vincent Létourneau; 第一届终身学习智能体会议论文集, PMLR 199:327-334

使用竞争联邦储层计算进行动态系统的持续学习

Leonard Bereska、Efstratios Gavves; 第一届终身学习智能体会议论文集, PMLR 199:335-350

使用图神经网络学习以对象为中心的自发行为

Ahmed Akakzia、Olivier Sigaud; 第一届终身学习智能体会议论文集, PMLR 199:351-365

TAG:基于任务的累积梯度用于终身学习

Pranshu Malviya、Balaraman Ravindran、Sarath Chandar; 第一届终身学习智能体会议论文集, PMLR 199:366-389

任务无关表示巩固:一种基于自监督的持续学习方法

Prashant Shivaram Bhat、Bahram Zonooz、Elahe Arani; 第一届终身学习智能体会议论文集, PMLR 199:390-405

用于强化学习的 Zipfian 环境

Stephanie C.Y. Chan、Andrew Kyle Lampinen、Pierre Harvey Richemond、Felix Hill; 第一届终身学习智能体会议论文集, PMLR 199:406-429

CLActive:用于快速主动学习的剧集记忆

Sri Aurobindo Munagala、Sidhant Subramanian、Shyamgopal Karthik、Ameya Prabhu、Anoop Namboodiri; 第一届终身学习智能体会议论文集, PMLR 199:430-440

应对终身强化学习中非平稳性的反应式探索

Christian Alexander Steinparz, Thomas Schmied, Fabian Paischer, Marius-constantin Dinu, Vihang Prakash Patil, Angela Bitto-nemling, Hamid Eghbal-zadeh, Sepp Hochreiter; 第1届终身学习智能体会议论文集, PMLR 199:441-469

离线强化学习的视角

Kajetan Schweighofer, Marius-constantin Dinu, Andreas Radler, Markus Hofmarcher, Vihang Prakash Patil, Angela Bitto-nemling, Hamid Eghbal-zadeh, Sepp Hochreiter; 第1届终身学习智能体会议论文集, PMLR 199:470-517

预测学习使神经网络能够学习复杂的运行记忆任务

Thijs Lambik Van der Plas, Sanjay G. Manohar, Tim P. Vogels; 第1届终身学习智能体会议论文集, PMLR 199:518-531

深度水库计算中学习效率的基准测试

Hugo Cisneros, Tomas Mikolov, Josef Sivic; 第1届终身学习智能体会议论文集, PMLR 199:532-547

通过分布外回放的持续学习的多头模型

Gyuhak Kim, Bing Liu, Zixuan Ke; 第1届终身学习智能体会议论文集, PMLR 199:548-563

持续学习在恶意软件分类中的局限性

Mohammad Saidur Rahman, Scott Coull, Matthew Wright; 第1届终身学习智能体会议论文集, PMLR 199:564-582

多任务公平表示的内在局限性

Tosca Lechner, Shai Ben-David; 第1届终身学习智能体会议论文集, PMLR 199:583-603

我应该知道什么?在单一流的经验中,使用元梯度下降进行预测性特征发现

Alex Kearney, Anna Koop, Johannes Günther, Patrick M. Pilarski; 第1届终身学习智能体会议论文集, PMLR 199:604-616

用于持续学习的稀疏性和异构dropout,在神经网络激活的零空间中

Ali Abbasi, Parsa Nooralinejad, Vladimir Braverman, Hamed Pirsiavash, Soheil Kolouri; 第1届终身学习智能体会议论文集, PMLR 199:617-628

测试样本准确度与神经网络中训练样本密度的关系

Xu Ji, Razvan Pascanu, R. Devon Hjelm, Balaji Lakshminarayanan, Andrea Vedaldi; 第1届终身学习智能体会议论文集, PMLR 199:629-646

持续学习中知识迁移的理论

Diana Benavides-Prado, Patricia Riddle; 第1届终身学习智能体会议论文集, PMLR 199:647-660

用于动态泛化的仿真获取的潜在动作空间

Nicholas Corrado, Yuxiao Qu, Josiah P. Hanna; 第1届终身学习智能体会议论文集, PMLR 199:661-682

用于持续强化学习的自激活神经网络集成

Sam Powers, Eliot Xing, Abhinav Gupta; 第1届终身学习智能体会议论文集, PMLR 199:683-704

CORA:基准测试、基线和指标,作为持续强化学习智能体的平台

Sam Powers, Eliot Xing, Eric Kolve, Roozbeh Mottaghi, Abhinav Gupta; 第1届终身学习智能体会议论文集, PMLR 199:705-743

嵌入式设备的在线持续学习

Tyler L. Hayes, Christopher Kanan; 第1届终身学习智能体会议论文集, PMLR 199:744-766

Heat-RL:用于流时间序列异常检测的在线模型选择

Yujing Wang, Luoxin Xiong, Mingliang Zhang, Hui Xue, Qi Chen, Yaming Yang, Yunhai Tong, Congrui Huang, Bixiong Xu; 第1届终身学习智能体会议论文集, PMLR 199:767-777

终身DP:终身机器学习中一致受限的差分隐私

Phung Lai, Han Hu, Hai Phan, Ruoming Jin, My Thai, An Chen; 第1届终身学习智能体会议论文集, PMLR 199:778-797

神经网络蒸馏作为强化学习中状态表示的瓶颈

Valentin Guillet, Dennis George Wilson, Emmanuel Rachelson; 第1届终身学习智能体会议论文集, PMLR 199:798-818

二次正则化如何防止灾难性遗忘:插值的角色

Ekdeep Singh Lubana, Puja Trivedi, Danai Koutra, Robert Dick; 第1届终身学习智能体会议论文集, PMLR 199:819-837

通过保留经验的终身机器人强化学习

Annie Xie, Chelsea Finn; 第1届终身学习智能体会议论文集, PMLR 199:838-855

用于强化学习中技能迁移的层次启动

Michael Matthews, Mikayel Samvelyan, Jack Parker-holder, Edward Grefenstette, Tim Rocktäschel; 第1届终身学习智能体会议论文集, PMLR 199:856-874

基于增强的相似性学习的开放集识别

Sepideh Esmaeilpour, Lei Shu, Bing Liu; 第1届终身学习智能体会议论文集, PMLR 199:875-885

非平稳环境中的元梯度

Jelena Luketina, Sebastian Flennerhag, Yannick Schroecker, David Abel, Tom Zahavy, Satinder Singh; 第1届终身学习智能体会议论文集, PMLR 199:886-901

MO2:基于模型的离线选项

Sasha Salter, Markus Wulfmeier, Dhruva Tirumala, Nicolas Heess, Martin Riedmiller, Raia Hadsell, Dushyant Rao; 第1届终身学习智能体会议论文集, PMLR 199:902-919

突触巩固和经验回放之间的协同作用,用于通用的持续学习

Fahad Sarfraz, Elahe Arani, Bahram Zonooz; 第1届终身学习智能体会议论文集, PMLR 199:920-936

使用表示相似性引导的多任务特征共享来抑制任务干扰

Naresh Kumar Gurulingan,Elahe Arani,Bahram Zonooz; 终身学习代理人第一届会议论文集, PMLR 199:937-951

基于差分法的自监督预训练用于场景变化检测

Vijaya Raghavan T. Ramkumar,Elahe Arani,Bahram Zonooz; 终身学习代理人第一届会议论文集, PMLR 199:952-965

最优传输与噪声标签鲁棒损失和MixUp正则化在领域自适应中的应用

Kilian Fatras,Hiroki Naganuma,Ioannis Mitliagkas; 终身学习代理人第一届会议论文集, PMLR 199:966-981

CompoSuite:一种组合强化学习基准

Jorge A. Mendez,Marcel Hussing,Meghna Gummadi,Eric Eaton; 终身学习代理人第一届会议论文集, PMLR 199:982-1003

持续的新颖性检测

Rahaf Aljundi,Daniel Olmeda Reino,Nikolay Chumerin,Richard E. Turner; 终身学习代理人第一届会议论文集, PMLR 199:1004-1025

InBiaseD:通过形状感知改进泛化和鲁棒性的归纳偏置蒸馏

Shruthi Gowda,Bahram Zonooz,Elahe Arani; 终身学习代理人第一届会议论文集, PMLR 199:1026-1042

基于梯度空间降维的少样本学习

Martin Gauch,Maximilian Beck,Thomas Adler,Dmytro Kotsur,Stefan Fiel,Hamid Eghbal-zadeh,Johannes Brandstetter,Johannes Kofler,Markus Holzleitner,Werner Zellinger,Daniel Klotz,Sepp Hochreiter,Sebastian Lehner; 终身学习代理人第一届会议论文集, PMLR 199:1043-1064

SHELS:用于新颖性检测和无类别边界的持续学习的独占特征集

Meghna Gummadi,David Kent,Jorge A. Mendez,Eric Eaton; 终身学习代理人第一届会议论文集, PMLR 199:1065-1085

CNN架构的可信度评估和可信度感知设计

Mingxi Cheng,Tingyang Sun,Shahin Nazarian,Paul Bogdan; 终身学习代理人第一届会议论文集, PMLR 199:1086-1102

将预训练语言模型适应于低资源文本简化:路径很重要

Cristina Garbacea,Qiaozhu Mei; 终身学习代理人第一届会议论文集, PMLR 199:1103-1119

用于终身强化学习的无模型生成重放:应用于星际争霸2

Zachary Alan Daniels,Aswin Raghavan,Jesse Hostetler,Abrar Rahman,Indranil Sur,Michael Piacentino,Ajay Divakaran,Roberto Corizzo,Kamil Faber,Nathalie Japkowicz,Michael Baron,James Smith,Sahana Pramod Joshi,Zsolt Kira,Cameron Ethan Taylor,Mustafa Burak Gurbuz,Constantine Dovrolis,Tyler L. Hayes,Christopher Kanan,Jhair Gallardo; 终身学习代理人第一届会议论文集, PMLR 199:1120-1145

在线模仿学习的改进策略优化

Jonathan Wilder Lavington,Sharan Vaswani,Mark Schmidt; 终身学习代理人第一届会议论文集, PMLR 199:1146-1173

学习在价值相关特征上多样化的技能

Matthew J. A. Smith,Jelena Luketina,Kristian Hartikainen,Maximilian Igl,Shimon Whiteson; 终身学习代理人第一届会议论文集, PMLR 199:1174-1194

一致性是进一步减轻持续学习中灾难性遗忘的关键

Prashant Shivaram Bhat,Bahram Zonooz,Elahe Arani; 终身学习代理人第一届会议论文集, PMLR 199:1195-1212

Sim-To-Real迁移的视觉定位用于人类辅助的歧义消除

Georgios Tziafas,Lambert Schomaker,Hamidreza Kasaei; 终身学习代理人第一届会议论文集, PMLR 199:1213-1230

在深度强化学习中探测迁移,无需任务工程

Andrei Alex Rusu,Sebastian Flennerhag,Dushyant Rao,Razvan Pascanu,Raia Hadsell; 终身学习代理人第一届会议论文集, PMLR 199:1231-1254

订阅 通过RSS