[编辑]
第199卷:终身学习智能体会议,2022年8月22日至24日,加拿大魁北克省蒙特利尔麦吉尔大学
[编辑]
编辑:Sarath Chandar、Razvan Pascanu、Doina Precup
[bib][citeproc]
用于持续学习的基于能量的模型
Shuang Li、Yilun Du、Gido van de Ven、Igor Mordatch; 第一届终身学习智能体会议论文集, PMLR 199:1-22
[摘要][下载 PDF]
任务景观如何影响 MAML 性能?
Liam Collins、Aryan Mokhtari、Sanjay Shakkottai; 第一届终身学习智能体会议论文集, PMLR 199:23-59
[摘要][下载 PDF]
使用基础模型进行持续学习:基于潜在重放的实证研究
Oleksiy Ostapenko、Timothee Lesort、Pau Rodriguez、Md Rifat Arefin、Arthur Douillard、Irina Rish、Laurent Charlin; 第一届终身学习智能体会议论文集, PMLR 199:60-91
[摘要][下载 PDF]
EFL:非独立同分布数据上的弹性联邦学习
Zichen Ma、Yu Lu、Wenye Li、Shuguang Cui; 第一届终身学习智能体会议论文集, PMLR 199:92-115
[摘要][下载 PDF]
在相关性偏移下进行解纠缠和泛化
Christina M. Funke、Paul Vicol、Kuan-chieh Wang、Matthias Kuemmerer、Richard Zemel、Matthias Bethge; 第一届终身学习智能体会议论文集, PMLR 199:116-141
[摘要][下载 PDF]
学习优化器中内存、计算和性能之间的实际权衡
Luke Metz、C. Daniel Freeman、James Harrison、Niru Maheswaranathan、Jascha Sohl-dickstein; 第一届终身学习智能体会议论文集, PMLR 199:142-164
[摘要][下载 PDF]
宏观尺度上的随时学习
Lucas Caccia、Jing Xu、Myle Ott、Marcaurelio Ranzato、Ludovic Denoyer; 第一届终身学习智能体会议论文集, PMLR 199:165-182
[摘要][下载 PDF]
使用深度网络进行持续无监督学习的光流估计
Simone Marullo、Matteo Tiezzi、Alessandro Betti、Lapo Faggi、Enrico Meloni、Stefano Melacci; 第一届终身学习智能体会议论文集, PMLR 199:183-200
[摘要][下载 PDF]
通过哈密顿方程进行持续学习
Alessandro Betti、Lapo Faggi、Marco Gori、Matteo Tiezzi、Simone Marullo、Enrico Meloni、Stefano Melacci; 第一届终身学习智能体会议论文集, PMLR 199:201-212
[摘要][下载 PDF]
使用基于激活的提前停止改进元学习泛化
Simon Guiroy、Christopher Pal、Goncalo Mordido、Sarath Chandar; 第一届终身学习智能体会议论文集, PMLR 199:213-230
[摘要][下载 PDF]
基于规则的盾牌:从灾难性动作效应中积累安全规则
Shahaf S. Shperberg、Bo Liu、Alessandro Allievi、Peter Stone; 第一届终身学习智能体会议论文集, PMLR 199:231-242
[摘要][下载 PDF]
持续学习和隐私保护的取消学习
Bo Liu、Qiang Liu、Peter Stone; 第一届终身学习智能体会议论文集, PMLR 199:243-254
[摘要][下载 PDF]
克服利用 GAN 进行小样本数据增强的挑战
Christopher Beckham、Issam H. Laradji、Pau Rodriguez、David Vazquez、Derek Nowrouzezahrai、Christopher Pal; 第一届终身学习智能体会议论文集, PMLR 199:255-280
[摘要][下载 PDF]
提高无监督视觉领域自适应的模型泛化能力
Mohammad Rostami; 第一届终身学习智能体会议论文集, PMLR 199:281-293
[摘要][下载 PDF]
使用离策略数据进行机器人终身学习中的遗忘和不平衡
Wenxuan Zhou、Steven Bohez、Jan Humplik、Nicolas Heess、Abbas Abdolmaleki、Dushyant Rao、Markus Wulfmeier、Tuomas Haarnoja; 第一届终身学习智能体会议论文集, PMLR 199:294-309
[摘要][下载 PDF]
无限非平稳聚类的流式推理
Rylan Schaeffer、Gabrielle Kaili-may Liu、Yilun Du、Scott Linderman、Ila R. Fiete; 第一届终身学习智能体会议论文集, PMLR 199:310-326
[摘要][下载 PDF]
经验不足的 RL 智能体无法做到:有限样本复杂度下的后悔下界
Maia Fraser、Vincent Létourneau; 第一届终身学习智能体会议论文集, PMLR 199:327-334
[摘要][下载 PDF]
使用竞争联邦储层计算进行动态系统的持续学习
Leonard Bereska、Efstratios Gavves; 第一届终身学习智能体会议论文集, PMLR 199:335-350
[摘要][下载 PDF]
使用图神经网络学习以对象为中心的自发行为
Ahmed Akakzia、Olivier Sigaud; 第一届终身学习智能体会议论文集, PMLR 199:351-365
[摘要][下载 PDF]
TAG:基于任务的累积梯度用于终身学习
Pranshu Malviya、Balaraman Ravindran、Sarath Chandar; 第一届终身学习智能体会议论文集, PMLR 199:366-389
[摘要][下载 PDF]
任务无关表示巩固:一种基于自监督的持续学习方法
Prashant Shivaram Bhat、Bahram Zonooz、Elahe Arani; 第一届终身学习智能体会议论文集, PMLR 199:390-405
[摘要][下载 PDF]
用于强化学习的 Zipfian 环境
Stephanie C.Y. Chan、Andrew Kyle Lampinen、Pierre Harvey Richemond、Felix Hill; 第一届终身学习智能体会议论文集, PMLR 199:406-429
[摘要][下载 PDF]
CLActive:用于快速主动学习的剧集记忆
Sri Aurobindo Munagala、Sidhant Subramanian、Shyamgopal Karthik、Ameya Prabhu、Anoop Namboodiri; 第一届终身学习智能体会议论文集, PMLR 199:430-440
[abs][下载 PDF]
应对终身强化学习中非平稳性的反应式探索
Christian Alexander Steinparz, Thomas Schmied, Fabian Paischer, Marius-constantin Dinu, Vihang Prakash Patil, Angela Bitto-nemling, Hamid Eghbal-zadeh, Sepp Hochreiter; 第1届终身学习智能体会议论文集, PMLR 199:441-469
[abs][下载 PDF]
离线强化学习的视角
Kajetan Schweighofer, Marius-constantin Dinu, Andreas Radler, Markus Hofmarcher, Vihang Prakash Patil, Angela Bitto-nemling, Hamid Eghbal-zadeh, Sepp Hochreiter; 第1届终身学习智能体会议论文集, PMLR 199:470-517
[abs][下载 PDF]
预测学习使神经网络能够学习复杂的运行记忆任务
Thijs Lambik Van der Plas, Sanjay G. Manohar, Tim P. Vogels; 第1届终身学习智能体会议论文集, PMLR 199:518-531
[abs][下载 PDF]
深度水库计算中学习效率的基准测试
Hugo Cisneros, Tomas Mikolov, Josef Sivic; 第1届终身学习智能体会议论文集, PMLR 199:532-547
[abs][下载 PDF]
通过分布外回放的持续学习的多头模型
Gyuhak Kim, Bing Liu, Zixuan Ke; 第1届终身学习智能体会议论文集, PMLR 199:548-563
[abs][下载 PDF]
持续学习在恶意软件分类中的局限性
Mohammad Saidur Rahman, Scott Coull, Matthew Wright; 第1届终身学习智能体会议论文集, PMLR 199:564-582
[abs][下载 PDF]
多任务公平表示的内在局限性
Tosca Lechner, Shai Ben-David; 第1届终身学习智能体会议论文集, PMLR 199:583-603
[abs][下载 PDF]
我应该知道什么?在单一流的经验中,使用元梯度下降进行预测性特征发现
Alex Kearney, Anna Koop, Johannes Günther, Patrick M. Pilarski; 第1届终身学习智能体会议论文集, PMLR 199:604-616
[abs][下载 PDF]
用于持续学习的稀疏性和异构dropout,在神经网络激活的零空间中
Ali Abbasi, Parsa Nooralinejad, Vladimir Braverman, Hamed Pirsiavash, Soheil Kolouri; 第1届终身学习智能体会议论文集, PMLR 199:617-628
[abs][下载 PDF]
测试样本准确度与神经网络中训练样本密度的关系
Xu Ji, Razvan Pascanu, R. Devon Hjelm, Balaji Lakshminarayanan, Andrea Vedaldi; 第1届终身学习智能体会议论文集, PMLR 199:629-646
[abs][下载 PDF]
持续学习中知识迁移的理论
Diana Benavides-Prado, Patricia Riddle; 第1届终身学习智能体会议论文集, PMLR 199:647-660
[abs][下载 PDF]
用于动态泛化的仿真获取的潜在动作空间
Nicholas Corrado, Yuxiao Qu, Josiah P. Hanna; 第1届终身学习智能体会议论文集, PMLR 199:661-682
[abs][下载 PDF]
用于持续强化学习的自激活神经网络集成
Sam Powers, Eliot Xing, Abhinav Gupta; 第1届终身学习智能体会议论文集, PMLR 199:683-704
[abs][下载 PDF]
CORA:基准测试、基线和指标,作为持续强化学习智能体的平台
Sam Powers, Eliot Xing, Eric Kolve, Roozbeh Mottaghi, Abhinav Gupta; 第1届终身学习智能体会议论文集, PMLR 199:705-743
[abs][下载 PDF]
嵌入式设备的在线持续学习
Tyler L. Hayes, Christopher Kanan; 第1届终身学习智能体会议论文集, PMLR 199:744-766
[abs][下载 PDF]
Heat-RL:用于流时间序列异常检测的在线模型选择
Yujing Wang, Luoxin Xiong, Mingliang Zhang, Hui Xue, Qi Chen, Yaming Yang, Yunhai Tong, Congrui Huang, Bixiong Xu; 第1届终身学习智能体会议论文集, PMLR 199:767-777
[abs][下载 PDF]
终身DP:终身机器学习中一致受限的差分隐私
Phung Lai, Han Hu, Hai Phan, Ruoming Jin, My Thai, An Chen; 第1届终身学习智能体会议论文集, PMLR 199:778-797
[abs][下载 PDF]
神经网络蒸馏作为强化学习中状态表示的瓶颈
Valentin Guillet, Dennis George Wilson, Emmanuel Rachelson; 第1届终身学习智能体会议论文集, PMLR 199:798-818
[abs][下载 PDF]
二次正则化如何防止灾难性遗忘:插值的角色
Ekdeep Singh Lubana, Puja Trivedi, Danai Koutra, Robert Dick; 第1届终身学习智能体会议论文集, PMLR 199:819-837
[abs][下载 PDF]
通过保留经验的终身机器人强化学习
Annie Xie, Chelsea Finn; 第1届终身学习智能体会议论文集, PMLR 199:838-855
[abs][下载 PDF]
用于强化学习中技能迁移的层次启动
Michael Matthews, Mikayel Samvelyan, Jack Parker-holder, Edward Grefenstette, Tim Rocktäschel; 第1届终身学习智能体会议论文集, PMLR 199:856-874
[abs][下载 PDF]
基于增强的相似性学习的开放集识别
Sepideh Esmaeilpour, Lei Shu, Bing Liu; 第1届终身学习智能体会议论文集, PMLR 199:875-885
[abs][下载 PDF]
非平稳环境中的元梯度
Jelena Luketina, Sebastian Flennerhag, Yannick Schroecker, David Abel, Tom Zahavy, Satinder Singh; 第1届终身学习智能体会议论文集, PMLR 199:886-901
[abs][下载 PDF]
MO2:基于模型的离线选项
Sasha Salter, Markus Wulfmeier, Dhruva Tirumala, Nicolas Heess, Martin Riedmiller, Raia Hadsell, Dushyant Rao; 第1届终身学习智能体会议论文集, PMLR 199:902-919
[abs][下载 PDF]
突触巩固和经验回放之间的协同作用,用于通用的持续学习
Fahad Sarfraz, Elahe Arani, Bahram Zonooz; 第1届终身学习智能体会议论文集, PMLR 199:920-936
[abs][下载 PDF]
使用表示相似性引导的多任务特征共享来抑制任务干扰
Naresh Kumar Gurulingan,Elahe Arani,Bahram Zonooz; 终身学习代理人第一届会议论文集, PMLR 199:937-951
[abs][下载PDF]
基于差分法的自监督预训练用于场景变化检测
Vijaya Raghavan T. Ramkumar,Elahe Arani,Bahram Zonooz; 终身学习代理人第一届会议论文集, PMLR 199:952-965
[abs][下载PDF]
最优传输与噪声标签鲁棒损失和MixUp正则化在领域自适应中的应用
Kilian Fatras,Hiroki Naganuma,Ioannis Mitliagkas; 终身学习代理人第一届会议论文集, PMLR 199:966-981
[abs][下载PDF]
CompoSuite:一种组合强化学习基准
Jorge A. Mendez,Marcel Hussing,Meghna Gummadi,Eric Eaton; 终身学习代理人第一届会议论文集, PMLR 199:982-1003
[abs][下载PDF]
持续的新颖性检测
Rahaf Aljundi,Daniel Olmeda Reino,Nikolay Chumerin,Richard E. Turner; 终身学习代理人第一届会议论文集, PMLR 199:1004-1025
[abs][下载PDF]
InBiaseD:通过形状感知改进泛化和鲁棒性的归纳偏置蒸馏
Shruthi Gowda,Bahram Zonooz,Elahe Arani; 终身学习代理人第一届会议论文集, PMLR 199:1026-1042
[abs][下载PDF]
基于梯度空间降维的少样本学习
Martin Gauch,Maximilian Beck,Thomas Adler,Dmytro Kotsur,Stefan Fiel,Hamid Eghbal-zadeh,Johannes Brandstetter,Johannes Kofler,Markus Holzleitner,Werner Zellinger,Daniel Klotz,Sepp Hochreiter,Sebastian Lehner; 终身学习代理人第一届会议论文集, PMLR 199:1043-1064
[abs][下载PDF]
SHELS:用于新颖性检测和无类别边界的持续学习的独占特征集
Meghna Gummadi,David Kent,Jorge A. Mendez,Eric Eaton; 终身学习代理人第一届会议论文集, PMLR 199:1065-1085
[abs][下载PDF]
CNN架构的可信度评估和可信度感知设计
Mingxi Cheng,Tingyang Sun,Shahin Nazarian,Paul Bogdan; 终身学习代理人第一届会议论文集, PMLR 199:1086-1102
[abs][下载PDF]
将预训练语言模型适应于低资源文本简化:路径很重要
Cristina Garbacea,Qiaozhu Mei; 终身学习代理人第一届会议论文集, PMLR 199:1103-1119
[abs][下载PDF]
用于终身强化学习的无模型生成重放:应用于星际争霸2
Zachary Alan Daniels,Aswin Raghavan,Jesse Hostetler,Abrar Rahman,Indranil Sur,Michael Piacentino,Ajay Divakaran,Roberto Corizzo,Kamil Faber,Nathalie Japkowicz,Michael Baron,James Smith,Sahana Pramod Joshi,Zsolt Kira,Cameron Ethan Taylor,Mustafa Burak Gurbuz,Constantine Dovrolis,Tyler L. Hayes,Christopher Kanan,Jhair Gallardo; 终身学习代理人第一届会议论文集, PMLR 199:1120-1145
[abs][下载PDF]
在线模仿学习的改进策略优化
Jonathan Wilder Lavington,Sharan Vaswani,Mark Schmidt; 终身学习代理人第一届会议论文集, PMLR 199:1146-1173
[abs][下载PDF]
学习在价值相关特征上多样化的技能
Matthew J. A. Smith,Jelena Luketina,Kristian Hartikainen,Maximilian Igl,Shimon Whiteson; 终身学习代理人第一届会议论文集, PMLR 199:1174-1194
[abs][下载PDF]
一致性是进一步减轻持续学习中灾难性遗忘的关键
Prashant Shivaram Bhat,Bahram Zonooz,Elahe Arani; 终身学习代理人第一届会议论文集, PMLR 199:1195-1212
[abs][下载PDF]
Sim-To-Real迁移的视觉定位用于人类辅助的歧义消除
Georgios Tziafas,Lambert Schomaker,Hamidreza Kasaei; 终身学习代理人第一届会议论文集, PMLR 199:1213-1230
[abs][下载PDF]
在深度强化学习中探测迁移,无需任务工程
Andrei Alex Rusu,Sebastian Flennerhag,Dushyant Rao,Razvan Pascanu,Raia Hadsell; 终身学习代理人第一届会议论文集, PMLR 199:1231-1254
[abs][下载PDF]