[编辑]
第232卷:终身学习智能体会议,2023年8月22日至25日,麦吉尔大学,魁北克省蒙特利尔市,加拿大
[编辑]
编辑:Sarath Chandar、Razvan Pascanu、Hanie Sedghi、Doina Precup
[bib][citeproc]
EMO:用于少样本元学习的经验记忆优化
杜英俊,沈嘉毅,甄显桐,Cees G.M. Snoek; 终身学习智能体第二届会议论文集, PMLR 232:1-20
[摘要][下载 PDF]
用于适应深度模型强化学习中局部环境变化的局部遗忘回放缓冲区
Ali Rahimi-Kalahroudi,Janarthanan Rajendran,Ida Momennejad,Harm van Seijen,Sarath Chandar; 终身学习智能体第二届会议论文集, PMLR 232:21-42
[摘要][下载 PDF]
挑战灾难性遗忘和知识积累的常见假设
Timothée Lesort,Oleksiy Ostapenko,Pau Rodríguez,Diganta Misra,Md Rifat Arefin,Laurent Charlin,Irina Rish; 终身学习智能体第二届会议论文集, PMLR 232:43-65
[摘要][下载 PDF]
用于高效在线基数优化器的差分隐私算法
Kushagra Chandak,Bingshan Hu,Nidhi Hegde; 终身学习智能体第二届会议论文集, PMLR 232:66-88
[摘要][下载 PDF]
任务无关的持续强化学习:获得洞察力和克服挑战
Massimo Caccia,Jonas Mueller,Taesup Kim,Laurent Charlin,Rasool Fakoor; 终身学习智能体第二届会议论文集, PMLR 232:89-119
[摘要][下载 PDF]
作为成功检测器的视觉-语言模型
Yuqing Du,Ksenia Konyushkova,Misha Denil,Akhil Raju,Jessica Landon,Felix Hill,Nando de Freitas,Serkan Cabi; 终身学习智能体第二届会议论文集, PMLR 232:120-136
[摘要][下载 PDF]
多智能体环境中的自发强化学习
Eleni Nisioti,Elias Masquil,Gautier Hamon,Clément Moulin-Frier; 终身学习智能体第二届会议论文集, PMLR 232:137-161
[摘要][下载 PDF]
使用分层分类对分布外数据进行细粒度推理
Randolph Linderman,Jingyang Zhang,Nathan Inkawhich,Hai Li,Yiran Chen; 终身学习智能体第二届会议论文集, PMLR 232:162-183
[摘要][下载 PDF]
世界模型对持续强化学习的有效性
Samuel Kessler,Mateusz Ostaszewski,MichałPaweł Bortkiewicz,Mateusz Żarski,Maciej Wolczyk,Jack Parker-Holder,Stephen J. Roberts,Piotr Mi\loś; 终身学习智能体第二届会议论文集, PMLR 232:184-204
[摘要][下载 PDF]
用大型语言模型增强自发智能体
Cédric Colas,Laetitia Teodorescu,Pierre-Yves Oudeyer,Xingdi Yuan,Marc-Alexandre Côté; 终身学习智能体第二届会议论文集, PMLR 232:205-226
[摘要][下载 PDF]
基于运动先验的轨迹预测中的单源域泛化:一种方法
Renhao Huang,Anthony Tompkins,Maurice Pagnucco,Yang Song; 终身学习智能体第二届会议论文集, PMLR 232:227-243
[摘要][下载 PDF]
RaSP:用于弱监督增量分割的关系感知语义先验
Subhankar Roy,Riccardo Volpi,Gabriela Csurka,Diane Larlus; 终身学习智能体第二届会议论文集, PMLR 232:244-269
[摘要][下载 PDF]
使用学习的对抗者稳定无监督环境设计
Ishita Mediratta,Minqi Jiang,Jack Parker-Holder,Michael Dennis,Eugene Vinitsky,Tim Rocktäschel; 终身学习智能体第二届会议论文集, PMLR 232:270-291
[摘要][下载 PDF]
用于多智能体强化学习中智能体元表征的学习
Shenao Zhang,Li Shen,Lei Han,Li Shen; 终身学习智能体第二届会议论文集, PMLR 232:292-317
[摘要][下载 PDF]
用于持续学习的部分超网络
Hamed Hemati,Vincenzo Lomonaco,Davide Bacciu,Damian Borth; 终身学习智能体第二届会议论文集, PMLR 232:318-336
[摘要][下载 PDF]
用于厌恶性持续学习的人类归纳偏见——分层贝叶斯非参数模型
Sashank Pisupati,Isabel M Berwian,Jamie Chiu,Yongjing Ren,Yael Niv; 终身学习智能体第二届会议论文集, PMLR 232:337-346
[摘要][下载 PDF]
前瞻学习:原则性的未来外推
Ashwin De Silva,Rahul Ramesh,Lyle Ungar,Marshall Hussain Shuler,Noah J. Cowan,Michael Platt,Chen Li,Leyla Isik,Seung-Eon Roh,Adam Charles,Archana Venkataraman,Brian Caffo,Javier J. How,Justus M Kebschull,John W. Krakauer,Maxim Bichuch,Kaleab Alemayehu Kinfu,Eva Yezerets,Dinesh Jayaraman,Jong M. Shin,Soledad Villar,Ian Phillips,Carey E. Priebe,Thomas Hartung,Michael I. Miller,Jayanta Dey,Ningyuan Huang,Eric Eaton,Ralph Etienne-Cummings,Elizabeth L. Ogburn,Randal Burns,Onyema Osuagwu,Brett Mensh,Alysson R. Muotri,Julia Brown,Chris White,Weiwei Yang,Andrei A. Rusu Timothy Verstynen,Konrad P. Kording,Pratik Chaudhari,Joshua T. Vogelstein; 终身学习智能体第二届会议论文集, PMLR 232:347-357
[摘要][下载 PDF]
用于双层规划的具身主动学习关系状态抽象
Amber Li,Tom Silver; 终身学习智能体第二届会议论文集, PMLR 232:358-375
[摘要][下载 PDF]
通过多时间尺度学习处理去中心化协同多智能体深度强化学习中的非平稳性
Hadi Nekoei, Akilesh Badrinaaraayanan, Amit Sinha, Mohammad Amini, Janarthanan Rajendran, Aditya Mahajan, Sarath Chandar; 第二届终身学习智能体会议论文集, PMLR 232:376-398
[abs][下载 PDF]
PlaStIL:可塑且稳定的无示例类增量学习
Grégoire Petit, Adrian Popescu, Eden Belouadah, David Picard, Bertrand Delezoide; 第二届终身学习智能体会议论文集, PMLR 232:399-414
[abs][下载 PDF]
部分索引跟踪:一种元学习方法
Yongxin Yang, Timothy Hospedales; 第二届终身学习智能体会议论文集, PMLR 232:415-436
[abs][下载 PDF]
具有重复的类增量学习
Hamed Hemati, Andrea Cossu, Antonio Carta, Julio Hurtado, Lorenzo Pellegrini, Davide Bacciu, Vincenzo Lomonaco, Damian Borth; 第二届终身学习智能体会议论文集, PMLR 232:437-455
[abs][下载 PDF]
使用参数高效微调减少联邦学习中预训练语言模型的通信开销
Shubham Malaviya, Manish Shukla, Sachin Lodha; 第二届终身学习智能体会议论文集, PMLR 232:456-469
[abs][下载 PDF]
时间与时间抽象在持续学习中的权衡、类比和主动测量环境中的遗憾
Vincent Létourneau, Colin Bellinger, Isaac Tamblyn, Maia Fraser; 第二届终身学习智能体会议论文集, PMLR 232:470-480
[abs][下载 PDF]
用于半监督跨域小样本学习的自训练质心分类器
Hongyu Wang, Eibe Frank, Bernhard Pfahringer, Geoffrey Holmes; 第二届终身学习智能体会议论文集, PMLR 232:481-492
[abs][下载 PDF]
在家庭机器人上评估持续学习
Sam Powers, Abhinav Gupta, Chris Paxton; 第二届终身学习智能体会议论文集, PMLR 232:493-512
[abs][下载 PDF]
基于正则化的持续学习的固定设计分析
Haoran Li, Jingfeng Wu, Vladimir Braverman; 第二届终身学习智能体会议论文集, PMLR 232:513-533
[abs][下载 PDF]
大规模持续学习表示
Alexandre Galashov, Jovana Mitrovic, Dhruva Tirumala, Yee Whye Teh, Timothy Nguyen, Arslan Chaudhry, Razvan Pascanu; 第二届终身学习智能体会议论文集, PMLR 232:534-547
[abs][下载 PDF]
用于可扩展和鲁棒的终身强化学习规划的最小价值等效部分模型
Safa Alver, Doina Precup; 第二届终身学习智能体会议论文集, PMLR 232:548-567
[abs][下载 PDF]
马尔可夫决策过程的分层表示学习
Lorenzo Steccanella, Simone Totaro, Anders Jonsson; 第二届终身学习智能体会议论文集, PMLR 232:568-585
[abs][下载 PDF]
MultiMix TFT:具有时间融合Transformer的多任务混合频率框架
Boje Deforce, Bart Baesens, Jan Diels, Estefanía Serral Asensio; 第二届终身学习智能体会议论文集, PMLR 232:586-600
[abs][下载 PDF]
视觉Transformer微调期间会发生什么:基于不变性的研究
Gabriele Merlin, Vedant Nanda, Ruchit Rawal, Mariya Toneva; 第二届终身学习智能体会议论文集, PMLR 232:601-619
[abs][下载 PDF]
持续深度强化学习中的可塑性丧失
Zaheer Abbas, Rosie Zhao, Joseph Modayil, Adam White, Marlos C. Machado; 第二届终身学习智能体会议论文集, PMLR 232:620-636
[abs][下载 PDF]
高效学习新视觉概念
Sarthak Bhagat, Simon Stepputtis, Joseph Campbell, Katia Sycara; 第二届终身学习智能体会议论文集, PMLR 232:637-657
[abs][下载 PDF]
VIBR:学习用于鲁棒视觉控制的视角不变价值函数
Tom Dupuis, Jaonary Rabarisoa, Quoc-Cuong Pham, David Filliat; 第二届终身学习智能体会议论文集, PMLR 232:658-682
[abs][下载 PDF]
演化图上的增量无监督领域自适应
Hsing-Huan Chung, Joydeep Ghosh; 第二届终身学习智能体会议论文集, PMLR 232:683-702
[abs][下载 PDF]
通过生成和测试发现辅助任务
Banafsheh Rafiee, Sina Ghiassian, Jun Jin, Richard Sutton, Jun Luo, Adam White; 第二届终身学习智能体会议论文集, PMLR 232:703-714
[abs][下载 PDF]
用于非平稳马尔可夫决策过程的重启贝叶斯在线变化点检测
Reda Alami, Mohammed Mahfoud, Eric Moulines; 第二届终身学习智能体会议论文集, PMLR 232:715-744
[abs][下载 PDF]
用于离策略强化学习的价值感知重要性加权
Kristopher De Asis, Eric Graves, Richard S. Sutton; 第二届终身学习智能体会议论文集, PMLR 232:745-763
[abs][下载 PDF]
用于联邦学习的重加权softmax交叉熵以控制遗忘
Gwen Legate, Lucas Caccia, Eugene Belilovsky; 第二届终身学习智能体会议论文集, PMLR 232:764-780
[abs][下载 PDF]
测量和减轻强化学习中的干扰
Vincent Liu, Han Wang, Ruo Yu Tao, Khurram Javed, Adam White, Martha White; 第二届终身学习智能体会议论文集, PMLR 232:781-795
[abs][下载 PDF]
基于数据依赖型PAC-Bayes界限的自适应元学习
Lior Friedman, Ron Meir; 第二届终身学习智能体会议论文集, PMLR 232:796-810
[abs][下载 PDF]
用于小样本类增量学习的主动类选择
Christopher McClurg, Ali Ayub, Harsh Tyagi, Sarah M. Rajtmajer, Alan R. Wagner; 第二届终身学习智能体会议论文集, PMLR 232:811-827
[abs][下载 PDF]
使用时间集成提高在线持续学习性能和稳定性
Albin Soutif–Cormerais, Antonio Carta, Joost van de Weijer; 第二届终身学习智能体会议论文集, PMLR 232:828-845
[abs][下载 PDF]
基于模型的元自动课程学习
徐子凡, 张玉麟, Shahaf S. Shperberg, Reuth Mirsky, 姜宇谦, 刘博, Peter Stone; 终身学习智能体第二届会议论文集, PMLR 232:846-860
[摘要][下载PDF]
面向少样本协调:重新审视Hanabi游戏中的临时团队合作挑战
Hadi Nekoei, 赵旭彤, Janarthanan Rajendran, 刘淼, Sarath Chandar; 终身学习智能体第二届会议论文集, PMLR 232:861-877
[摘要][下载PDF]
比较微调和元学习在少样本策略模仿中的有效性
Massimiliano Patacchiola, 孙明飞, Katja Hofmann, Richard E. Turner; 终身学习智能体第二届会议论文集, PMLR 232:878-908
[摘要][下载PDF]
用平衡邻域和集体损失替代数据标注,用于多标签文本分类
Muberra Ozmen, Joseph Cotnareanu, Mark Coates; 终身学习智能体第二届会议论文集, PMLR 232:909-922
[摘要][下载PDF]
I2I:用即兴知识初始化适配器
Tejas Srinivasan, 贾芙蓉, Mohammad Rostami, Jesse Thomason; 终身学习智能体第二届会议论文集, PMLR 232:923-935
[摘要][下载PDF]
通过调制掩码共享终身强化学习知识
Saptarshi Nath, Christos Peridis, Eseoghene Ben-Iwhiwhu, Xinran Liu, Shirin Dora, Cong Liu, Soheil Kolouri, Andrea Soltoggio; 终身学习智能体第二届会议论文集, PMLR 232:936-960
[摘要][下载PDF]
超越单个模型的终身学习
Thang Doan, Seyed Iman Mirzadeh, Mehrdad Farajtabar; 终身学习智能体第二届会议论文集, PMLR 232:961-991
[摘要][下载PDF]
使用受生物启发架构改进持续学习任务的性能
Sandeep Madireddy, Angel Yanguas-Gil, Prasanna Balaprakash; 终身学习智能体第二届会议论文集, PMLR 232:992-1008
[摘要][下载PDF]
使用最优传输的领域自适应的简约方法
Arip Asadulaev, Vitaly Shutov, Alexander Korotin, Alexander Panfilov, Vladislava Kontsevaya, Andrey Filchenkov; 终身学习智能体第二届会议论文集, PMLR 232:1009-1024
[摘要][下载PDF]
用于从流数据学习神经网络的低秩扩展卡尔曼滤波
Peter G. Chang, Gerardo Durán-Martín, Alex Shestopaloff, Matt Jones, Kevin Patrick Murphy; 终身学习智能体第二届会议论文集, PMLR 232:1025-1071
[摘要][下载PDF]
用于可解释迁移学习的内省行动建议
Joseph Campbell, Yue Guo, Fiona Xie, Simon Stepputtis, Katia Sycara; 终身学习智能体第二届会议论文集, PMLR 232:1072-1090
[摘要][下载PDF]
SF-FSDA:具有高效标注数据工厂的源自由少样本领域自适应目标检测
Han Sun, Rui Gong, Konrad Schindler, Luc Van Gool; 终身学习智能体第二届会议论文集, PMLR 232:1091-1111
[摘要][下载PDF]