[编辑]
第211卷:动力学与控制学习年会,2023年6月15-16日,宾夕法尼亚州费城
[编辑]
编辑:Nikolai Matni、Manfred Morari、George J. Pappas
[bib][citeproc]
流形上的学习:使用几何可控性条件进行神经常微分方程的通用逼近属性
Karthik Elamvazhuthi、Xuechen Zhang、Samet Oymak、Fabio Pasqualetti; 第五届动力学与控制学习年会会议论文集, PMLR 211:1-11
[摘要][下载 PDF][OpenReview]
具有神经网络控制器的非线性动力系统的区间可达性
Saber Jafarpour、Akash Harapanahalli、Samuel Coogan; 第五届动力学与控制学习年会会议论文集, PMLR 211:12-25
[摘要][下载 PDF][OpenReview]
基于物理信息的模型强化学习
Adithya Ramesh、Balaraman Ravindran; 第五届动力学与控制学习年会会议论文集, PMLR 211:26-37
[摘要][下载 PDF][OpenReview]
学习引导随机搜索的学习:流形上的无导数元黑盒优化
Bilgehan Sel、Ahmad Tawaha、Yuhao Ding、Ruoxi Jia、Bo Ji、Javad Lavaei、Ming Jin; 第五届动力学与控制学习年会会议论文集, PMLR 211:38-50
[摘要][下载 PDF][OpenReview]
直接潜在模型学习能否解决线性二次高斯控制问题?
Yi Tian、Kaiqing Zhang、Russ Tedrake、Suvrit Sra; 第五届动力学与控制学习年会会议论文集, PMLR 211:51-63
[摘要][下载 PDF][OpenReview]
针对连续 $SE(3)$ 轨迹的活动目标跟踪策略学习
Pengzhi Yang、Shumon Koga、Arash Asgharivaskasi、Nikolay Atanasov; 第五届动力学与控制学习年会会议论文集, PMLR 211:64-75
[摘要][下载 PDF][OpenReview]
神经符号模型对自然约束的保证性符合
Kaustubh Sridhar、Souradeep Dutta、James Weimer、Insup Lee; 第五届动力学与控制学习年会会议论文集, PMLR 211:76-89
[摘要][下载 PDF][OpenReview]
ISAACS:用于安全的迭代软对抗演员-评论家
Kai-Chieh Hsu、Duy Phuong Nguyen、Jaime Fernàndez Fisac; 第五届动力学与控制学习年会会议论文集, PMLR 211:90-103
[摘要][下载 PDF][OpenReview]
使用基于扰动观测器的控制屏障函数进行安全高效的强化学习
Yikun Cheng、Pan Zhao、Naira Hovakimyan; 第五届动力学与控制学习年会会议论文集, PMLR 211:104-115
[摘要][下载 PDF][OpenReview]
学习自治非线性延迟系统的动力学
Xunbi Ji、Gabor Orosz; 第五届动力学与控制学习年会会议论文集, PMLR 211:116-127
[摘要][下载 PDF][OpenReview]
改进具有接触的微分物理模拟的梯度计算
Yaofeng Desmond Zhong、Jiequn Han、Biswadip Dey、Georgia Olympia Brikis; 第五届动力学与控制学习年会会议论文集, PMLR 211:128-141
[摘要][下载 PDF][OpenReview]
在多智能体系统中学习有向图上的信任
Orhan Eren Akgun、Arif Kerem Dayi、Stephanie Gil、Angelia Nedich; 第五届动力学与控制学习年会会议论文集, PMLR 211:142-154
[摘要][下载 PDF][OpenReview]
对比示例控制
Kyle Beltran Hatch、Benjamin Eysenbach、Rafael Rafailov、Tianhe Yu、Ruslan Salakhutdinov、Sergey Levine、Chelsea Finn; 第五届动力学与控制学习年会会议论文集, PMLR 211:155-169
[摘要][下载 PDF][OpenReview]
DiffTune$^+$:使用自动微分的无超参数自动调优
Sheng Cheng、Lin Song、Minkyung Kim、Shenlong Wang、Naira Hovakimyan; 第五届动力学与控制学习年会会议论文集, PMLR 211:170-183
[摘要][下载 PDF][OpenReview]
马尔可夫势游戏中网络代理的策略梯度博弈
Sarper Aydin、Ceyhun Eksin; 第五届动力学与控制学习年会会议论文集, PMLR 211:184-195
[摘要][下载 PDF][OpenReview]
具有共因子不确定性的鲁棒观测器性能评估的样本复杂度界限
Serban Sabau, Yifei Zhang, Sourav Kumar Ukil; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:196-207
[abs][下载PDF][OpenReview]
使用神经常微分方程学习鲁棒状态观测器
Keyan Miao, Konstantinos Gatsis; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:208-219
[abs][下载PDF][OpenReview]
用于实时二次优化的预热端到端学习
Rajiv Sambharya, Georgina Hall, Brandon Amos, Bartolomeo Stellato; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:220-234
[abs][下载PDF][OpenReview]
用于平均奖励标准的全梯度深度强化学习
Tejas Pagare, Vivek Borkar, Konstantin Avrachenkov; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:235-247
[abs][下载PDF][OpenReview]
通过轨迹预测和跟踪进行在线LQR控制的遗憾分析
Yitian Chen, Timothy L Molloy, Tyler Summers, Iman Shames; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:248-258
[abs][下载PDF][OpenReview]
通过转移占用匹配进行基于模型的强化学习的策略感知模型学习
Yecheng Jason Ma, Kausik Sivakumar, Jason Yan, Osbert Bastani, Dinesh Jayaraman; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:259-271
[abs][下载PDF][OpenReview]
网络化动力系统的组合神经证书
Songyuan Zhang, Yumeng Xiu, Guannan Qu, Chuchu Fan; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:272-285
[abs][下载PDF][OpenReview]
分布内障碍函数:避免分布外状态的自监督策略过滤器
Fernando Castañeda, Haruki Nishimura, Rowan Thomas McAllister, Koushil Sreenath, Adrien Gaidon; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:286-299
[abs][下载PDF][OpenReview]
动态代理之间运动规划的自适应保形预测
Anushri Dixit, Lars Lindemann, Skylar X Wei, Matthew Cleaveland, George J. Pappas, Joel W. Burdick; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:300-314
[abs][下载PDF][OpenReview]
用于安全多智能体强化学习的经过证明的有效广义拉格朗日策略优化
Dongsheng Ding, Xiaohan Wei, Zhuoran Yang, Zhaoran Wang, Mihailo Jovanovic; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:315-332
[abs][下载PDF][OpenReview]
网络系统中完全去中心化学习的均衡
Yan Jiang, Wenqi Cui, Baosen Zhang, Jorge Cortes; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:333-345
[abs][下载PDF][OpenReview]
用于非线性自适应控制的算子学习
Luke Bhan, Yuanyuan Shi, Miroslav Krstic; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:346-357
[abs][下载PDF][OpenReview]
用于风险概率估计的通用物理信息学习框架
Zhuoyuan Wang, Yorie Nakahira; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:358-370
[abs][下载PDF][OpenReview]
通过轨迹生成进行高效强化学习
Wenqi Cui, Linbin Huang, Weiwei Yang, Baosen Zhang; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:371-382
[abs][下载PDF][OpenReview]
随机动力系统的集中现象:算子理论方法
Muhammad Abdullah Naeem; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:383-394
[abs][下载PDF][OpenReview]
用于指数成本风险敏感MDP的修正策略迭代
Yashaswini Murthy, Mehrdad Moharrami, R. Srikant; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:395-406
[abs][下载PDF][OpenReview]
通过自适应多面体进行神经网络控制系统的自动化可达性分析
Taha Entesari, Mahyar Fazlyab; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:407-419
[abs][下载PDF][OpenReview]
设计具有稳定性保证的非线性系统的系统级综合控制器
Lauren E Conger, Sydney Vernon, Eric Mazumdar; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:420-430
[abs][下载PDF][OpenReview]
针对神经网络轨迹预测器的有针对性的对抗攻击
Kaiyuan Tan, Jun Wang, Yiannis Kantaros; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:431-444
[abs][下载PDF][OpenReview]
学习会恶化控制吗?分析基于高斯过程的事件触发在线学习中的计算延迟
Xiaobing Dai, Armin Lederer, Zewen Yang, Sandra Hirche; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:445-457
[abs][下载PDF][OpenReview]
高斯过程状态空间模型的概率不变性
Paul Griffioen, Alex Devonport, Murat Arcak; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:458-468
[abs][下载PDF][OpenReview]
用于视觉POMDP的基于组合学习的规划
Sampada Deglurkar, Michael H Lim, Johnathan Tucker, Zachary N Sunberg, Aleksandra Faust, Claire Tomlin; 第五届动力学与控制学习会议论文集, PMLR 211:469-482
[abs][下载PDF][OpenReview]
通过混合整数规划认证神经网络的可逆性
Tianqi Cui, Thomas Bertalan, George J. Pappas, Manfred Morari, Yannis Kevrekidis, Mahyar Fazlyab; 第五届动力学与控制学习会议论文集, PMLR 211:483-496
[abs][下载PDF][OpenReview]
在具有Bandit反馈的安全优化中约束集几何属性的影响
Spencer Hutchinson, Berkay Turan, Mahnoosh Alizadeh; 第五届动力学与控制学习会议论文集, PMLR 211:497-508
[abs][下载PDF][OpenReview]
基于模板的分段仿射回归
Guillaume O Berger, Sriram Sankaranarayanan; 第五届动力学与控制学习会议论文集, PMLR 211:509-520
[abs][下载PDF][OpenReview]
物理增强的高斯过程变分自编码器
Thomas Beckers, Qirui Wu, George J. Pappas; 第五届动力学与控制学习会议论文集, PMLR 211:521-533
[abs][下载PDF][OpenReview]
对风险敏感线性二次高斯控制进行强化学习研究
Leilei Cui, Tamer Basar, Zhong-Ping Jiang; 第五届动力学与控制学习会议论文集, PMLR 211:534-546
[abs][下载PDF][OpenReview]
使用决策树进行时序逻辑分类器的时序增量学习
Erfan Aasi, Mingyu Cai, Cristian Ioan Vasile, Calin Belta; 第五届动力学与控制学习会议论文集, PMLR 211:547-559
[abs][下载PDF][OpenReview]
针对时变动力系统的自适应后悔
Paula Gradu, Elad Hazan, Edgar Minasyan; 第五届动力学与控制学习会议论文集, PMLR 211:560-572
[abs][下载PDF][OpenReview]
自动积分用于快速且可解释的神经点过程
Zihao Zhou, Rose Yu; 第五届动力学与控制学习会议论文集, PMLR 211:573-585
[abs][下载PDF][OpenReview]
用于线性动态系统的多任务模仿学习
Thomas T. Zhang, Katie Kang, Bruce D Lee, Claire Tomlin, Sergey Levine, Stephen Tu, Nikolai Matni; 第五届动力学与控制学习会议论文集, PMLR 211:586-599
[abs][下载PDF][OpenReview]
使用Transformer加速四旋翼飞行器的轨迹生成
Srinath Tankasala, Mitch Pryor; 第五届动力学与控制学习会议论文集, PMLR 211:600-611
[abs][下载PDF][OpenReview]
多步时序差分估计的有限样本分析
Yaqi Duan, Martin J. Wainwright; 第五届动力学与控制学习会议论文集, PMLR 211:612-624
[abs][下载PDF][OpenReview]
基于实际评论员梯度的Actor-Critic用于在线强化学习
Swaminathan Gurumurthy, Zachary Manchester, J Zico Kolter; 第五届动力学与控制学习会议论文集, PMLR 211:625-638
[abs][下载PDF][OpenReview]
深度离线迭代学习控制
Swaminathan Gurumurthy, J Zico Kolter, Zachary Manchester; 第五届动力学与控制学习会议论文集, PMLR 211:639-652
[abs][下载PDF][OpenReview]
连续状态空间动力系统的运输不等式、李雅普诺夫稳定性和采样
Muhammad Abdullah Naeem, Miroslav Pajic; 第五届动力学与控制学习会议论文集, PMLR 211:653-664
[abs][下载PDF][OpenReview]
在线学习扰动以进行风险感知控制:使用不到一分钟的数据进行风险感知飞行
Prithvi Akella, Skylar X Wei, Joel W. Burdick, Aaron Ames; 第五届动力学与控制学习会议论文集, PMLR 211:665-678
[abs][下载PDF][OpenReview]
使用端口哈密顿神经网络进行面向对象的动力系统模型组合学习
Cyrus Neary, Ufuk Topcu; 第五届动力学与控制学习会议论文集, PMLR 211:679-691
[abs][下载PDF][OpenReview]
多智能体强化学习中的奖励延迟
Yuyang Zhang, Runyu Zhang, Yuantao Gu, Na Li; 第五届动力学与控制学习会议论文集, PMLR 211:692-704
[abs][下载PDF][OpenReview]
CatlNet:从CaTL+规范学习通信和协调策略
Wenliang Liu, Kevin Leahy, Zachary Serlin, Calin Belta; 第五届动力学与控制学习会议论文集, PMLR 211:705-717
[abs][下载PDF][OpenReview]
Roll-Drop:用单个参数解释观测噪声
Luigi Campanaro, Daniele De Martini, Siddhant Gangapurwala, Wolfgang Merkt, Ioannis Havoutis; 第五届动力学与控制学习会议论文集, PMLR 211:718-730
[abs][下载PDF][OpenReview]
用于机器人系统学习和控制的李群强制变分积分器网络
Valentin Duruisseaux, Thai P. Duong, Melvin Leok, Nikolay Atanasov; 第五届动力学与控制学习会议论文集, PMLR 211:731-744
[abs][下载PDF][OpenReview]
从视频中学习面向对象的动态模式和涌现属性
Armand Comas,Christian Fernandez Lopez,Sandesh Ghimire,Haolin Li,Mario Sznaier,Octavia Camps;第5届学习动力学与控制年会论文集,PMLR 211:745-769
[abs][下载PDF][OpenReview]
基于学习的动作残差的连续多功能跳跃
Yuxiang Yang,Xiangyun Meng,Wenhao Yu,Tingnan Zhang,Jie Tan,Byron Boots;第5届学习动力学与控制年会论文集,PMLR 211:770-782
[abs][下载PDF][OpenReview]
使用安全指数引导的高斯过程模型进行强化学习的概率安全保障
Weiye Zhao,Tairan He,Changliu Liu;第5届学习动力学与控制年会论文集,PMLR 211:783-796
[abs][下载PDF][OpenReview]
分层策略混合作为最优传输
An Thai Le,Kay Hansel,Jan Peters,Georgia Chalvatzaki;第5届学习动力学与控制年会论文集,PMLR 211:797-812
[abs][下载PDF][OpenReview]
通过分布式样本分位数推断进行Top-k数据选择
Xu Zhang,Marcos M. Vasconcelos;第5届学习动力学与控制年会论文集,PMLR 211:813-824
[abs][下载PDF][OpenReview]
基于模型的验证作为概率推断
Harrison Delecki,Anthony Corso,Mykel Kochenderfer;第5届学习动力学与控制年会论文集,PMLR 211:825-837
[abs][下载PDF][OpenReview]
基于神经网络随机微分方程的非线性可控性和函数表示
Tanya Veeravalli,Maxim Raginsky;第5届学习动力学与控制年会论文集,PMLR 211:838-850
[abs][下载PDF][OpenReview]
使用全身体态运动规划和黑盒策略学习的敏捷抓取
Saminda Abeyruwan,Alex Bewley,Nicholas Matthew Boffi,Krzysztof Marcin Choromanski,David B D’Ambrosio,Deepali Jain,Pannag R Sanketi,Anish Shankar,Vikas Sindhwani,Sumeet Singh,Jean-Jacques Slotine,Stephen Tu;第5届学习动力学与控制年会论文集,PMLR 211:851-863
[abs][下载PDF][OpenReview]
在不确定性下进行分布鲁棒的Lyapunov函数搜索
Kehan Long,Yinzhuang Yi,Jorge Cortes,Nikolay Atanasov;第5届学习动力学与控制年会论文集,PMLR 211:864-877
[abs][下载PDF][OpenReview]
黑盒与灰盒:关于学习带旋转和碰撞的乒乓球轨迹预测的案例研究
Jan Achterhold,Philip Tobuschat,Hao Ma,Dieter Büchler,Michael Muehlebach,Joerg Stueckler;第5届学习动力学与控制年会论文集,PMLR 211:878-890
[abs][下载PDF][OpenReview]
基于数据的具有记忆依赖性的动力系统抽象
Adrien Banse,Licio Romao,Alessandro Abate,Raphael Jungers;第5届学习动力学与控制年会论文集,PMLR 211:891-902
[abs][下载PDF][OpenReview]
通过学习结构和时间模式进行车辆交通网络拥塞控制
SooJean Han,Soon-Jo Chung,Johanna Gustafson;第5届学习动力学与控制年会论文集,PMLR 211:903-914
[abs][下载PDF][OpenReview]
微型金融学的学习与控制视角
Xiyu Deng,Christian Kurniawan,Adhiraj Chakraborty,Assane Gueye,Niangjun Chen,Yorie Nakahira;第5届学习动力学与控制年会论文集,PMLR 211:915-927
[abs][下载PDF][OpenReview]
基于物理的驱动的环境流场主动学习
Reza Khodayi-mehr,Pingcheng Jian,Michael M. Zavlanos;第5届学习动力学与控制年会论文集,PMLR 211:928-940
[abs][下载PDF][OpenReview]
CT-DQN:控制引导的深度强化学习
Francesco De Lellis,Marco Coraggio,Giovanni Russo,Mirco Musolesi,Mario di Bernardo;第5届学习动力学与控制年会论文集,PMLR 211:941-953
[abs][下载PDF][OpenReview]
优雅地失败:学习有界不安全的神经网络控制器
Panagiotis Vlantis,Leila Bridgeman,Michael Zavlanos;第5届学习动力学与控制年会论文集,PMLR 211:954-965
[abs][下载PDF][OpenReview]
通过特征函数进行ReLU神经网络的概率验证
Joshua Pilipovsky,Vignesh Sivaramakrishnan,Meeko Oishi,Panagiotis Tsiotras;第5届学习动力学与控制年会论文集,PMLR 211:966-979
[abs][下载PDF][OpenReview]
基于数据的具有记忆依赖性的动力系统抽象
关如潘, 汝川欧, 蒂姆·法尔瓦瑟; 第5届学习动力学与控制年会论文集, PMLR 211:980-992
[摘要][下载PDF][OpenReview]
模型无关强化学习中中间人攻击的检测
里希·拉尼, 马西莫·弗朗切谢蒂; 第5届学习动力学与控制年会论文集, PMLR 211:993-1007
[摘要][下载PDF][OpenReview]
具有性能约束的线性二次高斯控制中的控制器简化
赵林任, 杨郑, 玛丽亚姆·法泽尔, 娜·李; 第5届学习动力学与控制年会论文集, PMLR 211:1008-1019
[摘要][下载PDF][OpenReview]
时变匹配市场中的竞争性强盗
迪潘·穆提拉扬, 钦迈·梅什瓦里, 普拉莫德·卡尔戈内卡尔, 香卡尔·萨斯特里; 第5届学习动力学与控制年会论文集, PMLR 211:1020-1031
[摘要][下载PDF][OpenReview]
在线深度控制的后悔界限
欣怡陈, 埃德加·米纳西安, 杰森·D·李, 埃拉德·哈赞; 第5届学习动力学与控制年会论文集, PMLR 211:1032-1045
[摘要][下载PDF][OpenReview]
用于$H^∞$不确定性的频率域高斯过程模型
亚历克斯·德文波特, 彼得·塞勒, 穆拉特·阿尔卡克; 第5届学习动力学与控制年会论文集, PMLR 211:1046-1057
[摘要][下载PDF][OpenReview]
有限信息共享的卫星导航与协调
悉尼·多兰, 西达斯·纳亚克, 汉萨·巴拉克里希南; 第5届学习动力学与控制年会论文集, PMLR 211:1058-1071
[摘要][下载PDF][OpenReview]
面向分布式事件触发控制的多智能体强化学习
卢卡斯·凯斯珀, 塞巴斯蒂安·特林佩, 多米尼克·鲍曼; 第5届学习动力学与控制年会论文集, PMLR 211:1072-1085
[摘要][下载PDF][OpenReview]
线性动态系统离线数据中毒攻击的分析与可检测性
阿莱西奥·鲁索; 第5届学习动力学与控制年会论文集, PMLR 211:1086-1098
[摘要][下载PDF][OpenReview]
基于视觉的端到端驾驶策略中的学习稳定性注意力
曾-轩王, 伟萧, 马克拉姆·沙欣, 亚历山大·阿米尼, 拉敏·哈萨尼, 丹妮拉·鲁斯; 第5届学习动力学与控制年会论文集, PMLR 211:1099-1111
[摘要][下载PDF][OpenReview]
具有线性函数逼近的领导者-跟随者马尔可夫决策过程中的可证明高效模型无关强化学习
阿诺布·戈什; 第5届学习动力学与控制年会论文集, PMLR 211:1112-1124
[摘要][下载PDF][OpenReview]
使用基于知识的神经常微分方程和深度集成学习增强的非线性模型预测控制
孔耀齐, M. 安妮·谢, 尼古拉·马特尼; 第5届学习动力学与控制年会论文集, PMLR 211:1125-1137
[摘要][下载PDF][OpenReview]
具有稳定性和后悔保证的在线切换控制
莹莹李, 詹姆斯·A·普雷斯, 娜·李, 义恒·林, 亚当·维尔曼, 杰夫·S·沙玛; 第5届学习动力学与控制年会论文集, PMLR 211:1138-1151
[摘要][下载PDF][OpenReview]
CLAS:使用中心潜在动作空间的协调多机器人操作
埃利·阿尔贾布特, 马克西米利安·卡尔, 帕特里克·范德·斯马特; 第5届学习动力学与控制年会论文集, PMLR 211:1152-1166
[摘要][下载PDF][OpenReview]
弱连接网络系统中的学习相干聚类
汉程闵, 恩里克·马拉达; 第5届学习动力学与控制年会论文集, PMLR 211:1167-1179
[摘要][下载PDF][OpenReview]
使用系统级综合的预测安全滤波器
安托万·利曼, 约翰内斯·科勒, 萨米尔·本纳尼, 梅拉妮·塞林格; 第5届学习动力学与控制年会论文集, PMLR 211:1180-1192
[摘要][下载PDF][OpenReview]
使用三角基函数的时间依赖逆最优控制
拉赫尔·里肯巴赫, 埃莱娜·阿尔卡里, 梅拉妮·塞林格; 第5届学习动力学与控制年会论文集, PMLR 211:1193-1204
[摘要][下载PDF][OpenReview]
约束多智能体强化学习的原始-对偶算法的解释
丹尼尔·塔巴斯, 艾哈迈德·S·扎姆扎姆, 宝森·张; 第5届学习动力学与控制年会论文集, PMLR 211:1205-1217
[摘要][下载PDF][OpenReview]
从传感器空间中的MPC学习运动技能
马吉德·卡迪夫, 阿瓦德什·梅杜里, 怀江·朱, 路多维克·里格蒂, 伯恩哈德·舍尔科普夫; 第5届学习动力学与控制年会论文集, PMLR 211:1218-1230
[摘要][下载PDF][OpenReview]
多智能体动力学的概率对称性
孙慧文, 罗宾·沃尔特斯, 李金熙, 于玫瑰; 第5届学习动力学与控制年会论文集, PMLR 211:1231-1244
[abs][下载PDF][OpenReview]
分布式LQR中的策略评估
王子凡, 高宇龙, 王思毅, 迈克尔·M·扎夫拉诺斯, 亚历山德罗·阿巴特, 卡尔·亨里克·约翰逊; 第5届学习动力学与控制年会论文集, PMLR 211:1245-1256
[abs][下载PDF][OpenReview]
基于可达性分析的安全关键控制,使用在线固定时间强化学习
尼克-马里奥斯·科科拉基斯, 基里亚科斯·G·瓦姆武达基斯, 瓦西姆·哈达德; 第5届学习动力学与控制年会论文集, PMLR 211:1257-1270
[abs][下载PDF][OpenReview]
使用傅里叶特征的Koopman算子的在线估计
塔希亚·萨拉姆, 爱丽丝·凯特·李, M·阿尼·希什; 第5届学习动力学与控制年会论文集, PMLR 211:1271-1283
[abs][下载PDF][OpenReview]
用于按需自动驾驶系统的混合多智能体深度强化学习
托比亚斯·恩德斯, 詹姆斯·哈里森, 马可·帕沃内, 马克西米利安·希弗; 第5届学习动力学与控制年会论文集, PMLR 211:1284-1296
[abs][下载PDF][OpenReview]
基于模型的用于空腔滤波器调谐的强化学习
杜米特鲁·达尼尔·尼马拉, 穆罕默德雷扎·马莱克-穆罕默迪, 彼得·奥格伦, 魏杰奇, 文森特·黄; 第5届学习动力学与控制年会论文集, PMLR 211:1297-1307
[abs][下载PDF][OpenReview]
FedSysID:一种用于样本高效系统识别的联邦方法
王涵, 莱昂纳多·费利佩·托索, 詹姆斯·安德森; 第5届学习动力学与控制年会论文集, PMLR 211:1308-1320
[abs][下载PDF][OpenReview]
一维卷积神经网络的Lipschitz常数估计
帕特里夏·保利, 丹尼斯·格拉姆利奇, 弗兰克·阿格沃; 第5届学习动力学与控制年会论文集, PMLR 211:1321-1332
[abs][下载PDF][OpenReview]
具有约束的随机连续臂老虎机的悲观-乐观学习
郭恒泉, 齐竹, 刘鑫; 第5届学习动力学与控制年会论文集, PMLR 211:1333-1344
[abs][下载PDF][OpenReview]
在线控制中的两全其美:竞争比和策略遗憾
高塔姆·戈埃尔, 纳曼·阿加瓦尔, 卡兰·辛格, 埃拉德·哈赞; 第5届学习动力学与控制年会论文集, PMLR 211:1345-1356
[abs][下载PDF][OpenReview]
用于托卡马克控制的离线基于模型的强化学习
伊恩·查尔, 约瑟夫·阿巴特, 拉斯洛·巴尔多奇, 马克·博耶尔, 杨锡忠, 罗里·康林, 基思·埃里克森, 维拉吉·梅塔, 内森·里希纳, 埃格曼·科莱曼, 杰夫·施耐德; 第5届学习动力学与控制年会论文集, PMLR 211:1357-1372
[abs][下载PDF][OpenReview]
具有比特约束信道的线性随机老虎机
阿里特拉·米特拉, 哈梅德·哈萨尼, 乔治·J·帕帕斯; 第5届学习动力学与控制年会论文集, PMLR 211:1387-1399
[abs][下载PDF][OpenReview]
具有区域吸引子规划器的混合系统神经网络控制
岳萌, 范楚楚; 第5届学习动力学与控制年会论文集, PMLR 211:1400-1415
[abs][下载PDF][OpenReview]
具有依赖于决策的数据的在线鞍点跟踪
基利安·里德·伍德, 埃米利亚诺·达尔·阿内塞; 第5届学习动力学与控制年会论文集, PMLR 211:1416-1428
[abs][下载PDF][OpenReview]
使用扩展卡尔曼滤波和卡尔曼网神经网络估计柔性机翼飞机机翼形状
哈德拉茨基·佐姆博尔·本塞, 弗里德曼·诺埃米, 塔卡里奇·贝拉, 瓦内克·巴林特; 第5届学习动力学与控制年会论文集, PMLR 211:1429-1440
[abs][下载PDF][OpenReview]
滤波感知模型预测控制
巴里斯·卡亚利拜, 阿塔纳斯·米尔切夫, 艾哈迈德·阿加, 帕特里克·范德·斯马特, 贾斯汀·拜尔; 第5届学习动力学与控制年会论文集, PMLR 211:1441-1454
[abs][下载PDF][OpenReview]
用于H∞跟踪控制的离线强化学习算法的超参数调整
阿里雷扎·法拉曼迪, 布赖恩·C·雷茨, 马克·德博德, 道格拉斯·菲尔布里克, 卡蒂亚·埃斯塔布里迪斯, 加里·休尔; 第5届学习动力学与控制年会论文集, PMLR 211:1455-1466
[abs][下载PDF][OpenReview]
DLKoopman:用于Koopman理论的深度学习软件包
索里亚·迪, 埃里克·威廉·戴维斯; 第5届学习动力学与控制年会论文集, PMLR 211:1467-1479
[abs][下载PDF][OpenReview]
刚体接触模型的基准测试
米歇尔·郭, 江一峰, 安德鲁·埃弗雷特·斯皮尔伯格, 吴佳俊, 刘凯伦; 第5届学习动力学与控制年会论文集, PMLR 211:1480-1492
[摘要][下载PDF][OpenReview]
基于策略模仿学习的模型预测控制
Kwangjun Ahn, Zakaria Mhammedi, Horia Mania, Zhang-Wei Hong, Ali Jadbabaie; 动力系统与控制学习第五届年会论文集, PMLR 211:1493-1505
[摘要][下载PDF][OpenReview]