[编辑]

第211卷:动力学与控制学习年会,2023年6月15-16日,宾夕法尼亚州费城

[编辑]

编辑:Nikolai Matni、Manfred Morari、George J. Pappas

[bib][citeproc]

流形上的学习:使用几何可控性条件进行神经常微分方程的通用逼近属性

Karthik Elamvazhuthi、Xuechen Zhang、Samet Oymak、Fabio Pasqualetti; 第五届动力学与控制学习年会会议论文集, PMLR 211:1-11

具有神经网络控制器的非线性动力系统的区间可达性

Saber Jafarpour、Akash Harapanahalli、Samuel Coogan; 第五届动力学与控制学习年会会议论文集, PMLR 211:12-25

基于物理信息的模型强化学习

Adithya Ramesh、Balaraman Ravindran; 第五届动力学与控制学习年会会议论文集, PMLR 211:26-37

学习引导随机搜索的学习:流形上的无导数元黑盒优化

Bilgehan Sel、Ahmad Tawaha、Yuhao Ding、Ruoxi Jia、Bo Ji、Javad Lavaei、Ming Jin; 第五届动力学与控制学习年会会议论文集, PMLR 211:38-50

直接潜在模型学习能否解决线性二次高斯控制问题?

Yi Tian、Kaiqing Zhang、Russ Tedrake、Suvrit Sra; 第五届动力学与控制学习年会会议论文集, PMLR 211:51-63

针对连续 $SE(3)$ 轨迹的活动目标跟踪策略学习

Pengzhi Yang、Shumon Koga、Arash Asgharivaskasi、Nikolay Atanasov; 第五届动力学与控制学习年会会议论文集, PMLR 211:64-75

神经符号模型对自然约束的保证性符合

Kaustubh Sridhar、Souradeep Dutta、James Weimer、Insup Lee; 第五届动力学与控制学习年会会议论文集, PMLR 211:76-89

ISAACS:用于安全的迭代软对抗演员-评论家

Kai-Chieh Hsu、Duy Phuong Nguyen、Jaime Fernàndez Fisac; 第五届动力学与控制学习年会会议论文集, PMLR 211:90-103

使用基于扰动观测器的控制屏障函数进行安全高效的强化学习

Yikun Cheng、Pan Zhao、Naira Hovakimyan; 第五届动力学与控制学习年会会议论文集, PMLR 211:104-115

学习自治非线性延迟系统的动力学

Xunbi Ji、Gabor Orosz; 第五届动力学与控制学习年会会议论文集, PMLR 211:116-127

改进具有接触的微分物理模拟的梯度计算

Yaofeng Desmond Zhong、Jiequn Han、Biswadip Dey、Georgia Olympia Brikis; 第五届动力学与控制学习年会会议论文集, PMLR 211:128-141

在多智能体系统中学习有向图上的信任

Orhan Eren Akgun、Arif Kerem Dayi、Stephanie Gil、Angelia Nedich; 第五届动力学与控制学习年会会议论文集, PMLR 211:142-154

对比示例控制

Kyle Beltran Hatch、Benjamin Eysenbach、Rafael Rafailov、Tianhe Yu、Ruslan Salakhutdinov、Sergey Levine、Chelsea Finn; 第五届动力学与控制学习年会会议论文集, PMLR 211:155-169

DiffTune$^+$:使用自动微分的无超参数自动调优

Sheng Cheng、Lin Song、Minkyung Kim、Shenlong Wang、Naira Hovakimyan; 第五届动力学与控制学习年会会议论文集, PMLR 211:170-183

马尔可夫势游戏中网络代理的策略梯度博弈

Sarper Aydin、Ceyhun Eksin; 第五届动力学与控制学习年会会议论文集, PMLR 211:184-195

具有共因子不确定性的鲁棒观测器性能评估的样本复杂度界限

Serban Sabau, Yifei Zhang, Sourav Kumar Ukil; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:196-207

使用神经常微分方程学习鲁棒状态观测器

Keyan Miao, Konstantinos Gatsis; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:208-219

用于实时二次优化的预热端到端学习

Rajiv Sambharya, Georgina Hall, Brandon Amos, Bartolomeo Stellato; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:220-234

用于平均奖励标准的全梯度深度强化学习

Tejas Pagare, Vivek Borkar, Konstantin Avrachenkov; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:235-247

通过轨迹预测和跟踪进行在线LQR控制的遗憾分析

Yitian Chen, Timothy L Molloy, Tyler Summers, Iman Shames; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:248-258

通过转移占用匹配进行基于模型的强化学习的策略感知模型学习

Yecheng Jason Ma, Kausik Sivakumar, Jason Yan, Osbert Bastani, Dinesh Jayaraman; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:259-271

网络化动力系统的组合神经证书

Songyuan Zhang, Yumeng Xiu, Guannan Qu, Chuchu Fan; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:272-285

分布内障碍函数:避免分布外状态的自监督策略过滤器

Fernando Castañeda, Haruki Nishimura, Rowan Thomas McAllister, Koushil Sreenath, Adrien Gaidon; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:286-299

动态代理之间运动规划的自适应保形预测

Anushri Dixit, Lars Lindemann, Skylar X Wei, Matthew Cleaveland, George J. Pappas, Joel W. Burdick; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:300-314

用于安全多智能体强化学习的经过证明的有效广义拉格朗日策略优化

Dongsheng Ding, Xiaohan Wei, Zhuoran Yang, Zhaoran Wang, Mihailo Jovanovic; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:315-332

网络系统中完全去中心化学习的均衡

Yan Jiang, Wenqi Cui, Baosen Zhang, Jorge Cortes; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:333-345

用于非线性自适应控制的算子学习

Luke Bhan, Yuanyuan Shi, Miroslav Krstic; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:346-357

用于风险概率估计的通用物理信息学习框架

Zhuoyuan Wang, Yorie Nakahira; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:358-370

通过轨迹生成进行高效强化学习

Wenqi Cui, Linbin Huang, Weiwei Yang, Baosen Zhang; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:371-382

随机动力系统的集中现象:算子理论方法

Muhammad Abdullah Naeem; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:383-394

用于指数成本风险敏感MDP的修正策略迭代

Yashaswini Murthy, Mehrdad Moharrami, R. Srikant; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:395-406

通过自适应多面体进行神经网络控制系统的自动化可达性分析

Taha Entesari, Mahyar Fazlyab; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:407-419

设计具有稳定性保证的非线性系统的系统级综合控制器

Lauren E Conger, Sydney Vernon, Eric Mazumdar; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:420-430

针对神经网络轨迹预测器的有针对性的对抗攻击

Kaiyuan Tan, Jun Wang, Yiannis Kantaros; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:431-444

学习会恶化控制吗?分析基于高斯过程的事件触发在线学习中的计算延迟

Xiaobing Dai, Armin Lederer, Zewen Yang, Sandra Hirche; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:445-457

高斯过程状态空间模型的概率不变性

Paul Griffioen, Alex Devonport, Murat Arcak; Proceedings of The 5th Annual Learning for Dynamics and Control Conference, PMLR 211:458-468

用于视觉POMDP的基于组合学习的规划

Sampada Deglurkar, Michael H Lim, Johnathan Tucker, Zachary N Sunberg, Aleksandra Faust, Claire Tomlin; 第五届动力学与控制学习会议论文集, PMLR 211:469-482

通过混合整数规划认证神经网络的可逆性

Tianqi Cui, Thomas Bertalan, George J. Pappas, Manfred Morari, Yannis Kevrekidis, Mahyar Fazlyab; 第五届动力学与控制学习会议论文集, PMLR 211:483-496

在具有Bandit反馈的安全优化中约束集几何属性的影响

Spencer Hutchinson, Berkay Turan, Mahnoosh Alizadeh; 第五届动力学与控制学习会议论文集, PMLR 211:497-508

基于模板的分段仿射回归

Guillaume O Berger, Sriram Sankaranarayanan; 第五届动力学与控制学习会议论文集, PMLR 211:509-520

物理增强的高斯过程变分自编码器

Thomas Beckers, Qirui Wu, George J. Pappas; 第五届动力学与控制学习会议论文集, PMLR 211:521-533

对风险敏感线性二次高斯控制进行强化学习研究

Leilei Cui, Tamer Basar, Zhong-Ping Jiang; 第五届动力学与控制学习会议论文集, PMLR 211:534-546

使用决策树进行时序逻辑分类器的时序增量学习

Erfan Aasi, Mingyu Cai, Cristian Ioan Vasile, Calin Belta; 第五届动力学与控制学习会议论文集, PMLR 211:547-559

针对时变动力系统的自适应后悔

Paula Gradu, Elad Hazan, Edgar Minasyan; 第五届动力学与控制学习会议论文集, PMLR 211:560-572

自动积分用于快速且可解释的神经点过程

Zihao Zhou, Rose Yu; 第五届动力学与控制学习会议论文集, PMLR 211:573-585

用于线性动态系统的多任务模仿学习

Thomas T. Zhang, Katie Kang, Bruce D Lee, Claire Tomlin, Sergey Levine, Stephen Tu, Nikolai Matni; 第五届动力学与控制学习会议论文集, PMLR 211:586-599

使用Transformer加速四旋翼飞行器的轨迹生成

Srinath Tankasala, Mitch Pryor; 第五届动力学与控制学习会议论文集, PMLR 211:600-611

多步时序差分估计的有限样本分析

Yaqi Duan, Martin J. Wainwright; 第五届动力学与控制学习会议论文集, PMLR 211:612-624

基于实际评论员梯度的Actor-Critic用于在线强化学习

Swaminathan Gurumurthy, Zachary Manchester, J Zico Kolter; 第五届动力学与控制学习会议论文集, PMLR 211:625-638

深度离线迭代学习控制

Swaminathan Gurumurthy, J Zico Kolter, Zachary Manchester; 第五届动力学与控制学习会议论文集, PMLR 211:639-652

连续状态空间动力系统的运输不等式、李雅普诺夫稳定性和采样

Muhammad Abdullah Naeem, Miroslav Pajic; 第五届动力学与控制学习会议论文集, PMLR 211:653-664

在线学习扰动以进行风险感知控制:使用不到一分钟的数据进行风险感知飞行

Prithvi Akella, Skylar X Wei, Joel W. Burdick, Aaron Ames; 第五届动力学与控制学习会议论文集, PMLR 211:665-678

使用端口哈密顿神经网络进行面向对象的动力系统模型组合学习

Cyrus Neary, Ufuk Topcu; 第五届动力学与控制学习会议论文集, PMLR 211:679-691

多智能体强化学习中的奖励延迟

Yuyang Zhang, Runyu Zhang, Yuantao Gu, Na Li; 第五届动力学与控制学习会议论文集, PMLR 211:692-704

CatlNet:从CaTL+规范学习通信和协调策略

Wenliang Liu, Kevin Leahy, Zachary Serlin, Calin Belta; 第五届动力学与控制学习会议论文集, PMLR 211:705-717

Roll-Drop:用单个参数解释观测噪声

Luigi Campanaro, Daniele De Martini, Siddhant Gangapurwala, Wolfgang Merkt, Ioannis Havoutis; 第五届动力学与控制学习会议论文集, PMLR 211:718-730

用于机器人系统学习和控制的李群强制变分积分器网络

Valentin Duruisseaux, Thai P. Duong, Melvin Leok, Nikolay Atanasov; 第五届动力学与控制学习会议论文集, PMLR 211:731-744

从视频中学习面向对象的动态模式和涌现属性

Armand Comas,Christian Fernandez Lopez,Sandesh Ghimire,Haolin Li,Mario Sznaier,Octavia Camps第5届学习动力学与控制年会论文集,PMLR 211:745-769

基于学习的动作残差的连续多功能跳跃

Yuxiang Yang,Xiangyun Meng,Wenhao Yu,Tingnan Zhang,Jie Tan,Byron Boots第5届学习动力学与控制年会论文集,PMLR 211:770-782

使用安全指数引导的高斯过程模型进行强化学习的概率安全保障

Weiye Zhao,Tairan He,Changliu Liu第5届学习动力学与控制年会论文集,PMLR 211:783-796

分层策略混合作为最优传输

An Thai Le,Kay Hansel,Jan Peters,Georgia Chalvatzaki第5届学习动力学与控制年会论文集,PMLR 211:797-812

通过分布式样本分位数推断进行Top-k数据选择

Xu Zhang,Marcos M. Vasconcelos第5届学习动力学与控制年会论文集,PMLR 211:813-824

基于模型的验证作为概率推断

Harrison Delecki,Anthony Corso,Mykel Kochenderfer第5届学习动力学与控制年会论文集,PMLR 211:825-837

基于神经网络随机微分方程的非线性可控性和函数表示

Tanya Veeravalli,Maxim Raginsky第5届学习动力学与控制年会论文集,PMLR 211:838-850

使用全身体态运动规划和黑盒策略学习的敏捷抓取

Saminda Abeyruwan,Alex Bewley,Nicholas Matthew Boffi,Krzysztof Marcin Choromanski,David B D’Ambrosio,Deepali Jain,Pannag R Sanketi,Anish Shankar,Vikas Sindhwani,Sumeet Singh,Jean-Jacques Slotine,Stephen Tu第5届学习动力学与控制年会论文集,PMLR 211:851-863

在不确定性下进行分布鲁棒的Lyapunov函数搜索

Kehan Long,Yinzhuang Yi,Jorge Cortes,Nikolay Atanasov第5届学习动力学与控制年会论文集,PMLR 211:864-877

黑盒与灰盒:关于学习带旋转和碰撞的乒乓球轨迹预测的案例研究

Jan Achterhold,Philip Tobuschat,Hao Ma,Dieter Büchler,Michael Muehlebach,Joerg Stueckler第5届学习动力学与控制年会论文集,PMLR 211:878-890

基于数据的具有记忆依赖性的动力系统抽象

Adrien Banse,Licio Romao,Alessandro Abate,Raphael Jungers第5届学习动力学与控制年会论文集,PMLR 211:891-902

通过学习结构和时间模式进行车辆交通网络拥塞控制

SooJean Han,Soon-Jo Chung,Johanna Gustafson第5届学习动力学与控制年会论文集,PMLR 211:903-914

微型金融学的学习与控制视角

Xiyu Deng,Christian Kurniawan,Adhiraj Chakraborty,Assane Gueye,Niangjun Chen,Yorie Nakahira第5届学习动力学与控制年会论文集,PMLR 211:915-927

基于物理的驱动的环境流场主动学习

Reza Khodayi-mehr,Pingcheng Jian,Michael M. Zavlanos第5届学习动力学与控制年会论文集,PMLR 211:928-940

CT-DQN:控制引导的深度强化学习

Francesco De Lellis,Marco Coraggio,Giovanni Russo,Mirco Musolesi,Mario di Bernardo第5届学习动力学与控制年会论文集,PMLR 211:941-953

优雅地失败:学习有界不安全的神经网络控制器

Panagiotis Vlantis,Leila Bridgeman,Michael Zavlanos第5届学习动力学与控制年会论文集,PMLR 211:954-965

通过特征函数进行ReLU神经网络的概率验证

Joshua Pilipovsky,Vignesh Sivaramakrishnan,Meeko Oishi,Panagiotis Tsiotras第5届学习动力学与控制年会论文集,PMLR 211:966-979

基于数据的具有记忆依赖性的动力系统抽象

关如潘, 汝川欧, 蒂姆·法尔瓦瑟; 第5届学习动力学与控制年会论文集, PMLR 211:980-992

模型无关强化学习中中间人攻击的检测

里希·拉尼, 马西莫·弗朗切谢蒂; 第5届学习动力学与控制年会论文集, PMLR 211:993-1007

具有性能约束的线性二次高斯控制中的控制器简化

赵林任, 杨郑, 玛丽亚姆·法泽尔, 娜·李; 第5届学习动力学与控制年会论文集, PMLR 211:1008-1019

时变匹配市场中的竞争性强盗

迪潘·穆提拉扬, 钦迈·梅什瓦里, 普拉莫德·卡尔戈内卡尔, 香卡尔·萨斯特里; 第5届学习动力学与控制年会论文集, PMLR 211:1020-1031

在线深度控制的后悔界限

欣怡陈, 埃德加·米纳西安, 杰森·D·李, 埃拉德·哈赞; 第5届学习动力学与控制年会论文集, PMLR 211:1032-1045

用于$H^∞$不确定性的频率域高斯过程模型

亚历克斯·德文波特, 彼得·塞勒, 穆拉特·阿尔卡克; 第5届学习动力学与控制年会论文集, PMLR 211:1046-1057

有限信息共享的卫星导航与协调

悉尼·多兰, 西达斯·纳亚克, 汉萨·巴拉克里希南; 第5届学习动力学与控制年会论文集, PMLR 211:1058-1071

面向分布式事件触发控制的多智能体强化学习

卢卡斯·凯斯珀, 塞巴斯蒂安·特林佩, 多米尼克·鲍曼; 第5届学习动力学与控制年会论文集, PMLR 211:1072-1085

线性动态系统离线数据中毒攻击的分析与可检测性

阿莱西奥·鲁索; 第5届学习动力学与控制年会论文集, PMLR 211:1086-1098

基于视觉的端到端驾驶策略中的学习稳定性注意力

曾-轩王, 伟萧, 马克拉姆·沙欣, 亚历山大·阿米尼, 拉敏·哈萨尼, 丹妮拉·鲁斯; 第5届学习动力学与控制年会论文集, PMLR 211:1099-1111

具有线性函数逼近的领导者-跟随者马尔可夫决策过程中的可证明高效模型无关强化学习

阿诺布·戈什; 第5届学习动力学与控制年会论文集, PMLR 211:1112-1124

使用基于知识的神经常微分方程和深度集成学习增强的非线性模型预测控制

孔耀齐, M. 安妮·谢, 尼古拉·马特尼; 第5届学习动力学与控制年会论文集, PMLR 211:1125-1137

具有稳定性和后悔保证的在线切换控制

莹莹李, 詹姆斯·A·普雷斯, 娜·李, 义恒·林, 亚当·维尔曼, 杰夫·S·沙玛; 第5届学习动力学与控制年会论文集, PMLR 211:1138-1151

CLAS:使用中心潜在动作空间的协调多机器人操作

埃利·阿尔贾布特, 马克西米利安·卡尔, 帕特里克·范德·斯马特; 第5届学习动力学与控制年会论文集, PMLR 211:1152-1166

弱连接网络系统中的学习相干聚类

汉程闵, 恩里克·马拉达; 第5届学习动力学与控制年会论文集, PMLR 211:1167-1179

使用系统级综合的预测安全滤波器

安托万·利曼, 约翰内斯·科勒, 萨米尔·本纳尼, 梅拉妮·塞林格; 第5届学习动力学与控制年会论文集, PMLR 211:1180-1192

使用三角基函数的时间依赖逆最优控制

拉赫尔·里肯巴赫, 埃莱娜·阿尔卡里, 梅拉妮·塞林格; 第5届学习动力学与控制年会论文集, PMLR 211:1193-1204

约束多智能体强化学习的原始-对偶算法的解释

丹尼尔·塔巴斯, 艾哈迈德·S·扎姆扎姆, 宝森·张; 第5届学习动力学与控制年会论文集, PMLR 211:1205-1217

从传感器空间中的MPC学习运动技能

马吉德·卡迪夫, 阿瓦德什·梅杜里, 怀江·朱, 路多维克·里格蒂, 伯恩哈德·舍尔科普夫; 第5届学习动力学与控制年会论文集, PMLR 211:1218-1230

多智能体动力学的概率对称性

孙慧文, 罗宾·沃尔特斯, 李金熙, 于玫瑰; 第5届学习动力学与控制年会论文集, PMLR 211:1231-1244

分布式LQR中的策略评估

王子凡, 高宇龙, 王思毅, 迈克尔·M·扎夫拉诺斯, 亚历山德罗·阿巴特, 卡尔·亨里克·约翰逊; 第5届学习动力学与控制年会论文集, PMLR 211:1245-1256

基于可达性分析的安全关键控制,使用在线固定时间强化学习

尼克-马里奥斯·科科拉基斯, 基里亚科斯·G·瓦姆武达基斯, 瓦西姆·哈达德; 第5届学习动力学与控制年会论文集, PMLR 211:1257-1270

使用傅里叶特征的Koopman算子的在线估计

塔希亚·萨拉姆, 爱丽丝·凯特·李, M·阿尼·希什; 第5届学习动力学与控制年会论文集, PMLR 211:1271-1283

用于按需自动驾驶系统的混合多智能体深度强化学习

托比亚斯·恩德斯, 詹姆斯·哈里森, 马可·帕沃内, 马克西米利安·希弗; 第5届学习动力学与控制年会论文集, PMLR 211:1284-1296

基于模型的用于空腔滤波器调谐的强化学习

杜米特鲁·达尼尔·尼马拉, 穆罕默德雷扎·马莱克-穆罕默迪, 彼得·奥格伦, 魏杰奇, 文森特·黄; 第5届学习动力学与控制年会论文集, PMLR 211:1297-1307

FedSysID:一种用于样本高效系统识别的联邦方法

王涵, 莱昂纳多·费利佩·托索, 詹姆斯·安德森; 第5届学习动力学与控制年会论文集, PMLR 211:1308-1320

一维卷积神经网络的Lipschitz常数估计

帕特里夏·保利, 丹尼斯·格拉姆利奇, 弗兰克·阿格沃; 第5届学习动力学与控制年会论文集, PMLR 211:1321-1332

具有约束的随机连续臂老虎机的悲观-乐观学习

郭恒泉, 齐竹, 刘鑫; 第5届学习动力学与控制年会论文集, PMLR 211:1333-1344

在线控制中的两全其美:竞争比和策略遗憾

高塔姆·戈埃尔, 纳曼·阿加瓦尔, 卡兰·辛格, 埃拉德·哈赞; 第5届学习动力学与控制年会论文集, PMLR 211:1345-1356

用于托卡马克控制的离线基于模型的强化学习

伊恩·查尔, 约瑟夫·阿巴特, 拉斯洛·巴尔多奇, 马克·博耶尔, 杨锡忠, 罗里·康林, 基思·埃里克森, 维拉吉·梅塔, 内森·里希纳, 埃格曼·科莱曼, 杰夫·施耐德; 第5届学习动力学与控制年会论文集, PMLR 211:1357-1372

离散优化的动力系统视角

童冠春, 迈克尔·穆勒巴赫; 第5届学习动力学与控制年会论文集, PMLR 211:1373-1386

具有比特约束信道的线性随机老虎机

阿里特拉·米特拉, 哈梅德·哈萨尼, 乔治·J·帕帕斯; 第5届学习动力学与控制年会论文集, PMLR 211:1387-1399

具有区域吸引子规划器的混合系统神经网络控制

岳萌, 范楚楚; 第5届学习动力学与控制年会论文集, PMLR 211:1400-1415

具有依赖于决策的数据的在线鞍点跟踪

基利安·里德·伍德, 埃米利亚诺·达尔·阿内塞; 第5届学习动力学与控制年会论文集, PMLR 211:1416-1428

使用扩展卡尔曼滤波和卡尔曼网神经网络估计柔性机翼飞机机翼形状

哈德拉茨基·佐姆博尔·本塞, 弗里德曼·诺埃米, 塔卡里奇·贝拉, 瓦内克·巴林特; 第5届学习动力学与控制年会论文集, PMLR 211:1429-1440

滤波感知模型预测控制

巴里斯·卡亚利拜, 阿塔纳斯·米尔切夫, 艾哈迈德·阿加, 帕特里克·范德·斯马特, 贾斯汀·拜尔; 第5届学习动力学与控制年会论文集, PMLR 211:1441-1454

用于H∞跟踪控制的离线强化学习算法的超参数调整

阿里雷扎·法拉曼迪, 布赖恩·C·雷茨, 马克·德博德, 道格拉斯·菲尔布里克, 卡蒂亚·埃斯塔布里迪斯, 加里·休尔; 第5届学习动力学与控制年会论文集, PMLR 211:1455-1466

DLKoopman:用于Koopman理论的深度学习软件包

索里亚·迪, 埃里克·威廉·戴维斯; 第5届学习动力学与控制年会论文集, PMLR 211:1467-1479

刚体接触模型的基准测试

米歇尔·郭, 江一峰, 安德鲁·埃弗雷特·斯皮尔伯格, 吴佳俊, 刘凯伦; 第5届学习动力学与控制年会论文集, PMLR 211:1480-1492

基于策略模仿学习的模型预测控制

Kwangjun Ahn, Zakaria Mhammedi, Horia Mania, Zhang-Wei Hong, Ali Jadbabaie; 动力系统与控制学习第五届年会论文集, PMLR 211:1493-1505

订阅 通过RSS