[编辑]
第120卷:动态与控制学习,2020年6月10-11日,云端
[编辑]
编辑:Alexandre M. Bayen, Ali Jadbabaie, George Pappas, Pablo A. Parrilo, Benjamin Recht, Claire Tomlin, Melanie Zeilinger
[bib][citeproc]
序言
Alexandre M. Bayen, Ali Jadbabaie, George Pappas, Pablo A. Parrilo, Benjamin Recht, Claire Tomlin, Melanie Zeilinger; 动态与控制学习第二届会议论文集, PMLR 120:1-4
[abs][下载PDF]
主动学习高斯过程动力学
Mona Buisson-Fenet, Friedrich Solowjow, Sebastian Trimpe; 动态与控制学习第二届会议论文集, PMLR 120:5-15
[abs][下载PDF]
有限样本系统辨识:最优速率和正则化的作用
Yue Sun, Samet Oymak, Maryam Fazel; 动态与控制学习第二届会议论文集, PMLR 120:16-25
[abs][下载PDF]
分布式两时间尺度随机逼近的有限时间性能
Thinh Doan, Justin Romberg; 动态与控制学习第二届会议论文集, PMLR 120:26-36
[abs][下载PDF]
带有数据驱动参考模型选择的虚拟参考反馈调整
Valentina Breschi, Simone Formentin; 动态与控制学习第二届会议论文集, PMLR 120:37-45
[abs][下载PDF]
带有嵌入防饱和补偿的直接数据驱动控制
Valentina Breschi, Simone Formentin; 动态与控制学习第二届会议论文集, PMLR 120:46-54
[abs][下载PDF]
高维向量自回归模型的稀疏和低偏差估计
Trevor Ruiz, Sharmodeep Bhattacharyya, Mahesh Balasubramanian, Kristofer Bouchard; 动态与控制学习第二届会议论文集, PMLR 120:55-64
[abs][下载PDF]
具有扩展卡尔曼滤波、指数移动平均和动态多历元策略的鲁棒在线模型自适应
Abulikemu Abuduweili, Changliu Liu; 动态与控制学习第二届会议论文集, PMLR 120:65-74
[abs][下载PDF]
使用场景优化估计可达集
Alex Devonport, Murat Arcak; 动态与控制学习第二届会议论文集, PMLR 120:75-84
[abs][下载PDF]
LSTM 神经网络:输入到状态稳定性与概率安全验证
Fabio Bonassi, Enrico Terzi, Marcello Farina, Riccardo Scattolini; 动态与控制学习第二届会议论文集, PMLR 120:85-94
[abs][下载PDF]
自回归模型中的贝叶斯联合状态和参数跟踪
Ismail Senoz, Albert Podusenko, Wouter M. Kouw, Bert Vries; 动态与控制学习第二届会议论文集, PMLR 120:95-104
[abs][下载PDF]
学习动态系统的对应关系
Nam Hee Kim, Zhaoming Xie, Michiel Panne; 动态与控制学习第二届会议论文集, PMLR 120:105-117
[abs][下载PDF]
使用 Benders 切割学习混合控制问题的解
Sandeep Menta, Joseph Warrington, John Lygeros, Manfred Morari; 动态与控制学习第二届会议论文集, PMLR 120:118-126
[abs][下载PDF]
具有可训练延迟的前馈神经网络
Xunbi A. Ji, Tamás G. Molnár, Sergei S. Avedisov, Gábor Orosz; 动态与控制学习第二届会议论文集, PMLR 120:127-136
[abs][下载PDF]
利用自适应 MPC 中的模型稀疏性:压缩感知视角
Monimoy Bujarbaruah, Charlott Vallon; 动态与控制学习第二届会议论文集, PMLR 120:137-146
[abs][下载PDF]
部分可观测不稳定高斯过程状态空间模型中的结构化变分推断
Sebastian Curi, Silvan Melchior, Felix Berkenkamp, Andreas Krause; 动态与控制学习第二届会议论文集, PMLR 120:147-157
[abs][下载PDF]
安全高斯过程 Bandit 优化的后悔界限
Sanae Amani, Mahnoosh Alizadeh, Christos Thrampoulidis; 动态与控制学习第二届会议论文集, PMLR 120:158-159
[abs][下载PDF]
用于安全在线学习的高斯过程的智能遗忘
Jonas Umlauft, Thomas Beckers, Alexandre Capone, Armin Lederer, Sandra Hirche; 动态与控制学习第二届会议论文集, PMLR 120:160-169
[abs][下载PDF]
线性反对称循环神经网络
Signe Moe, Filippo Remonato, Esten Ingar Grøtli, Jan Tommy Gravdahl; 动态与控制学习第二届会议论文集, PMLR 120:170-178
[abs][下载PDF]
用于具有 $\mathcal{H}_2$ 线性控制和 $\mathcal{H}_\infty$ 鲁棒性保证的策略优化:隐式正则化和全局收敛
Kaiqing Zhang, Bin Hu, Tamer Basar; 动态与控制学习第二届会议论文集, PMLR 120:179-190
[abs][下载PDF]
稳定自回归过程的有限样本偏差界限
Rodrigo A. González, Cristian R. Rojas; 动态与控制学习第二届会议论文集, PMLR 120:191-200
[abs][下载 PDF]
在线数据投毒攻击
薛洲张, 肖金朱, 洛朗·莱萨尔; 第二届动力学与控制学习会议论文集, PMLR 120:201-210
[abs][下载 PDF]
用于MPC的实用强化学习:在真实机器人上不到一小时内从稀疏目标中学习
纳帕特·卡纳查里, 米格尔·伊格莱西亚·瓦尔斯, 大卫·霍勒, 马可·胡特; 第二届动力学与控制学习会议论文集, PMLR 120:211-224
[abs][下载 PDF]
使用遵守高斯过程的Gauss原理学习约束动力学
安德烈亚斯·盖斯特, 塞巴斯蒂安·特林佩; 第二届动力学与控制学习会议论文集, PMLR 120:225-234
[abs][下载 PDF]
用于最优控制的反事实编程
路易斯·F.O. 查蒙, 圣地亚哥·帕特奈因, 亚历杭德罗·里贝罗; 第二届动力学与控制学习会议论文集, PMLR 120:235-244
[abs][下载 PDF]
从具有语义观察的演示中学习导航成本
田宇王, 维卡斯·迪曼, 尼科莱·阿塔纳索夫; 第二届动力学与控制学习会议论文集, PMLR 120:245-255
[abs][下载 PDF]
用于多智能体网络系统的局部策略的可扩展强化学习
关楠曲, 亚当·维尔曼, 娜·李; 第二届动力学与控制学习会议论文集, PMLR 120:256-266
[abs][下载 PDF]
具有稳定性保证的黑盒连续时间传递函数估计:基于核的方法
米尔科·马佐莱尼, 马泰奥·斯坎德拉, 西蒙·福尔门丁, 法比奥·普雷维迪; 第二届动力学与控制学习会议论文集, PMLR 120:267-276
[abs][下载 PDF]
通过交叉熵和基于梯度的优化进行模型预测控制
霍曼加·巴拉德瓦杰, 凯文·谢, 弗洛里安·施库尔蒂; 第二届动力学与控制学习会议论文集, PMLR 120:277-286
[abs][下载 PDF]
学习全局最优分布式LQ调节器
卢卡·富里耶里, 杨·郑, 玛丽亚姆·坎加普尔; 第二届动力学与控制学习会议论文集, PMLR 120:287-297
[abs][下载 PDF]
VarNet:用于求解偏微分方程的变分神经网络
雷扎·霍达伊-梅尔, 迈克尔·扎夫拉诺斯; 第二届动力学与控制学习会议论文集, PMLR 120:298-307
[abs][下载 PDF]
可追踪的信号时序逻辑目标的强化学习
哈里什·文卡塔拉曼, 德里亚·阿克萨拉, 彼得·塞勒; 第二届动力学与控制学习会议论文集, PMLR 120:308-317
[abs][下载 PDF]
用于建模船舶意图的空间和时间注意力联合轨迹预测框架
贾斯敏·塞孔, 科迪·弗莱明; 第二届动力学与控制学习会议论文集, PMLR 120:318-327
[abs][下载 PDF]
用于机器人学习和控制的结构化机械模型
杰伊什·K. 古普塔, 库纳尔·门达, 扎卡里·曼彻斯特, 迈克尔·科切恩德费尔; 第二届动力学与控制学习会议论文集, PMLR 120:328-337
[abs][下载 PDF]
用于非线性系统的近似被动线性模型的基于数据的识别
S. 西瓦兰贾尼, 埃蒂卡·阿加瓦尔, 维杰·古普塔; 第二届动力学与控制学习会议论文集, PMLR 120:338-339
[abs][下载 PDF]
使用迭代学习控制和参考校正器进行批量过程的约束管理
艾丹·拉拉西, 哈米德·奥萨雷; 第二届动力学与控制学习会议论文集, PMLR 120:340-349
[abs][下载 PDF]
基于感知的控制的鲁棒保证
莎拉·迪恩, 尼科莱·马特尼, 本杰明·雷希特, 维姬·叶; 第二届动力学与控制学习会议论文集, PMLR 120:350-360
[abs][下载 PDF]
学习凸优化控制策略
阿克谢·阿格拉瓦尔, 谢恩·巴拉特, 斯蒂芬·博伊德, 巴托洛梅奥·斯泰拉托; 第二届动力学与控制学习会议论文集, PMLR 120:361-373
[abs][下载 PDF]
使用卡尔曼约束将线性控制策略拟合到演示中
马拉扬迪·帕兰, 谢恩·巴拉特, 亚历克斯·麦考利, 多尔萨·萨迪格, 维卡斯·辛德瓦尼, 斯蒂芬·博伊德; 第二届动力学与控制学习会议论文集, PMLR 120:374-383
[abs][下载 PDF]
使用循环神经网络对稳定动态系统的通用模拟
乔舒亚·汉森, 马克西姆·拉金斯基; 第二届动力学与控制学习会议论文集, PMLR 120:384-392
[abs][下载 PDF]
收缩隐式循环神经网络:具有改进训练能力的稳定模型
麦克斯·雷瓦伊, 伊恩·曼彻斯特; 第二届动力学与控制学习会议论文集, PMLR 120:393-403
[abs][下载 PDF]
关于线性系统数据驱动控制器的鲁棒性
拉贾塞卡尔·安古鲁里, 阿贝德·阿尔拉曼·阿尔·马克达, 维巴夫·卡特瓦, 法比奥·帕斯夸莱蒂; 第二届动力学与控制学习会议论文集, PMLR 120:404-412
[abs][下载 PDF]
用于求解大规模马尔可夫决策过程的更快鞍点优化
琼·巴斯·塞拉诺, 格尔盖利·诺伊; 第二届动力学与控制学习会议论文集, PMLR 120:413-423
[abs][下载 PDF]
关于使用高斯过程动力学的模拟和轨迹预测
卢卡斯·休温, 埃莱娜·阿尔卡里, 卢卡斯·P. 弗洛利希, 梅拉妮·N. 塞林格; 第二届动力学与控制学习会议论文集, PMLR 120:424-434
[abs][下载 PDF]
未知系统卡尔曼滤波的样本复杂度
阿纳斯塔西奥斯·齐亚米斯, 尼科莱·马特尼, 乔治·帕帕斯; 第二届动力学与控制学习会议论文集, PMLR 120:435-444
[abs][下载 PDF]
NeurOpt:基于神经网络的优化,用于建筑能源管理和气候控制
阿钦·贾因, 弗朗切斯科·斯马拉, 恩里科·雷蒂奇奥利, 亚历山德罗·迪诺琴佐, 曼弗雷德·莫拉里; 第二届动力学与控制学习会议论文集, PMLR 120:445-454
[abs][下载 PDF]
贝叶斯模型预测控制:使用后验抽样进行高效的模型探索和遗憾界限
金·彼得·瓦伯西奇, 梅拉妮·塞林格; 第二届动力学与控制学习会议论文集, PMLR 120:455-464
[abs][下载 PDF]
用于基于学习的控制的控制仿射系统的参数优化
阿明·莱德勒, 亚历山德雷·卡波内, 桑德拉·希尔希; 第二届动力学与控制学习会议论文集, PMLR 120:465-475
[abs][下载 PDF]
用于在线线性二次控制的Riccati更新
Mohammad Akbari, Bahman Gharesifard, Tamas Linder; 第二届动力学与控制学习会议论文集, PMLR 120:476-485
[abs][下载 PDF]
深度 Q-学习的理论分析
Jianqing Fan, Zhaoran Wang, Yuchen Xie, Zhuoran Yang; 第二届动力学与控制学习会议论文集, PMLR 120:486-489
[abs][下载 PDF]
高斯过程状态空间模型的局部主动学习
Alexandre Capone, Gerrit Noske, Jonas Umlauft, Thomas Beckers, Armin Lederer, Sandra Hirche; 第二届动力学与控制学习会议论文集, PMLR 120:490-499
[abs][下载 PDF]
使用汉密尔顿-雅可比可达性生成用于基于学习的视觉导航的鲁棒监督
Anjian Li, Somil Bansal, Georgios Giovanis, Varun Tolani, Claire Tomlin, Mo Chen; 第二届动力学与控制学习会议论文集, PMLR 120:500-510
[abs][下载 PDF]
用于周期性参考跟踪的支持模型预测控制学习
Janine Matschek, Rolf Findeisen; 第二届动力学与控制学习会议论文集, PMLR 120:511-520
[abs][下载 PDF]
具有乘性噪声的数据驱动分布鲁棒 LQR
Peter Coppens, Mathijs Schuurmans, Panagiotis Patrinos; 第二届动力学与控制学习会议论文集, PMLR 120:521-530
[abs][下载 PDF]
通过随机搜索学习无模型线性二次调节器
Hesameddin Mohammadi, Mihailo R. Jovanovic’, Mahdi Soltanolkotabi; 第二届动力学与控制学习会议论文集, PMLR 120:531-539
[abs][下载 PDF]
具有随机化的收缩模型的 Lambda-策略迭代:适定性和收敛性
Yuchao Li, Karl Henrik Johansson, Jonas Mårtensson; 第二届动力学与控制学习会议论文集, PMLR 120:540-549
[abs][下载 PDF]
乐观鲁棒线性二次对偶控制
Jack Umenberger, Thomas B. Schön; 第二届动力学与控制学习会议论文集, PMLR 120:550-560
[abs][下载 PDF]
具有自适应负载分配策略的贝叶斯学习
Manxi Wu, Saurabh Amin, Asuman Ozdaglar; 第二届动力学与控制学习会议论文集, PMLR 120:561-570
[abs][下载 PDF]
具有状态相关不确定性的基于学习的随机模型预测控制
Angelo Domenico Bonzanini, Ali Mesbah; 第二届动力学与控制学习会议论文集, PMLR 120:571-580
[abs][下载 PDF]
具有无界状态空间的稳定强化学习
Devavrat Shah, Qiaomin Xie, Zhi Xu; 第二届动力学与控制学习会议论文集, PMLR 120:581-581
[abs][下载 PDF]
周期性 Q-学习
Donghwan Lee, Niao He; 第二届动力学与控制学习会议论文集, PMLR 120:582-598
[abs][下载 PDF]
通过引导乘性噪声进行鲁棒学习的基于控制
Benjamin Gravell, Tyler Summers; 第二届动力学与控制学习会议论文集, PMLR 120:599-607
[abs][下载 PDF]
用于控制中安全探索的鲁棒回归
Anqi Liu, Guanya Shi, Soon-Jo Chung, Anima Anandkumar, Yisong Yue; 第二届动力学与控制学习会议论文集, PMLR 120:608-619
[abs][下载 PDF]
约束置信上限强化学习
Liyuan Zheng, Lillian Ratliff; 第二届动力学与控制学习会议论文集, PMLR 120:620-629
[abs][下载 PDF]
欧几里得流:用于学习稳定动态系统的微分同胚简化
Muhammad Asif Rana, Anqi Li, Dieter Fox, Byron Boots, Fabio Ramos, Nathan Ratliff; 第二届动力学与控制学习会议论文集, PMLR 120:630-639
[abs][下载 PDF]
使用深度潜在高斯过程动力学从图像进行规划
Nathanael Bosch, Jan Achterhold, Laura Leal-Taixé, Jörg Stückler; 第二届动力学与控制学习会议论文集, PMLR 120:640-650
[abs][下载 PDF]
一种基于第一性原理的方法,用于通过可微分物理引擎进行弹簧杆系统的有效数据系统辨识
Kun Wang, Mridul Aanjaneya, Kostas Bekris; 第二届动力学与控制学习会议论文集, PMLR 120:651-665
[abs][下载 PDF]
基于价值目标回归的模型强化学习
Zeyu Jia, Lin Yang, Csaba Szepesvari, Mengdi Wang; 第二届动力学与控制学习会议论文集, PMLR 120:666-686
[abs][下载 PDF]
具有动态拓扑的网络系统鲁棒控制的局部学习
Soojean Han; 第二届动力学与控制学习会议论文集, PMLR 120:687-696
[abs][下载 PDF]
NeuralExplorer:使用神经网络进行闭环控制系统状态空间探索
Manish Goyal, Parasara Sridhar Duggirala; 第二届动力学与控制学习会议论文集, PMLR 120:697-697
[abs][下载 PDF]
使用机器学习加速模型进行 NSTX-U 聚变等离子体场景规划
Mark Boyer; 第二届动力学与控制学习会议论文集, PMLR 120:698-707
[abs][下载 PDF]
使用控制屏障函数进行安全关键控制的学习
Andrew Taylor, Andrew Singletary, Yisong Yue, Aaron Ames; 第二届动力学与控制学习会议论文集, PMLR 120:708-717
[abs][下载 PDF]
具有侧信息的学习动态系统
Amir Ali Ahmadi, Bachir El Khadir; 第二届动力学与控制学习会议论文集, PMLR 120:718-727
[abs][下载 PDF]
使用二阶 FBSDE 理论的 Feynman-Kac 神经网络架构用于随机控制
Marcus Pereira, Ziyi Wang, Tianrong Chen, Emily Reed, Evangelos Theodorou; 第二届动力学与控制学习会议论文集, PMLR 120:728-738
[abs][下载 PDF]
连续时间 Q-Learning 的 Hamilton-Jacobi-Bellman 方程
Jeongho Kim, Insoon Yang; 动力系统与控制学习第二届会议论文集, PMLR 120:739-748
[abs][下载 PDF]
使用可微物理模拟识别未知物体的机械模型
Changkyu Song, Abdeslam Boularias; 动力系统与控制学习第二届会议论文集, PMLR 120:749-760
[abs][下载 PDF]
基于模型的强化学习中的目标不匹配
Nathan Lambert, Brandon Amos, Omry Yadan, Roberto Calandra; 动力系统与控制学习第二届会议论文集, PMLR 120:761-770
[abs][下载 PDF]
用于欠驱动自适应手掌内操作数据驱动建模的工具
Avishai Sintov, Andrew Kimmel, Bowen Wen, Abdeslam Boularias, Kostas Bekris; 动力系统与控制学习第二届会议论文集, PMLR 120:771-780
[abs][下载 PDF]
学习的高相对阶系统动力学的概率安全约束
Mohammad Javad Khojasteh, Vikas Dhiman, Massimo Franceschetti, Nikolay Atanasov; 动力系统与控制学习第二届会议论文集, PMLR 120:781-792
[abs][下载 PDF]
Lyceum:一个高效且可扩展的机器人学习生态系统
Colin Summers, Kendall Lowrey, Aravind Rajeswaran, Siddhartha Srinivasa, Emanuel Todorov; 动力系统与控制学习第二届会议论文集, PMLR 120:793-803
[abs][下载 PDF]
将物理约束编码到可微牛顿-欧拉算法中
Giovanni Sutanto, Austin Wang, Yixin Lin, Mustafa Mukadam, Gaurav Sukhatme, Akshara Rai, Franziska Meier; 动力系统与控制学习第二届会议论文集, PMLR 120:804-813
[abs][下载 PDF]
用于分散线性二次控制的分布式强化学习:一种无导数策略优化方法
Yingying Li, Yujie Tang, Runyu Zhang, Na Li; 动力系统与控制学习第二届会议论文集, PMLR 120:814-814
[abs][下载 PDF]
通过深度乐观价值探索进行规划学习
Tim Seyde, Wilko Schwarting, Sertac Karaman, Daniela Rus; 动力系统与控制学习第二届会议论文集, PMLR 120:815-825
[abs][下载 PDF]
L1-GP:具有贝叶斯学习的 L1 自适应控制
Aditya Gahlawat, Pan Zhao, Andrew Patterson, Naira Hovakimyan, Evangelos Theodorou; 动力系统与控制学习第二届会议论文集, PMLR 120:826-837
[abs][下载 PDF]
通过网络优化进行数据驱动的分布式预测控制
Ahmed Allibhoy, Jorge Cortes; 动力系统与控制学习第二届会议论文集, PMLR 120:838-839
[abs][下载 PDF]
信息理论模型预测 Q-Learning
Mohak Bhardwaj, Ankur Handa, Dieter Fox, Byron Boots; 动力系统与控制学习第二届会议论文集, PMLR 120:840-850
[abs][下载 PDF]
从单个轨迹学习非线性动力系统
Dylan Foster, Tuhin Sarkar, Alexander Rakhlin; 动力系统与控制学习第二届会议论文集, PMLR 120:851-861
[abs][下载 PDF]
平均奖励遍历马尔可夫决策过程中的后悔最小化的一种对偶方法
Hao Gong, Mengdi Wang; 动力系统与控制学习第二届会议论文集, PMLR 120:862-883
[abs][下载 PDF]
鲁棒深度学习作为最优控制:见解和收敛保证
Jacob H. Seidman, Mahyar Fazlyab, Victor M. Preciado, George J. Pappas; 动力系统与控制学习第二届会议论文集, PMLR 120:884-893
[abs][下载 PDF]
具有参数和结构不确定性的系统的双重随机模型预测控制
Elena Arcari, Lukas Hewing, Max Schlichting, Melanie Zeilinger; 动力系统与控制学习第二届会议论文集, PMLR 120:894-903
[abs][下载 PDF]
用于系统识别和策略提炼的非线性动力学和控制的分层分解
Hany Abdulsamad, Jan Peters; 动力系统与控制学习第二届会议论文集, PMLR 120:904-914
[abs][下载 PDF]
一种基于核均值嵌入的方法,用于减少随机规划和控制中的保守性
Jia-Jie Zhu, Bernhard Schoelkopf, Moritz Diehl; 动力系统与控制学习第二届会议论文集, PMLR 120:915-923
[abs][下载 PDF]
通过仅相信信息性行动来高效大规模高斯过程强盗
Amrit Singh Bedi, Dheeraj Peddireddy, Vaneet Aggarwal, Alec Koppel; 动力系统与控制学习第二届会议论文集, PMLR 120:924-934
[abs][下载 PDF]
Plan2Vec:通过潜在计划进行无监督表征学习
Ge Yang, Amy Zhang, Ari Morcos, Joelle Pineau, Pieter Abbeel, Roberto Calandra; 动力系统与控制学习第二届会议论文集, PMLR 120:935-946
[abs][下载 PDF]
具有混合连续/离散变量的 MDP 的策略学习:马尔可夫跳跃系统模型自由控制的案例研究
Joao Paulo Jansch-Porto, Bin Hu, Geir Dullerud; 动力系统与控制学习第二届会议论文集, PMLR 120:947-957
[abs][下载 PDF]
通过风险厌恶分布强化学习提高鲁棒性
Rahul Singh, Qinsheng Zhang, Yongxin Chen; 动力系统与控制学习第二届会议论文集, PMLR 120:958-968
[abs][下载 PDF]
关键帧未来:用于视觉预测和规划的关键帧发现
Karl Pertsch, Oleh Rybkin, Jingyun Yang, Shenghao Zhou, Konstantinos Derpanis, Kostas Daniilidis, Joseph Lim, Andrew Jaegle; 动力系统与控制学习第二届会议论文集, PMLR 120:969-979
[abs][下载 PDF]
具有应用于策略搜索的安全非平滑黑盒优化
Ilnura Usmanova,Andreas Krause,Maryam Kamgarpour; 第二届动力学与控制学习会议论文集,PMLR 120:980-989
[abs][下载 PDF]
通过强化学习改进双足机器人的输入-输出线性化控制器
Fernando Castañeda,Mathias Wulfman,Ayush Agrawal,Tyler Westenbroek,Shankar Sastry,Claire Tomlin,Koushil Sreenath; 第二届动力学与控制学习会议论文集,PMLR 120:990-999
[abs][下载 PDF]
不确定多智能体 MILP:一种具有概率可行性保证的基于数据的去中心化解决方案
Alessandro Falsone,Federico Molinari,Maria Prandini; 第二届动力学与控制学习会议论文集,PMLR 120:1000-1009
[abs][下载 PDF]