[编辑]

第120卷:动态与控制学习,2020年6月10-11日,云端

[编辑]

编辑:Alexandre M. Bayen, Ali Jadbabaie, George Pappas, Pablo A. Parrilo, Benjamin Recht, Claire Tomlin, Melanie Zeilinger

[bib][citeproc]

序言

Alexandre M. Bayen, Ali Jadbabaie, George Pappas, Pablo A. Parrilo, Benjamin Recht, Claire Tomlin, Melanie Zeilinger; 动态与控制学习第二届会议论文集, PMLR 120:1-4

主动学习高斯过程动力学

Mona Buisson-Fenet, Friedrich Solowjow, Sebastian Trimpe; 动态与控制学习第二届会议论文集, PMLR 120:5-15

有限样本系统辨识:最优速率和正则化的作用

Yue Sun, Samet Oymak, Maryam Fazel; 动态与控制学习第二届会议论文集, PMLR 120:16-25

分布式两时间尺度随机逼近的有限时间性能

Thinh Doan, Justin Romberg; 动态与控制学习第二届会议论文集, PMLR 120:26-36

带有数据驱动参考模型选择的虚拟参考反馈调整

Valentina Breschi, Simone Formentin; 动态与控制学习第二届会议论文集, PMLR 120:37-45

带有嵌入防饱和补偿的直接数据驱动控制

Valentina Breschi, Simone Formentin; 动态与控制学习第二届会议论文集, PMLR 120:46-54

高维向量自回归模型的稀疏和低偏差估计

Trevor Ruiz, Sharmodeep Bhattacharyya, Mahesh Balasubramanian, Kristofer Bouchard; 动态与控制学习第二届会议论文集, PMLR 120:55-64

具有扩展卡尔曼滤波、指数移动平均和动态多历元策略的鲁棒在线模型自适应

Abulikemu Abuduweili, Changliu Liu; 动态与控制学习第二届会议论文集, PMLR 120:65-74

使用场景优化估计可达集

Alex Devonport, Murat Arcak; 动态与控制学习第二届会议论文集, PMLR 120:75-84

LSTM 神经网络:输入到状态稳定性与概率安全验证

Fabio Bonassi, Enrico Terzi, Marcello Farina, Riccardo Scattolini; 动态与控制学习第二届会议论文集, PMLR 120:85-94

自回归模型中的贝叶斯联合状态和参数跟踪

Ismail Senoz, Albert Podusenko, Wouter M. Kouw, Bert Vries; 动态与控制学习第二届会议论文集, PMLR 120:95-104

学习动态系统的对应关系

Nam Hee Kim, Zhaoming Xie, Michiel Panne; 动态与控制学习第二届会议论文集, PMLR 120:105-117

使用 Benders 切割学习混合控制问题的解

Sandeep Menta, Joseph Warrington, John Lygeros, Manfred Morari; 动态与控制学习第二届会议论文集, PMLR 120:118-126

具有可训练延迟的前馈神经网络

Xunbi A. Ji, Tamás G. Molnár, Sergei S. Avedisov, Gábor Orosz; 动态与控制学习第二届会议论文集, PMLR 120:127-136

利用自适应 MPC 中的模型稀疏性:压缩感知视角

Monimoy Bujarbaruah, Charlott Vallon; 动态与控制学习第二届会议论文集, PMLR 120:137-146

部分可观测不稳定高斯过程状态空间模型中的结构化变分推断

Sebastian Curi, Silvan Melchior, Felix Berkenkamp, Andreas Krause; 动态与控制学习第二届会议论文集, PMLR 120:147-157

安全高斯过程 Bandit 优化的后悔界限

Sanae Amani, Mahnoosh Alizadeh, Christos Thrampoulidis; 动态与控制学习第二届会议论文集, PMLR 120:158-159

用于安全在线学习的高斯过程的智能遗忘

Jonas Umlauft, Thomas Beckers, Alexandre Capone, Armin Lederer, Sandra Hirche; 动态与控制学习第二届会议论文集, PMLR 120:160-169

线性反对称循环神经网络

Signe Moe, Filippo Remonato, Esten Ingar Grøtli, Jan Tommy Gravdahl; 动态与控制学习第二届会议论文集, PMLR 120:170-178

用于具有 $\mathcal{H}_2$ 线性控制和 $\mathcal{H}_\infty$ 鲁棒性保证的策略优化:隐式正则化和全局收敛

Kaiqing Zhang, Bin Hu, Tamer Basar; 动态与控制学习第二届会议论文集, PMLR 120:179-190

稳定自回归过程的有限样本偏差界限

Rodrigo A. González, Cristian R. Rojas; 动态与控制学习第二届会议论文集, PMLR 120:191-200

在线数据投毒攻击

薛洲张, 肖金朱, 洛朗·莱萨尔; 第二届动力学与控制学习会议论文集, PMLR 120:201-210

用于MPC的实用强化学习:在真实机器人上不到一小时内从稀疏目标中学习

纳帕特·卡纳查里, 米格尔·伊格莱西亚·瓦尔斯, 大卫·霍勒, 马可·胡特; 第二届动力学与控制学习会议论文集, PMLR 120:211-224

使用遵守高斯过程的Gauss原理学习约束动力学

安德烈亚斯·盖斯特, 塞巴斯蒂安·特林佩; 第二届动力学与控制学习会议论文集, PMLR 120:225-234

用于最优控制的反事实编程

路易斯·F.O. 查蒙, 圣地亚哥·帕特奈因, 亚历杭德罗·里贝罗; 第二届动力学与控制学习会议论文集, PMLR 120:235-244

从具有语义观察的演示中学习导航成本

田宇王, 维卡斯·迪曼, 尼科莱·阿塔纳索夫; 第二届动力学与控制学习会议论文集, PMLR 120:245-255

用于多智能体网络系统的局部策略的可扩展强化学习

关楠曲, 亚当·维尔曼, 娜·李; 第二届动力学与控制学习会议论文集, PMLR 120:256-266

具有稳定性保证的黑盒连续时间传递函数估计:基于核的方法

米尔科·马佐莱尼, 马泰奥·斯坎德拉, 西蒙·福尔门丁, 法比奥·普雷维迪; 第二届动力学与控制学习会议论文集, PMLR 120:267-276

通过交叉熵和基于梯度的优化进行模型预测控制

霍曼加·巴拉德瓦杰, 凯文·谢, 弗洛里安·施库尔蒂; 第二届动力学与控制学习会议论文集, PMLR 120:277-286

学习全局最优分布式LQ调节器

卢卡·富里耶里, 杨·郑, 玛丽亚姆·坎加普尔; 第二届动力学与控制学习会议论文集, PMLR 120:287-297

VarNet:用于求解偏微分方程的变分神经网络

雷扎·霍达伊-梅尔, 迈克尔·扎夫拉诺斯; 第二届动力学与控制学习会议论文集, PMLR 120:298-307

可追踪的信号时序逻辑目标的强化学习

哈里什·文卡塔拉曼, 德里亚·阿克萨拉, 彼得·塞勒; 第二届动力学与控制学习会议论文集, PMLR 120:308-317

用于建模船舶意图的空间和时间注意力联合轨迹预测框架

贾斯敏·塞孔, 科迪·弗莱明; 第二届动力学与控制学习会议论文集, PMLR 120:318-327

用于机器人学习和控制的结构化机械模型

杰伊什·K. 古普塔, 库纳尔·门达, 扎卡里·曼彻斯特, 迈克尔·科切恩德费尔; 第二届动力学与控制学习会议论文集, PMLR 120:328-337

用于非线性系统的近似被动线性模型的基于数据的识别

S. 西瓦兰贾尼, 埃蒂卡·阿加瓦尔, 维杰·古普塔; 第二届动力学与控制学习会议论文集, PMLR 120:338-339

使用迭代学习控制和参考校正器进行批量过程的约束管理

艾丹·拉拉西, 哈米德·奥萨雷; 第二届动力学与控制学习会议论文集, PMLR 120:340-349

基于感知的控制的鲁棒保证

莎拉·迪恩, 尼科莱·马特尼, 本杰明·雷希特, 维姬·叶; 第二届动力学与控制学习会议论文集, PMLR 120:350-360

学习凸优化控制策略

阿克谢·阿格拉瓦尔, 谢恩·巴拉特, 斯蒂芬·博伊德, 巴托洛梅奥·斯泰拉托; 第二届动力学与控制学习会议论文集, PMLR 120:361-373

使用卡尔曼约束将线性控制策略拟合到演示中

马拉扬迪·帕兰, 谢恩·巴拉特, 亚历克斯·麦考利, 多尔萨·萨迪格, 维卡斯·辛德瓦尼, 斯蒂芬·博伊德; 第二届动力学与控制学习会议论文集, PMLR 120:374-383

使用循环神经网络对稳定动态系统的通用模拟

乔舒亚·汉森, 马克西姆·拉金斯基; 第二届动力学与控制学习会议论文集, PMLR 120:384-392

收缩隐式循环神经网络:具有改进训练能力的稳定模型

麦克斯·雷瓦伊, 伊恩·曼彻斯特; 第二届动力学与控制学习会议论文集, PMLR 120:393-403

关于线性系统数据驱动控制器的鲁棒性

拉贾塞卡尔·安古鲁里, 阿贝德·阿尔拉曼·阿尔·马克达, 维巴夫·卡特瓦, 法比奥·帕斯夸莱蒂; 第二届动力学与控制学习会议论文集, PMLR 120:404-412

用于求解大规模马尔可夫决策过程的更快鞍点优化

琼·巴斯·塞拉诺, 格尔盖利·诺伊; 第二届动力学与控制学习会议论文集, PMLR 120:413-423

关于使用高斯过程动力学的模拟和轨迹预测

卢卡斯·休温, 埃莱娜·阿尔卡里, 卢卡斯·P. 弗洛利希, 梅拉妮·N. 塞林格; 第二届动力学与控制学习会议论文集, PMLR 120:424-434

未知系统卡尔曼滤波的样本复杂度

阿纳斯塔西奥斯·齐亚米斯, 尼科莱·马特尼, 乔治·帕帕斯; 第二届动力学与控制学习会议论文集, PMLR 120:435-444

NeurOpt:基于神经网络的优化,用于建筑能源管理和气候控制

阿钦·贾因, 弗朗切斯科·斯马拉, 恩里科·雷蒂奇奥利, 亚历山德罗·迪诺琴佐, 曼弗雷德·莫拉里; 第二届动力学与控制学习会议论文集, PMLR 120:445-454

贝叶斯模型预测控制:使用后验抽样进行高效的模型探索和遗憾界限

金·彼得·瓦伯西奇, 梅拉妮·塞林格; 第二届动力学与控制学习会议论文集, PMLR 120:455-464

用于基于学习的控制的控制仿射系统的参数优化

阿明·莱德勒, 亚历山德雷·卡波内, 桑德拉·希尔希; 第二届动力学与控制学习会议论文集, PMLR 120:465-475

用于在线线性二次控制的Riccati更新

Mohammad Akbari, Bahman Gharesifard, Tamas Linder; 第二届动力学与控制学习会议论文集, PMLR 120:476-485

深度 Q-学习的理论分析

Jianqing Fan, Zhaoran Wang, Yuchen Xie, Zhuoran Yang; 第二届动力学与控制学习会议论文集, PMLR 120:486-489

高斯过程状态空间模型的局部主动学习

Alexandre Capone, Gerrit Noske, Jonas Umlauft, Thomas Beckers, Armin Lederer, Sandra Hirche; 第二届动力学与控制学习会议论文集, PMLR 120:490-499

使用汉密尔顿-雅可比可达性生成用于基于学习的视觉导航的鲁棒监督

Anjian Li, Somil Bansal, Georgios Giovanis, Varun Tolani, Claire Tomlin, Mo Chen; 第二届动力学与控制学习会议论文集, PMLR 120:500-510

用于周期性参考跟踪的支持模型预测控制学习

Janine Matschek, Rolf Findeisen; 第二届动力学与控制学习会议论文集, PMLR 120:511-520

具有乘性噪声的数据驱动分布鲁棒 LQR

Peter Coppens, Mathijs Schuurmans, Panagiotis Patrinos; 第二届动力学与控制学习会议论文集, PMLR 120:521-530

通过随机搜索学习无模型线性二次调节器

Hesameddin Mohammadi, Mihailo R. Jovanovic’, Mahdi Soltanolkotabi; 第二届动力学与控制学习会议论文集, PMLR 120:531-539

具有随机化的收缩模型的 Lambda-策略迭代:适定性和收敛性

Yuchao Li, Karl Henrik Johansson, Jonas Mårtensson; 第二届动力学与控制学习会议论文集, PMLR 120:540-549

乐观鲁棒线性二次对偶控制

Jack Umenberger, Thomas B. Schön; 第二届动力学与控制学习会议论文集, PMLR 120:550-560

具有自适应负载分配策略的贝叶斯学习

Manxi Wu, Saurabh Amin, Asuman Ozdaglar; 第二届动力学与控制学习会议论文集, PMLR 120:561-570

具有状态相关不确定性的基于学习的随机模型预测控制

Angelo Domenico Bonzanini, Ali Mesbah; 第二届动力学与控制学习会议论文集, PMLR 120:571-580

具有无界状态空间的稳定强化学习

Devavrat Shah, Qiaomin Xie, Zhi Xu; 第二届动力学与控制学习会议论文集, PMLR 120:581-581

周期性 Q-学习

Donghwan Lee, Niao He; 第二届动力学与控制学习会议论文集, PMLR 120:582-598

通过引导乘性噪声进行鲁棒学习的基于控制

Benjamin Gravell, Tyler Summers; 第二届动力学与控制学习会议论文集, PMLR 120:599-607

用于控制中安全探索的鲁棒回归

Anqi Liu, Guanya Shi, Soon-Jo Chung, Anima Anandkumar, Yisong Yue; 第二届动力学与控制学习会议论文集, PMLR 120:608-619

约束置信上限强化学习

Liyuan Zheng, Lillian Ratliff; 第二届动力学与控制学习会议论文集, PMLR 120:620-629

欧几里得流:用于学习稳定动态系统的微分同胚简化

Muhammad Asif Rana, Anqi Li, Dieter Fox, Byron Boots, Fabio Ramos, Nathan Ratliff; 第二届动力学与控制学习会议论文集, PMLR 120:630-639

使用深度潜在高斯过程动力学从图像进行规划

Nathanael Bosch, Jan Achterhold, Laura Leal-Taixé, Jörg Stückler; 第二届动力学与控制学习会议论文集, PMLR 120:640-650

一种基于第一性原理的方法,用于通过可微分物理引擎进行弹簧杆系统的有效数据系统辨识

Kun Wang, Mridul Aanjaneya, Kostas Bekris; 第二届动力学与控制学习会议论文集, PMLR 120:651-665

基于价值目标回归的模型强化学习

Zeyu Jia, Lin Yang, Csaba Szepesvari, Mengdi Wang; 第二届动力学与控制学习会议论文集, PMLR 120:666-686

具有动态拓扑的网络系统鲁棒控制的局部学习

Soojean Han; 第二届动力学与控制学习会议论文集, PMLR 120:687-696

NeuralExplorer:使用神经网络进行闭环控制系统状态空间探索

Manish Goyal, Parasara Sridhar Duggirala; 第二届动力学与控制学习会议论文集, PMLR 120:697-697

使用机器学习加速模型进行 NSTX-U 聚变等离子体场景规划

Mark Boyer; 第二届动力学与控制学习会议论文集, PMLR 120:698-707

使用控制屏障函数进行安全关键控制的学习

Andrew Taylor, Andrew Singletary, Yisong Yue, Aaron Ames; 第二届动力学与控制学习会议论文集, PMLR 120:708-717

具有侧信息的学习动态系统

Amir Ali Ahmadi, Bachir El Khadir; 第二届动力学与控制学习会议论文集, PMLR 120:718-727

使用二阶 FBSDE 理论的 Feynman-Kac 神经网络架构用于随机控制

Marcus Pereira, Ziyi Wang, Tianrong Chen, Emily Reed, Evangelos Theodorou; 第二届动力学与控制学习会议论文集, PMLR 120:728-738

连续时间 Q-Learning 的 Hamilton-Jacobi-Bellman 方程

Jeongho Kim, Insoon Yang; 动力系统与控制学习第二届会议论文集, PMLR 120:739-748

使用可微物理模拟识别未知物体的机械模型

Changkyu Song, Abdeslam Boularias; 动力系统与控制学习第二届会议论文集, PMLR 120:749-760

基于模型的强化学习中的目标不匹配

Nathan Lambert, Brandon Amos, Omry Yadan, Roberto Calandra; 动力系统与控制学习第二届会议论文集, PMLR 120:761-770

用于欠驱动自适应手掌内操作数据驱动建模的工具

Avishai Sintov, Andrew Kimmel, Bowen Wen, Abdeslam Boularias, Kostas Bekris; 动力系统与控制学习第二届会议论文集, PMLR 120:771-780

学习的高相对阶系统动力学的概率安全约束

Mohammad Javad Khojasteh, Vikas Dhiman, Massimo Franceschetti, Nikolay Atanasov; 动力系统与控制学习第二届会议论文集, PMLR 120:781-792

Lyceum:一个高效且可扩展的机器人学习生态系统

Colin Summers, Kendall Lowrey, Aravind Rajeswaran, Siddhartha Srinivasa, Emanuel Todorov; 动力系统与控制学习第二届会议论文集, PMLR 120:793-803

将物理约束编码到可微牛顿-欧拉算法中

Giovanni Sutanto, Austin Wang, Yixin Lin, Mustafa Mukadam, Gaurav Sukhatme, Akshara Rai, Franziska Meier; 动力系统与控制学习第二届会议论文集, PMLR 120:804-813

用于分散线性二次控制的分布式强化学习:一种无导数策略优化方法

Yingying Li, Yujie Tang, Runyu Zhang, Na Li; 动力系统与控制学习第二届会议论文集, PMLR 120:814-814

通过深度乐观价值探索进行规划学习

Tim Seyde, Wilko Schwarting, Sertac Karaman, Daniela Rus; 动力系统与控制学习第二届会议论文集, PMLR 120:815-825

L1-GP:具有贝叶斯学习的 L1 自适应控制

Aditya Gahlawat, Pan Zhao, Andrew Patterson, Naira Hovakimyan, Evangelos Theodorou; 动力系统与控制学习第二届会议论文集, PMLR 120:826-837

通过网络优化进行数据驱动的分布式预测控制

Ahmed Allibhoy, Jorge Cortes; 动力系统与控制学习第二届会议论文集, PMLR 120:838-839

信息理论模型预测 Q-Learning

Mohak Bhardwaj, Ankur Handa, Dieter Fox, Byron Boots; 动力系统与控制学习第二届会议论文集, PMLR 120:840-850

从单个轨迹学习非线性动力系统

Dylan Foster, Tuhin Sarkar, Alexander Rakhlin; 动力系统与控制学习第二届会议论文集, PMLR 120:851-861

平均奖励遍历马尔可夫决策过程中的后悔最小化的一种对偶方法

Hao Gong, Mengdi Wang; 动力系统与控制学习第二届会议论文集, PMLR 120:862-883

鲁棒深度学习作为最优控制:见解和收敛保证

Jacob H. Seidman, Mahyar Fazlyab, Victor M. Preciado, George J. Pappas; 动力系统与控制学习第二届会议论文集, PMLR 120:884-893

具有参数和结构不确定性的系统的双重随机模型预测控制

Elena Arcari, Lukas Hewing, Max Schlichting, Melanie Zeilinger; 动力系统与控制学习第二届会议论文集, PMLR 120:894-903

用于系统识别和策略提炼的非线性动力学和控制的分层分解

Hany Abdulsamad, Jan Peters; 动力系统与控制学习第二届会议论文集, PMLR 120:904-914

一种基于核均值嵌入的方法,用于减少随机规划和控制中的保守性

Jia-Jie Zhu, Bernhard Schoelkopf, Moritz Diehl; 动力系统与控制学习第二届会议论文集, PMLR 120:915-923

通过仅相信信息性行动来高效大规模高斯过程强盗

Amrit Singh Bedi, Dheeraj Peddireddy, Vaneet Aggarwal, Alec Koppel; 动力系统与控制学习第二届会议论文集, PMLR 120:924-934

Plan2Vec:通过潜在计划进行无监督表征学习

Ge Yang, Amy Zhang, Ari Morcos, Joelle Pineau, Pieter Abbeel, Roberto Calandra; 动力系统与控制学习第二届会议论文集, PMLR 120:935-946

具有混合连续/离散变量的 MDP 的策略学习:马尔可夫跳跃系统模型自由控制的案例研究

Joao Paulo Jansch-Porto, Bin Hu, Geir Dullerud; 动力系统与控制学习第二届会议论文集, PMLR 120:947-957

通过风险厌恶分布强化学习提高鲁棒性

Rahul Singh, Qinsheng Zhang, Yongxin Chen; 动力系统与控制学习第二届会议论文集, PMLR 120:958-968

关键帧未来:用于视觉预测和规划的关键帧发现

Karl Pertsch, Oleh Rybkin, Jingyun Yang, Shenghao Zhou, Konstantinos Derpanis, Kostas Daniilidis, Joseph Lim, Andrew Jaegle; 动力系统与控制学习第二届会议论文集, PMLR 120:969-979

具有应用于策略搜索的安全非平滑黑盒优化

Ilnura Usmanova,Andreas Krause,Maryam Kamgarpour第二届动力学与控制学习会议论文集,PMLR 120:980-989

通过强化学习改进双足机器人的输入-输出线性化控制器

Fernando Castañeda,Mathias Wulfman,Ayush Agrawal,Tyler Westenbroek,Shankar Sastry,Claire Tomlin,Koushil Sreenath第二届动力学与控制学习会议论文集,PMLR 120:990-999

不确定多智能体 MILP:一种具有概率可行性保证的基于数据的去中心化解决方案

Alessandro Falsone,Federico Molinari,Maria Prandini第二届动力学与控制学习会议论文集,PMLR 120:1000-1009

订阅 通过 RSS