[编辑]

第144卷:动力学与控制学习,2021年6月7-8日,云端

[编辑]

编辑:Ali Jadbabaie, John Lygeros, George J. Pappas, Pablo A. Parrilo, Benjamin Recht, Claire J. Tomlin, Melanie N. Zeilinger

[bib][citeproc]

序言

Ali Jadbabaie, John Lygeros, George J. Pappas, Pablo A. Parrilo, Benjamin Recht, Claire J. Tomlin, Melanie N. Zeilinger; 第3届动力学与控制学习会议论文集, PMLR 144:1-5

连续强化学习基于模型的随机值梯度

Brandon Amos, Samuel Stanton, Denis Yarats, Andrew Gordon Wilson; 第3届动力学与控制学习会议论文集, PMLR 144:6-20

不变策略优化:迈向强化学习中更强的泛化能力

Anoopkumar Sonar, Vincent Pacelli, Anirudha Majumdar; 第3届动力学与控制学习会议论文集, PMLR 144:21-33

基于学习的状态重构,用于噪声拉格朗日感应下的标量双曲偏微分方程

Matthieu Barreau, John Liu, Karl Henrik Johansson; 第3届动力学与控制学习会议论文集, PMLR 144:34-46

非线性两时间尺度随机逼近:收敛性和有限时间性能

Thinh T. Doan; 第3届动力学与控制学习会议论文集, PMLR 144:47-47

强凸和光滑函数的动态遗憾改进分析

Peng Zhao, Lijun Zhang; 第3届动力学与控制学习会议论文集, PMLR 144:48-59

从对数级样本中学习部分观测线性动态系统

Salar Fattahi; 第3届动力学与控制学习会议论文集, PMLR 144:60-72

用于元强化学习的隐藏状态和隐藏任务的离散信念估计

Kei Akuzawa, Yusuke Iwasawa, Yutaka Matsuo; 第3届动力学与控制学习会议论文集, PMLR 144:73-86

云辅助性能驱动框架,用于学习最优反馈策略的优势

Laura Ferrarotti, Valentina Breschi, Alberto Bemporad; 第3届动力学与控制学习会议论文集, PMLR 144:87-98

基于数据的用于线控制动应用的切换参考控制器设计

Andrea Sassella, Valentina Breschi, Simone Formentin; 第3届动力学与控制学习会议论文集, PMLR 144:99-110

用于分布式线性二次控制的图神经网络

Fernando Gama, Somayeh Sojoudi; 第3届动力学与控制学习会议论文集, PMLR 144:111-124

学习主动减少机器人控制任务的内存需求

Meghan Booker, Anirudha Majumdar; 第3届动力学与控制学习会议论文集, PMLR 144:125-137

基于输入输出数据的鲁棒跟踪控制器的非保守设计

Liang Xu, Mustafa Sahin Turan, Baiwei Guo, Giancarlo Ferrari-Trecate; 第3届动力学与控制学习会议论文集, PMLR 144:138-149

具有分布式约束的次模最大化优化算法

Alexander Robey, Arman Adibi, Brent Schlotfeldt, Hamed Hassani, George J. Pappas; 第3届动力学与控制学习会议论文集, PMLR 144:150-162

使用矩阵 zonotope 进行数据驱动的可达性分析

Amr Alanwar, Anne Koch, Frank Allgöwer, Karl Henrik Johansson; 第3届动力学与控制学习会议论文集, PMLR 144:163-175

学习动态网络中的局部模块

Paul M.J. Van den Hof, Karthik R. Ramaswamy; 第3届动力学与控制学习会议论文集, PMLR 144:176-188

数据驱动的系统级综合

Anton Xue, Nikolai Matni; 第3届动力学与控制学习会议论文集, PMLR 144:189-200

使用分离核学习近似前向可达集

Adam J. Thorpe, Kendric R. Ortiz, Meeko M. K. Oishi; 第3届动力学与控制学习会议论文集, PMLR 144:201-212

未知B矩阵的自适应LQR中无信息最优策略

Ingvar Ziemann, Henrik Sandberg; 第3届动力学与控制学习会议论文集, PMLR 144:213-226

用于高效可扩展策略搜索的谨慎贝叶斯优化

Lukas P. Fröhlich, Melanie N. Zeilinger, Edgar D. Klenske; 第3届动力学与控制学习会议论文集, PMLR 144:227-240

使用深度编码器网络的非线性状态空间辨识

Gerben Beintema, Roland Toth, Maarten Schoukens; 第3届动力学与控制学习会议论文集, PMLR 144:241-250

基于数据的开关参考控制器设计

Felix Bünning, Adrian Schalbetter, Ahmed Aboudonia, Mathias Hudoba de Badyn, Philipp Heer, John Lygeros; 第三届动力学与控制学习会议论文集, PMLR 144:251-262

基于抽象的分支定界方法用于混合最优控制的 Q-learning

Benoît Legat, Raphaël M. Jungers, Jean Bouchat; 第三届动力学与控制学习会议论文集, PMLR 144:263-274

哈密顿深度神经网络的统一框架

Clara Lucía Galimberti, Liang Xu, Giancarlo Ferrari Trecate; 第三届动力学与控制学习会议论文集, PMLR 144:275-286

通过有限视界耗散性进行数据驱动的控制器设计

Nils Wieler, Julian Berberich, Anne Koch, Frank Allgöwer; 第三届动力学与控制学习会议论文集, PMLR 144:287-298

利用参数空间方法进行安全贝叶斯优化控制器设计

Lorenz Dörschel, David Stenger, Dirk Abel; 第三届动力学与控制学习会议论文集, PMLR 144:299-311

具有任意数量移除样本的场景程序的紧凑采样和丢弃界限

Licio Romao, Kostas Margellos, Antonis Papachristodoulou; 第三届动力学与控制学习会议论文集, PMLR 144:312-323

具有高斯过程的概率鲁棒线性二次调节器

Alexander von Rohr, Matthias Neumann-Brosig, Sebastian Trimpe; 第三届动力学与控制学习会议论文集, PMLR 144:324-335

使用顶点网络进行安全强化学习的控制仿射系统

Liyuan Zheng, Yuanyuan Shi, Lillian J. Ratliff, Baosen Zhang; 第三届动力学与控制学习会议论文集, PMLR 144:336-347

用于可变形对象预测模型的顺序拓扑表示

Rika Antonova, Anastasia Varava, Peiyang Shi, J. Frederico Carvalho, Danica Kragic; 第三届动力学与控制学习会议论文集, PMLR 144:348-360

量化和剪枝神经网络的鲁棒误差界限

Jiaqi Li, Ross Drummond, Stephen R. Duncan; 第三届动力学与控制学习会议论文集, PMLR 144:361-372

过参数化神经网络梯度下降的动力学

Siddhartha Satpathi, R Srikant; 第三届动力学与控制学习会议论文集, PMLR 144:373-384

连接基于物理和数据驱动的建模以用于学习动态系统

Rui Wang, Danielle Maddix, Christos Faloutsos, Yuyang Wang, Rose Yu; 第三届动力学与控制学习会议论文集, PMLR 144:385-398

确定性等效感知控制

Sarah Dean, Benjamin Recht; 第三届动力学与控制学习会议论文集, PMLR 144:399-411

何时停止值迭代:稳定性和近似最优性与计算

Mathieu Granzotto, Romain Postoyan, Dragan Nešić, Lucian Buşoniu, Jamal Daafouz; 第三届动力学与控制学习会议论文集, PMLR 144:412-424

学习非线性系统的循环神经网络模型

Joshua Hanson, Maxim Raginsky, Eduardo Sontag; 第三届动力学与控制学习会议论文集, PMLR 144:425-435

基于数据的凸优化方法用于学习 Koopman 算子

Mario Sznaier; 第三届动力学与控制学习会议论文集, PMLR 144:436-446

使用迭代预调进行线性回归分布式 SGD 的加速

Kushal Chakrabarti, Nirupam Gupta, Nikhil Chopra; 第三届动力学与控制学习会议论文集, PMLR 144:447-458

神经 Lyapunov 重设计

Arash Mehrjou, Mohammad Ghavamzadeh, Bernhard Schölkopf; 第三届动力学与控制学习会议论文集, PMLR 144:459-470

自适应风险敏感模型预测控制的遗憾界限

Nicholas M. Boffi, Stephen Tu, Jean-Jacques E. Slotine; 第三届动力学与控制学习会议论文集, PMLR 144:471-483

使用有限状态任务机进行长视野操作任务的自监督学习

Junchi Liang, Abdeslam Boularias; 第三届动力学与控制学习会议论文集, PMLR 144:484-497

从短轨迹安全学习动态系统

Amir Ali Ahmadi, Abraar Chaudhry, Vikas Sindhwani, Stephen Tu; 第三届动力学与控制学习会议论文集, PMLR 144:498-509

具有随机搜索的自适应风险敏感模型预测控制

Ziyi Wang, Oswin So, Keuntaek Lee, Evangelos A. Theodorou; 第三届动力学与控制学习会议论文集, PMLR 144:510-522

非线性数据驱动预测与控制

Yingzhao Lian, Colin N. Jones; 第三届动力学与控制学习会议论文集, PMLR 144:523-534

基于学习的前馈增强,用于纳米级平面执行器系统残余动态的稳态抑制

Ioannis Proimadis, Yorick Broens, Roland Tóth, Hans Butler; 第三届动力学与控制学习会议论文集, PMLR 144:535-546

连续控制任务空间的不优覆盖

James A. Preiss, Gaurav S. Sukhatme; 第三届动力学与控制学习会议论文集, PMLR 144:547-558

线性二次高斯 (LQG) 输出反馈系统的样本复杂度

杨正, 卢卡·富里耶里, 玛丽亚姆·坎加普尔, 李娜; 第三届动力学与控制学习会议论文集, PMLR 144:559-570

基于数据驱动的切换系统控制的机率约束拟凸优化

纪尧姆·O·贝尔热, 拉斐尔·M·容格斯, 哲明·王; 第三届动力学与控制学习会议论文集, PMLR 144:571-583

使用递缩视界学习控制未知(线性)系统

克里斯蒂安·埃本鲍尔, 法比安·皮茨, 书友·余; 第三届动力学与控制学习会议论文集, PMLR 144:584-596

竞争线性二次系统中可证明的样本效率强化学习

景伟·张, 卓然·杨, 正元·周, 昭然·王; 第三届动力学与控制学习会议论文集, PMLR 144:597-598

线性二次高斯 (LQG) 控制优化景观分析

宇杰·唐, 杨正, 李娜; 第三届动力学与控制学习会议论文集, PMLR 144:599-610

具有接触的动力学模型学习的物理惩罚正则化

加布里埃拉·皮祖托, 迈克尔·米斯特里; 第三届动力学与控制学习会议论文集, PMLR 144:611-622

数据对基于学习的控制稳定性的影响

阿明·莱德勒, 亚历山大·卡波内, 托马斯·贝克尔斯, 约纳斯·乌姆劳夫特, 桑德拉·希尔希; 第三届动力学与控制学习会议论文集, PMLR 144:623-635

具有对抗回归器的鲁棒性的加速学习

约瑟夫·E·高迪奥, 阿努拉达·M·安纳斯瓦米, 何塞·M·莫雷乌, 迈克尔·A·博伦德, 特拉维斯·E·吉布森; 第三届动力学与控制学习会议论文集, PMLR 144:636-650

随机异步线性时不变系统的稳定性和辨识

沙欣·拉莱, 奥古赞·泰克, 巴巴克·哈西比, 阿尼玛·阿南德库马尔; 第三届动力学与控制学习会议论文集, PMLR 144:651-663

从单个轨迹学习不稳定线性二次调节器的稳定控制器

莱纳特·特雷文, 塞巴斯蒂安·库里, 莫伊米尔·穆特尼, 安德烈亚斯·克劳斯; 第三届动力学与控制学习会议论文集, PMLR 144:664-676

训练深度残差网络以保证一致逼近

马泰奥·马尔基, 巴赫曼·加雷西法德, 保罗·塔布阿达; 第三届动力学与控制学习会议论文集, PMLR 144:677-688

LEOC:将强化学习与经典控制理论相结合的原则性方法

乃夫·张, 尼古拉斯·卡佩尔; 第三届动力学与控制学习会议论文集, PMLR 144:689-701

无模型风险约束线性二次调节器的对偶学习

飞然·赵, 克友·游; 第三届动力学与控制学习会议论文集, PMLR 144:702-714

利用稀疏性进行神经网络验证

马修·牛顿, 安东尼斯·帕帕克里斯托杜鲁; 第三届动力学与控制学习会议论文集, PMLR 144:715-727

使用高斯过程和基于学习的场景视图合成的感知不确定性的安全探索规划

大伟·孙, 穆罕默德·贾瓦德·霍贾斯特, 舒班舒·谢卡尔, 楚楚·范; 第三届动力学与控制学习会议论文集, PMLR 144:728-741

线性时变系统的稳定在线控制

冠南·屈, 元元·史, 沙欣·拉莱, 阿尼玛·阿南德库马尔, 亚当·维尔曼; 第三届动力学与控制学习会议论文集, PMLR 144:742-753

ARDL - 自适应机器人动力学学习库

乔舒亚·史密斯, 迈克尔·米斯特里; 第三届动力学与控制学习会议论文集, PMLR 144:754-766

具有通信保证的网络线性回归

康斯坦提诺斯·加茨斯; 第三届动力学与控制学习会议论文集, PMLR 144:767-778

嵌套混合专家:混合动力系统的协同和竞争学习

俊赫·安, 路易斯·森蒂斯; 第三届动力学与控制学习会议论文集, PMLR 144:779-790

在不知道的情况下学习:连续迁移强化学习中的未观察到的上下文

陈宇·刘, 燕·张, 毅·申, 迈克尔·M·扎夫拉诺斯; 第三届动力学与控制学习会议论文集, PMLR 144:791-802

基于数据的单调系统抽象

阿纳斯·马克迪西, 安托万·吉拉德, 劳伦特·弗里堡; 第三届动力学与控制学习会议论文集, PMLR 144:803-814

用于强化学习的奖励偏差最大似然估计

阿克谢·梅特, 拉胡尔·辛格, 希·刘, P. R. 库马尔; 第三届动力学与控制学习会议论文集, PMLR 144:815-827

从像素反馈:通过基于学习的场景视图合成进行输出调节

穆拉德·阿布-哈拉夫, 塞塔克·卡拉曼, 丹妮拉·鲁斯; 第三届动力学与控制学习会议论文集, PMLR 144:828-841

通过凸优化认证神经网络的增量二次约束

纳维德·哈希米, 贾斯汀·鲁斯, 马赫亚尔·法兹利亚布; 第三届动力学与控制学习会议论文集, PMLR 144:842-853

贝叶斯学习的近优数据源选择

林涛·叶, 阿里特拉·米特拉, 施雷亚斯·桑达拉姆; 第三届动力学与控制学习会议论文集, PMLR 144:854-865

通过数据驱动的混合动力学和非平滑常微分方程加速并发学习算法

Daniel E. Ochoa, Jorge I. Poveda, Anantharam Subbaraman, Gerd S. Schmidt, Farshad R. Pour-Safaei; 第三届动力学与控制学习会议论文集, PMLR 144:866-878

基于学习的物理网络系统攻击:探索、检测和控制成本权衡

Anshuka Rangi, Mohammad Javad Khojasteh, Massimo Franceschetti; 第三届动力学与控制学习会议论文集, PMLR 144:879-892

有限线性系统集合的极小极大自适应控制

Anders Rantzer; 第三届动力学与控制学习会议论文集, PMLR 144:893-904

学习安全约束所需的探索

Pierre-François Massiani, Steve Heim, Sebastian Trimpe; 第三届动力学与控制学习会议论文集, PMLR 144:905-916

使用车联网进行交通预测

Steven Wong, Lejun Jiang, Robin Walters, Tamás G. Molnár, Gábor Orosz, Rose Yu; 第三届动力学与控制学习会议论文集, PMLR 144:917-929

学习具有可训练延迟的时滞系统的动力学

Xunbi A. Ji, Tamás G. Molnár, Sergei S. Avedisov, Gábor Orosz; 第三届动力学与控制学习会议论文集, PMLR 144:930-942

解耦动力学和采样:用于不均匀采样数据和灵活在线预测的 RNN

Signe Moe, Camilla Sterud; 第三届动力学与控制学习会议论文集, PMLR 144:943-953

学习到的基于感知的控制器受鲁棒控制限制的影响如何?

Jingxi Xu, Bruce Lee, Nikolai Matni, Dinesh Jayaraman; 第三届动力学与控制学习会议论文集, PMLR 144:954-966

自回归外生系统的有限时间系统辨识和自适应控制

Sahin Lale, Kamyar Azizzadenesheli, Babak Hassibi, Anima Anandkumar; 第三届动力学与控制学习会议论文集, PMLR 144:967-979

通过学习和进化自动化发现物理信息神经网络状态空间模型

Elliott Skomski, Ján Drgoňa, Aaron Tuor; 第三届动力学与控制学习会议论文集, PMLR 144:980-991

使用神经网络控制器实现无偏移设定点跟踪

Patricia Pauli, Johannes Köhler, Julian Berberich, Anne Koch, Frank Allgöwer; 第三届动力学与控制学习会议论文集, PMLR 144:992-1003

用于数据驱动预测控制的最大似然信号矩阵模型

Mingzhou Yin, Andrea Iannelli, Roy S. Smith; 第三届动力学与控制学习会议论文集, PMLR 144:1004-1014

KPC:具有确定性保证的学习型模型预测控制

Emilio T. Maddalena, Paul Scharnhorst, Yuning Jiang, Colin N. Jones; 第三届动力学与控制学习会议论文集, PMLR 144:1015-1026

使用高斯过程的收缩L1自适应控制

Aditya Gahlawat, Arun Lakshmanan, Lin Song, Andrew Patterson, Zhuohuan Wu, Naira Hovakimyan, Evangelos A. Theodorou; 第三届动力学与控制学习会议论文集, PMLR 144:1027-1040

使用控制屏障函数和投影到状态安全进行安全双足运动的历元学习

Noel Csomay-Shanklin, Ryan K. Cosner, Min Dai, Andrew J. Taylor, Aaron D. Ames; 第三届动力学与控制学习会议论文集, PMLR 144:1041-1053

使用连续时间梯度的更快策略学习

Samuel Ainsworth, Kendall Lowrey, John Thickstun, Zaid Harchaoui, Siddhartha Srinivasa; 第三届动力学与控制学习会议论文集, PMLR 144:1054-1067

学习如何解决“泡泡球”

Hotae Lee, Monimoy Bujarbaruah, Francesco Borrelli; 第三届动力学与控制学习会议论文集, PMLR 144:1068-1079

线性二次控制的近似中点策略迭代

Benjamin Gravell, Iman Shames, Tyler Summers; 第三届动力学与控制学习会议论文集, PMLR 144:1080-1092

使用鲁棒动作控制器的安全强化学习

Yutong Li, Nan Li, H. Eric Tseng, Anouck Girard, Dimitar Filev, Ilya Kolmanovsky; 第三届动力学与控制学习会议论文集, PMLR 144:1093-1104

SEAGuL:样本高效的对抗引导价值函数学习

Benoit Landry, Hongkai Dai, Marco Pavone; 第三届动力学与控制学习会议论文集, PMLR 144:1105-1117

用于强化学习的快速随机卡尔曼梯度下降

Simone Totaro, Anders Jonsson; 第三届动力学与控制学习会议论文集, PMLR 144:1118-1129

使用系统不变动力学模型的领域自适应

Sean J. Wang, Aaron M. Johnson; 第三届动力学与控制学习会议论文集, PMLR 144:1130-1141

用于机械系统预测和控制的强制变分积分器网络

Aaron Havens, Girish Chowdhary; 第三届动力学与控制学习会议论文集, PMLR 144:1142-1153

使用潜在空间模型的从图像中进行离线强化学习

Rafael Rafailov, Tianhe Yu, Aravind Rajeswaran, Chelsea Finn; 第三届动力学与控制学习会议论文集, PMLR 144:1154-1168

用于估计分布的自适应采样:贝叶斯置信上限方法

Dhruva Kartik, Neeraj Sood, Urbashi Mitra, Tara Javidi; 第三届动力学与控制学习会议论文集, PMLR 144:1169-1179

用于从输入输出数据识别部分观测线性时不变动力系统的新的目标

Nicholas Galioto, Alex Arkady Gorodetsky; 第三届动力学与控制学习会议论文集, PMLR 144:1180-1191

用于控制器验证的对抗扰动生成

Udaya Ghai, David Snyder, Anirudha Majumdar, Elad Hazan; 第三届动力学与控制学习会议论文集, PMLR 144:1192-1204

模型预测控制的优化成本设计

Avik Jain, Lawrence Chan, Daniel S. Brown, Anca D. Dragan; 第三届动力学与控制学习会议论文集, PMLR 144:1205-1217

基于数据的动力学学习的节能神经网络基准测试

Yaofeng Desmond Zhong, Biswadip Dey, Amit Chakraborty; 第三届动力学与控制学习会议论文集, PMLR 144:1218-1229

用于辅助遥操作的视觉引导潜在动作学习

Siddharth Karamcheti, Albert J. Zhai, Dylan P. Losey, Dorsa Sadigh; 第三届动力学与控制学习会议论文集, PMLR 144:1230-1241

鲁棒强化学习:基于约束博弈论的方法

Jing Yu, Clement Gehring, Florian Schäfer, Animashree Anandkumar; 第三届动力学与控制学习会议论文集, PMLR 144:1242-1254

带有模型预测控制应用的近似分布鲁棒非线性优化:一种函数方法

Yassine Nemmour, Bernhard Schölkopf, Jia-Jie Zhu; 第三届动力学与控制学习会议论文集, PMLR 144:1255-1269

后悔最优测量反馈控制

Gautam Goel, Babak Hassibi; 第三届动力学与控制学习会议论文集, PMLR 144:1270-1280

学习用于 Koopman 算子的有限维表示

Mohammad Khosravi; 第三届动力学与控制学习会议论文集, PMLR 144:1281-1281

订阅 通过 RSS