[编辑]
第100卷:机器人学习会议,2019年10月30日至11月1日
[编辑]
编辑:Leslie Pack Kaelbling,Danica Kragic,Komei Sugiura
[bib][citeproc]
用于腿式机器人的数据高效强化学习
杨玉祥,Ken Caluwaerts,Atil Iscen,张婷楠,谭杰,Vikas Sindhwani; 机器人学习会议论文集, PMLR 100:1-10
[摘要][下载PDF][补充ZIP][补充视频]
跟随还是不跟随:基于观察的选择性模仿学习
Youngwoon Lee,Edward S. Hu,Zhengyu Yang,Joseph J. Lim; 机器人学习会议论文集, PMLR 100:11-23
[摘要][下载PDF][网站]
基于收敛监督的机器人模仿学习
Ashwin Balakrishna,Brijen Thananjeyan,Jonathan Lee,Felix Li,Arsh Zahed,Joseph E. Gonzalez,Ken Goldberg; 机器人学习会议论文集, PMLR 100:24-41
[摘要][下载PDF]
用于多步操作的级联变分推断动力学学习
Kuan Fang,Yuke Zhu,Animesh Garg,Silvio Savarese,Li Fei-Fei; 机器人学习会议论文集, PMLR 100:42-52
[摘要][下载PDF]
S4G:杂乱场景中无模态单视图单次SE(3)抓取检测
Yuzhe Qin,Rui Chen,Hao Zhu,Meng Song,Jing Xu,Hao Su; 机器人学习会议论文集, PMLR 100:53-65
[摘要][下载PDF]
通过作弊学习
Dian Chen,Brady Zhou,Vladlen Koltun,Philipp Krähenbühl; 机器人学习会议论文集, PMLR 100:66-75
[摘要][下载PDF][补充ZIP][源代码]
用于视角无关句子生成的多模态注意力分支网络
Aly Magassouba,Komei Sugiura,Hisashi Kawai; 机器人学习会议论文集, PMLR 100:76-85
[摘要][下载PDF][补充PDF]
MultiPath:用于行为预测的多概率锚轨迹假设
Yuning Chai,Benjamin Sapp,Mayank Bansal,Dragomir Anguelov; 机器人学习会议论文集, PMLR 100:86-99
[摘要][下载PDF]
用于模型预测控制的以对象为中心的前向建模
Yufei Ye,Dhiraj Gandhi,Abhinav Gupta,Shubham Tulsiani; 机器人学习会议论文集, PMLR 100:100-109
[摘要][下载PDF][补充PDF][网站]
通过运动进行多智能体操作的Sim2Real分层
Ofir Nachum,Michael Ahn,Hugo Ponte,Shixiang (Shane) Gu,Vikash Kumar; 机器人学习会议论文集, PMLR 100:110-121
[摘要][下载PDF][网站]
结合深度学习和验证以进行精确的对象实例检测
Siddharth Ancha,Junyu Nan,David Held; 机器人学习会议论文集, PMLR 100:122-141
[摘要][下载PDF][源代码]
MAT:通过深度强化学习进行多指自适应触觉抓取
Bohan Wu,Iretiayo Akinola,Jacob Varley,Peter K. Allen; 机器人学习会议论文集, PMLR 100:142-161
[摘要][下载PDF][补充ZIP][网站]
好奇的iLQR:解决基于模型的强化学习中的不确定性
Sarah Bechtle,Yixin Lin,Akshara Rai,Ludovic Righetti,Franziska Meier; 机器人学习会议论文集, PMLR 100:162-171
[摘要][下载PDF][补充ZIP]
使用切换密度网络进行混合系统辨识
Michael Burke,Yordan Hristov,Subramanian Ramamoorthy; 机器人学习会议论文集, PMLR 100:172-181
[摘要][下载PDF]
使用能量模型正则化基于模型的规划
Rinu Boney,Juho Kannala,Alexander Ilin; 机器人学习会议论文集, PMLR 100:182-191
[摘要][下载PDF]
用于人机协作的半监督决策模型学习
Vaibhav V. Unhelkar,Shen Li,Julie A. Shah; 机器人学习会议论文集, PMLR 100:192-203
[摘要][下载PDF][补充ZIP]
基于李群的运动策略融合通过可学习的Lyapunov函数重塑
Mustafa Mukadam,Ching-An Cheng,Dieter Fox,Byron Boots,Nathan Ratliff; 机器人学习会议论文集, PMLR 100:204-219
[摘要][下载PDF][补充ZIP]
基于感知注意力的预测控制
Keuntaek Lee,Gabriel Nakajima An,Viacheslav Zakharov,Evangelos A. Theodorou; 机器人学习会议论文集, PMLR 100:220-232
[摘要][下载PDF][补充ZIP][补充视频]
贝叶斯优化与机器人学习中的黎曼流形
Noémie Jaquier,Leonel Rozo,Sylvain Calinon,Mathias Bürger; 机器人学习会议论文集, PMLR 100:233-246
[摘要][下载PDF][补充ZIP][网站]
使用基于模型的Gaussian过程进行从演示学习
Noémie Jaquier,David Ginsbourger,Sylvain Calinon; 机器人学习会议论文集, PMLR 100:247-257
[abs][下载 PDF][补充 ZIP][网站]
基于变分推断的贝叶斯模型强化学习 MPC
冈田真史, 谷口正博; 机器人学习会议论文集, PMLR 100:258-272
[abs][下载 PDF][源代码]
优化从演示中学习的概率操作技能序列
卢卡斯·施文克尔, 孟果, 马蒂亚斯·布尔格; 机器人学习会议论文集, PMLR 100:273-282
[abs][下载 PDF][补充 ZIP]
资源受限多智能体系统的预测安全网络
孟果, 马蒂亚斯·布尔格; 机器人学习会议论文集, PMLR 100:283-292
[abs][下载 PDF][补充 ZIP]
笛卡尔空间中机器人控制的面向运动原语的正确公式化
莱奥尼达斯·库特拉斯, 佐伊·杜尔格里; 机器人学习会议论文集, PMLR 100:293-302
[abs][下载 PDF][补充 ZIP][补充视频]
通过移动进行遮挡:从姿态信息中学习无干扰雷达里程计
丹·巴恩斯, 罗布·韦斯顿, 英格玛·波斯纳; 机器人学习会议论文集, PMLR 100:303-316
[abs][下载 PDF][补充视频]
学习 Cassie 的运动技能:迭代设计和 Sim-to-Real
谢肇鸣, 帕特里克·克拉里, 杰里米·道, 佩德罗·莫赖斯, 乔纳森·赫斯特, 米希尔·潘; 机器人学习会议论文集, PMLR 100:317-329
[abs][下载 PDF][补充 ZIP]
通过自动排序的演示学习实现优于演示的学习
丹尼尔·S·布朗, Wonjoon Goo, 斯科特·尼库姆; 机器人学习会议论文集, PMLR 100:330-359
[abs][下载 PDF][补充 ZIP][网站]
马尔可夫决策过程和 Actor-Critic 学习中的互信息正则化
费利克斯·莱布弗里德, Jordi Grau-Moya; 机器人学习会议论文集, PMLR 100:360-373
[abs][下载 PDF]
基于能量模型的模型规划
杜逸伦, 林托鲁, 伊戈尔·莫达奇; 机器人学习会议论文集, PMLR 100:374-383
[abs][下载 PDF]
用于自动驾驶的未知实例识别
Kelvin Wong, 王申龙, 孟业仁, 梁明, Raquel Urtasun; 机器人学习会议论文集, PMLR 100:384-393
[abs][下载 PDF]
视觉与对话导航
杰西·托马森, 迈克尔·默里, 玛雅·卡克马克, 卢克·泽特尔莫耶尔; 机器人学习会议论文集, PMLR 100:394-406
[abs][下载 PDF][补充 ZIP][补充视频]
离散残差流用于概率行人行为预测
Ajay Jain, Sergio Casas, 任杰, 熊宇文, 冯松, Sean Segal, Raquel Urtasun; 机器人学习会议论文集, PMLR 100:407-419
[abs][下载 PDF][补充 ZIP]
结合最优控制和学习,用于在新型环境中进行视觉导航
Somil Bansal, Varun Tolani, Saurabh Gupta, Jitendra Malik, Claire Tomlin; 机器人学习会议论文集, PMLR 100:420-429
[abs][下载 PDF][网站]
利用归一化流在离线算法中利用探索
Bogdan Mazoure, Thang Doan, Audrey Durand, Joelle Pineau, R Devon Hjelm; 机器人学习会议论文集, PMLR 100:430-444
[abs][下载 PDF][源代码][源代码][源代码]
TuneNet:用于系统识别和 Sim-to-Real 机器人任务迁移的一步残差调整
Adam Allevato, Elaine Schaertl Short, Mitch Pryor, Andrea Thomaz; 机器人学习会议论文集, PMLR 100:445-455
[abs][下载 PDF][补充 ZIP][源代码][源代码][源代码][网站]
具有动态压缩的变分潜在空间中的贝叶斯优化
Rika Antonova, Akshara Rai, 李天宇, Danica Kragic; 机器人学习会议论文集, PMLR 100:456-465
[abs][下载 PDF][源代码]
通过评估真实世界机器人的深度强化学习算法进行可重复性调查
Nicolai A. Lynnerup, 劳拉·诺林, Rasmus Hasle, John Hallam; 机器人学习会议论文集, PMLR 100:466-489
[abs][下载 PDF][补充 ZIP][源代码][源代码]
使用基于环境状态表示学习操纵对象集合
Matthew Wilson, Tucker Hermans; 机器人学习会议论文集, PMLR 100:490-502
[abs][下载 PDF]
基于重投影距离的鲁棒半监督单目深度估计
Vitor Guizilini, Jie Li, Rares Ambrus, Sudeep Pillai, Adrien Gaidon; 机器人学习会议论文集, PMLR 100:503-512
[abs][下载 PDF][补充 PDF]
自定步调上下文强化学习
Pascal Klink, Hany Abdulsamad, Boris Belousov, Jan Peters; 机器人学习会议论文集, PMLR 100:513-529
[abs][下载 PDF][补充 ZIP][源代码]
用于自监督机器人学习的上下文想象目标
Ashvin Nair, Shikhar Bahl, Alexander Khazatsky, Vitchyr Pong, Glen Berseth, Sergey Levine; 机器人学习会议论文集, PMLR 100:530-539
[abs][下载 PDF][网站]
基于自然语言指令的条件驾驶
Junha Roh, Chris Paxton, Andrzej Pronobis, Ali Farhadi, Dieter Fox; 机器人学习会议论文集, PMLR 100:540-551
[abs][下载 PDF][补充 ZIP][网站]
用于逆动力学模型学习的对抗主动探索
Zhang-Wei Hong, Tsu-Jui Fu, Tzu-Yun Shann, Chun-Yi Lee; 机器人学习会议论文集, PMLR 100:552-565
[abs][下载 PDF]
基于可迁移潜在动力学模型的模型优化想象值梯度
Arunkumar Byravan, Jost Tobias Springenberg, Abbas Abdolmaleki, Roland Hafner, Michael Neunert, Thomas Lampe, Noah Siegel, Nicolas Heess, Martin Riedmiller; 机器人学习会议论文集, PMLR 100:566-589
[abs][下载 PDF][网站]
PIC:用于多智能体深度强化学习的置换不变批评家
Iou-Jen Liu, Raymond A. Yeh, Alexander G. Schwing; 机器人学习会议论文集, PMLR 100:590-602
[abs][下载 PDF][网站]
HRL4IN:具有移动机械臂的交互式导航的层次强化学习
Chengshu Li, Fei Xia, Roberto Martín-Martín, Silvio Savarese; 机器人学习会议论文集, PMLR 100:603-616
[abs][下载 PDF][网站]
从第一人称视频中学习导航子例程
Ashish Kumar, Saurabh Gupta, Jitendra Malik; 机器人学习会议论文集, PMLR 100:617-626
[abs][下载 PDF][补充 PDF][网站]
可学习的安全度量
Steve Heim, Alexander von Rohr, Sebastian Trimpe, Alexander Badri-Spröwitz; 机器人学习会议论文集, PMLR 100:627-639
[abs][下载 PDF][补充 ZIP]
具有深度微分值函数和动作约束的HJB最优反馈控制
Michael Lutter, Boris Belousov, Kim Listmann, Debora Clever, Jan Peters; 机器人学习会议论文集, PMLR 100:640-650
[abs][下载 PDF]
多帧 GAN:用于低光环境立体视觉里程计的图像增强
Eunah Jung, Nan Yang, Daniel Cremers; 机器人学习会议论文集, PMLR 100:651-660
[abs][下载 PDF][补充 ZIP]
通过深度强化学习保证连通性的多机器人导航
Juntong Lin, Xuyun Yang, Peiwei Zheng, Hui Cheng; 机器人学习会议论文集, PMLR 100:661-670
[abs][下载 PDF][补充 ZIP]
使用图神经网络学习机器人群体的去中心化控制器
Ekaterina Tolstaya, Fernando Gama, James Paulos, George Pappas, Vijay Kumar, Alejandro Ribeiro; 机器人学习会议论文集, PMLR 100:671-682
[abs][下载 PDF][补充 ZIP]
用于强化学习的可靠黑盒优化
Krzysztof Choromanski, Aldo Pacchiano, Jack Parker-Holder, Yunhao Tang, Deepali Jain, Yuxiang Yang, Atil Iscen, Jasmine Hsu, Vikas Sindhwani; 机器人学习会议论文集, PMLR 100:683-696
[abs][下载 PDF]
随机最优控制作为近似输入推断
Joe Watson, Hany Abdulsamad, Jan Peters; 机器人学习会议论文集, PMLR 100:697-716
[abs][下载 PDF][源代码]
AC-Teach:具有 suboptimal 教师集合的策略学习的贝叶斯 Actor-Critic 方法
Andrey Kurenkov, Ajay Mandlekar, Roberto Martin-Martin, Silvio Savarese, Animesh Garg; 机器人学习会议论文集, PMLR 100:717-734
[abs][下载 PDF][网站]
用于机器人混合控制的连续-离散强化学习
Michael Neunert, Abbas Abdolmaleki, Markus Wulfmeier, Thomas Lampe, Tobias Springenberg, Roland Hafner, Francesco Romano, Jonas Buchli, Nicolas Heess, Martin Riedmiller; 机器人会议论文集, PMLR 100:735-751
[abs][下载 PDF][补充 ZIP]
从我的伙伴行动中学习:去中心化机器人团队中的角色
Dylan P. Losey, Mengxi Li, Jeannette Bohg, Dorsa Sadigh; 机器人会议论文集, PMLR 100:752-765
[abs][下载 PDF][补充 ZIP]
地面机器人通过结合空中和地面测量进行节能路径规划
Minghan Wei, Volkan Isler; 机器人会议论文集, PMLR 100:766-775
[abs][下载 PDF][补充 ZIP]
具有多步生成模型的多智能体强化学习
Orr Krupnik, Igor Mordatch, Aviv Tamar; 机器人会议论文集, PMLR 100:776-790
[abs][下载 PDF][补充 ZIP]
使用中级视觉先验进行导航学习
Alexander Sax, Jeffrey O. Zhang, Bradley Emi, Amir Zamir, Silvio Savarese, Leonidas Guibas, Jitendra Malik; 机器人会议论文集, PMLR 100:791-812
[abs][下载 PDF][补充 PDF][网站]
学习具有外生过程的规划的紧凑模型
Rohan Chitnis, Tomás Lozano-Pérez; 机器人会议论文集, PMLR 100:813-822
[abs][下载 PDF][补充 ZIP][补充视频]
用于大规模机器人控制的图策略梯度
Arbaaz Khan, Ekaterina Tolstaya, Alejandro Ribeiro, Vijay Kumar; 机器人会议论文集, PMLR 100:823-834
[abs][下载 PDF]
用于持续参数化环境的深度强化学习课程学习的教师算法
Rémy Portelas, Cédric Colas, Katja Hofmann, Pierre-Yves Oudeyer; 机器人会议论文集, PMLR 100:835-853
[abs][下载 PDF][源代码][网站][网站]
使用深度强化学习进行形态和行为的数据高效协同适应
Kevin Sebastian Luck, Heni Ben Amor, Roberto Calandra; 机器人会议论文集, PMLR 100:854-869
[abs][下载 PDF][网站]
用于解释和从演示中学习的分离关系表示
Yordan Hristov, Daniel Angelov, Michael Burke, Alex Lascarides, Subramanian Ramamoorthy; 机器人会议论文集, PMLR 100:870-884
[abs][下载 PDF][网站]
RoboNet:大规模多机器人学习
Sudeep Dasari, Frederik Ebert, Stephen Tian, Suraj Nair, Bernadette Bucher, Karl Schmeckpeper, Siddharth Singh, Sergey Levine, Chelsea Finn; 机器人会议论文集, PMLR 100:885-897
[abs][下载 PDF][网站]
反例引导的环境行为边界学习
Yuxiao Chen, Sumanth Dathathri, Tung Phan-Minh, Richard M. Murray; 机器人会议论文集, PMLR 100:898-909
[abs][下载 PDF][源代码]
MAME:模型无关的元探索
Swaminathan Gurumurthy, Sumit Kumar, Katia Sycara; 机器人会议论文集, PMLR 100:910-922
[abs][下载 PDF][网站]
用于激光雷达点云的端到端多视图融合的3D对象检测
Yin Zhou, Pei Sun, Yu Zhang, Dragomir Anguelov, Jiyang Gao, Tom Ouyang, James Guo, Jiquan Ngiam, Vijay Vasudevan; 机器人会议论文集, PMLR 100:923-932
[abs][下载 PDF]
用于学习运动原型的任务条件变分自编码器
Michael Noseworthy, Rohan Paul, Subhro Roy, Daehyung Park, Nicholas Roy; 机器人会议论文集, PMLR 100:933-944
[abs][下载 PDF]
Quasi-Newton Trust Region Policy Optimization
Devesh K. Jha, Arvind U. Raghunathan, Diego Romeres; 机器人会议论文集, PMLR 100:945-954
[abs][下载 PDF][补充 PDF]
学习具有关系状态表示的用于指导任务和运动规划的值函数
Beomjoon Kim, Luke Shimanuki; 机器人会议论文集, PMLR 100:955-968
[abs][下载 PDF]
用于自适应模型预测控制的局部加权回归伪重排
Grady R. Williams, Brian Goldfain, Keuntaek Lee, Jason Gibson, James M. Rehg, Evangelos A. Theodorou; 机器人会议论文集, PMLR 100:969-978
[abs][下载 PDF][补充 ZIP]
图结构化视觉模仿
Maximilian Sieb, Zhou Xian, Audrey Huang, Oliver Kroemer, Katerina Fragkiadaki; 机器人会议论文集, PMLR 100:979-989
[abs][下载 PDF][网站]
深度值模型预测控制
David Hoeller, Farbod Farshidian, Marco Hutter; 机器人学习会议论文集, PMLR 100:990-1004
[abs][下载PDF][补充ZIP][补充视频]
使用贝叶斯非参数逆强化学习推断任务目标和约束
Daehyung Park, Michael Noseworthy, Rohan Paul, Subhro Roy, Nicholas Roy; 机器人学习会议论文集, PMLR 100:1005-1014
[abs][下载PDF][补充ZIP]
基于经验的视觉前瞻
Lin Yen-Chen, Maria Bauza, Phillip Isola; 机器人学习会议论文集, PMLR 100:1015-1024
[abs][下载PDF][补充视频]
继电器策略学习:通过模仿和强化学习解决长时效任务
Abhishek Gupta, Vikash Kumar, Corey Lynch, Sergey Levine, Karol Hausman; 机器人学习会议论文集, PMLR 100:1025-1037
[abs][下载PDF][网站]
用于人类教师的非语言机器人反馈
Sandy H. Huang, Isabella Huang, Ravi Pandya, Anca D. Dragan; 机器人学习会议论文集, PMLR 100:1038-1051
[abs][下载PDF]
用于自监督自我运动估计的双流网络
Rares Ambrus, Vitor Guizilini, Jie Li, Sudeep Pillai Adrien Gaidon; 机器人学习会议论文集, PMLR 100:1052-1061
[abs][下载PDF][补充PDF]
基于模型的行为克隆与未来图像相似性学习
Alan Wu, AJ Piergiovanni, Michael S. Ryoo; 机器人学习会议论文集, PMLR 100:1062-1077
[abs][下载PDF]
最坏情况策略梯度
Yichuan Charlie Tang, Jian Zhang, Ruslan Salakhutdinov; 机器人学习会议论文集, PMLR 100:1078-1093
[abs][下载PDF][补充ZIP]
Meta-World:多任务和元强化学习的基准和评估
Tianhe Yu, Deirdre Quillen, Zhanpeng He, Ryan Julian, Karol Hausman, Chelsea Finn, Sergey Levine; 机器人学习会议论文集, PMLR 100:1094-1100
[abs][下载PDF][网站][源代码]
用于学习灵巧操作的基于深度动态模型
Anusha Nagabandi, Kurt Konolige, Sergey Levine, Vikash Kumar; 机器人学习会议论文集, PMLR 100:1101-1112
[abs][下载PDF][网站]
从游戏中学习潜在计划
Corey Lynch, Mohi Khansari, Ted Xiao, Vikash Kumar, Jonathan Tompson, Sergey Levine, Pierre Sermanet; 机器人学习会议论文集, PMLR 100:1113-1132
[abs][下载PDF][网站]
用于密集堆积物体的多实例场景级姿态估计
Chaitanya Mitash, Bowen Wen, Kostas Bekris, Abdeslam Boularias; 机器人学习会议论文集, PMLR 100:1133-1145
[abs][下载PDF]
基于宏动作的深度多智能体强化学习
Yuchen Xiao, Joshua Hoffman, Christopher Amato; 机器人学习会议论文集, PMLR 100:1146-1161
[abs][下载PDF][补充ZIP]
主动领域随机化
Bhairav Mehta, Manfred Diaz, Florian Golemo, Christopher J. Pal, Liam Paull; 机器人学习会议论文集, PMLR 100:1162-1176
[abs][下载PDF]
提出简单的问题:一种用户友好的主动奖励学习方法
Erdem B\iy\ik, Malayandi Palan, Nicholas C. Landolfi, Dylan P. Losey, Dorsa Sadigh; 机器人学习会议论文集, PMLR 100:1177-1190
[abs][下载PDF][补充ZIP][源代码][补充视频]
动态经验回放
Jieliang Luo, Hui Li; 机器人学习会议论文集, PMLR 100:1191-1200
[abs][下载PDF][补充视频]
在部分可观察环境中基于语言引导的语义地图构建和移动操作
Siddharth Patki, Ethan Fahnestock, Thomas M. Howard, Matthew R. Walter; 机器人学习会议论文集, PMLR 100:1201-1210
[abs][下载PDF][补充ZIP]
从演示中学习高维参数约束
Glen Chou, Necmiye Ozay, Dmitry Berenson; 机器人学习会议论文集, PMLR 100:1211-1230
[abs][下载PDF][补充ZIP]
基于变分优化的无限维随机系统的强化学习
Ethan N. Evans, Marcus A. Periera, George I. Boutselis, Evangelos A. Theodorou; 机器人学习会议论文集, PMLR 100:1231-1246
[abs][下载 PDF][补充 ZIP][补充视频][源代码]
理解机器人学习中的教师凝视模式
Akanksha Saran, Elaine Schaertl Short, Andrea Thomaz, Scott Niekum; 机器人学习会议论文集, PMLR 100:1247-1258
[abs][下载 PDF][补充 ZIP]
模仿学习方法的分散最小化视角
Seyed Kamyar Seyed Ghasemipour, Richard Zemel, Shixiang Gu; 机器人学习会议论文集, PMLR 100:1259-1277
[abs][下载 PDF][源代码][网站]
递缩视界好奇心
Matthias Schultheis, Boris Belousov, Hany Abdulsamad, Jan Peters; 机器人学习会议论文集, PMLR 100:1278-1288
[abs][下载 PDF][源代码]
学习将运动学模型泛化到新颖物体
Ben Abbatematteo, Stefanie Tellex, George Konidaris; 机器人学习会议论文集, PMLR 100:1289-1299
[abs][下载 PDF][补充 ZIP]
ROBEL:用于低成本机器人学习的机器人基准
Michael Ahn, Henry Zhu, Kristian Hartikainen, Hugo Ponte, Abhishek Gupta, Sergey Levine, Vikash Kumar; 机器人学习会议论文集, PMLR 100:1300-1313
[abs][下载 PDF][补充 PDF]
为视力障碍者设计的导航代理:人行道模拟器和实验
Martin Weiss, Simon Chamorro, Roger Girgis, Margaux Luck, Samira E. Kahou, Joseph P. Cohen, Derek Nowrouzezahrai, Doina Precup, Florian Golemo, Chris Pal; 机器人学习会议论文集, PMLR 100:1314-1327
[abs][下载 PDF][源代码][源代码][源代码]
深度强化学习的认证对抗鲁棒性
Björn Lütjens, Michael Everett, Jonathan P. How; 机器人学习会议论文集, PMLR 100:1328-1337
[abs][下载 PDF]
基于模型的强化学习的异步方法
Yunzhi Zhang, Ignasi Clavera, Boren Tsai, Pieter Abbeel; 机器人学习会议论文集, PMLR 100:1338-1347
[abs][下载 PDF][网站]
PyRoboLearn:用于机器人学习从业者的 Python 框架
Brian Delhaisse, Leonel Rozo, Darwin G. Caldwell; 机器人学习会议论文集, PMLR 100:1348-1358
[abs][下载 PDF][网站]
无需扭矩测量的反馈线性化控制的在线学习程序
M. Capotondi, G. Turrisi, C. Gaz, V. Modugno, G. Oriolo, A. De Luca; 机器人学习会议论文集, PMLR 100:1359-1368
[abs][下载 PDF][补充 ZIP]
视觉模型化强化学习中实体抽象
Christopher Xie, Yu Xiang, Arsalan Mousavian, Dieter Fox; 机器人学习会议论文集, PMLR 100:1369-1378
[abs][下载 PDF][补充 ZIP][网站]
策略梯度方法中轨迹智慧变分以减少方差
Ching-An Cheng, Xinyan Yan, Byron Boots; 机器人学习会议论文集, PMLR 100:1379-1394
[abs][下载 PDF][补充 PDF]
基于视觉触觉传感器的接触事件检测和预测的学习
Yazhan Zhang, Weihao Yuan, Zicheng Kan, Michael Yu Wang; 机器人学习会议论文集, PMLR 100:1395-1404
[abs][下载 PDF][补充 ZIP][网站]
用于多模态概率运动预测的核轨迹图
Weiming Zhi, Lionel Ott, Fabio Ramos; 机器人学习会议论文集, PMLR 100:1405-1414
[abs][下载 PDF][源代码]
使用模拟飞行学习将自然语言指令映射到物理四旋翼控制
Valts Blukis, Yannick Terme, Eyvind Niklasson, Ross A. Knepper, Yoav Artzi; 机器人学习会议论文集, PMLR 100:1415-1438
[abs][下载 PDF][补充 ZIP][补充视频][补充视频][源代码]
视觉模型化强化学习中的实体抽象
Rishi Veerapaneni, John D. Co-Reyes, Michael Chang, Michael Janner, Chelsea Finn, Jiajun Wu, Joshua Tenenbaum, Sergey Levine; 机器人学习会议论文集, PMLR 100:1439-1456
[abs][下载 PDF]
从人类演示中学习多任务空间中的反应运动策略
M. Asif Rana, Anqi Li, Harish Ravichandar, Mustafa Mukadam, Sonia Chernova, Dieter Fox, Byron Boots, Nathan Ratliff; 机器人学习会议论文集, PMLR 100:1457-1468
[abs][下载 PDF][补充 ZIP][补充视频]