Single-Demonstration Imitation with Residual Reinforcement Learning for Dual-Arm Robotic Bottle Opening

Francisco José Naranjo Campos; Juan Carlos González Victores; Carlos Balaguer; Alberto Jardón

doi:10.64117/simposioscea.v2i2.209

Single-Demonstration Imitation with Residual Reinforcement Learning for Dual-Arm Robotic Bottle Opening

Autores/as

Francisco J. Naranjo-Campos RoboticsLab, Systems and Automation Engineering Department, University Carlos III of Madrid, Leganés, 28911, Madrid, Spain https://orcid.org/0009-0009-3145-1342
Juan G. Victores RoboticsLab, Systems and Automation Engineering Department, University Carlos III of Madrid, Leganés, 28911, Madrid, Spain https://orcid.org/0000-0002-3080-3467
Carlos Balaguer RoboticsLab, Systems and Automation Engineering Department, University Carlos III of Madrid, Leganés, 28911, Madrid, Spain https://orcid.org/0000-0003-4864-4625
Alberto Jardón RoboticsLab, Systems and Automation Engineering Department, University Carlos III of Madrid, Leganés, 28911, Madrid, Spain https://orcid.org/0000-0002-3734-7492

DOI:

https://doi.org/10.64117/simposioscea.v2i2.209

Resumen

Learning manipulation from extremely limited data remains challenging for robotic systems. We present a framework that combines Behavioural Cloning (BC) from a single kinesthetic demonstration with residual Reinforcement Learning (RL) to solve a long-horizon dual-arm bottle unscrewing task. A base policy is first trained via supervised imitation, capturing nominal behaviour. A residual policy is then learned in simulation using PPO to produce bounded corrective actions, improving robustness and generalization to variations in bottle geometry. Results show that while single-demonstration BC performs reliably under nominal conditions, it degrades under distribution shifts. The residual formulation preserves nominal performance and significantly improves robustness. The final controller is deployed in a one-shot sim-to-real transfer, achieving successful execution on different bottle types.

Descargas

Publicado

2026-05-28

Número

Vol. 2 Núm. 2 (2026): Simposio CEA de Robótica, Bioingeniería, Visión Artificial y Automática Marina 2026

Sección

Robótica

Licencia

Los autores conservan los derechos de autor de sus trabajos y conceden a Simposios CEA el derecho de primera publicación.

Los artículos se publican bajo una licencia Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0), que permite compartir, copiar, distribuir y reutilizar el contenido para fines no comerciales, siempre que se reconozca adecuadamente la autoría y la publicación original.

Cualquier uso comercial del contenido requerirá autorización expresa de los titulares de los derechos de autor.

Single-Demonstration Imitation with Residual Reinforcement Learning for Dual-Arm Robotic Bottle Opening

Autores/as

DOI:

Resumen

Descargas

Publicado

Número

Sección

Licencia

Número actual

Información

Enviar un artículo