Marco metodol´ogico para la navegaci´on de robots en invernaderos mediante aprendizaje por refuerzo

Autores/as

  • Fernando Cañadas Aranega Universidad de Almería
  • Juan Diego Gil Vergel
  • Jose Carlos Moreno Úbeda
  • Jose Luis Blanco Claraco

DOI:

https://doi.org/10.64117/simposioscea.v2i2.156

Palabras clave:

Robótica móvil autónoma, Agricultura, Aprendizaje por refuerzo, Generación de Trayectorias, Machine learning, ROS 2

Resumen

La navegación autónoma de robots móviles en invernaderos agrícolas es un reto debido a la naturaleza dinámica, semiestructurada y parcialmente observable de estos entornos. Este artículo propone un marco metodológico basado en el aprendizaje por refuerzo para la planificación de trayectorias en invernaderos mediterráneos. El problema se formula como un planificador sin modelo y se resuelve utilizando el algoritmo \textit{Deep Deterministic Policy Gradient} (DDPG), empleando un esquema de entrenamiento offline basado en el conjunto de datos GREENBOT. Se define una función de recompensa específica para los invernaderos agrícolas, que equilibra el progreso hacia el objetivo con penalizaciones por colisiones y comportamientos inseguros. También se propone un procedimiento de ajuste fino en línea para mejorar la adaptación a las variaciones estructurales y dinámicas del entorno. Este trabajo establece las bases teóricas y metodológicas para el futuro desarrollo de sistemas de navegación robustos en invernaderos reales.

Descargas

Publicado

2026-05-28