Marco metodol´ogico para la navegaci´on de robots en invernaderos mediante aprendizaje por refuerzo
DOI:
https://doi.org/10.64117/simposioscea.v2i2.156Palabras clave:
Robótica móvil autónoma, Agricultura, Aprendizaje por refuerzo, Generación de Trayectorias, Machine learning, ROS 2Resumen
La navegación autónoma de robots móviles en invernaderos agrícolas es un reto debido a la naturaleza dinámica, semiestructurada y parcialmente observable de estos entornos. Este artículo propone un marco metodológico basado en el aprendizaje por refuerzo para la planificación de trayectorias en invernaderos mediterráneos. El problema se formula como un planificador sin modelo y se resuelve utilizando el algoritmo \textit{Deep Deterministic Policy Gradient} (DDPG), empleando un esquema de entrenamiento offline basado en el conjunto de datos GREENBOT. Se define una función de recompensa específica para los invernaderos agrícolas, que equilibra el progreso hacia el objetivo con penalizaciones por colisiones y comportamientos inseguros. También se propone un procedimiento de ajuste fino en línea para mejorar la adaptación a las variaciones estructurales y dinámicas del entorno. Este trabajo establece las bases teóricas y metodológicas para el futuro desarrollo de sistemas de navegación robustos en invernaderos reales.