Telepresencia monocular: de 2D a 3D en tiempo real sin sensores dedicados

Autores/as

  • Diego Cangas
  • Pedro Javier Herrera UNED
  • José Antonio Piedra

DOI:

https://doi.org/10.64117/simposioscea.v2i2.196

Palabras clave:

Modelado, Identificación y procesamiento de señales, Sistemas Humano Máquina, IA y control, Telemática: Control a través de Redes de Comunicación, Control basado en Datos

Resumen

Este trabajo evalúa la viabilidad de la reconstrucción 3D en tiempo real mediante un sistema monocular, planteándolo como una alternativa de software económica frente a los costosos sistemas de comunicación volumétrica basados en hardware especializado (LiDAR o multicámara). El objetivo central es demostrar que una arquitectura optimizada permite democratizar la telepresencia inmersiva en hardware de consumo. Se ha desarrollado un prototipo basado en microservicios que desacopla el procesamiento (Backend en Python/Flask) de la visualización (Frontend en Unity 3D). El sistema integra YOLO para segmentación y el modelo Intel MiDaS para la estimación de profundidad en tiempo real sobre GPUs NVIDIA RTX. Para garantizar la calidad, se emplea una red FSRCNN personalizada que recupera detalles geométricos finos. El Frontend utiliza VFX Graph para delegar el renderizado íntegramente a la GPU, alcanzando tasas estables de 30 a 60 FPS. Los resultados confirman que la tecnología es técnicamente viable para aplicaciones de consumo masivo, sentando las bases para futuras implementaciones móviles (APK).

Descargas

Publicado

2026-05-28