Telepresencia monocular: de 2D a 3D en tiempo real sin sensores dedicados
DOI:
https://doi.org/10.64117/simposioscea.v2i2.196Palabras clave:
Modelado, Identificación y procesamiento de señales, Sistemas Humano Máquina, IA y control, Telemática: Control a través de Redes de Comunicación, Control basado en DatosResumen
Este trabajo evalúa la viabilidad de la reconstrucción 3D en tiempo real mediante un sistema monocular, planteándolo como una alternativa de software económica frente a los costosos sistemas de comunicación volumétrica basados en hardware especializado (LiDAR o multicámara). El objetivo central es demostrar que una arquitectura optimizada permite democratizar la telepresencia inmersiva en hardware de consumo. Se ha desarrollado un prototipo basado en microservicios que desacopla el procesamiento (Backend en Python/Flask) de la visualización (Frontend en Unity 3D). El sistema integra YOLO para segmentación y el modelo Intel MiDaS para la estimación de profundidad en tiempo real sobre GPUs NVIDIA RTX. Para garantizar la calidad, se emplea una red FSRCNN personalizada que recupera detalles geométricos finos. El Frontend utiliza VFX Graph para delegar el renderizado íntegramente a la GPU, alcanzando tasas estables de 30 a 60 FPS. Los resultados confirman que la tecnología es técnicamente viable para aplicaciones de consumo masivo, sentando las bases para futuras implementaciones móviles (APK).