Telepresencia monocular: de 2D a 3D en tiempo real sin sensores dedicados

Diego Cangas; Pedro Javier Herrera; José Antonio Piedra

doi:10.64117/simposioscea.v2i2.196

Autores/as

Diego Cangas
Pedro Javier Herrera UNED
José Antonio Piedra

DOI:

https://doi.org/10.64117/simposioscea.v2i2.196

Palabras clave:

Modelado, Identificación y procesamiento de señales, Sistemas Humano Máquina, IA y control, Telemática: Control a través de Redes de Comunicación, Control basado en Datos

Resumen

Este trabajo evalúa la viabilidad de la reconstrucción 3D en tiempo real mediante un sistema monocular, planteándolo como una alternativa de software económica frente a los costosos sistemas de comunicación volumétrica basados en hardware especializado (LiDAR o multicámara). El objetivo central es demostrar que una arquitectura optimizada permite democratizar la telepresencia inmersiva en hardware de consumo. Se ha desarrollado un prototipo basado en microservicios que desacopla el procesamiento (Backend en Python/Flask) de la visualización (Frontend en Unity 3D). El sistema integra YOLO para segmentación y el modelo Intel MiDaS para la estimación de profundidad en tiempo real sobre GPUs NVIDIA RTX. Para garantizar la calidad, se emplea una red FSRCNN personalizada que recupera detalles geométricos finos. El Frontend utiliza VFX Graph para delegar el renderizado íntegramente a la GPU, alcanzando tasas estables de 30 a 60 FPS. Los resultados confirman que la tecnología es técnicamente viable para aplicaciones de consumo masivo, sentando las bases para futuras implementaciones móviles (APK).

Telepresencia monocular: de 2D a 3D en tiempo real sin sensores dedicados

Autores/as

DOI:

Palabras clave:

Resumen

Descargas

Publicado

Número

Sección

Número actual

Información

Enviar un artículo