Ajuste probabilístico de primitivas geométricas con inicialización guiada por VLM

Autores/as

  • Elisabeth Menéndez Salvador Universidad Carlos III de Madrid
  • Santiago Martínez Universidad Carlos III de Madrid
  • Carlos Balaguer Universidad Carlos III de Madrid

DOI:

https://doi.org/10.64117/simposioscea.v2i2.205

Resumen

La interacción física segura con objetos cotidianos desde una única vista requiere representaciones compactas y físicamente coherentes con la escena. Este trabajo aborda el modelado de objetos parcialmente visibles mediante el ajuste probabilístico de primitivas geométricas (superelipsoides, supertoroides y superparaboloides de base desplazada) sobre nubes de puntos incompletas. Utilizamos un modelo Gaussiana--Uniforme con asignación probabilística de inliers y regularizaciones físicas, extendido mediante un ajuste secuencial que permite recuperar múltiples primitivas por objeto. Nuestra contribución principal es una inicialización geométrica guiada por un modelo multimodal visión–lenguaje (VLM), que a partir de una única imagen RGB propone una descomposición en partes y una configuración inicial del tipo de primitiva, su orientación y región de influencia. Estas estimaciones se integran como priors espaciales y condiciones iniciales en la optimización local. Una evaluación cualitativa en escenas de sobremesa muestra mejoras en fidelidad geométrica y consistencia física frente a un ajuste secuencial basado únicamente en inicializaciones por PCA.

Descargas

Publicado

2026-05-28