Segmentaci´on sem´antica de instancias de objetos empleando un vocabulario abierto
DOI:
https://doi.org/10.64117/simposioscea.v1i1.38Palabras clave:
Visión por Computador, Reconocimiento de Objetos, Aprendizaje Profundo, Segmentación de ImágenesResumen
La segmentación semántica de instancias tradicional, basada en modelos como Detectron2, está restringida por un “vocabulario cerrado” derivado de sus datos de entrenamiento (p. ej. COCO), lo que limita su capacidad para reconocer objetos de categorías no consideradas. Para superar esta limitación, presentamos TALOS, un método modular y flexible para la segmentación semántica de instancias con vocabulario abierto. TALOS ejecuta una secuencia de tres etapas: Tagging (extracción de etiquetas semánticas de las clases de objetos presentes), Location (localización de bounding boxes para cada instancia mediante visual grounding basado en las etiquetas) y Segmentation (generación de máscaras de píxeles precisas de forma agnóstica a la categoría). La modularidad permite integrar diversas tecnologías de vanguardia. Evaluaciones cualitativas demuestran que TALOS identifica y segmenta correctamente objetos de categorías ajenas a COCO, superando a Detectron2 en riqueza semántica y calidad de las máscaras, especialmente en escenas complejas.
Descargas
Publicado
Número
Sección
Licencia
Los autores conservan los derechos de autor de sus trabajos y conceden a Simposios CEA el derecho de primera publicación.
Los artículos se publican bajo una licencia Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0), que permite compartir, copiar, distribuir y reutilizar el contenido para fines no comerciales, siempre que se reconozca adecuadamente la autoría y la publicación original.
Cualquier uso comercial del contenido requerirá autorización expresa de los titulares de los derechos de autor.