Visión por ordenador

3 minutos

Nota:

Consulte la pestaña Texto e imágenes para obtener más detalles.

Computer Vision es el área de la inteligencia artificial que se ocupa del análisis de la entrada visual; como fotografías, vídeos y fuentes de cámara en directo. La visión por computadora se logra utilizando grandes cantidades de imágenes para entrenar un modelo.

Diagrama de un modelo de Computer Vision entrenado con un gran volumen de imágenes.

Hay varios tipos de modelo de Computer Vision.

La clasificación de imágenes es una forma de visión informática en la que un modelo se entrena con imágenes etiquetadas con el asunto principal de la imagen (es decir, lo que es una imagen de) para que pueda analizar imágenes sin etiquetar y predecir la etiqueta más adecuada: identificar el asunto de la imagen.
La detección de objetos es una forma de visión informática en la que se entrena el modelo para identificar la ubicación de objetos específicos en una imagen.
La segmentación semántica es una forma avanzada de detección de objetos donde, en lugar de indicar la ubicación de un objeto dibujando un cuadro alrededor de él, el modelo puede identificar los píxeles individuales de la imagen que pertenecen a un objeto determinado.
Los modelos multi modal combinan características visuales y descripciones de texto asociadas, lo que les permite generar descripciones completas de imágenes.

Escenarios de Computer Vision

Entre los usos comunes de Computer Vision se incluyen:

Agentes de IA que son capaces de interpretar entradas visuales.
Título automático o generación de etiquetas para fotografías.
Búsqueda visual.
Supervisión de los niveles de existencias o identificación de artículos para la compra en escenarios comerciales.
Supervisión de vídeo de seguridad.
Autenticación a través del reconocimiento facial.
Robots y vehículos autocontrolados.

Comentarios

¿Le ha resultado útil esta página?