Compartir a través de


¿Qué es la clasificación de texto personalizado?

La clasificación de texto personalizada es una de las características personalizadas que ofrece el lenguaje de Azure en Foundry Tools. Es un servicio de API basado en la nube que aplica inteligencia de aprendizaje automático para permitirle crear modelos personalizados para tareas de clasificación de texto.

La clasificación de texto personalizada permite a los usuarios crear modelos de IA personalizados para clasificar texto en clases personalizadas predefinidas por el usuario. Mediante la creación de un proyecto de clasificación de texto personalizado, los desarrolladores pueden etiquetar datos de forma iterativa, entrenar, evaluar y mejorar el rendimiento del modelo antes de que esté disponible para su consumo. La calidad de los datos etiquetados afecta considerablemente al rendimiento del modelo. Para simplificar la creación y personalización del modelo, el servicio ofrece una plataforma unificada para crear, administrar e implementar soluciones de inteligencia artificial a las que se puede acceder a través de Microsoft Foundry. Si sigue los pasos que se indican en este inicio rápido, le resultará fácil empezar a usar el servicio.

La clasificación de texto personalizada admite dos tipos de proyectos:

  • Clasificación de etiqueta única: se puede asignar una sola clase a cada documento del conjunto de datos. Por ejemplo, un guión de película solo podría clasificarse como "Romance" o "Comedia".
  • Clasificación mediante varias etiquetas: se pueden asignar varias clases a cada documento del conjunto de datos. Por ejemplo, un guión de película podría clasificarse como "Comedia" o "Romance" y "Comedia".

Esta documentación contiene los siguientes tipos de artículos:

  • Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
  • Los conceptos proporcionan explicaciones sobre la funcionalidad y las características del servicio.
  • Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

Escenarios de uso de ejemplo

La clasificación de texto personalizada se puede usar en varios escenarios en varios sectores:

Evaluación automática de prioridades de correos electrónicos o vales

Los centros de soporte de todo tipo reciben un gran volumen de correos electrónicos o tickets que contienen texto no estructurado y archivos adjuntos. La revisión, confirmación y enrutamiento oportunos a expertos en la materia dentro de los equipos internos es fundamental. La evaluación de prioridades de correos electrónicos a esta escala requiere revisarlos y trasladar el asunto a los departamentos adecuados, lo que lleva tiempo y recursos. La clasificación de texto personalizado puede servir para analizar el texto entrante y evaluar y clasificar el contenido, de forma que pueda trasladarse automáticamente al departamento correspondiente para seguir adoptando medidas.

La búsqueda es fundamental para cualquier aplicación que ofrezca contenido de texto a los usuarios. Entre los escenarios comunes se incluyen las búsquedas de catálogos, documentos y productos minoristas o la minería de conocimiento para la ciencia de datos. Muchas empresas de varios sectores buscan crear una mejor experiencia de búsqueda de contenido privado y heterogéneo que incluya documentos tanto estructurados como no estructurados. Como parte de su canalización, los desarrolladores pueden usar la clasificación de texto personalizado para clasificar sus textos en clases que sean relevantes para su sector. Las clases predichas se pueden usar para enriquecer la indexación del archivo, con el fin de personalizar más la experiencia de búsqueda.

Ciclo de vida del desarrollo de proyectos

La creación de un proyecto de clasificación de texto personalizado suele implicar varios pasos.

El ciclo de vida del desarrollo

Siga estos pasos para sacar el máximo partido del modelo:

  1. Definir el esquema: conozca los datos e identifique las clases entre las que quiere marcar diferencias para evitar ambigüedades.

  2. Etiquetar los datos: la calidad del etiquetado de datos es un factor clave para determinar el rendimiento del modelo. Los documentos que pertenecen a la misma clase siempre deben tener la misma clase. Si tiene un archivo que puede pertenecer a dos clases, use proyectos de clasificación de varias etiquetas. Evite ambigüedades de clases; asegúrese de que las clases se pueden separar claramente unas de otras, especialmente en el caso de proyectos de clasificación de etiqueta única.

  3. Entrenar el modelo: el modelo empieza a aprender de los datos etiquetados.

  4. Ver el rendimiento del modelo: vea los detalles de evaluación del modelo para determinar su rendimiento cuando se introduce en datos nuevos.

  5. Implementar el modelo: la implementación de un modelo hace que esté disponible para su uso mediante Analyze API.

  6. Clasificar el texto: use el modelo personalizado en tareas de clasificación de texto personalizado.

Documentación de referencia y ejemplos de código

A medida que use la clasificación de texto personalizada, consulte la siguiente documentación de referencia y ejemplos de lenguaje de Azure en Foundry Tools:

Idioma u opción de desarrollo Documentación de referencia Ejemplos
API de REST (creación) Documentación de la API REST
API de REST (entorno de ejecución) Documentación de la API REST
C# (entorno de ejecución) Documentación de C# Ejemplos de C#: clasificación de etiqueta únicaEjemplos de C#: clasificación de varias etiquetas
Java (Entorno de ejecución) Documentación de Java Ejemplos de Java: clasificación de etiqueta únicaEjemplos de Java: clasificación de varias etiquetas
JavaScript (Entorno de ejecución) Documentación de JavaScript Ejemplos de JavaScript: clasificación de etiqueta únicaEjemplos de JavaScript: clasificación de varias etiquetas
Python (entorno de ejecución) Documentación de Python Ejemplos de Python: clasificación de etiqueta únicaEjemplos de JavaScript: clasificación de varias etiquetas

Inteligencia artificial responsable

Los sistemas de inteligencia artificial no solo incluyen la tecnología, sino también las personas que la usan, las que se ven afectadas por ella y el entorno en el que se implementan. Lea la nota de transparencia sobre la clasificación de texto personalizado para obtener información sobre el uso responsable de la inteligencia artificial y su implementación en los sistemas.

Pasos siguientes

  • Tras leer el artículo de inicio rápido podrá empezar a usar la clasificación de texto personalizada.

  • Cuando avance por el ciclo de vida del desarrollo de proyectos, consulte el glosario para más información sobre los términos que se usan en la documentación para esta característica.

  • No olvide consultar los límites del servicio para obtener información como, por ejemplo, la disponibilidad regional.