Compartir a través de


Flujos de trabajo con agentes y modelos de IA en Azure Logic Apps

Se aplica a: Azure Logic Apps (Consumo + Estándar)

Importante

La funcionalidad de flujos de trabajo del agente de consumo está en versión preliminar y está sujeta a los Términos de uso complementarios para las versiones preliminares de Microsoft Azure.

Azure Logic Apps admite flujos de trabajo que completan tareas mediante bucles de agente con modelos de lenguaje grandes (LLM). Un bucle de agente usa un proceso iterativo para resolver problemas complejos y de varios pasos. Un LLM es un programa entrenado que reconoce patrones y realiza trabajos sin interacción humana, por ejemplo:

  • Analice, interprete y razone sobre información como instrucciones, avisos, entradas y otros datos.
  • Tome decisiones, en función de los resultados y los datos disponibles.
  • Formule y devuelva respuestas al solicitante en función de las instrucciones del agente.

Puede crear flujos de trabajo que usen bucles de agente autónomos o conversacionales. El bucle del agente usa lenguaje natural para comunicarse con usted y el modelo conectado. El agente también usa salidas generadas por modelos para trabajar con o sin interacción humana. El modelo ayuda al bucle del agente a proporcionar las siguientes funcionalidades:

  • Acepte información sobre el rol del agente, cómo operar y cómo responder.
  • Recibir y responder a instrucciones y solicitudes, o avisos.
  • Procesar entradas, analizar datos y tomar decisiones, en función de la información disponible.
  • Elija herramientas para completar las tareas necesarias para satisfacer las solicitudes. Una herramienta es básicamente una secuencia con una o varias acciones que completan una tarea.
  • Adaptarse a entornos que requieren flexibilidad y son fluidos, dinámicos, impredecibles o inestables.

Con más de 1400 conectores que puede usar para crear herramientas para que un bucle de agente use, los flujos de trabajo del agente admiten una amplia gama de escenarios que se benefician en gran medida de las funcionalidades de bucle y modelo del agente. En función de su escenario, cree un flujo de trabajo de agente autónomo sin interacción humana o un flujo de trabajo de agente conversacional con interacción humana para satisfacer mejor las necesidades de la solución.

En esta introducción se describen las siguientes áreas:

  • Flujos de trabajo de agente frente a no agente
  • Conceptos clave del bucle del agente
  • Flujos de trabajo autónomos frente a agentes conversacionales
  • Estructura del agente
  • Escenarios de ejemplo
  • Autenticación y autorización
  • Información básica de facturación

Flujos de trabajo de agente frente a no agente

Los flujos de trabajo que usan bucles de agente pueden evolucionar más allá de los límites impuestos a los flujos de trabajo no reactivos. Los flujos de trabajo del agente pueden adaptarse a entornos en los que se producen eventos inesperados, elegir qué herramientas usar en función de las indicaciones, las entradas y los datos disponibles, mejorar continuamente su rendimiento, controlar los datos no estructurados, admitir escenarios complejos y proporcionar un mayor nivel de adaptación y flexibilidad. Los flujos de trabajo no reactivos funcionan mejor en entornos estables, siguen reglas predefinidas y realizan tareas estáticas, predecibles y repetitivas.

En la tabla siguiente se proporcionan más comparaciones entre los flujos de trabajo de agentes y los flujos de trabajo sin agentes.

Aspecto Agente Nonagente
Lógica Tome decisiones informadas sobre las tareas que se van a realizar, en función de las entradas y de otra información disponible, y realice acciones. Siga las reglas predefinidas y las secuencias fijas.
Administración de tareas Tratar las tareas como entidades independientes No aplicable
Estructura de datos Controle y procese datos no estructurados. Controle y procese datos estructurados con patrones predecibles.
Adaptabilidad Detecte y responda a las condiciones y entornos cambiantes, tome decisiones y se adapte a las nuevas entradas en tiempo real. Podría tener problemas con entornos que experimentan cambios inesperados o dinámicos.

Conceptos clave

En la tabla siguiente se proporcionan instrucciones básicas sobre los conceptos clave:

Concepto Descripción
Bucle del agente Acción precompilada que usa un proceso iterativo estructurado para resolver problemas complejos y de varios pasos. El bucle del agente realiza este objetivo siguiendo estos pasos de forma iterativa:

1. Piense: Recopile, procese y analice información y entradas disponibles, como texto, imágenes, audio, datos del sensor, etc., de orígenes de datos específicos. Aplique modelos de motivo, lógica o aprendizaje para comprender las solicitudes, crear planes o soluciones y elegir la mejor acción para responder o satisfacer las solicitudes con ayuda de los modelos de IA generativas.

2. Actuar: En función de las opciones elegidas y las herramientas disponibles, realice tareas en el mundo digital o real.

3. Learn (Opcional): adapte su propio comportamiento a lo largo del tiempo mediante comentarios u otra información.

Un agente puede aceptar instrucciones, trabajar con servicios, sistemas, aplicaciones y datos invocando herramientas que cree con acciones precompiladas en Azure Logic Apps y responda con los resultados. Un agente puede procesar información, tomar decisiones y completar tareas mediante un modelo implementado, por ejemplo, en el servicio Azure OpenAI.

Nota: Un flujo de trabajo de agente puede incluir varios agentes en una secuencia. No se puede agregar un agente insertado como una herramienta en otro agente.

Para más información, consulte ¿Qué es un agente de IA?
Modelo de lenguaje grande (LLM) Un programa entrenado para reconocer patrones y realizar trabajos sin intervención humana.

Para obtener más información, consulte ¿Qué son los modelos de lenguaje grande?
Herramienta Una herramienta contiene una o varias acciones que realizan una tarea para un agente. Por ejemplo, una herramienta puede enviar correo electrónico, trabajar con orígenes de datos, realizar cálculos o conversiones, interactuar con las API, etc. Por ejemplo, consulte Crear herramienta para obtener el tiempo.
Parámetro del agente Parámetro que se crea en una herramienta o en un parámetro de acción, en función del caso de uso del parámetro del agente. Los parámetros del agente se crean para que el agente pueda pasar salidas de solo modelo como entradas de parámetro para una acción en una herramienta. No necesita parámetros de agente para los valores de orígenes que no son de modelos.

Los parámetros del agente difieren de los parámetros tradicionales de las maneras siguientes:

- Los parámetros del agente solo se aplican a la herramienta donde se definen. Esta restricción significa que no se pueden compartir parámetros del agente con otras herramientas. En comparación, puede compartir parámetros tradicionales globalmente con operaciones y estructuras de flujo de control en un flujo de trabajo.

- Los parámetros del agente no usan valores resueltos cuando el flujo de trabajo comienza a ejecutarse. Un parámetro del agente recibe un valor solo si el agente invoca la herramienta mediante argumentos específicos. Estos argumentos se convierten en los parámetros del agente para invocar la herramienta.

: un agente puede invocar la misma herramienta varias veces con valores de parámetros de agente diferentes, incluso cuando esa herramienta existe en la misma iteración de bucle. Por ejemplo, una herramienta puede comprobar el tiempo tanto en Seattle como en Londres.

Para obtener más información, consulte Creación de parámetros del agente para la acción "Obtener previsión".
Contexto Un agente mantiene un historial de registros manteniendo un número máximo de tokens o mensajes como contexto y pasando ese contexto al modelo para la siguiente interacción. Cada modelo tiene límites de longitud de contexto diferentes.

Flujos de trabajo autónomos frente a agentes conversacionales

Para ayudarle a comprender mejor cómo difieren estos tipos de flujo de trabajo de agente, en las secciones siguientes se describen y muestran ejemplos para cada tipo de flujo de trabajo del agente. Ambos tipos de flujo de trabajo usan un bucle de agente y herramientas para obtener el tiempo actual y enviar esa información por correo electrónico. ** Todos los agentes tienen un panel de información en el que se configura el agente con el modelo deseado y se proporcionan instrucciones sobre los roles del agente, sus funciones y la forma de responder.

Flujo de trabajo del agente autónomo

Los siguientes pasos generales describen el comportamiento de un flujo de trabajo básico de agente autónomo:

  1. El flujo de trabajo comienza con cualquier desencadenador compatible disponible.

    Es posible que opcionalmente se ejecuten cero o más acciones entre el desencadenador y el agente.

  2. El agente acepta instrucciones del sistema y mensajes o entradas no humanos, por ejemplo, salidas del desencadenador o una acción previa.

  3. En función de si tiene un flujo de trabajo de agente de consumo o estándar, el agente usa un modelo de Azure OpenAI o una API LLM de la siguiente fuente para interpretar y comprender las instrucciones y las solicitudes. El agente también usa el modelo para procesar y analizar las entradas proporcionadas.

    Aplicación lógica Origen del modelo
    Consumption Microsoft Foundry
    Estándar - Recurso del servicio Azure OpenAI
    - Proyecto de Azure AI Foundry (versión preliminar)
    - Cuenta de Azure API Management con una API de LLM (versión preliminar)
  4. En función de las instrucciones del agente, el modelo ayuda a planear qué herramientas necesita invocar el agente para realizar las tareas necesarias.

  5. El agente devuelve los resultados de la herramienta y responde al autor de la llamada del flujo de trabajo o al destinatario especificado.

En la captura de pantalla siguiente se muestra un flujo de trabajo de agente autónomo de ejemplo básico:

Captura de pantalla que muestra Azure Portal, el diseñador de flujos de trabajo y un ejemplo de flujo de trabajo de agente autónomo básico.

Flujo de trabajo del agente conversacional

Los siguientes pasos generales describen el comportamiento de un flujo de trabajo básico del agente conversacional:

  1. El flujo de trabajo siempre comienza con el desencadenador denominado Cuando se inicia una sesión de chat.

    Es posible que opcionalmente se ejecuten cero o más acciones entre el desencadenador y el agente.

  2. El agente acepta instrucciones del sistema y mensajes o entradas proporcionados por el usuario a través de la interfaz de chat integrada, por ejemplo, ¿Cuál es el tiempo en Seattle?

  3. En función de si tiene un flujo de trabajo de agente de Consumo o Estándar, el agente utiliza un modelo de Azure OpenAI o una API LLM de las siguientes fuentes para interpretar y comprender las instrucciones y la solicitud. El agente también usa el modelo para procesar y analizar las entradas proporcionadas.

    Aplicación lógica Origen del modelo
    Consumption Microsoft Foundry
    Estándar - Recurso del servicio Azure OpenAI
    - Cuenta de Azure API Management con una API de LLM (versión preliminar)
  4. En función de las instrucciones del agente, el modelo ayuda a planear qué herramientas invoca el agente para las tareas necesarias.

  5. El agente devuelve los resultados de la herramienta y responde a través de la interfaz de chat al solicitante humano.

En la captura de pantalla siguiente se muestra un flujo de trabajo de agente conversacional de ejemplo básico:

Captura de pantalla que muestra Azure Portal, el diseñador de flujos de trabajo y un ejemplo de flujo de trabajo básico del agente conversacional.

En la captura de pantalla siguiente se muestra la interfaz de chat integrada a la que puede acceder desde la barra de herramientas del diseñador o el menú de la barra lateral del flujo de trabajo en Azure Portal:

Captura de pantalla que muestra Azure Portal y la interfaz de chat integrada del flujo de trabajo.

Los flujos de trabajo del agente conversacional también admiten un cliente de chat externo que otros usuarios pueden usar fuera de Azure Portal. Para proporcionar y proteger el acceso para este cliente de chat externo, debe configurar la autenticación y autorización de producción.

Exploración de la estructura del flujo de trabajo del agente

Para crear un nuevo flujo de trabajo de agente, cree una aplicación lógica de consumo en Azure Logic Apps multiinquilino o una aplicación lógica estándar en Azure Logic Apps de un solo inquilino y seleccione uno de los siguientes tipos de flujo de trabajo:

  • Agentes autónomos
  • Agentes conversacionales

Estos tipos de flujo de trabajo incluyen todas las funcionalidades de los flujos de trabajo con estado Estándar o Consumo y están diseñados para trabajar específicamente con las funcionalidades del agente. Estos tipos de flujo de trabajo incluyen automáticamente un agente vacío.

Por ejemplo, en la captura de pantalla siguiente se muestra un nuevo flujo de trabajo del agente autónomo:

Captura de pantalla que muestra Azure Portal, el diseñador de flujos de trabajo y el flujo de trabajo del agente autónomo parcial.

En la captura de pantalla siguiente se muestra un nuevo flujo de trabajo del agente de conversación:

Captura de pantalla que muestra Azure Portal, el diseñador de flujos de trabajo y el flujo de trabajo del agente de conversación parcial.

En Aplicaciones lógicas estándar, si tiene un flujo de trabajo Con estado existente, en la captura de pantalla siguiente se muestra cómo puede agregar una acción del Agente para incluir las funcionalidades de agente autónomo y LLM:

Captura de pantalla que muestra Azure Portal, el diseñador de flujos de trabajo, el flujo de trabajo existente y la opción para agregar un agente.

Aunque los flujos de trabajo del agente de consumo se configuran automáticamente con un modelo que se va a usar, los flujos de trabajo del agente estándar requieren que configure una conexión con el modelo para que el agente lo use:

Captura de pantalla que muestra el diseñador de flujos de trabajo, la acción de agente vacía y el panel de conexión del agente.

Nota:

El panel de conexión muestra los distintos requisitos de conexión, en función del tipo de flujo de trabajo y del origen del modelo seleccionado.

El agente requiere que proporcione instrucciones que describan los roles que puede desempeñar el agente, las tareas que el agente puede realizar y otra información prescriptiva específica que ayude al agente a responder a mensajes, responder preguntas y realizar tareas solicitadas, por ejemplo:

Captura de pantalla que muestra el diseñador de flujos de trabajo, la acción de agente vacía y el panel de información del agente.

Un agente vacío conectado a un modelo puede responder a las solicitudes que solo usan las funcionalidades del modelo, por lo que un agente no tiene que incluir herramientas. Sin embargo, para que el agente use acciones disponibles en Azure Logic Apps, el agente debe crear herramientas. Para empezar a crear una herramienta, primero agregue una acción desde la galería de conectores.

En el diagrama siguiente se muestra la galería donde puede examinar y seleccionar acciones para crear herramientas:

Captura de pantalla que muestra el diseñador de flujo de trabajo, el agente vacío y la acción seleccionada para empezar a crear una herramienta.

En el diagrama siguiente se muestra un agente meteorológico que puede obtener la previsión meteorológica y enviar esa previsión por correo electrónico:

Captura de pantalla que muestra Azure Portal, el diseñador de flujos de trabajo y el agente de ejemplo con la estructura de herramientas.

Más escenarios de ejemplo

En la sección siguiente se describen algunas maneras más de que un agente puede completar tareas en un flujo de trabajo:

Agente de préstamos hipotecas

Imagine que su banco usa un agente de préstamos hipotecas que procesa los préstamos de forma autónoma o con intervención humana cuando sea necesario realizando las siguientes tareas en un único bucle orquestado:

  • Conversa con los clientes para responder preguntas.
  • Revise las solicitudes de préstamo.
  • Recopile información financiera para evaluar la idoneidad de los préstamos.
  • Recupere y analice los datos de riesgo.
  • Solicite y resuma las evaluaciones inmobiliarias cuando se envíen.
  • Incluya revisores humanos para casos perimetrales.
  • Aprobar o rechazar aplicaciones.
  • Comunique las decisiones a las partes pertinentes.

Agente de suministro de pedidos

Supongamos que su empresa usa un agente de suministro de pedidos para realizar las siguientes tareas:

  • Póngase en contacto con los clientes para responder a preguntas del producto, basadas en el conocimiento empresarial.
  • Cree órdenes, pero páselas a los humanos cuando sea necesario.
  • Proporcione soporte las 24 horas del día, los 7 días de la semana con escalación inteligente.

También puede tener un agente que organice el trabajo entre otros agentes. Por ejemplo, puede tener un equipo de agentes, como un escritor, revisor y publicador, que trabajen juntos para crear y distribuir informes de ventas.

Agente de orden de trabajo de las instalaciones

Para apoyar a un equipo de instalaciones internas, un agente de órdenes de trabajo realiza las siguientes tareas:

  • Conversa con los empleados y proporciona opciones para las solicitudes de servicio.
  • Abra órdenes de trabajo en función de las selecciones de empleados.
  • Envíe pedidos de trabajo a los equipos de servicio correspondientes.
  • Actualice los pedidos de trabajo con el progreso y el estado de los trabajos.
  • Cierre los pedidos de trabajo cuando se completen los trabajos.
  • Notifique a las partes adecuadas los trabajos completados.

Autenticación y autorización

Normalmente, los flujos de trabajo no reactivos interactúan con un conjunto pequeño, conocido y predecible de autores de llamadas. Sin embargo, los flujos de trabajo del agente conversacional se comunican con una gama más amplia de autores de llamadas, como personas, agentes, servidores de Protocolo de contexto de modelo (MCP), agentes de herramientas y servicios externos. Este alcance más amplio aumenta las opciones de integración, pero presenta diferentes desafíos de seguridad, ya que los autores de llamadas pueden originarse en redes dinámicas, desconocidas o que no son de confianza. Cuando los llamantes proceden de redes que usted no controla, o cuando las identidades son externas o sin límites, debe autenticar y autorizar a cada llamante. Esto le permitirá proteger los flujos de trabajo del agente conversacional, ya que estos proporcionan un cliente de chat externo para interactuar con las personas.

En el caso de las actividades que no son de producción, Azure Portal usa una clave de desarrollador para la autenticación y autorización. Sin embargo, cuando los flujos de trabajo del agente conversacional están listos para producción, configure la autenticación y autorización de producción correspondientes para el tipo de aplicación lógica.

Autenticación y autorización de claves de desarrollador

En el caso de las actividades que no son de producción, como el diseño, el desarrollo y la validación rápida, Azure Portal proporciona, administra y usa una clave de desarrollador para ejecutar el flujo de trabajo en su nombre.

¿Qué es una clave de desarrollador?

Una clave de desarrollador es un mecanismo de autenticación útil que usa Azure Portal para ejecutar el flujo de trabajo durante las fases de diseño, desarrollo y pruebas rápidas en Azure Portal. Durante estas fases, la clave de desarrollador le permite omitir la necesidad de configurar manualmente Easy Auth o copiar manualmente las direcciones URL de devolución de llamada del desencadenador con firmas de acceso compartido (SAS). La clave está vinculada a un usuario y inquilino específico basado solo en un token de portador de Azure Resource Manager, que es un token de acceso que autentica las solicitudes a la API rest de Azure Resource Manager.

El portal inserta automáticamente la clave de desarrollador cuando se usan experiencias de prueba integradas en el diseñador de flujo de trabajo, como ejecutar un flujo de trabajo, llamar al desencadenador solicitud o interactuar con un flujo de trabajo de agente conversacional en la interfaz de chat interna. La clave se enlaza implícitamente a una sesión de arrendatario y a un usuario del portal que ha iniciado sesión, por lo que no se puede distribuir la clave externamente debido a esta vinculación, que se basa únicamente en el token portador de ARM.

Limitaciones clave del desarrollador

En la lista siguiente se describen las limitaciones de uso y diseño de la clave de desarrollador:

  • La clave no es un sustituto de Easy Auth, identidad administrada, credenciales federadas o direcciones URL de devolución de llamada firmadas en escenarios de producción.
  • La clave no está diseñada para poblaciones de llamadores grandes o que no son de confianza, herramientas de agentes o clientes automatizados.
  • La clave no es un mecanismo de autorización por usuario debido a la falta de ámbitos y roles pormenorizados.
  • La clave no se rige por las directivas de acceso condicional en la capa de ejecución de solicitudes, solo en la capa de inicio de sesión del portal.
  • La clave no está pensada para uso programático ni para CI/CD.

Para obtener una comparación entre la clave de desarrollador y Easy Auth, consulte Easy Auth frente a la clave de desarrollador.

Casos de uso clave para desarrolladores

En la tabla siguiente se describen los escenarios adecuados e inadecuados para usar la clave de desarrollador:

Escenarios adecuados Escenarios inadecuados
Pruebas rápidas en el diseñador antes de formalizar la autenticación. El flujo de trabajo necesita automatización determinista que use un principal de servicio y Easy Auth o SAS firmada en su lugar.
Compruebe la estructura del flujo de trabajo, los enlaces o el comportamiento básico de desencadenador y acción. - Los llamadores de flujo de trabajo incluyen agentes externos, servidores MCP o clientes conversacionales.

- Tiene previsto publicar el punto de conexión de flujo de trabajo fuera de su tenant.
Prototipos temporales de espacio aislado o de prueba que más adelante adoptan la protección de autenticación Easy Auth o el endurecimiento de URL SAS. El flujo de trabajo requiere identidades auditables por usuario, revocación de tokens, directivas de acceso condicional o aplicación con privilegios mínimos.

Autenticación y autorización de producción

Cuando los flujos de trabajo del agente conversacional están listos para producción, en las secciones siguientes se describen las opciones de producción y no producción para autenticar a los autores de llamadas y autorizar su acceso a los flujos de trabajo del agente.

Aplicación lógica Autenticación y autorización
Consumption OAuth 2.0 con el identificador de Entra de Microsoft
Estándar La autenticación sencilla, también conocida como autenticación de App Service, en el recurso de la aplicación lógica habilita un cliente de chat externo fuera de Azure Portal que otros usuarios pueden usar después de configurar Easy Auth. Consulte Autenticación sencilla para la aplicación lógica.

Para más información sobre la autenticación y autorización de producción, consulte la pestaña del tipo de aplicación lógica.

OAuth 2.0 con Microsoft Entra ID para su aplicación de lógica

Para los flujos de trabajo de agentes conversacionales de Consumption en producción, proteja el acceso a su cliente de chat con OAuth 2.0 con Microsoft Entra IDconfigurando una directiva de autorización de agentes en su recurso de aplicación lógica. Consulte Migración a la autenticación de producción.

Facturación

  • Consumo: la facturación usa el modelo de pago por uso. Los precios del bucle del agente se basan en el número de tokens que usa cada acción del agente y aparecen como unidades de empresa en la factura. Para más información sobre precios específicos, consulte Precios de Azure Logic Apps.

  • Estándar: aunque los flujos de trabajo del agente no incurren en cargos adicionales, el uso del modelo de IA incurre en cargos. Para más información, consulte la calculadora de precios de Azure.