Inferencia de Azure AI Foundry

Se trata de una especificación de Swagger de primera entidad para los modelos de Azure AI Foundry, específicamente diseñados para tareas de finalización de chat. Actualmente solo admite el punto de conexión Finalizaciones de chat.

Este conector está disponible en los siguientes productos y regiones:

Service	Class	Regions
Copilot Studio	Estándar	Todas las regiones de Power Automate
Aplicaciones lógicas	Estándar	Todas las regiones de Logic Apps
Power Apps	Estándar	Todas las regiones de Power Apps
Power Automate	Estándar	Todas las regiones de Power Automate

Contacto
Nombre	Microsoft
URL	https://support.microsoft.com/
Correo Electrónico	abapi@microsoft.com

Metadatos del conector
Publicador	Microsoft
Sitio web	https://learn.microsoft.com/en-us/azure/ai-foundry/
Directiva de privacidad	https://privacy.microsoft.com/en-us/privacystatement
Categorías	AI

Creación de una conexión

El conector admite los siguientes tipos de autenticación:


Predeterminado	Parámetros para crear una conexión.	Todas las regiones	Compartible

Predeterminado

Aplicable: Todas las regiones

Parámetros para crear una conexión.

Se trata de una conexión que se puede compartir. Si la aplicación de energía se comparte con otro usuario, también se comparte la conexión. Para más información, consulte introducción a los conectores para aplicaciones de lienzo: Power Apps | Microsoft Docs

Nombre	Tipo	Description	Obligatorio
Uri de destino	cuerda / cadena	Especificar el punto de conexión de inferencia para el modelo Foundry	Cierto
Clave de API	securestring	La clave de API para este punto de conexión de inferencia de modelo	Cierto
Nombre de implementación del modelo	cuerda / cadena	Especificar el nombre de implementación del modelo para el modelo Foundry
Nombre del modelo base	cuerda / cadena	Especificar el nombre del modelo base para el modelo Foundry

Limitaciones

Nombre	Llamadas	Período de renovación
Llamadas API por conexión	5000	60 segundos

Acciones

Creación de una finalización de chat

Genera una finalización para una conversación, en función de los mensajes y la configuración del modelo proporcionados.

Creación de una finalización de chat

Id. de la operación:: ChatCompletion

Genera una finalización para una conversación, en función de los mensajes y la configuración del modelo proporcionados.

Parámetros

Nombre	Clave	Tipo	Description
Versión de API	api-version	string	Versión de la API que se va a usar para este punto de conexión de finalizaciones de chat del modelo.
role	role	string	Rol del remitente del mensaje (por ejemplo, "usuario", "asistente").
contenido	content	object
temperatura	temperature	float	Temperatura de muestreo que se va a usar, entre 0 y 1. Los valores más altos hacen que la salida sea más aleatoria.
top_p	top_p	float	Parámetro de muestreo top-p, entre 0 y 1.
max_tokens	max_tokens	integer	El número máximo de tokens a generar en la respuesta.
model	model	string	Nombre de implementación del modelo.

Devoluciones

Body: ChatCompletionResponse

Definiciones

Choice

Nombre	Ruta de acceso	Tipo	Description
content_filter_results	content_filter_results	object	Resultados del filtro de contenido aplicado a la respuesta.
razón de finalización	finish_reason	string	Motivo por el que el modelo dejó de generar más tokens. Entre los valores posibles se incluyen "stop", "length", "content_filter", etc.
index	index	integer	Índice de esta elección dentro del conjunto generado de finalizaciones.
logprobs	logprobs	string	Registrar probabilidades asociadas a cada token en la respuesta (si se solicita).
contenido	message.content	string	Contenido del mensaje generado en la conversación. Esta es la respuesta a la consulta NL del usuario.
refusal	message.refusal	string	Si el modelo se niega a generar un mensaje, este campo describe la denegación.
role	message.role	string	Rol del remitente del mensaje (por ejemplo, "usuario", "asistente").

PromptFilterResult

Nombre	Ruta de acceso	Tipo	Description
prompt_index	prompt_index	integer	Índice del símbolo del sistema en la entrada original.
content_filter_results	content_filter_results	object	Metadatos del filtro de contenido aplicados al símbolo del sistema.

CompletionTokensDetails

Detalles sobre el uso del token para la finalización.

Nombre	Ruta de acceso	Tipo	Description
accepted_prediction_tokens	accepted_prediction_tokens	integer	Número de tokens aceptados como predicciones válidas para la respuesta.
reasoning_tokens	reasoning_tokens	integer	Número de tokens usados para el proceso de razonamiento del modelo.
rejected_prediction_tokens	rejected_prediction_tokens	integer	Número de tokens rechazados durante el proceso de predicción.

PromptTokensDetails

Detalles sobre los tokens usados en el símbolo del sistema.

Nombre	Ruta de acceso	Tipo	Description
cached_tokens	cached_tokens	integer	Número de tokens almacenados en caché y reutilizados para el símbolo del sistema.

Usage

Detalles de uso de tokens para la solicitud, incluidos los tokens de solicitud y finalización.

Nombre	Ruta de acceso	Tipo	Description
completion_tokens	completion_tokens	integer	Número de tokens consumidos por la finalización.
completion_tokens_details	completion_tokens_details	CompletionTokensDetails	Detalles sobre el uso del token para la finalización.
prompt_tokens	prompt_tokens	integer	Número de tokens consumidos por el símbolo del sistema.
prompt_tokens_details	prompt_tokens_details	PromptTokensDetails	Detalles sobre los tokens usados en el símbolo del sistema.
total_tokens	total_tokens	integer	Número total de tokens consumidos por toda la solicitud (símbolo del sistema y finalización).

ChatCompletionResponse

Nombre	Ruta de acceso	Tipo	Description
choices	choices	array of Choice	Lista de finalizaciones generadas para el símbolo del sistema especificado.
id	id	string	Identificador único para la solicitud de finalización del chat.
model	model	string	Modelo que se usa para generar la finalización del chat.
prompt_filter_results	prompt_filter_results	array of PromptFilterResult	Los resultados del filtro de contenido para cada solicitud de la solicitud.
usage	usage	Usage	Detalles de uso de tokens para la solicitud, incluidos los tokens de solicitud y finalización.

Compartir a través de

Inferencia de Azure AI Foundry

Creación de una conexión

Predeterminado

Limitaciones

Acciones

Creación de una finalización de chat

Parámetros

Devoluciones

Definiciones

Choice

PromptFilterResult

CompletionTokensDetails

PromptTokensDetails

Usage

ChatCompletionResponse