Creación de un analizador personalizado mediante las API REST

Los analizadores de Content Understanding definen cómo procesar y extraer información del contenido. Garantizan un procesamiento uniforme y una estructura de salida en todo el contenido para ofrecer resultados confiables y predecibles. Ofrecemos analizadores creados previamente para casos de uso comunes. En esta guía se muestra cómo se pueden personalizar estos analizadores para adaptarlos mejor a sus necesidades.

En esta guía, usamos la herramienta de línea de comandos cURL. Si no está instalado, puede descargar la versión adecuada para su entorno de desarrollador.

Prerrequisitos

Antes de empezar, asegúrese de tener los siguientes recursos y permisos:

Una suscripción de Azure. Si no tiene una suscripción a Azure, cree una cuenta gratuita.
Una vez que tenga la suscripción de Azure, cree un Recurso de Microsoft Foundry en Azure Portal. Asegúrese de crearlo en una región admitida.
- Este recurso aparece en Foundry>Foundry en el portal.
Configure las implementaciones de modelos predeterminadas para el recurso de Content Understanding. Al establecer los valores predeterminados, se crea una conexión a los modelos de Foundry que se utilizan para las solicitudes de Comprensión de Contenido. Elija uno de los métodos siguientes:
- Portal
- REST API
1. Vaya a la página de configuración de Content Understanding.
2. Seleccione el botón "+ Agregar recurso" en la esquina superior izquierda.
3. Seleccione el recurso Foundry que desea usar y haga clic en Siguiente y, a continuación, en Guardar.
  - Asegúrese de dejar "Habilitar la implementación automática para los modelos necesarios si no hay ningún valor predeterminado disponible". Esto garantiza que el recurso esté totalmente configurado con los modelos GPT-4.1, GPT-4.1-mini y text-embeding-3-large necesarios. Los distintos analizadores creados previamente requieren modelos diferentes.
Al realizar estos pasos, configurará una conexión entre los modelos de Comprensión de Contenidos y Foundry en el recurso Foundry.
1. Cree implementaciones de modelos Foundry de GPT-4.1, GPT-4.1-mini y text-embedding-3-large en su recurso Foundry. Para obtener más información sobre cómo implementar estos modelos, consulte Creación de implementaciones de modelos en el portal de Microsoft Foundry. Los distintos analizadores creados previamente requieren modelos diferentes, por lo que debe implementar los tres.
2. Defina las implementaciones de modelos predeterminadas en el nivel de recurso.
  
  Antes de ejecutar el siguiente comando cURL, realice los cambios siguientes en la solicitud HTTP:
  - Reemplace {endpoint} y {key} por los valores correspondientes de la instancia de Foundry en Azure Portal.
  - Reemplace {myGPT41Deployment}, {myGPT41MiniDeployment}, y {myEmbeddingDeployment} con los nombres reales de implementación de modelos de su recurso Foundry.
```
curl -i -X PATCH "{endpoint}/contentunderstanding/defaults?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d '{
        "modelDeployments": {
          "gpt-4.1": "{myGPT41Deployment}",
          "gpt-4.1-mini": "{myGPT41MiniDeployment}",
          "text-embedding-3-large": "{myEmbeddingDeployment}"
        }
      }'
```
Al realizar estos pasos, configurará una conexión entre los modelos de Comprensión de Contenidos y Foundry en el recurso Foundry.

Definición de un esquema de analizador

Para crear un analizador personalizado, defina un esquema de campo que describa los datos estructurados que desea extraer. En el ejemplo siguiente, creamos un analizador basado en el analizador de documentos precompilado para procesar una recepción.

Cree un archivo JSON denominado receipt.json con el siguiente contenido:

{
  "description": "Sample receipt analyzer",
  "baseAnalyzerId": "prebuilt-document",
  "models": {
      "completion": "gpt-4.1",
      "embedding": "text-embedding-ada-002"

    },
  "config": {
    "returnDetails": true,
    "enableFormula": false,
    "disableContentFiltering": false,
    "estimateFieldSourceAndConfidence": true,
    "tableFormat": "html"
  },
 "fieldSchema": {
    "fields": {
      "VendorName": {
        "type": "string",
        "method": "extract",
        "description": "Vendor issuing the receipt"
      },
      "Items": {
        "type": "array",
        "method": "extract",
        "items": {
          "type": "object",
          "properties": {
            "Description": {
              "type": "string",
              "method": "extract",
              "description": "Description of the item"
            },
            "Amount": {
              "type": "number",
              "method": "extract",
              "description": "Amount of the item"
            }
          }
        }
      }
    }
  }
}

Si tiene varios tipos de documentos que necesita procesar, pero desea clasificar y analizar solo los recibos, puede crear un analizador que clasifique primero el documento. A continuación, enrútela al analizador que creó más arriba con el siguiente esquema.

Cree un archivo JSON denominado categorize.json con el siguiente contenido:

{
  "baseAnalyzerId": "prebuilt-document",
  // Use the base analyzer to invoke the document specific capabilities.

  //Specify the model the analyzer should use. This is one of the supported completion models and one of the supported embeddings model. The specific deployment used during analyze is set on the resource or provided in the analyze request.
  "models": {
      "completion": "gpt-4.1",
      "embedding": "text-embedding-ada-002"

    },
  "config": {
    // Enable splitting of the input into segments. Set this property to false if you only expect a single document within the input file. When specified and enableSegment=false, the whole content will be classified into one of the categories.
    "enableSegment": false,

    "contentCategories": {
      // Category name.
      "receipt": {
        // Description to help with classification and splitting.
        "description": "Any images or documents of receipts",

        // Define the analyzer that any content classified as a receipt should be routed to
        "analyzerId": "receipt"
      },

      "invoice": {
        "description": "Any images or documents of invoice",
        "analyzerId": "prebuilt-invoice"
      },
      "policeReport": {
        "description": "A police or law enforcement report detailing the events that lead to the loss."
        // Don't perform analysis for this category.
      }

    },

    // Omit original content object and only return content objects from additional analysis.
    "omitContent": true
  }

  //You can use fieldSchema here to define fields that are needed from the entire input content.

}

Para crear un analizador personalizado, defina un esquema de campo que describa los datos estructurados que desea extraer. En el ejemplo siguiente, creamos un analizador basado en el analizador de imágenes predefinido para procesar imágenes de tablas y gráficos.

Cree un archivo JSON denominado request_body.json con el siguiente contenido:

{
  "description": "Sample image analyzer for charts and graphs",
  "baseAnalyzerId": "prebuilt-image",
  "models": {
      "completion": "gpt-4.1"
    },
  "config": {
    "disableContentFiltering": false
 },
 "fieldSchema": {
    "fields": {
      "Title": {
        "type": "string"
      },
      "ChartType": {
        "type": "string",
        "method": "classify",
        "enum": [ "bar", "line", "pie" ]
      }
    }
  }
}

Para crear un analizador personalizado, defina un esquema de campo que describa los datos estructurados que desea extraer. En el ejemplo siguiente, creamos un analizador basado en el analizador del centro de llamadas precompilado para procesar las grabaciones de llamadas de soporte al cliente.

Cree un archivo JSON denominado request_body.json con el siguiente contenido:

{
  "description": "Sample customer support call analyzer",
  "baseAnalyzerId": "prebuilt-audio",
  "config": {
    "locales": ["en-US", "fr-FR"],
    "returnDetails": true,
    "disableContentFiltering": false
  },
  "fieldSchema": {
    "fields": {
      "Summary": {
        "type": "string",
        "method": "generate"
      },
      "Sentiment": {
        "type": "string",
        "method": "classify",
        "enum": ["Positive", "Neutral", "Negative"]
      },
      "People": {
        "type": "array",
        "description": "List of people mentioned",
        "items": {
          "type": "object",
          "properties": {
            "Name": { "type": "string" },
            "Role": { "type": "string" }
          }
        }
      }
    }
  }
}

Para crear un analizador personalizado, defina un esquema de campo que describa los datos estructurados que desea extraer. En el ejemplo siguiente, creamos un analizador basado en el analizador de vídeo precompilado para procesar demostraciones y revisiones del producto.

Cree un archivo JSON denominado request_body.json con el siguiente contenido:

{
  "description": "Sample product demo video analyzer",
  "baseAnalyzerId": "prebuilt-video",
  "models": {
      "completion": "gpt-4.1"
    },
  "config": {
    "locales": ["en-US", "fr-FR"],
    "returnDetails": true,
    "enableFace": false,
    "disableFaceBlurring": false,
    "personDirectoryId": null,
    "segmentationMode": "auto",
    "disableContentFiltering": false
  },
   "fieldSchema": {
    "fields": {
      "Segments": {
        "type": "array",
        "items": {
          "type": "object",
          "properties": {
            "SegmentId": {
              "type": "string"
            },
            "Description": {
              "type": "string",
              "method": "generate",
              "description": "Detailed summary of the video segment, focusing on product characteristics, lighting, and color palette."
            },
            "Sentiment": {
              "type": "string",
              "method": "classify",
              "enum": ["Positive", "Neutral", "Negative"]
            }
          }
        }
      }
    }
  }
}

Creación de un analizador

Solicitud PUT

Cree primero un analizador de recibos y, a continuación, cree el analizador de categorías.

curl -i -X PUT "{endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d @receipt.json

curl -i -X PUT "{endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d @request_body.json

curl -i -X PUT "{endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d @request_body.json

curl -i -X PUT "{endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d @request_body.json

Respuesta PUT

La respuesta 201 Created incluye un Operation-Location encabezado que contiene una dirección URL que puede usar para realizar un seguimiento del estado de esta operación de creación asincrónica del analizador.

201 Created
Operation-Location: {endpoint}/contentunderstanding/analyzers/{analyzerId}/operations/{operationId}?api-version=2025-05-01-preview

Tras la finalización, la realización de un HTTP GET en la dirección URL de ubicación de la operación devuelve "status": "succeeded".

curl -i -X GET "{endpoint}/contentunderstanding/analyzers/{analyzerId}/operations/{operationId}?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}"

Analizar un archivo

Enviar el archivo

Ahora puede usar el analizador personalizado que creó para procesar archivos y extraer los campos que definió en el esquema.

Antes de ejecutar el comando cURL, realice los cambios siguientes en la solicitud HTTP:

Reemplace {endpoint} y {key} por los valores de punto de conexión y clave de la instancia de Azure Portal Foundry.
Reemplace por {analyzerId} el nombre del analizador personalizado que creó con el categorize.json archivo .
Reemplace {fileUrl} por una dirección URL de acceso público del archivo que se va a analizar, como una ruta de acceso a un Azure Storage Blob con una firma de acceso compartido (SAS) o la dirección URL de ejemplo https://github.com/Azure-Samples/azure-ai-content-understanding-python/raw/refs/heads/main/data/receipt.png.

Reemplaza {endpoint} y {key} por los valores de punto de conexión y clave de la instancia de Microsoft Foundry en el Portal de Azure.
Reemplace {analyzerId} por el nombre del analizador personalizado creado anteriormente.
Reemplace {fileUrl} por una dirección URL de acceso público del archivo que se va a analizar, como una ruta de acceso a un Azure Storage Blob con una firma de acceso compartido (SAS) o la dirección URL de ejemplo https://github.com/Azure-Samples/azure-ai-content-understanding-python/raw/refs/heads/main/data/pieChart.jpg.

Reemplaza {endpoint} y {key} por los valores de punto de conexión y clave de la instancia de Microsoft Foundry en el Portal de Azure.
Reemplace {analyzerId} por el nombre del analizador personalizado creado anteriormente.
Reemplace {fileUrl} por una dirección URL de acceso público del archivo que se va a analizar, como una ruta de acceso a un Azure Storage Blob con una firma de acceso compartido (SAS) o la dirección URL de ejemplo https://github.com/Azure-Samples/azure-ai-content-understanding-python/raw/refs/heads/main/data/audio.wav.

Reemplaza {endpoint} y {key} por los valores de punto de conexión y clave de la instancia de Microsoft Foundry en el Portal de Azure.
Reemplace {analyzerId} por el nombre del analizador personalizado creado anteriormente.
Reemplace {fileUrl} por una dirección URL de acceso público del archivo que se va a analizar, como una ruta de acceso a un Azure Storage Blob con una firma de acceso compartido (SAS) o la dirección URL de ejemplo https://github.com/Azure-Samples/azure-ai-content-understanding-python/raw/refs/heads/main/data/FlightSimulator.mp4.

Solicitud POST

En este ejemplo se usa el analizador personalizado que creó con el categorize.json archivo para analizar un recibo.

curl -i -X POST "{endpoint}/contentunderstanding/analyzers/{analyzerId}:analyze?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d '{
        "inputs":[
          {
            "url": "https://github.com/Azure-Samples/azure-ai-content-understanding-python/raw/refs/heads/main/data/receipt.png"
          }          
        ]
      }'

En este ejemplo se usa el analizador personalizado que creó para analizar un gráfico o una imagen de grafo.

curl -i -X POST "{endpoint}/contentunderstanding/analyzers/{analyzerId}:analyze?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d '{
        "inputs":[
          {
            "url": "https://github.com/Azure-Samples/azure-ai-content-understanding-python/raw/refs/heads/main/data/pieChart.jpg"
          }          
        ]
      }'

En este ejemplo se usa el analizador personalizado que creó para analizar una grabación de llamadas de soporte técnico al cliente.

curl -i -X POST "{endpoint}/contentunderstanding/analyzers/{analyzerId}:analyze?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d '{
        "inputs":[
          {
            "url": "https://github.com/Azure-Samples/azure-ai-content-understanding-python/raw/refs/heads/main/data/audio.wav"
          }          
        ]
      }'

En este ejemplo se usa el analizador personalizado que creó para analizar un vídeo de demostración del producto.

curl -i -X POST "{endpoint}/contentunderstanding/analyzers/{analyzerId}:analyze?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d '{
        "inputs":[
          {
            "url": "https://github.com/Azure-Samples/azure-ai-content-understanding-python/raw/refs/heads/main/data/FlightSimulator.mp4"
          }          
        ]
      }'

Respuesta de POST

La 202 Accepted respuesta incluye el {resultId} que puede usar para realizar el seguimiento del estado de esta operación asincrónica.

{
  "id": {resultId},
  "status": "Running",
  "result": {
    "analyzerId": {analyzerId},
    "apiVersion": "2025-11-01",
    "createdAt": "YYYY-MM-DDTHH:MM:SSZ",
    "warnings": [],
    "contents": []
  }
}

Obtención del resultado de análisis

Utilice el Operation-Location de la respuesta POST para recuperar el resultado del análisis.

Solicitud GET

curl -i -X GET "{endpoint}/contentunderstanding/analyzerResults/{resultId}?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}"

Respuesta GET

Una 200 OK respuesta incluye un status campo que muestra el progreso de la operación.

status es Succeeded si la operación se ha completado correctamente.
Si es running o notStarted, vuelva a llamar a la API manualmente o con un script: espere al menos un segundo entre solicitudes.

Respuesta de ejemplo

{
  "id": {resultId},
  "status": "Succeeded",
  "result": {
    "analyzerId": {analyzerId},
    "apiVersion": "2025-11-01",
    "createdAt": "YYYY-MM-DDTHH:MM:SSZ",
    "warnings": [],
    "contents": [
      {
        "path": "input1/segment1",
        "category": "receipt",
        "markdown": "Contoso\n\n123 Main Street\nRedmond, WA 98052\n\n987-654-3210\n\n6/10/2019 13:59\nSales Associate: Paul\n\n\n<table>\n<tr>\n<td>2 Surface Pro 6</td>\n<td>$1,998.00</td>\n</tr>\n<tr>\n<td>3 Surface Pen</td>\n<td>$299.97</td>\n</tr>\n</table> ...",
        "fields": {
          "VendorName": {
            "type": "string",
            "valueString": "Contoso",
            "spans": [{"offset": 0,"length": 7}],
            "confidence": 0.996,
            "source": "D(1,774.0000,72.0000,974.0000,70.0000,974.0000,111.0000,774.0000,113.0000)"
          },
          "Items": {
            "type": "array",
            "valueArray": [
              {
                "type": "object",
                "valueObject": {
                  "Description": {
                    "type": "string",
                    "valueString": "2 Surface Pro 6",
                    "spans": [ { "offset": 115, "length": 15}],
                    "confidence": 0.423,
                    "source": "D(1,704.0000,482.0000,875.0000,482.0000,875.0000,508.0000,704.0000,508.0000)"
                  },
                  "Amount": {
                    "type": "number",
                    "valueNumber": 1998,
                    "spans": [{ "offset": 140,"length": 9}
                    ],
                    "confidence": 0.957,
                    "source": "D(1,952.0000,482.0000,1048.0000,482.0000,1048.0000,508.0000,952.0000,509.0000)"
                  }
                }
              }, ...
            ]
          }
        },
        "kind": "document",
        "startPageNumber": 1,
        "endPageNumber": 1,
        "unit": "pixel",
        "pages": [
          {
            "pageNumber": 1,
            "angle": -0.0944,
            "width": 1743,
            "height": 878
          }
        ],
        "analyzerId": "{analyzerId}",
        "mimeType": "image/png"
      }
    ]
  },
  "usage": {
    "documentPages": 1,
    "tokens": {
      "contextualization": 1000
    }
  }
}

{
  "id": {resultId},
  "status": "Succeeded",
  "result": {
    "analyzerId": {analyzerId},
    "apiVersion": "2025-11-01",
    "createdAt": "YYYY-MM-DDTHH:MM:SSZ",
    "warnings": [],
    "contents": [
      {
        "markdown": "![image](image)\n",
        "fields": {
          "Title": {
            "type": "string",
            "valueString": "Weekly Work Hours Distribution"
          },
          "ChartType": {
            "type": "string",
            "valueString": "pie"
          }
        },
       "kind": "document",
        "startPageNumber": 1,
        "endPageNumber": 1,
        "unit": "pixel",
        "pages": [
          {
            "pageNumber": 1
          }
        ],
        "analyzerId": "{analyzerId}",
        "mimeType": "image/jpeg"
      }
    ]
  },
  "usage": {
    "tokens": {
      "contextualization": 1000
    }
  }
}

{
  "id": {resultId},
  "status": "Succeeded",
  "result": {
    "analyzerId": {analyzerId},
    "apiVersion": "2025-11-01",
    "createdAt": "YYYY-MM-DDTHH:MM:SSZ",
    "warnings": [],
    "contents": [
      {
        "markdown": "# Audio: 00:00.000 => 01:54.670\nTranscript\n```\n<v Agent>Thank you for calling Woodgrove Travel...\n<v Customer>Hi Isabella, my name is John Smith...\n<v Agent>Could you provide flight details?\n<v Customer>Contoso Airways, flight CA123...\n<v Agent>Sorry to 
                     hear that...\n<v Customer>Flight delay made me miss meeting...\n<v Agent>We’ll offer a partial refund...\n<v Customer>Thanks, appreciate your help!\n```",
        "fields": {
          "Summary": {
            "type": "string",
            "valueString": "John Smith contacted Woodgrove Travel to report a negative experience with a flight on Contoso Airways ..."
          },
          "Sentiment": {
            "type": "string",
            "valueString": "Positive"
          },
          "People": {
            "type": "array",
            "valueArray": [
              {
                "type": "object",
                "valueObject": {
                  "Name": {
                    "type": "string",
                    "valueString": "Isabella Taylor"
                  },
                  "Role": {
                    "type": "string",
                    "valueString": "Agent"
                  }
                }
              }, ...
            ]
          }
        },
        "kind": "audioVisual",
        "startTimeMs": 0,
        "endTimeMs": 114670,
        "transcriptPhrases": [
          {
            "speaker": "Agent",
            "startTimeMs": 80,
            "endTimeMs": 2160,
            "text": "Thank you for calling Woodgrove Travel.",
            "words": []
          }, ...

        ]
      }
    ]
  },
  "usage": {
    "audioHours": 0.032,
    "tokens": {
      "contextualization": 3194.445
    }
  }
}

{
  "id": {resultId},
  "status": "Succeeded",
  "result": {
    "analyzerId": {analyzerId},
    "apiVersion": "2025-11-01",
    "createdAt": "YYYY-MM-DDTHH:MM:SS",
    "warnings": [],
    "contents": [
      {
        "markdown": "# Video: 00:00 => 00:43\n## Segment 1: Island view\nTranscript\n```\n00:01 --> 00:06\n<Speaker 1>Good data improves TTS.\n```\nKey Frames: ![](keyFrame.726.jpg) ## Segment 2: Data center\nTranscript\n```\n00:07 --> 00:13\n<Speaker 2>We trained on 3,000   
                     hours.\n```\nKey Frames: ![](keyFrame.2046.jpg) ![](keyFrame.4884.jpg)",
        "fields": {
          "Segments": {
            "type": "array",
            "valueArray": [
              {
                "type": "object",
                "valueObject": {
                  
                  "SegmentId": {
                    "type": "string",
                    "valueString": "00:00:00.000-00:00:01.467"
                  },
                  "Description": {
                    "type": "string",
                    "valueString": "The video opens with a dramatic aerial shot of a small airplane flying over a tropical island surrounded by turquoise waters. The logos for 'Flight Simulator' and 'Microsoft Azure AI' are prominently displayed, indicating a collaboration or feature integration between the two."
                  },
                  "Sentiment": {
                    "type": "string",
                    "valueString": "Positive"
                  }
                }
              }, ...
            ]
          }
        },
        "kind": "audioVisual",
        "startTimeMs": 0,
        "endTimeMs": 43866,
        "width": 1080,
        "height": 608,
        "KeyFrameTimesMs": [733, ... , 43233],
        "transcriptPhrases": [
          {
            "speaker": "Speaker 1",
            "startTimeMs": 1360,
            "endTimeMs": 6640,
            "text": "When it comes to the neural TTS, in order to get a good voice, it's better to have good data.",
            "words": []
          }, ...
        ],
        "cameraShotTimesMs": [1467, ...  42033],
        "segments": [
          {
            "startTimeMs": 0,
            "endTimeMs": 1467,
            "description": "The video begins with a scenic aerial view of an island, showcasing the collaboration between Flight Simulator and Microsoft Azure AI.",
            "segmentId": "1"
          }, ...
        ]
      }
    ]
  },
  "usage": {
    "videoHours": 0.013,
    "tokens": {
      "contextualization": 12222.223
    }
  }
}

Revisar ejemplos de código: búsqueda de documentos visuales.
Revisar ejemplo de código: plantillas de analizador.
Pruebe a procesar el contenido del documento mediante Content Understanding en Foundry.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2025-12-19

Compartir a través de

Creación de un analizador personalizado mediante las API REST

Prerrequisitos

Definición de un esquema de analizador

Creación de un analizador

Solicitud PUT

Respuesta PUT

Analizar un archivo

Enviar el archivo

Solicitud POST

Respuesta de POST

Obtención del resultado de análisis

Solicitud GET

Respuesta GET

Respuesta de ejemplo

Contenido relacionado

Comentarios

Recursos adicionales