Compartir a través de


¿Qué es Azure Translator en la traducción de documentos de Foundry Tools?

La traducción de documentos es una característica de traducción automática basada en la nube de Azure Translator. Puede traducir varios documentos complejos en todos los idiomas y dialectos admitidos conservando la estructura y el formato de datos originales de los documentos. La API de traducción de documentos admite dos procesos de traducción:

  • La traducción por lotes asincrónica admite el procesamiento de varios documentos y archivos grandes. El proceso de traducción por lotes requiere una cuenta de Azure Blob Storage con contenedores de almacenamiento para los documentos de origen y traducidos.

  • El archivo único sincrónico admite el procesamiento de traducciones de archivos únicos. El proceso de traducción de archivos no requiere una cuenta de Azure Blob Storage. La respuesta final contiene el documento traducido y se devuelve directamente al cliente que realiza la llamada.

Características clave

Característica Descripción
Traducir archivos grandes Traducir documentos completos de forma asincrónica.
Traducir numerosos archivos Traduzca varios archivos entre todos los idiomas y dialectos admitidos manteniendo la estructura del documento y el formato de los datos.
Traducción de formatos de archivo de imagen (versión preliminar) 🆕 Traduce texto dentro de una imagen manteniendo el diseño y la distribución originales.
Formatos admitidos: .jpeg, .png, .bmp, , .webp
Precios: calculados por imagen. Para obtener más información, consultePrecios.
Traducir texto de imagen en archivos de documento de Word (.docx). Esta característica está disponible con la API de traducción de documentos en lote para el formato de archivo .
Conservar la presentación del archivo de origen Traducir archivos conservando el diseño y el formato originales.
Aplicar traducción personalizada Traducir documentos con modelos de traducción personalizada y general.
Aplicar glosarios personalizados Traducir documentos mediante glosarios personalizados.
Detectar automáticamente el idioma del documento Deje que el servicio de traducción de documentos determine el idioma del documento.
Traducir documentos con contenido en varios idiomas Use la característica de detección automática para traducir documentos con contenido en varios idiomas al idioma de destino.

Opciones de desarrollo

Integre las funcionalidades de traducción de documentos en sus proyectos y aplicaciones mediante las herramientas y opciones de desarrollo disponibles. Esta característica permite implementar mediante programación características de traducción en la funcionalidad de la aplicación y proporcionar a los usuarios soporte multilingüe según sea necesario.

Optimice la eficacia mediante flujos de trabajo asincrónicos para habilitar la traducción en paralelo de varios documentos y archivos grandes.

Opción de desarrollo Descripción
REST API La API REST es una interfaz independiente del lenguaje que permite crear solicitudes HTTP y encabezados de autorización para traducir documentos.
Bibliotecas cliente (SDK) La biblioteca cliente (SDK) son clases, objetos, métodos y código específicos del lenguaje que puede usar rápidamente agregando una referencia en el proyecto. Actualmente, la traducción de documentos admite lenguajes de programación para C#/.NET y Python.

Formatos de documento y glosario admitidos

Formatos admitidos para documentos por lotes

El método Get supported document formats devuelve una lista de formatos de documento admitidos por el servicio de traducción de documentos. La lista incluye la extensión de archivos común y el tipo de contenido si se usa la API de carga.

Tipo de archivo Extensión de archivo Descripción
PDF de Adobe pdf Formato de archivo de documento portátil. La traducción de documentos usa tecnología de reconocimiento óptico de caracteres (OCR) para extraer y traducir texto en el documento PDF escaneado mientras conserva el diseño original.
Valores separados por comas csv Archivo de datos sin formato delimitados por comas que usan los programas de hoja de cálculo.
HTML html, htm Lenguaje de marcado de hipertexto
Imagen (2025-12-01-preview) .jpeg, .png, , .bmp, .webp Archivos que almacenan datos de imágenes digitales.
Presentación de OpenDocument odp Archivo de presentación de código abierto.
Hoja de cálculo de OpenDocument ods Archivo de hoja de cálculo de código abierto.
Texto de OpenDocument odt Archivo de documento de texto de código abierto.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtextrmd Lenguaje de incremento ligero para crear texto con formato.
M​HTML mhtml, mht Formato de archivo de página web que se usa para combinar código HTML y sus recursos complementarios.
Microsoft Excel xls, xlsx Archivo de hoja de cálculo para el análisis de datos y la documentación
Microsoft Outlook msg Mensaje de correo electrónico creado o guardado en Microsoft Outlook
Microsoft PowerPoint ppt, pptx Archivo de presentación utilizado para mostrar contenido en formato de presentación
Microsoft Word doc, docx Archivo de documento de texto
Formato de texto enriquecido rtf Documento de texto que incluye formato.
Valores separados por tabulación/TAB tsv/tab Archivo de datos sin formato delimitado por tabulaciones que usan los programas de hoja de cálculo.
Texto txt Documento de texto sin formato
XML Formato de archivo de intercambio de localización xlff Formato de documento paralelo que se exporta desde los sistemas de memoria de traducción. Los idiomas utilizados se definen dentro del archivo.

Tipos de archivo heredados de Batch

Los tipos de archivo de origen se conservarán durante la traducción de documentos con las excepciones siguientes:

Extensión del archivo de origen Extensión del archivo traducido
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Formatos admitidos en el glosario de Batch

La traducción de documentos admite los siguientes tipos de archivo de glosario:

Tipo de archivo Extensión de archivo Descripción
Valores separados por comas csv Archivo de datos sin formato delimitados por comas que usan los programas de hoja de cálculo.
XML Formato de archivo de intercambio de localización xlf , xliff Formato de documento paralelo, exportación de sistemas de memoria de traducción. Los idiomas usados se definen dentro del archivo.
Valores separados por tabulaciones/TAB tsv, tab Archivo de datos sin formato delimitado por tabulaciones que usan los programas de hoja de cálculo.

Límites de solicitud de traducción de documentos

Para obtener información detallada sobre los límites de solicitudes de Azure Translator, consulteLímites de solicitudes de traducción de documentos.

Residencia de datos de traducción de documentos

La residencia de datos de traducción de documentos depende de la región de Azure donde se creó el recurso translator:

✔️ Característica: Traducción de documentos
✔️ Punto de conexión del servicio: personalizado: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Región creada por el recurso Solicitud del centro de datos de procesamiento
Global Centro de datos más cercano disponible.
América Este de EE. UU. 2 • Oeste de EE. UU. 2
Asia Pacífico Este de Japón • Sudeste asiático
Europa (excepto Suiza) Centro de Francia • Oeste de Europa
Suiza Norte de Suiza • Oeste de Suiza

Pasos siguientes

En nuestro inicio rápido, aprenderá a empezar a usar rápidamente la traducción de documentos. Para empezar, necesitará una cuenta de Azure activa. En caso de no tener ninguna, puede crear una gratis.