Compartilhar via


Scaffolder zanran (versão prévia)

O Scaffolder zanran extrai tabelas e texto de arquivos PDF ou de imagem. As tabelas são extraídas como Excel ou XML, texto como XML. A Scaffolder é melhor para relatórios como demonstrativos financeiros, artigos científicos, relatórios de corretores... Inicialmente, você pode testar seus documentos usando o site manual, anônimo e prático: www.zanrandemoapi.com

Esse conector está disponível nos seguintes produtos e regiões:

Service Class Regions
Copilot Studio Premium Todas as regiões do Power Automate , exceto as seguintes:
     – Governo dos EUA (GCC)
     – Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Aplicativos Lógicos Standard Todas as regiões dos Aplicativos Lógicos , exceto as seguintes:
     – Regiões do Azure Governamental
     - Regiões do Azure China
     - Departamento de Defesa dos EUA (DoD)
Power Apps Premium Todas as regiões do Power Apps , exceto as seguintes:
     – Governo dos EUA (GCC)
     – Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Power Automate Premium Todas as regiões do Power Automate , exceto as seguintes:
     – Governo dos EUA (GCC)
     – Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Contato
Nome Contato do Zanran
URL https://pdf.zanran.com/contact-us
Email helpdesk@zanran.com
Metadados do conector
Publicador Zanran Ltd
Site http://www.zanran.com
Política de privacidade https://pdf.zanran.com/privacy-policy
Categorias Conteúdo e arquivos; Produtividade

O servidor Zanran Scaffolder fornece uma API Web que permite que os usuários extraam automaticamente conteúdo de PDFs e imagens. Ele foi projetado principalmente para extração de relatórios (contas anuais, artigos científicos, relatórios de mercado etc.) O mecanismo scaffolder do Zanran determina automaticamente a estrutura e o layout desses documentos e extrai o conteúdo em partes constituintes: blocos de texto (por exemplo, parágrafos); Tabelas; e imagens/gráficos. Ele usa Pesquisa Visual Computacional e Machine Learning e gera dados em formatos estruturados como Excel e XML. Ele é escalonável e não requer nenhuma intervenção manual ou modelos predefinidos, nenhum treinamento ou configuração. O software é independente de linguagem e foi criado para ambientes de automação/RPA processarem milhões de arquivos.

Pré-requisitos

Esse conector acessa um serviço gratuito para extração de texto e tabelas de baixo volume de PDFs. Pré-requisito: um nome de usuário (endereço de email) e senha (que você inventar).

Como obter credenciais

Registre-se em: http://scaffolderlink.zanran.com/

Problemas e limitações conhecidos

Recomendamos testar o uso de PDFs 'nativos', em vez de verificados - para remover quaisquer efeitos do OCR.

Criando uma conexão

O conector dá suporte aos seguintes tipos de autenticação:

Default Parâmetros para criar conexão. Todas as regiões Não compartilhável

Padrão

Aplicável: todas as regiões

Parâmetros para criar conexão.

Essa não é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
nome de usuário secureString O nome de usuário para esta api Verdade
senha secureString A senha dessa api Verdade

Limitações

Nome Chamadas Período de renovação
Chamadas à API por conexão 100 60 segundos

Ações

Baixar resultados como arquivos Xml compactados

Baixa um arquivo zip que contém os resultados da análise no formato Xml (um arquivo Xml por página)

Baixar resultados como um arquivo Znr

Baixa os resultados na forma de um arquivo Znr que pode ser exibido e editado pelo Pdf Workbench (uma ferramenta Zanran projetada para essa finalidade)

Baixar resultados como Xlsx

Baixa os resultados da análise de tabela como um documento do Excel (Xlsx) com planilhas separadas para cada tabela.

Carregar documento

Carregar documento

Consultar Status

Obter o status do documento que está sendo carregado – ou seja, se ele está na fila a ser processado, sendo processado ou concluído o processamento

Baixar resultados como arquivos Xml compactados

Baixa um arquivo zip que contém os resultados da análise no formato Xml (um arquivo Xml por página)

Parâmetros

Nome Chave Obrigatório Tipo Description
Nome do documento sem extensão
docname True string

o nome do arquivo de documento original sem a extensão

Retornos

response
file

Baixar resultados como um arquivo Znr

Baixa os resultados na forma de um arquivo Znr que pode ser exibido e editado pelo Pdf Workbench (uma ferramenta Zanran projetada para essa finalidade)

Parâmetros

Nome Chave Obrigatório Tipo Description
Nome do documento sem extensão
docname True string

o nome do arquivo de documento original sem a extensão

Retornos

response
file

Baixar resultados como Xlsx

Baixa os resultados da análise de tabela como um documento do Excel (Xlsx) com planilhas separadas para cada tabela.

Parâmetros

Nome Chave Obrigatório Tipo Description
Nome do documento sem extensão
docname True string

o nome do arquivo de documento original sem a extensão

Retornos

response
file

Carregar documento

Carregar documento

Parâmetros

Nome Chave Obrigatório Tipo Description
arquivo
file True file

O arquivo de documento a ser carregado

Página Inicial
startPage integer

Página inicial se estiver analisando apenas um intervalo

Página final
endPage integer

Página final se estiver analisando apenas um intervalo

Coords
Coords string

Coordenadas da tabela a serem analisadas (para processar uma única página).) OBSERVAÇÃO: esse é um requisito especializado; se você quiser usar esse parâmetro, entre em contato conosco helpdesk@zanran.com para perguntar como proceder

Retornos

response
string

Consultar Status

Obter o status do documento que está sendo carregado – ou seja, se ele está na fila a ser processado, sendo processado ou concluído o processamento

Parâmetros

Nome Chave Obrigatório Tipo Description
Nome do documento sem extensão
docname True string

o nome do arquivo do documento original sem a extensão

Retornos

response
string

Definições

arquivo

Esse é o tipo de dados básico 'file'.

cadeia

Esse é o tipo de dados básico 'string'.