Partilhar via


Zanran Scaffolder (Pré-visualização)

O Zanran Scaffolder extrai tabelas e texto de arquivos PDF ou de imagem. As tabelas são extraídas como Excel ou XML, o texto como XML. O Scaffolder é melhor para relatórios como demonstrações financeiras, artigos científicos, relatórios de corretores... Inicialmente, você pode testar seus documentos usando o manual, anônimo, site de prática: www.zanrandemoapi.com

Este conector está disponível nos seguintes produtos e regiões:

Serviço Class Regiões
Estúdio Copiloto Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Aplicações Lógicas Standard Todas as regiões do Logic Apps , exceto as seguintes:
     - Regiões do Azure Government
     - Regiões do Azure China
     - Departamento de Defesa dos EUA (DoD)
Aplicações Power Premium Todas as regiões do Power Apps , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Automatize o poder Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Contato
Nome Contato Zanran
URL https://pdf.zanran.com/contact-us
Email helpdesk@zanran.com
Metadados do conector
Editora Zanran Ltd
Sítio Web http://www.zanran.com
Política de privacidade https://pdf.zanran.com/privacy-policy
Categorias Conteúdos e Ficheiros; Produtividade

O servidor Zanran Scaffolder fornece uma API web que permite aos usuários extrair automaticamente conteúdo de PDFs e imagens. Destina-se principalmente à extração de relatórios (contas anuais, artigos científicos, relatórios de mercado, etc.) O mecanismo Scaffolder da Zanran determina automaticamente a estrutura e o layout desses documentos e extrai o conteúdo em partes constituintes: blocos de texto (por exemplo, parágrafos); tabelas; e imagens/gráficos. Utiliza Visão por Computador e Machine Learning e produz dados em formatos estruturados como Excel e XML. É escalável e não requer qualquer intervenção manual ou modelos pré-definidos, qualquer formação ou configuração. O software é agnóstico de linguagem e é construído para automação / ambientes RPA para processar milhões de arquivos.

Pré-requisitos

Este conector acede a um serviço gratuito para extração de baixo volume de texto e tabelas de PDFs. Pré-requisito: um nome de usuário (endereço de e-mail) e senha (que você inventou).

Como obter credenciais

Registe-se em: http://scaffolderlink.zanran.com/

Problemas conhecidos e limitações

Recomendamos testar usando PDFs "nativos", em vez de digitalizados - para remover quaisquer efeitos do OCR.

A criar uma ligação

O conector suporta os seguintes tipos de autenticação:

Predefinição Parâmetros para criar conexão. Todas as regiões Não compartilhável

Padrão

Aplicável: Todas as regiões

Parâmetros para criar conexão.

Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
nome de utilizador securestring O nome de usuário para esta api Verdade
palavra-passe securestring A senha para esta api Verdade

Limites de Limitação

Name Chamadas Período de Renovação
Chamadas de API por conexão 100 60 segundos

Ações

Baixar resultados como arquivos Xml compactados

Baixa um arquivo zip contendo os resultados da análise em formato Xml (um arquivo Xml por página)

Baixar resultados como um arquivo Znr

Baixa os resultados na forma de um arquivo Znr que pode ser visualizado e editado pelo Pdf Workbench (uma ferramenta Zanran projetada para este fim)

Carregar documento

Carregar documento

Descarregar resultados como Xlsx

Baixa os resultados da análise de tabela como um documento do Excel (Xlsx) com planilhas separadas para cada tabela.

Obter estado

Obter o status do documento que está sendo carregado - ou seja, se ele está na fila para ser processado, sendo processado ou terminou o processamento

Baixar resultados como arquivos Xml compactados

Baixa um arquivo zip contendo os resultados da análise em formato Xml (um arquivo Xml por página)

Parâmetros

Name Chave Necessário Tipo Description
Nome do documento sem extensão
docname True string

o nome do ficheiro do documento original sem a extensão

Devoluções

response
file

Baixar resultados como um arquivo Znr

Baixa os resultados na forma de um arquivo Znr que pode ser visualizado e editado pelo Pdf Workbench (uma ferramenta Zanran projetada para este fim)

Parâmetros

Name Chave Necessário Tipo Description
Nome do documento sem extensão
docname True string

o nome do ficheiro do documento original sem a extensão

Devoluções

response
file

Carregar documento

Carregar documento

Parâmetros

Name Chave Necessário Tipo Description
ficheiro
file True file

O ficheiro do documento a carregar

Página inicial
startPage integer

Página inicial se analisar apenas um intervalo

Fim da página
endPage integer

Fim da página se analisar apenas um intervalo

Coords
Coords string

Coordenadas da tabela a analisar (para processamento de uma única página.) NOTA: trata-se de um requisito especializado; Se você deseja usar este parâmetro, entre em contato conosco para helpdesk@zanran.com perguntar como proceder

Devoluções

response
string

Descarregar resultados como Xlsx

Baixa os resultados da análise de tabela como um documento do Excel (Xlsx) com planilhas separadas para cada tabela.

Parâmetros

Name Chave Necessário Tipo Description
Nome do documento sem extensão
docname True string

o nome do ficheiro do documento original sem a extensão

Devoluções

response
file

Obter estado

Obter o status do documento que está sendo carregado - ou seja, se ele está na fila para ser processado, sendo processado ou terminou o processamento

Parâmetros

Name Chave Necessário Tipo Description
Nome do documento sem extensão
docname True string

o nome do arquivo do documento original sem a extensão

Devoluções

response
string

Definições

ficheiro

Este é o tipo de dados básicos 'arquivo'.

cadeia (de caracteres)

Este é o tipo de dados básico 'string'.