Compartilhar via


Raspador Avançado (Editor Independente)

Uma API avançada de raspador da Web com IPs rotativos de mais de 170 países.

Esse conector está disponível nos seguintes produtos e regiões:

Service Class Regions
Copilot Studio Premium Todas as regiões do Power Automate , exceto as seguintes:
     – Governo dos EUA (GCC)
     – Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Aplicativos Lógicos Standard Todas as regiões dos Aplicativos Lógicos , exceto as seguintes:
     – Regiões do Azure Governamental
     - Regiões do Azure China
     - Departamento de Defesa dos EUA (DoD)
Power Apps Premium Todas as regiões do Power Apps , exceto as seguintes:
     – Governo dos EUA (GCC)
     – Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Power Automate Premium Todas as regiões do Power Automate , exceto as seguintes:
     – Governo dos EUA (GCC)
     – Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Contato
Nome Troy Taylor
URL https://www.hitachisolutions.com
Email ttaylor@hitachisolutions.com
Metadados do conector
Publicador Troy Taylor, Hitachi Solutions
Site https://apilayer.com/marketplace/description/adv_scraper-api
Política de privacidade https://www.ideracorp.com/Legal/APILayer/PrivacyStatement
Categorias Site

Criando uma conexão

O conector dá suporte aos seguintes tipos de autenticação:

Default Parâmetros para criar conexão. Todas as regiões Não compartilhável

Padrão

Aplicável: todas as regiões

Parâmetros para criar conexão.

Essa não é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
Chave de API secureString A chave de API para esta api Verdade

Limitações

Nome Chamadas Período de renovação
Chamadas à API por conexão 100 60 segundos

Ações

Raspar uma página de formulário

Raspe uma página remota que contém um formulário HTML.

Raspar uma URL remota

Raspe uma URL remota, com solicitação opcional de país, renderização, seletor de CSS e tempo limite.

Raspar uma página de formulário

Raspe uma página remota que contém um formulário HTML.

Parâmetros

Nome Chave Obrigatório Tipo Description
URL
url True string

O endereço de URL a ser raspado.

País
country string

Um código de país opcional de 2 caracteres se você quiser raspar de um endereço IP de um país específico.

Render
render boolean

Um booliano que deve renderizar a página remota. Se você quiser raspar imagens, arquivos JSON, arquivos PDF ou feeds XML, você precisará definir isso como false.

Selector
selector string

Um seletor CSS. Ex: a.navbar-brand.

Intervalo
timeout integer

Um tempo limite em segundos antes que o raspador retorne um resultado. Valor mínimo: 5, máximo: 45.

Corpo
body True string

As entradas do formulário.

Retornos

Nome Caminho Tipo Description
Seletor de Dados
data-selector array of string

Os dados selecionados.

País
options.country string

O país solicitou.

Render
options.render boolean

Se renderizado.

Selector
options.selector string

O seletor solicitado.

Intervalo
options.timeout integer

O tempo limite solicitado.

Título da Página
page_title string

O título da página.

Referenciador
request_headers.Referer string

O referenciador.

O endereço de URL do resultado.
result_url string

URL de resultado

O endereço de URL solicitado.
url string

URL

Raspar uma URL remota

Raspe uma URL remota, com solicitação opcional de país, renderização, seletor de CSS e tempo limite.

Parâmetros

Nome Chave Obrigatório Tipo Description
URL
url True string

O endereço de URL a ser raspado.

País
country string

Um código de país opcional de 2 caracteres se você quiser raspar de um endereço IP de um país específico.

Render
render boolean

Um booliano que deve renderizar a página remota. Se você quiser raspar imagens, arquivos JSON, arquivos PDF ou feeds XML, você precisará definir isso como false.

Selector
selector string

Um seletor CSS. Ex: a.navbar-brand.

Intervalo
timeout integer

Um tempo limite em segundos antes que o raspador retorne um resultado. Valor mínimo: 5, máximo: 45.

Retornos

Nome Caminho Tipo Description
Seletor de Dados
data-selector array of string

Os dados selecionados.

País
options.country string

O país solicitou.

Render
options.render boolean

Se renderizado.

Selector
options.selector string

O seletor solicitado.

Intervalo
options.timeout integer

O tempo limite solicitado.

Título da Página
page_title string

O título da página.

URL de resultado
result_url string

O endereço de URL do resultado.

URL
url string

O endereço de URL solicitado.