Partilhar via


Advanced Scraper (Editora Independente)

Uma API web scraper avançada com IPs rotativos de 170+ países.

Este conector está disponível nos seguintes produtos e regiões:

Serviço Class Regiões
Estúdio Copiloto Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Aplicações Lógicas Standard Todas as regiões do Logic Apps , exceto as seguintes:
     - Regiões do Azure Government
     - Regiões do Azure China
     - Departamento de Defesa dos EUA (DoD)
Aplicações Power Premium Todas as regiões do Power Apps , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Automatize o poder Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Contato
Nome Troia Taylor
URL https://www.hitachisolutions.com
Email ttaylor@hitachisolutions.com
Metadados do conector
Editora Troy Taylor, Soluções Hitachi
Sítio Web https://apilayer.com/marketplace/description/adv_scraper-api
Política de privacidade https://www.ideracorp.com/Legal/APILayer/PrivacyStatement
Categorias Sítio Web

A criar uma ligação

O conector suporta os seguintes tipos de autenticação:

Predefinição Parâmetros para criar conexão. Todas as regiões Não compartilhável

Padrão

Aplicável: Todas as regiões

Parâmetros para criar conexão.

Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
Chave de API securestring A chave de API para esta api Verdade

Limites de Limitação

Name Chamadas Período de Renovação
Chamadas de API por conexão 100 60 segundos

Ações

Raspar um URL remoto

Raspe uma URL remota, com solicitação opcional de país, renderização, seletor de CSS e tempo limite.

Raspar uma página de formulário

Raspe uma página remota que contenha um formulário HTML.

Raspar um URL remoto

Raspe uma URL remota, com solicitação opcional de país, renderização, seletor de CSS e tempo limite.

Parâmetros

Name Chave Necessário Tipo Description
URL
url True string

O endereço URL a ser raspado.

Country
country string

Um código de país opcional de 2 caracteres se você deseja extrair de um endereço IP de um país específico.

Render
render boolean

Um booleano para renderizar a página remota. Se você deseja raspar imagens, arquivos JSON, arquivos PDF ou feeds XML, você precisa definir isso como false.

Selector
selector string

Um seletor CSS. Ex: a.navbar-marca.

Timeout
timeout integer

Um tempo limite em segundos antes do raspador retornar um resultado. Valor mínimo: 5, máx.: 45.

Devoluções

Name Caminho Tipo Description
Seletor de dados
data-selector array of string

Os dados selecionados.

Country
options.country string

O país pediu.

Render
options.render boolean

Se renderizado.

Selector
options.selector string

O seletor solicitou.

Timeout
options.timeout integer

O tempo limite solicitado.

Título da página
page_title string

O título da página.

URL do resultado
result_url string

O endereço URL do resultado.

URL
url string

O endereço URL solicitado.

Raspar uma página de formulário

Raspe uma página remota que contenha um formulário HTML.

Parâmetros

Name Chave Necessário Tipo Description
URL
url True string

O endereço URL a ser raspado.

Country
country string

Um código de país opcional de 2 caracteres se você deseja extrair de um endereço IP de um país específico.

Render
render boolean

Um booleano para renderizar a página remota. Se você deseja raspar imagens, arquivos JSON, arquivos PDF ou feeds XML, você precisa definir isso como false.

Selector
selector string

Um seletor CSS. Ex: a.navbar-marca.

Timeout
timeout integer

Um tempo limite em segundos antes do raspador retornar um resultado. Valor mínimo: 5, máx.: 45.

Body
body True string

As entradas do formulário.

Devoluções

Name Caminho Tipo Description
Seletor de dados
data-selector array of string

Os dados selecionados.

Country
options.country string

O país pediu.

Render
options.render boolean

Se renderizado.

Selector
options.selector string

O seletor solicitou.

Timeout
options.timeout integer

O tempo limite solicitado.

Título da página
page_title string

O título da página.

Referer
request_headers.Referer string

O referente.

O endereço URL do resultado.
result_url string

URL do resultado

O endereço URL solicitado.
url string

URL