Advanced Scraper (Editora Independente)
Uma API web scraper avançada com IPs rotativos de 170+ países.
Este conector está disponível nos seguintes produtos e regiões:
| Serviço | Class | Regiões |
|---|---|---|
| Estúdio Copiloto | Premium | Todas as regiões do Power Automatic , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Aplicações Lógicas | Standard | Todas as regiões do Logic Apps , exceto as seguintes: - Regiões do Azure Government - Regiões do Azure China - Departamento de Defesa dos EUA (DoD) |
| Aplicações Power | Premium | Todas as regiões do Power Apps , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Automatize o poder | Premium | Todas as regiões do Power Automatic , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Contato | |
|---|---|
| Nome | Troia Taylor |
| URL | https://www.hitachisolutions.com |
| ttaylor@hitachisolutions.com |
| Metadados do conector | |
|---|---|
| Editora | Troy Taylor, Soluções Hitachi |
| Sítio Web | https://apilayer.com/marketplace/description/adv_scraper-api |
| Política de privacidade | https://www.ideracorp.com/Legal/APILayer/PrivacyStatement |
| Categorias | Sítio Web |
A criar uma ligação
O conector suporta os seguintes tipos de autenticação:
| Predefinição | Parâmetros para criar conexão. | Todas as regiões | Não compartilhável |
Padrão
Aplicável: Todas as regiões
Parâmetros para criar conexão.
Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.
| Nome | Tipo | Description | Obrigatório |
|---|---|---|---|
| Chave de API | securestring | A chave de API para esta api | Verdade |
Limites de Limitação
| Name | Chamadas | Período de Renovação |
|---|---|---|
| Chamadas de API por conexão | 100 | 60 segundos |
Ações
| Raspar um URL remoto |
Raspe uma URL remota, com solicitação opcional de país, renderização, seletor de CSS e tempo limite. |
| Raspar uma página de formulário |
Raspe uma página remota que contenha um formulário HTML. |
Raspar um URL remoto
Raspe uma URL remota, com solicitação opcional de país, renderização, seletor de CSS e tempo limite.
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
O endereço URL a ser raspado. |
|
Country
|
country | string |
Um código de país opcional de 2 caracteres se você deseja extrair de um endereço IP de um país específico. |
|
|
Render
|
render | boolean |
Um booleano para renderizar a página remota. Se você deseja raspar imagens, arquivos JSON, arquivos PDF ou feeds XML, você precisa definir isso como false. |
|
|
Selector
|
selector | string |
Um seletor CSS. Ex: a.navbar-marca. |
|
|
Timeout
|
timeout | integer |
Um tempo limite em segundos antes do raspador retornar um resultado. Valor mínimo: 5, máx.: 45. |
Devoluções
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
Seletor de dados
|
data-selector | array of string |
Os dados selecionados. |
|
Country
|
options.country | string |
O país pediu. |
|
Render
|
options.render | boolean |
Se renderizado. |
|
Selector
|
options.selector | string |
O seletor solicitou. |
|
Timeout
|
options.timeout | integer |
O tempo limite solicitado. |
|
Título da página
|
page_title | string |
O título da página. |
|
URL do resultado
|
result_url | string |
O endereço URL do resultado. |
|
URL
|
url | string |
O endereço URL solicitado. |
Raspar uma página de formulário
Raspe uma página remota que contenha um formulário HTML.
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
O endereço URL a ser raspado. |
|
Country
|
country | string |
Um código de país opcional de 2 caracteres se você deseja extrair de um endereço IP de um país específico. |
|
|
Render
|
render | boolean |
Um booleano para renderizar a página remota. Se você deseja raspar imagens, arquivos JSON, arquivos PDF ou feeds XML, você precisa definir isso como false. |
|
|
Selector
|
selector | string |
Um seletor CSS. Ex: a.navbar-marca. |
|
|
Timeout
|
timeout | integer |
Um tempo limite em segundos antes do raspador retornar um resultado. Valor mínimo: 5, máx.: 45. |
|
|
Body
|
body | True | string |
As entradas do formulário. |
Devoluções
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
Seletor de dados
|
data-selector | array of string |
Os dados selecionados. |
|
Country
|
options.country | string |
O país pediu. |
|
Render
|
options.render | boolean |
Se renderizado. |
|
Selector
|
options.selector | string |
O seletor solicitou. |
|
Timeout
|
options.timeout | integer |
O tempo limite solicitado. |
|
Título da página
|
page_title | string |
O título da página. |
|
Referer
|
request_headers.Referer | string |
O referente. |
|
O endereço URL do resultado.
|
result_url | string |
URL do resultado |
|
O endereço URL solicitado.
|
url | string |
URL |