Raspador Avançado (Editor Independente)
Uma API avançada de raspador da Web com IPs rotativos de mais de 170 países.
Esse conector está disponível nos seguintes produtos e regiões:
| Service | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Todas as regiões do Power Automate , exceto as seguintes: – Governo dos EUA (GCC) – Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Aplicativos Lógicos | Standard | Todas as regiões dos Aplicativos Lógicos , exceto as seguintes: – Regiões do Azure Governamental - Regiões do Azure China - Departamento de Defesa dos EUA (DoD) |
| Power Apps | Premium | Todas as regiões do Power Apps , exceto as seguintes: – Governo dos EUA (GCC) – Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Power Automate | Premium | Todas as regiões do Power Automate , exceto as seguintes: – Governo dos EUA (GCC) – Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Contato | |
|---|---|
| Nome | Troy Taylor |
| URL | https://www.hitachisolutions.com |
| ttaylor@hitachisolutions.com |
| Metadados do conector | |
|---|---|
| Publicador | Troy Taylor, Hitachi Solutions |
| Site | https://apilayer.com/marketplace/description/adv_scraper-api |
| Política de privacidade | https://www.ideracorp.com/Legal/APILayer/PrivacyStatement |
| Categorias | Site |
Criando uma conexão
O conector dá suporte aos seguintes tipos de autenticação:
| Default | Parâmetros para criar conexão. | Todas as regiões | Não compartilhável |
Padrão
Aplicável: todas as regiões
Parâmetros para criar conexão.
Essa não é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.
| Nome | Tipo | Description | Obrigatório |
|---|---|---|---|
| Chave de API | secureString | A chave de API para esta api | Verdade |
Limitações
| Nome | Chamadas | Período de renovação |
|---|---|---|
| Chamadas à API por conexão | 100 | 60 segundos |
Ações
| Raspar uma página de formulário |
Raspe uma página remota que contém um formulário HTML. |
| Raspar uma URL remota |
Raspe uma URL remota, com solicitação opcional de país, renderização, seletor de CSS e tempo limite. |
Raspar uma página de formulário
Raspe uma página remota que contém um formulário HTML.
Parâmetros
| Nome | Chave | Obrigatório | Tipo | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
O endereço de URL a ser raspado. |
|
País
|
country | string |
Um código de país opcional de 2 caracteres se você quiser raspar de um endereço IP de um país específico. |
|
|
Render
|
render | boolean |
Um booliano que deve renderizar a página remota. Se você quiser raspar imagens, arquivos JSON, arquivos PDF ou feeds XML, você precisará definir isso como false. |
|
|
Selector
|
selector | string |
Um seletor CSS. Ex: a.navbar-brand. |
|
|
Intervalo
|
timeout | integer |
Um tempo limite em segundos antes que o raspador retorne um resultado. Valor mínimo: 5, máximo: 45. |
|
|
Corpo
|
body | True | string |
As entradas do formulário. |
Retornos
| Nome | Caminho | Tipo | Description |
|---|---|---|---|
|
Seletor de Dados
|
data-selector | array of string |
Os dados selecionados. |
|
País
|
options.country | string |
O país solicitou. |
|
Render
|
options.render | boolean |
Se renderizado. |
|
Selector
|
options.selector | string |
O seletor solicitado. |
|
Intervalo
|
options.timeout | integer |
O tempo limite solicitado. |
|
Título da Página
|
page_title | string |
O título da página. |
|
Referenciador
|
request_headers.Referer | string |
O referenciador. |
|
O endereço de URL do resultado.
|
result_url | string |
URL de resultado |
|
O endereço de URL solicitado.
|
url | string |
URL |
Raspar uma URL remota
Raspe uma URL remota, com solicitação opcional de país, renderização, seletor de CSS e tempo limite.
Parâmetros
| Nome | Chave | Obrigatório | Tipo | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
O endereço de URL a ser raspado. |
|
País
|
country | string |
Um código de país opcional de 2 caracteres se você quiser raspar de um endereço IP de um país específico. |
|
|
Render
|
render | boolean |
Um booliano que deve renderizar a página remota. Se você quiser raspar imagens, arquivos JSON, arquivos PDF ou feeds XML, você precisará definir isso como false. |
|
|
Selector
|
selector | string |
Um seletor CSS. Ex: a.navbar-brand. |
|
|
Intervalo
|
timeout | integer |
Um tempo limite em segundos antes que o raspador retorne um resultado. Valor mínimo: 5, máximo: 45. |
Retornos
| Nome | Caminho | Tipo | Description |
|---|---|---|---|
|
Seletor de Dados
|
data-selector | array of string |
Os dados selecionados. |
|
País
|
options.country | string |
O país solicitou. |
|
Render
|
options.render | boolean |
Se renderizado. |
|
Selector
|
options.selector | string |
O seletor solicitado. |
|
Intervalo
|
options.timeout | integer |
O tempo limite solicitado. |
|
Título da Página
|
page_title | string |
O título da página. |
|
URL de resultado
|
result_url | string |
O endereço de URL do resultado. |
|
URL
|
url | string |
O endereço de URL solicitado. |