Compartir a través de


Scraper avanzado (publicador independiente)

Una API avanzada de desguace web con direcciones IP giratorias de más de 170 países.

Este conector está disponible en los siguientes productos y regiones:

Service Class Regions
Copilot Studio Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Aplicaciones lógicas Estándar Todas las regiones de Logic Apps excepto las siguientes:
     - Regiones de Azure Government
     - Regiones de Azure China
     - Departamento de Defensa de EE. UU. (DoD)
Power Apps Premium Todas las regiones de Power Apps excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Power Automate Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Contacto
Nombre Troy Taylor
URL https://www.hitachisolutions.com
Correo Electrónico ttaylor@hitachisolutions.com
Metadatos del conector
Publicador Troy Taylor, Hitachi Solutions
Sitio web https://apilayer.com/marketplace/description/adv_scraper-api
Directiva de privacidad https://www.ideracorp.com/Legal/APILayer/PrivacyStatement
Categorías Sitio web

Creación de una conexión

El conector admite los siguientes tipos de autenticación:

Predeterminado Parámetros para crear una conexión. Todas las regiones No se puede compartir

Predeterminado

Aplicable: Todas las regiones

Parámetros para crear una conexión.

Esta conexión no se puede compartir. Si la aplicación de energía se comparte con otro usuario, se pedirá a otro usuario que cree explícitamente una nueva conexión.

Nombre Tipo Description Obligatorio
Clave de API securestring La clave de API de esta API Cierto

Limitaciones

Nombre Llamadas Período de renovación
Llamadas API por conexión 100 60 segundos

Acciones

Extraer una dirección URL remota

Extrae una dirección URL remota, con una solicitud opcional del país, la representación, el selector css y el tiempo de espera.

Extraer una página de formulario

Extrae una página remota que contiene un formulario HTML.

Extraer una dirección URL remota

Extrae una dirección URL remota, con una solicitud opcional del país, la representación, el selector css y el tiempo de espera.

Parámetros

Nombre Clave Requerido Tipo Description
URL
url True string

Dirección URL que se va a extraer.

País
country string

Un código de país opcional de 2 caracteres si desea extraer de una dirección IP de un país específico.

Render
render boolean

Valor booleano si se va a representar la página remota. Si desea extraer imágenes, archivos JSON, archivos PDF o fuentes XML, debe establecerlo en false.

Selector
selector string

Un selector CSS. Por ejemplo: a.navbar-brand.

Timeout
timeout integer

Tiempo de espera en segundos antes de que el scraper devuelva un resultado. Valor mínimo: 5, máximo: 45.

Devoluciones

Nombre Ruta de acceso Tipo Description
Selector de datos
data-selector array of string

Datos seleccionados.

País
options.country string

El país solicitado.

Render
options.render boolean

Indica si se representa.

Selector
options.selector string

Selector solicitado.

Timeout
options.timeout integer

Tiempo de espera solicitado.

Título de página
page_title string

Título de la página.

Dirección URL del resultado
result_url string

Dirección URL del resultado.

URL
url string

Dirección URL solicitada.

Extraer una página de formulario

Extrae una página remota que contiene un formulario HTML.

Parámetros

Nombre Clave Requerido Tipo Description
URL
url True string

Dirección URL que se va a extraer.

País
country string

Un código de país opcional de 2 caracteres si desea extraer de una dirección IP de un país específico.

Render
render boolean

Valor booleano si se va a representar la página remota. Si desea extraer imágenes, archivos JSON, archivos PDF o fuentes XML, debe establecerlo en false.

Selector
selector string

Un selector CSS. Por ejemplo: a.navbar-brand.

Timeout
timeout integer

Tiempo de espera en segundos antes de que el scraper devuelva un resultado. Valor mínimo: 5, máximo: 45.

Body
body True string

Entradas del formulario.

Devoluciones

Nombre Ruta de acceso Tipo Description
Selector de datos
data-selector array of string

Datos seleccionados.

País
options.country string

El país solicitado.

Render
options.render boolean

Indica si se representa.

Selector
options.selector string

Selector solicitado.

Timeout
options.timeout integer

Tiempo de espera solicitado.

Título de página
page_title string

Título de la página.

Referer
request_headers.Referer string

El referenciador.

Dirección URL del resultado.
result_url string

Dirección URL del resultado

Dirección URL solicitada.
url string

URL