高级刮刀 (独立发布者)

具有来自 170 多个国家/地区的轮换 IP 的高级 Web 刮刀 API。

此连接器在以下产品和区域中可用:

服务 Class 区域
Copilot Studio 高级 除以下各项外的所有 Power Automate 区域
     - 美国政府 (GCC)
     - 美国政府 (GCC High)
     - 由世纪互联运营的中国云
     - 美国国防部(DoD)
逻辑应用程序 标准 除以下各项外的所有 逻辑应用区域
     - Azure 政府区域
     - Azure 中国区域
     - 美国国防部(DoD)
Power Apps 高级 除以下各项外的所有 Power Apps 区域
     - 美国政府 (GCC)
     - 美国政府 (GCC High)
     - 由世纪互联运营的中国云
     - 美国国防部(DoD)
Power Automate 高级 除以下各项外的所有 Power Automate 区域
     - 美国政府 (GCC)
     - 美国政府 (GCC High)
     - 由世纪互联运营的中国云
     - 美国国防部(DoD)
联系人​​
Name 特洛伊·泰勒
URL https://www.hitachisolutions.com
Email ttaylor@hitachisolutions.com
连接器元数据
发布者 特洛伊·泰勒,日立解决方案
Website https://apilayer.com/marketplace/description/adv_scraper-api
隐私策略 https://www.ideracorp.com/Legal/APILayer/PrivacyStatement
类别 Website

正在创建连接

连接器支持以下身份验证类型:

默认 用于创建连接的参数。 所有区域 不可共享

违约

适用:所有区域

用于创建连接的参数。

这是不可共享的连接。 如果 Power App 与另一个用户共享,系统会提示其他用户显式创建新连接。

Name 类型 Description 必选
API 密钥 securestring 此 API 的 API 密钥 True

限制

名称 调用 续订期
每个连接的 API 调用数 100 60 秒

操作

擦除窗体页

抓取包含 HTML 窗体的远程页面。

擦除远程 URL

抓取远程 URL,并从国家/地区、呈现、CSS 选择器以及超时提供可选请求。

擦除窗体页

抓取包含 HTML 窗体的远程页面。

参数

名称 密钥 必需 类型 说明
URL
url True string

要擦除的 URL 地址。

国家
country string

如果要从特定国家/地区的 IP 地址中刮去,则为可选 2 个字符的国家/地区代码。

Render
render boolean

是否呈现远程页面的布尔值。 如果想要抓取图像、JSON 文件、PDF 文件或 XML 源,则需要将它设置为 false。

Selector
selector string

CSS 选择器。 例如:a.navbar-brand。

超时
timeout integer

报废器返回结果前的超时(以秒为单位)。 最小值:5,最大值:45。

Body
body True string

表单条目。

返回

名称 路径 类型 说明
数据选择器
data-selector array of string

选择的数据。

国家
options.country string

国家/地区要求。

Render
options.render boolean

是否呈现。

Selector
options.selector string

请求的选择器。

超时
options.timeout integer

请求的超时。

页面标题
page_title string

页面的标题。

引用者
request_headers.Referer string

引用者。

结果 URL 地址。
result_url string

结果 URL

请求的 URL 地址。
url string

URL

擦除远程 URL

抓取远程 URL,并从国家/地区、呈现、CSS 选择器以及超时提供可选请求。

参数

名称 密钥 必需 类型 说明
URL
url True string

要擦除的 URL 地址。

国家
country string

如果要从特定国家/地区的 IP 地址中刮去,则为可选 2 个字符的国家/地区代码。

Render
render boolean

是否呈现远程页面的布尔值。 如果想要抓取图像、JSON 文件、PDF 文件或 XML 源,则需要将它设置为 false。

Selector
selector string

CSS 选择器。 例如:a.navbar-brand。

超时
timeout integer

报废器返回结果前的超时(以秒为单位)。 最小值:5,最大值:45。

返回

名称 路径 类型 说明
数据选择器
data-selector array of string

选择的数据。

国家
options.country string

国家/地区要求。

Render
options.render boolean

是否呈现。

Selector
options.selector string

请求的选择器。

超时
options.timeout integer

请求的超时。

页面标题
page_title string

页面标题。

结果 URL
result_url string

结果 URL 地址。

URL
url string

请求的 URL 地址。