高级刮刀 (独立发布者)
具有来自 170 多个国家/地区的轮换 IP 的高级 Web 刮刀 API。
此连接器在以下产品和区域中可用:
| 服务 | Class | 区域 |
|---|---|---|
| Copilot Studio | 高级 | 除以下各项外的所有 Power Automate 区域 : - 美国政府 (GCC) - 美国政府 (GCC High) - 由世纪互联运营的中国云 - 美国国防部(DoD) |
| 逻辑应用程序 | 标准 | 除以下各项外的所有 逻辑应用区域 : - Azure 政府区域 - Azure 中国区域 - 美国国防部(DoD) |
| Power Apps | 高级 | 除以下各项外的所有 Power Apps 区域 : - 美国政府 (GCC) - 美国政府 (GCC High) - 由世纪互联运营的中国云 - 美国国防部(DoD) |
| Power Automate | 高级 | 除以下各项外的所有 Power Automate 区域 : - 美国政府 (GCC) - 美国政府 (GCC High) - 由世纪互联运营的中国云 - 美国国防部(DoD) |
| 联系人 | |
|---|---|
| Name | 特洛伊·泰勒 |
| URL | https://www.hitachisolutions.com |
| ttaylor@hitachisolutions.com |
| 连接器元数据 | |
|---|---|
| 发布者 | 特洛伊·泰勒,日立解决方案 |
| Website | https://apilayer.com/marketplace/description/adv_scraper-api |
| 隐私策略 | https://www.ideracorp.com/Legal/APILayer/PrivacyStatement |
| 类别 | Website |
正在创建连接
连接器支持以下身份验证类型:
| 默认 | 用于创建连接的参数。 | 所有区域 | 不可共享 |
违约
适用:所有区域
用于创建连接的参数。
这是不可共享的连接。 如果 Power App 与另一个用户共享,系统会提示其他用户显式创建新连接。
| Name | 类型 | Description | 必选 |
|---|---|---|---|
| API 密钥 | securestring | 此 API 的 API 密钥 | True |
限制
| 名称 | 调用 | 续订期 |
|---|---|---|
| 每个连接的 API 调用数 | 100 | 60 秒 |
操作
| 擦除窗体页 |
抓取包含 HTML 窗体的远程页面。 |
| 擦除远程 URL |
抓取远程 URL,并从国家/地区、呈现、CSS 选择器以及超时提供可选请求。 |
擦除窗体页
抓取包含 HTML 窗体的远程页面。
参数
| 名称 | 密钥 | 必需 | 类型 | 说明 |
|---|---|---|---|---|
|
URL
|
url | True | string |
要擦除的 URL 地址。 |
|
国家
|
country | string |
如果要从特定国家/地区的 IP 地址中刮去,则为可选 2 个字符的国家/地区代码。 |
|
|
Render
|
render | boolean |
是否呈现远程页面的布尔值。 如果想要抓取图像、JSON 文件、PDF 文件或 XML 源,则需要将它设置为 false。 |
|
|
Selector
|
selector | string |
CSS 选择器。 例如:a.navbar-brand。 |
|
|
超时
|
timeout | integer |
报废器返回结果前的超时(以秒为单位)。 最小值:5,最大值:45。 |
|
|
Body
|
body | True | string |
表单条目。 |
返回
| 名称 | 路径 | 类型 | 说明 |
|---|---|---|---|
|
数据选择器
|
data-selector | array of string |
选择的数据。 |
|
国家
|
options.country | string |
国家/地区要求。 |
|
Render
|
options.render | boolean |
是否呈现。 |
|
Selector
|
options.selector | string |
请求的选择器。 |
|
超时
|
options.timeout | integer |
请求的超时。 |
|
页面标题
|
page_title | string |
页面的标题。 |
|
引用者
|
request_headers.Referer | string |
引用者。 |
|
结果 URL 地址。
|
result_url | string |
结果 URL |
|
请求的 URL 地址。
|
url | string |
URL |
擦除远程 URL
抓取远程 URL,并从国家/地区、呈现、CSS 选择器以及超时提供可选请求。
参数
| 名称 | 密钥 | 必需 | 类型 | 说明 |
|---|---|---|---|---|
|
URL
|
url | True | string |
要擦除的 URL 地址。 |
|
国家
|
country | string |
如果要从特定国家/地区的 IP 地址中刮去,则为可选 2 个字符的国家/地区代码。 |
|
|
Render
|
render | boolean |
是否呈现远程页面的布尔值。 如果想要抓取图像、JSON 文件、PDF 文件或 XML 源,则需要将它设置为 false。 |
|
|
Selector
|
selector | string |
CSS 选择器。 例如:a.navbar-brand。 |
|
|
超时
|
timeout | integer |
报废器返回结果前的超时(以秒为单位)。 最小值:5,最大值:45。 |
返回
| 名称 | 路径 | 类型 | 说明 |
|---|---|---|---|
|
数据选择器
|
data-selector | array of string |
选择的数据。 |
|
国家
|
options.country | string |
国家/地区要求。 |
|
Render
|
options.render | boolean |
是否呈现。 |
|
Selector
|
options.selector | string |
请求的选择器。 |
|
超时
|
options.timeout | integer |
请求的超时。 |
|
页面标题
|
page_title | string |
页面标题。 |
|
结果 URL
|
result_url | string |
结果 URL 地址。 |
|
URL
|
url | string |
请求的 URL 地址。 |