ScrapingBee (onafhankelijke uitgever) (preview)
ScrapingBee is de krachtigste webschrootservice op het web. Het verwerkt hoofdloze browsers, proxy's, CAPTCHAs, het extraheren van complexe gestructureerde informatie van elke website met CSS-selectors en het uitvoeren van JavaScript-scenario's (klikken, schuiven, formulier vullen, enzovoort).
Deze connector is beschikbaar in de volgende producten en regio's:
| Dienst | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Alle Power Automate-regio's , met uitzondering van het volgende: - Amerikaanse overheid (GCC) - Amerikaanse overheid (GCC High) - China Cloud beheerd door 21Vianet - Us Department of Defense (DoD) |
| Logic-apps | Standaard | Alle Logic Apps-regio's , met uitzondering van het volgende: - Azure Government-regio's - Azure China-regio's - Us Department of Defense (DoD) |
| Power Apps | Premium | Alle Power Apps-regio's , met uitzondering van het volgende: - Amerikaanse overheid (GCC) - Amerikaanse overheid (GCC High) - China Cloud beheerd door 21Vianet - Us Department of Defense (DoD) |
| Power Automate | Premium | Alle Power Automate-regio's , met uitzondering van het volgende: - Amerikaanse overheid (GCC) - Amerikaanse overheid (GCC High) - China Cloud beheerd door 21Vianet - Us Department of Defense (DoD) |
| Contactpersoon | |
|---|---|
| Naam | Troy Taylor |
| URL | https://www.hitachisolutions.com |
| E-mailen | ttaylor@hitachisolutions.com |
| Connectormetagegevens | |
|---|---|
| Uitgever | Troy Taylor |
| Webpagina | https://www.scrapingbee.com/ |
| Privacybeleid | https://www.scrapingbee.com/privacy-policy/ |
| Categorieën | Webpagina |
Een verbinding maken
De connector ondersteunt de volgende verificatietypen:
| standaard | Parameters voor het maken van verbinding. | Alle regio's | Niet deelbaar |
Verstek
Van toepassing: Alle regio's
Parameters voor het maken van verbinding.
Dit is geen deelbare verbinding. Als de power-app wordt gedeeld met een andere gebruiker, wordt een andere gebruiker gevraagd om expliciet een nieuwe verbinding te maken.
| Naam | Typologie | Description | Verplicht |
|---|---|---|---|
| API-sleutel | beveiligde string | De API-sleutel voor deze API | Klopt |
Beperkingslimieten
| Name | Aanroepen | Verlengingsperiode |
|---|---|---|
| API-aanroepen per verbinding | 100 | 60 seconden |
Acties
| Gebruik ophalen |
Informatie ophalen over het gebruik van het tegoed en het gelijktijdigheidsgebruik. |
| Google-zoekopdracht uitvoeren |
Hiermee haalt u een scrape van Google Search-resultatenpagina's op |
| Scrap-URL |
Haalt de URL op die is aangevraagd om te scrapen en geeft JavaScript weer als dit wordt aangevraagd. |
Gebruik ophalen
Informatie ophalen over het gebruik van het tegoed en het gelijktijdigheidsgebruik.
Retouren
| Name | Pad | Type | Description |
|---|---|---|---|
|
Maximaal API-tegoed
|
max_api_credit | integer |
Het maximale API-tegoed. |
|
Gebruikt API-tegoed
|
used_api_credit | integer |
Het gebruikte API-tegoed. |
|
Maximale gelijktijdigheid
|
max_concurrency | integer |
De maximale gelijktijdigheid. |
|
Huidige gelijktijdigheid
|
current_concurrency | integer |
De huidige gelijktijdigheid. |
|
Abonnementsdatum verlengen
|
renewal_subscription_date | string |
De verlengingsdatum van het abonnement. |
Google-zoekopdracht uitvoeren
Hiermee haalt u een scrape van Google Search-resultatenpagina's op
Parameters
| Name | Sleutel | Vereist | Type | Description |
|---|---|---|---|---|
|
Zoeken
|
search | True | string |
De tekst die u in de Google-zoekbalk zou plaatsen. |
|
Landcode
|
country_code | string |
Het land waar u het verzoek vandaan wilt halen. |
|
|
Results
|
nb_results | integer |
Het aantal te retourneren resultaten. |
|
|
Page
|
page | integer |
Het paginanummer waaruit resultaten moeten worden geëxtraheerd. |
|
|
Language
|
language | string |
De taal waarin de resultaten moeten worden geretourneerd. |
|
|
Extra Params
|
extra_params | string |
Eventuele extra URL-parameters die moeten worden verzonden. |
Retouren
| Name | Pad | Type | Description |
|---|---|---|---|
|
URL
|
meta_data.url | string |
Het URL-adres. |
|
Results
|
meta_data.number_of_results | integer |
Het aantal resultaten. |
|
Locatie
|
meta_data.location | string |
De locatie. |
|
Organische resultaten
|
meta_data.number_of_organic_results | integer |
Het aantal organische resultaten. |
|
Advertenties
|
meta_data.number_of_ads | integer |
Het aantal advertenties. |
|
Page
|
meta_data.number_of_page | integer |
Het paginanummer. |
|
Geen resultatenbericht
|
meta_data.no_results_message | string |
Het bericht zonder resultaten. |
|
Organische resultaten
|
organic_results | array of object | |
|
URL
|
organic_results.url | string |
Het URL-adres. |
|
Weergegeven URL
|
organic_results.displayed_url | string |
De weergegeven URL-adressen. |
|
Description
|
organic_results.description | string |
De beschrijving. |
|
Extra informatie
|
organic_results.extra_info | string |
De extra informatie. |
|
Position
|
organic_results.position | integer |
De positie. |
|
Title
|
organic_results.title | string |
De titel. |
|
Lokale resultaten
|
local_results | array of string |
De lokale resultaten. |
|
Topadvertenties
|
top_ads | string |
De beste advertenties. |
|
Onderste advertenties
|
bottom_ads | string |
De onderste advertenties. |
|
Verwante query's
|
related_queries | array of object | |
|
Tekst
|
related_queries.text | string |
De tekst. |
|
Position
|
related_queries.position | integer |
De positie. |
|
Vragen
|
questions | array of string |
De vragen. |
Scrap-URL
Haalt de URL op die is aangevraagd om te scrapen en geeft JavaScript weer als dit wordt aangevraagd.
Parameters
| Name | Sleutel | Vereist | Type | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
De URL die u wilt scrapen. |
|
JS weergeven
|
render_js | True | boolean |
De website weergeven in een headless browser. |
|
JS-scenario
|
js_scenario | string |
Voer JavaScript uit voordat u de rendering uitvoert. |
|
|
Wait
|
wait | integer |
Tijd om te wachten voordat de weergave wordt weergegeven. |
|
|
Wachten op
|
wait_for | string |
Wacht tot een bepaald element wordt weergegeven in de DOM. |
|
|
Advertenties blokkeren
|
block_ads | boolean |
Of advertenties moeten worden geblokkeerd. |
|
|
Resources blokkeren
|
block_resources | boolean |
Of u alle afbeeldingen en CSS wilt blokkeren. |
|
|
Breedte van venster
|
window_width | integer |
De breedte van het venster dat moet worden gebruikt. |
|
|
Hoogte van venster
|
window_height | integer |
De hoogte van het venster dat moet worden gebruikt. |
|
|
Premium-proxy
|
premium_proxy | boolean |
Of u een proxy wilt gebruiken om een website te scrapen. |
|
|
Landcode
|
country_code | string |
Het proxyland dat moet worden gebruikt voor het scrapen van de website. |
|
|
Verborgen proxy
|
stealth_proxy | boolean |
Of u een verborgen proxy gebruikt om website te scrapen. |
|
|
Eigen proxy
|
own_proxy | string |
Uw eigen proxy die u wilt gebruiken. |
|
|
Regels extraheren
|
extract_rules | string |
Extractieregels om de HTML te parseren voordat ze reageren. |
|
|
Screenshot
|
screenshot | boolean |
Maak een schermopname van de aangevraagde website. |
|
|
Schermopnamekiezer
|
screenshot_selector | string |
Maak een schermopname van een bepaalde CSS-selector. |
|
|
Schermopname van volledige pagina
|
screenshot_full_page | boolean |
Maak een schermopname van de hele website. |
|
|
Bron van retourpagina
|
return_page_source | boolean |
De paginabron ook retourneren. |
|
|
Sessie-id
|
session_id | integer |
Alle API-aanvragen die gebruikmaken van dezelfde session_id worden gedurende vijf minuten gerouteerd via hetzelfde IP-adres. |
|
|
Onderbreking
|
timeout | integer |
Het maximum aantal ms time-outs, tussen 1000 en 140000 (standaard). |
|
|
Cookies
|
cookies | string |
Aangepaste cookie om door te geven aan de website. |
|
|
Apparaat
|
device | string |
Het type apparaat dat naar de server wordt verzonden. |
|
|
Aangepaste Google
|
custom_google | boolean |
Ingesteld op waar als u webpagina's op Google of een Google-subdomein plakt. |
Retouren
| Name | Pad | Type | Description |
|---|---|---|---|
|
Body
|
body | string |
Het lichaam. |
|
Cookies
|
cookies | array of object | |
|
Naam
|
cookies.name | string |
De naam. |
|
Waarde
|
cookies.value | string |
De waarde. |
|
Domein
|
cookies.domain | string |
Het domein. |
|
Path
|
cookies.path | string |
Het pad. |
|
Verloopt
|
cookies.expires | float |
Wanneer deze verloopt. |
|
Grootte
|
cookies.size | integer |
De grootte. |
|
Alleen HTTP
|
cookies.httpOnly | boolean |
Of alleen HTTP. |
|
Secure
|
cookies.secure | boolean |
Of het veilig is. |
|
Session
|
cookies.session | boolean |
Of sessie. |
|
Dezelfde partij
|
cookies.sameParty | boolean |
Of hetzelfde feest. |
|
Bronschema
|
cookies.sourceScheme | string |
Het bronschema. |
|
Bronpoort
|
cookies.sourcePort | integer |
De bronpoort. |
|
Geëvalueerde resultaten
|
evaluate_results | array of string |
De geëvalueerde resultaten. |
|
Leeftijd
|
headers.age | string |
De leeftijd. |
|
Cachebeheer
|
headers.cache-control | string |
Het cachebeheer. |
|
Inhoudscodering
|
headers.content-encoding | string |
De inhoudscodering. |
|
Beleid voor inhoudsbeveiliging
|
headers.content-security-policy | string |
Het beveiligingsbeleid voor inhoud. |
|
Inhoudstype
|
headers.content-type | string |
Het inhoudstype. |
|
Datum
|
headers.date | string |
De datum. |
|
ETag
|
headers.etag | string |
De eTag. |
|
Referrer-beleid
|
headers.referrer-policy | string |
Het referrerbeleid. |
|
Server
|
headers.server | string |
De server. |
|
Strikte transportbeveiliging
|
headers.strict-transport-security | string |
De strikte transportbeveiliging. |
|
Opties voor X-inhoudstype
|
headers.x-content-type-options | string |
De opties voor het x-inhoudstype. |
|
X-frameopties
|
headers.x-frame-options | string |
De x-frameopties. |
|
X-overeenkomend pad
|
headers.x-matched-path | string |
Het x-overeenkomende pad. |
|
X mogelijk gemaakt door
|
headers.x-powered-by | string |
De x aangedreven door. |
|
X Vercel Cache
|
headers.x-vercel-cache | string |
De x Vercel-cache. |
|
X Vercel-id
|
headers.x-vercel-id | string |
De x Vercel-id. |
|
Typologie
|
type | string |
Het type. |
|
IFrames
|
iframes | array of string |
De iFrames. |
|
XHR
|
xhr | array of object | |
|
URL
|
xhr.url | string |
Het URL-adres. |
|
Statuscode
|
xhr.status_code | integer |
De statuscode. |
|
Methode
|
xhr.method | string |
De methode. |
|
Leeftijd
|
xhr.headers.age | string |
De leeftijd. |
|
Cachebeheer
|
xhr.headers.cache-control | string |
Het cachebeheer. |
|
Lengte van inhoud
|
xhr.headers.content-length | string |
De lengte van de inhoud. |
|
Beleid voor inhoudsbeveiliging
|
xhr.headers.content-security-policy | string |
Het beveiligingsbeleid voor inhoud. |
|
Inhoudstype
|
xhr.headers.content-type | string |
Het inhoudstype. |
|
Datum
|
xhr.headers.date | string |
De datum. |
|
ETag
|
xhr.headers.etag | string |
De eTag. |
|
Referrer-beleid
|
xhr.headers.referrer-policy | string |
Het referrerbeleid. |
|
Server
|
xhr.headers.server | string |
De server. |
|
Strikte transportbeveiliging
|
xhr.headers.strict-transport-security | string |
De strikte transportbeveiliging. |
|
Opties voor X-inhoudstype
|
xhr.headers.x-content-type-options | string |
De opties voor het X-inhoudstype. |
|
X-frameopties
|
xhr.headers.x-frame-options | string |
De X-frameopties. |
|
X-overeenkomend pad
|
xhr.headers.x-matched-path | string |
Het X-overeenkomende pad. |
|
X Vercel Cache
|
xhr.headers.x-vercel-cache | string |
De X Vercel-cache. |
|
X Vercel-id
|
xhr.headers.x-vercel-id | string |
De X Vercel-id. |
|
Toegangsbeheer Oorsprong toestaan
|
xhr.headers.access-control-allow-origin | string |
Het toegangsbeheer staat oorsprong toe. |
|
Koppen beschikbaar maken voor toegangsbeheer
|
xhr.headers.access-control-expose-headers | string |
In het toegangsbeheer worden headers weergegeven. |
|
Alt SVC
|
xhr.headers.alt-svc | string |
De alt-SVC. |
|
Vary
|
xhr.headers.vary | string |
De verschillen. |
|
Via
|
xhr.headers.via | string |
De via. |
|
X Envoy Upstream-servicetijd
|
xhr.headers.x-envoy-upstream-service-time | string |
De X-upvoy-servicetijd. |
|
X Amazon Request ID
|
xhr.headers.x-amzn-requestid | string |
De X Amazon-aanvraag-id. |
|
X Amazon Trace ID
|
xhr.headers.x-amzn-trace-id | string |
De X Amazon-tracerings-id. |
|
Body
|
xhr.body | string |
Het lichaam. |
|
Kosten
|
cost | integer |
De kosten. |
|
Initiële statuscode
|
initial-status-code | integer |
De initiële statuscode. |
|
Opgeloste URL
|
resolved-url | string |
Het opgeloste URL-adres. |
|
Microdata
|
metadata.microdata | array of string |
De microdata. |
|
JSON LD
|
metadata.json-ld | array of object | |
|
Context
|
metadata.json-ld.@context | string |
De context. |
|
Typologie
|
metadata.json-ld.@type | string |
Het type. |
|
Naam
|
metadata.json-ld.name | string |
De naam. |
|
URL
|
metadata.json-ld.url | string |
Het URL-adres. |
|
Description
|
metadata.json-ld.description | string |
De beschrijving. |
|
Typologie
|
metadata.json-ld.mainEntityOfPage.@type | string |
Het type. |
|
URL
|
metadata.json-ld.mainEntityOfPage.url | string |
Het URL-adres. |
|
Typologie
|
metadata.json-ld.image.@type | string |
Het type. |
|
URL
|
metadata.json-ld.image.url | string |
Het URL-adres. |
|
Typologie
|
metadata.json-ld.publisher.@type | string |
Het type. |
|
Naam
|
metadata.json-ld.publisher.name | string |
De naam. |
|
URL
|
metadata.json-ld.publisher.url | string |
Het URL-adres. |
|
Hetzelfde als
|
metadata.json-ld.sameAs | string |
Hetzelfde als. |
|
Grafiek openen
|
metadata.opengraph | array of object | |
|
Grafiektitel openen
|
metadata.opengraph.og:title | string |
De titel Open Graph. |
|
Beschrijving van open grafiek
|
metadata.opengraph.og:description | string |
De beschrijving van Open Graph. |
|
Naam van graph-site openen
|
metadata.opengraph.og:site_name | string |
De naam van de Open Graph-site. |
|
Graph-URL openen
|
metadata.opengraph.og:url | string |
Het URL-adres van Open Graph. |
|
Grafiekafbeelding openen
|
metadata.opengraph.og:image | string |
De afbeelding van Open Graph. |
|
Typologie
|
metadata.opengraph.@type | string |
Het type. |
|
OG
|
metadata.opengraph.@context.og | string |
De open grafiek. |
|
Dublincore
|
metadata.dublincore | array of object | |
|
Elements
|
metadata.dublincore.elements | array of object | |
|
Naam
|
metadata.dublincore.elements.name | string |
De naam. |
|
Content
|
metadata.dublincore.elements.content | string |
De inhoud. |
|
URI
|
metadata.dublincore.elements.URI | string |
De URI. |
|
Terms
|
metadata.dublincore.terms | array of string |
De voorwaarden. |