MiniSoup HTML Parser (Unabhängiger Herausgeber) (Vorschau)
Eine einfache HTML-Analysebibliothek, die von Beautiful Soup inspiriert ist und Funktionen für die HTML-Elementanalyse und -extraktion bereitstellt
Dieser Connector ist in den folgenden Produkten und Regionen verfügbar:
| Dienstleistung | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche: - US Government (GCC) - US Government (GCC High) - China Cloud betrieben von 21Vianet - US Department of Defense (DoD) |
| Logik-Apps | Norm | Alle Logik-Apps-Regionen mit Ausnahme der folgenden Bereiche: – Azure Government-Regionen - Azure China-Regionen - US Department of Defense (DoD) |
| Power Apps | Premium | Alle Power Apps-Regionen mit Ausnahme der folgenden: - US Government (GCC) - US Government (GCC High) - China Cloud betrieben von 21Vianet - US Department of Defense (DoD) |
| Power Automate | Premium | Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche: - US Government (GCC) - US Government (GCC High) - China Cloud betrieben von 21Vianet - US Department of Defense (DoD) |
| Kontakt | |
|---|---|
| Name | MiniSoup-Unterstützung |
| URL | https://github.com/DEmodoriGatsuO/MiniSoup |
| demodori.gatsuo@gmail.com |
| Connectormetadaten | |
|---|---|
| Herausgeber | Shogo Shindo |
| Webseite | https://github.com/DEmodoriGatsuO/MiniSoup |
| Datenschutzrichtlinie | https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md |
| Kategorien | Daten; Website |
Drosselungsgrenzwerte
| Name | Aufrufe | Verlängerungszeitraum |
|---|---|---|
| API-Aufrufe pro Verbindung | 100 | 60 Sekunden |
Aktionen
| ABRUFEN von HTML-Inhalten |
Ruft HTML-Inhalte von einer angegebenen URL ab. |
| Analysieren einer HTML-Tabelle |
Analysiert eine HTML-Tabelle in strukturierte Daten mit Kopfzeilen und Zeilen |
| Extrahieren von Werten aus HTML-Elementen |
Extrahiert bestimmte Attributwerte aus HTML-Elementen, die dem bereitgestellten Selektor entsprechen |
| HTML-Elemente auswählen |
Wählt HTML-Elemente aus, die dem bereitgestellten Selektor entsprechen. |
| Suchen aller übereinstimmenden Elemente |
Sucht alle HTML-Elemente, die dem angegebenen Tagnamen und optionalen Attributen entsprechen |
ABRUFEN von HTML-Inhalten
Ruft HTML-Inhalte von einer angegebenen URL ab.
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
URL
|
url | True | string |
URL zum Abrufen von HTML-Inhalten von |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Erfolgreich
|
success | boolean |
Gibt an, ob der Vorgang erfolgreich war. |
|
HTML
|
html | string |
HTML-Inhalt, der aus der angegebenen URL abgerufen wurde |
Analysieren einer HTML-Tabelle
Analysiert eine HTML-Tabelle in strukturierte Daten mit Kopfzeilen und Zeilen
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
HTML
|
html | True | string |
HTML-Inhalt, der die Tabelle enthält |
|
table_selector
|
table_selector | string |
CSS-Selektor zum Suchen des HTML-Tabellenelements |
|
|
header_rows_exist
|
header_rows_exist | boolean |
Gibt an, ob die Tabelle Überschriftenzeilen enthält. |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Erfolgreich
|
success | boolean |
Gibt an, ob der Vorgang erfolgreich war. |
|
Headers
|
data.Headers | array of string |
Aus der Tabelle extrahierte Spaltenüberschriften |
|
Rows
|
data.Rows | array of array |
Tabellenzeilen, die jeweils ein Array von Zellwerten enthalten |
|
items
|
data.Rows | array of string |
Extrahieren von Werten aus HTML-Elementen
Extrahiert bestimmte Attributwerte aus HTML-Elementen, die dem bereitgestellten Selektor entsprechen
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
HTML
|
html | True | string |
HTML-Inhalt, der analysiert werden soll |
|
Selektor
|
selector | True | string |
CSS-Selektor oder XPath für Zielelemente |
|
Attribut
|
attribute | True | string |
Attribut, das aus ausgewählten Elementen extrahiert werden soll. Verwenden von "Text" für inneren Text, "html" für inneren HTML oder spezifischen Attributnamen |
|
selector_type
|
selector_type | string |
Typ der zu verwendenden Auswahl |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Erfolgreich
|
success | boolean |
Gibt an, ob der Vorgang erfolgreich war. |
|
values
|
values | array of string |
Array von extrahierten Werten aus den übereinstimmenden Elementen |
|
count
|
count | integer |
Anzahl der extrahierten Werte |
HTML-Elemente auswählen
Wählt HTML-Elemente aus, die dem bereitgestellten Selektor entsprechen.
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
HTML
|
html | True | string |
HTML-Inhalt, der analysiert werden soll |
|
Selektor
|
selector | True | string |
CSS-Selektor oder XPath für Zielelemente |
|
selector_type
|
selector_type | string |
Typ der zu verwendenden Auswahl |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Erfolgreich
|
success | boolean |
Gibt an, ob der Vorgang erfolgreich war. |
|
Elemente
|
elements | array of HtmlElement |
Array von HTML-Elementen, die dem angegebenen Selektor entsprechen |
|
count
|
count | integer |
Anzahl der gefundenen Elemente |
Suchen aller übereinstimmenden Elemente
Sucht alle HTML-Elemente, die dem angegebenen Tagnamen und optionalen Attributen entsprechen
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
HTML
|
html | True | string |
HTML-Inhalt, der analysiert werden soll |
|
tag_name
|
tag_name | True | string |
HTML-Tagname, nach dem gesucht werden soll |
|
id
|
id | string |
Filtern nach Element-ID |
|
|
class
|
class | string |
Filtern nach Elementklasse |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Erfolgreich
|
success | boolean |
Gibt an, ob der Vorgang erfolgreich war. |
|
Elemente
|
elements | array of HtmlElement |
Array von HTML-Elementen, die mit dem angegebenen Tagnamen und -attributen übereinstimmen |
|
count
|
count | integer |
Anzahl der gefundenen Elemente |
Definitionen
HtmlElement
Stellt ein HTML-Element mit seinen Eigenschaften und Attributen dar.
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
tag
|
tag | string |
Der HTML-Tagname des Elements (z. B. "div", "span", "a"). |
|
outerHtml
|
outerHtml | string |
Der vollständige HTML-Code des Elements einschließlich des Elements selbst |
|
innerHtml
|
innerHtml | string |
Der HTML-Inhalt innerhalb des Elements, der andere Elemente enthalten kann |
|
innerText
|
innerText | string |
Der Textinhalt innerhalb des Elements, wobei alle HTML-Tags entfernt wurden |
|
attributes
|
attributes | object |
Alle Attribute des Elements als Name-Wert-Paare |
|
isSelfClosing
|
isSelfClosing | boolean |
Gibt an, |