Freigeben über


MiniSoup HTML Parser (Unabhängiger Herausgeber) (Vorschau)

Eine einfache HTML-Analysebibliothek, die von Beautiful Soup inspiriert ist und Funktionen für die HTML-Elementanalyse und -extraktion bereitstellt

Dieser Connector ist in den folgenden Produkten und Regionen verfügbar:

Dienstleistung Class Regions
Copilot Studio Premium Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Logik-Apps Norm Alle Logik-Apps-Regionen mit Ausnahme der folgenden Bereiche:
     – Azure Government-Regionen
     - Azure China-Regionen
     - US Department of Defense (DoD)
Power Apps Premium Alle Power Apps-Regionen mit Ausnahme der folgenden:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Power Automate Premium Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Kontakt
Name MiniSoup-Unterstützung
URL https://github.com/DEmodoriGatsuO/MiniSoup
Email demodori.gatsuo@gmail.com
Connectormetadaten
Herausgeber Shogo Shindo
Webseite https://github.com/DEmodoriGatsuO/MiniSoup
Datenschutzrichtlinie https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md
Kategorien Daten; Website

Drosselungsgrenzwerte

Name Aufrufe Verlängerungszeitraum
API-Aufrufe pro Verbindung 100 60 Sekunden

Aktionen

ABRUFEN von HTML-Inhalten

Ruft HTML-Inhalte von einer angegebenen URL ab.

Analysieren einer HTML-Tabelle

Analysiert eine HTML-Tabelle in strukturierte Daten mit Kopfzeilen und Zeilen

Extrahieren von Werten aus HTML-Elementen

Extrahiert bestimmte Attributwerte aus HTML-Elementen, die dem bereitgestellten Selektor entsprechen

HTML-Elemente auswählen

Wählt HTML-Elemente aus, die dem bereitgestellten Selektor entsprechen.

Suchen aller übereinstimmenden Elemente

Sucht alle HTML-Elemente, die dem angegebenen Tagnamen und optionalen Attributen entsprechen

ABRUFEN von HTML-Inhalten

Ruft HTML-Inhalte von einer angegebenen URL ab.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
URL
url True string

URL zum Abrufen von HTML-Inhalten von

Gibt zurück

Name Pfad Typ Beschreibung
Erfolgreich
success boolean

Gibt an, ob der Vorgang erfolgreich war.

HTML
html string

HTML-Inhalt, der aus der angegebenen URL abgerufen wurde

Analysieren einer HTML-Tabelle

Analysiert eine HTML-Tabelle in strukturierte Daten mit Kopfzeilen und Zeilen

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
HTML
html True string

HTML-Inhalt, der die Tabelle enthält

table_selector
table_selector string

CSS-Selektor zum Suchen des HTML-Tabellenelements

header_rows_exist
header_rows_exist boolean

Gibt an, ob die Tabelle Überschriftenzeilen enthält.

Gibt zurück

Name Pfad Typ Beschreibung
Erfolgreich
success boolean

Gibt an, ob der Vorgang erfolgreich war.

Headers
data.Headers array of string

Aus der Tabelle extrahierte Spaltenüberschriften

Rows
data.Rows array of array

Tabellenzeilen, die jeweils ein Array von Zellwerten enthalten

items
data.Rows array of string

Extrahieren von Werten aus HTML-Elementen

Extrahiert bestimmte Attributwerte aus HTML-Elementen, die dem bereitgestellten Selektor entsprechen

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
HTML
html True string

HTML-Inhalt, der analysiert werden soll

Selektor
selector True string

CSS-Selektor oder XPath für Zielelemente

Attribut
attribute True string

Attribut, das aus ausgewählten Elementen extrahiert werden soll. Verwenden von "Text" für inneren Text, "html" für inneren HTML oder spezifischen Attributnamen

selector_type
selector_type string

Typ der zu verwendenden Auswahl

Gibt zurück

Name Pfad Typ Beschreibung
Erfolgreich
success boolean

Gibt an, ob der Vorgang erfolgreich war.

values
values array of string

Array von extrahierten Werten aus den übereinstimmenden Elementen

count
count integer

Anzahl der extrahierten Werte

HTML-Elemente auswählen

Wählt HTML-Elemente aus, die dem bereitgestellten Selektor entsprechen.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
HTML
html True string

HTML-Inhalt, der analysiert werden soll

Selektor
selector True string

CSS-Selektor oder XPath für Zielelemente

selector_type
selector_type string

Typ der zu verwendenden Auswahl

Gibt zurück

Name Pfad Typ Beschreibung
Erfolgreich
success boolean

Gibt an, ob der Vorgang erfolgreich war.

Elemente
elements array of HtmlElement

Array von HTML-Elementen, die dem angegebenen Selektor entsprechen

count
count integer

Anzahl der gefundenen Elemente

Suchen aller übereinstimmenden Elemente

Sucht alle HTML-Elemente, die dem angegebenen Tagnamen und optionalen Attributen entsprechen

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
HTML
html True string

HTML-Inhalt, der analysiert werden soll

tag_name
tag_name True string

HTML-Tagname, nach dem gesucht werden soll

id
id string

Filtern nach Element-ID

class
class string

Filtern nach Elementklasse

Gibt zurück

Name Pfad Typ Beschreibung
Erfolgreich
success boolean

Gibt an, ob der Vorgang erfolgreich war.

Elemente
elements array of HtmlElement

Array von HTML-Elementen, die mit dem angegebenen Tagnamen und -attributen übereinstimmen

count
count integer

Anzahl der gefundenen Elemente

Definitionen

HtmlElement

Stellt ein HTML-Element mit seinen Eigenschaften und Attributen dar.

Name Pfad Typ Beschreibung
tag
tag string

Der HTML-Tagname des Elements (z. B. "div", "span", "a").

outerHtml
outerHtml string

Der vollständige HTML-Code des Elements einschließlich des Elements selbst

innerHtml
innerHtml string

Der HTML-Inhalt innerhalb des Elements, der andere Elemente enthalten kann

innerText
innerText string

Der Textinhalt innerhalb des Elements, wobei alle HTML-Tags entfernt wurden

attributes
attributes object

Alle Attribute des Elements als Name-Wert-Paare

isSelfClosing
isSelfClosing boolean

Gibt an, ob das Element ein selbstschließendes Tag ist (z. B. ,
)