Analyseur HTML MiniSoup (éditeur indépendant) (préversion)
Bibliothèque d’analyse HTML légère inspirée de Beautiful Soup, offrant des fonctionnalités d’analyse et d’extraction d’éléments HTML
Ce connecteur est disponible dans les produits et régions suivants :
| Service | classe | Régions |
|---|---|---|
| Copilot Studio | Premium | Toutes les régions Power Automate , à l’exception des éléments suivants : - Us Government (GCC) - Us Government (GCC High) - China Cloud géré par 21Vianet - Us Department of Defense (DoD) |
| Applications logiques | Norme | Toutes les régions Logic Apps , à l’exception des suivantes : - Régions Azure Government - Régions Azure Chine - Us Department of Defense (DoD) |
| Power Apps | Premium | Toutes les régions Power Apps , à l’exception des suivantes : - Us Government (GCC) - Us Government (GCC High) - China Cloud géré par 21Vianet - Us Department of Defense (DoD) |
| Power Automate | Premium | Toutes les régions Power Automate , à l’exception des éléments suivants : - Us Government (GCC) - Us Government (GCC High) - China Cloud géré par 21Vianet - Us Department of Defense (DoD) |
| Contact | |
|---|---|
| Nom | Prise en charge de MiniSoup |
| URL | https://github.com/DEmodoriGatsuO/MiniSoup |
| Messagerie électronique | demodori.gatsuo@gmail.com |
| Métadonnées du connecteur | |
|---|---|
| Éditeur | Shogo Shindo |
| Site internet | https://github.com/DEmodoriGatsuO/MiniSoup |
| Politique de confidentialité | https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md |
| Catégories | Données; Site internet |
Limitations
| Nom | Appels | Période de renouvellement |
|---|---|---|
| Appels d’API par connexion | 100 | 60 secondes |
Actions
| Analyser la table HTML |
Analyse une table HTML en données structurées avec des en-têtes et des lignes |
| Extraire des valeurs à partir d’éléments HTML |
Extrait des valeurs d’attribut spécifiques à partir d’éléments HTML correspondant au sélecteur fourni |
| Rechercher tous les éléments correspondants |
Recherche tous les éléments HTML correspondant au nom de balise et aux attributs facultatifs spécifiés |
| Récupérer du contenu HTML |
Récupère du contenu HTML à partir d’une URL spécifiée |
| Sélectionner des éléments HTML |
Sélectionne les éléments HTML correspondant au sélecteur fourni |
Analyser la table HTML
Analyse une table HTML en données structurées avec des en-têtes et des lignes
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Contenu HTML contenant le tableau |
|
table_selector
|
table_selector | string |
Sélecteur CSS pour localiser l’élément de table HTML |
|
|
header_rows_exist
|
header_rows_exist | boolean |
Indique si la table comporte des lignes d’en-tête |
Retours
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
success
|
success | boolean |
Indique si l’opération a réussi |
|
headers
|
data.Headers | array of string |
En-têtes de colonne extraits de la table |
|
Rows
|
data.Rows | array of array |
Lignes de tableau, chacune contenant un tableau de valeurs de cellule |
|
items
|
data.Rows | array of string |
Extraire des valeurs à partir d’éléments HTML
Extrait des valeurs d’attribut spécifiques à partir d’éléments HTML correspondant au sélecteur fourni
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Contenu HTML à analyser |
|
sélecteur
|
selector | True | string |
Sélecteur CSS ou XPath pour le ciblage d’éléments |
|
attribute
|
attribute | True | string |
Attribut à extraire des éléments sélectionnés. Utilisez « text » pour le texte interne, « html » pour le code HTML interne ou un nom d’attribut spécifique |
|
selector_type
|
selector_type | string |
Type de sélecteur à utiliser |
Retours
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
success
|
success | boolean |
Indique si l’opération a réussi |
|
values
|
values | array of string |
Tableau de valeurs extraites des éléments correspondants |
|
count
|
count | integer |
Nombre de valeurs extraites |
Rechercher tous les éléments correspondants
Recherche tous les éléments HTML correspondant au nom de balise et aux attributs facultatifs spécifiés
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Contenu HTML à analyser |
|
tag_name
|
tag_name | True | string |
Nom de balise HTML à rechercher |
|
pièce d'identité
|
id | string |
Filtrer par ID d’élément |
|
|
classe
|
class | string |
Filtrer par classe d’élément |
Retours
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
success
|
success | boolean |
Indique si l’opération a réussi |
|
Éléments
|
elements | array of HtmlElement |
Tableau d’éléments HTML qui correspondent au nom et aux attributs de balise spécifiés |
|
count
|
count | integer |
Nombre d’éléments trouvés |
Récupérer du contenu HTML
Récupère du contenu HTML à partir d’une URL spécifiée
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
URL d’extraction du contenu HTML à partir de |
Retours
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
success
|
success | boolean |
Indique si l’opération a réussi |
|
html
|
html | string |
Contenu HTML récupéré à partir de l’URL spécifiée |
Sélectionner des éléments HTML
Sélectionne les éléments HTML correspondant au sélecteur fourni
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Contenu HTML à analyser |
|
sélecteur
|
selector | True | string |
Sélecteur CSS ou XPath pour le ciblage d’éléments |
|
selector_type
|
selector_type | string |
Type de sélecteur à utiliser |
Retours
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
success
|
success | boolean |
Indique si l’opération a réussi |
|
Éléments
|
elements | array of HtmlElement |
Tableau d’éléments HTML qui correspondent au sélecteur spécifié |
|
count
|
count | integer |
Nombre d’éléments trouvés |
Définitions
HtmlElement
Représente un élément HTML avec ses propriétés et ses attributs
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
tag
|
tag | string |
Nom de balise HTML de l’élément (par exemple, 'div', 'span', 'a') |
|
outerHtml
|
outerHtml | string |
Code HTML complet de l’élément, y compris l’élément lui-même |
|
innerHtml
|
innerHtml | string |
Contenu HTML à l’intérieur de l’élément, qui peut inclure d’autres éléments |
|
innerText
|
innerText | string |
Contenu texte à l’intérieur de l’élément avec toutes les balises HTML supprimées |
|
attributes
|
attributes | object |
Tous les attributs de l’élément en tant que paires nom-valeur |
|
isSelfClosing
|
isSelfClosing | boolean |
Indique si l’élément est une balise de fermeture automatique (par exemple, |