Analizador HTML de MiniSoup (publicador independiente) (versión preliminar)
Una biblioteca ligera de análisis html inspirada en Beautiful Soup, que proporciona funcionalidades para el análisis y la extracción de elementos HTML.
Este conector está disponible en los siguientes productos y regiones:
| Service | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Aplicaciones lógicas | Estándar | Todas las regiones de Logic Apps excepto las siguientes: - Regiones de Azure Government - Regiones de Azure China - Departamento de Defensa de EE. UU. (DoD) |
| Power Apps | Premium | Todas las regiones de Power Apps excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Power Automate | Premium | Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Contacto | |
|---|---|
| Nombre | Compatibilidad con MiniSoup |
| URL | https://github.com/DEmodoriGatsuO/MiniSoup |
| Correo Electrónico | demodori.gatsuo@gmail.com |
| Metadatos del conector | |
|---|---|
| Publicador | Shogo Shindo |
| Sitio web | https://github.com/DEmodoriGatsuO/MiniSoup |
| Directiva de privacidad | https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md |
| Categorías | Datos; Sitio web |
Limitaciones
| Nombre | Llamadas | Período de renovación |
|---|---|---|
| Llamadas API por conexión | 100 | 60 segundos |
Acciones
| Análisis de la tabla HTML |
Analiza una tabla HTML en datos estructurados con encabezados y filas |
| Buscar todos los elementos coincidentes |
Busca todos los elementos HTML que coincidan con el nombre de etiqueta especificado y los atributos opcionales. |
| Capturar contenido HTML |
Captura el contenido HTML de una dirección URL especificada |
| Extraer valores de elementos HTML |
Extrae valores de atributo específicos de elementos HTML que coinciden con el selector proporcionado. |
| Seleccionar elementos HTML |
Selecciona elementos HTML que coinciden con el selector proporcionado. |
Análisis de la tabla HTML
Analiza una tabla HTML en datos estructurados con encabezados y filas
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Contenido HTML que contiene la tabla |
|
table_selector
|
table_selector | string |
Selector CSS para buscar el elemento de tabla HTML |
|
|
header_rows_exist
|
header_rows_exist | boolean |
Si la tabla tiene filas de encabezado |
Devoluciones
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
correcto
|
success | boolean |
Indica si la operación se realizó correctamente. |
|
Headers
|
data.Headers | array of string |
Encabezados de columna extraídos de la tabla |
|
Rows
|
data.Rows | array of array |
Filas de tabla, cada una que contiene una matriz de valores de celda |
|
items
|
data.Rows | array of string |
Buscar todos los elementos coincidentes
Busca todos los elementos HTML que coincidan con el nombre de etiqueta especificado y los atributos opcionales.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Contenido HTML que se va a analizar |
|
tag_name
|
tag_name | True | string |
Nombre de etiqueta HTML que se va a buscar |
|
id
|
id | string |
Filtrar por identificador de elemento |
|
|
class
|
class | string |
Filtrar por clase de elemento |
Devoluciones
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
correcto
|
success | boolean |
Indica si la operación se realizó correctamente. |
|
Elementos
|
elements | array of HtmlElement |
Matriz de elementos HTML que coinciden con el nombre de etiqueta y los atributos especificados |
|
count
|
count | integer |
Número de elementos encontrados |
Capturar contenido HTML
Captura el contenido HTML de una dirección URL especificada
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
Dirección URL para capturar contenido HTML de |
Devoluciones
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
correcto
|
success | boolean |
Indica si la operación se realizó correctamente. |
|
html
|
html | string |
Contenido HTML recuperado de la dirección URL especificada |
Extraer valores de elementos HTML
Extrae valores de atributo específicos de elementos HTML que coinciden con el selector proporcionado.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Contenido HTML que se va a analizar |
|
selector
|
selector | True | string |
Selector css o XPath para los elementos de destino |
|
atributo
|
attribute | True | string |
Atributo que se va a extraer de los elementos seleccionados. Usar 'text' para texto interno, 'html' para HTML interno o nombre de atributo específico |
|
selector_type
|
selector_type | string |
Tipo de selector que se va a usar |
Devoluciones
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
correcto
|
success | boolean |
Indica si la operación se realizó correctamente. |
|
values
|
values | array of string |
Matriz de valores extraídos de los elementos coincidentes |
|
count
|
count | integer |
Número de valores extraídos |
Seleccionar elementos HTML
Selecciona elementos HTML que coinciden con el selector proporcionado.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Contenido HTML que se va a analizar |
|
selector
|
selector | True | string |
Selector css o XPath para los elementos de destino |
|
selector_type
|
selector_type | string |
Tipo de selector que se va a usar |
Devoluciones
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
correcto
|
success | boolean |
Indica si la operación se realizó correctamente. |
|
Elementos
|
elements | array of HtmlElement |
Matriz de elementos HTML que coinciden con el selector especificado |
|
count
|
count | integer |
Número de elementos encontrados |
Definiciones
HtmlElement
Representa un elemento HTML con sus propiedades y atributos.
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
tag
|
tag | string |
Nombre de etiqueta HTML del elemento (por ejemplo, 'div', 'span', 'a') |
|
outerHtml
|
outerHtml | string |
Html completo del elemento, incluido el propio elemento |
|
innerHtml
|
innerHtml | string |
Contenido HTML dentro del elemento , que puede incluir otros elementos |
|
innerText
|
innerText | string |
Contenido de texto dentro del elemento con todas las etiquetas HTML quitadas |
|
attributes
|
attributes | object |
Todos los atributos del elemento como pares nombre-valor |
|
isSelfClosing
|
isSelfClosing | boolean |
Indica si el elemento es una etiqueta de autocierre (por ejemplo, |