Compartir a través de


Analizador HTML de MiniSoup (publicador independiente) (versión preliminar)

Una biblioteca ligera de análisis html inspirada en Beautiful Soup, que proporciona funcionalidades para el análisis y la extracción de elementos HTML.

Este conector está disponible en los siguientes productos y regiones:

Service Class Regions
Copilot Studio Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Aplicaciones lógicas Estándar Todas las regiones de Logic Apps excepto las siguientes:
     - Regiones de Azure Government
     - Regiones de Azure China
     - Departamento de Defensa de EE. UU. (DoD)
Power Apps Premium Todas las regiones de Power Apps excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Power Automate Premium Todas las regiones de Power Automate excepto las siguientes:
     - Gobierno de EE. UU. (GCC)
     - Gobierno de EE. UU. (GCC High)
     - China Cloud operado por 21Vianet
     - Departamento de Defensa de EE. UU. (DoD)
Contacto
Nombre Compatibilidad con MiniSoup
URL https://github.com/DEmodoriGatsuO/MiniSoup
Correo Electrónico demodori.gatsuo@gmail.com
Metadatos del conector
Publicador Shogo Shindo
Sitio web https://github.com/DEmodoriGatsuO/MiniSoup
Directiva de privacidad https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md
Categorías Datos; Sitio web

Limitaciones

Nombre Llamadas Período de renovación
Llamadas API por conexión 100 60 segundos

Acciones

Análisis de la tabla HTML

Analiza una tabla HTML en datos estructurados con encabezados y filas

Buscar todos los elementos coincidentes

Busca todos los elementos HTML que coincidan con el nombre de etiqueta especificado y los atributos opcionales.

Capturar contenido HTML

Captura el contenido HTML de una dirección URL especificada

Extraer valores de elementos HTML

Extrae valores de atributo específicos de elementos HTML que coinciden con el selector proporcionado.

Seleccionar elementos HTML

Selecciona elementos HTML que coinciden con el selector proporcionado.

Análisis de la tabla HTML

Analiza una tabla HTML en datos estructurados con encabezados y filas

Parámetros

Nombre Clave Requerido Tipo Description
html
html True string

Contenido HTML que contiene la tabla

table_selector
table_selector string

Selector CSS para buscar el elemento de tabla HTML

header_rows_exist
header_rows_exist boolean

Si la tabla tiene filas de encabezado

Devoluciones

Nombre Ruta de acceso Tipo Description
correcto
success boolean

Indica si la operación se realizó correctamente.

Headers
data.Headers array of string

Encabezados de columna extraídos de la tabla

Rows
data.Rows array of array

Filas de tabla, cada una que contiene una matriz de valores de celda

items
data.Rows array of string

Buscar todos los elementos coincidentes

Busca todos los elementos HTML que coincidan con el nombre de etiqueta especificado y los atributos opcionales.

Parámetros

Nombre Clave Requerido Tipo Description
html
html True string

Contenido HTML que se va a analizar

tag_name
tag_name True string

Nombre de etiqueta HTML que se va a buscar

id
id string

Filtrar por identificador de elemento

class
class string

Filtrar por clase de elemento

Devoluciones

Nombre Ruta de acceso Tipo Description
correcto
success boolean

Indica si la operación se realizó correctamente.

Elementos
elements array of HtmlElement

Matriz de elementos HTML que coinciden con el nombre de etiqueta y los atributos especificados

count
count integer

Número de elementos encontrados

Capturar contenido HTML

Captura el contenido HTML de una dirección URL especificada

Parámetros

Nombre Clave Requerido Tipo Description
URL
url True string

Dirección URL para capturar contenido HTML de

Devoluciones

Nombre Ruta de acceso Tipo Description
correcto
success boolean

Indica si la operación se realizó correctamente.

html
html string

Contenido HTML recuperado de la dirección URL especificada

Extraer valores de elementos HTML

Extrae valores de atributo específicos de elementos HTML que coinciden con el selector proporcionado.

Parámetros

Nombre Clave Requerido Tipo Description
html
html True string

Contenido HTML que se va a analizar

selector
selector True string

Selector css o XPath para los elementos de destino

atributo
attribute True string

Atributo que se va a extraer de los elementos seleccionados. Usar 'text' para texto interno, 'html' para HTML interno o nombre de atributo específico

selector_type
selector_type string

Tipo de selector que se va a usar

Devoluciones

Nombre Ruta de acceso Tipo Description
correcto
success boolean

Indica si la operación se realizó correctamente.

values
values array of string

Matriz de valores extraídos de los elementos coincidentes

count
count integer

Número de valores extraídos

Seleccionar elementos HTML

Selecciona elementos HTML que coinciden con el selector proporcionado.

Parámetros

Nombre Clave Requerido Tipo Description
html
html True string

Contenido HTML que se va a analizar

selector
selector True string

Selector css o XPath para los elementos de destino

selector_type
selector_type string

Tipo de selector que se va a usar

Devoluciones

Nombre Ruta de acceso Tipo Description
correcto
success boolean

Indica si la operación se realizó correctamente.

Elementos
elements array of HtmlElement

Matriz de elementos HTML que coinciden con el selector especificado

count
count integer

Número de elementos encontrados

Definiciones

HtmlElement

Representa un elemento HTML con sus propiedades y atributos.

Nombre Ruta de acceso Tipo Description
tag
tag string

Nombre de etiqueta HTML del elemento (por ejemplo, 'div', 'span', 'a')

outerHtml
outerHtml string

Html completo del elemento, incluido el propio elemento

innerHtml
innerHtml string

Contenido HTML dentro del elemento , que puede incluir otros elementos

innerText
innerText string

Contenido de texto dentro del elemento con todas las etiquetas HTML quitadas

attributes
attributes object

Todos los atributos del elemento como pares nombre-valor

isSelfClosing
isSelfClosing boolean

Indica si el elemento es una etiqueta de autocierre (por ejemplo, , ,
)