Partilhar via


Use ai.embed com pandas

A ai.embed função utiliza IA generativa para converter texto em embeddings vetoriais. Estes vetores permitem à IA compreender as relações entre textos, permitindo pesquisar, agrupar e comparar conteúdos com base no significado e não na redação exata. Com uma única linha de código, pode gerar embeddings vetoriais a partir de uma coluna num DataFrame.

Observação

Visão geral

A função ai.embed estende a classe pandas Series.

Para gerar embeddings vetoriais de cada linha de entrada, chamar a função numa série pandas ou numa coluna de texto de um DataFrame pandas.

A função devolve uma Série Pandas que contém embeddings, que podem ser armazenadas numa nova coluna do dataframe.

Sintaxe

df["embed"] = df["col1"].ai.embed()

Parâmetros

Nenhum.

Devoluções

A função devolve uma série pandas que contém embeddings como numpy array de float-32 para cada linha de texto de entrada. O número de elementos no array depende das dimensões do modelo de embedding, que são configuráveis em funções de IA

Example

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

Esta célula de código de exemplo fornece a seguinte saída:

Captura de ecrã de um data frame com as colunas 'descriptions' e 'embed'. A coluna 'embed' contém embeddings para as descrições.