Partager via


Utiliser ai.embed avec pandas

La fonction utilise l’IA ai.embed générative pour convertir du texte en incorporations vectorielles. Ces vecteurs permettent à l’IA de comprendre les relations entre les textes. Vous pouvez donc rechercher, regrouper et comparer du contenu en fonction de la signification plutôt que du libellé exact. Avec une seule ligne de code, vous pouvez générer des incorporations vectorielles à partir d’une colonne dans un DataFrame.

Note

Aperçu

La fonction ai.embed étend la classe Série pandas.

Pour générer des incorporations vectorielles de chaque ligne d’entrée, appelez la fonction sur une série pandas ou une colonne de texte de DataFrame pandas.

La fonction retourne une série pandas qui contient des incorporations, qui peuvent être stockées dans une nouvelle colonne DataFrame.

Syntaxe

df["embed"] = df["col1"].ai.embed()

Paramètres

Aucun.

Retours

La fonction retourne une série pandas qui contient des incorporations sous forme de tableau numpy de float-32 pour chaque ligne de texte d’entrée. Le nombre d’éléments dans le tableau dépend des dimensions du modèle d’incorporation, qui sont configurables dans les fonctions IA

Example

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

Cet exemple de cellule de code fournit la sortie suivante :

Capture d’écran d’une trame de données avec des colonnes « descriptions » et « incorporer ». La colonne « embed » contient des incorporations pour les descriptions.