Udostępnij przez


Używanie pliku ai.embed z biblioteką pandas

Funkcja ai.embed używa generatywnej sztucznej inteligencji do przekształcania tekstu w wektorowe osadzenia. Te wektory umożliwiają sztucznej inteligencji zrozumienie relacji między tekstami, dzięki czemu można wyszukiwać, grupować i porównywać zawartość na podstawie znaczenia, a nie dokładnego sformułowania. Za pomocą pojedynczego wiersza kodu można wygenerować wektorowe osadzania z kolumny w ramce danych.

Uwaga / Notatka

Przegląd

Funkcja ai.embed rozszerza klasę serii pandas.

Aby wygenerować wektorowe osadzanie każdego wiersza wejściowego, wywołaj funkcję w kolumnie pandas Series lub kolumnie tekstowej ramki danych biblioteki pandas.

Funkcja zwraca serię pandas zawierającą osadzenia, które mogą być przechowywane w nowej kolumnie DataFrame.

Składnia

df["embed"] = df["col1"].ai.embed()

Parametry

Żaden.

Zwraca

Funkcja zwraca serię pandas, która zawiera embeddingi w postaci tablicy numpy z typem float-32 dla każdego wiersza tekstu wejściowego. Liczba elementów w tablicy zależy od wymiarów modelu osadzania, które można konfigurować w funkcjach sztucznej inteligencji

Example

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

Ta przykładowa komórka kodu udostępnia następujące dane wyjściowe:

Zrzut ekranu przedstawiający ramkę danych z kolumnami