Udostępnij przez


Bpe Klasa

Definicja

Reprezentują model kodowania par bajtów.

public sealed class Bpe : Microsoft.ML.Tokenizers.Model
type Bpe = class
    inherit Model
Public NotInheritable Class Bpe
Inherits Model
Dziedziczenie

Konstruktory

Bpe()

Konstruowanie nowego obiektu modelu Bpe bez słownictwa tokenizacji. Ten konstruktor jest przydatny tylko w scenariuszu trenowania.

Bpe(String, String, String, String, String)

Skonstruuj nowy obiekt modelu Bpe do użycia na potrzeby tokenizacji zdań i trenowania tokenizatora.

Właściwości

ContinuingSubwordPrefix

Opcjonalny prefiks do użycia dla dowolnego podzrostka, który istnieje tylko za innym

Decoder

Pobiera obiekt dekodera Bpe.

EndOfWordSuffix

Opcjonalny sufiks do scharakteryzowania i końca wyrazu podrzędnego

FuseUnknownTokens

Pobiera lub ustawia, czy zezwalanie na łączenie wielu nieznanych tokenów

UnknownToken

Pobiera lub ustawia nieznany token. Nieznany token do użycia w przypadku napotkania nieznanego znaku

Metody

GetTrainer()

Pobiera obiekt trenera do użycia w trenowaniu modelu i generuje słownictwo i scala dane.

GetVocab()

Pobiera tokeny mapowania słownika na identyfikatory.

GetVocabSize()

Pobiera rozmiar słownika mapujący tokeny na identyfikatory.

IdToString(Int32, Boolean)

Zamapuj tokenizowany identyfikator na token.

IdToToken(Int32, Boolean)

Zamapuj tokenizowany identyfikator na token.

IsValidChar(Char)

Reprezentują model kodowania par bajtów.

Save(String, String)

Zapisz dane modelu w słownictwie i scala pliki.

Tokenize(String)

Tokenizowanie ciągu sekwencji do listy tokenów.

TokenToId(String)

Mapuj token na tokenizowany identyfikator.

Dotyczy