Udostępnij przez


Tokenizer Klasa

Definicja

Tokenizer działa jako potok. Przetwarza on nieprzetworzonego tekstu jako dane wejściowe i generuje obiekt TokenizerResult.

public class Tokenizer
type Tokenizer = class
Public Class Tokenizer
Dziedziczenie
Tokenizer

Konstruktory

Tokenizer(Model, PreTokenizer, Normalizer)

Utwórz nowy obiekt Tokenizer.

Właściwości

Decoder

Pobiera lub ustawia dekoder używany przez tokenizator.

Model

Pobiera model używany przez tokenizator.

Normalizer

Pobiera lub ustawia normalizator używany przez tokenizator.

PreTokenizer

Pobiera lub ustawia pretokenizer używany przez tokenizator.

Metody

Decode(IEnumerable<Int32>, Boolean)

Zdekoduj podane identyfikatory z powrotem do ciągu.

Decode(Int32, Boolean)

Dekoduje identyfikator do zamapowanego tokenu.

Encode(String)

Koduje tekst wejściowy do obiektu zawiera listę tokenów, identyfikatory tokenów, mapowanie przesunięcia tokenów.

IsValidChar(Char)

Tokenizer działa jako potok. Przetwarza on nieprzetworzonego tekstu jako dane wejściowe i generuje obiekt TokenizerResult.

TrainFromFiles(Trainer, ReportProgress, String[])

Trenowanie modelu tokenizatora przy użyciu plików wejściowych.

Dotyczy