共用方式為


Tokenizer 類別

定義

Tokenizer 可作為管線。 它會處理一些原始文字做為輸入,並輸出 TokenizerResult 物件。

public class Tokenizer
type Tokenizer = class
Public Class Tokenizer
繼承
Tokenizer

建構函式

Tokenizer(Model, PreTokenizer, Normalizer)

建立新的 Tokenizer 物件。

屬性

Decoder

取得或設定 Tokenizer 所使用的解碼器。

Model

取得 Tokenizer 所使用的模型。

Normalizer

取得或設定 Tokenizer 所使用的 Normalizer。

PreTokenizer

取得或設定 Tokenizer 所使用的 PreTokenizer。

方法

Decode(IEnumerable<Int32>, Boolean)

將指定的識別碼解碼回 String。

Decode(Int32, Boolean)

將識別碼解碼為對應的權杖。

Encode(String)

將輸入文字編碼為物件具有標記清單、權杖識別碼、權杖位移對應。

IsValidChar(Char)

Tokenizer 可作為管線。 它會處理一些原始文字做為輸入,並輸出 TokenizerResult 物件。

TrainFromFiles(Trainer, ReportProgress, String[])

使用輸入檔將 Tokenizer 模型定型。

適用於