共用方式為


Model 類別

定義

表示令牌化期間使用的模型 (,例如 BPE 或 Word 片段或 Unigram) 。

public abstract class Model
type Model = class
Public MustInherit Class Model
繼承
Model
衍生

建構函式

Model()

表示令牌化期間使用的模型 (,例如 BPE 或 Word 片段或 Unigram) 。

方法

GetTrainer()

取得定型模型時要使用的定型器物件。

GetVocab()

取得字典將令牌對應至標識碼。

GetVocabSize()

取得將令牌對應至標識符的字典大小。

IdToString(Int32, Boolean)

表示令牌化期間使用的模型 (,例如 BPE 或 Word 片段或 Unigram) 。

IdToToken(Int32, Boolean)

將令牌化標識碼對應至令牌。

IsValidChar(Char)

如果 char 在 Tokenizer 中有效,則傳回 true;否則會傳回 false。

Save(String, String)

將模型數據儲存到詞彙中,並合併檔案。

Tokenize(String)

將序列字串標記化為令牌清單。

TokenToId(String)

將令牌對應至令牌化標識碼。

適用於