共用方式為


Bpe 建構函式

定義

多載

Bpe()

建構沒有標記化詞彙的新 Bpe 模型物件。 此建構函式只有在定型案例中才有用。

Bpe(String, String, String, String, String)

建構新的 Bpe 模型物件,以用於句子標記化和 Tokenizer 定型。

Bpe()

建構沒有標記化詞彙的新 Bpe 模型物件。 此建構函式只有在定型案例中才有用。

public Bpe();
Public Sub New ()

適用於

Bpe(String, String, String, String, String)

建構新的 Bpe 模型物件,以用於句子標記化和 Tokenizer 定型。

public Bpe(string vocabFile, string? mergesFile, string? unknownToken = default, string? continuingSubwordPrefix = default, string? endOfWordSuffix = default);
new Microsoft.ML.Tokenizers.Bpe : string * string * string * string * string -> Microsoft.ML.Tokenizers.Bpe
Public Sub New (vocabFile As String, mergesFile As String, Optional unknownToken As String = Nothing, Optional continuingSubwordPrefix As String = Nothing, Optional endOfWordSuffix As String = Nothing)

參數

vocabFile
String

JSON 檔案路徑,其中包含字串索引鍵及其識別碼的字典。

mergesFile
String

包含權杖配對清單的檔案路徑。

unknownToken
String

模型要使用的未知權杖。

continuingSubwordPrefix
String

要附加至不代表單字開頭之子字單位的前置詞。

endOfWordSuffix
String

要附加至子字單位的尾碼,代表字尾。

適用於