Bpe 建構函式
定義
重要
部分資訊涉及發行前產品,在發行之前可能會有大幅修改。 Microsoft 對此處提供的資訊,不做任何明確或隱含的瑕疵擔保。
多載
| Bpe() |
建構沒有標記化詞彙的新 Bpe 模型物件。 此建構函式只有在定型案例中才有用。 |
| Bpe(String, String, String, String, String) |
建構新的 Bpe 模型物件,以用於句子標記化和 Tokenizer 定型。 |
Bpe()
建構沒有標記化詞彙的新 Bpe 模型物件。 此建構函式只有在定型案例中才有用。
public Bpe();
Public Sub New ()
適用於
Bpe(String, String, String, String, String)
建構新的 Bpe 模型物件,以用於句子標記化和 Tokenizer 定型。
public Bpe(string vocabFile, string? mergesFile, string? unknownToken = default, string? continuingSubwordPrefix = default, string? endOfWordSuffix = default);
new Microsoft.ML.Tokenizers.Bpe : string * string * string * string * string -> Microsoft.ML.Tokenizers.Bpe
Public Sub New (vocabFile As String, mergesFile As String, Optional unknownToken As String = Nothing, Optional continuingSubwordPrefix As String = Nothing, Optional endOfWordSuffix As String = Nothing)
參數
- vocabFile
- String
JSON 檔案路徑,其中包含字串索引鍵及其識別碼的字典。
- mergesFile
- String
包含權杖配對清單的檔案路徑。
- unknownToken
- String
模型要使用的未知權杖。
- continuingSubwordPrefix
- String
要附加至不代表單字開頭之子字單位的前置詞。
- endOfWordSuffix
- String
要附加至子字單位的尾碼,代表字尾。