共用方式為


TokenizerResult 類別

定義

Encoding 代表 Tokenizer 的輸出。

public sealed class TokenizerResult
type TokenizerResult = class
Public NotInheritable Class TokenizerResult
繼承
TokenizerResult

建構函式

TokenizerResult(String, String, IReadOnlyList<Split>, Boolean)

建立 TokenizerResult 物件的新物件。

屬性

Ids

取得權杖識別碼的清單。 Id 是語言模型的主要輸入。 它們是權杖索引,也就是 LM 所瞭解的數值標記法。

NormalizedString

取得原始字串的正規化形式。

Offsets

取得位移的清單。 這些位移可讓您配量輸入字串,進而擷取導致產生對應權杖的原始部分。

OffsetsMappedToOriginalString

取得原始字串的正規化形式。

OriginalString

取得原始的 Token 化字串。

Tokens

取得產生的權杖。 它們是 Id 的字串表示。

適用於