Udostępnij przez


EnglishRoberta Klasa

Definicja

Reprezentuje model kodowania par bajtów.

public sealed class EnglishRoberta : Microsoft.ML.Tokenizers.Model
type EnglishRoberta = class
    inherit Model
Public NotInheritable Class EnglishRoberta
Inherits Model
Dziedziczenie
EnglishRoberta

Konstruktory

EnglishRoberta(Stream, Stream, Stream)

Konstruowanie obiektu tokenizatora do użycia z angielskim modelem Robert.

EnglishRoberta(String, String, String)

Konstruowanie obiektu tokenizatora do użycia z angielskim modelem Robert.

Właściwości

PadIndex

Pobiera indeks symbolu okienka na liście symboli.

SymbolsCount

Pobiera długość listy symboli.

Metody

AddMaskSymbol(String)

Dodaj symbol maski do listy symboli.

GetTrainer()

Pobiera obiekt trenera do użycia w trenowaniu modelu i generuje słownictwo i scala dane.

GetVocab()

Pobiera tokeny mapowania słownika na identyfikatory.

GetVocabSize()

Pobiera rozmiar słownika, który mapuje tokeny na identyfikatory.

IdsToOccurrenceRanks(IReadOnlyList<Int32>)

Przekonwertuj listę identyfikatorów tokenów na najwyższe klasyfikacje wystąpień.

IdsToOccurrenceValues(IReadOnlyList<Int32>)

Przekonwertuj listę identyfikatorów tokenów na najwyższe wartości wystąpień.

IdToString(Int32, Boolean)

Zamapuj tokenizowany identyfikator na oryginalny ciąg.

IdToToken(Int32, Boolean)

Zamapuj tokenizowany identyfikator na token.

IsValidChar(Char)

Reprezentuje model kodowania par bajtów.

OccurrenceRanksIds(IReadOnlyList<Int32>)

Przekonwertuj listę najwyższych klasyfikacji wystąpień na listę identyfikatorów tokenów .

Save(String, String)

Zapisz dane modelu w słownictwie, scalaj i pliki mapowania wystąpień.

Tokenize(String)

Tokenizowanie ciągu sekwencji do listy tokenów.

TokenToId(String)

Zamapuj token na tokenizowany identyfikator.

Dotyczy