Microsoft.ML.Transforms.Text Namespace

Referência

Importante

Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.

Namespace contendo componentes de transformação de dados de texto.

Classes

CustomStopWordsRemovingEstimator	IEstimator<TTransformer> para o CustomStopWordsRemovingTransformer.
CustomStopWordsRemovingEstimator.Options	Use o removedores de palavras stop que podem remover a lista específica de linguagem de palavras de parada (palavras mais comuns) já definidas no sistema.
CustomStopWordsRemovingTransformer	ITransformer resultante da montagem de um CustomStopWordsRemovingEstimator.
LatentDirichletAllocationEstimator	A transformação LDA implementa o LightLDA, uma implementação de última geração da Alocação de Dirichlet Latente.
LatentDirichletAllocationTransformer	ITransformer resultante da montagem de um LatentDirichletAllocationEstimator.
LatentDirichletAllocationTransformer.ModelParameters	Forneça detalhes sobre os tópicos descobertos pelo LightLDA.
NgramExtractingEstimator	Produz um vetor de contagens de n-gramas (sequências de palavras consecutivas) encontradas no texto de entrada.
NgramExtractingTransformer	ITransformer resultante da montagem de um NgramExtractingEstimator.
NgramHashingEstimator	IEstimator<TTransformer> para o NgramHashingTransformer.
NgramHashingTransformer	Namespace contendo componentes de transformação de dados de texto.
StopWordsRemovingEstimator	IEstimator<TTransformer> para o CustomStopWordsRemovingTransformer.
StopWordsRemovingEstimator.Options	Use o removedores de palavras stop que podem remover a lista específica de idioma de palavras irrelevantes (palavras mais comuns) já definidas no sistema.
StopWordsRemovingTransformer	ITransformer resultante da montagem de um StopWordsRemovingEstimator.
TextFeaturizingEstimator	Um estimador que transforma uma coleção de documentos de texto em vetores de recursos numéricos. Os vetores de recurso são contagens normalizadas de n-gramas de palavra e/ou caractere (com base nas opções fornecidas).
TextFeaturizingEstimator.Options	Opções avançadas para o TextFeaturizingEstimator.
TextNormalizingEstimator	IEstimator<TTransformer> para o TextNormalizingTransformer.
TextNormalizingTransformer	ITransformer resultante da montagem de um TextNormalizingEstimator.
TokenizingByCharactersEstimator	IEstimator<TTransformer> para o TokenizingByCharactersTransformer.
TokenizingByCharactersTransformer	ITransformer resultante da montagem de um TokenizingByCharactersEstimator.
WordBagEstimator	IEstimator<TTransformer> para o ITransformer.
WordBagEstimator.Options	Opções de como os n-gramas são extraídos.
WordEmbeddingEstimator	Recurso de texto que converte vetores de tokens de texto em um vetor numérico usando um modelo de incorporações pré-treinado.
WordEmbeddingTransformer	ITransformer resultante da montagem de um WordEmbeddingEstimator.
WordHashBagEstimator	IEstimator<TTransformer> para o ITransformer.
WordTokenizingEstimator	Tokeniza o texto de entrada usando delimitadores especificados.
WordTokenizingTransformer	ITransformer resultante da montagem de um WordTokenizingEstimator.

Estruturas

LatentDirichletAllocationTransformer.ModelParameters.ItemScore	Namespace contendo componentes de transformação de dados de texto.
LatentDirichletAllocationTransformer.ModelParameters.WordItemScore	Namespace contendo componentes de transformação de dados de texto.

Interfaces

IStopWordsRemoverOptions

Define o tipo diferente de removedores de palavras de parada com suporte.

Enumerações

NgramExtractingEstimator.WeightingCriteria	Uma medida estatística usada para avaliar a importância de uma palavra para um documento em um corpus. Essa enumeração é serializada.
StopWordsRemovingEstimator.Language	Linguagem stopwords. Essa enumeração é serializada.
TextFeaturizingEstimator.Language	Linguagem de texto. Essa enumeração é serializada.
TextFeaturizingEstimator.NormFunction	Tipo de normalizador de vetor de texto.
TextNormalizingEstimator.CaseMode	Modo de normalização de maiúsculas e minúsculas de texto. Essa enumeração é serializada.
WordEmbeddingEstimator.PretrainedModelKind	Especifica quais inserções de palavra usar.

Compartilhar via

Microsoft.ML.Transforms.Text Namespace

Classes

Estruturas

Interfaces

Enumerações