Microsoft.ML.Transforms.Text Namespace
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Namespace contendo componentes de transformação de dados de texto.
Classes
| CustomStopWordsRemovingEstimator |
IEstimator<TTransformer> para o CustomStopWordsRemovingTransformer. |
| CustomStopWordsRemovingEstimator.Options |
Use o removedores de palavras stop que podem remover a lista específica de linguagem de palavras de parada (palavras mais comuns) já definidas no sistema. |
| CustomStopWordsRemovingTransformer |
ITransformer resultante da montagem de um CustomStopWordsRemovingEstimator. |
| LatentDirichletAllocationEstimator |
A transformação LDA implementa o LightLDA, uma implementação de última geração da Alocação de Dirichlet Latente. |
| LatentDirichletAllocationTransformer |
ITransformer resultante da montagem de um LatentDirichletAllocationEstimator. |
| LatentDirichletAllocationTransformer.ModelParameters |
Forneça detalhes sobre os tópicos descobertos pelo LightLDA. |
| NgramExtractingEstimator |
Produz um vetor de contagens de n-gramas (sequências de palavras consecutivas) encontradas no texto de entrada. |
| NgramExtractingTransformer |
ITransformer resultante da montagem de um NgramExtractingEstimator. |
| NgramHashingEstimator | |
| NgramHashingTransformer |
Namespace contendo componentes de transformação de dados de texto. |
| StopWordsRemovingEstimator |
IEstimator<TTransformer> para o CustomStopWordsRemovingTransformer. |
| StopWordsRemovingEstimator.Options |
Use o removedores de palavras stop que podem remover a lista específica de idioma de palavras irrelevantes (palavras mais comuns) já definidas no sistema. |
| StopWordsRemovingTransformer |
ITransformer resultante da montagem de um StopWordsRemovingEstimator. |
| TextFeaturizingEstimator |
Um estimador que transforma uma coleção de documentos de texto em vetores de recursos numéricos. Os vetores de recurso são contagens normalizadas de n-gramas de palavra e/ou caractere (com base nas opções fornecidas). |
| TextFeaturizingEstimator.Options |
Opções avançadas para o TextFeaturizingEstimator. |
| TextNormalizingEstimator | |
| TextNormalizingTransformer |
ITransformer resultante da montagem de um TextNormalizingEstimator. |
| TokenizingByCharactersEstimator |
IEstimator<TTransformer> para o TokenizingByCharactersTransformer. |
| TokenizingByCharactersTransformer |
ITransformer resultante da montagem de um TokenizingByCharactersEstimator. |
| WordBagEstimator |
IEstimator<TTransformer> para o ITransformer. |
| WordBagEstimator.Options |
Opções de como os n-gramas são extraídos. |
| WordEmbeddingEstimator |
Recurso de texto que converte vetores de tokens de texto em um vetor numérico usando um modelo de incorporações pré-treinado. |
| WordEmbeddingTransformer |
ITransformer resultante da montagem de um WordEmbeddingEstimator. |
| WordHashBagEstimator |
IEstimator<TTransformer> para o ITransformer. |
| WordTokenizingEstimator |
Tokeniza o texto de entrada usando delimitadores especificados. |
| WordTokenizingTransformer |
ITransformer resultante da montagem de um WordTokenizingEstimator. |
Estruturas
| LatentDirichletAllocationTransformer.ModelParameters.ItemScore |
Namespace contendo componentes de transformação de dados de texto. |
| LatentDirichletAllocationTransformer.ModelParameters.WordItemScore |
Namespace contendo componentes de transformação de dados de texto. |
Interfaces
| IStopWordsRemoverOptions |
Define o tipo diferente de removedores de palavras de parada com suporte. |
Enumerações
| NgramExtractingEstimator.WeightingCriteria |
Uma medida estatística usada para avaliar a importância de uma palavra para um documento em um corpus. Essa enumeração é serializada. |
| StopWordsRemovingEstimator.Language |
Linguagem stopwords. Essa enumeração é serializada. |
| TextFeaturizingEstimator.Language |
Linguagem de texto. Essa enumeração é serializada. |
| TextFeaturizingEstimator.NormFunction |
Tipo de normalizador de vetor de texto. |
| TextNormalizingEstimator.CaseMode |
Modo de normalização de maiúsculas e minúsculas de texto. Essa enumeração é serializada. |
| WordEmbeddingEstimator.PretrainedModelKind |
Especifica quais inserções de palavra usar. |