你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

KnownBlockedTransformers enum

BlockedTransformers 服务的已知值。

字段

CatTargetEncoder

分类数据的目标编码。

CountVectorizer

Count Vectorizer 将文本文档集合转换为令牌计数矩阵。

HashOneHotEncoder

哈希一个热编码器可以将分类变量转换为有限数量的新功能。 这通常用于高基数分类特征。

LabelEncoder

标签编码器以数字形式转换标签/分类变量。

NaiveBayes

Naive Bayes 是一种分类,用于分类明确分布的离散特征。

OneHotEncoder

Ohe 热编码创建二进制特征转换。

TextTargetEncoder

文本数据的目标编码。

TfIdf

Tf-Idf 代表术语频率时间反转文档频率。 这是一种常见的术语加权方案,用于识别来自文档的信息。

WoETargetEncoder

证据编码的权重是用于对分类变量进行编码的技术。 它使用 P(1)/P(0)的自然日志来创建权重。

WordEmbedding

Word 嵌入有助于将字词或短语表示为向量或一系列数字。