你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

实体类型和标记

使用本文大致了解自 2024-11-01 版本以来的新 API 更改。 此 API 更改主要引入了两个新概念 (entity typesentity tags) 替换当前正式版 API 中的categorysubcategory字段。 有关每个 API 参数和相应支持的 API 版本的详细概述,请参阅 [技能参数][.。/how-to/skill-parameters.md] 页。

由于“西雅图”等实体可以归类为 City、GPE(地理政治实体)和 Location,因此该 type 属性用于定义最精细的分类,在本例中为 City。 服务输出中的 tags 属性是一个列表,列出了所有可能的分类(城市、GPE 和位置)及其各自的置信度分数。 各个类型的可能标记的完整映射均已列明。 metadata服务输出中的属性包含有关实体的其他信息,例如与实体关联的整数值。

实体类型

实体类型表示检测到实体的最低(或最佳)粒度。 类型被视为已识别的基类。

实体标记

实体标记用于对检测到的实体进行进一步标识,并标记为实体类型。 实体标记列表可以包括类别、子类别和子类别。

从版本 2022-05-012023-04-01 更改为版本 2024-11-01 API

这些更改为命名实体识别服务带来了更好的灵活性,包括:

对输入格式结构的更新:

  • InclusionList
  • ExclusionList
  • 重叠策略

对输出格式处理方式的更新:

  • 通过引入一个标记列表,可以实现更精细的实体识别,在这个列表中,一个实体可以拥有多个实体标记。
  • 重叠实体,其中实体可以识别为多个实体类型,如果是,则此实体将返回两次。 如果某个实体被识别为属于同一实体类型下的两个实体标记,则会在标记列表中返回这两个实体标记。
  • 使用实体标记筛选实体:若要了解详细信息, 请参阅“选择返回的实体”。
  • 包含有关实体的其他信息的元数据对象,但当前仅充当现有实体解析功能的包装器。 可在此处了解有关此新功能的详细信息。

版本 2022-05-012023-04-01 到当前版本 API 实体映射

可以在支持的命名实体识别 (NER) 实体类别和实体类型一文中查看实体类别/类型结构之间的比较。 下表展示了您期望从版本2022-05-012023-04-01与当前版本 API 之间看到的结果的映射。

类型 Tags
Date 临时、日期
DateRange 临时、DateRange
DateTime 临时、DateTime
DateTimeRange 临时、DateTimeRange
Duration 临时,持续时间
SetTemporal 临时,SetTemporal
时间 临时,时间
时间范围 临时,TimeRange
城市 GPE、位置、城市
状态 GPE、位置、状态
CountryRegion GPE、位置、CountryRegion
大陆 GPE、位置、所在洲
GPE 位置、GPE
位置 位置
机场 结构、位置
Structural 位置、结构
地质 位置、地质
年龄 数值、年龄
货币 数值、货币
Number 数值、数字
电话号码 电话号码
NumberRange 数值、NumberRange
百分比 数值、百分比
Ordinal 数值、序号
温度 数值、维度、温度
速度 数值、维度、速度
重量 数值、维度、重量
高度 数值、维度、高度
长度 数值、维度、长度
数据量(Volume) 数值、维度、体积
区域 数值、维度、面积
信息 数值、维度、信息
地址 地址
人员 人员
人员类型 人员类型
组织 组织
Products Products
ComputingProduct Product, ComputingProduct
IP IP
Email Email
URL URL
技能 技能
事件 事件
CulturalEvent 事件、CulturalEvent
体育赛事 事件、SportsEvent
NaturalEvent 事件、NaturalEvent