Extrahieren von Entitäten

Abgeschlossen

Benannte Entitätserkennung identifiziert Entitäten, die im Text erwähnt werden. Entitäten werden in Kategorien und Unterkategorien gruppiert, z. B.:

  • Person
  • Ort
  • Datum/Zeit
  • Organisation
  • Adresse
  • E-Mail
  • URL

Anmerkung

Eine vollständige Liste der Kategorien finden Sie in der Dokumentation.

Die Eingabe für die Entitätserkennung ähnelt der Eingabe für andere Azure-Sprach-API-Funktionen:

{
  "kind": "EntityRecognition",
  "parameters": {
    "modelVersion": "latest"
  },
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "en",
        "text": "Joe went to London on Saturday"
      }
    ]
  }
}

Die Antwort enthält eine Liste der kategorisierten Entitäten, die in jedem Dokument gefunden werden:

{
    "kind": "EntityRecognitionResults",
     "results": {
          "documents":[
              {
                  "entities":[
                  {
                    "text":"Joe",
                    "category":"Person",
                    "offset":0,
                    "length":3,
                    "confidenceScore":0.62
                  },
                  {
                    "text":"London",
                    "category":"Location",
                    "subcategory":"GPE",
                    "offset":12,
                    "length":6,
                    "confidenceScore":0.88
                  },
                  {
                    "text":"Saturday",
                    "category":"DateTime",
                    "subcategory":"Date",
                    "offset":22,
                    "length":8,
                    "confidenceScore":0.8
                  }
                ],
                "id":"1",
                "warnings":[]
              }
          ],
          "errors":[],
          "modelVersion":"2021-01-15"
    }
}

Weitere Informationen zu Entitäten finden Sie im Modul Erstellen eines Modells zur Verständnis von Gesprochenen Sprachen.