Tworzenie rozwiązania do wyszukiwania wiedzy za pomocą usługi Azure AI Search

Zakończone

Zasadniczo usługa Azure AI Search to usługa w chmurze służąca do indeksowania i wyszukiwania danych. Jednak wykorzystanie umiejętności sztucznej inteligencji do wyodrębniania szczegółowych informacji z wielu formatów danych i możliwości integracji ich z innymi usługami sztucznej inteligencji, w tym usług Azure Vision i Azure Document Intelligence, stanowią zaawansowaną platformę do tworzenia rozwiązań do zarządzania zasobami cyfrowymi i wyszukiwania wiedzy.

Indeksatory, indeksy i umiejętności

W centrum rozwiązania azure AI Search jest indeksator, który definiuje powtarzalny proces:

  1. Pobieranie danych ze źródła, takiego jak kontener dokumentów usługi Azure Storage lub baza danych.

  2. Rozpakowywanie dokumentów w celu wyodrębnienia ich zawartości — na przykład wyodrębnianie danych tekstowych i obrazów z dokumentu PDF.

  3. Zastosuj sekwencję zadań, aby pobrać informacje z danych i wygenerować hierarchię pól dla indeksu. Niektóre pola to podstawowe atrybuty danych źródłowych (na przykład nazwy plików dokumentów i daty ostatniego zapisania), podczas gdy inne są generowane przy użyciu umiejętności sztucznej inteligencji. Przykład:

    • Używanie usług Azure Vision do generowania tagów i podpisów dla obrazów .
    • Korzystanie z usług Azure Language do wyprowadzenia pól dla analizy nastrojów lub wykrywania nazwanych encji.
    • Wyodrębnianie wartości pól z formularzy przy użyciu analizy dokumentów platformy Azure .
  4. Przechowywanie wyodrębnionych pól jako indeks.

    Diagram indeksatora wykorzystującego umiejętności sztucznej inteligencji do wyodrębniania pól z dokumentów źródłowych i tworzenia indeksu.

Wynikowy indeks może służyć do umożliwienia użytkownikom wyszukiwania informacji w wyodrębnionych polach na podstawie słów kluczowych i kryteriów filtrowania.

Utrwalanie wyodrębnionych danych do magazynu wiedzy

Oprócz tworzenia indeksu z możliwością wyszukiwania usługa Azure AI Search może utrwalać wyodrębnione zasoby danych do magazynu wiedzy w usłudze Azure Storage.

Indeksator może zapisywać następujące rodzaje zasobów w magazynie wiedzy:

  • Tabele wartości pól.

  • Obrazy wyodrębnione z dokumentów.

  • Dokumenty JSON reprezentujące struktury danych; które mogą być złożonymi hierarchiami pól i wartości.

    Diagram systemu indeksującego przechowującego tabele, obrazy i dokumenty w magazynie wiedzy.