Tworzenie rozwiązania do wyszukiwania wiedzy za pomocą usługi Azure AI Search
Zasadniczo usługa Azure AI Search to usługa w chmurze służąca do indeksowania i wyszukiwania danych. Jednak wykorzystanie umiejętności sztucznej inteligencji do wyodrębniania szczegółowych informacji z wielu formatów danych i możliwości integracji ich z innymi usługami sztucznej inteligencji, w tym usług Azure Vision i Azure Document Intelligence, stanowią zaawansowaną platformę do tworzenia rozwiązań do zarządzania zasobami cyfrowymi i wyszukiwania wiedzy.
Indeksatory, indeksy i umiejętności
W centrum rozwiązania azure AI Search jest indeksator, który definiuje powtarzalny proces:
Pobieranie danych ze źródła, takiego jak kontener dokumentów usługi Azure Storage lub baza danych.
Rozpakowywanie dokumentów w celu wyodrębnienia ich zawartości — na przykład wyodrębnianie danych tekstowych i obrazów z dokumentu PDF.
Zastosuj sekwencję zadań, aby pobrać informacje z danych i wygenerować hierarchię pól dla indeksu. Niektóre pola to podstawowe atrybuty danych źródłowych (na przykład nazwy plików dokumentów i daty ostatniego zapisania), podczas gdy inne są generowane przy użyciu umiejętności sztucznej inteligencji. Przykład:
- Używanie usług Azure Vision do generowania tagów i podpisów dla obrazów .
- Korzystanie z usług Azure Language do wyprowadzenia pól dla analizy nastrojów lub wykrywania nazwanych encji.
- Wyodrębnianie wartości pól z formularzy przy użyciu analizy dokumentów platformy Azure .
Przechowywanie wyodrębnionych pól jako indeks.
Wynikowy indeks może służyć do umożliwienia użytkownikom wyszukiwania informacji w wyodrębnionych polach na podstawie słów kluczowych i kryteriów filtrowania.
Utrwalanie wyodrębnionych danych do magazynu wiedzy
Oprócz tworzenia indeksu z możliwością wyszukiwania usługa Azure AI Search może utrwalać wyodrębnione zasoby danych do magazynu wiedzy w usłudze Azure Storage.
Indeksator może zapisywać następujące rodzaje zasobów w magazynie wiedzy:
Tabele wartości pól.
Obrazy wyodrębnione z dokumentów.
Dokumenty JSON reprezentujące struktury danych; które mogą być złożonymi hierarchiami pól i wartości.