Udostępnij przez


Wybieranie technologii przetwarzania języka docelowego sztucznej inteligencji platformy Azure

Usługi azure AI ułatwiają deweloperom i organizacjom szybkie tworzenie inteligentnych, najnowocześniejszych, gotowych na rynek i odpowiedzialnych aplikacji za pomocą gotowych do użycia i wstępnie utworzonych i dostosowywalnych interfejsów API i modeli.

W tym artykule omówiono usługi sztucznej inteligencji, które zapewniają ukierunkowane możliwości przetwarzania języka, takie jak przetwarzanie języka naturalnego (NLP), analiza tekstu, rozumienie języka, tłumaczenie i wyodrębnianie danych dokumentów. Język sztucznej inteligencji platformy Microsoft Azure to jedna z najszerszych kategorii usług sztucznej inteligencji. Interfejsy API w obciążeniu można używać do włączania funkcji językowych, takich jak rozpoznawanie jednostek nazwanych (NER), analiza tonacji, wykrywanie języka i podsumowanie tekstu.

Usługi

Następujące usługi zapewniają ukierunkowane możliwości przetwarzania języka dla usług sztucznej inteligencji:

  • Język zapewnia NLP do analizy tekstu.

    • Używać Język, gdy musisz pracować z dokumentami ustrukturyzowanymi lub nieustrukturyzowanymi dla szerokiego zakresu zadań związanych z językiem opisanych w tym artykule.

    • Nie używaj Język, jeśli chcesz przeszukać dokumenty za pomocą czatu, sprawdzić je pod kątem bezpieczeństwa treści lub przetłumaczyć.

  • Microsoft Azure AI Translator to usługa tłumaczenia maszynowego. Może wykonywać tłumaczenie tekstu w czasie rzeczywistym, tłumaczenie wsadowe i pojedyncze dokumenty oraz tłumaczenia niestandardowe , których można użyć do włączenia specjalistycznej terminologii lub języka specyficznego dla branży dla danego scenariusza. Translator obsługuje wiele języków.

    • Używać Translator, gdy potrzebujesz wykonać tłumaczenie konkretnie. Do wykonania tłumaczenia można użyć innych podstawowych modeli językowych ogólnego przeznaczenia. Jednak używanie usługi Translator do jego specjalistycznych celów może być bardziej efektywne i opłacalne ze względu na ukierunkowane modele tłumaczenia.

    • Nie używaj Tłumacz, jeśli chcesz nawiązać kontakt z czatem, analizować zawartość pod kątem sentymentu lub moderować zawartość. W przypadku analizy tonacji użyj zamiast tego języka. W przypadku moderowania zawartości użyj usługi Microsoft Azure AI Content Safety.

  • Azure AI Document Intelligence to usługa, która umożliwia konwertowanie obrazów bezpośrednio na formularze elektroniczne. Możesz określić oczekiwane pola, a następnie wyszukać dostarczone obrazy, aby przechwycić te pola bez interwencji człowieka. Analiza dokumentów obsługuje wiele wstępnie utworzonych modeli, a także umożliwia tworzenie własnych modeli niestandardowych.

    • Używać Document Intelligence, gdy wiesz dokładnie, które pola musisz wyodrębnić z zeskanowanych dokumentów, aby prawidłowo wypełnić formularze elektroniczne.

    • Używać Document Intelligence do identyfikowania kluczowych struktur, takich jak nagłówki, stopki i podziały rozdziałów, w różnych kolekcjach dokumentów w celu dalszej programowej interakcji z dokumentem, na przykład w implementacji pobierania rozszerzonej generacji (RAG).

    • Nie używaj Document Intelligence jako interfejs API wyszukiwania w czasie rzeczywistym.

Azure OpenAI w modelach Foundry

Azure OpenAI w Modelach Foundry zapewnia dostęp do interfejsu API REST zaawansowanych modeli językowych OpenAI. Modele te obejmują O3-Mini, O1, O1-Mini, GPT-4o, GPT-4o Mini, GPT-4 Turbo with Vision, GPT-4, GPT-3.5-Turbo oraz serię modeli Embeddings. Modele te są wysoce elastyczne, co pozwala dostosować je do zadań, takich jak generowanie treści, podsumowywanie, analiza obrazów i wyszukiwanie semantyczne. Obsługują również tłumaczenie języka naturalnego na kod, co czyni je wszechstronnymi w różnych zastosowaniach.

Możliwości

Poniższa tabela zawiera listę możliwości dostępnych w usłudze Azure OpenAI.

Możliwość opis
Generowanie i uzupełnianie tekstów Generuje tekst podobny do ludzkiego na podstawie podpowiedzi, automatycznie uzupełnia zdania lub akapity, podsumowuje długie dokumenty w zwięzłe podsumowania i odpowiada na pytania w oparciu o kontekst.
Czat Twórz chatboty i wirtualnych asystentów, utrzymuj kontekst w wieloetapowych rozmowach i personalizuj odpowiedzi na podstawie interakcji użytkownika.
Asystenci Stwórz środowisko podobne do drugiego pilota, które zachowuje spójną osobowość we wszystkich interakcjach użytkowników. Umożliwiaj jednoczesne korzystanie z wielu narzędzi, takich jak implementacja kodu i wyszukiwanie wiedzy.
Osadzenia Konwertuj tekst na wektory numeryczne, w których podobne znaczenia są umieszczone blisko siebie w przestrzeni wektorowej. Ten proces umożliwia zaawansowane wyszukiwanie podobieństw w usługach, takich jak Azure AI Search, Azure Cosmos DB, Azure SQL Database i Azure Database for PostgreSQL.
Filtrowanie zawartości Filtruje zarówno dane wejściowe użytkownika, jak i dane wyjściowe sztucznej inteligencji pod kątem szkodliwych treści w kategoriach takich jak nienawiść, treści seksualne, przemoc i samookaleczenie, z obsługą wielu języków. Monitoruje również wzorce użycia, aby zapewnić zgodność.
Personalizacja LLM Udostępnia techniki adaptacji modelu, w tym szybką inżynierię w celu szybkich dostosowań, RAG w celu uwzględnienia informacji zewnętrznych oraz dostrajanie w celu wytrenowania modelu w specjalistycznych zadaniach. Możesz połączyć te metody, aby zoptymalizować wydajność dla określonych przypadków użycia.

Język

Język to usługa oparta na chmurze, która zapewnia funkcje NLP do rozumienia i analizowania tekstu. Ta usługa ułatwia tworzenie inteligentnych aplikacji przy użyciu internetowego programu Language Studio, interfejsów API REST i bibliotek klienckich.

Możliwości

Poniższa tabela zawiera listę funkcji dostępnych w programie Język.

Możliwość opis
Personalizowane odpowiadanie na pytania Znajduje najbardziej odpowiednią odpowiedź na dane wejściowe od użytkowników. Jest on często używany do tworzenia konwersacyjnych aplikacji klienckich, takich jak aplikacje mediów społecznościowych, boty czatu i aplikacje klasyczne z obsługą mowy.
Niestandardowa klasyfikacja tekstu Tworzy niestandardowe modele sztucznej inteligencji w celu klasyfikowania dokumentów tekstowych bez struktury do zdefiniowanych klas niestandardowych.
Zrozumienie języka konwersacyjnego (CLU) Twórz niestandardowe modele rozumienia języka naturalnego, aby przewidywać ogólną intencję wiadomości przychodzącej i wyodrębniać z niej ważne informacje.
Łączenie jednostek Uściśla tożsamość słów lub fraz znalezionych w tekście nieustrukturyzowanym i zwraca linki do Wikipedii.
Wykrywanie języka Wykrywa język, w którym został napisany dokument, i zwraca kod języka dla szerokiej gamy języków, wariantów, dialektów oraz niektórych języków regionalnych lub kulturowych.
Wyodrębnianie kluczowych fraz Ocenia i zwraca główne pojęcia w tekście bez struktury i zwraca je jako listę.
NER (Ner) Kategoryzuje wyrazy lub frazy w tekście nieustrukturyzowanym w kilku wstępnie zdefiniowanych grupach kategorii, takich jak osoby, wydarzenia, miejsca i daty.
Przepływ pracy orkiestracji Służy do łączenia CLU.
Dane osobowe (PII) i wykrywanie informacji o stanie zdrowia umożliwiających identyfikację osoby Identyfikuje, kategoryzuje i redaguje poufne informacje zarówno w nieustrukturyzowanych dokumentach tekstowych , jak i transkrypcjach rozmów, takich jak numery telefonów, adresy e-mail i formy identyfikacji. Aby uzyskać więcej informacji, zobacz Obsługiwane kategorie jednostek umożliwiających identyfikację.
Analiza nastrojów i eksploracja opinii Pomaga zrozumieć, co ludzie myślą o Twojej marce lub temacie, analizując tekst pod kątem oznak pozytywnego lub negatywnego sentymentu i łącząc je z określonymi aspektami treści.
Podsumowania Używa wyodrębnianego tekstu do tworzenia podsumowań dokumentów i transkrypcji konwersacji. Wyodrębnia zdania, które łącznie reprezentują najważniejsze lub istotne informacje w oryginalnej zawartości.
Analiza tekstu pod kątem kondycji Wyodrębnia i etykietuje istotne informacje medyczne z nieustrukturyzowanych tekstów, takich jak notatki lekarza, podsumowania wypisów, dokumenty kliniczne i elektroniczne rekordy zdrowotne. Podczas projektowania obciążenia oceń lokalizację przetwarzania i miejsce przechowywania danych tej funkcji hostowanej w chmurze, aby upewnić się, że jest ona zgodna z oczekiwaniami dotyczącymi zgodności. Niektóre obciążenia mogą mieć ograniczenia w możliwości wysyłania danych związanych z opieką zdrowotną do platformy hostowanej w chmurze. Tego interfejsu API można użyć jako kontenera platformy Docker do hostowania we własnych obliczeniach w chmurze lub lokalnie. Ten proces może pomóc w rozwiązaniu problemów ze zgodnością, które obejmują platformę jako usługę. Aby uzyskać więcej informacji, zobacz Używanie analizy tekstu dla kontenerów kondycji.

Przypadki użycia

Poniższa tabela zawiera listę możliwych przypadków użycia języka.

Przypadek użycia Można dostosowywać
Przewidywanie intencji danych wejściowych użytkownika i wyodrębnianie z nich informacji. Tak
Identyfikowanie i redagowanie informacji poufnych, takich jak dane osobowe.
Zidentyfikuj język, w jakim został napisany tekst.
Wyodrębnianie informacji medycznych z dokumentów klinicznych lub medycznych bez tworzenia modelu.
Wyodrębnianie informacji medycznych z dokumentów klinicznych lub medycznych przy użyciu modelu wytrenowanego na danych. Tak
Wyodrębnij kategorie informacji bez tworzenia modelu niestandardowego.
Wyodrębnianie kategorii informacji przy użyciu modelu specyficznego dla danych. Tak
Wyodrębnij główne tematy i ważne frazy.
Podsumuj dokument.
Klasyfikowanie tekstu przy użyciu analizy sentymentu. Tak
Klasyfikowanie tekstu przy użyciu klas niestandardowych. Tak
Klasyfikuj elementy do kategorii podanych w czasie wnioskowania.
Łączenie jednostki z artykułami bazy wiedzy.
Zapoznaj się z pytaniami i odpowiedziami (ogólnymi). Tak
Utwórz aplikację konwersacyjną, która odpowiada na dane wejściowe użytkownika.
Połącz aplikacje z CLU i odpowiadaj na pytania. Tak

Jeśli funkcję można dostosowywać, możesz wytrenować model sztucznej inteligencji przy użyciu naszych narzędzi, aby dopasować go do określonych danych. W przeciwnym razie funkcja jest wstępnie skonfigurowana, co oznacza, że jej modele AI pozostają niezmienione. Podajesz swoje dane i używasz danych wyjściowych funkcji w swoich aplikacjach.

Translator

Translator to usługa tłumaczenia maszynowego, która jest częścią usług sztucznej inteligencji. Translator obsługuje wiele produktów i usług firmy Microsoft.

Możliwości

Poniższa tabela zawiera listę funkcji dostępnych w usłudze Translator.

Możliwość opis
Tłumaczenie tekstu platformy Azure Wykonuj tłumaczenie tekstu między obsługiwanymi językami źródłowymi i docelowymi w czasie rzeczywistym. Utwórz słownik dynamiczny i dowiedz się, jak zapobiegać tłumaczeniom za pomocą interfejsu API usługi Translator.
Tłumaczenie dokumentu Asynchroniczne tłumaczenie wsadowe: Tłumacz pliki wsadowe i złożone, zachowując strukturę i format oryginalnych dokumentów. Proces tłumaczenia wsadowego wymaga konta Azure Blob Storage, które zawiera kontenery dla dokumentów źródłowych i przetłumaczonych.
Synchroniczna translacja pojedynczego pliku: Przetłumacz pojedynczy plik dokumentu samodzielnie lub z plikiem glosariusza, zachowując strukturę i format oryginalnego dokumentu. Proces translacji plików nie wymaga konta usługi Blob Storage. Ostateczna odpowiedź zawiera przetłumaczony dokument i jest zwracana bezpośrednio do klienta wywołującego.
Translator niestandardowy Twórz dostosowane modele do tłumaczenia języka, terminologii i stylu specyficznego dla domeny i branży. Utwórz słownik (frazę lub zdanie) dla tłumaczeń niestandardowych.

Przypadki użycia

Poniższa tabela zawiera listę możliwych przypadków użycia usługi Translator.

Przypadek użycia Dokumentacja
Tłumaczenie tekstu specyficznego dla branży. Translator niestandardowy
Tłumaczenie tekstu ogólnego, który nie jest specyficzny dla branży. Tłumaczenie tekstu platformy Azure

Analiza dokumentów

Język to usługa oparta na chmurze, która zapewnia funkcje NLP do rozumienia i analizowania tekstu. Ta usługa ułatwia tworzenie inteligentnych aplikacji przy użyciu internetowego programu Language Studio, interfejsów API REST i bibliotek klienckich.

Możliwości

Poniższa tabela zawiera listę niektórych funkcji dostępnych w analizie dokumentów.

Możliwość opis
Ekstrakcja wizytówek Model analizy wizytówek łączy funkcje optycznego rozpoznawania znaków (OCR) z modelami głębokiego uczenia, aby analizować i wyodrębniać dane z obrazów wizytówek. Interfejs API analizuje wydrukowane wizytówki, wyodrębnia kluczowe informacje, takie jak imię, nazwisko, nazwa firmy, adres e-mail i numer telefonu, a następnie zwraca ustrukturyzowaną reprezentację danych JSON.
Wyodrębnianie modelu kontraktu Model kontraktów analizy dokumentów wykorzystuje funkcje OCR do analizowania i wyodrębniania kluczowych pól i pozycji z wybranej grupy ważnych encji umowy. Umowy mogą mieć różne formaty i jakość, w tym obrazy przechwycone telefonem, zeskanowane dokumenty i cyfrowe pliki PDF. Interfejs API analizuje tekst dokumentu, wyodrębnia kluczowe informacje, takie jak strony, jurysdykcje, identyfikator umowy i tytuł, a następnie zwraca ustrukturyzowaną reprezentację danych JSON. Model obsługuje obecnie formaty dokumentów w języku angielskim.
Wyodrębnianie danych z karty kredytowej Model karty kredytowej/debetowej Document Intelligence wykorzystuje funkcje OCR do analizowania i wyodrębniania kluczowych pól z kart kredytowych i debetowych. Karty kredytowe i debetowe mogą pojawiać się w różnych formatach i jakościach, w tym na obrazach zrobionych telefonem, zeskanowanych dokumentach i cyfrowych plikach PDF. Interfejs API analizuje tekst dokumentu, wyodrębnia kluczowe informacje, takie jak numer karty, bank wystawiający kartę i data ważności, a następnie zwraca ustrukturyzowaną reprezentację danych JSON. Model obsługuje obecnie formaty dokumentów w języku angielskim.
Ekstrakcja kart ubezpieczenia zdrowotnego Model karty ubezpieczenia zdrowotnego Document Intelligence łączy możliwości OCR z modelami uczenia głębokiego w celu analizowania i wyodrębniania kluczowych informacji z amerykańskich kart ubezpieczenia zdrowotnego. Karta ubezpieczenia zdrowotnego jest kluczowym dokumentem do przetwarzania opieki i może być cyfrowo analizowana pod kątem dołączania pacjentów, informacji o pokryciu finansowym, płatności bezgotówkowych i przetwarzania roszczeń ubezpieczeniowych. Model karty ubezpieczenia zdrowotnego analizuje obrazy kart zdrowotnych, wyodrębnia kluczowe informacje, takie jak ubezpieczyciel, członek, recepta i numer grupy, a następnie zwraca ustrukturyzowaną reprezentację JSON. Karty ubezpieczenia zdrowotnego mogą być wyświetlane w różnych formatach i jakościach, w tym na zdjęciach zrobionych telefonem, zeskanowanych dokumentach i cyfrowych plikach PDF.
Wyodrębnianie dokumentów podatkowych w USA Model kontraktów Document Intelligence wykorzystuje możliwości OCR do analizowania i wyodrębniania kluczowych pól i pozycji z wybranej grupy dokumentów podatkowych. Dokumenty podatkowe mogą mieć różne formaty i jakość, w tym obrazy przechwycone telefonem, zeskanowane dokumenty i cyfrowe pliki PDF. Interfejs API analizuje tekst dokumentu, wyodrębnia kluczowe informacje, takie jak imię i nazwisko klienta, adres rozliczeniowy, termin płatności i należna kwota, a następnie zwraca ustrukturyzowaną reprezentację danych JSON. Model obsługuje obecnie określone formaty dokumentów podatkowych w języku angielskim.
Biblioteki klienckie Analiza dokumentów obsługuje szeroką gamę modeli, które umożliwiają dodawanie inteligentnego przetwarzania dokumentów do aplikacji i przepływów. Możesz użyć wstępnie utworzonego modelu specyficznego dla domeny lub wytrenować model niestandardowy dostosowany do konkretnych potrzeb biznesowych i przypadków użycia. Analiza dokumentów może być używana z interfejsem API REST lub bibliotekami klienta języka Python, C#, Java i JavaScript.

Aby uzyskać więcej informacji na temat scenariuszy modeli, zobacz Który model należy wybrać?

Następne kroki