Wprowadzenie

Zakończone

W ramach sztucznej inteligencji analiza tekstu jest podzbiorem przetwarzania języka naturalnego (NLP), który umożliwia maszynom wyodrębnianie znaczenia, struktury i szczegółowych informacji z tekstu bez struktury. Organizacje używają analizy tekstu do przekształcania opinii klientów, biletów pomocy technicznej, kontraktów i wpisów w mediach społecznościowych w analizę umożliwiającą podejmowanie działań.

Techniki przetwarzania i analizowania tekstu ewoluowały w ciągu wielu lat, od prostych obliczeń statystycznych opartych na częstotliwości terminów do modeli językowych opartych na wektorach, które hermetyzują znaczenie semantyczne. Oto niektóre typowe przypadki użycia analizy tekstu:

  • Wyodrębnianie terminów kluczowych: identyfikowanie ważnych słów i fraz w tekście w celu ułatwienia określenia tematów i tematów, które omawia.
  • Wykrywanie jednostek: identyfikowanie nazwanych jednostek wymienionych w tekście; na przykład miejsca, osoby, daty i organizacje.
  • Klasyfikacja tekstu: kategoryzowanie dokumentów tekstowych na podstawie ich zawartości. Na przykład filtrowanie wiadomości e-mail jako spamu lub nie spamu.
  • Analiza tonacji: określona forma klasyfikacji tekstu, która przewiduje tonację tekstu — na przykład kategoryzowanie wpisów w mediach społecznościowych jako pozytywnych, neutralnych lub negatywnych.
  • Podsumowanie tekstu: zmniejszenie ilości tekstu przy zachowaniu ważnych punktów. Na przykład generowanie krótkiego podsumowania jednego akapitu z wielostronicowego dokumentu.

Analiza tekstu jest trudna, ponieważ język jest złożony, a komputery trudno je zrozumieć. Ostatecznie wszystkie techniki analizy tekstu są oparte na wymogu wyodrębniania znaczenia z tekstu w języku naturalnym.

Uwaga / Notatka

Zdajemy sobie sprawę, że różni ludzie lubią uczyć się na różne sposoby. Możesz ukończyć ten moduł w formacie wideo lub przeczytać zawartość jako tekst i obrazy. Tekst zawiera więcej szczegółów niż filmy wideo, więc w niektórych przypadkach możesz chcieć odwoływać się do niego jako materiał uzupełniający do prezentacji wideo.