Udostępnij przez


Jak Edytowanie pliku tezaurusa (@@)

Tezaurus dla danego języka mogą być skonfigurowane, edytując jej plik tezaurusa (plik XML).Podczas instalacji, opróżnić pliki tezaurusa, które zawierają tylko <XML> kontener i próbki komentarz wykreślania <Słownik wyrazów bliskoznacznych> element są zainstalowane. Aby wyszukać synonimy do poprawnego działania kwerendy wyszukiwania pełnotekstowego należy utworzyć rzeczywistej <Słownik wyrazów bliskoznacznych> element, który definiuje zestaw synonimy. Można zdefiniować dwa rodzaje synonimy, zestawy rozszerzające i zestawy zastępcze.Aby uzyskać informacje dotyczące lokalizacji i strukturę pliku tezaurusa zobacz Konfiguracja tezaurusa.

Ograniczenia dotyczące plików tezaurusa

Aby edytować plik tezaurusa, obowiązują następujące ograniczenia:

  • Tylko administratorzy systemu mogą zaktualizować, zmodyfikować lub usunąć pliki tezaurusa.

  • Podczas edycji plików tezaurusa za pomocą narzędzi edytora tekstu, pliki, musi być zapisany w formacie Unicode, a bajt kolejność znaków musi być określona.

  • Wpisy tezaurusa nie może być pusta lub word podział na pusty ciąg.

  • Wyrażenia w pliku tezaurusa nie może być dłuższa niż 512 znaków.

  • Tezaurus nie może zawierać wszystkie zduplikowane wpisy między <podrzędne> wpisy zestawy rozszerzające oraz <Po> elementy zestawów zastępczych.

Zalecenia dotyczące plików tezaurusa

Zaleca się, że wpisy w pliku tezaurusa nie zawiera żadnych znaków specjalnych.Dzieje się tak, ponieważ wyraz wyłączników mają subtelnych zachowań znaków specjalnych.Jeżeli wpis tezaurusa zawiera znaki specjalne, wyłączników słowo, używane w połączeniu z tym wpisem może mieć subtelnych behawioralnej następstwa dla zapytanie pełnotekstowe.

Zaleca się, że <podrzędne> wpisy zawierają nie stopwords, ponieważ pominięto stopwords z indeksu pełnotekstowego. Kwerendy są rozwinięte, aby uwzględnić <podrzędne> wpisy z pliku tezaurusa i w razie <podrzędne> wpis zawiera stopwords, niepotrzebnie zwiększa się rozmiar kwerendy.

Aby edytować plik tezaurusa

  1. Otwórz plik tezaurusa w Notatniku.

  2. Jeśli edytujesz plik tezaurusa po raz pierwszy, usuń następujące wiersze komentarzy na początku i na końcu pliku:

    <!--Commented out
    -->
    
  3. Dodawanie, modyfikowanie lub usuwanie zestaw zastępczy lub zestaw rozszerzeń.Aby uzyskać więcej informacji zobaczKonfiguracja tezaurusa.

  4. Zapisz plik i zamknij Notatnik.

  5. Użycie sp_fulltext_load_thesaurus_file załadować zawartość pliku tezaurusa do tempdb podawania identyfikatora lokalnego (LCID) odpowiadający językowi plik tezaurusa.Na przykład w przypadku pliku tezaurusa angielski tsenu.xml odpowiednich LCID jest 1033.

    USE AdventureWorks ;
    EXEC sys.sp_fulltext_load_thesaurus_file 1033;
    GO