Udostępnij przez


grupowanie rozmyte Edytor transformacji (karta kolumny)

Użycie Kolumny Karta Rozmyty Edytor transformacja grupowanie okno dialogowe, aby określić kolumny, używane do grupowanie wierszy za pomocą zduplikowane wartości.

Aby uzyskać więcej informacji na temat grupowanie rozmyte transformacja, zobacz Fuzzy Grouping Transformation.

Opcje

  • Dostępne kolumny wprowadzania
    Wybierz z listy kolumn danych wejściowych, używanych do grupy wierszy z zduplikowane wartości.

  • Imię i nazwisko
    Umożliwia wyświetlenie nazwy dostępnych kolumn danych wejściowych.

  • Przechodzą przez
    Zdecyduj, czy chcesz dołączyć kolumna danych wejściowych w danych wyjściowych transformacja.Wszystkie kolumny używane do grupowanie są automatycznie kopiowane do danych wyjściowych.Można dołączyć dodatkowe kolumna, przez sprawdzenie w tej kolumnie.

  • Kolumna danych wejściowych
    Wybierz jedną z kolumn danych wejściowych, wybranych wcześniej w Dostępne kolumny wprowadzania listy.

  • Alias danych wyjściowych
    Wprowadź opisową nazwę odpowiedniej kolumna wyprowadzenia.Domyślnie nazwa kolumna danych wyjściowych jest taka sama jak nazwa kolumna danych wejściowych.

  • Alias grupy w danych wyjściowych
    Wpisz opisową nazwę kolumna, która będzie zawierać wartość kanoniczna zgrupowanych duplikatów.Domyślną nazwą tej kolumna danych wyjściowych jest nazwa kolumna danych wejściowych z _clean dołączane.

  • Typ dopasowania
    Umożliwia wybranie niewyraźne lub dokładnego dopasowania.Wiersze są traktowane jako duplikaty, jeśli są one podobne wystarczająco wszystkich kolumn z typem odpowiednika niewyraźny.Jeśli zostanie określony, dokładne dopasowanie pewnych kolumn, tylko te wiersze, które zawierają identyczne wartości w kolumnach dokładnego dopasowania są uznawane za możliwe duplikaty.W związku z tym jeśli wiadomo, że niektóre kolumna nie zawiera żadnych błędów ani niespójności, można określić dokładne dopasowanie w tej kolumnie, aby zwiększyć dokładność dopasowania rozmyty na innych kolumnach.

  • Minimalna podobieństw
    zestaw Próg podobieństwa poziom łączyć za pomocą suwaka.Im bliżej wartością jest 1, im bliżej resemblance wartości odnośników do wartości urządzenie źródłowe musi być w celu zakwalifikowania jako odpowiednik.Zwiększanie progu może zwiększyć szybkość dopasowania, ponieważ mniejsza liczba rekordów kandydata należy wziąć pod uwagę.

  • Alias wyjście podobieństw
    Określ nazwę dla nowej kolumna wyjściowe, zawierający wyniki podobieństwa dla wybranego łączyć.Jeśli wartość ta pozostanie puste, nie jest tworzona kolumna wyprowadzenia.

  • Cyfry
    Określ istotność cyfry początkowe i końcowe przy porównywaniu danych kolumna.Na przykład jeśli wiodących cyfry znaczące, "123 Main Street" będzie nie będzie podlegał grupowaniu z "456 Main Street. „

    Wartość

    Description

    Ani

    Początkowe i końcowe liczby nie są istotne.

    Wiodące

    Tylko cyfry początkowe są istotne.

    Odstęp kończący

    Tylko cyfry końcowe są istotne.

    LeadingAndTrailing

    Zarówno początkowe i końcowe cyfry są istotne.

  • Porównanie flagi
    Aby uzyskać informacje o opcjach porównania ciągów zobacz Comparing String Data.