grupowanie rozmyte Edytor transformacji (karta kolumny)
Użycie Kolumny Karta Rozmyty Edytor transformacja grupowanie okno dialogowe, aby określić kolumny, używane do grupowanie wierszy za pomocą zduplikowane wartości.
Aby uzyskać więcej informacji na temat grupowanie rozmyte transformacja, zobacz Fuzzy Grouping Transformation.
Opcje
Dostępne kolumny wprowadzania
Wybierz z listy kolumn danych wejściowych, używanych do grupy wierszy z zduplikowane wartości.Imię i nazwisko
Umożliwia wyświetlenie nazwy dostępnych kolumn danych wejściowych.Przechodzą przez
Zdecyduj, czy chcesz dołączyć kolumna danych wejściowych w danych wyjściowych transformacja.Wszystkie kolumny używane do grupowanie są automatycznie kopiowane do danych wyjściowych.Można dołączyć dodatkowe kolumna, przez sprawdzenie w tej kolumnie.Kolumna danych wejściowych
Wybierz jedną z kolumn danych wejściowych, wybranych wcześniej w Dostępne kolumny wprowadzania listy.Alias danych wyjściowych
Wprowadź opisową nazwę odpowiedniej kolumna wyprowadzenia.Domyślnie nazwa kolumna danych wyjściowych jest taka sama jak nazwa kolumna danych wejściowych.Alias grupy w danych wyjściowych
Wpisz opisową nazwę kolumna, która będzie zawierać wartość kanoniczna zgrupowanych duplikatów.Domyślną nazwą tej kolumna danych wyjściowych jest nazwa kolumna danych wejściowych z _clean dołączane.Typ dopasowania
Umożliwia wybranie niewyraźne lub dokładnego dopasowania.Wiersze są traktowane jako duplikaty, jeśli są one podobne wystarczająco wszystkich kolumn z typem odpowiednika niewyraźny.Jeśli zostanie określony, dokładne dopasowanie pewnych kolumn, tylko te wiersze, które zawierają identyczne wartości w kolumnach dokładnego dopasowania są uznawane za możliwe duplikaty.W związku z tym jeśli wiadomo, że niektóre kolumna nie zawiera żadnych błędów ani niespójności, można określić dokładne dopasowanie w tej kolumnie, aby zwiększyć dokładność dopasowania rozmyty na innych kolumnach.Minimalna podobieństw
zestaw Próg podobieństwa poziom łączyć za pomocą suwaka.Im bliżej wartością jest 1, im bliżej resemblance wartości odnośników do wartości urządzenie źródłowe musi być w celu zakwalifikowania jako odpowiednik.Zwiększanie progu może zwiększyć szybkość dopasowania, ponieważ mniejsza liczba rekordów kandydata należy wziąć pod uwagę.Alias wyjście podobieństw
Określ nazwę dla nowej kolumna wyjściowe, zawierający wyniki podobieństwa dla wybranego łączyć.Jeśli wartość ta pozostanie puste, nie jest tworzona kolumna wyprowadzenia.Cyfry
Określ istotność cyfry początkowe i końcowe przy porównywaniu danych kolumna.Na przykład jeśli wiodących cyfry znaczące, "123 Main Street" będzie nie będzie podlegał grupowaniu z "456 Main Street. „Wartość
Description
Ani
Początkowe i końcowe liczby nie są istotne.
Wiodące
Tylko cyfry początkowe są istotne.
Odstęp kończący
Tylko cyfry końcowe są istotne.
LeadingAndTrailing
Zarówno początkowe i końcowe cyfry są istotne.
Porównanie flagi
Aby uzyskać informacje o opcjach porównania ciągów zobacz Comparing String Data.