다음을 통해 공유


유사 항목 그룹화 변환 편집기(고급 탭)

유사 항목 그룹화 변환 편집기 대화 상자의 고급 탭을 사용하여 입력 및 출력 열을 지정하고, 유사성 임계값을 설정하고, 구분 기호를 정의합니다.

비고

ExhaustiveMaxMemoryUsage 프로퍼티는 유사 항목 그룹화 변환 편집기에서 사용할 수 없지만 고급 편집기를 사용하여 설정할 수 있습니다. 이러한 속성에 대한 자세한 내용은 변환 사용자 지정 속성의 유사 항목 그룹화 변환 섹션을 참조하세요.

유사 항목 그룹화 변환에 대한 자세한 내용은 유사 항목 그룹화 변환을 참조하세요.

옵션

입력 키 열 이름
각 입력 행에 대한 고유 식별자를 포함하는 출력 열의 이름을 지정합니다. 열에는 _key_in 각 행을 고유하게 식별하는 값이 있습니다.

출력 키 열 이름
중복 행 그룹의 정식 행에 대한 고유 식별자를 포함하는 출력 열의 이름을 지정합니다. _key_out 열은 정식 데이터 행의 _key_in 값에 해당합니다.

유사성 점수 열 이름
유사성 점수가 포함된 열의 이름을 지정합니다. 유사성 점수는 입력 행과 정식 행의 유사성을 나타내는 0에서 1 사이의 값입니다. 점수가 1에 가까울수록 행이 정식 행과 더 가깝게 일치합니다.

유사성 임계값
슬라이더를 사용하여 유사성 임계값을 설정합니다. 임계값이 1에 가까울수록 중복 항목으로 한정하려면 행이 서로 더 유사해야 합니다. 임계값을 늘리면 고려해야 하는 후보 레코드가 적기 때문에 일치 속도가 향상될 수 있습니다.

토큰 구분 기호
변환은 데이터를 토큰화하기 위한 기본 구분 기호 집합을 제공하지만 목록을 편집하여 필요에 따라 구분 기호를 추가하거나 제거할 수 있습니다.

또한 참조하십시오

Integration Services 오류 및 메시지 참조
유사 항목 그룹화 변환을 사용하여 유사한 데이터 행 식별