이 문서는 이 API에 대한 참조 설명서를 보충하는 추가 설명을 제공합니다.
두 문자열의 문화권 구분 비교는 스크립트, 알파벳, 대/소문자 및 발음 가중치를 포함하여 여러 범주의 정렬 가중치가 있는 문자열의 각 문자에 따라 달라집니다. 정렬 키는 특정 문자열에 대한 이러한 가중치의 리포지토리 역할을 합니다.
CompareInfo.GetSortKey 메서드는 지정된 문자열에서 문화에 민감한 문자 매핑을 반영하는 SortKey 클래스의 인스턴스를 반환합니다. SortKey 개체의 값은 KeyData 속성에서 반환되는 키 데이터입니다. 이 키 데이터는 문자열, 문화권별 정렬 규칙 및 사용자가 지정한 비교 옵션을 인코딩하는 일련의 바이트로 구성됩니다. 정렬 키를 사용한 비교는 각 정렬 키의 해당 키 데이터에 대한 비트 비교로 구성됩니다. 예를 들어, GetSortKey(String, CompareOptions) 메서드를 CompareOptions.IgnoreCase 값과 함께 호출하여 정렬 키를 생성하면, 이 정렬 키를 사용하는 문자열 비교 작업은 대소문자를 구분하지 않습니다.
문자열에 대한 정렬 키를 만든 후 정적 SortKey.Compare 메서드를 호출하여 정렬 키를 비교합니다. 이 메서드는 간단한 바이트 바이트 비교를 수행하므로 메서드보다 String.CompareCompareInfo.Compare 훨씬 빠릅니다.
비고
Windows 운영 체제의 정렬 및 비교 작업에 사용되는 문자 가중치에 대한 정보가 포함된 텍스트 파일 집합인 정렬 가중치 테이블, 기본 유니코드 데이터 정렬 요소 테이블, Linux 및 macOS용 정렬 가중치 테이블을 다운로드할 수 있습니다.
성능 고려 사항
문자열 비교를 수행할 때 Compare와 CompareInfo.Compare 메서드는 동일한 결과를 생성하지만, 서로 다른 시나리오에 적합합니다.
상위 수준에서 메서드는 CompareInfo.Compare 각 문자열에 대한 정렬 키를 생성하고 비교를 수행한 다음 정렬 키를 삭제하고 비교 결과를 반환합니다. 그러나 메서드는 CompareInfo.Compare 실제로 비교를 수행하기 위해 전체 정렬 키를 생성하지 않습니다. 대신 메서드는 각 문자열에서 각 텍스트 요소(기본 문자, 서로게이트 쌍 또는 결합 문자 시퀀스)에 대한 키 데이터를 생성합니다. 그런 다음 메서드는 해당 텍스트 요소에 대한 키 데이터를 비교합니다. 비교의 최종 결과가 결정되는 즉시 작업이 종료됩니다. 정렬 키 정보는 계산되지만 개체는 만들어지지 않습니다 SortKey . 이 전략은 두 문자열을 한 번 비교하는 경우 성능 측면에서 경제적이지만 동일한 문자열을 여러 번 비교하면 비용이 많이 듭니다.
이 메서드는 비교를 수행하기 전에 각 문자열에 대해 Compare 개체를 생성해야 합니다. 이 전략은 개체를 생성하는 SortKey 데 투자된 시간과 메모리 때문에 첫 번째 비교의 성능 측면에서 비용이 많이 듭니다. 그러나 동일한 정렬 키를 여러 번 비교하면 경제적이 됩니다.
예를 들어 데이터베이스 테이블에서 문자열 기반 인덱스 열이 지정된 검색 문자열과 일치하는 행을 검색하는 애플리케이션을 작성한다고 가정합니다. 테이블에는 수천 개의 행이 포함되어 있으며 각 행의 인덱스와 검색 문자열을 비교하는 데 시간이 오래 걸릴 수 있습니다. 따라서 애플리케이션이 행과 해당 인덱스 열을 저장하는 경우 검색 성능 향상을 위해 인덱스에 대한 정렬 키도 생성하고 열에 저장합니다. 애플리케이션은 대상 행을 검색할 때 검색 문자열과 인덱스 문자열을 비교하는 대신 검색 문자열의 정렬 키를 인덱스 문자열의 정렬 키와 비교합니다.
보안 고려 사항
이 CompareInfo.GetSortKey(String, CompareOptions) 메서드는 지정된 문자열과 SortKey 값을 바탕으로 한 값을 가지며, 기본 CompareOptions 개체와 연결된 문화권이 있는 CompareInfo 개체를 반환합니다. 보안 결정이 문자열 비교 또는 대/소문자 변경에 따라 달라지는 경우, 운영 체제의 문화권 설정에 관계없이 작업의 동작이 일관되도록 불변 문화권의 CompareInfo.GetSortKey(String, CompareOptions) 메서드를 사용해야 합니다.
정렬 키를 가져오려면 다음 단계를 사용합니다.
CultureInfo.InvariantCulture 속성에서 불변 문화권을 검색합니다.
속성 CompareInfo에서 CultureInfo.CompareInfo 고정 문화권에 대한 개체를 검색합니다.
CompareInfo.GetSortKey(String, CompareOptions) 메서드를 호출합니다.
개체 값 SortKey 으로 작업하는 것은 지정된 LCMAP_SORTKEY 값을 사용하여 Windows LCMapString 메서드를 호출하는 것과 같습니다. 그러나 개체의 SortKey 경우 영어 문자의 정렬 키는 한국어 문자의 정렬 키 앞에 섰습니다.
SortKey 개체는 직렬화할 수 있지만, 이것은 AppDomain 개체를 넘어 전달할 수 있도록 하기 위한 것입니다. 애플리케이션이 개체를 SortKey serialize하는 경우 새 버전의 .NET이 있는 경우 애플리케이션은 모든 정렬 키를 다시 생성해야 합니다.
정렬 키에 대한 자세한 내용은 유니코드 컨소시엄 웹 사이트에서 유니코드 기술 표준 #10, "유니코드 데이터 정렬 알고리즘"을 참조하세요.
.NET