대/소문자 구분, 악센트 구분 및 사용 중인 기본 언어를 포함하여 다양한 속성이 텍스트 데이터의 정렬 순서 및 같음 의미 체계에 영향을 줍니다. 이러한 특성은 데이터에 대한 데이터 정렬 선택을 통해 SQL Server에 표현됩니다. 데이터 정렬 자체에 대한 자세한 내용은 데이터 정렬 및 유니코드 지원을 참조하세요.
데이터 정렬은 사용자 테이블에 저장된 데이터뿐만 아니라 메타데이터, 임시 개체, 변수 이름 등을 포함하여 SQL Server에서 처리하는 모든 텍스트에 적용됩니다. 이러한 처리는 포함된 데이터베이스와 포함되지 않은 데이터베이스에서 다릅니다. 이 변경은 많은 사용자에게 영향을 미치지 않지만 인스턴스 독립성과 균일성을 제공하는 데 도움이 됩니다. 그러나 이로 인해 포함된 데이터베이스와 포함되지 않은 데이터베이스 모두에 액세스하는 세션에 대한 문제뿐만 아니라 약간의 혼란이 발생할 수도 있습니다.
이 항목에서는 변경 내용을 명확히 설명하고 변경으로 인해 문제가 발생할 수 있는 영역을 살펴봅니다.
포함되지 않은 데이터베이스
모든 데이터베이스에는 기본 데이터 정렬이 있습니다(데이터베이스를 만들거나 변경할 때 설정할 수 있음). 이 데이터 정렬은 데이터베이스 내의 모든 문자열 열에 대한 기본값뿐만 아니라 데이터베이스의 모든 메타데이터에도 사용됩니다. 사용자는 절을 사용하여 특정 열에 대해 다른 데이터 정렬을 COLLATE 선택할 수 있습니다.
예제 1
예를 들어 베이징에서 작업하는 경우 중국어 데이터 정렬을 사용할 수 있습니다.
ALTER DATABASE MyDB COLLATE Chinese_Simplified_Pinyin_100_CI_AS;
이제 열을 만들면 기본 데이터 정렬은 이 중국어 데이터 정렬이지만 원하는 경우 다른 데이터 정렬을 선택할 수 있습니다.
CREATE TABLE MyTable
(mycolumn1 nvarchar,
mycolumn2 nvarchar COLLATE Frisian_100_CS_AS);
GO
SELECT name, collation_name
FROM sys.columns
WHERE name LIKE 'mycolumn%' ;
GO
결과 집합은 다음과 같습니다.
name collation_name
--------------- ----------------------------------
mycolumn1 Chinese_Simplified_Pinyin_100_CI_AS
mycolumn2 Frisian_100_CS_AS
이는 비교적 간단해 보이지만 몇 가지 문제가 발생합니다. 열의 데이터 정렬은 테이블이 만들어지는 데이터베이스에 따라 달라지므로 저장 tempdb되는 임시 테이블을 사용할 때 문제가 발생합니다. 일반적으로 데이터 정렬은 인스턴스의 tempdb 데이터 정렬과 일치하며 데이터베이스 데이터 정렬과 일치하지 않아도 됩니다.
예제 2
예를 들어 Latin1_General 데이터 정렬이 있는 인스턴스에서 사용되는 경우 위의 (중국어) 데이터베이스를 고려합니다.
CREATE TABLE T1 (T1_txt nvarchar(max)) ;
GO
CREATE TABLE #T2 (T2_txt nvarchar(max)) ;
GO
언뜻 보기에 이러한 두 테이블은 스키마가 같은 것처럼 보이지만 데이터베이스의 데이터 정렬이 다르기 때문에 값은 실제로 호환되지 않습니다.
SELECT T1_txt, T2_txt
FROM T1
JOIN #T2
ON T1.T1_txt = #T2.T2_txt
결과 집합은 다음과 같습니다.
Msg 468, Level 16, State 9, Line 2
같음 연산에서 "Latin1_General_100_CI_AS_KS_WS_SC"과 Chinese_Simplified_Pinyin_100_CI_AS" 간의 데이터 정렬 충돌을 해결할 수 없습니다.
임시 테이블을 명시적으로 정렬하여 이 문제를 해결할 수 있습니다. SQL Server에서는 COLLATE 구문의 DATABASE_DEFAULT 키워드를 제공하여 이를 좀 더 쉽게 수행할 수 있습니다.
CREATE TABLE T1 (T1_txt nvarchar(max)) ;
GO
CREATE TABLE #T2 (T2_txt nvarchar(max) COLLATE DATABASE_DEFAULT);
GO
SELECT T1_txt, T2_txt
FROM T1
JOIN #T2
ON T1.T1_txt = #T2.T2_txt ;
이제 오류 없이 실행됩니다.
변수를 사용한 데이터 정렬 종속 동작도 확인할 수 있습니다. 다음 함수를 고려합니다.
CREATE FUNCTION f(@x INT) RETURNS INT
AS BEGIN
DECLARE @I INT = 1
DECLARE @?? INT = 2
RETURN @x * @i
END;
이것은 다소 특이한 함수입니다. 대소문자를 구분하는 정렬에서, 반환 절의 @i은 @I이나 @??에 바인드할 수 없습니다. 대/소문자를 구분하지 않는 Latin1_General 대조에서 @i가 @I에 바인딩되고, 이 함수는 1을 반환합니다. 그러나 대소문자를 구분하지 않는 터키어 정렬에서는 @i가 @??에 바인딩되고 함수는 2를 반환합니다. 이렇게 하면 서로 다른 데이터 정렬을 사용하여 인스턴스 간에 이동하는 데이터베이스에 큰 피해를 줄 수 있습니다.
포함된 데이터베이스
포함된 데이터베이스의 디자인 목표는 데이터베이스를 자체 포함으로 만드는 것이므로 인스턴스 및 tempdb 데이터 정렬에 대한 의존도를 끊어야 합니다. 이를 위해 포함된 데이터베이스는 카탈로그 데이터 정렬의 개념을 소개합니다. 카탈로그 데이터 정렬은 시스템 메타데이터 및 임시 개체에 사용됩니다. 자세한 내용은 아래와 같습니다.
제한된 데이터베이스에서 카탈로그 정렬은 Latin1_General_100_CI_AS_WS_KS_SC입니다. 이 데이터 정렬은 SQL Server의 모든 인스턴스에 포함된 모든 데이터베이스에 대해 동일하며 변경할 수 없습니다.
데이터베이스 데이터 정렬은 유지되지만 사용자 데이터의 기본 데이터 정렬로만 사용됩니다. 기본적으로 데이터베이스 정렬 방식은 모델 데이터베이스의 정렬 방식과 같지만, 사용자는 포함되지 않은 데이터베이스와 마찬가지로 CREATE 또는 ALTER DATABASE 명령을 통해 이를 변경할 수 있습니다.
절에서 COLLATE 새 키워드CATALOG_DEFAULT를 사용할 수 있습니다. 포함된 데이터베이스와 포함되지 않은 데이터베이스 모두에서 메타데이터의 현재 데이터 정렬에 대한 바로 가기로 사용됩니다. 즉, 독립적인 데이터베이스에서는 메타데이터가 데이터베이스 정렬에 따라 정렬되므로 현재 데이터베이스 정렬을 반환합니다. 포함된 데이터베이스에서는 사용자가 카탈로그 데이터 정렬과 일치하지 않도록 데이터베이스 데이터 정렬을 변경할 수 있으므로 이러한 두 값이 다를 수 있습니다.
포함되지 않은 데이터베이스와 포함된 데이터베이스 모두에서 다양한 개체의 동작은 다음 표에 요약되어 있습니다.
| 항목 | 포함되지 않은 데이터베이스 | 포함된 데이터베이스 |
| 사용자 데이터(기본값) | 데이터베이스_기본값 | 데이터베이스_기본값 |
| 임시 데이터(기본값) | TempDB 데이터 정렬 | 데이터베이스_기본값 |
| 메타데이터 | DATABASE_DEFAULT/CATALOG_DEFAULT | CATALOG_DEFAULT |
| 임시 메타데이터 | tempdb 데이터 정렬 | 카탈로그_디폴트 |
| 변수 | 인스턴스 데이터 정렬 | 카탈로그_기본값 |
| Goto 레이블 | 인스턴스 데이터 정렬 | CATALOG_DEFAULT |
| 커서 이름 | 인스턴스 데이터 정렬 | 카탈로그_기본값 |
앞에서 설명한 임시 테이블 예제의 경우 이 데이터 정렬 동작으로 대부분의 임시 테이블에서 명시적 COLLATE 절이 필요하지 않은 것을 알 수 있습니다. 포함된 데이터베이스에서 이 코드는 데이터베이스와 인스턴스 데이터 정렬이 다르더라도 오류 없이 실행됩니다.
CREATE TABLE T1 (T1_txt nvarchar(max)) ;
GO
CREATE TABLE #T2 (T2_txt nvarchar(max));
GO
SELECT T1_txt, T2_txt
FROM T1
JOIN #T2
ON T1.T1_txt = #T2.T2_txt ;
이는 T1_txt 및 T2_txt 모두 포함된 데이터베이스의 정렬 방식에 따라 정렬되기 때문에 작동합니다.
포함된 컨텍스트와 포함되지 않은 컨텍스트 간 교차
포함된 데이터베이스의 세션이 포함된 상태로 유지되는 한 연결된 데이터베이스 내에 남아 있어야 합니다. 이 경우 동작은 매우 간단합니다. 그러나 세션이 포함된 컨텍스트와 포함되지 않은 컨텍스트 간에 교차하는 경우 두 규칙 집합을 브리지해야 하므로 동작이 더 복잡해집니다. 사용자가 다른 데이터베이스에 연결할 수 있으므로 부분적으로 격리된 데이터베이스에서 이러한 상황이 발생할 수 있습니다 USE. 이 경우 데이터 정렬 규칙의 차이는 다음 원칙에 의해 처리됩니다.
- 일괄 처리에 대한 데이터 정렬 동작은 일괄 처리가 시작되는 데이터베이스에 의해 결정됩니다.
이 결정은 초기 USE명령을 포함하여 모든 명령이 실행되기 전에 결정됩니다. 즉, 포함된 데이터베이스에서 일괄 처리가 시작되지만 첫 번째 명령이 USE 포함되지 않은 데이터베이스에 대한 명령인 경우 포함된 데이터 정렬 동작은 일괄 처리에 계속 사용됩니다. 예를 들어 변수에 대한 참조는 다음과 같은 여러 가지 가능한 결과를 가질 수 있습니다.
참조는 정확히 하나의 일치 항목을 찾을 수 있습니다. 이 경우 참조는 오류 없이 작동합니다.
참조는 이전에는 일치가 있었던 경우라도 현재 정렬 방식에서 일치 항목을 찾지 못할 수 있습니다. 이렇게 하면 변수가 생성된 것으로 보이는 경우에도 변수가 존재하지 않음을 나타내는 오류가 발생합니다.
참조는 원래 고유했던 여러 일치 항목을 찾을 수 있습니다. 이렇게 하면 오류가 발생합니다.
몇 가지 예제를 사용하여 이를 설명합니다. 이를 위해 데이터베이스 데이터 정렬이 기본 데이터 정렬로 설정된 부분적으로 포함된 데이터베이스가 MyCDBLatin1_General_100_CI_AS_WS_KS_SC 가정합니다. 인스턴스 정렬은 Latin1_General_100_CS_AS_WS_KS_SC입니다. 두 데이터 정렬은 대/소문자 구분만 다릅니다.
예제 1
다음 예제에서는 참조가 정확히 하나의 일치 항목을 찾는 경우를 보여 줍니다.
USE MyCDB;
GO
CREATE TABLE #a(x int);
INSERT INTO #a VALUES(1);
GO
USE master;
GO
SELECT * FROM #a;
GO
Results:
결과 집합은 다음과 같습니다.
x
-----------
1
이 경우 식별된 #a 대/소문자를 구분하지 않는 카탈로그 데이터 정렬과 대/소문자를 구분하는 인스턴스 데이터 정렬 모두에서 바인딩되며 코드가 작동합니다.
예제 2
다음 예제에서는 참조가 이전에 있던 현재 데이터 정렬에서 일치 항목을 찾지 못하는 경우를 보여 줍니다.
USE MyCDB;
GO
CREATE TABLE #a(x int);
INSERT INTO #A VALUES(1);
GO
여기서 #A는 대/소문자를 구분하지 않는 기본 정렬에서 #a에 바인딩되며, 삽입이 작동합니다.
결과 집합은 다음과 같습니다.
(1 row(s) affected)
그러나 스크립트를 계속 진행하면...
USE master;
GO
SELECT * FROM #A;
GO
대소문자를 구분하는 인스턴스 정렬에서 #A를 바인딩하려 할 때 오류가 발생합니다.
결과 집합은 다음과 같습니다.
Msg 208, Level 16, State 0, Line 2
개체 이름 '#A'이(가) 잘못되었습니다.
예제 3
다음 예제에서는 참조가 원래 고유했던 여러 일치 항목을 찾는 경우를 보여 줍니다. 먼저 tempdb (인스턴스와 대/소문자 구분 데이터 정렬이 동일한 곳)에서 시작하여 다음 문을 실행합니다.
USE tempdb;
GO
CREATE TABLE #a(x int);
GO
CREATE TABLE #A(x int);
GO
INSERT INTO #a VALUES(1);
GO
INSERT INTO #A VALUES(2);
GO
테이블은 이 데이터 정렬에서 고유하므로 성공합니다.
결과 집합은 다음과 같습니다.
(1 row(s) affected)
(1 row(s) affected)
그러나 포함된 데이터베이스로 이동하면 더 이상 이러한 테이블에 바인딩할 수 없습니다.
USE MyCDB;
GO
SELECT * FROM #a;
GO
결과 집합은 다음과 같습니다.
Msg 12800, Level 16, State 1, Line 2
임시 테이블 이름 '#a'에 대한 참조가 모호하며 확인할 수 없습니다. 가능한 후보자는 '#a'과 '#A'입니다.
결론
포함된 데이터베이스의 데이터 정렬 동작은 포함되지 않은 데이터베이스의 데이터 정렬 동작과 미묘하게 다릅니다. 이 동작은 일반적으로 인스턴스 독립성과 단순성을 제공하는 데 유용합니다. 일부 사용자는 특히 세션이 포함된 데이터베이스와 포함되지 않은 데이터베이스에 모두 액세스할 때 문제가 있을 수 있습니다.