다음을 통해 공유


PySpark 데이터 형식

이 페이지에서는 해당 참조 설명서에 대한 링크와 함께 Databricks에서 사용할 수 있는 PySpark 데이터 형식 목록을 제공합니다.

데이터 형식 Description
ArrayType(elementType[, containsNull]) 배열 데이터 형식
BinaryType() 이진(바이트 배열) 데이터 형식
BooleanType() 부울 데이터 형식
ByteType() 부가된 8비트 정수를 나타내는 바이트 데이터 형식
CalendarIntervalType() 일정 간격
CharType(length) Char 데이터 형식
DataType() 데이터 형식에 대한 기본 클래스
DateType() Date(datetime.date) 데이터 형식
DayTimeIntervalType([startField, endField]) DayTimeIntervalType(datetime.timedelta)
DecimalType([precision, scale]) 10진수(decimal.Decimal) 데이터 형식
DoubleType() 배정밀도 부동 소수 자릿수를 나타내는 이중 데이터 형식
FloatType() 단정밀도 부동 소수 자릿수를 나타내는 Float 데이터 형식
Geography (Databricks만 해당) 지리 데이터 형식
Geometry (Databricks만 해당) 기하 데이터 형식
IntegerType() 부가된 32비트 정수를 나타내는 Int 데이터 형식
LongType() Long 데이터 타입, 부호 있는 64비트 정수
MapType(keyType, valueType[, valueContainsNull]) 맵 데이터 형식
NullType() Null 형식
ShortType() 부호 있는 16비트 정수를 나타내는 Short 데이터 형식
StringType([collation]) 문자열 데이터 타입
StructField(name, dataType[, nullable, metadata]) StructType의 필드
StructType([fields]) 구조체 형식( StructField 목록으로 구성)
TimestampType() 타임스탬프(datetime.datetime) 데이터 형식
TimestampNTZType() 표준 시간대 정보가 없는 타임스탬프(datetime.datetime) 데이터 형식
VarcharType(length) Varchar 데이터 형식
VariantType() 반구조화된 값을 나타내는 Variant 데이터 형식
YearMonthIntervalType([startField, endField]) YearMonthIntervalType은 SQL 표준의 연도-월 간격을 나타냅니다.