Udostępnij przez


Typy danych PySpark

Ta strona zawiera listę typów danych PySpark dostępnych w usłudze Databricks z linkami do odpowiedniej dokumentacji referencyjnej.

Typ danych Description
ArrayType(elementType[, containsNull]) Typ danych tablicy
BinaryType() Typ danych binarnych (tablica bajtów)
BooleanType() Typ danych boole'owski
ByteType() Typ danych bajtów reprezentujący podpisane 8-bitowe liczby całkowite
CalendarIntervalType() Interwały kalendarza
CharType(length) Typ danych char
DataType() Klasa podstawowa dla typów danych
DateType() Typ danych Date (datetime.date)
DayTimeIntervalType([startField, endField]) DayTimeIntervalType (datetime.timedelta)
DecimalType([precision, scale]) Typ danych dziesiętny (decimal.Decimal)
DoubleType() Typ danych double, reprezentujący liczby zmiennoprzecinkowe o podwójnej precyzji
FloatType() Typ danych zmiennoprzecinkowych reprezentujący liczby zmiennoprzecinkowe o pojedynczej precyzji
Geography (Dotyczy tylko Databricks) Typ danych geografii
Geometry (Dotyczy tylko Databricks) Typ danych geometria
IntegerType() Typ danych int reprezentujący podpisane 32-bitowe liczby całkowite
LongType() Długi typ danych reprezentujący podpisane 64-bitowe liczby całkowite
MapType(keyType, valueType[, valueContainsNull]) Typ danych mapy
NullType() Typ null
ShortType() Krótki typ danych reprezentujący podpisane 16-bitowe liczby całkowite
StringType([collation]) ciągowy typ danych
StructField(name, dataType[, nullable, metadata]) Pole w StructType
StructType([fields]) Typ struktury składający się z listy obiektu StructField
TimestampType() Typ danych sygnatury czasowej (datetime.datetime)
TimestampNTZType() Typ danych sygnatury czasowej (datetime.datetime) bez informacji o strefie czasowej
VarcharType(length) Typ danych Varchar
VariantType() Typ danych Variant, reprezentujący częściowo ustrukturyzowane wartości
YearMonthIntervalType([startField, endField]) YearMonthIntervalType, reprezentuje interwały rok-miesiąc dla standardu SQL