Freigeben über


make_valid_utf8-Funktion

Gilt für:mit Häkchen markiert ja Databricks SQL mit Häkchen markiert ja Databricks Runtime 15.4 und höher

Gibt eine Zeichenfolge zurück, in der alle ungültigen UTF-8-Bytesequenzen in strExpr, durch das Unicode-Ersetzungszeichen (U+FFFD) ersetzt werden.

Syntax

make_valid_utf8(strExpr)

Argumente

  • strExpr: Ein STRING-Ausdruck.

Rückgabe

A STRING, bestehend aus einer gültigen UTF-8-Bytesequenz.

Beispiele

– Simple example taking a valid string as input.
> SELECT make_valid_utf8('Spark')
  Spark

– Simple example taking a valid collated string as input.
> SELECT make_valid_utf8('SQL' COLLATE UTF8_LCASE)
  SQL

– Simple example taking a valid hexadecimal string as input.
> SELECT make_valid_utf8(x'61')
  a

– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT make_valid_utf8(x'80')
  �

- Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT make_valid_utf8(x'61C262')
  a�b