Pythonでバリアント型 (Variant) の値を表すクラス。
Databricks Runtime 15.2 で追加されました
構文
from pyspark.sql.types import VariantVal
VariantVal(value, metadata)
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
value |
バイト | Variant の値コンポーネントを表すバイト。 |
metadata |
バイト | Variant のメタデータ コンポーネントを表すバイト。 |
メソッド
| メソッド | 説明 |
|---|---|
toPython() |
VariantVal をPythonデータ構造に変換します。 |
toJson() |
VariantVal を JSON 文字列に変換します。 ゾーン ID は、タイムスタンプを出力するタイム ゾーンを表します。 既定値は UTC です。 有効なゾーン ID の一覧は、zoneinfo モジュールをインポートし、 zoneinfo.available_timezones()を実行することで確認できます。 |
parseJson() |
VariantVal を、Pythonデータ型の入れ子になったPython オブジェクトに変換します。 |
例示
from pyspark.sql import functions as sf
df = spark.createDataFrame([ {'json': '''{ "a" : 1 }'''} ])
v = df.select(sf.parse_json(df.json).alias("var")).head().var
v.toPython()
# {'a': 1}
v.toJson()
# '{"a":1}'