xml (DataFrameReader)

XML ファイルを読み込み、結果を DataFrameとして返します。 schemaが指定されていない場合、この関数は入力を 1 回読み取って入力スキーマを決定します。

構文

xml(path, schema=None, **options)

パラメーター

パラメーター タイプ 説明
path str、list、または RDD 1 つ以上の入力パス、または XML 行を格納する文字列の RDD。
schema StructType または str(省略可能) StructType オブジェクトまたは DDL 形式の文字列 (たとえば、'col0 INT, col1 DOUBLE') としての省略可能な入力スキーマ。

返品

DataFrame

例示

DataFrame を XML ファイルに書き込み、読み戻します。

import tempfile
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").option("rowTag", "person").format("xml").save(d)

    spark.read.option("rowTag", "person").xml(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+