XML (DataFrameReader)

Lädt eine XML-Datei und gibt das Ergebnis als ein DataFrame. Wenn schema nicht angegeben, liest diese Funktion die Eingabe einmal, um das Eingabeschema zu bestimmen.

Syntax

xml(path, schema=None, **options)

Parameter

Parameter Typ Beschreibung
path str, list oder RDD Mindestens ein Eingabepfad oder eine RDD von Zeichenfolgen, die XML-Zeilen speichern.
schema StructType oder str, optional Ein optionales Eingabeschema als StructType Objekt oder eine DDL-formatierte Zeichenfolge (z. B 'col0 INT, col1 DOUBLE'. ).

Rückkehr

DataFrame

Beispiele

Schreiben Sie einen DataFrame in eine XML-Datei, und lesen Sie es zurück.

import tempfile
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").option("rowTag", "person").format("xml").save(d)

    spark.read.option("rowTag", "person").xml(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+