Condividi tramite


xml (DataFrameReader)

Carica un file XML e restituisce il risultato come .DataFrame Se schema non viene specificato, questa funzione legge l'input una volta per determinare lo schema di input.

Sintassi

xml(path, schema=None, **options)

Parametri

Parametro Tipo Descrizione
path str, list o RDD Uno o più percorsi di input o rdd di stringhe che archiviano righe XML.
schema StructType o str, facoltativo Schema di input facoltativo come StructType oggetto o stringa in formato DDL ,ad esempio 'col0 INT, col1 DOUBLE'.

Restituzioni

DataFrame

Examples

Scrivere un dataframe in un file XML e leggerlo di nuovo.

import tempfile
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").option("rowTag", "person").format("xml").save(d)

    spark.read.option("rowTag", "person").xml(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+