xml (DataFrameReader)

Carrega um ficheiro XML e devolve o resultado como um DataFramearquivo . Se schema não for especificado, esta função lê a entrada uma vez para determinar o esquema de entrada.

Sintaxe

xml(path, schema=None, **options)

Parâmetros

Parâmetro Tipo Descrição
path str, list ou RDD Um ou mais caminhos de entrada, ou um RDD de strings que armazenam linhas XML.
schema StructType ou str, opcional Um esquema de entrada opcional como StructType objeto ou uma cadeia formatada em DDL (por exemplo, 'col0 INT, col1 DOUBLE').

Devoluções

DataFrame

Exemplos

Escreve um DataFrame num ficheiro XML e lê-o.

import tempfile
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").option("rowTag", "person").format("xml").save(d)

    spark.read.option("rowTag", "person").xml(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+