json (DataStreamReader)

Carica un flusso di file JSON e restituisce i risultati come dataframe. Le righe JSON (JSON delimitato da nuova riga) sono supportate per impostazione predefinita. Per JSON con un record per ogni file, impostare l'opzione multiLine su true. Se schema non viene specificato, lo schema di input viene dedotto dai dati.

Sintassi

json(path, schema=None, **options)

Parametri

Parametro	Tipo	Descrizione
`path`	str	Percorso del set di dati JSON.
`schema`	StructType o str, facoltativo	Schema come stringa in formato StructType o DDL (ad esempio, `col0 INT, col1 DOUBLE`).

Restituzioni

DataFrame

Examples

Caricare un flusso da un file JSON temporaneo:

import tempfile
import time
with tempfile.TemporaryDirectory(prefix="json") as d:
    spark.createDataFrame(
        [(100, "Hyukjin Kwon"),], ["age", "name"]
    ).write.mode("overwrite").format("json").save(d)
    q = spark.readStream.schema(
        "age INT, name STRING"
    ).json(d).writeStream.format("console").start()
    time.sleep(3)
    q.stop()

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-19