Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Carica un flusso di file JSON e restituisce i risultati come dataframe. Le righe JSON (JSON delimitato da nuova riga) sono supportate per impostazione predefinita. Per JSON con un record per ogni file, impostare l'opzione multiLine su true. Se schema non viene specificato, lo schema di input viene dedotto dai dati.
Sintassi
json(path, schema=None, **options)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
path |
str | Percorso del set di dati JSON. |
schema |
StructType o str, facoltativo | Schema come stringa in formato StructType o DDL (ad esempio, col0 INT, col1 DOUBLE). |
Restituzioni
DataFrame
Examples
Caricare un flusso da un file JSON temporaneo:
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="json") as d:
spark.createDataFrame(
[(100, "Hyukjin Kwon"),], ["age", "name"]
).write.mode("overwrite").format("json").save(d)
q = spark.readStream.schema(
"age INT, name STRING"
).json(d).writeStream.format("console").start()
time.sleep(3)
q.stop()