Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Carica i dati da un'origine dati e lo restituisce come .DataFrame
Sintassi
load(path=None, format=None, schema=None, **options)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
path |
str o list, facoltativo | Uno o più percorsi in un'origine dati supportata dal file system. |
format |
str, facoltativo | Formato dell'origine dati. Il valore predefinito è 'parquet'. |
schema |
StructType o str, facoltativo | Schema di input come StructType oggetto o stringa in formato DDL , ad esempio 'col0 INT, col1 DOUBLE'. |
**options |
dizionario | Opzioni di stringa aggiuntive. |
Restituzioni
DataFrame
Examples
Caricare un file CSV con formato, schema e opzioni specificate.
import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.option("header", True).mode("overwrite").format("csv").save(d)
df = spark.read.load(
d, schema=df.schema, format="csv", nullValue="Alice", header=True)
df.printSchema()
# root
# |-- age: long (nullable = true)
# |-- name: string (nullable = true)
df.show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+