Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Lädt Daten aus einer Datenquelle und gibt sie als ein DataFrame.
Syntax
load(path=None, format=None, schema=None, **options)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
path |
str oder list, optional | Mindestens ein Pfad in einer dateisystemgestützten Datenquelle. |
format |
str, optional | Das Format der Datenquelle. Wird standardmäßig auf 'parquet' festgelegt. |
schema |
StructType oder str, optional | Das Eingabeschema als StructType Objekt oder DDL-formatierte Zeichenfolge (z. B 'col0 INT, col1 DOUBLE'. ). |
**options |
Wörterbuch | Zusätzliche Zeichenfolgenoptionen. |
Rückkehr
DataFrame
Beispiele
Laden Sie eine CSV-Datei mit formatieren, schema und optionen angegeben.
import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.option("header", True).mode("overwrite").format("csv").save(d)
df = spark.read.load(
d, schema=df.schema, format="csv", nullValue="Alice", header=True)
df.printSchema()
# root
# |-- age: long (nullable = true)
# |-- name: string (nullable = true)
df.show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+