Laden

Lädt Daten aus einer Datenquelle und gibt sie als ein DataFrame.

Syntax

load(path=None, format=None, schema=None, **options)

Parameter

Parameter Typ Beschreibung
path str oder list, optional Mindestens ein Pfad in einer dateisystemgestützten Datenquelle.
format str, optional Das Format der Datenquelle. Wird standardmäßig auf 'parquet' festgelegt.
schema StructType oder str, optional Das Eingabeschema als StructType Objekt oder DDL-formatierte Zeichenfolge (z. B 'col0 INT, col1 DOUBLE'. ).
**options Wörterbuch Zusätzliche Zeichenfolgenoptionen.

Rückkehr

DataFrame

Beispiele

Laden Sie eine CSV-Datei mit formatieren, schema und optionen angegeben.

import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
    df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
    df.write.option("header", True).mode("overwrite").format("csv").save(d)

    df = spark.read.load(
        d, schema=df.schema, format="csv", nullValue="Alice", header=True)
    df.printSchema()
    # root
    #  |-- age: long (nullable = true)
    #  |-- name: string (nullable = true)
    df.show()
    # +---+----+
    # |age|name|
    # +---+----+
    # |100|NULL|
    # +---+----+