csv (DataStreamReader)

Lädt einen CSV-Dateidatenstrom und gibt das Ergebnis als DataFrame zurück. Wenn inferSchema diese Option aktiviert ist, durchläuft die Funktion die Eingabe einmal, um das Schema zu bestimmen. Um diesen Durchlauf zu vermeiden, deaktivieren inferSchema oder geben Sie das Schema explizit mithilfe schemavon .

Syntax

csv(path, schema=None, **options)

Parameter

Parameter	Typ	Beschreibung
`path`	str	Pfad für die CSV-Eingabe.
`schema`	StructType oder str, optional	Schema als StructType- oder DDL-formatierte Zeichenfolge (z. B `col0 INT, col1 DOUBLE`. ).

Rückkehr

DataFrame

Beispiele

Laden eines Datenstroms aus einer temporären CSV-Datei:

import tempfile
import time
with tempfile.TemporaryDirectory(prefix="csv") as d:
    spark.createDataFrame([(1, "2"),]).write.mode("overwrite").format("csv").save(d)
    q = spark.readStream.schema(
        "col0 INT, col1 STRING"
    ).format("csv").load(d).writeStream.format("console").start()
    time.sleep(3)
    q.stop()

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-19