Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Lädt einen CSV-Dateidatenstrom und gibt das Ergebnis als DataFrame zurück. Wenn inferSchema diese Option aktiviert ist, durchläuft die Funktion die Eingabe einmal, um das Schema zu bestimmen. Um diesen Durchlauf zu vermeiden, deaktivieren inferSchema oder geben Sie das Schema explizit mithilfe schemavon .
Syntax
csv(path, schema=None, **options)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
path |
str | Pfad für die CSV-Eingabe. |
schema |
StructType oder str, optional | Schema als StructType- oder DDL-formatierte Zeichenfolge (z. B col0 INT, col1 DOUBLE. ). |
Rückkehr
DataFrame
Beispiele
Laden eines Datenstroms aus einer temporären CSV-Datei:
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="csv") as d:
spark.createDataFrame([(1, "2"),]).write.mode("overwrite").format("csv").save(d)
q = spark.readStream.schema(
"col0 INT, col1 STRING"
).format("csv").load(d).writeStream.format("console").start()
time.sleep(3)
q.stop()