text (DataFrameReader)

Lädt Textdateien und gibt ein DataFrame Schema zurück, dessen Schema mit einer Zeichenfolgenspalte mit dem Namen beginnt value, gefolgt von partitionierten Spalten, falls vorhanden. Textdateien müssen als UTF-8 codiert werden. Standardmäßig ist jede Zeile in der Textdatei eine neue Zeile im resultierenden DataFrame.

Syntax

text(paths, wholetext=False, lineSep=None, **options)

Parameter

Parameter	Typ	Beschreibung
`paths`	str oder list	Mindestens ein Eingabepfad.
`wholetext`	bool, optional	Wenn `True`, lesen Sie jede Datei als einzelne Zeile. Der Standardwert ist `False`.
`lineSep`	str, optional	Das zu verwendende Zeilentrennzeichen. Der Standardwert ist `'\n'`, oder `'\r''\r\n'`.

Rückkehr

DataFrame

Beispiele

Schreiben Sie einen DataFrame in eine Textdatei, und lesen Sie ihn zurück.

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-22