Freigeben über


text (DataFrameReader)

Lädt Textdateien und gibt ein DataFrame Schema zurück, dessen Schema mit einer Zeichenfolgenspalte mit dem Namen beginnt value, gefolgt von partitionierten Spalten, falls vorhanden. Textdateien müssen als UTF-8 codiert werden. Standardmäßig ist jede Zeile in der Textdatei eine neue Zeile im resultierenden DataFrame.

Syntax

text(paths, wholetext=False, lineSep=None, **options)

Parameter

Parameter Typ Beschreibung
paths str oder list Mindestens ein Eingabepfad.
wholetext bool, optional Wenn True, lesen Sie jede Datei als einzelne Zeile. Der Standardwert ist False.
lineSep str, optional Das zu verwendende Zeilentrennzeichen. Der Standardwert ist '\n', oder '\r''\r\n'.

Rückkehr

DataFrame

Beispiele

Schreiben Sie einen DataFrame in eine Textdatei, und lesen Sie ihn zurück.

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+