Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Lädt Textdateien und gibt ein DataFrame Schema zurück, dessen Schema mit einer Zeichenfolgenspalte mit dem Namen beginnt value, gefolgt von partitionierten Spalten, falls vorhanden. Textdateien müssen als UTF-8 codiert werden. Standardmäßig ist jede Zeile in der Textdatei eine neue Zeile im resultierenden DataFrame.
Syntax
text(paths, wholetext=False, lineSep=None, **options)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
paths |
str oder list | Mindestens ein Eingabepfad. |
wholetext |
bool, optional | Wenn True, lesen Sie jede Datei als einzelne Zeile. Der Standardwert ist False. |
lineSep |
str, optional | Das zu verwendende Zeilentrennzeichen. Der Standardwert ist '\n', oder '\r''\r\n'. |
Rückkehr
DataFrame
Beispiele
Schreiben Sie einen DataFrame in eine Textdatei, und lesen Sie ihn zurück.
import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
df.write.mode("overwrite").format("text").save(d)
spark.read.schema(df.schema).text(d).sort("alphabets").show()
# +---------+
# |alphabets|
# +---------+
# | a|
# | b|
# | c|
# +---------+