Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Carica i file di testo e restituisce un DataFrame oggetto il cui schema inizia con una colonna stringa denominata value, seguita da colonne partizionate, se presenti. I file di testo devono essere codificati come UTF-8. Per impostazione predefinita, ogni riga nel file di testo è una nuova riga nel dataframe risultante.
Sintassi
text(paths, wholetext=False, lineSep=None, **options)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
paths |
str o list | Uno o più percorsi di input. |
wholetext |
bool, facoltativo | Se True, leggere ogni file come singola riga. Il valore predefinito è False. |
lineSep |
str, facoltativo | Separatore di riga da utilizzare. Il valore predefinito è '\n', '\r'o '\r\n'. |
Restituzioni
DataFrame
Examples
Scrivere un dataframe in un file di testo e leggerlo di nuovo.
import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
df.write.mode("overwrite").format("text").save(d)
spark.read.schema(df.schema).text(d).sort("alphabets").show()
# +---------+
# |alphabets|
# +---------+
# | a|
# | b|
# | c|
# +---------+