Condividi tramite


text (DataFrameReader)

Carica i file di testo e restituisce un DataFrame oggetto il cui schema inizia con una colonna stringa denominata value, seguita da colonne partizionate, se presenti. I file di testo devono essere codificati come UTF-8. Per impostazione predefinita, ogni riga nel file di testo è una nuova riga nel dataframe risultante.

Sintassi

text(paths, wholetext=False, lineSep=None, **options)

Parametri

Parametro Tipo Descrizione
paths str o list Uno o più percorsi di input.
wholetext bool, facoltativo Se True, leggere ogni file come singola riga. Il valore predefinito è False.
lineSep str, facoltativo Separatore di riga da utilizzare. Il valore predefinito è '\n', '\r'o '\r\n'.

Restituzioni

DataFrame

Examples

Scrivere un dataframe in un file di testo e leggerlo di nuovo.

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+