Condividi tramite


csv (DataFrameReader)

Carica un file CSV e restituisce il risultato come .DataFrame Se inferSchema è abilitato, questa funzione legge l'input una sola volta per determinare lo schema. Per evitare questo problema, disabilitare inferSchema o specificare lo schema in modo esplicito usando schema.

Sintassi

csv(path, schema=None, **options)

Parametri

Parametro Tipo Descrizione
path str o list Uno o più percorsi di input o un RDD di stringhe che archiviano righe CSV.
schema StructType o str, facoltativo Schema di input facoltativo come StructType oggetto o stringa in formato DDL ,ad esempio 'col0 INT, col1 DOUBLE'.

Restituzioni

DataFrame

Examples

Scrivere un dataframe in un file CSV e leggerlo di nuovo.

import tempfile
with tempfile.TemporaryDirectory(prefix="csv") as d:
    df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
    df.write.mode("overwrite").format("csv").save(d)

    spark.read.csv(d, schema=df.schema, nullValue="Alice").show()
    # +---+----+
    # |age|name|
    # +---+----+
    # |100|NULL|
    # +---+----+