Condividi tramite


schema

Specifica lo schema di input. Alcune origini dati( ad esempio JSON) possono dedurre automaticamente lo schema di input dai dati. Specificando lo schema qui, l'origine dati sottostante può ignorare il passaggio di inferenza dello schema, che accelera il caricamento dei dati.

Sintassi

schema(schema)

Parametri

Parametro Tipo Descrizione
schema StructType o str Oggetto StructType o stringa in formato DDL , ad esempio 'col0 INT, col1 DOUBLE'.

Restituzioni

DataFrameReader

Examples

Specificare lo schema durante la lettura di un file CSV.

import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
    spark.read.schema("col0 INT, col1 DOUBLE").format("csv").load(d).printSchema()
    # root
    #  |-- col0: integer (nullable = true)
    #  |-- col1: double (nullable = true)