Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Restituisce un nuovo dataframe in cui ogni riga viene riconciliata in modo che corrisponda allo schema specificato.
Sintassi
to(schema: StructType)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
schema |
StructType (tipo di struttura) | Schema specificato. |
Restituzioni
DataFrame: dataframe riconciliato.
Note
- Riordinare le colonne e/o i campi interni in base al nome in modo che corrisponda allo schema specificato.
- Project colonne e/o campi interni non necessari per lo schema specificato. Le colonne e/o i campi interni mancanti (presenti nello schema specificato ma non nel dataframe di input) comportano errori.
- Eseguire il cast delle colonne e/o dei campi interni in modo che corrispondano ai tipi di dati nello schema specificato, se i tipi sono compatibili, ad esempio numerici a numerici (errore in caso di overflow), ma non stringa a int.
- Trascinare i metadati dallo schema specificato, mentre le colonne e/o i campi interni mantengono i propri metadati se non vengono sovrascritti dallo schema specificato.
- Esito negativo se il supporto dei valori Null non è compatibile. Ad esempio, la colonna e/o il campo interno sono nullable, ma lo schema specificato richiede che non siano nullable.
Supporta Spark Connect.
Examples
from pyspark.sql.types import StructField, StringType
df = spark.createDataFrame([("a", 1)], ["i", "j"])
df.schema
# StructType([StructField('i', StringType(), True), StructField('j', LongType(), True)])
schema = StructType([StructField("j", StringType()), StructField("i", StringType())])
df2 = df.to(schema)
df2.schema
# StructType([StructField('j', StringType(), True), StructField('i', StringType(), True)])
df2.show()
# +---+---+
# | j| i|
# +---+---+
# | 1| a|
# +---+---+