Condividi tramite


toArrow

Restituisce il contenuto di questo dataframe come PyArrow pyarrow.Table.

Aggiunta in Databricks Runtime 15.3

Sintassi

toArrow()

Restituzioni

pyarrow.Table

Note

Questo metodo deve essere usato solo se si prevede che il pyArrow pyarrow.Table risultante sia di piccole dimensioni, poiché tutti i dati vengono caricati nella memoria del driver.

Questa opzione è disponibile solo se PyArrow è installato e disponibile.

Questa API è un'API per sviluppatori.

Examples

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.coalesce(1).toArrow()
# pyarrow.Table
# age: int64
# name: string
# ----
# age: [[2,5]]
# name: [["Alice","Bob"]]