Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Restituisce uno snapshot ottimale dei file che compongono questo dataframe. Questo metodo chiede semplicemente a ogni componente BaseRelation per i rispettivi file e accetta l'unione di tutti i risultati. A seconda delle relazioni di origine, questo potrebbe non trovare tutti i file di input. I duplicati vengono rimossi.
Sintassi
inputFiles()
Restituzioni
list: elenco di percorsi di file.
Examples
import os
import tempfile
with tempfile.TemporaryDirectory(prefix="inputFiles") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).repartition(1).write.json(d, mode="overwrite")
df = spark.read.format("json").load(d)
if os.environ.get('PYTEST_DBCONNECT_MODE') is None:
len(df.inputFiles())
else:
1 # dbconnect doesn't support inputFiles.
# 1