Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Devolve um instantâneo de melhor esforço dos ficheiros que compõem este DataFrame. Este método simplesmente pede a cada BaseRelation constituente os seus respetivos ficheiros e faz a união de todos os resultados. Dependendo das relações de origem, isto pode não encontrar todos os ficheiros de entrada. Os duplicados são removidos.
Sintaxe
inputFiles()
Devoluções
lista: Lista de caminhos de ficheiros.
Exemplos
import os
import tempfile
with tempfile.TemporaryDirectory(prefix="inputFiles") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).repartition(1).write.json(d, mode="overwrite")
df = spark.read.format("json").load(d)
if os.environ.get('PYTEST_DBCONNECT_MODE') is None:
len(df.inputFiles())
else:
1 # dbconnect doesn't support inputFiles.
# 1