inputFiles

この DataFrame を構成するファイルのベスト エフォート スナップショットを返します。 このメソッドは、各構成要素の BaseRelation にそれぞれのファイルを要求し、すべての結果の和集合を受け取ります。 ソースの関係によっては、すべての入力ファイルが見つからない場合があります。 重複が削除されます。

構文

inputFiles()

返品

list: ファイル パスの一覧。

例示

import os
import tempfile
with tempfile.TemporaryDirectory(prefix="inputFiles") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).repartition(1).write.json(d, mode="overwrite")

    df = spark.read.format("json").load(d)

    if os.environ.get('PYTEST_DBCONNECT_MODE') is None:
        len(df.inputFiles())
    else:
        1  # dbconnect doesn't support inputFiles.
# 1