データ ソースからデータを読み込み、 DataFrameとして返します。
構文
load(path=None, format=None, schema=None, **options)
パラメーター
| パラメーター | タイプ | 説明 |
|---|---|---|
path |
str または list、省略可能 | ファイル システムベースのデータ ソース内の 1 つ以上のパス。 |
format |
str、省略可能 | データ ソースの形式。 既定値は 'parquet' です。 |
schema |
StructType または str(省略可能) |
StructType オブジェクトまたは DDL 形式の文字列 (たとえば、'col0 INT, col1 DOUBLE') としての入力スキーマ。 |
**options |
辞書 | 追加の文字列オプション。 |
返品
DataFrame
例示
形式、スキーマ、およびオプションを指定して CSV ファイルを読み込みます。
import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.option("header", True).mode("overwrite").format("csv").save(d)
df = spark.read.load(
d, schema=df.schema, format="csv", nullValue="Alice", header=True)
df.printSchema()
# root
# |-- age: long (nullable = true)
# |-- name: string (nullable = true)
df.show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+