DataStreamWriter

ストリーミング DataFrame を外部ストレージシステム (ファイルシステムやキー値ストアなど) に書き込むためのインターフェイス。 df.writeStreamを使用してこれにアクセスします。

構文

# Access through DataFrame
df.writeStream

メソッド

メソッド	説明
`outputMode(outputMode)`	ストリーミング DataFrame のデータをシンクに書き込む方法を指定します。オプションは `append`、`complete`、`update` です。
`format(source)`	出力データソースの形式を指定します。
`option(key, value)`	基になるデータソースの出力オプションを追加します。
`options(**options)`	基になるデータソースの複数の出力オプションを追加します。
`partitionBy(*cols)`	ファイルシステム上の指定された列で出力をパーティション分割します。
`clusterBy(*cols)`	指定された列で出力をクラスター化します。
`queryName(queryName)`	ストリーミングクエリの名前を指定します。
`trigger(**kwargs)`	ストリーミングクエリ実行のトリガーを設定します。
`foreach(f)`	指定された関数またはオブジェクトによって処理されるストリーミングクエリの出力を設定します。
`foreachBatch(func)`	指定された関数によって処理される各マイクロバッチの出力を設定します。
`start(path)`	ストリーミングクエリの実行を開始し、 `StreamingQuery` オブジェクトを返します。
`table(tableName)`	`toTable()` の別名。指定したテーブルにデータを書き込み、 `StreamingQuery` オブジェクトを返します。
`toTable(tableName)`	ストリーミングクエリの実行を開始し、指定されたテーブルに継続的に結果を出力します。

例示

レートストリームを読み込み、変換を適用し、コンソールに書き込み、3 秒後に停止します。

import time
df = spark.readStream.format("rate").load()
df = df.selectExpr("value % 3 as v")
q = df.writeStream.format("console").start()
time.sleep(3)
q.stop()

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-19

DataStreamWriter

構文

メソッド

例示

フィードバック

その他のリソース