Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Schreibt einen Iterator von PyArrow RecordBatch -Objekten in die Spüle.
Diese Methode wird einmal für jeden Executor aufgerufen, um Daten in die Datenquelle zu schreiben. Sie akzeptiert einen Iterator von PyArrow-Objekten RecordBatch und gibt eine einzelne Zeile zurück, die eine Commit-Nachricht darstellt, oder None wenn keine Commit-Nachricht vorhanden ist.
Der Treiber sammelt commit-Nachrichten( falls vorhanden) von allen Executoren und übergibt sie an die commit() Methode, wenn alle Aufgaben erfolgreich ausgeführt werden. Wenn eine Aufgabe fehlschlägt, wird die abort() Methode mit den gesammelten Commit-Nachrichten aufgerufen.
Syntax
write(iterator: Iterator[RecordBatch])
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
iterator |
Iterator[RecordBatch] | Ein Iterator von PyArrow-Objekten RecordBatch , die die Eingabedaten darstellen. |
Rückkehr
WriterCommitMessage
Eine serialisierbare Commitnachricht.
Beispiele
from dataclasses import dataclass
@dataclass
class MyCommitMessage(WriterCommitMessage):
num_rows: int
def write(self, iterator: Iterator["RecordBatch"]) -> "WriterCommitMessage":
total_rows = 0
for batch in iterator:
total_rows += len(batch)
return MyCommitMessage(num_rows=total_rows)