Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Verwenden Sie das Skript Python, um eine Python Datei auszuführen.
Konfigurieren einer Python Skriptaufgabe
Bevor Sie beginnen, müssen Sie Ihr Python Skript an einen Speicherort hochladen, auf den der Benutzer zugreifen kann, der den Auftrag konfiguriert. Databricks empfiehlt die Verwendung von Arbeitsbereichsdateien für Python Skripts. Weitere Informationen finden Sie unter Was sind Arbeitsbereichsdateien?.
Note
Die Job-Benutzeroberfläche zeigt Optionen dynamisch basierend auf anderen konfigurierten Einstellungen an.
Databricks empfiehlt, Code oder Daten nicht im DBFS-Stammverzeichnis oder über Mounts zu speichern. Stattdessen können Sie Python Skripts zu Arbeitsbereichsdateien oder Volumes migrieren oder URIs verwenden, um auf Cloudobjektspeicher zuzugreifen.
So beginnen Sie den Ablauf zum Konfigurieren einer Python script-Aufgabe:
- Navigieren Sie zur Registerkarte Aufgaben in der Benutzeroberfläche „Jobs“.
- Klicken Sie auf "Aufgabe hinzufügen".
- Geben Sie einen Namen in das Feld " Vorgangsname " ein.
- Wählen Sie im Dropdownmenü Type
Python scriptaus.
Konfigurieren der Quelle
Wählen Sie im Dropdownmenü Source einen Speicherort für das Python Skript aus, indem Sie eine der folgenden Optionen verwenden.
Workspace
Verwenden Sie Workspace, um ein mithilfe von Arbeitsbereichsdateien gespeichertes Python Skript zu konfigurieren.
- Klicken Sie auf das Feld Pfad. Das Dialogfeld Select Python File wird angezeigt.
- Navigieren Sie zum skript Python, klicken Sie, um die Datei hervorzuheben, und klicken Sie auf Confirm.
Note
Mit dieser Option können Sie eine Aufgabe in einem Python Skript konfigurieren, das in einem Git-Ordner "Databricks" gespeichert ist. Databricks empfiehlt die Verwendung der Git-Anbieter-Option und eines Remote-Git-Repositorys zur Versionsverwaltung von Assets, die in Jobs geplant werden.
DBFS/ADLS
Verwenden Sie DBFS/ADLS, um ein in einem Volume, einem Cloudobjektspeicherort oder dem DBFS-Stamm gespeichertes Python Skript zu konfigurieren.
Databricks empfiehlt, Python Skripts in Unity Catalog-Volumes oder Cloudobjektspeicher zu speichern.
Geben Sie im Feld Path den URI für Ihr Python Skript ein. Zum Beispiel: dbfs:/path/to/script.py oder abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py.
Git-Anbieter
Verwenden Sie Git-Anbieter, um ein in einem Remote-Git-Repository gespeichertes Python Skript zu konfigurieren.
Die von der Benutzeroberfläche angezeigten Optionen hängen davon ab, ob Sie bereits einen Git-Anbieter an anderer Stelle konfiguriert haben. Nur ein Git-Remote-Repository kann für alle Aufgaben in einem Job verwendet werden. Siehe Verwenden von Git mit Lakeflow-Aufträgen.
Das Feld Pfad wird angezeigt, nachdem Sie eine Git-Referenz konfiguriert haben.
Geben Sie den relativen Pfad für Ihr Python Skript ein, z. B. etl/bronze/ingest.py.
Important
Wenn Sie den relativen Pfad eingeben, beginnen Sie nicht mit / oder ./. Wenn beispielsweise der absolute Pfad für den Python Code, auf den Sie zugreifen möchten, /etl/bronze/ingest.py ist, geben Sie etl/bronze/ingest.py in das Feld Path ein.
Konfigurieren von Rechenressourcen und abhängigen Bibliotheken
- Verwenden Sie Compute, um einen Cluster auszuwählen oder zu konfigurieren, der die Logik in Ihrem Skript unterstützt.
- Wenn Sie
Serverless-Compute verwenden, verwenden Sie das Feld Umgebung und Bibliotheken, um eine neue Umgebung auszuwählen, zu bearbeiten oder hinzuzufügen. Siehe Konfigurieren der serverlosen Umgebung. - Klicken Sie für alle anderen Rechnerkonfigurationen unter Abhängige Bibliotheken auf + Hinzufügen. Der Dialog Abhängige Bibliothek hinzufügen wird angezeigt.
- Sie können eine vorhandene Bibliothek auswählen oder eine neue Bibliothek hochladen.
- Sie können nur Bibliotheken verwenden, die an einem Speicherort gespeichert sind, der von Ihren Compute-Konfigurationen unterstützt wird. Weitere Informationen zu Python-Bibliotheksunterstützung.
- Jede Bibliotheksquelle verfügt über einen anderen Flow zum Auswählen oder Hochladen einer Bibliothek. Siehe Installieren von Bibliotheken.
Abschließen der Job-Konfiguration
- (Optional) Konfigurieren Sie Parameters als Liste der Zeichenfolgen, die als CLI-Argumente an das skript Python übergeben werden. Weitere Informationen finden Sie unter Konfigurieren von Aufgabenparametern.
- Klicken Sie auf Aufgabe speichern.