Freigeben über


Databricks-Befehlszeilenschnittstelle

Hinweis

Diese Informationen gelten für Databricks CLI-Versionen 0.205 und höher. Die Databricks CLI befindet sich in der öffentlichen Vorschau.

Die Verwendung von Databricks CLI unterliegt der Datenbricks-Lizenz - und Databricks-Datenschutzerklärung, einschließlich der Bestimmungen zu Nutzungsdaten.

Mit der Databricks CLI (Befehlszeilenschnittstelle) können Sie mit der Azure Databricks Plattform über Ihr lokales Terminal oder Automatisierungsskript interagieren. Sie können Databricks CLI-Befehle auch in einem Databricks-Arbeitsbereich mithilfe des Webterminals ausführen. Siehe Run shell commands in Azure Databricks web terminal.

Informationen zum Installieren und Konfigurieren der Authentifizierung für die Databricks CLI finden Sie unter Installieren oder Aktualisieren der Databricks CLI und Authentifizierung für die Databricks CLI.

Tipp

Die Databricks CLI-Quelle ist im databricks/cli GitHub Repository öffentlich verfügbar.

Informationen für Benutzer*innen der Legacy-Databricks-CLI

  • Databricks plant keinen Support und keine Arbeiten an neuen Features für die Legacy-Databricks-CLI.
  • Weitere Informationen zur älteren Databricks CLI finden Sie unter Legacy Databricks CLI.
  • Informationen zum Migrieren der Databricks CLI-Version 0.18 oder niedriger zur Databricks CLI-Version 0.205 oder höher finden Sie unter Databricks CLI-Migration.

Wie funktioniert die Databricks-CLI?

Die CLI umschließt die Databricks-REST-API, die Endpunkte zum Ändern oder Anfordern von Informationen zu Azure Databricks Konto- und Arbeitsbereichsobjekten bereitstellt. Siehe Azure Databricks REST-API-Referenz.

Wenn Sie beispielsweise Informationen zu einem einzelnen Cluster in einem Arbeitsbereich drucken möchten, führen Sie die CLI wie folgt aus:

databricks clusters get 1234-567890-a12bcde3

Bei curl lautet der entsprechende Vorgang wie folgt:

curl --request GET "https://${DATABRICKS_HOST}/api/2.0/clusters/get" \
     --header "Authorization: Bearer ${DATABRICKS_TOKEN}" \
     --data '{ "cluster_id": "1234-567890-a12bcde3" }'

Beispiel: Erstellen eines Azure Databricks Auftrags

Im folgenden Beispiel wird die CLI verwendet, um einen Azure Databricks Auftrag zu erstellen. Dieser Job enthält einen einzelnen Arbeitsschritt. Diese Aufgabe führt das angegebene Azure Databricks Notizbuch aus. Dieses Notebook verfügt über eine Abhängigkeit von einer bestimmten Version des PyPI-Pakets namens wheel. Zum Ausführen dieser Aufgabe erstellt der Auftrag vorübergehend einen Auftragscluster, der eine Umgebungsvariable namens PYSPARK_PYTHON exportiert. Nachdem der Auftrag ausgeführt wurde, wird der Cluster beendet.

databricks jobs create --json '{
  "name": "My hello notebook job",
  "tasks": [
    {
      "task_key": "my_hello_notebook_task",
      "notebook_task": {
        "notebook_path": "/Workspace/Users/someone@example.com/hello",
        "source": "WORKSPACE"
      },
      "libraries": [
        {
          "pypi": {
            "package": "wheel==0.41.2"
          }
        }
      ],
      "new_cluster": {
        "spark_version": "13.3.x-scala2.12",
        "node_type_id": "Standard_DS3_v2",
        "num_workers": 1,
        "spark_env_vars": {
          "PYSPARK_PYTHON": "/databricks/python3/bin/python3"
        }
      }
    }
  ]
}'

Nächste Schritte