Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Hinweis
Die Unterstützung für diese Databricks-Runtime-Version wurde beendet. Informationen zum Enddatum des Supports finden Sie unter "Ende des Supports" und "Ende des Lebenszyklus". Eine Übersicht aller unterstützten Databricks Runtime-Versionen finden Sie unter Versionshinweise und Kompatibilität von Databricks Runtime.
Databricks Runtime 11.2 für Machine Learning bietet eine ready-to-go Umgebung für machine learning und Data Science basierend auf Databricks Runtime 11.2 (EoS). Databricks Runtime ML enthält viele beliebte Machine Learning-Bibliotheken, einschließlich TensorFlow, PyTorch und XGBoost. Databricks Runtime ML enthält AutoML, ein Tool zum automatischen Trainieren von Machine Learning-Pipelines. Databricks Runtime ML unterstützt auch verteiltes Deep Learning-Training mit Horovod.
Weitere Informationen, einschließlich Anweisungen zum Erstellen eines Databricks Runtime ML-Clusters, finden Sie unter KI und Machine Learning in Databricks.
Neue Features und Verbesserungen
Databricks Runtime 11.2 ML basiert auf Databricks Runtime 11.2. Informationen zu den Neuerungen in Databricks Runtime 11.2, einschließlich Apache Spark MLlib und SparkR, finden Sie in den Versionshinweisen zur Databricks Runtime 11.2 (EoS).
Verbesserungen an AutoML
AutoML hat jetzt eine bessere Unterstützung für ungleichgewichte Datasets für Klassifizierungsprobleme. Einzelheiten finden Sie unter Unterstützung von unausgeglichenen Datensätzen bei Klassifizierungsproblemen.
Optimierungen des Databricks Feature Store
Die folgenden Verbesserungen wurden an Databricks Feature Store vorgenommen.
- Für Online-Shops sind die Benutzer- und Passwortfelder veraltet. Um zukünftige Inkompatibilitäten zu vermeiden, ändern Sie alle Verwendungen dieser Felder in
write_secret_prefix.
- Alle Dokumentationen und Ausgaben des Feature Store-Clients beziehen sich jetzt auf die Clientversion (z. B. 0.6.1) anstelle von Databricks Runtime ML-Versionen (z. B. 11.2).
Systemumgebung
Die Systemumgebung in Databricks Runtime 11.2 ML unterscheidet sich von Databricks Runtime 11.2 wie folgt:
-
DBUtils: Databricks Runtime ML enthält kein Bibliothekshilfsprogramm (dbutils.library) (veraltet).
Verwenden Sie stattdessen
%pip-Befehle. Siehe Notebook-bezogenen Python-Bibliotheken. - Für GPU-Cluster umfasst Databricks Runtime ML die folgenden NVIDIA-GPU-Bibliotheken:
- CUDA 11.3
- cuDNN 8.0.5.39
- NCCL 2.9.9
- TensorRT 7.2.2
Bibliotheken
In den folgenden Abschnitten werden die in Databricks Runtime 11.2 ML enthaltenen Bibliotheken aufgeführt, die sich von denen unterscheiden, die in Databricks Runtime 11.2 enthalten sind.
Inhalt dieses Abschnitts:
- Bibliotheken der obersten Ebene
- Python-Bibliotheken
- R-Bibliotheken
- Java- und Scala-Bibliotheken (Scala 2.12 Cluster)
Bibliotheken der obersten Ebene
Databricks Runtime 11.2 ML enthält die folgenden erstklassigen Bibliotheken:
- GraphFrames
- Horovod und HorovodRunner
- MLflow
- PyTorch
- Spark-Tensorflow-Verbinder
- TensorFlow
- TensorBoard
- scikit-learn
Python-Bibliotheken
Databricks Runtime 11.2 ML verwendet Virtualenv für Python Paketverwaltung und enthält viele beliebte ML-Pakete.
Zusätzlich zu den in den folgenden Abschnitten angegebenen Paketen enthält Databricks Runtime 11.2 ML auch die folgenden Pakete:
- hyperopt 0.2.7.db1
- sparkdl 2.2.0_db6
- feature_store 0.6.0
- automl 1.12.3
Python-Bibliotheken auf CPU-Clustern
Um die Databricks Runtime ML-Python-Umgebung in Ihrer lokalen Python virtuellen Umgebung zu reproduzieren, laden Sie die Datei requirements-11.2.txt herunter, und führen Sie pip install -r requirements-11.2.txt aus. Dieser Befehl installiert alle open source Bibliotheken, die Databricks Runtime ML verwendet, installiert jedoch keine Azure Databricks entwickelten Bibliotheken, z. B. databricks-automl, databricks-feature-store oder die Databricks-Verzweigung von hyperopt.
| Bibliothek | Version | Bibliothek | Version | Bibliothek | Version |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | Antergos Linux | 2015.10 (ISO-Rolling) | argon2-cffi | 20.1.0 |
| Astor | 0.8.1 | astunparse | 1.6.3 | asynchroner Generator | 1.10 |
| Attrs | 21.2.0 | Azure Core | 1.22.1 | Azure-Cosmos | 4.2.0 |
| backcall | 0.2.0 | backports.entry-points-selectable | 1.1.1 | bcrypt | 3.2.2 |
| schwarz | 22.3.0 | Bleichmittel | 4.0.0 | blis | 0.7.8 |
| boto3 | 1.21.18 | Botocore | 1.24.18 | CacheWerkzeuge | 5.2.0 |
| Katalog | 2.0.8 | Zertifikat | 2021.10.8 | cffi | 1.14.6 |
| Chardet | 4.0.0 | Charset-Normalizer | 2.0.4 | klicken | 8.0.3 |
| cloudpickle | 2.0.0 | cmdstanpy | 0.9.68 | configparser | 5.2.0 |
| Convertdate | 2.4.0 | Kryptografie | 3.4.8 | Fahrradfahrer | 0.10.0 |
| cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.10 |
| databricks-cli | 0.17.0 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
| debugpy | 1.4.1 | Dekorateur | 5.1.0 | defusedxml | 0.7.1 |
| Dill | 0.3.4 | Festplatten-Cache | 5.4.0 | Distlib | 0.3.5 |
| Distro-Informationen | 0.23ubuntu1 | Einstiegspunkte | 0,3 | Kurzlebig | 4.1.3 |
| Übersicht der Facetten | 1.0.0 | fasttext | 0.9.2 | Dateisperrung | 3.3.1 |
| Flask | 1.1.2 | FlatBuffers | 1.12 | fsspec | 2021.8.1 |
| Zukunft | 0.18.2 | gast | 0.4.0 | gitdb | 4.0.9 |
| GitPython | 3.1.27 | Google-Authentifizierung | 2.6.0 | google-auth-oauthlib | 0.4.6 |
| Google-Pasta | 0.2.0 | GRPCIO | 1.44.0 | gunicorn | 20.1.0 |
| gviz-api | 1.10.0 | h5py | 3.3.0 | Hijri-Konverter | 2.2.4 |
| Ferien | 0.14.2 | Horovod | 0.25.0 | htmlmin | 0.1.12 |
| huggingface-hub | 0.8.1 | IDNA | 3.2 | ImageHash | 4.2.1 |
| Ungleichgewichte lernen | 0.8.1 | importlib-metadata | 4.8.1 | ipykernel | 6.12.1 |
| ipython | 7.32.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 |
| isodate | 0.6.1 | es ist gefährlich | 2.0.1 | Jedi | 0.18.0 |
| Jinja2 | 2.11.3 | jmespath | 0.10.0 | joblib | 1.0.1 |
| joblibspark | 0.5.0 | jsonschema | 3.2.0 | Jupyter-Client | 6.1.12 |
| jupyter-core | 4.8.1 | jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
| Keras | 2.9.0 | Keras-Preprocessing | 1.1.2 | kiwisolver | 1.3.1 |
| koreanischer Lunarkalender | 0.2.1 | langcodes | 3.3.0 | libclang | 14.0.6 |
| lightgbm | 3.3.2 | llvmlite | 0.37.0 | Mondkalender | 0.0.9 |
| Mako | 1.2.0 | Markdown | 3.3.6 | MarkupSafe | 2.0.1 |
| matplotlib | 3.4.3 | matplotlib-inline | 0.1.2 | fehltNein | 0.5.1 |
| mistune | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 1.28.0 |
| multimethod | 1.8 | Murmurhash | 1.0.8 | mypy-Erweiterungen | 0.4.3 |
| nbclient | 0.5.3 | nbconvert | 6.1.0 | nbformat | 5.1.3 |
| nest-asyncio | 1.5.1 | networkx | 2.6.3 | Natural Language Toolkit (nltk) | 3.6.5 |
| Notebook | 6.4.5 | numba | 0.54.1 | numpy | 1.20.3 |
| oauthlib | 3.2.0 | opt-einsum | 3.3.0 | Verpackung | 21.0 |
| Pandas | 1.3.4 | Pandas-Profiling | 3.1.0 | Pandocfilter | 1.4.3 |
| paramiko | 2.9.2 | Parso | 0.8.2 | pathspec | 0.9.0 |
| pathie | 0.6.2 | patsy | 0.5.2 | Petastorm | 0.11.4 |
| pexpect | 4.8.0 | phik | 0.12.2 | pickleshare | 0.7.5 |
| Kissen | 8.4.0 | pip | 21.2.4 | platformdirs | 2.5.2 |
| plotly | 5.9.0 | pmdarima | 1.8.5 | vorgehäckselt | 3.0.7 |
| prometheus-client | 0.11.0 | Prompt-Toolkit | 3.0.20 | prophet | 1.0.1 |
| protobuf | 3.19.4 | psutil | 5.8.0 | psycopg2 | 2.9.3 |
| ptyprocess | 0.7.0 | Pyarrow | 7.0.0 | Pyasn1 | 0.4.8 |
| Pyasn1-Module | 0.2.8 | pybind11 | 2.10.0 | Pycparser | 2,20 |
| Pydantisch | 1.9.2 | Pygments | 2.10.0 | PyGObject | 3.36.0 |
| PyJWT | 2.4.0 | PyMeeus | 0.5.11 | PyNaCl | 1.5.0 |
| pyodbc | 4.0.31 | pyparsing | 3.0.4 | pyrsistent | 0.18.0 |
| Pystan | 2.19.1.1 | python-apt | 2.0.0+ubuntu0.20.4.7 | Python-dateutil | 2.8.2 |
| Python-Editor | 1.0.4 | Pytz | 2021.3 | PyWavelets | 1.1.1 |
| PyYAML | 6,0 | pyzmq | 22.2.1 | Regex | 2021.8.3 |
| requests | 2.26.0 | requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 |
| rsa | 4,9 | s3transfer | 0.5.2 | scikit-learn | 0.24.2 |
| SciPy | 1.7.1 | Seegeboren | 0.11.2 | Send2Trash | 1.8.0 |
| setuptools | 58.0.4 | setuptools-git | 1.2 | Schattierung | 0.41.0 |
| simplejson | 3.17.6 | Sechs | 1.16.0 | slicer | 0.0.7 |
| smart-open | 5.2.1 | smmap | 5.0.0 | Geräumig | 3.4.0 |
| spacy-legacy | 3.0.9 | spacy-loggers | 1.0.3 | Spark-Tensorflow-Distributor | 1.0.0 |
| sqlparse | 0.4.2 | srsly | 2.4.4 | ssh-import-id | 5.10 |
| StatistikModelle | 0.12.2 | tabellarisieren | 0.8.9 | tangled-up-in-unicode | 0.1.0 |
| Hartnäckigkeit | 8.0.1 | TensorBoard | 2.9.1 | tensorboard-data-server | 0.6.1 |
| tensorboard-plugin-profile (Tensorboard-Plugin-Profil) | 2.8.0 | tensorboard-plugin-wit | 1.8.1 | tensorflow-cpu | 2.9.1 |
| TensorFlow-Estimator | 2.9.0 | tensorflow-io-gcs-filesystem | 0.26.0 | Termcolor | 1.1.0 |
| terminado | 0.9.4 | Testpfad | 0.5.0 | thinc | 8.1.0 |
| Threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 | tokenizers | 0.12.1 |
| tomli | 2.0.1 | Fackel | 1.11.0+cpu | torchvision | 0.12.0+cpu |
| tornado | 6.1 | tqdm | 4.62.3 | traitlets | 5.1.0 |
| Transformatoren | 4.20.1 | Typer | 0.4.2 | Erweiterungen für Typisierung | 3.10.0.2 |
| ujson | 4.0.2 | unbeaufsichtigte Aktualisierungen | 0,1 | urllib3 | 1.26.7 |
| virtualenv | 20.8.0 | Visionen | 0.7.4 | Wasabi | 0.10.1 |
| wcwidth (Breite eines Zeichens) | 0.2.5 | Webkodierungen | 0.5.1 | WebSocket-Client | 1.3.1 |
| Werkzeug | 2.0.2 | Rad | 0.37.0 | widgetsnbextension | 3.6.0 |
| Eingehüllt | 1.12.1 | xgboost | 1.5.2 | zipp | 3.6.0 |
Python Bibliotheken auf GPU-Clustern
| Bibliothek | Version | Bibliothek | Version | Bibliothek | Version |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | Antergos Linux | 2015.10 (ISO-Rolling) | argon2-cffi | 20.1.0 |
| Astor | 0.8.1 | astunparse | 1.6.3 | asynchroner Generator | 1.10 |
| Attrs | 21.2.0 | Azure Core | 1.22.1 | Azure-Cosmos | 4.2.0 |
| backcall | 0.2.0 | backports.entry-points-selectable | 1.1.1 | bcrypt | 3.2.2 |
| schwarz | 22.3.0 | Bleichmittel | 4.0.0 | blis | 0.7.8 |
| boto3 | 1.21.18 | Botocore | 1.24.18 | CacheWerkzeuge | 5.2.0 |
| Katalog | 2.0.8 | Zertifikat | 2021.10.8 | cffi | 1.14.6 |
| Chardet | 4.0.0 | Charset-Normalizer | 2.0.4 | klicken | 8.0.3 |
| cloudpickle | 2.0.0 | cmdstanpy | 0.9.68 | configparser | 5.2.0 |
| Convertdate | 2.4.0 | Kryptografie | 3.4.8 | Fahrradfahrer | 0.10.0 |
| cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.10 |
| databricks-cli | 0.17.0 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
| debugpy | 1.4.1 | Dekorateur | 5.1.0 | defusedxml | 0.7.1 |
| Dill | 0.3.4 | Festplatten-Cache | 5.4.0 | Distlib | 0.3.5 |
| Distro-Informationen | 0.23ubuntu1 | Einstiegspunkte | 0,3 | Kurzlebig | 4.1.3 |
| Übersicht der Facetten | 1.0.0 | fasttext | 0.9.2 | Dateisperrung | 3.3.1 |
| Flask | 1.1.2 | FlatBuffers | 1.12 | fsspec | 2021.8.1 |
| Zukunft | 0.18.2 | gast | 0.4.0 | gitdb | 4.0.9 |
| GitPython | 3.1.27 | Google-Authentifizierung | 2.6.0 | google-auth-oauthlib | 0.4.6 |
| Google-Pasta | 0.2.0 | GRPCIO | 1.44.0 | gunicorn | 20.1.0 |
| gviz-api | 1.10.0 | h5py | 3.3.0 | Hijri-Konverter | 2.2.4 |
| Ferien | 0.14.2 | Horovod | 0.25.0 | htmlmin | 0.1.12 |
| huggingface-hub | 0.8.1 | IDNA | 3.2 | ImageHash | 4.2.1 |
| Ungleichgewichte lernen | 0.8.1 | importlib-metadata | 4.8.1 | ipykernel | 6.12.1 |
| ipython | 7.32.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 |
| isodate | 0.6.1 | es ist gefährlich | 2.0.1 | Jedi | 0.18.0 |
| Jinja2 | 2.11.3 | jmespath | 0.10.0 | joblib | 1.0.1 |
| joblibspark | 0.5.0 | jsonschema | 3.2.0 | Jupyter-Client | 6.1.12 |
| jupyter-core | 4.8.1 | jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
| Keras | 2.9.0 | Keras-Preprocessing | 1.1.2 | kiwisolver | 1.3.1 |
| koreanischer Lunarkalender | 0.2.1 | langcodes | 3.3.0 | libclang | 14.0.6 |
| lightgbm | 3.3.2 | llvmlite | 0.37.0 | Mondkalender | 0.0.9 |
| Mako | 1.2.0 | Markdown | 3.3.6 | MarkupSafe | 2.0.1 |
| matplotlib | 3.4.3 | matplotlib-inline | 0.1.2 | fehltNein | 0.5.1 |
| mistune | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 1.28.0 |
| multimethod | 1.8 | Murmurhash | 1.0.8 | mypy-Erweiterungen | 0.4.3 |
| nbclient | 0.5.3 | nbconvert | 6.1.0 | nbformat | 5.1.3 |
| nest-asyncio | 1.5.1 | networkx | 2.6.3 | Natural Language Toolkit (nltk) | 3.6.5 |
| Notebook | 6.4.5 | numba | 0.54.1 | numpy | 1.20.3 |
| oauthlib | 3.2.0 | opt-einsum | 3.3.0 | Verpackung | 21.0 |
| Pandas | 1.3.4 | Pandas-Profiling | 3.1.0 | Pandocfilter | 1.4.3 |
| paramiko | 2.9.2 | Parso | 0.8.2 | pathspec | 0.9.0 |
| pathie | 0.6.2 | patsy | 0.5.2 | Petastorm | 0.11.4 |
| pexpect | 4.8.0 | phik | 0.12.2 | pickleshare | 0.7.5 |
| Kissen | 8.4.0 | pip | 21.2.4 | platformdirs | 2.5.2 |
| plotly | 5.9.0 | pmdarima | 1.8.5 | vorgehäckselt | 3.0.7 |
| Prompt-Toolkit | 3.0.20 | prophet | 1.0.1 | protobuf | 3.19.4 |
| psutil | 5.8.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
| Pyarrow | 7.0.0 | Pyasn1 | 0.4.8 | Pyasn1-Module | 0.2.8 |
| pybind11 | 2.10.0 | Pycparser | 2,20 | Pydantisch | 1.9.2 |
| Pygments | 2.10.0 | PyGObject | 3.36.0 | PyJWT | 2.4.0 |
| PyMeeus | 0.5.11 | PyNaCl | 1.5.0 | pyodbc | 4.0.31 |
| pyparsing | 3.0.4 | pyrsistent | 0.18.0 | Pystan | 2.19.1.1 |
| python-apt | 2.0.0+ubuntu0.20.4.7 | Python-dateutil | 2.8.2 | Python-Editor | 1.0.4 |
| Pytz | 2021.3 | PyWavelets | 1.1.1 | PyYAML | 6,0 |
| pyzmq | 22.2.1 | Regex | 2021.8.3 | requests | 2.26.0 |
| requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 | rsa | 4,9 |
| s3transfer | 0.5.2 | scikit-learn | 0.24.2 | SciPy | 1.7.1 |
| Seegeboren | 0.11.2 | Send2Trash | 1.8.0 | setuptools | 58.0.4 |
| setuptools-git | 1.2 | Schattierung | 0.41.0 | simplejson | 3.17.6 |
| Sechs | 1.16.0 | slicer | 0.0.7 | smart-open | 5.2.1 |
| smmap | 5.0.0 | Geräumig | 3.4.0 | spacy-legacy | 3.0.9 |
| spacy-loggers | 1.0.3 | Spark-Tensorflow-Distributor | 1.0.0 | sqlparse | 0.4.2 |
| srsly | 2.4.4 | ssh-import-id | 5.10 | StatistikModelle | 0.12.2 |
| tabellarisieren | 0.8.9 | tangled-up-in-unicode | 0.1.0 | Hartnäckigkeit | 8.0.1 |
| TensorBoard | 2.9.1 | tensorboard-data-server | 0.6.1 | tensorboard-plugin-profile (Tensorboard-Plugin-Profil) | 2.8.0 |
| tensorboard-plugin-wit | 1.8.1 | TensorFlow | 2.9.1 | TensorFlow-Estimator | 2.9.0 |
| tensorflow-io-gcs-filesystem | 0.26.0 | Termcolor | 1.1.0 | terminado | 0.9.4 |
| Testpfad | 0.5.0 | thinc | 8.1.0 | Threadpoolctl | 2.2.0 |
| tokenize-rt | 4.2.1 | tokenizers | 0.12.1 | tomli | 2.0.1 |
| Fackel | 1.11.0+cu113 | torchvision | 0.12.0+cu113 | tornado | 6.1 |
| tqdm | 4.62.3 | traitlets | 5.1.0 | Transformatoren | 4.20.1 |
| Typer | 0.4.2 | Erweiterungen für Typisierung | 3.10.0.2 | ujson | 4.0.2 |
| unbeaufsichtigte Aktualisierungen | 0,1 | urllib3 | 1.26.7 | virtualenv | 20.8.0 |
| Visionen | 0.7.4 | Wasabi | 0.10.1 | wcwidth (Breite eines Zeichens) | 0.2.5 |
| Webkodierungen | 0.5.1 | WebSocket-Client | 1.3.1 | Werkzeug | 2.0.2 |
| Rad | 0.37.0 | widgetsnbextension | 3.6.0 | Eingehüllt | 1.12.1 |
| xgboost | 1.5.2 | zipp | 3.6.0 |
R-Bibliotheken
Die R-Bibliotheken sind identisch mit den R-Bibliotheken in Databricks Runtime 11.2.
Java- und Scala-Bibliotheken (Scala 2.12-Cluster)
Zusätzlich zu Java- und Scala-Bibliotheken in Databricks Runtime 11.2 enthält Databricks Runtime 11.2 ML die folgenden JARs:
Rechencluster
| Gruppen-ID | Artefakt-ID | Version |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
| ml.dmlc | xgboost4j-spark_2.12 | 1.5.2 |
| ml.dmlc | xgboost4j_2.12 | 1.5.2 |
| org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
| org.mlflow | mlflow-client | 1.28.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
GPU-Cluster
| Gruppen-ID | Artefakt-ID | Version |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
| ml.dmlc | xgboost4j-gpu_2.12 | 1.5.2 |
| ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.5.2 |
| org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
| org.mlflow | mlflow-client | 1.28.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |