Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Important
Verwenden Sie keine Bloom-Filterindizes. Azure Databricks hat dieses Feature eingestellt und empfiehlt, vorhandene Bloom-Filterindizes aus Ihren Tabellen zu entfernen.
Bloom-Filterindizes sind ein veralteter Mechanismus zum Überspringen von Daten, den Azure Databricks für keine Workloads mehr empfiehlt. Sie fügen Schreibaufwand hinzu, sind schwierig zu optimieren und werden durch effektivere Alternativen ersetzt.
Empfohlene Alternativen
Verwenden Sie stattdessen die folgenden Features:
- Predictive I/O: Bei Photon-fähigen Computern mit Databricks Runtime 12.2 und höher führt Predictive I/O das automatische Dateiüberspringen für alle Spalten durch. Er ersetzt die Bloom-Filterindizes vollständig, wodurch nur Schreibaufwand hinzugefügt wird, wenn Photon aktiviert ist.
- Flüssigclustering: In Databricks Runtime 13.3 und höher verbessert das Flüssigclustering das Datenüberspringen, indem Daten basierend auf häufig gefilterten Spalten organisiert werden.
Vorhandene Bloom-Filterindizes entfernen
Wenn Sie über vorhandene Bloom-Filterindizes für Ihre Tabellen verfügen, legen Sie sie ab, um unnötigen Schreibaufwand zu vermeiden:
DROP BLOOMFILTER INDEX ON TABLE table_name
Ausführliche Informationen zur Syntax finden Sie unter DROP BLOOM FILTER INDEX.
Nachdem Sie alle Bloom-Filterindizes gelöscht haben, führen Sie VACUUM aus, um die zugrunde liegenden Indexdateien im _delta_index-Verzeichnis zu bereinigen.