Freigeben über


Bloom-Filterindizes (veraltet)

Important

Verwenden Sie keine Bloom-Filterindizes. Azure Databricks hat dieses Feature eingestellt und empfiehlt, vorhandene Bloom-Filterindizes aus Ihren Tabellen zu entfernen.

Bloom-Filterindizes sind ein veralteter Mechanismus zum Überspringen von Daten, den Azure Databricks für keine Workloads mehr empfiehlt. Sie fügen Schreibaufwand hinzu, sind schwierig zu optimieren und werden durch effektivere Alternativen ersetzt.

Verwenden Sie stattdessen die folgenden Features:

  • Predictive I/O: Bei Photon-fähigen Computern mit Databricks Runtime 12.2 und höher führt Predictive I/O das automatische Dateiüberspringen für alle Spalten durch. Er ersetzt die Bloom-Filterindizes vollständig, wodurch nur Schreibaufwand hinzugefügt wird, wenn Photon aktiviert ist.
  • Flüssigclustering: In Databricks Runtime 13.3 und höher verbessert das Flüssigclustering das Datenüberspringen, indem Daten basierend auf häufig gefilterten Spalten organisiert werden.

Vorhandene Bloom-Filterindizes entfernen

Wenn Sie über vorhandene Bloom-Filterindizes für Ihre Tabellen verfügen, legen Sie sie ab, um unnötigen Schreibaufwand zu vermeiden:

DROP BLOOMFILTER INDEX ON TABLE table_name

Ausführliche Informationen zur Syntax finden Sie unter DROP BLOOM FILTER INDEX.

Nachdem Sie alle Bloom-Filterindizes gelöscht haben, führen Sie VACUUM aus, um die zugrunde liegenden Indexdateien im _delta_index-Verzeichnis zu bereinigen.