重要
Lakebase Autoscaling 是 Lakebase 的最新版本更新,具有自动缩放计算、缩放到零、分支和即时还原功能。 有关支持的区域,请参阅 区域可用性。 如果你是 Lakebase 预配的用户,请参阅 Lakebase 预配。
Databricks 在线特性存储由 Lakebase 自动缩放驱动。 使用特征工程客户端 创建在线商店 时,Databricks 将 Lakebase 自动缩放项目预配为基础存储后端,从而提供对功能数据的低延迟访问,以便进行实时 ML 推理。
用例
- 实时模型推理:以低延迟提供最新特征值给模型服务端点。 使用 Databricks 特征工程训练的模型会自动跟踪其功能的世系,并使用 Unity 目录在服务时查找适当的在线商店。
- 功能服务终结点:使用功能服务终结点直接向外部应用程序和服务提供功能,而无需模型。
- 建议系统、欺诈检测、个性化:任何需要针对脱机功能表进行一致的高吞吐量功能查找的应用程序。
工作原理
联机功能存储将数据从脱机 Unity 目录功能表同步到 Lakebase 自动缩放项目。 可以使用 发布模式控制数据同步的频率:
- TRIGGERED (默认值):按计划或通过 API 进行增量同步。
- CONTINUOUS:流式数据管道在新数据写入离线表时更新在线商店。
- 快照:一次性完整复制,对批量更新有效。
由于在线商店是 Lakebase 自动缩放项目,因此它受益于自动计算缩放、在非活动期间缩放到零以及 Unity 目录治理。
注释
新联机功能库被创建为 Lakebase 自动扩展项目。 如果您有现有的 Lakebase 预置在线商店,请参阅 默认情况下自动缩放 以获取迁移详细信息。
Implementation
有关完整的设置指南、API 文档和笔记本示例,请参阅 Databricks 在线特征库。