Utilizar funcionalidades em fluxos de trabalho online

Quando utiliza o Databricks Feature Store, cada etapa do seu processo de desenvolvimento do modelo é integrada na Plataforma de Inteligência de Dados Databricks. Isso significa que pode criar pipelines de dados automatizados para calcular e disponibilizar valores de características, enquanto o Databricks gere a infraestrutura por si. A plataforma Databricks fornece serviço em tempo real para recursos e modelos, incluindo computação sob demanda de valores de recursos.

Pesquisa automática de funcionalidades

Quando treina um modelo usando o Armazém de Funcionalidades do Databricks e o serve com o Databricks Model Serving, o modelo procura automaticamente os valores das funcionalidades de um Armazém de Funcionalidades Online do Databricks ou de uma loja online de terceiros. Isso acontece automaticamente, sem necessidade de configuração.

Importante

As tabelas online Databricks já não são suportadas. Se já tiver tabelas online, o Databricks recomenda que as migre para a Databricks Online Feature Store. Consulte Migrar de tabelas online herdadas e de terceiros.

Quando uma solicitação de pontuação chega ao modelo, o Model Serving recupera automaticamente os valores de recurso publicados necessários para o modelo. Desta forma, os valores das funcionalidades mais recentes são sempre usados para previsões. Para obter detalhes e exemplos de blocos de anotações, consulte Serviço de modelo com pesquisa automática de recursos.

O diagrama a seguir ilustra a relação entre os componentes da plataforma para servir em tempo real.

Fluxo de trabalho do Feature Store com consulta online

Recursos sob demanda

Os modelos de aprendizado de máquina para aplicativos em tempo real geralmente exigem os valores de recurso mais recentes. No exemplo mostrado no diagrama, um recurso para um modelo de recomendação de restaurante é a distância atual do usuário de um restaurante. Esse recurso deve ser calculado "sob demanda", ou seja, no momento da solicitação de pontuação. Ao receber um pedido de pontuação, o modelo procura a localização do restaurante e, em seguida, aplica uma função predefinida para calcular a distância entre a localização atual do usuário e o restaurante. Essa distância é passada como uma entrada para o modelo, juntamente com outros recursos pré-computados do repositório de recursos. Para obter mais informações, consulte Recursos de computação sob demanda.

Fluxo de trabalho de recursos de computação sob demanda