Integração com o AutoML Feature Store

O AutoML pode enriquecer o conjunto de dados de entrada original com funcionalidades de tabelas de funcionalidades no Unity Catalog ou no Workspace Feature Store herdado.

Requisitos

  • Os experimentos de classificação e regressão exigem o Databricks Runtime 11.3 LTS ML e superior.
  • Os experimentos de previsão exigem o Databricks Runtime 12.2 LTS ML e superior.

Selecione uma tabela de recursos usando a interface do usuário AutoML

Depois de configurar seu experimento AutoML, você pode selecionar uma tabela de recursos usando as seguintes etapas:

  1. Clique em Participar nas funcionalidades (opcional).

    Selecione o botão Juntar Funcionalidades

  2. Na página Juntar-se a funcionalidades adicionais, selecione uma tabela no campo Tabela de Funcionalidades.

  3. Para cada chave primária da tabela de recursos, selecione a chave de pesquisa correspondente. A chave de pesquisa deve ser uma coluna no conjunto de dados de treinamento que você forneceu para seu experimento AutoML.

  4. Para tabelas de características de séries temporais, selecione a chave de correspondência de data/hora correspondente. Da mesma forma, a chave de pesquisa pelo carimbo de data/hora deve ser uma coluna no conjunto de dados de treinamento que forneceu para o seu experimento AutoML.

    Selecionar chave primária e tabelas de pesquisa

  5. Para adicionar mais tabelas de recursos, clique em Adicionar outra tabela de recursos e repita as etapas acima.

Usar tabelas de recursos com a API AutoML

Para usar tabelas de características existentes, defina o parâmetro feature_store_lookups na especificação do AutoML.

feature_store_lookups = [
  {
     "table_name": "example.trip_pickup_features",
     "lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
  },
  {
      "table_name": "example.trip_dropoff_features",
     "lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
  }
]

O bloco de anotações a seguir mostra como unir tabelas de recursos ao seu conjunto de dados de treinamento para uso com o AutoML.

Experiência de AutoML usando o bloco de anotações de tabelas de recursos

Obter o notebook