Visão geral de fontes de dados

Para configurar Dynamics 365 Customer Insights - Data, primeiro traga dados de origem para processamento. O Customer Insights - Data oferece diversos tipos de conectores de dados para se conectar a e ingerir dados de um conjunto de fontes abrangente.

Este artigo descreve opções que podem afetar o desempenho da ingestão de dados.

Formato Delta

O formato de dados Delta é o formato de processamento nativo usado pelo Customer Insights – Data. Se você conseguir fornecer dados de origem no formato Delta, haverá muitas vantagens.

  • Melhor eficiência com o Customer Insights - Data: o Customer Insights - Data usa internamente o formato Delta.
  • Ingestão de dados mais rápida: o formato Delta oferece compactação superior tendo em vista transferências de dados mais rápidas.
  • Unificação mais rápida: quando o recurso viagem no tempo Delta é usado, o Customer Insights – Data só unifica os dados alterados. Ele não reprocessa todo o conjunto de dados. Para unificação incremental, todas as entradas de dados na unificação devem estar no formato Delta.
  • Menos problemas de danos nos dados: o formato Delta reduz as partições corrompidas e os problemas de danos comuns nos dados causados por formatos mais antigos, como o formato CSV (valores separados por vírgula).
  • Design do gerenciamento de dados mais confiável: o formato Delta não exige atualizações manuais para manifestos, esquemas e arquivos de partição.
  • Mais validade de dados: o formato Delta oferece transações de atomicidade, consistência, isolamento, durabilidade (ACID), além dos níveis de isolamento no Spark.

Você pode usar o formato Delta com os seguintes conectores:

Delta é um termo introduzido no Delta Lake, o fundamento para armazenar dados e tabelas na plataforma Databricks Lakehouse. Delta Lake é uma camada de armazenamento de código aberto que traz transações ACID (atomicidade, consistência, isolamento e durabilidade) para cargas de trabalho de big data. Para obter mais informações, consulte a Página de documentação do Delta Lake.

Anexo ou importação da fonte de dados

Quando você decide como ingerir os dados, uma consideração-chave é se o conector de dados se conecta aos dados ou faz cópias dos dados. Ao usar Customer Insights - Data, recomendamos que você use um conector que se anexe aos dados. Assim, os dados são acessados diretamente no momento de processá-los. Se você usar um conector que copie os dados, atrasos podem ocorrer quando os dados são atualizados.

Os seguintes conectores de dados se conectam aos seus dados:

Se você não conseguir usar um conector que se conecta aos seus dados, copie-os usando um dos conectores do Power Query. Power Query fornece uma maneira útil de transformar os dados.

Criação de perfil de dados

Quando os dados são ingeridos, o Customer Insights – Data realiza uma criação de perfil de dados básicos. Por exemplo, ele cria o perfil da frequência de valores repetidos em uma coluna. Você pode usar dados de perfil para compreender os dados e resolver os problemas. Por exemplo, se estiver fazendo correspondência na coluna FullName, o perfilamento de dados pode ajudar você a detectar que o valor padrão, Digite seu nome, aparece em 10.000 linhas. Portanto, se você corresponder a esse valor, 10.000 linhas que não deveriam ser correspondidas serão correspondidas. Ao adicionar o Azure Data Lake, as tabelas Delta ou as fontes de dados do Azure Synapse, você pode habilitar a criação de perfil dos dados para mais colunas.

Depois de ingerir os dados, você pode visualizar os resultados do perfil de dados.

  1. Vá até Dados>Tabelas e selecione uma tabela. Em seguida, na linha de um campo (por exemplo, DateOfBirth), na coluna Resumo, selecione o ícone Resumo .

    Captura de tela da guia Atributos na página da tabela Cliente, realçando o ícone Resumo do campo DateOfBirth.

  2. Revise os detalhes em busca de erros ou valores não encontrados.

    Captura de tela que mostra o resumo do campo DateOfBirth, inclusive o gráfico dos principais valores por contagem.

Note

A criação de perfil de dados é gerada como parte da tarefa preparação de dados e é executada separadamente para cada fonte de dados. Se a tarefa de preparação de dados não for concluída com êxito, a coluna Resumo não estará disponível para a fonte de dados afetada. Os resultados da criação de perfil de dados podem não estar disponíveis para todas as colunas. A tarefa preparação de dados tem um tempo máximo de execução de três horas. Para solicitar um aumento a esse limite, entre em contato com o Suporte da Microsoft.

Página de fontes de dados

A página Fontes de dados lista as fontes de dados em duas seções:

  • Gerenciado por mim: Microsoft Power Platform fluxos de dados que você criou e gerencia. Outros usuários só podem exibir esses fluxos de dados. Eles não podem editar, atualizar ou deletá-los.
  • Gerenciado por outros: os fluxos de dados do Microsoft Power Platform criados por outros administradores. Você só pode exibir esses fluxos de dados. Esta seção mostra o proprietário de cada fluxo de dados, de maneira que você possa entrar em contato com ele caso precise de ajuda.

Note

Outros usuários podem exibir e usar todas as tabelas. Embora cada fonte de dados seja de propriedade do usuário que a criou, cada usuário do Customer Insights - Data pode usar todas as tabelas resultantes da ingestão de dados.

Captura de tela da página Fontes de dados.

Próximas Etapas