Relatórios Personalizados do Scanner (pré-visualização)

Este artigo descreve a funcionalidade de Relatórios Personalizados do Proteção de Informações do Microsoft Purview scanner (pré-visualização). Os Relatórios Personalizados fornecem aos administradores do scanner os dados de que precisam na base de dados do cluster de scanners para criarem os seus próprios relatórios com base nos resultados da análise, incluindo etiquetagem, estado de proteção e tipos de informações confidenciais correspondentes (SITs).

Os Relatórios Personalizados estão disponíveis com Proteção de Informações do Microsoft Purview cliente e a versão 3.2.89.0 ou posterior. Os Relatórios Personalizados são ativados por um administrador através do controlo de funcionalidades do Scanner.

O que os Relatórios Personalizados permitem

Atualmente, o scanner produz relatórios CSV e TXT por análise e armazena um conjunto limitado de dados operacionais na base de dados do cluster. Para criar uma imagem completa do estado do ficheiro — o que mudou, o que está etiquetado, o que está protegido e que tipos de dados confidenciais existem em que — os administradores têm de combinar múltiplas exportações de CSV em ciclos de análise e carregá-las numa ferramenta de relatórios separada.

Os Relatórios Personalizados movem esses dados para a base de dados do cluster de scanner para que os administradores possam:

  • Consulte a etiqueta presente e anterior, o estado de proteção e as contagens SIT para cada ficheiro analisado num repositório.
  • Diferenças de computação entre análises (por exemplo, a alteração no número de SITs correspondentes por ficheiro).
  • Veja que tipos de informações confidenciais foram correspondidos em que ficheiros e quantas correspondências por tipo.
  • Ligue a base de dados do cluster de scanners a uma ferramenta de relatórios à sua escolha (por exemplo, o Power BI, um armazém de relatórios empresarial ou uma ferramenta de dashboarding baseada em SQL) sem primeiro ter de coser as exportações de CSV em conjunto.

O scanner continua a ser a fonte da verdade. Os Relatórios Personalizados escrevem os dados de relatório adicionais na mesma base de dados de cluster de scanner partilhado no próximo ciclo de análise após a funcionalidade estar ativada.

Esquema de banco de dados

As tabelas e colunas de relatórios exigidas pelos Relatórios Personalizados foram adicionadas primeiro ao esquema da base de dados do cluster de scanner na versão 3.2.57.0 do cliente. Até que os Relatórios Personalizados estejam ativados, as novas colunas e tabelas existem, mas não são preenchidas. A funcionalidade do scanner existente não é inalterada.

Observação

Não precisa de instalar primeiro a versão 3.2.57.0 do cliente. Quer esteja a instalar o scanner atualizado ou a atualizar a partir de qualquer versão anterior, o analisador implementa o esquema completo da base de dados (incluindo as colunas e tabelas de Relatórios Personalizados) na instalação ou atualização.

Quando os Relatórios Personalizados são ativados através do controlo de funcionalidades do Scanner, o scanner começa a preencher os seguintes dados no próximo ciclo de análise.

Adições a dbo.ScannerFiles

dbo.ScannerFiles continua a conter uma linha por ficheiro analisado. Os Relatórios Personalizados preenchem as seguintes colunas adicionais para capturar o estado do ficheiro e o delta entre a análise atual e a anterior:

Coluna Tipo Descrição
LabelName NVARCHAR(MAX), nulo Nome da etiqueta atual aplicado ao ficheiro. NULL se não for etiquetado.
PrevLabelId NVARCHAR(MAX), nulo ID da etiqueta aplicado na análise anterior, armazenado como uma cadeia. NULL se anteriormente não tiver a etiqueta.
PrevLabelName NVARCHAR(MAX), nulo Nome da etiqueta aplicado na análise anterior. NULL se anteriormente não tiver a etiqueta.
ProtectionState NVARCHAR(MAX), nulo Estado de proteção atual do ficheiro no final da análise.
PrevProtectionState NVARCHAR(MAX), nulo Estado de proteção registado na análise anterior.
ClassificationCount INT, predefinição 0 Contagem de correspondências de tipos de informações confidenciais no ficheiro na análise atual.
LatestScanSessionId UNIQUEIDENTIFIER, nulo Identifica a sessão de análise mais recente que tocou no ficheiro. Utilizado para calcular deltas em ciclos de análise.
FileStatus NVARCHAR(MAX), nulo Eliminação final do ficheiro no ciclo de análise (por exemplo, a justificação necessária status definida por ProcessJobou Failed para ficheiros que não puderam ser processados).

Nova tabela: dbo.MatchedClassificationAction

dbo.MatchedClassificationAction é uma nova tabela que armazena os tipos de informações confidenciais correspondentes por ficheiro por análise. Cada linha representa um SIT correspondente para um único ficheiro numa única sessão de análise.

Coluna Tipo Descrição
Id BIGINT IDENTITY (chave primária) Chave de substituição da linha.
FilePath NVARCHAR(MAX), nulo Caminho completo do ficheiro no qual o SIT foi correspondido.
FileHashPath BINARY(64), nulo Hash do caminho do ficheiro. Associa-se a dbo.ScannerFiles.HashPath e é indexado para o desempenho da associação.
ScanSessionId UNIQUEIDENTIFIER, nulo Identifica a sessão de análise na qual o SIT foi correspondido. Associa-se a dbo.ScannerFiles.ScanSessionId e é indexado.
MatchedInformationTypeName NVARCHAR(MAX), nulo Nome a apresentar do tipo de informações confidenciais correspondentes (por exemplo, U.S. social security number (SSN)).
MatchedInformationTypeId UNIQUEIDENTIFIER, nulo GUID do SIT correspondente. O mesmo GUID é utilizado nos registos de Proteção de Informações do Microsoft Purview local para Workload=OnPremisesFileShareScanner.
MatchedInformationTypeCount INT, predefinição 0 Número de correspondências para este SIT no ficheiro.
ConfidenceScore INT, predefinição 0 Pontuação de confiança da partida.

dbo.ScanSummary (totais por análise) não mudou.

Perguntas de exemplo que os Relatórios Personalizados podem responder

Assim que os Relatórios Personalizados estiverem a preencher a base de dados, os administradores podem executar consultas como:

  • Que repositórios têm a maior concentração de SITs correspondentes e como é que essa concentração mudou desde a última análise?
  • Que ficheiros foram etiquetados ou recautados durante o ciclo de análise mais recente e qual era a etiqueta anterior?
  • Que ficheiros ainda não têm etiqueta, mas contêm correspondências para um ou mais tipos de informações confidenciais?
  • Que tipos de informações confidenciais são mais predominantes num determinado repositório e em que confiança?
  • Que ficheiros transitaram de desprotegidos para protegidos (ou inversos) desde a última análise?

Ativar Relatórios Personalizados

Os Relatórios Personalizados são ativados através da configuração de funcionalidades controlada pelo administrador. A partir de qualquer nó no cluster de scanners, execute:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting="On"}

Para ativar os Relatórios Personalizados no momento da instalação num novo nó de scanner, utilize o -FeatureSettings parâmetro com Install-Scanner:

Install-Scanner -SqlServerInstance SQLSERVER1 -Cluster Europe -FeatureSettings @{CustomReporting="On"}

Para confirmar o estado atual, execute:

Get-ScannerConfiguration

A alteração entra em vigor em todos os nós do cluster no próximo ciclo de análise. Não é necessário reiniciar o serviço.

Para parar de preencher as colunas e tabelas de Relatórios Personalizados, execute:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting="Off"}

A desativação de Relatórios Personalizados interrompe as novas escritas. Os dados já escritos nas colunas e tabelas de relatórios não são eliminados, pelo que a funcionalidade pode ser reativada mais tarde sem perda de dados.

Planear a base de dados do cluster de scanners para relatórios

Quando ativa a opção Relatórios Personalizados, a base de dados do cluster de scanners armazena significativamente mais dados por ciclo de análise— colunas adicionais por ficheiro no dbo.ScannerFiles, além de uma linha por SIT correspondente por ficheiro por análise no dbo.MatchedClassificationAction. A criação de relatórios na base de dados do cluster de scanner também adiciona uma carga de trabalho de leitura que é executada juntamente com as leituras e escritas operacionais do scanner.

Antes de ativar os Relatórios Personalizados na produção, considere:

  • Tamanho do cluster e volume de análise. Calcule o número de ficheiros analisados por ciclo, o número típico de correspondências SIT por ficheiro e a frequência de análise. Utilize esses números para dimensionar a base de dados.
  • Impacto operacional. Comunicar consultas na mesma base de dados para a qual o scanner está a escrever pode competir com o scanner para obter recursos durante um ciclo de análise.
  • A carga de trabalho de relatórios que realmente pretende. Os dashboards interativos, os extratos agendados e as consultas ad hoc têm impactos muito diferentes.

Para a maioria das implementações de produção, recomendamos que aloje a base de dados do cluster do scanner no SQL Server Enterprise para que possa dedicar uma réplica só de leitura aos relatórios. Com uma SQL Server Always On grupo de disponibilidade, pode encaminhar o tráfego de relatórios para um réplica secundário legível para que as consultas de relatórios não compitam com a carga de trabalho operacional do scanner no réplica primário.

Esta separação permite que as ferramentas de relatórios (por exemplo, o Power BI) se liguem ao réplica só de leitura e atualizem com base na sua própria cadência sem afetar o débito de análise no principal.

Observação

O próprio scanner lê e escreve sempre na base de dados primária. Apenas a carga de trabalho de relatórios personalizados deve ser apontada para um réplica só de leitura.

Limitações durante a pré-visualização

  • Não existem dashboard incorporados fornecidos com Relatórios Personalizados nesta pré-visualização. Os clientes criam os seus próprios relatórios na base de dados do cluster de scanners.
  • As definições configuradas pela configuração de funcionalidades controladas pelo administrador não são sincronizadas com o portal do Microsoft Purview. Nem todas as funcionalidades do scanner acabarão por ser configuráveis a partir do portal. Para as funcionalidades que estão disponíveis no portal e que foram configuradas no mesmo, a definição configurada pelo portal tem precedência e impede atualizações do PowerShell.

Confira também