Condividi tramite


Caricare dati in modo incrementale da un archivio dati di origine a un archivio dati di destinazione

SI APPLICA A: Azure Data Factory Azure Synapse Analytics

Suggerimento

Cercare un modo semplice per spostare i dati? Il processo di copia in Microsoft Fabric offre un modo semplice e scalabile per caricare i dati senza creare una pipeline. Informazioni su come crearne uno.

In una soluzione di integrazione dei dati il caricamento incrementale (o differenziale) dei dati dopo un caricamento di dati iniziale completo è uno scenario ampiamente diffuso. Le esercitazioni incluse in questa sezione mostrano diversi metodi per caricare dati in modo incrementale usando Azure Data Factory.

Caricamento differenziale dei dati usando un limite

In questo caso, definisci un indicatore nel database di origine. Un watermark è una colonna che contiene l'ultimo timestamp aggiornato o una chiave incrementale. La soluzione di caricamento differenziale carica i dati modificati tra un limite precedente e uno nuovo. Il flusso di lavoro per questo approccio è raffigurato nel diagramma seguente:

Flusso di lavoro per l'uso di una filigrana

Per istruzioni dettagliate, vedere le esercitazioni seguenti:

Per i modelli vedere l'argomento seguente:

Caricamento differenziale dei dati dal database SQL usando la tecnologia Rilevamento modifiche

La tecnologia Rilevamento modifiche è una soluzione leggera inclusa in SQL Server e nel database SQL di Azure che offre un efficiente meccanismo di rilevamento delle modifiche per le applicazioni. Questa tecnologia consente a un'applicazione di identificare facilmente i dati inseriti, aggiornati o eliminati.

Il flusso di lavoro per questo approccio è raffigurato nel diagramma seguente:

Flusso di lavoro per l'uso del rilevamento delle modifiche

Per istruzioni dettagliate, vedere l'esercitazione seguente:

Caricamento dei soli file nuovi e modificati usando LastModifiedDate

È possibile copiare i file nuovi e modificati solo usando LastModifiedDate nell'archivio di destinazione. Azure Data Factory analizza tutti i file dall'archivio di origine, applica il filtro LastModifiedDate sui file e copia nell'archivio di destinazione solo quello nuovo e aggiornato più di recente. Se si consente ad ADF di analizzare grandi quantità di file, ma si copiano solo alcuni file nella destinazione, questo richiederà ancora molto tempo a causa del processo di analisi dei file.

Per istruzioni dettagliate, vedere l'esercitazione seguente:

Per i modelli vedere l'argomento seguente:

Caricamento di nuovi file solo mediante cartelle o nomi file partizionati per tempo.

È possibile copiare solo i nuovi file se i file o le cartelle sono già stati partizionati in base al tempo con informazioni temporali inserite nel nome di file o cartella (ad esempio, /aaaa/mm/gg/file.csv). Si tratta dell'approccio più efficiente per il caricamento incrementale di nuovi file.

Per istruzioni dettagliate, vedere l'esercitazione seguente:

Passare all'esercitazione seguente: