Condividi tramite


Modello di risorse di Analisi di flusso di Azure

Analisi di flusso di Azure è una piattaforma distribuita come servizio (PaaS) completamente gestita per l'elaborazione dei flussi. Questo articolo descrive il modello di risorsa per Analisi di flusso introducendo il concetto di cluster di Analisi di flusso, processo e componenti di un processo.

Processo di Analisi di flusso

Un processo di Analisi di flusso è l'unità fondamentale di Analisi di flusso che consente di definire ed eseguire la logica di elaborazione del flusso. Un processo è costituito da 3 componenti principali:

  • Inserimento
  • Risultato
  • Quesito

Inserimento

Un processo può avere uno o più input da cui leggere continuamente i dati. Queste origini dati di input di streaming possono essere Hub eventi di Azure, Hub IoT di Azure o Archiviazione di Azure. Analisi di flusso supporta anche la lettura di dati di input statici o a modifica lenta (denominati dati di riferimento), spesso usati per arricchire i dati di streaming. L'aggiunta di questi input al processo è un'operazione senza codice.

Risultato

Un processo può avere uno o più output in cui scrivere dati in modo continuo. Analisi di flusso supporta 12 sink di output diversi, tra cui il database SQL di Azure, Azure Data Lake Storage, Azure Cosmos DB, Power BI e altro ancora. L'aggiunta di questi output al job è un'operazione senza codice.

Quesito

È possibile implementare la logica di elaborazione del flusso scrivendo una query SQL nel tuo job. Il supporto avanzato del linguaggio SQL consente di affrontare scenari come l'analisi di json complessi, i valori di filtro, l'elaborazione di aggregazioni, l'esecuzione di join e casi d'uso ancora più avanzati, ad esempio l'analisi geospaziale e il rilevamento delle anomalie. È anche possibile estendere questo linguaggio SQL con funzioni definite dall'utente JavaScript e aggregazioni definite dall'utente. Stream Analytics consente anche di regolare facilmente gli eventi in ritardo e fuori ordine tramite semplici configurazioni nelle impostazioni del processo. È anche possibile scegliere di eseguire la query in base all'ora di arrivo dell'evento di input nell'origine di input o quando l'evento è stato generato nell'origine evento.

Esecuzione di un lavoro

Dopo aver sviluppato il processo configurando input, output e query, è possibile avviare il processo specificando il numero di unità di streaming. Una volta avviato il processo, passa a uno stato In esecuzione e rimarrà in tale stato fino a quando non viene arrestato esplicitamente o incontra un errore irreversibile. Quando il processo è in esecuzione, recupera continuamente dati dalle origini di input, applica la logica della query che produce risultati che vengono scritti nelle destinazioni di output con una latenza end-to-end misurata in millisecondi.

All'avvio del processo, il servizio Analisi di flusso si occupa della compilazione della query e assegna una certa quantità di calcolo e memoria in base al numero di unità di streaming configurate nel processo. Non è necessario preoccuparsi di un'infrastruttura sottostante come manutenzione del cluster, le patch di sicurezza in quanto vengono eseguite automaticamente dalla piattaforma. Quando si eseguono processi nello SKU Standard, vengono addebitati i costi per le unità di streaming solo quando viene eseguito il processo.

Cluster di Analisi Streaming

Per impostazione predefinita, i processi di Analisi di flusso vengono eseguiti nell'ambiente multi-tenant Standard che costituisce lo SKU Standard. Analisi di flusso offre anche uno SKU dedicato, che consente di effettuare il provisioning di un intero cluster di analisi di flusso di proprietà. In questo modo è possibile controllare completamente i processi eseguiti nel cluster. Le dimensioni minime di un cluster di Analisi di flusso sono pari a 12 unità di streaming e vengono addebitate le spese per l'intera capacità del cluster da quando viene effettuato il provisioning. Altre informazioni sui vantaggi dei cluster di Analisi di flusso e su quando usarli.

Diagramma che mostra l'ambiente multi-tenant Standard in Stream Analytics.

Diagramma che mostra l'ambiente dedicato in Analisi di flusso.

Passaggi successivi

Informazioni su come gestire Analisi di flusso di Azure e altri concetti: