L’AI dal cloud all’edge: l’innovazione data da Azure Local ed Azure Arc

Nell’era dell’Intelligenza Artificiale, che sta trasformando in modo sostanziale i modelli di business, l’adozione di infrastrutture locali e distribuite è fondamentale per gestire workload specifici e mission-critical. In questo contesto, Azure Local si presenta come una soluzione innovativa in grado di colmare il divario tra il cloud e l’edge computing, portando applicazioni, dati e servizi di AI esattamente dove servono. In questo articolo analizzeremo gli scenari reali in cui Azure Local, abbinato ad Azure Arc, consente l’elaborazione dei dati in tempo reale “alla fonte” e l’implementazione di soluzioni avanzate di intelligenza artificiale. Approfondiremo anche i nuovi servizi Azure AI progettati per Azure Local, focalizzati sulla possibilità di sfruttare al meglio i dati on-premises.

Scenari reali di infrastruttura locale e distribuita con Azure Local

Nei paragrafi successivi, esploriamo alcuni esempi concreti che mostrano come Azure Local, in sinergia con Azure Arc, risponda in modo efficace alle esigenze di infrastruttura distribuita, garantendo bassa latenza, sicurezza e continuità operativa in diversi contesti aziendali e industriali.

Figura 1 – Scenari reali di infrastruttura locale e distribuita con Azure Local

Local AI Inferencing

In molte situazioni, analizzare i dati in tempo reale direttamente all’edge (ad esempio, all’interno di un punto vendita o di un impianto industriale) offre vantaggi notevoli in termini di latenza e di riduzione dell’uso di banda. Azure Local consente di processare i dati in loco, evitando di doverli trasferire tutti nel cloud prima di effettuare analisi critiche. Ecco alcuni esempi:

  • Retail Loss Prevention: con l’AI integrata in locale, è possibile identificare comportamenti sospetti e potenziali furti in tempo reale, offrendo ai retailer la possibilità di intervenire immediatamente e ridurre le perdite.
  • Smart Self-Checkout: la videosorveglianza e l’analisi visiva permettono il riconoscimento automatico degli articoli, migliorando l’esperienza del cliente e riducendo i tempi di attesa.
  • Pipeline Monitoring: in settori come oil & gas, il monitoraggio video dell’infrastruttura in tempo reale aiuta a rilevare anomalie e perdite, riducendo i rischi ambientali e garantendo interventi tempestivi.

Continuità operativa in ambienti mission-critical

La capacità di garantire la continuità del business in caso di interruzioni di rete o di alimentazione è un elemento cruciale. Con Azure Local è possibile implementare sistemi robusti per preservare l’operatività anche quando la connettività al cloud è limitata o assente. Alcuni esempi:

  • Operazioni in fabbriche e magazzini: la produzione e la gestione dell’inventario non possono fermarsi; avere una soluzione in locale garantisce che linee di produzione e sistemi di gestione funzionino anche in caso di disservizi di rete.
  • Stadi e strutture per eventi: sicurezza, biglietteria e illuminazione sono servizi essenziali che devono rimanere sempre attivi, per salvaguardare sia l’esperienza degli spettatori sia la loro incolumità.
  • Hub di trasporto: l’operatività costante di sistemi di biglietteria, pianificazione corse e comunicazioni è fondamentale per il flusso dei passeggeri e la sicurezza nei grandi snodi di transito.

Sistemi di controllo e Near Real-Time Processing

Alcuni ambienti industriali, finanziari e sanitari richiedono tempi di risposta estremamente bassi per evitare errori, garantire la sicurezza o massimizzare le prestazioni. Azure Local, in abbinamento ad Azure Arc, può gestire queste esigenze di latenza:

  • Manufacturing Execution System (MES): la sincronizzazione e il monitoraggio continuo delle macchine di produzione permettono di ottimizzare i processi e ridurre al minimo i tempi di fermo.
  • Quality Assurance (QA) industriale: controlli e verifiche di qualità immediati identificano i difetti prima che raggiungano lo stadio finale di produzione, aumentando la conformità e riducendo gli sprechi.
  • Infrastrutture finanziarie: l’elaborazione di transazioni finanziarie a bassa latenza e la valutazione rapida del rischio sono fondamentali per la competitività e la stabilità dei mercati.

Conformità normativa e connettività DDIL (Disconnected, Degraded, Intermittent, Limited)

Per molte realtà (governative, militari, o per chi lavora con infrastrutture critiche), la protezione dei dati e la gestione sicura anche in assenza di una connessione affidabile rappresentano un’esigenza prioritaria. Azure Local supporta la necessità di mantenere i dati e il controllo in sede:

  • Governo e settori militari: la riservatezza dei dati è massima e richiede la gestione in locale per assicurare l’accesso continuo anche in scenari di rete compromessa.
  • Infrastrutture energetiche: la stabilità delle reti di distribuzione e il controllo di gasdotti e raffinerie richiedono resilienza anche in condizioni di connettività ridotta, nel rispetto di normative stringenti.

L’approccio adaptive cloud di Azure

L’adaptive cloud approach di Microsoft, abilitato da Azure Arc, aiuta le organizzazioni a unificare infrastrutture ibride, multicloud ed edge all’interno di Azure. Grazie ad Azure Arc, le stesse esperienze e funzionalità tipiche del cloud (come sicurezza, aggiornamenti, gestione, scalabilità) possono essere estese a qualsiasi luogo: dai data center locali fino alle sedi distribuite.

Figura 2 – Adaptive cloud approach

Azure Local, collegato al cloud attraverso Azure Arc, permette di:

  • Operare e scalare l’infrastruttura distribuita tramite il portale Azure e tramite le stesse API.
  • Eseguire servizi fondamentali di compute, rete, storage e applicazioni localmente, scegliendo l’hardware del vendor preferito.
  • Rafforzare la sicurezza di app e dati con tecnologie Azure, proteggendole contro minacce avanzate.

Un punto chiave è la presenza di Azure Kubernetes Service (AKS), la soluzione Kubernetes gestita da Microsoft. Su Azure Local, AKS può essere configurato e aggiornato automaticamente, fornendo tutto il necessario (driver storage, immagini container per Linux e Windows, ecc.) per supportare applicazioni containerizzate. Inoltre, ogni cluster è automaticamente abilitato con Azure Arc, consentendo l’integrazione con servizi come Microsoft Defender for Containers, Azure Monitor e GitOps per la continuous delivery.

Figura 3- Porta ovunque app, dati e intelligenza artificiale di Azure

Nuovi servizi Azure AI con Azure Local ed Azure Arc

Ricerca sui dati on-premises con AI generativa

Negli ultimi anni, l’AI generativa ha compiuto enormi passi avanti, grazie all’introduzione di modelli linguistici (come GPT) in grado di interpretare e generare testo in linguaggio naturale. Gli strumenti pubblici come ChatGPT funzionano molto bene per interrogazioni di conoscenza generale, ma non possono rispondere a quesiti relativi ai dati aziendali privati su cui non sono stati addestrati. Per colmare questa lacuna, è stato introdotto il concetto di Retrieval Augmented Generation (RAG), una tecnica che “arricchisce” i modelli linguistici con dati proprietari, aprendo così la strada a casi d’uso più avanzati e personalizzati.

Nell’ambito di Azure Local, Microsoft ha annunciato un nuovo servizio che porta l’AI generativa e RAG direttamente dove risiedono i dati, ovvero all’edge. In pochi minuti, è possibile distribuire (tramite un’estensione di Azure Arc) tutto il necessario per porre domande sui propri dati on-premises, tra cui:

  • Modelli linguistici piccoli e grandi (SLM/LLM) in esecuzione locale, con supporto sia per CPU sia per GPU.
  • Una pipeline end-to-end di acquisizione dati e RAG che mantiene tutte le informazioni in sede, con controlli RBAC (Role-Based Access Control) per assicurare un accesso protetto.
  • Uno strumento integrato per il prompt engineering e la valutazione dei risultati, utile per ottimizzare settaggi e prestazioni del modello.
  • API e interfacce coerenti con gli standard Azure, così da facilitare l’integrazione nelle applicazioni aziendali, oltre a un’interfaccia “preconfezionata” (UI) per iniziare subito a usare il servizio.

Questa funzionalità è già disponibile in anteprima privata per i clienti che utilizzano Azure Local e, nel prossimo futuro, Microsoft prevede di renderla fruibile anche su altre piattaforme Arc-enabled.

“Edge RAG”: l’ecosistema di Retrieval-Augmented Generation in locale

Questo nuovo servizio, definito “Edge RAG”, si inserisce nell’ecosistema di Azure come un blocco centrale che può contemplare diversi componenti in ingresso, quali:

  • Azure AI Search: fornisce funzionalità di ricerca e indicizzazione di documenti, permettendo di individuare in modo rapido i contenuti più rilevanti all’interno di grandi volumi di dati.
  • Azure OpenAI: offre modelli di AI avanzati (come GPT), capaci di generare, comprendere e riassumere testo in linguaggio naturale.
  • Azure AI Studio: una piattaforma per sviluppare e gestire asset di intelligenza artificiale (dataset, modelli, pipeline) in modo centralizzato.

Grazie a questi elementi, “Edge RAG” offre un flusso integrato: dall’ingestione dei dati fino all’inferenza e alla presentazione dei risultati via chat o altre modalità di sviluppo. Ciò abilita la creazione di chatbot, strumenti di knowledge discovery e altre soluzioni di AI che sfruttano il patrimonio informativo interno dell’azienda, in un ambiente sicuro, personalizzabile e conforme.

Distribuzione di modelli AI open source tramite Azure Arc

Un altro aspetto fondamentale dell’offerta Azure AI è la disponibilità di un catalogo di modelli AI testati, validati e garantiti da Microsoft pronti per il deployment e con endpoint di inferenza consistenti. Questa esigenza si rispecchia anche all’edge, dove Microsoft rende ora disponibili una selezione di modelli direttamente dal portale Azure:

  • Phi-3.5 Mini (modello linguistico da 3,8 miliardi di parametri)
  • Mistral 7B (modello linguistico da 7,3 miliardi di parametri)
  • MMDetection YOLO (rilevamento oggetti)
  • OpenAI Whisper Large (riconoscimento vocale speech-to-text)
  • Google T5 Base (traduzione automatica)

Tutti questi modelli possono essere distribuiti in pochi passaggi su un cluster Arc AKS che gira on-premises. In particolare, la maggior parte richiedono esclusivamente una CPU, ma per Phi-3.5 e Mistral 7B è disponibile anche il supporto alle GPU, offrendo performance superiori per scenari di inferenza più intensivi.

L’offerta di Azure AI “dal cloud all’edge”

L’approccio di Microsoft copre l’intero spettro di funzionalità di AI, offrendo servizi e strumenti che possono essere erogati nel cloud Azure oppure “estesi” in ambienti on-premises o edge tramite Azure Arc. Questa offerta si compone di quattro pilastri principali:

  • Application Development
    • Azure AI Studio: ambiente per lo sviluppo di applicazioni AI (ad esempio chatbot, agenti virtuali), fornendo un set completo di API e interfacce per integrare funzionalità AI in modo semplice e veloce.
  • AI Services
    • Azure AI language e model services: servizi preconfigurati di NLP (Natural Language Processing), visione artificiale e altre funzionalità AI.
    • Soluzioni come Edge RAG, Video Indexer e Managed AI Containers consentono di distribuire localmente modelli AI “pronti all’uso”.
  • Machine Learning & ML Ops
    • Azure Machine Learning Studio: piattaforma completa per la creazione, l’addestramento, l’ottimizzazione e la gestione di modelli di machine learning.
    • Con Azure Arc, la stessa esperienza di ML Ops può essere portata all’edge, grazie a estensioni come l’AML Arc Extension, che permettono di sfruttare gli strumenti di Azure ML su infrastrutture on-premises e negli edge.
  • Infrastruttura
    • Azure global infrastructure: la base cloud di Azure, comprendente risorse di calcolo, archiviazione e networking.
    • Arc-enabled edge infrastructure: estensione delle funzionalità di Azure al data center o ai dispositivi periferici, gestiti come fossero risorse del cloud.

Conclusioni

La strategia di Microsoft si fonda sulla volontà di portare il meglio del cloud “ovunque”. Azure Local è l’emblema di questa visione: una soluzione che offre tutti i vantaggi del cloud – agilità, scalabilità, sicurezza – direttamente in ambiente locale, soddisfacendo esigenze di bassa latenza, continuità operativa e conformità normativa.

Grazie ad Azure Arc, le organizzazioni possono sfruttare servizi Azure AI come modelli di linguaggio avanzati, pipeline di Retrieval-Augmented Generation (RAG), e strumenti di ML Ops in modalità ibrida. Le applicazioni sono innumerevoli: dal controllo di qualità in fabbrica alla prevenzione di furti in negozio, dai sistemi critici nei data center governativi al monitoraggio di infrastrutture energetiche.

In un mondo in cui i dati continuano a crescere esponenzialmente e la necessità di analizzarli “sul posto” si fa sempre più pressante, soluzioni come Azure Local rappresentano il passo successivo verso una nuova generazione di infrastrutture distribuite. È così che Microsoft risponde alla sfida di unire il potenziale del cloud con la realtà on-premises, creando opportunità di innovazione e di crescita per ogni settore.