L’evoluzione dell’alta disponibilità e del disaster recovery nelle infrastrutture moderne: il caso di Azure Local

Le soluzioni di alta disponibilità e disaster recovery assumono un ruolo sempre più centrale nelle strategie di adozione delle infrastrutture moderne. Azure Local, la piattaforma on-premises connessa al cloud di Microsoft, rappresenta un esempio emblematico di questa trasformazione.

A partire dalla versione 23H2, Azure Local introduce una nuova generazione di funzionalità, abbandonando il modello tradizionale degli Stretched Cluster per proporre approcci più moderni e flessibili, progettati per ottimizzare la resilienza e semplificare la gestione. Attraverso nuove configurazioni come il Rack Aware Cluster e il supporto per il disaster recovery tramite Azure Site Recovery, Azure Local si posiziona come una piattaforma strategica per le organizzazioni che puntano su soluzioni robuste, scalabili e coerenti con l’ecosistema Azure. In questo articolo, esploreremo le principali novità introdotte da Azure Local versione 23H2, analizzando le nuove opzioni di alta disponibilità, le strategie di disaster recovery e l’impatto della transizione dagli Stretched Cluster verso un modello più avanzato.

Azure Local, versione 23H2: un’evoluzione Arc-enabled

La nuova versione 23H2 segna un importante passo avanti, trasformandosi da un semplice sistema operativo cloud-connected a una soluzione abilitata da Azure Arc, con funzionalità come Arc Resource Bridge, Arc VM e AKS integrate. Questa trasformazione espande le possibilità di gestione e controllo degli ambienti distribuiti, offrendo un’esperienza di amministrazione unificata. Inoltre, la gestione multi-sito si estende oltre il livello del sistema operativo, rendendo obsolete le funzionalità dei precedenti Stretched Cluster e introducendo nuovi paradigmi di resilienza e affidabilità.

Opzioni di Alta Disponibilità

Rack Aware Cluster: alta disponibilità per brevi distanze

La novità principale per scenari a breve distanza è il Rack Aware Cluster, una configurazione che permette di:

  • Distribuire il cluster su due rack o due stanze nello stesso Layer-2 network (ad esempio, in uno stabilimento produttivo o in un campus).
  • Funzionare come una sorta di availability zone locale, garantendo isolamento dei guasti e posizionamento ottimale dei carichi di lavoro.
Figura 1 – Rack Aware Cluster: architettura di rete

Questa configurazione rappresenta una soluzione ottimale per chi desidera combinare efficienza e semplicità di gestione in ambienti locali. L’adozione di un unico pool di storage riduce la complessità e migliora l’efficienza complessiva, evitando il sovraccarico derivante da una replica eccessiva dei dati. Il Rack Aware Cluster è ideale per sedi periferiche (edge locations) e può scalare fino a 8 nodi (4 per rack). Attualmente, la funzione è in private preview e si prevede una disponibilità pubblica entro il 2025.

È interessante notare come, anche su Azure Local, si introduca il concetto di availability zone, un allineamento significativo con il modello già consolidato su Azure per garantire massima affidabilità e continuità operativa.

Opzioni di Disaster Recovery

Replica verso il cloud con Azure Site Recovery

Per scenari di disaster recovery su lunghe distanze, Azure Local sfrutta Azure Site Recovery (ASR) per replicare le macchine virtuali locali nel cloud Azure. Questa soluzione consente di effettuare:

  1. Replica: trasferire i dischi delle VM su uno storage account in Azure, proteggendo i dati da eventuali disastri.
  2. Failover: eseguire le VM replicate direttamente su Azure in caso di disastro, assicurando la continuità operativa.
  3. Re-protect: replicare le VM di nuovo verso il cluster locale, mantenendo un ciclo continuo di protezione.
  4. Failback: riportare i carichi di lavoro dal cloud al sistema on-premises senza interruzioni significative.

La gestione di queste operazioni avviene in modo centralizzato tramite il portale di Azure, garantendo semplicità ed efficienza per gli amministratori di sistema.

Replica locale con Hyper-V Replica

Per carichi di lavoro che non possono essere spostati sul cloud, Azure Local supporta Hyper-V Replica, una soluzione che replica le VM Arc su un sito secondario. Questo approccio consente di:

  • Garantire la continuità operativa replicando i dati in una posizione remota.
  • Gestire il ripristino delle VM come macchine virtuali Hyper-V sul sito secondario e ritornare a Arc VM al ripristino sul cluster primario.

Questa funzionalità, integrata nel ruolo Hyper-V, rappresenta un’opzione essenziale per garantire resilienza in scenari multi-sito.

La transizione dagli Stretched Cluster

Gli Stretched Cluster, introdotti con Azure Local versione 22H2, sfruttavano Storage Replica per garantire la resilienza tra due gruppi di nodi situati in siti distinti. Questa configurazione:

  • Richiedeva almeno 2 nodi per sito e replicava lo storage in modalità sincrona, assicurando l’integrità dei dati in caso di guasti.
  • Permetteva la migrazione live delle VM tra siti, offrendo una transizione fluida per manutenzioni pianificate.

Tuttavia, questa soluzione richiedeva operazioni manuali per invertire la direzione della replica dello storage, un processo che poteva introdurre complessità e impatti sulle prestazioni. Con la versione 23H2, gli Stretched Cluster non sono più supportati. Tuttavia, i cluster configurati con la versione 22H2 possono essere aggiornati parzialmente al sistema operativo 23H2, mantenendo la compatibilità, ma senza beneficiare delle nuove funzionalità offerte dalla versione più recente.

Per i clienti che utilizzano ancora questa configurazione, è consigliabile valutare l’adozione delle nuove opzioni di alta disponibilità e disaster recovery offerte da Azure Local, che garantiscono maggiore efficienza ed affidabilità.

Conclusioni

Le nuove funzionalità di Azure Local versione 23H2 riflettono un’evoluzione significativa verso una gestione più flessibile, moderna e in linea con l’ecosistema Azure. Grazie a soluzioni come il Rack Aware Cluster e l’integrazione con Azure Site Recovery, le organizzazioni possono migliorare la resilienza dei loro ambienti locali e garantirsi opzioni di disaster recovery scalabili e integrate. Inoltre, l’abbandono del modello Stretched Cluster apre la strada a configurazioni più efficienti e semplificate, permettendo ai clienti di sfruttare appieno le potenzialità offerte dalle tecnologie Azure.