Il progetto tardigrado protegge i tuoi vms dai guasti dell'host

Sommario:

Video: Utilizzare Windows 95 su CPU potenti e VirtualBox (Come risolvere "Errore di protezione") 2024

Video: Utilizzare Windows 95 su CPU potenti e VirtualBox (Come risolvere "Errore di protezione") 2024
Anonim

Dopo più modifiche di Azure e miglioramenti della sicurezza negli ultimi due mesi, Microsoft sta introducendo Project Tardigrade come il loro ultimo tentativo di rendere Azure più affidabile.

Il progetto Tardigrade impedisce guasti alla piattaforma

Project Tardigrade è un nuovo servizio che mira a migliorare la resilienza di Azure. Include strategie di mitigazione che proteggono le macchine virtuali di Azure dagli errori della piattaforma.

Ecco come Mark Russinovich, Chief Technology Officer di Microsoft Azure, sta descrivendo l'attuale lavoro su Azure:

Il nostro obiettivo è consentire alle organizzazioni di eseguire i carichi di lavoro in modo affidabile su Azure. Con questo come principio guida, investiamo continuamente nell'evoluzione della piattaforma Azure per diventare resistenti ai guasti, non solo per aumentare la produttività aziendale, ma anche per offrire un'esperienza cliente senza soluzione di continuità.

Per prevenire l'impatto sui carichi di lavoro, il servizio consente ai componenti di autoguarigione e di recuperare rapidamente da potenziali guasti, anche in caso di guasti critici dell'host.

Come funziona Project Tardigrade?

Ecco un esempio di come funziona il flusso di lavoro di recupero di Tardigrade:

  • Fase 1: questo passaggio non ha alcun impatto sull'esecuzione di macchine virtuali dei clienti. Ricicla semplicemente tutti i servizi in esecuzione sull'host. Nel raro caso in cui il servizio difettoso non si riavvii correttamente, si passa alla Fase 2.
  • Fase 2: il nostro servizio di diagnostica viene eseguito sull'host per raccogliere sistematicamente tutti i registri / i dump pertinenti, per garantire che possiamo diagnosticare a fondo il motivo dell'errore nella fase 1. Questa analisi completa ci consente di "causare la causa" del problema e quindi prevenire le ricorrenze nel futuro.
  • Fase 3: a un livello elevato, ripristiniamo il sistema operativo in uno stato integro con un impatto minimo sul cliente per mitigare il problema dell'host. Durante questa fase conserviamo gli stati di ogni VM su RAM, dopodiché iniziamo a ripristinare il sistema operativo in uno stato integro. Mentre il sistema operativo si reimposta rapidamente sotto, l'esecuzione delle applicazioni su tutte le macchine virtuali ospitate sul server si "blocca" brevemente quando la CPU viene temporaneamente sospesa. Questa esperienza è simile a una connessione di rete temporaneamente persa ma ripresa rapidamente a causa della logica dei tentativi. Dopo che il sistema operativo è stato ripristinato correttamente, le VM consumano il loro stato archiviato e riprendono la normale attività, aggirando in tal modo qualsiasi potenziale riavvio della VM.

A tal fine, Project Tardigrade garantirà che il guasto di ogni singolo componente nell'host non influisca sull'intero sistema. Pertanto, le VM dei clienti non saranno interessate da errori dell'host.

Microsoft sta lavorando duramente per migliorare ed espandere i diversi scenari di errore dell'host per garantire che la propria piattaforma di cloud computing sia più affidabile che mai.

Aspettatevi nuovi sviluppi e altre implementazioni di affidabilità nel prossimo futuro.

Il progetto tardigrado protegge i tuoi vms dai guasti dell'host