Condividi tramite


Preparare le operazioni cloud di Azure

La gestione dell'ambiente Di Azure non riguarda solo il mantenimento delle luci. Si tratta di mantenere la governance e la sicurezza garantendo al tempo stesso che il cloud rimanga allineato agli obiettivi aziendali. Man mano che l'ambiente cresce, è necessario evitare la deriva della configurazione, migliorare le distribuzioni tramite l'infrastruttura come codice e gestire le modifiche in modo efficace.

La metodologia di gestione di Cloud Adoption Framework (CAF) introduce l'approccio RAMP (Ready, Administer, Monitor, Protect) per creare queste funzionalità. RAMP offre un modo strutturato per organizzare i team, definire le responsabilità e implementare i processi e gli strumenti che mantengono le operazioni di Azure sicure, conformi e resilienti. Dall'amministrazione quotidiana al monitoraggio dell'integrità e della protezione dalle interruzioni, RAMP consente di stabilire una solida base operativa per il successo a lungo termine.

Diagramma che mostra il processo di gestione del Cloud Adoption Framework: preparare, amministrare, monitorare e proteggere (RAMP).

Identificare le responsabilità di gestione

La gestione efficace di Azure si estende su due livelli di responsabilità: responsabilità centrale (piattaforma) e responsabilità del carico di lavoro . Le responsabilità centrali si applicano all'intero ambiente cloud. Le responsabilità del carico di lavoro sono incentrate su singole applicazioni o servizi. Usare la tabella 1 per assicurarsi che il modello operativo copra le aree essenziali di gestione del cloud

Tabella 1. Responsabilità principali della gestione del cloud

Aree di gestione cloud Responsabilità centrali (piattaforma) Responsabilità del carico di lavoro
Compliance ▪ Definire le procedure operative.
▪ Applicare i criteri di governance.
Monitorare la conformità e risolvere o escalare in base alle esigenze.
▪ Seguire le procedure operative.
▪ Allineare la progettazione ai criteri di governance.
Security ▪ Gestire le operazioni di sicurezza a livello di organizzazione.
▪ Gestire le identità in Microsoft Entra ID.
▪ Concedere l'accesso alle sottoscrizioni di Azure.
▪ Definire e gestire le baseline di sicurezza tramite Criteri di Azure e Microsoft Defender for Cloud.
▪ Supervisionare l'integrazione della protezione dalle minacce e della risposta agli eventi imprevisti con Microsoft Sentinel.
▪ Implementare la progettazione sicura del carico di lavoro.
▪ Rispondere agli avvisi di sicurezza e agli eventi imprevisti specifici del carico di lavoro.
▪ Valutare continuamente le vulnerabilità all'interno del carico di lavoro.
Gestione delle risorse ▪ Definire e gestire la gerarchia delle risorse.
▪ Creare sottoscrizioni per carichi di lavoro come richiesto.
▪ Definire la strategia di denominazione e assegnazione di tag.
▪ Definire la topologia di rete.
▪ Configurare la rete condivisa (peering di rete virtuale, connettività locale).
▪ Gestire risorse/servizi condivisi tra diversi carichi di lavoro.
▪ Monitorare i limiti delle sottoscrizioni e gestire le richieste di aumento della quota.
▪ Gestire sottoscrizioni specifiche del carico di lavoro (se delegate).
▪ Gestire gruppi di risorse e risorse per ogni carico di lavoro.
▪ Rispettare e applicare standard di denominazione e assegnazione di tag.
▪ Gestire l'utilizzo delle risorse a livello di applicazione, assicurandosi che le risorse rimangano entro le quote di sottoscrizione.
Distribuzione ▪ Standardizzare e gestire pipeline e strumenti CI/CD (Azure DevOps, GitHub Actions).
▪ Definire modelli di infrastruttura come codice di riferimento (Bicep, Terraform, modelli ARM).
▪ Fornire procedure consigliate centrali per la sicurezza delle pipeline (analisi del codice, gestione dei segreti).
▪ Usare il framework CI/CD centrale e i modelli IaC per le distribuzioni dei carichi di lavoro.
▪ Implementare attività di distribuzione specifiche del carico di lavoro (configurare le impostazioni dell'app, il database).
▪ Adattare i modelli di riferimento alle esigenze del carico di lavoro rispettando le linee guida centrali.
Sviluppo ▪ Fornire e applicare toolchain e framework di sviluppo standardizzati per accelerare la coerenza (standard di codifica, procedure consigliate per DevOps).
▪ Gestire repository interni o feed di pacchetti per librerie o moduli condivisi.
▪ Adottare e adattare toolchain standard per lo sviluppo del carico di lavoro.
▪ È proprietario del ciclo di vita dell'applicazione e incorpora le procedure consigliate (unit test, test di integrazione).
▪ Gestire il miglioramento continuo per la base di codice del workload.
Monitoraggio ▪ Pianificare la strategia di monitoraggio.
Avviso sulle responsabilità centralizzate.
▪ Fornire dashboard per le metriche operative comuni nell'ambiente.
▪ Monitorare il carico di lavoro
▪ Estendere o ottimizzare gli avvisi centrali per acquisire condizioni specifiche del carico di lavoro.
▪ Analizzare e correggere gli eventi imprevisti a livello di carico di lavoro in base a avvisi e log.
Costo ▪ Distribuire budget cloud globali o a livello di abbonamento
▪ Monitorare la spesa cloud a livello di organizzazione e creare report sui costi.
▪ Allocare i costi alle business unit o ai prodotti, in genere usando tag o modelli di allocazione dei costi personalizzati.
▪ Applicare la strategia di assegnazione di tag per l'allocazione dei costi.
Progettare un carico di lavoro ottimizzato per ottimizzare i costi
▪ Rispettare i vincoli di budget.
Reliability ▪ Definire i requisiti di affidabilità (SLO, RPO, RTO) per priorità del carico di lavoro.
▪ Fornire indicazioni sulla continuità aziendale e sul ripristino di emergenza (BCDR).
▪ Gestire soluzioni di ripristino di emergenza centralizzate.
▪ Supportare la gestione degli eventi imprevisti principali in tutti i carichi di lavoro.
▪ Progettare un carico di lavoro per soddisfare i requisiti di affidabilità.
Performance ▪ Monitorare e mantenere le prestazioni in componenti centralizzati (rete hub, servizi condivisi).
▪ Fornire linee guida per l'ottimizzazione delle prestazioni e la pianificazione della capacità.
▪ Monitorare la quota
▪ Progettare un carico di lavoro per l'efficienza delle prestazioni.

Impostare le operazioni cloud

Usare le responsabilità descritte nella tabella 1 per creare una base operativa efficace. Definire chiaramente team, standard e processi seguendo questa procedura:

  1. Definire il modello operativo cloud. Scegliere un modello operativo centralizzato, condiviso o decentralizzato in base alle dimensioni e alla maturità dell'organizzazione. Per indicazioni, vedere Scegliere un modello operativo cloud

  2. Assegnare le responsabilità centrali della piattaforma. Formare un team dedicato per gestire le attività di gestione centrale. Sviluppare una matrice di competenze dalla tabella 1 per identificare le competenze necessarie.

  3. Assegnare le responsabilità del carico di lavoro. Configurare team specializzati per attività specifiche del carico di lavoro. Identificare le responsabilità usando la tabella 1 e quindi reclutare di conseguenza. Usare Azure Well-Architected Framework e il relativo pilastro Di eccellenza operativa per guidare le responsabilità di gestione del carico di lavoro.

  4. Assegnare la responsabilità. Assegnare un nome a proprietari specifici per tutte le responsabilità di gestione del cloud. In un modello di gestione condivisa, i team del carico di lavoro devono avere autonomia per gestire le sottoscrizioni.

Documentare le operazioni cloud

Documentare chiaramente le operazioni cloud per consentire una risposta efficiente alle crisi e un'implementazione uniforme dei cambiamenti. Stabilire procedure generali e creare guide dettagliate per attività frequenti e specifiche.

Documentare le procedure operative

Definire procedure operative per la gestione delle modifiche, del ripristino di emergenza e delle attività di manutenzione di routine che l'automazione non può gestire. Segui questi passaggi:

  1. Definire le procedure di gestione delle modifiche. La modifica è la causa principale dell'errore nel cloud. Sviluppare un processo standardizzato per la gestione delle modifiche per evitare errori nell'ambiente cloud. Consulta Gestire le modifiche.

  2. Definire le procedure di distribuzione (gestione delle versioni). Per mantenere una configurazione coerente, standardizzare le distribuzioni, le versioni e le promozioni dell'ambiente. Vedere Gestire le distribuzioni.

  3. Definire le procedure di ripristino di emergenza e di continuità aziendale. Per gestire i potenziali errori, preparare un piano di risposta standardizzato. Vedere Gestire il ripristino di emergenza e la continuità aziendale.

  4. Definire procedure aggiuntive. Processi di documento per la gestione delle richieste di servizio, dell'applicazione di patch e della gestione della configurazione. Documentare chiaramente questi processi per garantire agli stakeholder come avviare o completare ogni attività.

Documentazione delle istruzioni operative

Creare guide dettagliate (runbook o playbook) per le principali attività operative. Questa preparazione garantisce un'esecuzione coerente, migliora l'efficienza e riduce i tempi di risoluzione durante gli eventi critici.

  1. Definire le attività quotidiane. Preparare i manuali che coprono le responsabilità quotidiane, ad esempio le richieste di escalation dei privilegi e le revisioni dei log. Stabilire procedure operative standard (SOP) per il monitoraggio di metriche, soglie di avviso e dashboard per ogni sistema.

  2. Creare una libreria di runbook incentrati su Azure. Creare runbook specifici di Azure per scenari come:

    Scenario Example
    Utilizzo elevato della CPU Gestire l'aumento delle prestazioni nel servizio app di Azure
    Failover e failback Failover e failback in Azure Site Recovery
    Distribuzioni blu/verde Distribuzione blu/verde in Frontdoor di Azure
    Ripristino del backup Ripristino dei backup in Azure Blob Storage e Azure Cosmos DB
  3. Archiviare questi runbook in un repository centrale. Gestire i runbook in un repository centrale accessibile dai tecnici su chiamata per un uso immediato durante gli eventi imprevisti.

  4. Implementare operazioni a livello di codice. Integrare l'infrastruttura come codice nei runbook per distribuire le risorse comuni in modo coerente e accurato ogni volta.

  5. Rivedere e aggiornare. Esaminare e rivedere periodicamente la documentazione per riflettere le modifiche operative e gli aggiornamenti del servizio cloud.

Strumenti e soluzioni per documenti

La documentazione chiara garantisce coerenza, riduce i rischi operativi e migliora l'efficienza del team. Creare e gestire documentazione completa per gli strumenti cloud. Aggiornare regolarmente la documentazione per riflettere le procedure correnti e garantire un'accessibilità semplice per tutti i membri del team.

Area Vantaggi di esempio
Integration La standardizzazione semplifica le integrazioni consolidando i log e i repository di codice.
Automazione Riutilizzare i modelli IaC tra team, script di automazione e procedure consigliate tra i progetti.
Gestione degli incidenti Acquisire i problemi e generare azioni correttive che si integrano nei cicli di rilascio.

Gestire le operazioni cloud

Una gestione efficace del cloud ottimizza l'efficienza operativa, riduce i tempi di inattività e chiarisce ruoli e responsabilità. Standardizzare le operazioni cloud tramite processi di automazione e supporto strutturato. Seguire queste linee guida operative:

  • Fornire supporto cloud continuo. Stabilire una copertura di supporto 24/7 tramite team globali che adottano un modello di follow-the-sun o rotazioni strutturate su chiamata. Definire chiaramente le responsabilità per garantire una risposta tempestiva e la risoluzione degli eventi imprevisti critici. Configurare avvisi automatizzati per notificare immediatamente al personale di supporto designato.

  • Automatizzare il lavoro ripetitivo. Usare le funzionalità di automazione di Azure per ridurre al minimo i processi manuali e ridurre il sovraccarico operativo. Automatizzare le attività di routine per eliminare gli errori, semplificare i flussi di lavoro e consentire ai team di concentrarsi sulle priorità strategiche.

    Caso d'uso Esempi
    Automazione Automatizzare i flussi di lavoro in Azure Boards o nel sistema ITSM. Modelli per gli elementi di lavoro "Richiesta di modifica" e "Evento imprevisto".
    Risposta agli eventi imprevisti Per generare automaticamente i ticket degli eventi imprevisti con i campi standard popolati, integrare Monitoraggio di Azure e Integrità dei servizi di Azure con il sistema di creazione di ticket.
    Gestione delle modifiche Usare App per la logica di Azure per applicare automaticamente modifiche a basso rischio o correggere automaticamente determinati eventi imprevisti.
    Compliance Usare Criteri di Azure per applicare e monitorare la conformità al cloud.
    Security Usare Microsoft Defender per Cloud e Microsoft Sentinel per automatizzare il rilevamento e la risposta delle minacce per la sicurezza. Usare Microsoft Entra ID Governance per esaminare le autorizzazioni e automatizzare la gestione delle autorizzazioni.

Migliorare le operazioni

Ottimizzare l'ambiente cloud di Azure promuovendo il miglioramento continuo. Valutare regolarmente le operazioni e classificare in ordine di priorità l'apprendimento e il feedback in corso. Segui questi passaggi:

  1. Esaminare le operazioni per migliorare. Seguire le procedure consigliate per monitorare l'integrità, la conformità, la sicurezza, i costi, i dati e le risorse cloud. Condurre revisioni operative settimanali per discutere le metriche chiave, gli eventi imprevisti recenti, le modifiche distribuite e i rischi previsti. Affrontare attivamente lo sprawl delle risorse e il debito tecnico.

  2. Formarsi per le operazioni. Favorire lo sviluppo continuo delle competenze assegnando priorità alle risorse di apprendimento essenziali. Gestire le operazioni cloud dinamiche tramite ambienti di training pratici. Nella tabella seguente vengono fornite risorse per il training delle operazioni.

    Formazione operativa Description
    Ottenere le credenziali Definire gli obiettivi per le credenziali Microsoft, ad esempio competenze applicate e certificazioni Microsoft per creare competenze.
    Usare le risorse operative Vedere Risorse di gestione di Azure.
    Usare la documentazione del prodotto Usare Microsoft Learn per trovare indicazioni sui servizi di Azure.
    Esercitati praticamente Incoraggiare la pratica diretta in ambienti sandbox non di produzione.

Risorse di gestione di Azure

Categoria Risorsa di gestione Description
Compliance CAF Govern Framework di governance del cloud di Microsoft
Security Gestire le operazioni di sicurezza Linee guida per gestire le operazioni di sicurezza
Security Strumento di sicurezza Microsoft Elenco degli strumenti di sicurezza di Microsoft e Azure
Security Sicurezza del carico di lavoro Guida alla gestione del carico di lavoro per la sicurezza
Gestione delle risorse Strategia di denominazione e assegnazione di tag Denominazione e assegnazione di tag alle raccomandazioni per gestire le risorse
Gestione delle risorse Abbreviazione di Azure Elenco di abbreviazioni per le risorse di Azure
Gestione delle risorse Azure Advisor Assistente digitale per allinearsi alle procedure consigliate di Azure.
Gestione delle risorse Regole di denominazione di Azure Regole di denominazione per tutte le risorse di Azure
Gestione delle risorse Guide ai servizi di Azure Linee guida per le decisioni di configurazione del servizio
Sviluppo Sviluppo di software del carico di lavoro Linee guida per il carico di lavoro per lo sviluppo di software
Sviluppo Centro di architettura di Azure Architetture e guide per casi d'uso diversi
Sviluppo Hub delle risorse per sviluppatori Hub per strumenti e risorse per sviluppatori
Distribuzione Modelli Bicep, Terraform e ARM Modelli IaC per ogni risorsa di Azure
Distribuzione Coppie di aree di Azure Elenco delle aree abbinate di Azure
Distribuzione Directory dei servizi cloud di Azure Directory di tutti i servizi di Azure
Distribuzione Distribuzione del carico di lavoro Linee guida sull'integrazione continua del carico di lavoro
Monitoraggio Monitorare il cloud estate di Azure Linee guida complete sul monitoraggio di Azure
Monitoraggio Monitoraggio del carico di lavoro Linee guida per la gestione del carico di lavoro nel monitoraggio
Costo Gestire i costi Linee guida per la gestione dei costi
Costo Ottimizzazione dei costi del carico di lavoro Linee guida per il carico di lavoro per l'ottimizzazione dei costi
Reliability Gestire l'affidabilità dei dati Linee guida per mantenere l'affidabilità dei dati
Reliability Gestire l'affidabilità delle risorse cloud Linee guida per mantenere l'affidabilità delle risorse
Reliability Gestire gli eventi imprevisti di sicurezza Raccomandazioni per rispondere agli eventi imprevisti di sicurezza
Performance Efficienza delle prestazioni del carico di lavoro Indicazioni sul carico di lavoro per l'efficienza delle prestazioni

Passaggi successivi