Un nuovo modo per gestire il cloud

Un nuovo modo per gestire il cloud

English Version Below

La nuova era degli agenti intelligenti

Nell'ultima edizione di Microsoft Ignite (2025), durante la sessione BRK145, è stato presentato un vero e proprio cambio di paradigma per chi gestisce e progetta infrastrutture cloud.

I presentatori di Microsoft stessi annunciano che:

"Siamo arrivati ben oltre all'era in cui l'AI veniva usata come semplice chatbot conversazionale.

Introduciamo l'era delle Agentic Cloud Operations"


L'evoluzione di Copilot:

L'ondata dell'Intelligenza Artificiale generativa ha preso il via poco più di tre anni fa, verso la fine del 2022, con il rilascio di ChatGPT. Da quel momento, tutti i principali colossi dell'IT hanno introdotto le proprie soluzioni, investendo in una tecnologia che ha già trasformato profondamente il mondo del lavoro.

Tuttavia, rispetto agli altri Tech Leader, Microsoft ha scelto un approccio più radicale: ha posto Copilot al centro della propria evoluzione aziendale, integrandolo in profondità fino a implementarlo nello stesso sistema operativo Windows 11, ma non come chatbot, ma come parte strutturale di esso.

All'interno degli ambienti cloud di Azure, Copilot si trasforma in un vero e proprio orchestratore "Agentic". Non è più un semplice assistente passivo, ma un'entità in grado di agire prendendo decisioni basate sul contesto specifico dell'infrastruttura implementata. Grazie all'analisi avanzata dei dati, Copilot fornisce raccomandazioni strategiche supportate da metriche e statistiche trasparenti; una volta ottenuta la conferma da parte dell'operatore, è in grado di applicarle immediatamente. Il risultato è una drastica riduzione dei tempi di troubleshooting e ottimizzazione, che permette ai team Operations di operare con un'efficienza senza precedenti

1.00

Azure Copilot: L'interfaccia agentic

I team possono operare sull'infrastruttura richiamando gli agenti direttamente all'interno dei propri flussi di lavoro.

Durante l'evento sono state mostrate in azione le nuove capacità "agentic" di Copilot, che si estendono su sei domini operativi fondamentali:

  • Migration
  • Deployment
  • Optimization
  • Observability
  • Resiliency
  • Troubleshooting

Il vero punto di forza di questi domini è che non sono a sé stanti. Al contrario, lavorano in modo cooperativo per migliorare continuamente le Operations nel cloud. Agiscono in modo strategico, analizzando attivamente il contesto in cui si trovano per prendere decisioni mirate e proattive.


Approfondiamo di seguito gli agent:

Deployment agent:


Aiuta l'utente a progettare, configurare e al deployment dell'infrastruttura Azure, usando le best practices e l'automazione.

Decide in modo autonomo quali servizi Azure sono più opportuni da utilizzare, e infine, genera un template IaC (Infrastructure as Code): una pratica DevOps che automatizza il provisioning e la gestione dell'infrastruttura IT utilizzando file di configurazione anziché processi manuali.


Migration agent:

Questo agent fornisce un processo basato sull'AI attraverso il processo di migrazione. Viene eseguita una analisi dell'infrastruttura e delle applicazioni presenti, di seguito viene generato un "business case" per la migrazione, configurando l'ambiente Azure di destinazione.

Il processo di migrazione però non si limita soltanto a questo, ma contribuisce anche alla modernizzazione dei carichi di lavoro dopo il processo di migrazione.

Un'esempio aziendale per l'utilizzo di questo agente può essere:

  • Adozione del cloud: l'agent riesce a operare su domande di alto livello, ad esempio:

    • Quanto mi costerebbe muovere una specifica applicazione/VM su Azure
    • Identifica i server più facilmente migrabili su Azure

Observability agent:


Il suo obiettivo è quello di aiutare i cloud operator ad assicurare che le risorse e le applicazioni funzionino correttamente, vengono inoltre analizzate automaticamente eventuali anomalie o allarmi nell'ambiente.

In caso venga rilevata qualche anomalia, l'agente agisce, avviando una investigazione guidata dall'AI.

Dopo l'analisi, l'agente di Observability produce i risultati per l'operatore. Riassume ciò che ha scoperto in un linguaggio chiaro e ad alto livello: ad esempio, "Gli errori di connessione al database sono aumentati dell'80% durante l'incidente, causando probabilmente il timeout dell'API" oppure "La CPU della macchina virtuale era al 100% poco prima del crash - possibile problema di saturazione".

Ogni risultato include in genere una spiegazione e i passaggi successivi consigliati.


Optimization agent:


Aiuta a identificare le risorse sovradimensionate, componenti inattivi o configurazioni non ottimali, di seguito fornisce suggerimenti per ottimizzare l'ambiente.

L'agent può inoltre essere integrato con Microsoft Cost Management per supportare attività di analisi e ottimizzazione della spesa. Grazie a questa integrazione, è possibile porre domande di alto livello, ad esempio:

  • "Perché il costo dell'ultimo mese è stato così elevato?"

L'agent fornirà dati statistici per soddisfare la nostra domanda suggerendo azioni concrete per ridurre i costi e migliorare l'utilizzo delle risorse.


Resiliency agent:

Si possono strutturare delle strategie di Disaster Recovery e Fault Tolerance con questo agent. Esso propone una configurazione adeguata in base alle esigenze richieste dall'azienda.

  • L'agente può identificare le risorse senza ridondanza implementata o senza backup. Oppure può identificare risorse con dati critici (come database o VM) con il deploy effettuato su una singola zona di disponiblità (una singola zona geografica che in caso di disastri porterebbe alla perdita dei dati).

Troubleshooting agent:

Il Troubleshooting agent, consente di diagnosticare e risolvere i problemi relativi ai carichi di lavoro in esecuzione in Azure.

Viene invocato quando viene esplicitamente richiesto di risolvere qualche tipo di problema.

Tramite l'utilizzo della documentazione di Microsoft e alla sua capacità di pattern recognition con l'utilizzo del machine learning, comunica all'utente quali sono le cause di certi sintomi arrivando a progettare una soluzione (con conferma dell'utente).

Nel caso in cui il problema non riesca ad essere risolto, verrà direttamente aperto un ticket di supporto a Microsoft per ulteriori analisi.

A quali danni può portare l'utilizzo di agent imperfetti?

Questi agent non sono dei tool usati per sostituire il ruolo dei team di Operations nel cloud, ma come degli aiuti per rendere il workflow più rapido ed efficiente.

Ormai è risaputo che l'intelligenza artificiale tende ad allucinare, visto che si basa su dei calcoli probabilistici, ed essi non sono ancora allenati in modo perfetto per non fornire risposte errate.

Le azioni che gli agent possono effettuare sull'ambiente in Azure possono essere solo quelle che l'utente possiede sotto il tenant di Microsoft Entra ID. In altre parole, Copilot non può in alcun modo rompere le barriere di sicurezza né compiere azioni per le quali l'operatore umano non disponga già dei privilegi necessari.

Il paradigma "Human-in-the-loop"

Per mitigare questi rischi, il vero fulcro delle Agentic Cloud Operations presentate da Microsoft non è l'automazione totale e incontrastata, ma il concetto di "Human-in-the-loop".

L'intelligenza artificiale esamina migliaia di log, analizza la documentazione e prepara le azioni di remediation in pochi secondi, ma si ferma al momento dell'esecuzione. La decisione finale, viene sempre presa dall'ingegnere, egli deve infatti anche valutare quanto la soluzione presa da Copilot sia valida per le esigenze aziendali**.**

Conclusione: il possibile impatto sui ruoli IT:

L'introduzione di questa nuova era Agentic solleva una domanda inevitabile:

Quale sarà il destino di Cloud Architect, System Administrator e ingegneri DevOps? Saranno sostituiti dall'intelligenza artificiale a breve?

Più che di "sostituzione", è corretto parlare di una profonda evoluzione del ruolo.

Grazie all'aiuto di Copilot gli ingegneri Operations non dovranno più spendere giornate intere preziose per scovare la radice di un problema analizzando righe infinite di logs, questi compiti potranno essere facilmente delegati a Copilot, mentre gli ingegneri potranno occuparsi di altro.

Il focus del lavoro umano si sposterà inevitabilmente da esecutore di task a revisore, architetto strategico e garante della sicurezza. Le competenze più preziose del prossimo futuro non saranno legate solo al "saper fare", ma soprattutto al "saper validare e orchestrare"

Il vero impatto sui ruoli IT colpirà, con ogni probabilità, chi manca di un approccio orientato all'evoluzione e al miglioramento continuo, preferendo restare nella propria comfort zone e ancorato alle metodologie del passato.

Fonti:

https://agoracdn.blob.core.windows.net/cms/Content/Uploads/Talks/Files/5bea5af5-0768-4ea9-9c06-42e3542efb92/Agentic%20Cloud%20Ops%20come%20Azure%20Copilot%20trasforma%20la%20gestione%20del%20cloud.pdf

Microsoft AI Fest: IT Pro - Save time with Azure Copilot


English version

The New Era of Intelligent Agents

In the latest edition of Microsoft Ignite (2025), during session BRK145, a true paradigm shift was presented for those who manage and design cloud infrastructures.

Microsoft presenters themselves announced:

"We have moved well beyond the era where AI was used as a simple conversational chatbot.

We are introducing the era of Agentic Cloud Operations."

The Evolution of Copilot

The wave of generative Artificial Intelligence kicked off just over three years ago, toward the end of 2022, with the release of ChatGPT. Since then, all major IT giants have introduced their own solutions, investing in a technology that has already profoundly transformed the workplace.

However, compared to other tech leaders, Microsoft has chosen a more radical approach: it placed Copilot at the center of its corporate evolution, deeply integrating it to the point of embedding it within the Windows 11 operating system itself—not as a chatbot, but as a structural component of it.

Within Azure cloud environments, Copilot transforms into a true "Agentic" orchestrator. It is no longer a simple passive assistant, but an entity capable of taking action by making decisions based on the specific context of the deployed infrastructure. Thanks to advanced data analysis, Copilot provides strategic recommendations supported by transparent metrics and statistics; once it receives confirmation from the operator, it can apply them immediately. The result is a drastic reduction in troubleshooting and optimization times, allowing Operations teams to operate with unprecedented efficiency.

1.00

Azure Copilot: The Agentic Interface

Teams can operate on the infrastructure by invoking agents directly within their workflows.

During the event, Copilot's new "agentic" capabilities were showcased in action, spanning six fundamental operational domains:

  • Migration
  • Deployment
  • Optimization
  • Observability
  • Resiliency
  • Troubleshooting

The real strength of these domains is that they do not stand alone. On the contrary, they work cooperatively to continuously improve cloud Operations. They act strategically, actively analyzing their surrounding context to make targeted and proactive decisions.


Exploring the Agents in Detail

Deployment Agent

It helps the user design, configure, and deploy the Azure infrastructure, using best practices and automation. It autonomously decides which Azure services are most appropriate to use and, finally, generates an IaC (Infrastructure as Code) template: a DevOps practice that automates the provisioning and management of IT infrastructure using configuration files instead of manual processes.

Migration Agent

This agent provides an AI-driven workflow throughout the migration journey. It performs an analysis of the existing infrastructure and applications, then generates a "business case" for the migration while configuring the target Azure environment. The migration process, however, is not limited to just this; it also contributes to the modernization of workloads even after the migration is complete.

A business use case for this agent could be:

  • Cloud Adoption: The agent can handle high-level queries, for example:

    • How much would it cost to move a specific application/VM to Azure?
    • Identify the servers that are most easily migratable to Azure.

Observability Agent

Its goal is to help cloud operators ensure that resources and applications are functioning correctly; it also automatically analyzes any anomalies or alarms within the environment. If an anomaly is detected, the agent takes action, initiating an AI-guided investigation. After the analysis, the Observability agent produces its findings for the operator. It summarizes what it discovered in clear, high-level language: for example, "Database connection errors increased by 80% during the incident, likely causing the API timeout," or "The virtual machine's CPU was at 100% just before the crash - possible saturation issue." Each finding generally includes an explanation and the recommended next steps.

Optimization Agent

It helps identify oversized resources, inactive components, or suboptimal configurations, subsequently providing suggestions to optimize the environment. The agent can also be integrated with Microsoft Cost Management to support spend analysis and optimization activities. Thanks to this integration, it is possible to ask high-level questions, such as:

  • "Why was last month's cost so high?"

The agent will provide statistical data to answer our question, suggesting concrete actions to reduce costs and improve resource utilization.

Resiliency Agent

Disaster Recovery and Fault Tolerance strategies can be structured with this agent. It proposes a suitable configuration based on the specific needs required by the company.

  • The agent can identify resources lacking implemented redundancy or backups. Alternatively, it can identify resources with critical data (such as databases or VMs) deployed in a single availability zone (a single geographic area where a disaster would lead to data loss).

Troubleshooting Agent

The Troubleshooting agent allows you to diagnose and resolve issues related to workloads running in Azure. It is invoked when explicitly requested to solve a specific type of problem. By leveraging Microsoft documentation and its pattern recognition capabilities powered by machine learning, it communicates the root causes of certain symptoms to the user and goes as far as designing a solution (pending user confirmation). In the event that the problem cannot be resolved, a support ticket will automatically be opened with Microsoft for further analysis.


What Damage Can the Use of Imperfect Agents Cause?

These agents are not tools meant to replace the role of cloud Operations teams, but rather aids to make the workflow faster and more efficient.

It is now well known that artificial intelligence tends to hallucinate, as it is based on probabilistic calculations, and models are not yet perfectly trained to avoid providing incorrect answers entirely.

The actions that these agents can perform on the Azure environment are strictly limited to those the user possesses under their Microsoft Entra ID tenant. In other words, Copilot cannot in any way bypass security barriers or perform actions for which the human operator does not already hold the necessary privileges.

The "Human-in-the-loop" paradigm

To mitigate these risks, the true core of the Agentic Cloud Operations presented by Microsoft is not total, unchecked automation, but the concept of "Human-in-the-loop".

The artificial intelligence examines thousands of logs, analyzes documentation, and prepares remediation actions in a matter of seconds, but it stops short of execution. The final decision is always made by the engineer, who must also evaluate whether the solution proposed by Copilot is truly valid for the company's business needs.


Conclusion: The Potential Impact on IT Roles

The introduction of this new Agentic era raises an inevitable question: What will be the destiny of Cloud Architects, System Administrators, and DevOps Engineers? Will they soon be replaced by artificial intelligence?

Rather than "replacement," it is more accurate to speak of a profound evolution of the role.

Thanks to Copilot's assistance, Operations engineers will no longer have to spend entire, precious days hunting down the root of a problem by analyzing endless rows of logs. These tasks can easily be delegated to Copilot, while engineers can focus on other priorities.

The focus of human labor will inevitably shift from being a task executor to a reviewer, strategic architect, and security guarantor. The most valuable skills in the near future will not simply be tied to "knowing how to do," but above all to "knowing how to validate and orchestrate."

The real impact on IT roles will, in all likelihood, strike those who lack an approach oriented toward evolution and continuous improvement, preferring to stay in their comfort zone and remain anchored to the methodologies of the past.

Sources:

https://agoracdn.blob.core.windows.net/cms/Content/Uploads/Talks/Files/5bea5af5-0768-4ea9-9c06-42e3542efb92/Agentic%20Cloud%20Ops%20come%20Azure%20Copilot%20trasforma%20la%20gestione%20del%20cloud.pdf

Microsoft AI Fest: IT Pro - Save time with Azure Copilot