Azure Haberler Microsoft

Azure Infrastructure Resiliency Manager Public Preview’da: Tek Pencerede Resiliency Yönetimi

Azure Infrastructure Resiliency Manager public preview

Microsoft, Build 2026’da Azure’un yeni resiliency yönetim platformunu duyurdu: Azure Infrastructure Resiliency Manager (AIRM). Public preview olarak tüm Azure müşterilerine açıldı. Platform, mevcut Azure resiliency özelliklerinin yerini almıyor; onları tek bir hedef odaklı iş akışına bağlayan birleştirici bir katman olarak konumlanıyor.

AIRM; Availability Zones, Azure Advisor, Azure Chaos Studio, Azure Monitor ve Azure Copilot ile birlikte çalışıyor. Dağınık yetenekleri bir araya getirip bütüncül bir resiliency stratejisine dönüştürüyor. Preview’da VM’ler, veritabanları, AKS cluster’ları ve networking gibi geniş bir kaynak yelpazesi destekleniyor.

Üç fazlı resiliency yolculuğu

Platformun temel inanışı şu: resiliency tek seferlik bir konfigürasyon işi değil, sürekli bir yolculuk. Bu yolculuk üç eyleme dönüştürülebilir faza ayrılmış:

  • Start Resilient: Sıfırdan tasarımda resiliency’yi katma
  • Get Resilient: Mevcut uygulamalardaki boşlukları kapama
  • Stay Resilient: Sürekli doğrulama ve recovery hazırlığı

Start Resilient: Resiliency Agent

Bu preview’ın öne çıkan özelliği Resiliency Agent. Azure Portal’a doğrudan gömülü, sohbet bazlı AI destekli bir asistan. Mimarlar ve geliştiriciler doğal dille resiliency stratejilerini doğrulayıp iyileştirebiliyor.

Örneğin “VM’ler, Flexible PostgreSQL veritabanı ve Standard Load Balancer ile üç katmanlı bir web uygulaması tasarlıyorum, zone-resiliency için ne yapmalıyım?” diye sorabilirsiniz. Agent planınızı analiz ediyor, single point of failure’ları tespit ediyor ve önerilerde bulunuyor: veritabanı için zone redundancy açmak, VM’leri farklı zone’lara dağıtmak, load balancer’ı zone-redundant versiyona yükseltmek gibi.

IaC üretimi ve doğrulama

Resiliency Agent sadece tavsiye vermiyor, doğrudan ARM, Bicep veya Terraform template’leri üretebiliyor. Tüm resiliency yapılandırmaları hazır gelmiş, deploy etmeye hazır template’ler. Mevcut IaC dosyalarını yükleyip doğal dilde resiliency boşluklarının analizini de alabiliyorsunuz. Eksikleri kapamak için hedeflenmiş kod parçacıkları döndürüyor.

Get Resilient: Hedef odaklı resiliency posture

Çoğu Azure müşterisinin aylarca veya yıllarca inşa ettiği iş yükleri bugünün resiliency gereksinimlerini tam karşılamayabiliyor. AIRM bu noktada Service Groups kavramıyla devreye giriyor.

Service Groups ile region’lar, subscription’lar veya resource group’lar arasında kaynaklarınızı (tag bazlı da olabilir) gruplayıp uygulamanızı tanımlıyorsunuz. Sonra bu uygulamaya bir resiliency hedefi atıyorsunuz: tüm bileşenler için zone-failure tolerance veya kritik servisler için belirli data replication gereksinimleri gibi.

Platform her kaynağı bu hedefe göre değerlendiriyor ve tek pencerede resiliency posture’ı gösteriyor: hedefi karşılayanlar, karşılamayanlar, henüz değerlendirilmemiş olanlar. Genel best practice’ler değil, hedef durumunuza özel öneriler.

Önceliklendirilmiş eylem önerileri

Her boşluk için Azure Advisor destekli hedefli iyileştirme önerileri üretiliyor. Her öneride etkilenen kaynaklar, implementasyon adımları ve kalitatif maliyet göstergeleri (Yüksek, Orta, Düşük) bulunuyor. Bu göstergeler düzeltmenin ek servis harcaması, downtime veya redeployment gerektirip gerektirmediğini belirtiyor.

Resiliency Agent burada da devreye giriyor. “Bu App Service zone-redundant storage’a taşınabilir mi?”, “Ne kadar downtime beklemeliyim?” gibi soruları workload’a özel cevaplıyor. Talep edildiğinde remediation script’leri veya IaC snippet’leri üretiyor. Önemli bir nokta: agent hiçbir zaman otomatik değişiklik yapmıyor. Bilgi ve kod sağlıyor, execution kontrolü tamamen sizde kalıyor. Human-in-the-loop modeli.

Stay Resilient: Zone failure drill’leri

Bu fazın yıldızı, Azure Chaos Studio ile çalışan availability zone failure drill’leri. Kontrollü ve güvenli bir ortamda zone outage’ları simüle ediyor: hedef availability zone’daki VM’leri kapatıyor, zone-redundant veritabanları için failover’ı zorluyor, AKS node pool’ları durduruyor.

AIRM hangi kaynakların zone-resilient olması gerektiğini bildiği için hangi fault action’ların uygulanacağına otomatik karar veriyor. Out-of-the-box karşılanmayan senaryolar için Azure Automation runbook’ları üzerinden custom fault logic destekleniyor.

Tam döngü recovery orchestration

Drill’ler sadece fault injection’la kalmıyor. AIRM, recovery plan ile entegre olup tam recovery dizisini otomatik orkestrasyon ediyor:

fault injection → failover → reprotection → failback

Bu tam döngü simülasyon, zone outage’ında uygulamanızın maksimum downtime’ını ölçüyor ve beklendiği gibi çalışmayan recovery adımlarını ortaya çıkarıyor. Drill boyunca Azure Monitor destekli canlı health monitoring var, dashboard her kaynağın sağlığını gerçek zamanlı izliyor.

Her drill sonrası sonuçlar ekip notlarıyla ve attestation’larla loglanıyor. Bu da zamanla resiliency testlerinin geçmişini oluşturuyor ve compliance gereksinimleri için kanıt sağlıyor.

Nasıl başlanır?

Azure Portal’da “Resiliency” araması yaparak platforma erişebilirsiniz. Microsoft üç başlangıç adımı öneriyor:

  • Kritik bir uygulama için resiliency hedefi tanımlayıp posture insight’larını incele
  • Resiliency Agent ile birkaç öneriyi ele al, AI rehberli düzeltmeyi deneyimle
  • Non-production ortamda zone-down drill çalıştır, failover ve recovery süreçlerini gerçek koşullarda doğrula

AIRM, Azure müşterileri için resiliency’yi tek tek özellikler kullanmaktan çıkarıp hedef odaklı bir disipline dönüştürüyor. Özellikle çok sayıda kaynak ve karmaşık iş yükü olan kurumların, hangi resiliency yatırımlarının en çok kazanç sağlayacağını görmesi açısından değerli. Tabii ki public preview olduğu için production iş yüklerinde dikkatli kullanmak ve Microsoft’un GA’ya kadar yapacağı değişiklikleri takip etmek gerekiyor.

Kaynak: https://techcommunity.microsoft.com/blog/reliability-and-resiliency-in-azure/announcing-azure-infrastructure-resiliency-manager-public-preview/4523710

Yazar Hakkında

Kerem Şuğle

Solution Architect, VMware vExpert ve Microsoft sertifikalı altyapı uzmanı. VMware vSphere/vSAN/VCF, Azure, AWS, Google Cloud, enterprise sanallaştırma ve yapay zeka konularında 15+ yıl deneyim. AI/cloud dönüşümü, sovereign cloud, enterprise güvenlik ve modern altyapı mimarisi alanlarında yazıyor.

Leave a Comment