SLA’lerin Ötesine Bakmak Dijitalleşmenin hızlandığı, iş süreçlerinin neredeyse tamamının bilgi teknolojileri altyapıları üzerine kurulduğu günümüzde, erişilebilirlik artık bir tercih değil, temel bir zorunluluk haline gelmiştir.
Kurumlar için sistemlerin “çalışıyor olması” tek başına yeterli değildir. Asıl beklenti; sistemlerin doğru zamanda, doğru performansla ve kesintisiz biçimde çalışmasıdır.
Bu noktada sıkça kullanılan bir kavram öne çıkar: Yüksek Erişilebilirlik (High Availability).
Ancak yüksek erişilebilirlik, çoğu zaman yalnızca bir yüzde değeriyle — örneğin %99,9 SLA — ifade edilerek basitleştirilir. Oysa gerçek yüksek erişilebilirlik, bu rakamların çok daha ötesinde; mimari tasarım, operasyonel yetkinlik ve kurumsal sorumluluk gerektirir.
Bu yazıda, yüksek erişilebilirliğin ne olduğu kadar ne olmadığına, SLA kavramının sınırlarına ve gerçek anlamda kesintisiz hizmetin nasıl sağlanabileceğine yakından bakacağız.
Yüksek Erişilebilirlik Neden Bu Kadar Kritik Hale Geldi? Geleneksel BT döneminde sistem kesintileri çoğu zaman “tolere edilebilir” kabul edilirdi. Gece yaşanan bir kesinti, ertesi sabah telafi edilebilir; kullanıcılar kısa süreli duraksamalara alışkındı.
Bugün ise tablo tamamen değişti. • İş uygulamaları 7/24 çalışıyor • Uzaktan ve hibrit çalışma modelleri yaygın • E-ticaret, finans, sağlık ve üretim sistemleri anlık erişim gerektiriyor • Müşteri deneyimi, saniyeler içinde şekilleniyor
Bu yeni dünyada birkaç dakikalık bir kesinti bile; • Gelir kaybına • Operasyonel aksamalara • Marka itibarının zedelenmesine • Regülasyon ihlallerine yol açabiliyor.
Dolayısıyla yüksek erişilebilirlik, artık yalnızca BT ekiplerinin değil; üst yönetimin ve iş birimlerinin de doğrudan gündeminde yer alıyor.
SLA: Güvence mi, Referans mı? SLA (Service Level Agreement), bir hizmet sağlayıcının belirli bir süre boyunca sunmayı taahhüt ettiği erişilebilirlik oranını ifade eder.
Bu rakamlar ilk bakışta oldukça güven verici görünebilir. Ancak SLA’ler çoğu zaman yanlış yorumlanır veya eksik anlaşılır.
SLA’lerin Sıklıkla Göz Ardı Edilen Noktaları
• Kesinti nasıl tanımlanıyor? Sistem tamamen mi kapalı olmalı, yoksa performans düşüşü de kesinti sayılıyor mu? • Planlı bakım süreleri SLA’ya dahil mi? Çoğu SLA, planlı bakımları erişilebilirlik hesabı dışında tutar. • Ağ, uygulama ve veri katmanları ayrı ayrı mı değerlendiriliyor? • Müdahale süresi mi yoksa çözüm süresi mi taahhüt ediliyor?
Bu soruların cevapları net değilse, SLA tek başına gerçek bir güvence sunmaz. SLA; daha çok bir ölçüm referansıdır. Gerçek iş sürekliliği ise SLA’nın ötesinde başlar.
%99,9 Erişilebilirlik Gerçekte Ne Anlama Gelir? SLA oranlarının gerçek hayattaki karşılığı çoğu zaman göz ardı edilir.
Örneğin: • %99,9 erişilebilirlik → Yılda yaklaşık 8 saat 45 dakika kesinti • %99,99 erişilebilirlik → Yılda yaklaşık 52 dakika kesinti
Bu süreler kağıt üzerinde makul görünebilir. Ancak kritik soru şudur:
Bu kesinti hangi anda yaşanacak? • Ay sonu kapanışında mı? • Kampanya döneminde mi? • Yoğun hasta kabul saatlerinde mi? • Üretim hattının en kritik anında mı?
Gerçek yüksek erişilebilirlik, yalnızca toplam süreyle değil; kesintinin zamanı, etkisi ve yönetimiyle ölçülür.
Gerçek Yüksek Erişilebilirlik Ne Demektir? Yüksek erişilebilirlik, sistemlerin yalnızca “ayakta kalması” değildir. Asıl hedef, kesinti yaşanmadan veya kullanıcı etkilenmeden hizmetin devam etmesidir. Bu yaklaşım üç temel katmanda ele alınmalıdır:
1. Mimari: Dayanıklı Altyapının Temeli Gerçek yüksek erişilebilirlik, en başta doğru mimariyle başlar.
Bu mimaride: • Tekil hata noktaları ortadan kaldırılır • Tüm kritik bileşenler yedekli tasarlanır • Coğrafi riskler dikkate alınır Multi-zone ve multi-site mimariler bu noktada kritik rol oynar.
Bir veri merkezinde yaşanabilecek: • Elektrik kesintisi • Ağ arızası • Doğal afet • Fiziksel erişim sorunları gibi durumlar, diğer zone’lar üzerinden hizmetin kesintisiz devam etmesini sağlar.
2. Operasyon: Sürekli İzleme ve Proaktif Müdahale En sağlam mimari bile, doğru işletilmediğinde yetersiz kalır.
Gerçek yüksek erişilebilirlik için: • 7/24 izleme • Anomali tespiti • Erken uyarı mekanizmaları • Proaktif müdahale süreçleri hayati önem taşır.
Buradaki fark; sorunun yaşanmasını beklemek değil, sorun kullanıcıya yansımadan önce müdahale edebilmektir.
3. Süreç ve İnsan Faktörü Otomasyon ve teknoloji ne kadar gelişmiş olursa olsun, yüksek erişilebilirliğin arkasında her zaman doğru süreçler ve yetkin ekipler vardır. • Olası senaryolar önceden tanımlanmalı • Müdahale prosedürleri net olmalı • Yetki ve sorumluluklar açıkça belirlenmeli • Tek muhatap modeli benimsenmeli Bu sayede kriz anlarında belirsizlik değil, kontrollü aksiyon alınır.
Felaket Kurtarma (DR): Yedeklemenin Ötesi Yüksek erişilebilirlik ile felaket kurtarma çoğu zaman karıştırılır. Oysa bu iki kavram birbirini tamamlar.
Felaket kurtarma; • Yalnızca veri yedeklemek değil • Sistemleri belirli bir sürede ayağa kaldırabilmek • İş sürekliliğini kabul edilebilir seviyede sürdürebilmektir
Gerçek bir DR yaklaşımı: • Düzenli test edilen senaryolar • Ölçülen RTO ve RPO değerleri • İnsan hatasını minimize eden otomasyon ile mümkündür.
Test edilmeyen bir felaket kurtarma planı, kâğıt üzerindeki bir varsayımdan ibarettir.
Bulutpark Perspektifi: SLA’nın Ötesinde Bir Yaklaşım Bulutpark’ta yüksek erişilebilirlik, yalnızca bir oran veya sözleşme maddesi değildir. Bu yaklaşım; mimari, operasyon ve sorumluluk üçgeninde ele alınır.
Bulutpark altyapısı: • Türkiye genelinde konumlandırılmış çoklu coğrafi zone yapısıyla çalışır • Her zone, birbirinden bağımsız ve yedekli olarak tasarlanmıştır • Operasyonel süreçler, kesintiyi önlemeye odaklı şekilde kurgulanmıştır
Buradaki temel yaklaşım şudur: Kesintiyi telafi etmek değil, kesintinin yaşanmamasını sağlamak.
Doğru Soruları Sormak Yüksek erişilebilirlik değerlendirirken şu sorular sorulmalıdır: • Mimari gerçekten ne kadar dayanıklı? • Olası bir kesintide kim, nasıl ve ne kadar sürede müdahale ediyor? • Felaket senaryoları ne sıklıkla test ediliyor? • Operasyonun arkasında tek ve net bir sorumluluk var mı?
Gerçek yüksek erişilebilirlik; yüzdelerle değil, hazırlıkla, tecrübeyle ve doğru tasarımla sağlanır.
Bulutpark ile Yüksek erişilebilirlik bir vaat değil; sürekli yaşayan ve işletilen bir sistem yaklaşımıdır.