
تا همین چند سال پیش، بسیاری از سازمانها تصور میکردند داشتن نسخه پشتیبان از اطلاعات برای محافظت از کسبوکار کافی است. اما تجربه بحرانهای سالهای اخیر نشان داده است که در بسیاری از مواقع، مشکل اصلی از بین رفتن دادهها نیست؛ بلکه از دسترس خارج شدن سرویسهاست. این یعنی داشتن بکاپ، لزوماً به معنای آمادگی برای بحران نیست. واقعیت این است که بحرانهای امروزی مانند اختلال در زیرساختهای ارتباطی، قطعشدن اینترنت، خرابی مراکز داده، خطاهای انسانی و حتی رخدادهای غیرقابل پیشبینی میتوانند دسترسی به سامانههای حیاتی را برای ساعتها یا روزها مختل کنند. در چنین شرایطی، سازمانی موفقتر خواهد بود که از قبل برای ادامه فعالیت در زمان بحران برنامه داشته باشد.
تفاوتی که بسیاری از سازمانها دیر متوجه آن میشوند
فرض کنید تمامی اطلاعات سازمان شما بهصورت منظم پشتیبانگیری شده است، اما وقوع یک اختلال باعث میشود دیتاسنتری که سامانههای اصلی سازمان در آن قرار دارند برای چند ساعت یا حتی چند روز از دسترس خارج شود، در این حالت، دادهها از بین نرفتهاند اما کاربران همچنان نمیتوانند از سامانهها استفاده کنند، مشتریان امکان دریافت خدمات ندارند و فرآیندهای عملیاتی سازمان متوقف میشوند.
اینجاست که تفاوت میان راهکارها آشکار میشود. در بسیاری از سازمانها، مفاهیم بکاپ،اسنپشات و بازیابی از بحران (DR) گاهی بهجای یکدیگر استفاده میشوند؛ در حالی که هرکدام نقش متفاوتی دارند:
- از Backup برای نگهداری نسخههای قابل بازیابی از دادهها استفاده میشود و معمولاً برای حفاظت در برابر حذف، خرابی یا تغییرات ناخواسته کاربرد دارد.
- Snapshot وضعیت یک ماشین مجازی، دیسک یا سامانه را در یک لحظه مشخص ثبت میکند و میتواند برای بازگشت سریع به یک وضعیت قبلی مفید باشد؛ اما بهتنهایی برای تداوم سرویس در مقیاس سازمانی طراحی نشده است.
- راهکار Disaster Recovery یک لایه بالاتر قرار میگیرد. در اینجا هدف صرفاً نگهداری داده نیست؛ بلکه باید زیرساخت جایگزین، منابع پردازشی، شبکه، مسیرهای ارتباطی، ترتیب بازیابی سرویسها و سناریوی Failover از پیش طراحی و آماده شده باشند. به همین دلیل یک راهکار بازیابی از بحران موفق، به تجهیزات و فناوری محدود نمیشود؛ بلکه شامل فرآیندها، سناریوهای اجرایی و آزمونهای دورهای نیز هست.
معماری تابآور؛ پاسخ به تهدیدهای امروز
در معماریهای مدرن، سازمانها تلاش میکنند وابستگی خود را به یک دیتاسنتر، یک محل استقرار یا یک نقطه جغرافیایی کاهش دهند. در این رویکرد، دادهها و سرویسها میتوانند میان چند منطقه جغرافیایی مستقل، توزیع شوند تا در صورت بروز اختلال در یک بخش از زیرساخت، امکان ادامه فعالیت از محل دیگری وجود داشته باشد. دو شاخص کلیدی در طراحی چنین سناریوهایی، RTO و RPO هستند.
- شاخص RTO مشخص میکند پس از وقوع حادثه، سرویس در چه مدت زمانی باید دوباره در دسترس قرار گیرد.
- شاخص RPO نشان میدهد سازمان حداکثر چه میزان از دادههای تولیدشده پیش از حادثه را میتواند از دست بدهد.
هرچه این دو شاخص به مقادیر پایینتری نزدیک شوند، سطح تابآوری سازمان افزایش پیدا میکند. البته دستیابی به چنین سطحی نیازمند زیرساخت مناسب، شبکه پایدار، ذخیرهسازی امن و طراحی دقیق سناریوهای بازیابی است.
از حفاظت داده تا تداوم سرویس
در معماری مدرن زیرساخت، سازمانها برای مدیریت ریسک، ترکیبی از راهکارهای Backup، Snapshot و Disaster Recovery را استفاده میکنند. در این رویکرد، دادهها در یک یا چند محل امن نگهداری میشوند و در کنار آن، سناریوهایی برای ادامه فعالیت سرویسها در زمان بحران طراحی میشود. هدف این است که حتی در صورت بروز اختلال در یک بخش از زیرساخت، سرویسهای حیاتی با کمترین وقفه ممکن به کار خود ادامه دهند.
در این میان، برخی راهکارهای ابری امکان پیادهسازی سناریوهای پشتیبانگیری، ذخیرهسازی سازگار با S3 و طراحی معماری بازیابی از بحران میان مناطق جغرافیایی مختلف را فراهم میکنند. در این مدل، سازمانها میتوانند متناسب با نیازهای عملیاتی خود، سناریوهای Active-Passive یا Active-Active را پیادهسازی کرده و شاخصهای RTO و RPO موردنیاز خود را هدف قرار دهند.
سازمان شما برای تداوم سرویسها در زمان بحران چه برنامهای دارد؟
آیا فقط از دادهها بکاپ گرفته می شود؟ اگر یکی از اجزای زیرساخت از دسترس خارج شود، چه مدت طول میکشد تا سرویسها دوباره در اختیار کاربران قرار بگیرند؟
بسیاری از سازمانها تا زمانی که با یک اختلال جدی مواجه نشدهاند، به ضرورت طراحی سناریوی بازیابی از بحران فکر نمیکنند. اما در زمان بحران، برای طراحی معماری بازیابی دیگر فرصتی وجود ندارد.
اگر میخواهید بدانید سازمان شما در صورت از دسترس خارج شدن یک دیتاسنتر، قطع ارتباط بین مراکز داده یا وقوع یک حادثه زیرساختی چه میزان آمادگی دارد، میتوانید جزئیات راهکار بازیابی از بحران و سناریوهای Active-Passive و Active-Active آبالون را در لینک زیر بررسی کنید:




