بهار فناوری
چرا داشتن بکاپ به‌تنهایی به معنای آمادگی در بحران نیست؟

تا همین چند سال پیش، بسیاری از سازمان‌ها تصور می‌کردند داشتن نسخه پشتیبان از اطلاعات برای محافظت از کسب‌وکار کافی است. اما تجربه بحران‌های سال‌های اخیر نشان داده است که در بسیاری از مواقع، مشکل اصلی از بین رفتن داده‌ها نیست؛ بلکه از دسترس خارج شدن سرویس‌هاست. این یعنی داشتن بکاپ، لزوماً به معنای آمادگی برای بحران نیست. واقعیت این است که بحران‌های امروزی مانند اختلال در زیرساخت‌های ارتباطی، قطع‌شدن اینترنت، خرابی مراکز داده، خطاهای انسانی و حتی رخدادهای غیرقابل پیش‌بینی می‌توانند دسترسی به سامانه‌های حیاتی را برای ساعت‌ها یا روزها مختل کنند. در چنین شرایطی، سازمانی موفق‌تر خواهد بود که از قبل برای ادامه فعالیت در زمان بحران برنامه داشته باشد.

تفاوتی که بسیاری از سازمان‌ها دیر متوجه آن می‌شوند

فرض کنید تمامی اطلاعات سازمان شما به‌صورت منظم پشتیبان‌گیری شده است، اما وقوع یک اختلال باعث می‌شود دیتاسنتری که سامانه‌های اصلی سازمان در آن قرار دارند برای چند ساعت یا حتی چند روز از دسترس خارج شود، در این حالت، داده‌ها از بین نرفته‌اند اما کاربران همچنان نمی‌توانند از سامانه‌ها استفاده کنند، مشتریان امکان دریافت خدمات ندارند و فرآیندهای عملیاتی سازمان متوقف می‌شوند.

اینجاست که تفاوت میان راهکارها آشکار می‌شود. در بسیاری از سازمان‌ها، مفاهیم بکاپ،اسنپ‌شات و بازیابی از بحران (DR) گاهی به‌جای یکدیگر استفاده می‌شوند؛ در حالی که هرکدام نقش متفاوتی دارند:

  • از Backup برای نگهداری نسخه‌های قابل بازیابی از داده‌ها استفاده می‌شود و معمولاً برای حفاظت در برابر حذف، خرابی یا تغییرات ناخواسته کاربرد دارد.
  • Snapshot وضعیت یک ماشین مجازی، دیسک یا سامانه را در یک لحظه مشخص ثبت می‌کند و می‌تواند برای بازگشت سریع به یک وضعیت قبلی مفید باشد؛ اما به‌تنهایی برای تداوم سرویس در مقیاس سازمانی طراحی نشده است.
  • راهکار Disaster Recovery یک لایه بالاتر قرار می‌گیرد. در اینجا هدف صرفاً نگهداری داده نیست؛ بلکه باید زیرساخت جایگزین، منابع پردازشی، شبکه، مسیرهای ارتباطی، ترتیب بازیابی سرویس‌ها و سناریوی Failover از پیش طراحی و آماده شده باشند. به همین دلیل یک راهکار بازیابی از بحران موفق، به تجهیزات و فناوری محدود نمی‌شود؛ بلکه شامل فرآیندها، سناریوهای اجرایی و آزمون‌های دوره‌ای نیز هست.

معماری تاب‌آور؛ پاسخ به تهدیدهای امروز

در معماری‌های مدرن، سازمان‌ها تلاش می‌کنند وابستگی خود را به یک دیتاسنتر، یک محل استقرار یا یک نقطه جغرافیایی کاهش دهند. در این رویکرد، داده‌ها و سرویس‌ها می‌توانند میان چند منطقه جغرافیایی مستقل، توزیع شوند تا در صورت بروز اختلال در یک بخش از زیرساخت، امکان ادامه فعالیت از محل دیگری وجود داشته باشد. دو شاخص کلیدی در طراحی چنین سناریوهایی، RTO و RPO هستند.

  • شاخص RTO مشخص می‌کند پس از وقوع حادثه، سرویس در چه مدت زمانی باید دوباره در دسترس قرار گیرد.
  • شاخص RPO نشان می‌دهد سازمان حداکثر چه میزان از داده‌های تولیدشده پیش از حادثه را می‌تواند از دست بدهد.

هرچه این دو شاخص به مقادیر پایین‌تری نزدیک شوند، سطح تاب‌آوری سازمان افزایش پیدا می‌کند. البته دستیابی به چنین سطحی نیازمند زیرساخت مناسب، شبکه پایدار، ذخیره‌سازی امن و طراحی دقیق سناریوهای بازیابی است.

از حفاظت داده تا تداوم سرویس

در معماری مدرن زیرساخت، سازمان‌ها برای مدیریت ریسک، ترکیبی از راهکارهای Backup، Snapshot و Disaster Recovery را استفاده می‌کنند. در این رویکرد، داده‌ها در یک یا چند محل امن نگهداری می‌شوند و در کنار آن، سناریوهایی برای ادامه فعالیت سرویس‌ها در زمان بحران طراحی می‌شود. هدف این است که حتی در صورت بروز اختلال در یک بخش از زیرساخت، سرویس‌های حیاتی با کمترین وقفه ممکن به کار خود ادامه دهند.

در این میان، برخی راهکارهای ابری امکان پیاده‌سازی سناریوهای پشتیبان‌گیری، ذخیره‌سازی سازگار با S3 و طراحی معماری بازیابی از بحران میان مناطق جغرافیایی مختلف را فراهم می‌کنند. در این مدل، سازمان‌ها می‌توانند متناسب با نیازهای عملیاتی خود، سناریوهای Active-Passive یا Active-Active را پیاده‌سازی کرده و شاخص‌های RTO و RPO موردنیاز خود را هدف قرار دهند.

سازمان شما برای تداوم سرویس‌ها در زمان بحران چه برنامه‌ای دارد؟

آیا فقط از داده‌ها بکاپ گرفته می شود؟ اگر یکی از اجزای زیرساخت از دسترس خارج شود، چه مدت طول می‌کشد تا سرویس‌ها دوباره در اختیار کاربران قرار بگیرند؟

بسیاری از سازمان‌ها تا زمانی که با یک اختلال جدی مواجه نشده‌اند، به ضرورت طراحی سناریوی بازیابی از بحران فکر نمی‌کنند. اما در زمان بحران، برای طراحی معماری بازیابی دیگر فرصتی وجود ندارد.

اگر می‌خواهید بدانید سازمان شما در صورت از دسترس خارج شدن یک دیتاسنتر، قطع ارتباط بین مراکز داده یا وقوع یک حادثه زیرساختی چه میزان آمادگی دارد، می‌توانید جزئیات راهکار بازیابی از بحران و سناریوهای Active-Passive و Active-Active آبالون را در لینک زیر بررسی کنید:

https://abalon.cloud/disaster-recovery

دیدگاه ها
  1. مقاله جالبی بود. یک سؤال داشتم؛ برای کسب‌وکارهای کوچک هم راهکار Disaster Recovery ضروریه یا بیشتر مناسب سازمان‌های بزرگه؟

    1. ضرورت آن به میزان وابستگی کسب‌وکار به سرویس‌های آنلاین بستگی دارد، نه صرفاً اندازه سازمان. حتی شرکت‌های کوچک هم اگر قطعی سرویس برایشان هزینه‌زا باشد، بهتر است حداقل یک سناریوی بازیابی متناسب با نیاز خود داشته باشند.

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

5 × سه =