O distincție cheie în domeniul recuperării în caz de dezastru este cea dintre failover și failback. Ambii termeni descriu două fețe ale aceleiași monede, procese complementare care sunt adesea reunite.
Cu toate acestea, efectele și scopurile lor nu ar putea fi mai diferite. Ambele joacă roluri esențiale în asigurarea continuității afacerii și a recuperării în caz de dezastru, ceea ce face esențială înțelegerea a ceea ce sunt și a modului în care diferă.
Ce este failover-ul?
Failover este o operațiune de continuitate a afacerii care asigură accesul continuu la un sistem prin tranziția completă la o altă instanță a sistemului respectiv. Acest sistem secundar este proiectat pentru a fi rezistent, în mod ideal neafectat de evenimentul care a compromis sistemul primar.
Mai simplu spus, failover-ul are loc atunci când conectivitatea este comutată de la o instanță de sistem la alta. Acest lucru se poate întâmpla în diferite moduri, inclusiv:
Nota editorului:
Această postare pe blogul oaspeților a fost scrisă de personalul de la Pure Storage, o companie tehnologică cotată la bursă din SUA, dedicată soluțiilor de stocare a datelor pentru întreprinderi all-flash. Pure Storage păstrează un blog foarte activ, aceasta este una dintre postările lor „Purely Educational” pe care le retipărim aici cu permisiunea lor.
- Trecerea de la un sistem primar la un sistem de așteptare
- Trecerea la o rezervă caldă sau rece
- Activarea unui sistem de rezervă în timpul unei defecțiuni sau în scopuri de testare
- Comutare manuală sau automată
Punctul critic despre failover este că implică o migrare completă a accesului logic sau fizic de la sistemul primar, serverul sau locația de găzduire la una secundară.
În timp ce alte procese, cum ar fi echilibrarea încărcăturii, pot distribui conectivitate parțială între instanțele sau componentele sistemului, ele nu se califică drept failover deoarece nu reprezintă o trecere completă.
Ce este Failback?
Failback-ul este operațiunea de recuperare în caz de dezastru prin excelență. Implica o migrare completă înapoi la starea de producție – o recuperare dacă doriți – la încheierea validată a unui dezastru.
Failback-ul are loc atunci când un sistem revine la mediul primar după ce a fost rezolvată cauza principală a unei întreruperi. În practică, aceasta arată ca un failover, dar invers. Odată ce sistemul primar este restaurat, accesul este îndreptat către acel sistem, iar standby-ul este dezactivat.
Această revenire este o distincție critică. Unele organizații pot avea sisteme complete de așteptare pentru aplicații critice, care permit operațiuni complete pe sistemul de așteptare. În acest caz, standby-ul poate fi considerat pe bună dreptate principalul, iar fostul primar reparat noul standby.
Rolul failoverului și failback-ului în recuperarea în caz de dezastru
Failover-ul este critic într-un eveniment de continuitate a afacerii, deoarece menține operațiunile în desfășurare. Având un sistem la care afacerea dvs. poate trece atunci când un sistem principal nu este disponibil, puteți continua să faceți afaceri. Oamenii pot lucra, fluxurile de venituri sunt păstrate și clienții pot fi serviți.
Fără failover, aceste funcții s-ar putea opri, ducând la întreruperi semnificative. Multe organizații depind de tehnologie pentru procesele critice și, atunci când aceste procese nu sunt disponibile, alternativele analogice pot fi insuficiente sau complet învechite. Failoverul asigură că, chiar și în caz de dezastru, afacerea continuă să se miște.
Failback-ul intră în joc odată ce nevoia de failover se termină. Pe măsură ce dezastrul este rezolvat, failback-ul permite organizației să revină la operațiunile normale. De obicei, failback-ul este necesar atunci când sistemul de așteptare nu poate susține operațiunile la fel de eficient ca sistemul primar. De exemplu, un sistem de așteptare poate să nu fie o replică completă a sistemului primar și ar putea fi proiectat doar pentru utilizare temporară în timpul unei urgențe.
Pentru sistemele critice pentru misiune, unele organizații pot construi un sistem de așteptare care este o replică completă a sistemului principal. Deși costisitoare, această abordare atenuează riscurile de funcționare diminuată în timpul dezastrelor.
Beneficiile valorificării atât a failover-ului, cât și a failback-ului
Într-o lume ideală, fiecare afacere ar menține două medii complet operaționale: un mediu principal și un mediu de așteptare identic. Această configurație ar permite tranziții fără întreruperi în timpul dezastrelor, asigurându-se că operațiunile de afaceri sunt complet neafectate.
Cu toate acestea, acel model poate dubla efectiv un buget IT: două seturi de puncte finale, două seturi de servere, două seturi de medii cloud, două seturi de date, personal care să sprijine acest lucru atât în IT, cât și în operațiunile de afaceri etc. Este costisitor și ineficient pentru orice companie, până la punctul în care nicio companie nu menține cu adevărat acel model de suport.
În schimb, majoritatea organizațiilor optează pentru un model de failover și failback, deoarece echilibrează costul și eficiența. Cu această abordare, mediul de așteptare este conceput pentru a susține operațiuni critice în timpul unui dezastru, chiar dacă nu este la fel de robust ca sistemul principal. Acest lucru îl face mai economic, se dublează mai puțină muncă și riscul pierderii sau impactului datelor este mai mic.
Este esențial să mențineți un mediu secundar bine proiectat. Reducerea prea profundă a costurilor într-un sistem de așteptare poate duce la ineficiențe sau pierderi financiare dacă operațiunile critice sunt întrerupte. Găsirea echilibrului corect între cost și funcționalitate este esențială.
Dacă operațiunile de afaceri neîntrerupte sunt esențiale, atunci un plan strategic de failover și failback nu este opțional – este o necesitate.
Dacă vă place conținutul nostru, vă rugăm să vă abonați.
- Experiență Noobz.ro fără anunțuri, în timp ce ne susținem munca
- Promisiunea noastră: Toate contribuțiile cititorilor vor fi destinate finanțării mai multor conținut
- Asta înseamnă: Mai multe caracteristici tehnice, mai multe benchmark-uri și analize