5 nguyên tắc quan trọng trong sao lưu dữ liệu

Backup Recovery

Dù thích dù không, sao lưu dữ liệu là việc mà mọi người IT cần phải làm. Là người phụ trách IT của doanh nghiệp, nếu bạn không đảm bảo công tác quan trọng này cũng đồng nghĩa bạn đang đặt cược hoạt động của công ty và công việc của chính bạn vào trò chơi may rủi. Bạn nên ghi nhớ Trong IT, bất kỳ công việc nào cũng có thể xử lý được; ngoại trừ một việc duy nhất: MẤT DỮ LIỆU.

Bài viết dưới đây làm rõ 5 nguyên tắc cơ bản (và quan trọng) giúp bạn sao lưu dữ liệu an toàn, chắc chắn khả năng phục hồi khi sự cố mất dữ liệu xảy ra.

# 1 – Tuân thủ quy tắc sao lưu 3-2-1

Cám ơn Peter Krogh đã đề xuất quy tắc 3-2-1 trong sao lưu (thật thú vị, Peter Krogh là một photographer, không phải dân IT ^^). Quy tắc sao lưu 3-2-1 khuyên bạn nên:

  • Mỗi file dữ liệu có ít nhất 3 bản sao (1 bản gốc + 2 bản sao lưu)
  • Lưu trên ít nhất 2 thiết bị lưu trữ khác nhau
  • Có ít nhất 1 bản sao lưu offsite

Quy tắc 3-2-1 trong sao lưu

Quy tắc 3-2-1 trong sao lưu

Nếu tuân thủ quy tắc trên, bạn có thể hoàn toàn yên tâm về tính an toàn của dữ liệu.

Một ví dụ về cách sao lưu tuân thủ quy tắc 3-2-1: Dữ liệu File Server công ty bạn được sao lưu đồng thời vào External HDD và dịch vụ Cloud Backup của zBackup. Lúc này, bạn có:

  • 3 bản sao dữ liệu (1 bản gốc trong File Server + 1 bản sao lưu trong External HDD + 1 bản sao lưu vào hệ thống lưu trữ zBackup)
  • 2 thiết bị/vùng lưu trữ khác nhau cho 2 bản sao lưu là External HDD và hệ thống lưu trữ zBackup
  • 1 bản sao lưu được lưu trữ offsite trên hệ thống zBackup (cách xa văn phòng công ty bạn)

# 2 – Không nhầm lẫn giữa Replication và Backup

Ở khía cạnh nào đó, replication mang ý nghĩa của backup. Nhưng là một ý nghĩa không trọn vẹn. Với replication, khi dữ liệu gốc thay đổi thì gần như ngay lập tức thay đổi này sẽ được cập nhật sang bản replication. Nếu thay đổi đó là một lỗi logic bên trong dữ liệu? Hẳn nhiên lỗi này cũng ngay lập tức “lây lan” sang bản replication. Kết quả là bạn có cả 2 bản bị cùng một lỗi: bản gốc bị lỗi, bản replication cũng bị lỗi nên không giúp ích được gì cho bạn. Trong tình huống này, chỉ có bản backup (trước khi lỗi trên xảy ra) mới có thể giúp bạn phục hồi. Đó là khác biệt mà backup mang lại so với replication.

Thực tế, replication ngày càng quan trọng trong chiến lược Disaster Recovery của doanh nghiệp. Replication là giải pháp cực kỳ hiệu quả giúp trong tình huống bị các sự cố về vật lý như lỗi HDD, cháy nổ,… Replication giúp giảm thiểu RPO và RTO nhiều lần khi gặp phải những sự cố trên. Nhưng lỗi logic xảy ra bên trong dữ liệu lại là vấn đề lớn với replication. Do đó, replication không nên là giải pháp thay thế backup. Một chiến lược sao lưu kết hợp cả hai là tốt nhất.

Free eBook: Download ebook 8 lưu ý quan trọng khi sao lưu & phục hồi SQL Server. Những kinh nghiệm hữu ích chia sẻ trong ebook giúp bạn sao lưu an toàn và đảm bảo khả năng phục hồi khi sự cố mất dữ liệu xảy ra với database SQL Server.

# 3 – Tự động hóa

Không có gì buồn tẻ và nhàm chán hơn sao lưu dữ liệu. Khó có người IT nào yêu thích công việc này (và tất nhiên càng không thích công việc phục hồi, vì điều đó đồng nghĩa sự cố đã xảy ra, rất rủi ro và áp lực). Đây lại là công việc khó thấy được kết quả khi hệ thống đang hoạt động bình thường. Do đó, việc sao lưu nếu phải tiến hành thủ công, phụ thuộc vào ý thức, trách nhiệm, trí nhớ của người IT thì cực kỳ nguy hiểm.

Hãy tự động hóa mọi thao tác có thể bằng các công cụ sao lưu: lập lịch sao lưu, mã hóa dữ liệu, quản lý phiên bản, nhân bản offsite,…Thậm chí, có những phần mềm hỗ trợ tự động quá trình phục hồi để kiểm tra dữ liệu sao lưu. Hẳn nhiên, nguyên tắc này không khuyến khích bạn phó thác 100% cho phần mềm và quên hẳn đi công tác này. Định kỳ, hãy kiểm tra để chắc chắn không có sai sót nào xảy ra (xem thêm Nguyên tắc #5 – Testing).

# 4 – Mã hóa dữ liệu

Bạn nghĩ rằng bộ phận IT chủ động quản lý hoàn toàn dữ liệu sao lưu, vậy cần mã hóa làm gì? Không chắc đâu. Bạn không thể biết được chuyện gì sẽ xảy ra khi một ngày cần phải mang thiết bị đi bảo hành, hoặc những rò rỉ không biết được trong quá trình lưu trữ offsite (có thể là tại nhà bạn).

Không có gì là chắc chắn. Trừ một điều duy nhất: Mã hóa dữ liệu khi sao lưu.

Luôn mã hóa dữ liệu sao lưu

Luôn mã hóa dữ liệu sao lưu

# 5 – Testing, testing & testing

Sao lưu và phục hồi là 2 vế khác nhau của cùng câu chuyện. Sao lưu không có nghĩa là phục hồi (rõ ràng là vậy mà ^^). Có rất nhiều câu chuyện về người IT mỗi ngày đều cặm cụi sao lưu thành công nhưng khi cần phục hồi mới phát hiện dữ liệu bị lỗi. Tất nhiên khi đó mọi việc đã quá muộn.

Tiến hành testing thường xuyên là cách duy nhất giúp bạn tin tưởng có thể phục hồi khi cần. Nếu không thể tiến hành hàng tháng, ít ra bạn cũng nên thu xếp hàng quý. Testing không chỉ giúp bạn kiểm tra dữ liệu, đảm bảo khả năng phục hồi; mà còn giúp bạn nắm chắc các bước phục hồi. Để khi sự cố xảy ra bất thình lình, bạn biết được cần tiến hành các bước nào để phục hồi hệ thống trong thời gian nhanh nhất (RTO càng thấp càng tốt).