Chào bạn, tôi là Tiến sĩ Minh Trí. Bạn đã bao giờ trải qua cảm giác "đứng ngồi không yên" khi hệ thống quan trọng của công ty bị sập vào giữa đêm? Bạn muốn thiết kế một hạ tầng trên AWS có khả năng tự động phục hồi ngay cả khi toàn bộ một Region gặp sự cố? Đã đến lúc chuyển từ tư duy "phòng bệnh" sang tư duy "kháng bệnh" với cuốn sách "Engineering Resilient Systems on AWS" (2025).
Ba chuyên gia từ chính AWS sẽ dẫn dắt bạn qua quy trình khép kín: Thiết kế (Design), Xây dựng (Build) và Kiểm thử (Test) cho tính bền bỉ của hệ thống. Trong cuốn sách công nghệ thực chiến này, bạn sẽ làm chủ:
Kiến trúc Multi-Region & Multi-AZ: Cách phân tán rủi ro và tận dụng tối đa hạ tầng toàn cầu của AWS để đạt mức 99.99% availability.
Mẫu thiết kế bền bỉ (Resilience Patterns): Triển khai các kỹ thuật như Circuit Breaker, Retries with Exponential Backoff, và Bulkheads để ngăn chặn lỗi lan truyền.
Chaos Engineering trên AWS: Cách sử dụng AWS Fault Injection Simulator (FIS) để chủ động tạo ra lỗi và kiểm chứng sức chịu đựng của hệ thống.
Observability & Monitoring: Xây dựng hệ thống giám sát thông minh để phát hiện sớm các dấu hiệu suy giảm hiệu năng trước khi chúng trở thành thảm họa.
Disaster Recovery (DR): Các chiến lược từ Pilot Light đến Warm Standby, giúp tối ưu hóa chi phí và thời gian phục hồi (RTO/RPO).
Về mặt học thuật, tôi đánh giá cao cách các tác giả chuẩn hóa khái niệm "Resilience" thành một quy trình kỹ thuật có thể đo lường được. Đối với cộng đồng kỹ sư Cloud Việt Nam, kiến thức trong cuốn sách IT này là "bảo hiểm" cho sự nghiệp của bạn, giúp bạn tự tin vận hành những hệ thống có quy mô hàng triệu người dùng. Tại 89ebook, chúng tôi mang đến tri thức này để giúp bạn kiến tạo những hệ thống không bao giờ "ngủ quên".