Trong ngành AI, việc scale Model và tự động hóa quy trình vận hành (MLOps) là yếu tố quyết định thành công. Cuốn sách Data Science on AWS (2021) của Chris Fregly và Antje Barth là hướng dẫn thực hành chi tiết nhất để tận dụng sức mạnh của các dịch vụ AWS cho mục tiêu này.
Tại sao đây là cuốn sách thiết yếu cho Cloud Engineer/ML Engineer Việt Nam? Sách cung cấp kiến trúc và code mẫu để xây dựng hệ thống AI cấp độ doanh nghiệp:
ML Pipeline toàn diện: Hướng dẫn sử dụng các dịch vụ cốt lõi như Amazon S3, AWS Lambda và Amazon SageMaker để quản lý toàn bộ vòng đời của Model.
Continuous MLOps: Áp dụng CI/CD (Continuous Integration/Continuous Deployment) để tự động huấn luyện lại Model và triển khai phiên bản mới mà không làm gián đoạn hệ thống.
Xử lý dữ liệu lớn: Sử dụng AWS Glue và Spark để xử lý hàng Terabyte dữ liệu trước khi đưa vào huấn luyện.
SageMaker chuyên sâu: Làm chủ các tính năng của SageMaker từ Notebook Instance, Training Jobs cho đến Endpoint Deployment (Model Serving).
Đối với các kỹ sư tại Hà Nội và TP.HCM đang muốn chuyển các dự án AI Proof-of-Concept lên môi trường Production ổn định, cuốn sách này cung cấp bản thiết kế chuẩn mực, sử dụng ngôn ngữ Python làm nền tảng cho mọi tác vụ.