89ebook – Sách IT, Data Science, Công nghệ bản quyền
89ebook – Kho sách chuyên ngành quốc tế
89ebook – Sách IT, Data Science, Công nghệ bản quyền
0922 113 989
Tài khoản

Reliable Machine Learning – Áp dụng Nguyên tắc SRE vào Vận hành ML Production | DevOps & Cloud – Cathy Chen (2022)

Thể loại: Đang cập nhật
Thương hiệu: O'Reilly Media
Mã: E790
Tình trạng: Còn hàng

Tóm tắt sản phẩm

Reliable Machine Learning là hướng dẫn áp dụng các nguyên tắc SRE (SLOs, Error Budgets, Incident Response) vào vận hành ML. Sách tập trung vào việc giám sát Data Drift và Model Health để xây dựng các hệ thống AI/ML ổn định và có độ tin cậy cao trong Production.

Các phiên bản đang phân phối tại 89 Expert Books:

  • 📖 Sách in (Bản cứng): Giấy định lượng tốt, in sắc nét, đóng gáy keo nhiệt chắc chắn, giấy chống lóa, phù hợp để nghiên cứu các mô hình vận hành và Metrics.

  • 🌍 Bản quốc tế: Hàng xách tay US/UK, nguyên bản tiếng Anh, nội dung chuẩn mực từ Google SRE.

  • 💻 Ebook: File PDF/EPUB chất lượng cao, text rõ ràng, dễ dàng tra cứu các công thức tính SLO.

 

ebook
ebook Tặng Ebook chính hãng tương ứng
HSD: 12/12/2025
Lưu mã
89ebook
89ebook Giảm thêm 5% tổng giá trị đơn hàng
HSD: 24/12/2025
Lưu mã
FREESHIP COD
FREESHIP COD Miễn phí giao hàng
HSD: 25/12/2025
Lưu mã
295.000₫
Loại:
Số lượng:

Mô hình Machine Learning có một thách thức đặc thù: chúng có thể thất bại một cách âm thầm do dữ liệu đầu vào thay đổi (Data Drift), mà không làm hệ thống sập. Cuốn sách Reliable Machine Learning (2022), được đồng viết bởi Niall Richard Murphy (một chuyên gia SRE hàng đầu từ Google), cung cấp các kỹ thuật SRE để quản lý rủi ro này.

Tại sao cuốn sách này là bắt buộc cho các SRE và MLOps Engineer Việt Nam? Sách hướng dẫn cách áp dụng các nguyên tắc SRE (vốn dành cho hạ tầng truyền thống) vào các hệ thống AI:

  • SLOs và SLIs cho ML: Định nghĩa các mục tiêu và chỉ số độ tin cậy cấp độ dịch vụ (Service Level Objectives/Indicators) không chỉ cho Uptime mà còn cho Độ chính xác của Model (Model Accuracy)Độ trễ dự đoán (Prediction Latency).

  • Error Budgets: Sử dụng ngân sách lỗi để cân bằng giữa tốc độ phát triển (Feature Velocity) và sự ổn định của hệ thống.

  • Quan sát dữ liệu: Xây dựng hệ thống giám sát chuyên biệt để phát hiện sớm các dấu hiệu Data Drift hoặc Model Drift và tự động phản ứng.

  • Incident Response: Quy trình xử lý sự cố khi Model thất bại hoặc đưa ra dự đoán sai lệch, giảm thiểu tác động đến khách hàng.

Đối với các tổ chức tại Hà NộiTP.HCM đang vận hành các dịch vụ AI quan trọng, cuốn sách này là giáo trình để chuyển đổi từ MLOps tốt sang MLOps đáng tin cậy.

Sản Phẩm Đã Xem

Liên hệ với chúng tôi

Liên hệ