89ebook – Sách IT, Data Science, Công nghệ bản quyền
89ebook – Kho sách chuyên ngành quốc tế
89ebook – Sách IT, Data Science, Công nghệ bản quyền
0922 113 989
Tài khoản

Scaling Machine Learning with Spark – Xử lý Big Data & Distributed AI | Data Engineering – Adi Polak (2023)

Thể loại: Đang cập nhật
Thương hiệu: O'Reilly Media
Mã: E631
Tình trạng: Còn hàng

Tóm tắt sản phẩm

Scaling Machine Learning with Spark hướng dẫn cách mở rộng quy mô huấn luyện AI từ máy đơn lên cụm máy chủ phân tán. Sách tập trung vào việc kết hợp Apache Spark với TensorFlow, PyTorch để xử lý Big Data hiệu quả.

Các phiên bản đang phân phối tại 89 Expert Books:

  • 📖 Sách in (Bản cứng): Giấy định lượng tốt, in sắc nét, đóng gáy keo nhiệt chắc chắn, giấy chống lóa giúp bạn nghiên cứu các kiến trúc hệ thống phức tạp trong thời gian dài.

  • 🌍 Bản quốc tế: Hàng xách tay US/UK, nguyên bản tiếng Anh, cập nhật các kỹ thuật Distributed ML mới nhất 2023.

  • 💻 Ebook: File PDF/EPUB chất lượng cao, text rõ ràng, code hiển thị chuẩn, dễ dàng tra cứu trên máy tính.

 

ebook
ebook Tặng Ebook chính hãng tương ứng
HSD: 12/12/2025
Lưu mã
89ebook
89ebook Giảm thêm 5% tổng giá trị đơn hàng
HSD: 24/12/2025
Lưu mã
FREESHIP COD
FREESHIP COD Miễn phí giao hàng
HSD: 25/12/2025
Lưu mã
225.000₫
Loại:
Số lượng:

Trong kỷ nguyên Big Data, việc huấn luyện mô hình Machine Learning trên laptop hay một server đơn lẻ (Single Node) đã trở nên lỗi thời. Scaling Machine Learning with Spark (2023) là tài liệu chuyên sâu hướng dẫn cách chuyển đổi từ tư duy xử lý cục bộ sang xử lý phân tán (Distributed Computing) bằng hệ sinh thái Apache Spark.

Tại sao cuốn sách này là "vũ khí hạng nặng" cho Data Engineer? Adi Polak (chuyên gia từng làm việc tại Microsoft Azure) mang đến cái nhìn toàn cảnh về hạ tầng dữ liệu quy mô lớn. Sách không chỉ dạy về Spark MLlib (thư viện ML có sẵn của Spark) mà còn hướng dẫn cách tích hợp các Framework Deep Learning hiện đại như TensorFlowPyTorch vào môi trường Spark để huấn luyện mạng nơ-ron trên hàng TB dữ liệu.

Nội dung trọng tâm:

  • Distributed Training: Hiểu cơ chế phân tán dữ liệu và tính toán song song.

  • Hybrid Pipelines: Kết hợp sức mạnh xử lý dữ liệu của Spark với khả năng mô hình hóa của Deep Learning.

  • Operationalizing ML: Xây dựng quy trình MLOps tự động hóa từ Data Ingestion đến Model Serving.

  • Ngôn ngữ đa dạng: Hỗ trợ code ví dụ bằng cả Python (PySpark), ScalaJava.

Đối với các kỹ sư dữ liệu tại Hà NộiTP.HCM đang làm việc với các hệ thống Hadoop/Spark, cuốn sách này là cầu nối quan trọng để nâng cấp hạ tầng AI, giúp doanh nghiệp khai thác tối đa giá trị từ hồ dữ liệu (Data Lake).

Sản Phẩm Đã Xem

Liên hệ với chúng tôi

Liên hệ