Data Algorithms with Spark (Mahmoud Parsian, 2022) là cuốn cẩm nang thực chiến cho data engineer, data scientist, backend developer tại Việt Nam muốn làm chủ PySpark và hệ sinh thái Apache Spark trong xử lý dữ liệu lớn.
Hơn 70 công thức & pattern dữ liệu lớn:
Hướng dẫn xây dựng pipeline xử lý dữ liệu, tối ưu ETL, phân tích và tổng hợp dữ liệu với Spark/PySpark.
Ứng dụng thực tế với dữ liệu doanh nghiệp:
Tích hợp các bài toán recommendation, graph, time-series, batch/streaming, bám sát nhu cầu doanh nghiệp tại TP.HCM, Hà Nội, Đà Nẵng.
Mở rộng kỹ năng Data Engineering hiện đại:
Giới thiệu best practice về phân vùng dữ liệu, quản lý resource, tối ưu hóa chi phí vận hành hệ thống Big Data.
Kết nối hệ sinh thái AI/ML:
Hướng dẫn tích hợp Spark với Python, MLlib, Pandas, Scikit-learn… để xây dựng giải pháp phân tích và AI trên dữ liệu lớn.
Dễ ứng dụng thực tiễn:
Công thức sát thực tế, giải quyết bài toán big data cho data team, startup, doanh nghiệp công nghệ Việt Nam.
Kết hợp đa kỹ năng:
Phù hợp với data engineer, data scientist, backend developer, kỹ sư dữ liệu đang hướng tới vị trí chuyên sâu về Big Data và AI.
Đồng bộ với các tài liệu kinh điển:
Nên đọc cùng “Designing Data-Intensive Applications”, “Streaming Systems”, “Fundamentals of Data Engineering”.
Data Engineer, Data Scientist
Backend Developer
AI/ML Engineer, kỹ sư dữ liệu
Sinh viên IT chuyên ngành dữ liệu tại Việt Nam
Data Algorithms with Spark là tài liệu không thể thiếu cho kỹ sư dữ liệu, lập trình viên muốn nâng cấp năng lực xử lý dữ liệu lớn, ứng dụng thực tế tại doanh nghiệp IT Việt Nam.