Cuốn sách “gối đầu giường” cho mọi kỹ sư dữ liệu hiện đại – tổng hợp toàn bộ kiến thức, công cụ và quy trình thiết kế hệ thống xử lý dữ liệu bền vững, mở rộng tốt và phù hợp với sản phẩm thực tế.
Fundamentals of Data Engineering do hai chuyên gia nổi tiếng là Joe Reis và Matt Housley biên soạn, giúp bạn đi qua toàn bộ vòng đời kỹ thuật dữ liệu: từ ingestion → storage → processing → orchestration → observability → serving.
Cuốn sách không chỉ giới thiệu khái niệm, mà còn phân tích ưu nhược điểm từng công nghệ, hướng dẫn cách chọn kiến trúc phù hợp, và chia sẻ những kinh nghiệm triển khai hệ thống dữ liệu ở quy mô lớn.
📌 Bạn sẽ học được:
Thiết kế pipeline dữ liệu hiện đại theo kiến trúc Lakehouse, Lambda, Kappa
Cách chọn công nghệ phù hợp: Spark, Airflow, dbt, Kafka, Redshift, BigQuery…
Hiểu rõ quy trình data ingestion, ETL/ELT, warehousing, batch vs streaming
Xây dựng nền tảng dữ liệu phục vụ AI/ML, BI, analytics
Phối hợp tốt giữa data engineer – analyst – scientist trong tổ chức
Đánh giá
Chưa có đánh giá nào.