Trong kỷ nguyên số, "dữ liệu cũ là dữ liệu chết". Các doanh nghiệp TMĐT hay Fintech tại Hà Nội và TP.HCM đang khát khao khả năng phân tích dữ liệu ngay lập tức (Real-time Analytics) để phát hiện gian lận hoặc gợi ý sản phẩm. Streaming Databases (2024) ra đời để giải quyết bài toán đó, chấm dứt kỷ nguyên đau khổ của kiến trúc Lambda (phải duy trì 2 hệ thống Batch và Stream riêng biệt).
Cuốn sách này mang lại giá trị gì cho Data Engineer? Tác giả Hubert Dulay và Ralph M. Debusmann giải thích cơ chế của một thế hệ cơ sở dữ liệu mới: nơi dữ liệu được xử lý ngay khi nó vừa sinh ra, nhưng vẫn truy vấn dễ dàng như một database truyền thống.
Unified Architecture: Hợp nhất xử lý lô (Batch) và luồng (Stream) vào một nền tảng duy nhất, giảm 50% công sức vận hành.
SQL for Streams: Sử dụng ngôn ngữ SQL quen thuộc để truy vấn dữ liệu đang chảy (Streaming SQL) mà không cần học Java/Scala phức tạp như trước.
Materialized Views: Hiểu cách các view được cập nhật tự động theo thời gian thực (Incremental Updates) để dashboard luôn hiển thị số liệu mới nhất.
Use Cases: Ứng dụng thực tế trong giám sát hệ thống, cá nhân hóa người dùng và IoT.
Đây là cuốn sách đón đầu xu hướng công nghệ 2024-2025, giúp bạn xây dựng hạ tầng dữ liệu hiện đại, độ trễ thấp (Low Latency) và sẵn sàng cho các bài toán Big Data quy mô lớn.