Trong thế giới thực, một Data Scientist không chỉ là người xây dựng mô hình. Họ là người quản lý dữ liệu, xây dựng hạ tầng, và quan trọng nhất là phải thuyết phục (communicate) giá trị của mô hình đó. Cuốn sách Data Science: The Hard Parts (2024) là cẩm nang để chuyển từ một nhà khoa học dữ liệu làm việc trong Jupyter Notebook sang một chuyên gia có tầm ảnh hưởng trong doanh nghiệp.
Tại sao cuốn sách này cần thiết cho Senior Data Scientist Việt Nam? Sách đi sâu vào các khía cạnh mà ít tài liệu nào đề cập, nhưng lại là rào cản lớn nhất cho sự nghiệp của các chuyên gia tại Hà Nội và TP.HCM:
Hạ tầng (Infrastructure): Xử lý dữ liệu lớn bằng SQL và Python trong môi trường Production.
Chất lượng dữ liệu: Áp dụng các kỹ thuật Data Quality để tránh lỗi "Garbage In, Garbage Out".
Giao tiếp và Đạo đức (Ethics): Cách trình bày kết quả phân tích cho Business Users và xử lý các vấn đề đạo đức của AI.
Tăng trưởng sự nghiệp: Các kỹ thuật để chuyển từ làm việc cá nhân sang quản lý đội nhóm và tư duy kiến trúc (Architecture).
Đây là cuốn sách lý tưởng cho những người đã có nền tảng về Machine Learning và muốn nâng cao năng lực để giải quyết toàn bộ vòng đời của dự án Data Science, từ khâu thu thập dữ liệu thô cho đến triển khai liên tục (MLOps).