Thị giác máy tính (Computer Vision - CV) là lĩnh vực có tính ứng dụng thương mại cao nhất của AI (e-KYC, nhận diện sản phẩm, phân tích y tế). Cuốn sách Practical Machine Learning for Computer Vision (2021), được viết bởi các chuyên gia kỳ cựu của Google Cloud, cung cấp phương pháp tiếp cận thực tế, tập trung vào việc đưa các Model CV vào môi trường sản xuất.
Tại sao cuốn sách này là bắt buộc cho ML Engineer Việt Nam? Sách hướng dẫn sử dụng thư viện TensorFlow và Keras – những công cụ chuẩn mực của ngành AI – để giải quyết các tác vụ phức tạp:
Phân loại hình ảnh (Classification): Xây dựng nền tảng nhận diện đối tượng cơ bản.
Nhận diện đối tượng (Object Detection): Các kỹ thuật tìm kiếm và khoanh vùng nhiều đối tượng trong một bức ảnh (ví dụ: mô hình YOLO, R-CNN).
Phân đoạn ngữ nghĩa (Segmentation): Phân chia từng pixel trong ảnh, ứng dụng trong xe tự hành hoặc y tế.
Quy trình MLOps cho CV: Xử lý các vấn đề dữ liệu hình ảnh như ghi nhãn (labeling), tăng cường dữ liệu (augmentation), và quản lý Model trong Production.
Đối với các Developer và ML Engineer tại Hà Nội và TP.HCM đang xây dựng các hệ thống AI thương mại, cuốn sách này giúp bạn chuyển từ code PoC (Proof-of-Concept) sang các hệ thống CV có khả năng mở rộng (Scalable) và hiệu suất cao, sử dụng Python làm ngôn ngữ chính.