Hands-On Entity Resolution (Michael Shearer, 2024) là tài liệu không thể thiếu cho data engineer, data scientist, backend developer, AI/ML engineer tại Việt Nam muốn làm chủ kỹ thuật entity resolution – giải pháp “xoá trùng dữ liệu”, làm sạch thông tin, tích hợp nguồn dữ liệu lớn cho mọi dự án chuyển đổi số.
Kỹ thuật entity resolution toàn diện:
Hướng dẫn các phương pháp chuẩn hóa dữ liệu, matching, deduplication, linking entity – từ cơ bản đến nâng cao, sát nhu cầu thực tế tại doanh nghiệp Việt Nam (retail, fintech, eKYC, healthcare…).
Thực hành với Python, thư viện phổ biến:
Ứng dụng pandas, dedupe, recordlinkage, fuzzy matching, machine learning để giải quyết bài toán data cleansing, data integration hiệu quả, tiết kiệm thời gian.
Best practice xử lý data lớn, tự động hóa pipeline:
Tối ưu workflow chuẩn cho data engineer, AI/ML engineer: xây dựng pipeline tự động kiểm tra – gán nhãn – kiểm thử chất lượng entity.
Case study thực tế & bài tập ứng dụng:
Phân tích tình huống thực tiễn, bài tập hands-on cho sinh viên, developer, đội dữ liệu tại các công ty công nghệ ở TP.HCM, Hà Nội, Đà Nẵng.
Chuẩn hóa kỹ năng xử lý & làm sạch dữ liệu:
Giúp data engineer, data scientist, backend developer Việt Nam tự tin giải quyết bài toán data matching, làm sạch dữ liệu phục vụ AI/ML, BI, big data.
Nên đọc cùng:
“Data Engineering with Python”, “Practical Data Cleaning”, “Fundamentals of Data Engineering” để phát triển toàn diện kỹ năng xử lý dữ liệu.
Data Engineer, Data Scientist
Backend Developer, AI/ML Engineer
BI Engineer, Product Manager
Sinh viên IT, học viên data analytics/engineering
Hands-On Entity Resolution là cuốn tài liệu thực chiến cho cộng đồng dữ liệu Việt Nam muốn nâng cao kỹ năng data cleansing, data matching, tích hợp & chuẩn hóa nguồn dữ liệu lớn trong mọi lĩnh vực.