89ebook – Sách IT, Data Science, Công nghệ bản quyền
89ebook – Kho sách chuyên ngành quốc tế
89ebook – Sách IT, Data Science, Công nghệ bản quyền
0922 113 989
Tài khoản

Hands-On Entity Resolution – Sách ITBook Hợp Nhất Dữ Liệu | 2024

Thể loại: Đang cập nhật
Thương hiệu: O'Reilly Media
Mã: E445
Tình trạng: Còn hàng

Tóm tắt sản phẩm

Hands-On Entity Resolution (2024) của Michael Shearer là cẩm nang thực chiến chuyên sâu nhất về kỹ thuật Data Matching. Cuốn sách đưa anh đi sâu vào quy trình xử lý dữ liệu từ việc làm sạch (data cleaning), trích xuất đặc trưng (feature engineering), cho đến việc sử dụng các mô hình Machine Learning để "khớp" các bản ghi có khả năng cao là cùng một thực thể. Đây là công cụ không thể thiếu cho các dự án Customer 360, Master Data Management (MDM) và Fraud Detection.

5 Điểm Vàng của cuốn sách:

  • Quy trình thực chiến: Hướng dẫn từ A-Z cách xây dựng một pipeline Entity Resolution chuyên nghiệp.

  • Kỹ thuật Matching: Làm chủ các thuật toán so khớp chuỗi (Levenshtein, Jaro-Winkler) đến các mô hình học máy (Supervised/Unsupervised Learning).

  • Scaling: Cách xử lý hàng triệu bản ghi với độ trễ thấp bằng các kỹ thuật Blocking và Indexing thông minh.

  • Python Ecosystem: Ứng dụng các thư viện mạnh mẽ như recordlinkage, dedupe, và pandas để giải quyết bài toán thực tế.

  • Đánh giá & Kiểm thử: Bí quyết đo lường độ chính xác (Precision, Recall, F1-score) để đảm bảo dữ liệu luôn "sạch".

🔹 Thông số cơ bản:

  • Tác giả: Michael Shearer.

  • Năm xuất bản: 2024.

  • Định dạng: Tiếng Anh chuyên ngành.

🔹 3 Phiên bản sách hiện có tại 89ebook:

  • 📖 Sách in: Bìa màu, nội dung in trên giấy cao cấp, gáy keo nhiệt bền bỉ – sự lựa chọn cho các Data Engineers, Data Analysts cần một tài liệu tra cứu chuyên sâu.

  • 🌍 Bản quốc tế: Sách chuẩn gốc, xách tay chính hãng từ nhà xuất bản.

  • 💻 Ebook: File PDF chất lượng cao, bản quyền 89ebook, hỗ trợ tra cứu các kỹ thuật match dữ liệu nhanh chóng.

🔹 Bảo hành & Chính sách: ✅ Bảo hành sách, lỗi đổi 1-1 trong 90 ngày kể từ ngày nhận sách.

 

ebook
ebook Tặng Ebook chính hãng tương ứng
HSD: 12/12/2025
Lưu mã
89ebook
89ebook Giảm thêm 5% tổng giá trị đơn hàng
HSD: 24/12/2025
Lưu mã
FREESHIP COD
FREESHIP COD Miễn phí giao hàng
HSD: 25/12/2025
Lưu mã
245.000₫
Loại:
Số lượng:

Chào anh, tôi là Tiến sĩ Minh Trí. Trong năm 2026, dữ liệu "bẩn" là kẻ thù số 1 của các mô hình AI. Nếu anh đưa dữ liệu trùng lặp vào mô hình, anh sẽ nhận về kết quả sai lệch. Entity Resolution là bước tiền xử lý quan trọng nhất để xây dựng một nguồn "Single Source of Truth".

Tại sao nên đầu tư vào cuốn sách này? Michael Shearer viết rất thực tế. Anh không chỉ học lý thuyết, anh học cách đối mặt với những dữ liệu thực tế đầy lỗi chính tả, sai định dạng và thiếu thông tin. Đối với các Data Professionals, cuốn sách này giúp anh nâng cao kỹ năng xử lý dữ liệu lên tầm chuyên gia, giải quyết triệt để vấn đề "dữ liệu rác".

Khẳng định vị thế cho cộng đồng IT Việt Nam Tại thị trường Việt Nam, các ngân hàng, đơn vị bán lẻ (Retail) đang cực kỳ khát nhân sự có kỹ năng "hợp nhất dữ liệu". Những kỹ sư sở hữu kiến thức trong cuốn sách này chính là những mảnh ghép còn thiếu để hoàn thiện hệ sinh thái dữ liệu doanh nghiệp. Tại 89ebook, chúng tôi tâm huyết mang đến ấn phẩm này để cộng đồng IT Việt Nam dẫn đầu trong kỷ nguyên dữ liệu lớn.

Đừng để dữ liệu rời rạc cản bước phát triển – hãy làm chủ nghệ thuật Entity Resolution cùng 89ebook!

 

Sản Phẩm Đã Xem

Liên hệ với chúng tôi

Liên hệ