Chào bạn, tôi là Tiến sĩ Minh Trí. Bạn đang sở hữu dữ liệu vị trí và muốn biết liệu các cụm dữ liệu đó là ngẫu nhiên hay có quy luật ẩn giấu? Bạn muốn dự báo mức độ ô nhiễm không khí hoặc tỷ lệ dịch bệnh tại những nơi chưa có trạm đo? Đã đến lúc bạn làm chủ "bản đồ tri thức" với cuốn sách "Spatial Statistics for Data Science - Theory and Practice with R" (2024).
Paula Moraga dẫn dắt bạn đi từ lý thuyết thống kê cốt lõi đến việc triển khai các mô hình hiện đại nhất trên ngôn ngữ R. Trong cuốn sách thống kê địa không gian chuyên sâu này, bạn sẽ làm chủ:
Các loại dữ liệu không gian: Phân biệt và xử lý Geostatistical data, Areal data (Lattice), và Point patterns một cách bài bản.
Mô hình hóa Bayes (Bayesian Modeling): Kỹ thuật sử dụng INLA và Stan để giải quyết các bài toán thống kê không gian phức tạp với độ chính xác cao.
Ước lượng rủi ro & Dự báo: Cách tính toán tỷ lệ rủi ro tương đối (Relative Risk) và tạo ra các bản đồ dự báo (Prediction maps) cho các hiện tượng tự nhiên và xã hội.
Phân tích dữ liệu chuỗi thời gian không gian: Làm chủ chiều thứ 4 (thời gian) trong dữ liệu địa lý để theo dõi sự dịch chuyển và biến đổi của các xu hướng.
Truyền thông dữ liệu (Communication): Cách sử dụng R Markdown, Shiny và các bản đồ tương tác (leafet) để trình bày kết quả phân tích một cách thuyết phục nhất.
Ứng dụng thực tế đa ngành: Từ giám sát dịch bệnh toàn cầu đến phân tích thị trường bất động sản địa phương.
Về mặt học thuật, tôi đánh giá cao cách Paula Moraga đơn giản hóa các phương pháp thống kê phức tạp (như Markov Chain Monte Carlo - MCMC) để bất kỳ Data Scientist nào cũng có thể áp dụng ngay vào công việc. Đối với cộng đồng khoa học dữ liệu Việt Nam, kiến thức trong cuốn sách IT này là bước đệm để bạn trở thành chuyên gia trong các dự án mang tầm vĩ mô. Tại 89ebook, chúng tôi mang đến tri thức này để giúp bạn thấu hiểu thế giới qua lăng kính tọa độ.