Chào bạn, tôi là Tiến sĩ Minh Trí. Bạn đang sở hữu những bộ dữ liệu khổng lồ nhưng mã nguồn Python của bạn đang chạy chậm như "rùa bò"? Bạn muốn tận dụng tối đa sức mạnh của CPU đa nhân và GPU để xử lý dữ liệu nhưng không biết bắt đầu từ đâu? Đã đến lúc bạn cần nâng tầm kỹ năng với cuốn sách "Fast Python: High performance techniques for large datasets" (2023).
Tiago Rodrigues Antao mang đến một cái nhìn thực dụng và sâu sắc về việc tối ưu hóa Python từ cấp độ mã nguồn đến cấp độ kiến trúc. Trong cuốn sách lập trình Python chuyên sâu này, bạn sẽ làm chủ các kỹ thuật:
Profiling & Bottlenecks: Cách sử dụng các công cụ đo lường để tìm ra chính xác đoạn code nào đang làm chậm hệ thống của bạn.
Tối ưu hóa bộ nhớ: Các chiến lược quản lý bộ nhớ thông minh để xử lý các Dataset lớn hơn cả dung lượng RAM hiện có.
Concurrency & Parallelism: Phân biệt và triển khai hiệu quả asyncio, đa luồng (multithreading) và đa tiến trình (multiprocessing).
Sử dụng thư viện hiệu suất cao: Tận dụng sức mạnh của NumPy, Pandas, Polars và các kỹ thuật Vectorization để tăng tốc tính toán hàng chục lần.
Cython & Numba: Cách biên dịch Python sang mã máy (C-level speed) cho những tác vụ tính toán đặc biệt nặng.
Xử lý dữ liệu phân tán: Giới thiệu các phương pháp làm việc với dữ liệu quy mô lớn vượt ra ngoài giới hạn của một máy đơn lẻ.
Về mặt học thuật, tôi đánh giá cao cách Tiago giải thích về cơ chế GIL (Global Interpreter Lock) và cách "vượt rào" nó một cách an toàn. Đối với cộng đồng kỹ sư dữ liệu Việt Nam, kiến thức trong cuốn sách IT này là sự khác biệt giữa một ứng dụng chạy thử nghiệm và một hệ thống quy mô công nghiệp (Production-ready). Tại 89ebook, chúng tôi mang đến tri thức này để giúp mã nguồn của bạn chạy nhanh như ý nghĩ.