XGBoost & LightGBM: Tối ưu cho các bài toán về cây quyết định gradient boosting
XGBoost & LightGBM
Mục tiêu: Giải quyết hiệu quả các bài toán học máy với thuật toán Gradient Boosting dựa trên cây quyết định — nổi bật với tốc độ huấn luyện nhanh và độ chính xác cao.
🌳 XGBoost (Extreme Gradient Boosting)
Thư viện mạnh mẽ, tối ưu hóa thuật toán boosting truyền thống.
Hỗ trợ xử lý giá trị thiếu, regularization (L1/L2), song song hóa (parallel computing).
Được sử dụng rộng rãi trong các cuộc thi Kaggle nhờ hiệu năng vượt trội.
⚡ LightGBM (Light Gradient Boosting Machine)
Phát triển bởi Microsoft, tập trung vào hiệu suất với tập dữ liệu lớn.
Áp dụng kỹ thuật Histogram-based learning và Leaf-wise growth, giúp tăng tốc độ và giảm tiêu thụ bộ nhớ.
Tích hợp tốt với Pandas, NumPy và Scikit-learn.
✅ Ưu điểm chung
Dễ tích hợp vào pipeline học máy hiện đại.
Hỗ trợ các bài toán: phân loại, hồi quy, xếp hạng, phát hiện bất thường,...
Được tối ưu hóa cho GPU (đặc biệt LightGBM).
Ví dụ với XGBoost:
Last updated
Was this helpful?