CatBoost: Một thư viện boosting hiệu quả do Yandex phát triển, tốt cho dữ liệu chứa các đặc trưng...
CatBoost
Mục tiêu: Tối ưu hóa bài toán học máy với thuật toán Gradient Boosting, đặc biệt hiệu quả với dữ liệu chứa các đặc trưng phân loại (categorical features).
🧠 Đặc điểm nổi bật:
Tự động xử lý dữ liệu phân loại mà không cần mã hóa thủ công (không cần OneHot hay LabelEncoder).
Giảm hiện tượng overfitting nhờ kỹ thuật Ordered Boosting.
Cài đặt đơn giản, hỗ trợ GPU, tích hợp tốt với Pandas & Scikit-learn.
📦 Ưu điểm:
Hiệu quả cao với dữ liệu dạng bảng chứa nhiều đặc trưng rời rạc.
Dễ sử dụng, ít cần tinh chỉnh siêu tham số ban đầu.
Hỗ trợ các bài toán phân loại, hồi quy, ranking và multi-class.
Ví dụ sử dụng cơ bản:
PreviousXGBoost & LightGBM: Tối ưu cho các bài toán về cây quyết định gradient boostingNextPhần 3: Học Sâu (Deep Learning)
Last updated
Was this helpful?