Scikit-learn: Một thư viện toàn diện cho các thuật toán học máy cơ bản (phân loại, hồi quy, cụm)
Scikit-learn
Mục tiêu: Cung cấp một thư viện toàn diện cho học máy cơ bản và tiền xử lý dữ liệu.
🔧 Tiền xử lý dữ liệu (Preprocessing)
Chuẩn hóa (Standardization): giúp các đặc trưng có cùng thang đo, cải thiện hiệu suất mô hình.
Mã hóa (Encoding): chuyển đổi dữ liệu phân loại thành số (LabelEncoder, OneHotEncoder).
Chia tập dữ liệu: tách dữ liệu thành tập huấn luyện (train) và kiểm tra (test) nhanh chóng.
🤖 Thuật toán học máy cơ bản
Phân loại (Classification):
Logistic Regression
,KNN
,Random Forest
,SVM
,...Hồi quy (Regression):
Linear Regression
,Ridge
,Lasso
,...Phân cụm (Clustering):
KMeans
,DBSCAN
,Agglomerative Clustering
,...
💡 Đặc điểm nổi bật:
Giao diện đơn giản, dễ tích hợp vào quy trình học máy.
Là lựa chọn hàng đầu cho người mới bắt đầu với AI/ML.
Tích hợp tốt với NumPy, Pandas và Matplotlib.
Ví dụ tổng quát:
Last updated
Was this helpful?