Release Note¶
Version 0.2.0¶
本次发布新增以下特性:
- 特征工程
特征衍生
特征降维
- 数据清洗
特殊空值字符处理
列类型校正
常量列清理
重复列清理
删除标签列为空的样本
非法值替换
id列清理
共线性特征清理
- 数据集拆分
对抗验证
- 建模算法
XGBoost
Catboost
LightGBM
HistGridientBoosting
- 模型训练
自动任务类型推断
命令行工具
- 评估方法
交叉验证(Cross-Validation)
Train-Validation-Holdout验证
- 搜索算法
蒙特卡洛树算法
进化算法
随机搜索算法
- 不平衡数据处理
类平衡(Class Weight)
降采样(Under -Samping)支持 - Near miss - Tomeks links - Random
过采样(Over-Samping)支持 - SMOTE - ADASYN - Random
- 提前停止策略
n次搜索都不再提升,提前停止
最大用时提前停止
到达预期指标提前停止
- 高级特性
二阶段搜索 * 伪标签 * 特征选择
概念漂移处理
模型融合