原|2024-01-21 10:16:55|浏览:96
纯度推移是指在数据集中选择一个合适的特征和特征值,将数据集按照该特征值进行划分,并通过计算划分后的数据集的纯度来评估划分的好坏。纯度通常使用信息增益、基尼指数等指标来度量,目标是将数据划分为纯度较高的子集。通过不断选择最优的划分特征和特征值进行数据集的划分,可以最大程度地提高子集的纯度,从而进行有效的数据分类和回归任务。