基于PCA-SMOTE-随机森林的地质不平衡数据分类方法——以东天山地球化学数据为例
摘要:基于PCA改进SMOTE算法,能实现不平衡数据集的均衡化,并以随机森林作为分类器,应用于地质数据进行分类与预测.因原始数据集中的噪声数据可能会引起插值后的数据分布形态的改变,故提出结合PCA算法与SMOTE算法,先进行除噪降维再进行数据插值,改善不平衡数据集的分类性能,并对东天山化探样本数据进行实验,结果表明,新算法能较好地提高分类精度,为地质不平衡数据的分类与预测提供新的思路.
注: 保护知识产权,如需阅读全文请联系桂林理工大学学报杂志社