加急见刊

基于PCA-SMOTE-随机森林的地质不平衡数据分类方法——以东天山地球化学数据为例

桂州; 陈建国; 王成彬 中国石油大学(华东)地球科学与技术学院; 山东青岛257061; 中国地质大学(武汉)地质过程与矿产资源国家重点实验室; 武汉430074; 中国地质大学(武汉)资源学院; 武汉430074

摘要:基于PCA改进SMOTE算法,能实现不平衡数据集的均衡化,并以随机森林作为分类器,应用于地质数据进行分类与预测.因原始数据集中的噪声数据可能会引起插值后的数据分布形态的改变,故提出结合PCA算法与SMOTE算法,先进行除噪降维再进行数据插值,改善不平衡数据集的分类性能,并对东天山化探样本数据进行实验,结果表明,新算法能较好地提高分类精度,为地质不平衡数据的分类与预测提供新的思路.

注: 保护知识产权,如需阅读全文请联系桂林理工大学学报杂志社