加急见刊

基于多隐层极限学习机的文本分类方法

冀俊忠; 庞皓明; 杨翠翠; 刘金铎 北京工业大学多媒体与智能软件技术北京市重点实验室; 北京100124

摘要:针对正则化极限学习机处理高维文本数据时文本特征表示能力不足的问题,提出了一种基于多隐层极限学习机的文本分类方法.首先,使用极限学习机自编码器的压缩表示对高维文本数据进行降维处理.然后,通过多隐层极限学习机的多隐层结构提取出高层文本特征并通过最小二乘的方法对文本数据进行分类.与多个算法的实验对比表明,该算法在20newsgroup、Reuters和复旦大学中文语料库这3个数据集上都具有良好的分类性能.

注: 保护知识产权,如需阅读全文请联系北京工业大学学报杂志社