加急见刊

一种基于集成学习的科研合作者潜力预测分类方法

艾科; 马国帅; 杨凯凯; 钱宇华 山西大学大数据科学与产业研究院; 太原030006; 计算智能与中文信息处理教育部重点实验室(山西大学); 太原030006; 山西大学计算机与信息技术学院; 太原030006

摘要:科研合作是学术成果非常重要的实现形式,很多高水平的研究成果通过合作实现.研究合作潜力可以为学者选择合作者提供指导,最大化科研效率.然而当前大数据爆发阻碍了合作者的有效选择.为了解决这个问题,基于学者文章大数据,经过特征分析和优化,综合考虑学者的文章、机构、研究兴趣等个人属性和相关属性,分别从文章标题、文章等级、文章数量、时间及署名序多维度构造样本特征,以文章所发表的期刊会议等级作为合作者序列对的样本标签,表示当前合作者的潜力高低,利用集成方法的强学习特性,提出了基于集成学习分类方法的科研合作者潜力预测模型.分析并构造对应于科研合作者潜力预测问题的特征集后,采用分类方法解决这一问题.实验中准确率、召回率、F1分数都远高于传统机器学习方法,并能以较少的样本和时间收敛于较高值(80%以上),说明了模型的优越性.

注: 保护知识产权,如需阅读全文请联系计算机研究与发展杂志社