加急见刊

基于关键词和关键句抽取的用户评论情感分析

喻影; 陈珂; 寿黎但; 陈刚; 吴晓凡 浙江大学计算机科学与技术学院; 杭州310027; 浙江省大数据智能计算重点实验室(浙江大学); 杭州310027; 网易(杭州)网络有限公司; 杭州310051

摘要:情感分析的一项主要研究任务是根据文档内容对其情感极性(即正类和负类)进行判断。在判断文档的情感极性时,不同的词语和句子具有不同的情感贡献度,因此如何从整个文档中准确地提取与情感分类更相关的词语和句子,从而提升分类性能,成为了一个重要问题。在有监督实验中,基于依存句法关系分析句子的逻辑结构,提取出了与表达情感更相关的词语进行加权,提高了分类性能。在半监督实验中,使用基于中文评论的关键句抽取和分类器融合算法,对整篇文档中包含更多情感词和总结意味的关键句进行了抽取,充分考虑了句子的情感词属性、位置属性、标点符号属性和关键词属性,并且使用分类器融合算法,让置信度最高的子分类器决定分类效果。在大众点评网和头条新闻的数据集上将所提算法与已有的经典算法进行对比,发现所提方法的性能更高,从而证明了基于依存句法分析的关键词抽取和基于特征的中文关键句抽取算法的有效性。

注: 保护知识产权,如需阅读全文请联系计算机科学杂志社