面向中文用户评论的自动化众包攻击方法
摘要:面向文本的自动化众包攻击具有攻击成本低、隐蔽性强等特点,这种攻击可以自动生成大量虚假评论,影响用户评论社区的健康发展。近些年来,有学者研究面向英文评论社区的文本自动化众包攻击,但是鲜有针对中文评论社区的自动化众包攻击的研究,针对这一不足,提出了基于汉字嵌入LSTM模型的中文文本自动化生成攻击方法。通过训练由汉字嵌入网络、LSTM网络和Softmax全连接网络组成的多层网络模型,并引入温度参数T构建攻击模型。实验中,从淘宝网的在线用户评论中抓取了超过5万条真实的用户评论数据,验证所提攻击方法的有效性。实验结果表明,生成的虚假评论可以有效地欺骗基于语言学分析的分类检测方法和基本文本拷贝检测等方法,并且通过大量的人工评估实验发现所生成的文本具有真实性强、类型广等特点。
注: 保护知识产权,如需阅读全文请联系通信学报杂志社