基于余弦相识度的聚类算法在统计调查对象分类中的应用研究 王习涛; 马雁疆; 刘新新 河南省统计局数管中心 摘要:对统计数据的研究往往采用无监督学习的聚类算法,而基于欧式距离的常规聚类算法不太适合统计数据,文章将常用于文本相似度计算的余弦相似度算法与聚类算法相结合,形成基于图形相似度的模糊识别算法,采用统计月度数据进行实验测试,证明能够实现企业分类,达到了研究目标。 注: 保护知识产权,如需阅读全文请联系市场研究杂志社