基于资源内容聚类的社会化标签聚类方法
发布时间:2018-04-05 20:29
本文选题:社会化标注系统 切入点:标签聚类 出处:《情报杂志》2016年11期
【摘要】:[目的/意义]标签聚类能够发现标签群体中蕴含的知识和语义结构,从而缓解标签所面临的歧义、模糊等问题,对于提升资源的检索效率、改善用户的使用体验、促进社会化标注系统的深化应用具有十分重要的意义。[过程/方法]提出一种基于资源内容聚类的标签聚类方法,该方法首先利用谱聚类算法对资源的词特征进行聚类,获取资源内容的K个特征簇,然后利用点互信息测量标签与这K特征簇的相关性,最后依据最大相关性原则将标签全体聚类成K个类簇。[结果/结论]实验结果表明,由于有效利用了资源的内容这一重要信息,提出的方法与基于VSM的K-M eans聚类方法和基于VSM的凝聚式层次聚类方法相比,获取了更好的聚类效果。
[Abstract]:[objective / meaning] tag clustering can find out the knowledge and semantic structure contained in tag group, so as to alleviate the ambiguity and ambiguity faced by tag, and improve the efficiency of resource retrieval and user's experience.It is of great significance to promote the application of social tagging system.[process / method] A label clustering method based on resource content clustering is proposed. Firstly, the spectral clustering algorithm is used to cluster the word features of resources, and K feature clusters of resource content are obtained.Then the correlation between the label and the K feature cluster is measured by using the point mutual information. Finally, all the tags are clustered into K clusters according to the principle of maximum correlation.[results / conclusion] the experimental results show that the proposed method is more effective than K-M eans clustering method based on VSM and condensed hierarchical clustering method based on VSM because of the effective use of the important information of resource content.
【作者单位】: 安徽理工大学经济与管理学院;复旦大学管理科学与工程博士后流动站;
【基金】:国家自然科学基金项目“基于领域本体的煤矿安全数据融合方法及应用”(编号:51474007) 教育部人文社会科学研究项目“社会化标注环境下的标签层次关系发现方法研究”(编号:13YJCZH077) 安徽省人文社会科学重点研究基地项目“基于多源异构信息融合的煤矿安全管理体系与方法研究”(编号:SK2014A042)和“煤矿安全风险领域本体的构建技术及应用研究”(编号:SK2015A082)资助
【分类号】:TP391.1
,
本文编号:1716338
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1716338.html