基于相似图片聚类的Web文本特征算法
发布时间:2017-12-29 22:33
本文关键词:基于相似图片聚类的Web文本特征算法 出处:《计算机工程》2014年12期 论文类型:期刊论文
更多相关文章: Web文本特征 图片搜索引擎 基于文本的图像检索 基于内容的图像检索 倒排索引 Web文本分析
【摘要】:对于图文不符的低质量网页,现有基于文本关键词的图片搜索引擎得到的结果相关性较差。针对该问题,将图片的相似性聚类信息和网页质量因素融入文本分析过程,提出一种基于相似图片聚类的Web文本特征算法。根据网页Page Rank值、关键词HTML标签类别和关键词词性类别的不同,分别赋予其不同的权重并代入计算公式,综合计算得到整个聚类中全部关键词的文本特征值,并通过设置阈值提取高相关文本。对随机选取的15个图片聚类进行实验分析,结果表明,与百度和谷歌目前所用图片搜索算法相比,该算法能够准确地找到反映图片内容的真实文本,提高图片检索的精度。
[Abstract]:......
【作者单位】: 武汉大学计算机学院;
【分类号】:TP391.1;TP391.41
【正文快照】: 中文引用格式:方爽,殷俊杰,徐武平.基于相似图片聚类的Web文本特征算法[J].计算机工程,2014,40(12):161-165,171.英文引用格式:Fang Shuang,Yin Junjie,Xu Wuping.Web Text Feature Algorithm Based on Similar Image Clustering[J].Computer Engineering,2014,40(12):161-165
【共引文献】
相关博士学位论文 前1条
1 刘钰峰;异构信息网络检索技术研究[D];湖南大学;2014年
,本文编号:1352205
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1352205.html