面向大规模无结构数据的Web方面搜索方法
发布时间:2017-09-17 12:13
本文关键词:面向大规模无结构数据的Web方面搜索方法
更多相关文章: Web方面搜索 命名实体 随机行走模型 个性化PageRank
【摘要】:针对Web数据的异构性和非结构特征,提出一种最小开销的Web方面实体搜索方法:FacetedWeb.采用命名实体对Web进行结构化的标注,将无结构的Web数据建模为实体元组数据库以支持多类型的实体搜索和动态的方面选择.采用基于随机行走模型的概率排序算法,用结点的个性化PageRank值来衡量结果的相关性,以构造最小开销的方面接口.在真实Web数据集Clueweb上实现了FacetedWeb的原型系统,通过用户评测数据验证了FacetedWeb作为通用Web方面搜索引擎的有效性,并与传统实体搜索算法的进行对比,结果表明FacetedWeb在实体搜索的效率和精确度上具有明显的优势.
【作者单位】: 浙江大学计算机科学与技术学院;浙江大学城市学院计算机科学与工程学系;
【关键词】: Web方面搜索 命名实体 随机行走模型 个性化PageRank
【基金】:清华-腾讯互联网创新技术基金资助项目(2011-8)
【分类号】:TP391.3
【正文快照】: 方面搜索作为一种新兴的搜索技术,集成了浏览式搜索(navigational search)提供的搜索导航(navigational guidance)能力和关键字搜索(freetext search)具有的搜索灵活性,为大规模数据空间的信息搜索提供了一种便捷高效的模式.方面搜索为一个关键字搜索的结果集提供了一系列相
【相似文献】
中国期刊全文数据库 前10条
1 高文利;;军备情报说明文的武器对象判定[J];软件导刊;2010年02期
2 王睿,张洁,张由仪,于y,
本文编号:869330
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/869330.html