当前位置:主页 > 科技论文 > 搜索引擎论文 >

一种基于关键特征的搜索引擎结果聚类算法

发布时间:2018-02-09 12:12

  本文关键词: 搜索引擎 算法 特征提取 文档聚类 向量空间模型VSM KFC算法 出处:《北京航空航天大学学报》2007年06期  论文类型:期刊论文


【摘要】:为了解决用户在搜索引擎结果列表中寻找所需信息困难的问题,帮助用户快速有效地定位有价值的Web文档,与向量空间模型方法不同,采用基于关键特征的聚类算法(KFC).首先从搜索引擎返回结果的关键词里选择重要的词作为关键特征,然后通过分析特征间的关系对特征聚类,最后基于特征聚类结果实现文档的聚类.通过对实验结果的测试表明了算法的有效性.
[Abstract]:In order to solve the problem that it is difficult for users to find the needed information in search engine results list, and to help users locate valuable Web documents quickly and effectively, it is different from vector space model. The key feature based clustering algorithm is adopted. Firstly, the key words are selected from the key words of the result returned by the search engine, and then the features are clustered by analyzing the relationship between the features. Finally, the document clustering is realized based on the feature clustering results, and the experimental results show that the algorithm is effective.
【作者单位】: 北京航空航天大学开发环境国家重点实验室 北京航空航天大学开发环境国家重点实验室 北京航空航天大学开发环境国家重点实验室 北京航空航天大学开发环境国家重点实验室
【基金】:国家科技基础条件平台建设资助项目(2005DKA63901)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前2条

1 姚莉秀,杨杰,叶晨洲,陈念贻;用于特征筛选的最近邻(KNN)法[J];计算机与应用化学;2001年02期

2 耿玉良,陈家琪,王咏梅;中文Web检索中聚类算法的改进[J];计算机工程与设计;2005年10期

【共引文献】

相关期刊论文 前10条

1 姚莉秀;用于特征筛选的基于目标值的最近邻法[J];红外与激光工程;2001年05期

2 李云鹏;熊桂喜;;面向交通管理领域的分类索引算法[J];计算机工程;2009年20期

3 张光亚;李红春;方柏山;;基于k-近邻算法预测蛋白质热稳定性的研究[J];计算机与应用化学;2008年01期

4 程菲;汪建海;罗键;;基于重复检测的多摘要消重方法[J];计算机工程与设计;2006年23期

5 谭德坤;赵珑;吴润秀;孙辉;;基于UDDI Registry的智能检索引擎的研究[J];计算机工程与设计;2007年04期

6 张永;侯莉莉;周振龙;;基于多Agent的智能信息检索框架[J];计算机工程与设计;2007年05期

7 黄建春;邹汉斌;李晓峰;;基于文本聚类的映射聚类算法研究[J];计算机工程与设计;2007年06期

8 原福永;张园园;;基于链接分析的相关排序方法的研究和改进[J];计算机工程与设计;2007年07期

9 郭建永;蔡勇;甄艳霞;;基于文本聚类技术的主题发现[J];计算机工程与设计;2008年06期

10 段淮川;胡平;;基于主题特征和时间因子的改进PageRank算法[J];计算机工程与设计;2010年04期

相关博士学位论文 前2条

1 万星;水电科学中若干新方法应用研究[D];四川大学;2006年

2 程伟;基于机器视觉的旋切单板检测系统研究[D];南京林业大学;2007年

相关硕士学位论文 前9条

1 刘文辉;基于链接结构的网页排序算法研究[D];哈尔滨工程大学;2010年

2 关菲;决策树的启发式模式研究及其在属性约简中的应用[D];河北科技大学;2010年

3 晏伟峰;邻域粗糙集及其基于邻域粗糙集的分类算法[D];江西师范大学;2011年

4 蒋丹丹;基于广义信息熵的决策树模型及其在绩效评价中的应用[D];河北科技大学;2012年

5 赵琛;用于中药分析的近红外光谱多元校正方法学研究[D];浙江大学;2003年

6 秦蓓蕾;清江流域水文中长期预测研究[D];四川大学;2004年

7 戴露;雅鲁藏布江中游段径流预测研究[D];四川大学;2006年

8 关大伟;数据挖掘中的数据预处理[D];吉林大学;2006年

9 郑世茶;基于机器视觉技术的棉花病害识别[D];江苏大学;2007年

【相似文献】

相关期刊论文 前10条

1 白宝兴;管道内表面质量检测系统设计[J];中国图象图形学报;1998年06期

2 张亮;郭桂蓉;庄钊文;何松华;马莉波;;雷达目标高分辨距离像数据预处理方法研究[J];电子学报;1998年06期

3 沈同圣;任建存;冯亚林;周晓东;;红外成像制导中目标识别方法探讨[J];红外与激光工程;1998年05期

4 刘守生,丁勇,胡寿松;一种特征提取新方法[J];信号处理;1999年S1期

5 李平,蒋振刚;神经网络对手写字符识别特征的提取[J];长春光学精密机械学院学报;2000年02期

6 孟国强;基于车辆牌照识别系统字符的特征提取方法研究[J];河南科学;2003年06期

7 邵云生,徐国华;雷达舰船目标的混合特征提取算法的设计与实现[J];舰船电子对抗;2004年02期

8 崔晨e,

本文编号:1497901


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1497901.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e9959***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com