一种基于聚类技术的全文检索与推介系统的构建
本文关键词:一种基于聚类技术的全文检索与推介系统的构建
【摘要】:近年来,搜索引擎的发展可谓突飞猛进,排序算法也日新月异,但相关搜索推介这项功能却进展缓慢,无法为用户提供令人满意的有价值的关键词。本项目是专门为了解决这个问题而进行研究的,采用单词到文档,文档到聚类,聚类再回归单词的语义检索流程,完成了K-means聚类算法以及TFIDF权重算法的Java实现。通过此系统,用户不仅可以找到包含指定关键词的网页,还会收到与该关键词关联最紧密的其他关键词推介,协助用户进一步发掘信息。
【作者单位】: 北京电子科技学院计算机科学与技术系;西安电子科技大学计算机学院;
【关键词】: 搜索引擎 聚类 关键词 推介
【基金】:国家自然基金项目(61170037) 北京电子科技学院科研项目(2014GCYY09)资助
【分类号】:TP391.3
【正文快照】: 本文受国家自然基金项目(61170037),北京电子科技学院科研项目(2014GCYY09)资助。1引言如今,互联网已经成为了世界上最重要的信息发布平台之一,极低的门槛让每个人都能成为信息的发布者。但随之而来的就是信息的大爆炸,使得互联网上的信息大大超过了一个普通人的记忆范畴,再也
【参考文献】
中国期刊全文数据库 前6条
1 谷照升;;RIA技术解析[J];长春工程学院学报(自然科学版);2010年01期
2 郑廷;郑诚;;基于Lucene的语义检索系统[J];计算机工程;2008年16期
3 施聪莺;徐朝军;杨晓江;;TFIDF算法研究综述[J];计算机应用;2009年S1期
4 熊回香;陈姗;许颖颖;;基于Web 3.0的个性化信息聚合技术研究[J];情报理论与实践;2011年08期
5 侯丽;;Web2.0的特性及对信息服务的创新性思考[J];图书馆建设;2008年01期
6 吴洁明;冀单单;韩云辉;;基于Web的DCI垂直搜索引擎的研究与设计[J];计算机工程与设计;2013年04期
中国博士学位论文全文数据库 前1条
1 翟延冬;基于WordNet的短文本语义网挖掘算法研究[D];吉林大学;2012年
【共引文献】
中国期刊全文数据库 前10条
1 王益明;崔莎;王婧文;;2011年我国情报学研究进展[J];国家图书馆学刊;2012年03期
2 尚福华;韩开旭;;基于相关术语群和同义词的查询扩展研究[J];长江大学学报(自然科学版)理工卷;2010年03期
3 李卫峰;;基于Web2.0的学科知识服务模式及其平台构建[J];大学图书情报学刊;2011年06期
4 李蓓;;政治博客及其信息过滤问题研究[J];电子政务;2009年12期
5 秦岳;毛征;孙乐公;齐南;彭超;;慢运动背景下的实时运动目标检测算法研究[J];国外电子测量技术;2011年12期
6 寇小文;吴剑霞;;基于SNS的大学图书馆信息服务模式研究[J];高校图书馆工作;2010年03期
7 杨生举;蒙杰;赵昕辉;杜雨璐;;基于文本挖掘的科研项目网上评审系统研究与实现[J];甘肃科技;2012年15期
8 宋艳;何嘉;舒红平;郑皎凌;梁繁荣;任玉兰;文立玉;;基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研究[J];成都信息工程学院学报;2014年01期
9 熊志斌;朱剑锋;王冬;;K-means聚类算法的研究和应用[J];电脑编程技巧与维护;2014年08期
10 阮成奇;谢辉;;面向网络群体用户的知识服务模型研究[J];电子商务;2014年08期
中国重要会议论文全文数据库 前2条
1 初苏华;潘晓东;刑萍;郑贺健;施健欢;解家蒂;;工商银行审计信息化向信息化审计转变的思考[A];全国内部审计理论研讨优秀论文集(2013)[C];2014年
2 蒋志滨;樊巧玲;;关联分析法在方剂配伍规律研究中的应用与思考[A];中华中医药学会第十四次中医方剂学学术年会论文集[C];2014年
中国博士学位论文全文数据库 前10条
1 申文武;无结构P2P网络中基于语义和节点存储能力的搜索关键技术研究[D];北京邮电大学;2011年
2 张莹;基于语义的分布式服务与资源一体化发现方法研究[D];北京交通大学;2009年
3 彭菲菲;网络热点话题发现的关键技术研究[D];中国矿业大学(北京);2012年
4 刘文;食品安全指数的构建及应用研究[D];华中农业大学;2013年
5 欧阳柳波;领域本体覆盖度评价关键技术研究[D];中南大学;2012年
6 张金松;基于引文上下文分析的文献检索技术研究[D];大连海事大学;2013年
7 武慧娟;社会化标注系统中个性化信息推荐模型研究[D];吉林大学;2014年
8 张赛男;基于集体智慧的开放学习资源聚合与分享研究[D];东北师范大学;2014年
9 苑卫国;微博用户行为分析和网络结构演化的研究[D];北京交通大学;2014年
10 李书明;数字化学习中知识组织模型及应用研究[D];华中师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
2 张晓艳;面向农业信息服务平台的挖掘技术研究[D];湖南工业大学;2010年
3 丁林枭;多源监视系统的设计与实现[D];中国地质大学(北京);2011年
4 贾增朝;用于图像检索的视觉词汇树研究[D];西北大学;2011年
5 张韦;基于语义的Web主题提取的研究[D];湖北工业大学;2011年
6 丁若尧;基于博客的网络话题发现及追踪的研究[D];北京交通大学;2011年
7 陈凯;搜索引擎有关排序算法研究[D];武汉理工大学;2011年
8 齐尚海;基于JavaFX的富互联网应用技术的研究[D];武汉理工大学;2011年
9 邱伟林;面向领域的垂直搜索引擎的研究与实现[D];大连海事大学;2011年
10 黎源;基于粗糙集的中文文本分类在邮件过滤中的研究[D];暨南大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 牛琨;张舒博;陈俊亮;;融合网格密度的聚类中心初始化方案[J];北京邮电大学学报;2007年02期
3 孙铁利,杨凤芹;根据用户隐式反馈建立和更新用户兴趣模型[J];东北师大学报(自然科学版);2003年03期
4 景丽萍,黄厚宽,石洪波;用于文本挖掘的特征选择方法TFIDF及其改进[J];广西师范大学学报(自然科学版);2003年01期
5 许卓明,苏文萍;关系数据库模式信息的提取[J];河海大学学报(自然科学版);2005年02期
6 提姆·奥莱理 ,玄伟剑;什么是Web2.0[J];互联网周刊;2005年40期
7 谭晨辉;刘青炎;;OpenAPI出现、起源与现状[J];程序员;2008年07期
8 张东娜;周春光;刘彦斌;郭东伟;;一种基于WordNet和Corpus Statistics的语义相似性计算方法[J];吉林大学学报(理学版);2010年05期
9 刘立平,孟志青;一种选取初始聚类中心的方法[J];计算机工程与应用;2004年08期
10 左雄辉,糜麒;个性化搜索引擎研究[J];计算机工程与应用;2005年17期
中国重要会议论文全文数据库 前1条
1 黄世国;耿国华;;语义相似性测度方法研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
中国硕士学位论文全文数据库 前5条
1 王宇;基于TFIDF的文本分类算法研究[D];郑州大学;2006年
2 李媛媛;基于潜在语义索引的中文文本检索研究[D];西南交通大学;2008年
3 万红波;语义网环境下本体映射的研究[D];重庆大学;2008年
4 黄少林;基于用户兴趣分析的个性化搜索引擎研究[D];首都师范大学;2009年
5 顾雅枫;基于用户兴趣模型的信息检索研究[D];兰州大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 刘凌云,章银良,郭秀丽;多媒体全文检索光盘的系统组成与检索原理[J];郑州轻工业学院学报;2000年01期
2 ;全文检索入佳境[J];微电脑世界;2000年37期
3 李卫伟;全文数据光盘在校园网上的应用实践[J];情报杂志;2001年01期
4 晓月;;全文检索原理及实现[J];程序员;2006年12期
5 吴泽彬;魏洁;李蔚清;吴慧中;;面向服务架构的全文检索研究[J];华中科技大学学报(自然科学版);2007年S1期
6 常征;;SQL Server 2000全文检索的实现[J];科技信息(科学教研);2007年16期
7 符捷雯;;媒体资料库的全文检索效率提升[J];中国传媒科技;2008年09期
8 陈福生;;全文检索在网站搜索系统中的应用[J];电脑编程技巧与维护;2009年12期
9 谢正华;罗立芳;;基于多数据源的全文检索设计方案[J];中国科技信息;2010年10期
10 兰萍;;SQL Server 2005全文检索在数据查询中的应用[J];电脑编程技巧与维护;2010年20期
中国重要会议论文全文数据库 前7条
1 曾福萍;周定康;;基于索引服务器实现全文检索[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
2 史建斌;;军控核查数据库光盘全文检索功能的原理及实现[A];中国工程物理研究院科技年报(2005)[C];2005年
3 范志新;王宁;陶晓鹏;施伯乐;;开放式图书馆汉语检索结构[A];数据库研究进展97——第十四届全国数据库学术会议论文集(下)[C];1997年
4 朱虹;吴林;;DM4全文检索机制的设计[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 朱虹;黄欢;;DM4全文检索机制的改进[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 张谊岩;张霞;;OpenBASE中BLOB型文本数据全文检索的设计与实现[A];第十六届全国数据库学术会议论文集[C];1999年
7 王富强;马德涛;张立朝;王建明;;地方志数据库全文信息检索研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
中国重要报纸全文数据库 前8条
1 冯贝;“工”于全文检索的数据库系统[N];科技日报;2001年
2 宁夏数据通信局 刘君;SQL Server 2000中全文检索的使用[N];计算机世界;2002年
3 陈玉荣;更多、更快、更新的检索系统[N];中国企业报;2000年
4 郭莹;全文检索市场空间大[N];中国计算机报;2006年
5 宁夏 刘君;SQL Server中全文检索的使用[N];电脑报;2001年
6 朱艳;术语解释[N];中国电脑教育报;2000年
7 ;深度开发利用 广泛资源共享[N];中国财经报;2001年
8 温苏刚 姚大红;在PB中实现全文检索[N];计算机世界;2002年
中国博士学位论文全文数据库 前2条
1 周科松;全文检索与GIS一体化及在应急管理中的应用研究[D];华东师范大学;2009年
2 温延龙;XML信息检索关键技术研究[D];南开大学;2012年
中国硕士学位论文全文数据库 前10条
1 李帅;全文检索在“2008奥运多语言系统”中的应用研究与实现[D];北京工业大学;2009年
2 张翔;基于多核并行的全文检索动态后继树模型相关算法研究[D];广西大学;2013年
3 史杰;基于语义的全文检索优化和改进[D];江苏科技大学;2014年
4 陈宁;Lucene全文检索在网络教学平台中的应用研究[D];大连海事大学;2007年
5 林义明;全文检索及相关技术研究[D];辽宁科技大学;2012年
6 郭建荣;基于分布式计算的全文检索关键技术研究[D];北京邮电大学;2014年
7 朱书梅;开放获取期刊统一访问及全文检索平台研究[D];南京农业大学;2008年
8 卢光华;基于Lucene的全文检索研究与应用[D];吉林大学;2009年
9 王忠义;基于XML的全文检索方法及原型系统实现研究[D];华中师范大学;2009年
10 杨娜;基于lucene的轻量级全文检索系统模型研究[D];郑州大学;2009年
,本文编号:667203
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/667203.html