当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于ontology抽取优化初始选择的检索结果聚类

发布时间:2018-11-18 11:18
【摘要】:本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高.
[Abstract]:In order to improve the effect of structured clustering of the result returned by search engine and make the location of information more quickly, this paper aims at the increasing amount of data on the Internet and the increasingly difficult role of accurate search engine. In this paper, the tag-based clustering algorithm is used, and the dependency syntactic analysis and dictionary resources in the natural language processing technology are used to dig the semantic structure in depth, and a K-means clustering method based on the optimization of initial selection is proposed. In this paper, the characteristics of K-means clustering algorithm are analyzed, and the algorithm is improved by class label technology. Experiments show that this algorithm is not only better than the general clustering algorithm in effect, but also helpful to the description of the results and greatly improved in efficiency.
【作者单位】: 哈尔滨工业大学计算机科学与技术学院信息检索研究室;
【基金】:国家自然科学基金重点项目(No.60435020) 国家自然科学基金面上项目(No.60503072)
【分类号】:TP391.3

【共引文献】

相关期刊论文 前9条

1 张俐,李晶皎,胡明涵,姚天顺;中文WordNet的研究及实现[J];东北大学学报(自然科学版);2003年04期

2 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期

3 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期

4 赵岩;王晓龙;刘秉权;关毅;;融合聚类触发对特征的最大熵词性标注模型[J];计算机研究与发展;2006年02期

5 郭池 ,陈家骏 ,王启祥;一种基于语料库的词义消歧策略[J];计算机工程与应用;2003年35期

6 韩习武,赵铁军;基于子类的汉语动词SCF获取回退[J];计算机工程与应用;2005年30期

7 郑泽芝,张永奎;《现代汉语语义词典》管理系统的设计与实现[J];计算机工程;2001年06期

8 张永奎,赵辄谦,白丽君,陈鑫卿;基于互联网的中文问答系统[J];计算机工程;2003年15期

9 李云云;汉语下肢语义场的历史演变[J];绵阳师范学院学报;2004年01期

相关会议论文 前5条

1 徐海;;英、汉分类词典编纂刍议[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年

2 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

3 马永腾;亢世勇;;新编同义词词林语义分类体系[A];第三届学生计算语言学研讨会论文集[C];2006年

4 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

5 路斌;万小军;杨建武;陈晓鸥;;基于同义词词林的词汇褒贬计算[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年

相关博士学位论文 前5条

1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年

2 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年

3 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年

4 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年

5 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年

相关硕士学位论文 前7条

1 江森卓;现代汉语上下关系时间词语[D];华东师范大学;2004年

2 杨宇娜;基于统计的中文词义消歧技术研究[D];哈尔滨工业大学;2006年

3 曹南;颜色与动物:文化内涵与跨文化交际能力研究[D];辽宁师范大学;2007年

4 于龙杰;新词语在新闻语体中的应用研究[D];山东大学;2007年

5 林进展;试论汉语词义系统的类别层级性及其实现[D];厦门大学;2007年

6 贾晓东;汉语动宾搭配识别研究[D];大连理工大学;2008年

7 孟丽;现代汉语腿部动词研究[D];广西师范大学;2008年

【相似文献】

相关期刊论文 前10条

1 张蓉,申德荣,于戈;Ontology在异构数据库集成中的应用[J];计算机工程;2004年24期

2 潘宇斌,陈跃新;基于Ontology的自然语言理解[J];计算技术与自动化;2003年04期

3 常春;大型 Ontology构建工具 KAON的使用和评价[J];现代图书情报技术;2004年08期

4 谢枫平;Ontology与信息检索[J];龙岩师专学报;2004年06期

5 王文俊,刘昕鹏,罗英伟,汪小林,许卓群;应急事件Ontology语义模型及其应用[J];计算机工程;2005年10期

6 黄国景,崔志明;基于Ontology的个性化元搜索引擎研究[J];微电子学与计算机;2004年12期

7 蒋国瑞,赵书良;基于Multi-Agent和Ontology的技术性贸易壁垒预警预测系统设计[J];计算机工程与应用;2004年27期

8 王晓东;王靖;;基于Ontology的语料库系统[J];计算机应用与软件;2007年08期

9 李景;以语义互操作性为目标的FOS(水产业ontology服务)的开发研究[J];农业图书情报学刊;2003年05期

10 王洋,陈占伟;Ontology及掌纹识别ontology的构建[J];商丘师范学院学报;2003年05期

相关会议论文 前10条

1 王囡;王大玲;于戈;马婷;;Ontology-Scalability:一种基于本体实现社会网络可扩展性的算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

2 ;Web Information Extraction based on News Domain Ontology Theory[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

3 ;A method for OWL Ontology Module Partition[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

4 张亮;陈肇雄;黄河燕;张孝飞;;Ontology在智能信息检索中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年

5 赵书城;高大庆;赵雅洁;;主题数字图书馆中基于Ontology的元数据建模研究[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

6 周相兵;;基于Ontology的语义Web服务聚合自动机研究及应用[A];第二十七届中国控制会议论文集[C];2008年

7 姚文琳;王莉;王璀民;;基于Ontology的知识检索系统的设计与实现[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

8 杨昆;王军;彭双云;;基于Ontology的空间信息互操作初步研究[A];中国地理信息系统协会第八届年会论文集[C];2004年

9 骆雄武;万小军;杨建武;吴於茜;;基于后缀树的Web检索结果聚类标签生成方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

10 王建州;李廉;汪映海;;面向Ontology的电力信息系统的研究[A];2005年信息与通信领域博士后学术会议论文集[C];2005年

相关重要报纸文章 前4条

1 清华大学 陈丹 谢晓芹 蔡月茹;让知识可以共享和重用[N];计算机世界;2002年

2 北京地税个税SOA项目组;让SOA更智能[N];计算机世界;2009年

3 牛晓;计算机辅助创新[N];科技日报;2005年

4 陈礼明;计算机辅助创新[N];中国高新技术产业导报;2005年

相关博士学位论文 前7条

1 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年

2 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年

3 李晓燕;海量图像语义分析和检索技术研究[D];浙江大学;2009年

4 Khalil Ahmed Saleh Al-mekhlafi;[D];大连理工大学;2011年

5 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年

6 刘勇;基于本体的家电领域功能知识表达研究[D];中国海洋大学;2011年

7 王颖;本体匹配器的选择与组合方法研究[D];哈尔滨工程大学;2011年

相关硕士学位论文 前10条

1 朱增霞;基于Ontology的虚拟社群知识库构建与应用研究[D];山东理工大学;2012年

2 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年

3 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年

4 刘艺琴;基于本体的Web非规范知识处理中信息抽取技术研究[D];昆明理工大学;2005年

5 凌海云;基于语义网的智能搜索技术的研究与实现[D];电子科技大学;2004年

6 刘建军;基于ontology的股票信息抽取系统的研究与实现[D];电子科技大学;2005年

7 冯茜;面向信息抽取的ontology设计与实现[D];电子科技大学;2005年

8 孙静;基于Ontology应急救援决策支持系统研究及实现[D];四川大学;2006年

9 李兴隆;基于Ontology的文档检索[D];东北大学;2005年

10 马腾;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2006年



本文编号:2339893

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2339893.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0ec18***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com