基于朴素贝叶斯的垂直搜索引擎分类器设计
本文关键词:基于朴素贝叶斯的垂直搜索引擎分类器设计
更多相关文章: 朴素贝叶斯 垂直搜索引擎 特征提取 文档分类
【摘要】:随着互联网的网页数量呈现爆炸式增长,传统的通用搜索引擎越来越遭人诟病,查询不准、深度不够等问题,使用户倍感烦恼。因此,针对特定行业的垂直搜索引擎逐渐兴起,与之相关的研究也日益受到重视。网页分类是垂直搜索引擎的基础和难点,分类器的好坏直接决定了一个垂直搜索引擎系统的性能。基于朴素贝叶斯的垂直搜索引擎分类器通过CHI方法进行特征提取,利用朴素贝叶斯模型对从互联网爬取的网页按内容类别进行分类。实验结果表明,该分类器对网页分类有着良好的表现,为构建大型专业的垂直搜索引擎系统奠定了一定的理论基础。
【作者单位】: 天津科技大学;河北远东通信系统工程有限公司;
【分类号】:TP391.3
【正文快照】: 0引言所谓垂直搜索引擎,是针对某一个行业或类别的专业搜索引擎,其特点是“专、精、深”,且具有行业色彩,相比传统通用搜索引擎的海量信息无序化,垂直搜索引擎则更加专注、具体和深入[1]。2006年以来,国内垂直搜索引擎与相关行业相结合,在IT信息、房地产、招聘、购物和医疗等
【参考文献】
中国期刊全文数据库 前10条
1 王树文;郑阔实;陈竟博;;面向教育主题的垂直搜索引擎的设计与实现[J];长春师范学院学报;2013年04期
2 菅小艳;崔彩霞;;基于朴素贝叶斯的文本分类[J];电脑开发与应用;2013年12期
3 李静梅,孙丽华,张巧荣,张春生;一种文本处理中的朴素贝叶斯分类器[J];哈尔滨工程大学学报;2003年01期
4 卢苇;彭雅;;几种常用文本分类算法性能比较与分析[J];湖南大学学报(自然科学版);2007年06期
5 胡永锋;;浅谈垂直搜索引擎的工作原理[J];科学大众(科学教育);2011年06期
6 任晓娜;;基于Lucene的全文搜索引擎的研究与实现[J];湖北广播电视大学学报;2010年05期
7 王文钧;李巍;;垂直搜索引擎的现状与发展探究[J];情报科学;2010年03期
8 余淼;杨丹;赵俊芹;;垂直搜索引擎的关键技术研究[J];软件导刊;2007年23期
9 张红斌;曹义亲;;混合多层分类和朴素贝叶斯模型的垂直搜索引擎分类器设计[J];现代图书情报技术;2011年03期
10 余芳,姜云飞;一种基于朴素贝叶斯分类的特征选择方法[J];中山大学学报(自然科学版);2004年05期
中国重要会议论文全文数据库 前1条
1 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
【共引文献】
中国期刊全文数据库 前10条
1 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
2 陈弋兰;;基于朴素贝叶斯分类的图像消噪[J];安庆师范学院学报(自然科学版);2008年03期
3 邵乐;于红;刘溪婧;綦孝姬;梁晓娜;;基于朴素贝叶斯的渔业文本分类器研究[J];大连水产学院学报;2010年01期
4 刘颖;;贝叶斯方法在文本分类预处理中的应用[J];电脑与信息技术;2010年06期
5 刘颖;;浅析贝叶斯方法在文本分类中的应用[J];电脑知识与技术(学术交流);2007年22期
6 牟肖光;宫丽宁;;基于朴素贝叶斯的中文垃圾短信过滤系统的设计[J];电脑知识与技术;2008年32期
7 苑俊英;袁方;刘博;;一种基于类别核心词的概念映射方法[J];广西师范大学学报(自然科学版);2007年02期
8 杨永斌;;油田信息专业搜索引擎的研究与应用[J];计算机光盘软件与应用;2012年12期
9 焦鹏;王新政;谢鹏远;;基于属性选择法的朴素贝叶斯分类器性能改进[J];电讯技术;2013年03期
10 陈晓丽;杨欣蓉;王作钊;周航;赵益;沈玲玲;;面向制造业的知识搜索引擎设计[J];电脑知识与技术;2013年16期
中国重要会议论文全文数据库 前6条
1 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
2 徐晓东;郭燕慧;;AppStore应用信息自动化采集系统设计与实现[A];2013年中国信息通信研究新进展论文集[C];2014年
3 周利民;童珉;陈燕双;;面向互联网视频主题管理的搜索引擎关键技术研究及实现[A];中国新闻技术工作者联合会第六次会员代表大会、2014年学术年会暨第七届《王选新闻科学技术奖》和优秀论文奖颁奖大会论文集(二等奖)[C];2014年
4 徐晓东;郭燕慧;;App Store应用信息自动化采集系统设计与实现[A];2013年中国信息通信研究新进展论文集[C];2014年
5 吴运超;崔浩;王赛;王浩然;崔真真;;面向规划编制的网络数据获取与整合方法研究[A];第十七届中国科协年会——分16 大数据与城乡治理研讨会论文集[C];2015年
6 张维楚;高翔;;互联网热点搜索与追踪的研究和实现[A];中国新闻技术工作者联合会2015年度“新闻科技论文”优秀论文集[C];2015年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
3 罗建宏;粒计算分类知识发现算法及其应用[D];浙江大学;2010年
4 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
5 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
6 周亦鹏;基于软件人的情境主题分析及应用研究[D];北京科技大学;2012年
7 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年
8 王龙;教育资源推荐服务中若干关键技术的研究[D];吉林大学;2013年
9 黄炜;电子商务环境下商品信息检索的若干问题研究[D];武汉大学;2010年
10 王骏;基于文本挖掘的国际关系网络研究[D];北京邮电大学;2013年
中国硕士学位论文全文数据库 前10条
1 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
2 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
3 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
4 荣建文;基于RS-SVM的Web中文文本自动分类研究[D];东北财经大学;2010年
5 许世明;中文网页分类技术研究及预分类算法实现[D];西安电子科技大学;2009年
6 王佳;支持Ajax技术的主题网络爬虫系统研究与实现[D];北京交通大学;2011年
7 黄华;基于搜索引擎和语义的Web服务发现研究[D];武汉理工大学;2011年
8 么士宇;基于分布式计算的网络爬虫技术研究[D];大连海事大学;2011年
9 管翠花;支持Ajax技术的Deep Web网络爬虫模型研究[D];大连海事大学;2011年
10 孙海东;面向医学教育视频的垂直检索的研究[D];第二军医大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 吴yP昕;顺风;;网络搜索引擎的发展趋势分析[J];当代传播;2007年03期
2 卢新国,林亚平,陈治平;一种改进的互信息特征选取预处理算法[J];湖南大学学报(自然科学版);2005年01期
3 刘佳;贾彩燕;;基于TAN的文本自动分类框架[J];计算机工程;2010年16期
4 王琼;搜索引擎的四大发展趋势[J];农业网络信息;2005年03期
5 孙登峰;面向XML文档的概念检索技术[J];计算机应用;2003年01期
6 朱学昊;王儒敬;余锋林;唐昱;;基于Lucene的站内搜索设计与实现[J];计算机应用与软件;2008年10期
7 刘畅;;综合搜索引擎与垂直搜索引擎的比较研究[J];情报科学;2007年01期
8 李广丽;;基于网页内容评价和Web图的启发式垂直搜索策略的设计[J];情报理论与实践;2009年09期
9 何东炯;搜索无所不在[J];软件世界;2005年09期
10 罗海飞;吴刚;杨金生;;基于贝叶斯的文本分类方法[J];计算机工程与设计;2006年24期
中国博士学位论文全文数据库 前1条
1 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前1条
1 李广丽;垂直搜索引擎的研究与设计[D];华东交通大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 郑凯明;李义杰;;垂直搜索引擎及其应用价值[J];信息技术;2008年04期
2 许鑫;黄仲清;;垂直搜索引擎应用中的若干策略探讨——以12580餐饮垂直搜索为例[J];现代图书情报技术;2009年02期
3 祝奕;;垂直搜索引擎的构建与应用[J];信息与电脑(理论版);2010年01期
4 张美芳;张迎春;;浅议垂直搜索引擎服务市场的商业模式[J];现代商业;2010年06期
5 焦龙;;垂直搜索引擎在旅游企业中应用的探索[J];商场现代化;2010年08期
6 赵宏中;李亚;;垂直搜索引擎应用研究[J];现代商贸工业;2010年04期
7 陈高维;邓天权;曾云磊;王维国;张龙;;基于垂直搜索引擎的旅游线路评价模型的设计[J];科技创新导报;2010年18期
8 刘小强;;二手转让及房产租售垂直搜索引擎的设计与实现[J];三门峡职业技术学院学报;2010年03期
9 郑凯明;;垂直搜索引擎应用研究[J];赤峰学院学报(自然科学版);2011年02期
10 胡永锋;;浅谈垂直搜索引擎的工作原理[J];科学大众(科学教育);2011年06期
中国重要会议论文全文数据库 前4条
1 褚蓓蓓;刘丹;;垂直搜索引擎:搜索引擎发展方向[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
2 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 毛华扬;刘卫;;会计信息搜索方法研究[A];第十届全国会计信息化年会论文集[C];2011年
中国重要报纸全文数据库 前1条
1 电子工业出版社 董娅 工业和信息化部电子科学技术情报研究所 周峻松;用开源软件建垂直搜索引擎[N];计算机世界;2010年
中国博士学位论文全文数据库 前3条
1 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年
2 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年
3 王桂红;农产品市场价格web信息分析方法研究[D];沈阳农业大学;2013年
中国硕士学位论文全文数据库 前10条
1 崔诗远;基于垂直搜索引擎的旅行社网络营销[D];青岛大学;2009年
2 翟晓玲;面向学科的基础教育资源垂直搜索引擎的研究与实现[D];东北师范大学;2009年
3 王嘉杰;面向博客领域的垂直搜索引擎的研究与实现[D];北京邮电大学;2009年
4 刘明君;垂直搜索引擎传播学特征及应用研究[D];华中科技大学;2008年
5 黎斌;可扩展分布式垂直搜索引擎设计与实现研究[D];国防科学技术大学;2008年
6 李春燕;企业信息垂直搜索引擎的研究与实现[D];中国地质大学(北京);2010年
7 石占伟;垃圾页面检测及其在垂直搜索引擎中的应用[D];燕山大学;2010年
8 张楠;面向汽车主题的垂直搜索引擎研究与实现[D];西南交通大学;2010年
9 陈向东;宠物用品垂直搜索引擎研究与设计[D];西北农林科技大学;2010年
10 周佳庆;实时垂直搜索引擎数据抓取调度研究[D];浙江大学;2010年
,本文编号:1144592
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1144592.html