当前位置:主页 > 科技论文 > 搜索引擎论文 >

混合多层分类和朴素贝叶斯模型的垂直搜索引擎分类器设计

发布时间:2019-03-07 15:38
【摘要】:研究Web上计算机教育资源的分布特点,融合主题词和文档形式,设计多层分类器来完成主题搜索过程中的正确分类,继而应用朴素贝叶斯模型对主题资源信息进行自动类别划分,完成资源的物理存储。实验中主题分类的平均正确率约78%,主题的平均召回率约61%,而资源解析的平均正确率约81.5%,测试结果能够验证本文设计思想的可行性。
[Abstract]:This paper studies the distribution characteristics of computer education resources on Web, integrates topic words and document forms, and designs multi-layer classifiers to complete the correct classification in the process of topic search. Then the naive Bayesian model is used to classify the subject resource information automatically, and the physical storage of the resource is completed. In the experiment, the average correct rate of topic classification is about 78%, the average recall rate of topic is about 61%, and the average correct rate of resource analysis is about 81.5%. The test results can verify the feasibility of the design idea in this paper.
【作者单位】: 华东交通大学软件学院;
【基金】:教育部人文社会科学研究规划项目“基于模式识别的金融时间序列挖掘技术研究”(项目编号:09YJA630036) 华东交通大学校立科研基金项目“基于SOA架构的垂直搜索引擎的研究与实现”(项目编号:08XX05)的研究成果之一
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 李方;刘琼荪;;基于改进属性加权的朴素贝叶斯分类模型[J];计算机工程与应用;2010年04期

2 唐中军;聂珍;;高校图书馆重点学科垂直搜索引擎初探[J];科技情报开发与经济;2010年01期

3 张美芳;张迎春;;浅议垂直搜索引擎服务市场的商业模式[J];现代商业;2010年06期

4 张敏;;基于本体的垂直搜索引擎的研究[J];软件导刊;2010年02期

5 王文钧;李巍;;垂直搜索引擎的现状与发展探究[J];情报科学;2010年03期

6 王琦;张戈;何婧;;基于Lucene与Heritrix的图书垂直搜索引擎的研究与实现[J];计算机时代;2010年02期

7 祝奕;;垂直搜索引擎的构建与应用[J];信息与电脑(理论版);2010年01期

8 兰富军;李春霆;高海忠;;农业主题垂直搜索引擎过滤技术研究[J];安徽农业科学;2010年09期

9 孙铁利;赵隽;杨凤芹;吴迪;;一种基于相对特征的文本分类算法[J];东北师大学报(自然科学版);2010年01期

10 林国;;基于朴素贝叶斯的农业土地适宜性评价算法设计[J];杭州师范大学学报(自然科学版);2010年02期

相关会议论文 前10条

1 李毅;顾健;顾铁军;;基于朴素贝叶斯方法的邮件样本预筛选[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年

2 袁继来;林建入;柯曾勇;;岩爆可能性估计的贝叶斯网络方法[A];Proceedings of 2010 The 3rd International Conference on Computational Intelligence and Industrial Application(Volume 6)[C];2010年

3 韩增新;颜雪松;姜韬;;一种改进的朴素贝叶斯文本分类器研究[A];Proceedings of 2010 The 3rd International Conference on Computational Intelligence and Industrial Application(Volume 6)[C];2010年

4 司学峰;蒋国瑞;李英毅;;基于数据挖掘技术的客户流失预测研究综述[A];第三届中国智能计算大会论文集[C];2009年

5 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年

6 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

7 许震;沙朝锋;王晓玲;周傲英;;LiPU:一种基于KL距离的主动分类算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

8 黄文良;李石坚;刘菊新;徐从富;;大规模垃圾短信实时过滤系统的设计与实现[A];中国通信学会第五届学术年会论文集[C];2008年

9 富羽鹏;张敏;马少平;;通过邮件分析进行专家查找[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

10 苏绥;林鸿飞;叶正;;基于字符语言模型的垃圾邮件过滤[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

相关重要报纸文章 前10条

1 本报记者 陈炜;生意宝瞄准大宗商品交易市场[N];国际商报;2011年

2 电子工业出版社 董娅 工业和信息化部电子科学技术情报研究所 周峻松;用开源软件建垂直搜索引擎[N];计算机世界;2010年

3 记者李淼;盛大全面布局电子书产业[N];中国新闻出版报;2010年

4 记者李淼;盛大全面布局电子书产业[N];中国新闻出版报;2010年

5 记者李淼;盛大全面布局电子书产业[N];中国新闻出版报;2010年

6 记者李淼;盛大全面布局电子书产业[N];中国新闻出版报;2010年

7 记者李淼;盛大全面布局电子书产业[N];中国新闻出版报;2010年

8 记者李淼;盛大全面布局电子书产业[N];中国新闻出版报;2010年

9 记者李淼;盛大全面布局电子书产业[N];中国新闻出版报;2010年

10 记者李淼;盛大全面布局电子书产业[N];中国新闻出版报;2010年

相关博士学位论文 前10条

1 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年

2 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年

3 蒋庆华;基于生物网络的疾病microRNA挖掘技术研究[D];哈尔滨工业大学;2010年

4 蒋庆华;基于生物网络的疾病microRNA挖掘技术研究[D];哈尔滨工业大学;2010年

5 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年

6 蒋良孝;朴素贝叶斯分类器及其改进算法研究[D];中国地质大学;2009年

7 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年

8 舒泓;电能质量扰动检测和分类问题的研究[D];北京交通大学;2009年

9 关菁华;基于贝叶斯网数据挖掘若干问题研究[D];吉林大学;2009年

10 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年

相关硕士学位论文 前10条

1 唐业yN;基于轻量级J2EE的证券数据分析系统研究与设计[D];浙江大学;2011年

2 王海波;垃圾短信的屏蔽机制与应用研究[D];东华大学;2011年

3 李彬;基于NetFPGA的网络流量分类[D];电子科技大学;2011年

4 路慧;基于模式识别算法的网络入侵检测系统研究[D];华东师范大学;2010年

5 梅君;中文文本分类的研究与应用[D];南昌大学;2010年

6 李春燕;企业信息垂直搜索引擎的研究与实现[D];中国地质大学(北京);2010年

7 李亮;基于Lucene和Heritrix的职位垂直搜索引擎的设计与实现[D];中国地质大学(北京);2010年

8 石占伟;垃圾页面检测及其在垂直搜索引擎中的应用[D];燕山大学;2010年

9 许厚金;垂直搜索引擎及其关键方法研究[D];燕山大学;2010年

10 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年



本文编号:2436236

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2436236.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户53198***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com