当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于文本分类的网络知识发现

发布时间:2017-10-04 04:32

  本文关键词:基于文本分类的网络知识发现


  更多相关文章: 知识发现 文本分类 搜索引擎 规则挖掘


【摘要】:研究基于网络的文本知识发现,根据搜索引擎分类内容的特点,通过几种常用搜索引擎的比较,结合文本分类的特点,发现单纯搜索文本信息资源的引擎更适合于文本分类;进而给出基于文本分类的网络信息获取原型,提出基于元数据的用户感兴趣知识的提取模式,用户可以根据实际情况在给定范围内提取自己感兴趣的文本信息,从而提高文本信息挖掘的精准性。
【作者单位】: 中国人民解放军陆军军官学院;
【关键词】知识发现 文本分类 搜索引擎 规则挖掘
【分类号】:TP391.1
【正文快照】: 0引言互联网飞速发展,网络成为了海量数据的一个载体,互联网用户可以借助Internet搜寻大量的数字化信息,这些数字化信息可以是文本、数字、图形、图像、地图、声音甚至可以是视频。但这些信息大都是分散的、无结构数据,存在着大量无用或垃圾信息,只有小部分是有用的信息,这使

【参考文献】

中国期刊全文数据库 前6条

1 叶震,周兵斌;基于数据挖掘的NIDS日志分析系统[J];合肥工业大学学报(自然科学版);2005年01期

2 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期

3 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期

4 黄嘉满;张冬茉;;基于文本的关联规则提取方法的研究[J];计算机仿真;2008年01期

5 白曦;吕晓枫;孙吉贵;;基于加权向量空间模型的网络搜索[J];计算机应用研究;2007年02期

6 林永民;吕震宇;赵爽;朱卫东;;向量空间模型中特征加权的研究[J];情报杂志;2008年03期

【共引文献】

中国期刊全文数据库 前10条

1 罗长寿;张峻峰;孙素芬;魏清凤;;基于改进VSM的农业实用技术自动问答系统研究[J];安徽农业科学;2009年28期

2 许云,樊孝忠,张锋;一种不需分词的中文文本分类方法[J];北京理工大学学报;2005年09期

3 李兴鹏;秦昌友;;垃圾邮件综合过滤系统的研究与设计[J];电脑知识与技术(学术交流);2007年19期

4 刘静;;浅析Lucene的查询技术[J];电脑知识与技术;2012年11期

5 陈光;;优化K-近邻方法及其应用[J];福建电脑;2009年02期

6 索红光;杨涛;;基于互信息的Web文档聚类方法[J];广西师范大学学报(自然科学版);2007年02期

7 吕曹芳;侯智斌;;基于文本情报的数据挖掘[J];电脑与信息技术;2012年06期

8 袁方,杨柳,张红霞;基于k-近邻方法的渐进式中文文本分类技术[J];华南理工大学学报(自然科学版);2004年S1期

9 李凡,林爱武,陈国社;一种基于VSM文本分类系统的设计与实现[J];华中科技大学学报(自然科学版);2005年03期

10 许勇,宋柔;基于HMM的百科辞典文本中句子的知识点分类[J];计算机工程与应用;2005年04期

中国重要会议论文全文数据库 前2条

1 许勇;宋柔;;基于HMM的百科辞典文本中知识点划分方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年

2 胡蓉;唐常杰;陈敏敏;栾江;;关联规则制导的遗传算法在文本分类中的应用[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

中国博士学位论文全文数据库 前7条

1 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年

2 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年

3 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年

4 柏宏权;适应性教学系统中个性化教学策略研究[D];南京师范大学;2006年

5 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年

6 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年

7 陈圣兵;基于商空间理论的海量信息检索模型的研究[D];安徽大学;2010年

中国硕士学位论文全文数据库 前10条

1 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年

2 张晓艳;面向农业信息服务平台的挖掘技术研究[D];湖南工业大学;2010年

3 姜伦;模糊聚类算法及其在中文文本聚类中的研究与实现[D];哈尔滨理工大学;2010年

4 邓忠莹;中文文本倾向性分类系统研究[D];昆明理工大学;2009年

5 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年

6 郭凯;面向Web文本的数据清洗关键技术的研究与实现[D];西安电子科技大学;2009年

7 王秀菲;基于特征加权支持向量机的复合材料粘接缺陷量化识别研究[D];内蒙古大学;2011年

8 匡巧艳;面向G2C交互平台的Web文本挖掘模型和方法研究[D];湖南大学;2009年

9 陈乐;基于智能文本分类技术的素材管理软件的设计与开发[D];南京师范大学;2003年

10 姚松源;文本自动分类系统的研究与实现[D];北京工业大学;2003年

【二级参考文献】

中国期刊全文数据库 前10条

1 付艳;杨冬青;唐世渭;伍伟;王腾蛟;高军;;基于实体识别的在线主题检测方法[J];北京大学学报(自然科学版);2009年02期

2 张筱丹;胡学钢;;基于向量空间模型的自动摘要冗余处理研究[J];合肥工业大学学报(自然科学版);2010年09期

3 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期

4 范明,李川;在FP-树中挖掘频繁模式而不生成条件FP-树[J];计算机研究与发展;2003年08期

5 尚文倩;黄厚宽;刘玉玲;林永民;瞿有利;董红斌;;文本分类中基于基尼指数的特征选择算法研究[J];计算机研究与发展;2006年10期

6 刘乃丽,李玉忱,马磊;一种有效且无冗余的快速关联规则挖掘算法[J];计算机应用;2005年06期

7 黄建设;;一种改进的关联规则算法探讨[J];计算机仿真;2005年12期

8 刘静,尹存燕,陈家骏;一种规则和贝叶斯方法相结合的文本自动分类策略[J];计算机应用研究;2005年07期

9 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[J];通信学报;2006年02期

10 潘春华,武港山;面向主题的Web信息收集系统的设计与实现[J];小型微型计算机系统;2003年12期

【相似文献】

中国期刊全文数据库 前10条

1 刘苗苗;张永生;;文本分类技术在搜索引擎中的应用[J];中国新技术新产品;2010年04期

2 祝宇;夏诏杰;聂峰光;郭力;;支持向量机在化学主题爬虫中的应用[J];计算机与应用化学;2006年04期

3 丁志刚;王小捷;;一种基于类别意图的信息检索模型[J];郑州大学学报(理学版);2009年01期

4 荣光;张化祥;;文本分类在搜索引擎性能中的应用[J];科技致富向导;2008年24期

5 方兰,王明文;文本自动分类技术及其应用[J];计算机与现代化;2004年07期

6 马玉春,宋瀚涛;基于搜索引擎的知识发现[J];计算机工程与应用;2004年30期

7 彭玉容;沈红岩;程芳;;搜索引擎中的文本分类方法研究[J];中国新技术新产品;2008年17期

8 ;中国计算机学会第九届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2011)征文通知[J];计算机辅助设计与图形学学报;2010年10期

9 ;中国计算机学会第9届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2011)征文通知[J];计算机研究与发展;2010年10期

10 ;中国计算机学会第九届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2011)征文通知[J];计算机科学;2010年10期

中国重要会议论文全文数据库 前10条

1 李卫东;杨炳儒;李龙星;曲文龙;;基于中心词位置的VSM文本分类算法[A];2005中国控制与决策学术年会论文集(下)[C];2005年

2 程新荣;杨仁刚;;网页自动分类在搜索引擎上的应用研究[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年

3 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

4 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

5 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

6 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

7 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年

8 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

9 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年

10 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

中国重要报纸全文数据库 前10条

1 刘文君;搜索引擎也在寻求创新[N];大众科技报;2007年

2 博文邋译;你的隐私 搜索引擎知道[N];计算机世界;2007年

3 杨洁;搜索引擎营销市场生变[N];中国计算机报;2007年

4 赵敏;“鱼群理论”破解搜索营销谜局[N];中国企业报;2007年

5 ;法国挑战谷歌推出卫星地图搜索引擎[N];人民日报;2006年

6 MirrorCity.net技术总监 姚浩;让搜索引擎回归最初梦想[N];中国文化报;2008年

7 本报记者 樊哲高;搜索引擎三国纷争 中文市场两军对垒[N];中国电子报;2009年

8 本报记者 操秀英;国双科技以技术加服务赢得市场[N];科技日报;2009年

9 EndTo;优化Meta讨好搜索引擎[N];电脑报;2009年

10 本报记者 马文方;Yebol:从思维科学导出搜索引擎[N];中国计算机报;2010年

中国博士学位论文全文数据库 前10条

1 王树梅;信息检索相关技术研究[D];南京理工大学;2007年

2 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年

3 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年

4 张邦佐;基于正例和无标记样例学习研究[D];吉林大学;2009年

5 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年

6 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

7 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年

8 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

9 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

10 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年

中国硕士学位论文全文数据库 前10条

1 曾砺锋;基于数字有机体数据库的搜索引擎的理论研究与实现[D];电子科技大学;2008年

2 张蕾;WEB中多媒体资料的发现研究[D];山东师范大学;2004年

3 李凯;Web挖掘在教学资源搜索引擎中的应用研究[D];东北师范大学;2007年

4 谭龙远;基于领域的网络爬虫技术的研究与实现[D];武汉理工大学;2009年

5 丁志刚;基于类别意图的信息检索模型[D];北京邮电大学;2009年

6 王伟;搜索引擎下Web分类技术研究[D];内蒙古科技大学;2011年

7 吕靖;互联网搜索词分类关键技术研究[D];浙江大学;2011年

8 张玉杰;基于偏斜数据集的中文文本分类问题的改进特征权重算法研究[D];东北师范大学;2010年

9 杨晓丹;基于Lucene的主题搜索引擎模板的设计与实现[D];浙江工商大学;2011年

10 江慧娜;中文搜索引擎的关键技术研究[D];北京化工大学;2007年



本文编号:968668

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/968668.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户86608***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com