当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Java的搜索引擎技术在Web信息挖掘中的应用

发布时间:2019-10-24 04:49
【摘要】:为了快速有效地从海量的网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用,采用搜索引擎技术,借鉴Web挖掘技术解决用户检索网络信息的困难。同时探讨搜索引擎技术在网络信息挖掘方面的应用,重点研究网络爬行器技术,给出了Linux下Java语言实现简陋Web爬虫代码。研究结果表明对于搜索引擎而言,通过借鉴Web挖掘技术,可以提高查准率和查全率,改善检索结果的组织,增强检索用户的模式研究,从而使得检索效率得到改善。该成果对Web信息挖掘有一定参考价值。
【作者单位】: 辽宁工程技术大学工商管理学院;辽宁工业大学电子与信息工程学院;
【基金】:辽宁省博士科研启动基金项目资助(20091034)
【分类号】:TP393.09

【参考文献】

相关期刊论文 前2条

1 涂承胜,鲁明羽,陆玉昌;Web内容挖掘技术研究[J];计算机应用研究;2003年11期

2 徐谦;;网络信息检索的智能化趋势[J];图书馆理论与实践;2006年02期

相关博士学位论文 前1条

1 王实;基于Web访问信息挖掘的推荐方法研究[D];中国科学院研究生院(计算技术研究所);2001年

【共引文献】

相关期刊论文 前10条

1 刘俊熙;Web挖掘过程和元数据的运用[J];情报杂志;2004年02期

2 宋伟,王举成,马根峰,赵济林;Internet数据挖掘原理及实现[J];重庆邮电学院学报(自然科学版);2001年02期

3 廖里,余英泽,吴渝,聂能;数据挖掘和数据仓库及其在电信业中的应用[J];重庆邮电学院学报(自然科学版);2000年04期

4 王宇,杨莉;模糊k-prototypes聚类算法的一种改进算法[J];大连理工大学学报;2003年06期

5 赵建军;Web数据挖掘[J];电脑知识与技术;2005年05期

6 周永权,焦李成;高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法[J];电子学报;2004年08期

7 冷英男,李文超,陈金林,郭利松;数据挖掘在网站网页设计优化中的应用[J];抚顺石油学院学报;2002年04期

8 王熙照,王丽娟,袁方,湛燕;Web用户访问模式挖掘[J];河北大学学报(自然科学版);2002年04期

9 祖巧红,陈定方,胡吉全;分析型客户关系管理系统的研究[J];湖北工业大学学报;2005年03期

10 黄永锋,刘同明;聚集式聚类分析方法及其应用[J];华东船舶工业学院学报(自然科学版);2002年04期

相关会议论文 前5条

1 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年

2 祖巧红;陈定方;胡吉全;;分析型客户关系管理系统的研究[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年

3 杨子良;陶宏才;;一种基于向量运算的频繁项集快速挖掘算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年

4 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年

5 赵立江;何钦铭;;聚类分析在个性化学习中的研究与应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

相关博士学位论文 前9条

1 许志兴;粗集理论的若干技术及其应用研究[D];南京航空航天大学;2001年

2 罗可;数据库中数据挖掘理论方法及应用研究[D];湖南大学;2005年

3 皮德常;CIMS数据库中数据挖掘关键技术的研究[D];南京航空航天大学;2002年

4 闫巧;基于免疫机理的入侵检测系统研究[D];西安电子科技大学;2003年

5 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年

6 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年

7 魏玖长;危机事件社会影响的分析与评估研究[D];中国科学技术大学;2006年

8 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年

9 冯永;基于计算智能的聚类技术及其应用研究[D];重庆大学;2006年

相关硕士学位论文 前10条

1 杨建光;电信级智能网络信息过滤引擎的研究和应用[D];浙江大学;2005年

2 褚学征;面向PDM的可视化聚类系统研究与开发[D];华中科技大学;2005年

3 刘晓鹏;基于用户浏览兴趣度的WEB挖掘[D];辽宁工程技术大学;2005年

4 王晨力;基于蚁群优化算法的电力负荷聚类和输电线故障识别研究[D];天津大学;2005年

5 赵朋;基于Web的用户访问信息挖掘研究[D];东华大学;2006年

6 杨占华;聚类分析研究及其在文本挖掘中的应用[D];西南交通大学;2006年

7 江永全;Web文档聚类系统的设计与实现[D];西南交通大学;2006年

8 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年

9 赵立刚;搜索引擎的研究与设计[D];吉林大学;2005年

10 张兆中;WEB文本挖掘的聚类分析[D];山东科技大学;2005年

【二级参考文献】

相关期刊论文 前10条

1 刘志勇;网络环境下信息检索效率的评价[J];大连大学学报;2002年01期

2 凌美秀;关于搜索引擎当前存在的主要问题及其发展趋势的探讨[J];高校图书馆工作;2001年05期

3 胡维青;Web信息检索技术浅谈[J];河南图书馆学刊;2002年04期

4 金峰,刘永丹,江宝林,胡运发;TTFS:一个倾向性文本过滤系统的设计与实现[J];计算机工程与应用;2003年30期

5 赵仲孟,袁薇,何世丽,沈钧毅;个性化搜索引擎中用户模型智能调整算法的研究[J];计算机工程与应用;2005年24期

6 彭京;杨冬青;唐世渭;付艳;蒋汉奎;;一种基于语义内积空间模型的文本聚类算法[J];计算机学报;2007年08期

7 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期

8 金芳;浅谈信息检索与信息检索技术[J];晋图学刊;2001年03期

9 邓汉成,王敏芳,王瑛;查全率与查准率之间关系的理论研究[J];情报学报;2000年04期

10 李花芹,张国芳;元搜索引擎及其特色[J];情报杂志;2005年06期

【相似文献】

相关期刊论文 前10条

1 褚丽莉;;基于Java的搜索引擎技术在Web信息挖掘中的应用[J];辽宁工程技术大学学报(自然科学版);2010年05期

2 梁勇勇;;基于数据挖掘的WEB内容过滤系统模型[J];今日科技;2006年04期

3 樊友国;丁鸿鸣;;虚拟社区管理初探[J];电脑知识与技术(学术交流);2007年16期

4 张彤;童向兰;;面向企业的Web使用挖掘研究[J];中小企业管理与科技(上旬刊);2008年07期

5 李霞;;Web内容挖掘在企业电子商务网站的应用研究[J];网络财富;2010年09期

6 吴庆涛,普杰信,崔林;基于BBS文本信息的数据挖掘[J];洛阳工学院学报;2002年02期

7 尹海丽,刘慧;用一种数据挖掘的方法解决网络拥挤的问题[J];青岛理工大学学报;2005年05期

8 高月,梁本亮;浅谈网络信息挖掘[J];通信电源技术;2004年01期

9 张超;;入侵检测与蜜网及防火墙的联动技术[J];科技经济市场;2007年03期

10 王斌;王汉飞;;网络数据智能提取[J];石油工业计算机应用;2003年02期

相关会议论文 前10条

1 褚丽莉;;基于Java的搜索引擎技术在Web信息挖掘中的应用[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年

2 易虹;许德刚;;Web数据挖掘的研究与应用[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年

3 王洪肖;刘威;于贺玲;;基于XML技术的WEB数据收集模型的研究[A];低碳经济与科学发展——吉林省第六届科学技术学术年会论文集[C];2010年

4 解晓萌;冼进;;基于IBM S/390面向Web数据挖掘系统[A];04'中国企业自动化和信息化建设论坛暨中南六省区自动化学会学术年会专辑[C];2004年

5 陈曦;曾凡锋;;数据挖掘算法在风险评估中的应用[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

6 董泗光;李玉忱;袁春阳;赵汝腾;吴新松;;基于数据挖掘的入侵检测系统模型[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

7 王萍萍;戴上平;郑世珏;单亚静;;基于马尔可夫链的点击流技术在校园网评估分析中的应用[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

8 吴珊;杨桦;;基于日志挖掘的Web预取模型[A];2006年电气工程教育专业委员会年会论文集[C];2006年

9 朱肇中;;内外网逻辑隔离技术[A];2003年中国智能自动化会议论文集(下册)[C];2003年

10 谷远虎;;JAVA技术在互联网实时接口系统中的应用[A];江苏省通信学会2004年学术年会论文集[C];2004年

相关重要报纸文章 前10条

1 ;帮助分支办公室改善互联网连接性能[N];网络世界;2008年

2 本报记者 胡英;过滤互联网内容需采用新招[N];计算机世界;2009年

3 本报记者 边歆;2009年下半年互联网十大威胁回顾[N];网络世界;2010年

4 孙富春 李磊;电子政务中的数据挖掘[N];计算机世界;2001年

5 刘忠厚;基于IPv6的新一代互联网值得关注[N];学习时报;2006年

6 Mark Gibbs;互联网地狱的分层[N];网络世界;2006年

7 徐勇;全天候接入创造互联网新应用[N];人民邮电;2006年

8 四川 舒航;UCWEB让你的手机畅游互联网[N];电子报;2009年

9 本报记者 边歆;改变习惯的力量[N];网络世界;2005年

10 Thomas Nolle;超越互联网[N];网络世界;2007年

相关博士学位论文 前10条

1 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年

2 傅涛;基于数据挖掘的分布式网络入侵协同检测系统研究及实现[D];南京理工大学;2008年

3 齐建东;基于数据挖掘的入侵检测方法及系统研究[D];中国农业大学;2003年

4 章淼;互联网端到端拥塞控制的研究[D];清华大学;2004年

5 李婧;应用层组播算法研究[D];中国科学技术大学;2007年

6 陈平;数据挖掘网格若干关键技术研究[D];北京邮电大学;2007年

7 刘勇国;基于数据挖掘的网络入侵检测研究[D];重庆大学;2003年

8 吴瑞;模糊和粗糙环境下的网络用户浏览模式研究[D];天津大学;2006年

9 郑健平;互联网的IP组播与泛播通信机制研究[D];中国科学院研究生院(软件研究所);2005年

10 曲昭伟;基于下一代移动互联网客户的服务质量管理研究[D];北京邮电大学;2006年

相关硕士学位论文 前10条

1 姜亚南;数据挖掘在校园网用户网络行为分析的应用研究[D];河南理工大学;2009年

2 吴海红;基于Web日志的数据挖掘[D];武汉科技大学;2003年

3 范斌;基于Web服务的分布式数据挖掘系统研究[D];武汉理工大学;2004年

4 张承明;基于Web的数据挖掘研究[D];山东科技大学;2003年

5 赵云成;基于流量突变及数据挖掘的DDOS攻击检测与防范方法研究[D];吉林大学;2009年

6 廖国威;基于数据挖掘的分布式入侵检测系统研究[D];西北工业大学;2004年

7 林萍;基于数据挖掘的入侵检测系统研究与实现[D];昆明理工大学;2004年

8 任铮;基于数据挖掘和规划识别的入侵检测技术的应用和研究[D];中南大学;2005年

9 于涛;基于系统调用监控的入侵检测模型的研究与实现[D];沈阳工业大学;2005年

10 谭雅莉;数据挖掘在网络入侵检测中的应用[D];广东工业大学;2005年



本文编号:2552388

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2552388.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d141b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com