当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于示例的Web信息自动获取系统的设计与实现

发布时间:2018-04-05 00:17

  本文选题:中文示例Web页面 切入点:Web信息获取 出处:《计算机应用》2005年S1期


【摘要】:介绍了一个基于多层体系结构的个性化W eb信息自动获取系统的设计与实现,提出了一种新的基于少量中文示例W eb页面的兴趣特征抽取算法,并给出了系统的检全率和检准率测试结果。实验结果表明,较基于关键词的搜索引擎而言,该系统能充分考虑用户的兴趣偏好(示例),长期、主动地向用户提供更加准确的W eb信息获取服务。
[Abstract]:This paper introduces the design and implementation of a personalized Web information acquisition system based on multi-layer architecture, and proposes a new interest feature extraction algorithm based on a small number of Chinese sample Web pages.The test results are given.The experimental results show that the system can take full account of the interest preferences of users compared with the search engine based on keywords (example, long-term, active and more accurate Web information acquisition services to users).
【作者单位】: 海南大学信息科学技术学院 海南大学信息科学技术学院
【基金】:教育部科学技术研究重点资助项目(03144)
【分类号】:TP393.092

【参考文献】

相关期刊论文 前2条

1 张春元,康耀红,王曙光,张莉;中文搜索引擎的缺陷与改进[J];海南大学学报(自然科学版);2004年01期

2 黄萱菁,夏迎炬,吴立德;基于向量空间模型的文本过滤系统[J];软件学报;2003年03期

相关博士学位论文 前1条

1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年

【共引文献】

相关期刊论文 前10条

1 杭娟;张冬茉;;一种基于同义词消除的文本过滤方法[J];计算机工程与应用;2006年19期

2 于海燕;陈晓江;冯健;房鼎益;;Web文本内容过滤方法的研究[J];微电子学与计算机;2006年09期

3 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期

4 陈磊,冯玉珉;一种基于网页自动分类的分类查询搜索引擎[J];电脑与信息技术;2004年06期

5 贺卫红;曹毅;;基于向量空间模型文本过滤算法[J];系统工程;2005年10期

6 索红光;杨涛;;基于互信息的Web文档聚类方法[J];广西师范大学学报(自然科学版);2007年02期

7 伊文敏,高岩,王颖;评估信息过滤系统的方法及衡量标准概述[J];河北建筑工程学院学报;2004年02期

8 丁月华,文贵华,郭炜强;基于核向量空间模型的专利分类[J];华南理工大学学报(自然科学版);2005年08期

9 雷鸣,刘建国,王建勇,陈葆珏;一种基于词典的搜索引擎系统动态更新模型[J];计算机研究与发展;2000年10期

10 周水庚,关佶红,胡运发,周傲英;一个无需词典支持和切词处理的中文文档分类系统[J];计算机研究与发展;2001年07期

相关会议论文 前6条

1 陈希;侯德文;朱祥玉;;基于强化学习的信息过滤模型[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年

2 朱祥玉;侯德文;陈希;;基于双重评估函数的文本特征提取方法[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年

3 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

4 于海燕;陈晓江;冯健;房鼎益;;Web文本内容过滤方法的研究[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年

5 李连霞;马军;陈竹敏;;基于多特征的网页内容提取研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年

6 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

相关博士学位论文 前10条

1 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年

2 王树梅;信息检索相关技术研究[D];南京理工大学;2007年

3 吴江;基于本体的知识管理系统关键技术研究[D];西北大学;2007年

4 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年

5 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年

6 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年

7 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年

8 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年

9 贾自艳;Web信息智能获取若干关键问题研究[D];中国科学院研究生院(计算技术研究所);2004年

10 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年

相关硕士学位论文 前10条

1 江飞;基于内容的过滤技术研究及其在隔离网闸中的应用[D];解放军信息工程大学;2007年

2 方柯;面向网络不良文本过滤的概念网技术研究与实现[D];上海交通大学;2007年

3 贾丙静;聚类分析在Web文本挖掘中的应用研究[D];辽宁工程技术大学;2007年

4 孙登林;基于概念网的不良信息过滤研究与实现[D];上海交通大学;2008年

5 吴新涛;基于向量空间模型的网页信息过滤方法研究[D];大连理工大学;2008年

6 炎士涛;基于词频统计的文本分类模型研究[D];上海师范大学;2007年

7 王晓欢;移动通信客户服务中的知识导航方法研究[D];大连理工大学;2007年

8 邹腊梅;基于隐马尔可夫模型的Web文本挖掘技术研究[D];南华大学;2007年

9 杨春喜;Web文本内容过滤关键技术的分析与研究[D];暨南大学;2007年

10 杨珂;基于Linux的智能内容过滤防火墙的研究与实现[D];西北大学;2006年

【二级参考文献】

相关期刊论文 前4条

1 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期

2 王建勇,单松巍,雷鸣,谢正茂,李晓明;海量Web搜索引擎系统中用户行为的分布特征及其启示[J];中国科学E辑;2001年04期

3 李志蜀,李果;中文搜索引擎的原理剖析及开发实现技术[J];计算机应用研究;2001年11期

4 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期

【相似文献】

相关期刊论文 前1条

1 张春元;康耀红;;基于示例的Web信息自动获取系统的设计与实现[J];计算机应用;2005年S1期



本文编号:1712349

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1712349.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户81519***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com