名人网页的相关度评价
[Abstract]:This paper introduces the design and development of the popularity system of Peking University Skynet, with emphasis on the factors, algorithms and corresponding retrieval results of the relevance evaluation of Chinese celebrity web pages. In view of the shortcomings of the current search engine service, the purpose of this work is to improve the quality of online information service and improve the ability of personalized online information service. On the basis of Skynet search engine of Peking University, this system makes use of natural language processing, especially the new technology of Chinese information extraction, combined with the characteristics of web page information. In this paper, a new web page relevance evaluation algorithm is proposed for celebrity web page retrieval, which improves the rationality of retrieval results and improves the quality of celebrity web page retrieval service.
【作者单位】: 北京大学计算语言学研究所 北京大学计算语言学研究所 北京大学计算语言学研究所 北京大学计算语言学研究所
【基金】:国家自然科学基金资助项目(69973005) 863资助项目(2001AA14040) 北大-IBM创新研究院资助项目
【分类号】:TP393.09
【参考文献】
相关期刊论文 前1条
1 昝红英,俞士汶;CCD及其应用[J];广西师范大学学报(自然科学版);2003年01期
【共引文献】
相关期刊论文 前3条
1 肖丁;万里;吴斌;陈平;;社群网络中基于链接分类的研究与应用[J];广西师范大学学报(自然科学版);2006年04期
2 沙芸;张国英;孟凡亮;;基于关键词提取的娱乐新闻文档去重算法[J];广西师范大学学报(自然科学版);2007年02期
3 徐建民;唐万生;;基于查询术语同义词的扩展信念网络检索模型[J];计算机工程;2007年10期
相关会议论文 前1条
1 昝红英;苏玉梅;孙斌;俞士汶;;基于浅层分析的网页相关度研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
相关博士学位论文 前1条
1 徐建民;基于术语关系的贝叶斯网络信息检索模型扩展研究[D];天津大学;2007年
相关硕士学位论文 前5条
1 石凯华;基于领域词典的汉语语块分析的研究[D];南京邮电大学;2011年
2 陆勇;面向信息检索的汉语同义词自动识别[D];南京农业大学;2005年
3 贾玉祥;基于概率模型的名人网页相关度评价研究[D];郑州大学;2006年
4 段国成;基于CCD的术语抽取研究[D];郑州大学;2007年
5 梁宏胜;朴素贝叶斯文本分类方法改进研究[D];河北大学;2007年
【二级参考文献】
相关会议论文 前1条
1 刘扬;俞士汶;;CCD构造模型及VACOL辅助软件的设计与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
【相似文献】
相关期刊论文 前10条
1 火善栋;;用N-连字算法实现网页的相似度比较[J];现代计算机(专业版);2007年09期
2 万华,牛军钰,吴立德;链接信息在Web检索中的应用[J];计算机工程;2002年09期
3 张选平;马琮;蒋宇;袁明轩;梁平;;一种基于概念抽取的相关词推荐模型[J];微电子学与计算机;2006年05期
4 杨威;FrontPage98在企业Intranet中的应用(六)[J];通信世界;1998年10期
5 卢峰;Frontpage 98的网页编辑[J];电脑技术;1999年03期
6 ;Web Painter 3.0功能完整的网页绘图及动画处理软件[J];电子出版;1999年01期
7 李宗宏;如何利用FrontPage Express制作主页[J];计算机时代;1999年11期
8 ;网上先生——教您上网(四) 上网第四站[J];市场与电脑;1999年07期
9 ;站点扫描[J];计算机周刊;1999年17期
10 云起;信息人——你有网页吗[J];计算机周刊;1999年22期
相关会议论文 前10条
1 白清源;林锦贤;谢丽聪;;信息自动获取系统的研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
2 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 冯艳卉;洪宇;颜振祥;姚建民;朱巧明;;基于搜索引擎的双语混合网页识别新方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 江志纲;丁增喜;刘洋;王大玲;鲍玉斌;于戈;;基于面向属性规约方法的网页和超链的分类[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
5 孔辉;梁洪亮;辛阳;杨义先;陈林顺;;一种高性能的网页篡改检测与恢复机制[A];2010年全国通信安全学术会议论文集[C];2010年
6 刘晖;赵萍;;新疆环境气象中心网站的总体规划及建设[A];信息技术在气象领域的开发应用论文集(一)[C];2005年
7 李立宗;高铁杠;陈蓉;陈超;;基于混沌系统的web信息隐藏研究与实现[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
8 王玉龙;叶新铭;李秀华;;网页优化策略的模糊C均值(FCM)聚类算法研究(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 朱建国;孙钟德;刘婷;;地市级网络管理监控初探[A];“推进气象科技创新,,提高防灾减灾和应对气候变化能力”——江苏省气象学会第七届学术交流会论文集[C];2011年
10 郑传新;谢筱惠;;基于网页技术的决策气象服务信息系统[A];2002年广西气象电子专业技术交流会论文集[C];2002年
相关重要报纸文章 前10条
1 任悦采写 本报记者 方妍;照片买家说,网页繁复不招喜欢[N];中国摄影报;2009年
2 鸣涧;走近3D梦幻网页(3)[N];中国电脑教育报;2002年
3 湖南 Ringfo;防止你的网页被“偷拍”[N];电脑报;2002年
4 路人甲;在网页上圈圈点点[N];电脑报;2004年
5 湖南 郭荣辉;网页图片保存四法[N];电子报;2005年
6 鸣涧;初次握手3D网页[N];中国电脑教育报;2002年
7 李芳香;和网页垃圾说再见[N];中国电脑教育报;2002年
8 马淑芬 记者 吴岳福;宝清 率先启动“村村通网页”工程[N];黑龙江日报;2010年
9 鸣涧;网页的编辑[N];中国电脑教育报;2002年
10 辽宁 张策;滚动的字幕 滚动的网页[N];中国电脑教育报;2002年
相关博士学位论文 前10条
1 刘东飞;智能双语搜索方法及搜索引擎的研究[D];武汉理工大学;2009年
2 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
3 杨建波;基于多小波及遗传算法的数字水印技术研究[D];吉林大学;2005年
4 覃健诚;网络多层纵深防御体系的关键技术研究[D];北京邮电大学;2011年
5 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
6 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
7 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
8 冯登国;频谱理论及其在通信保密技术中的应用[D];西安电子科技大学;1995年
9 黄小广;港美经济关系研究[D];暨南大学;2008年
10 洪宇;基于语义结构和时序特征的话题检测与跟踪技术研究[D];哈尔滨工业大学;2009年
相关硕士学位论文 前10条
1 孙学刚;面向奥运的中文网页信息获取方法的初步研究[D];清华大学;2004年
2 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
3 张晓宇;农业网站中垃圾网页过滤方法的研究[D];新疆大学;2011年
4 王祥冰;个人网页人际意义构建的多模态分析[D];西南交通大学;2012年
5 李琦;基于层次聚类和网页关系的人名消歧[D];山东大学;2012年
6 姚永祥;基于XTM的政务知识导航系统的研究与实现[D];大连理工大学;2006年
7 李艳群;网络教育资源的建设及查询方法研究[D];山东师范大学;2005年
8 刘金;模块化设计在中央空调产品项目开发中的应用[D];上海交通大学;2009年
9 尹本雄;中文搜索引擎中的文档特征提取研究[D];广西师范大学;2004年
10 闫蓉;基于语义的汉语词义消歧方法研究[D];西北大学;2006年
本文编号:2485026
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2485026.html