中文文本WEB搜索引擎的设计与实现
本文选题:搜索引擎 + 文本处理 ; 参考:《计算机工程与应用》2001年17期
【摘要】:文章主要研究中文文本WEB搜索引擎设计中面临的关键技术以及相应的设计实现。文章首先介绍了WEB搜索引擎的基本系统结构,,然后具体讨论了设计时应考虑的问题并且给出了相应的实现。作者希望通过该文能为中文信息搜索引擎的发展提供一些有益的参考和经验。
[Abstract]:This paper mainly studies the key technologies in the design of Chinese text WEB search engine and the corresponding design and implementation. This paper first introduces the basic system structure of WEB search engine, then discusses the problems that should be considered in the design and gives the corresponding implementation. The author hopes to provide some useful reference and experience for the development of Chinese information search engine.
【作者单位】: 复旦大学网络信息工程中心!上海
【基金】:上海市科学技术发展资金支持
【分类号】:TP393.09
【相似文献】
相关期刊论文 前10条
1 钟涛,陈新明,万钧,张世永;中文文本WEB搜索引擎的设计与实现[J];计算机工程与应用;2001年17期
2 王靖,肖明君,蔡庆生;一种基于Web的智能搜索方法[J];计算机应用研究;2001年11期
3 陈红英,李卫华;智能信息Agent的研究和实现[J];计算机工程与应用;2002年12期
4 冯书晓,徐新,杨春梅;国内中文分词技术研究新进展[J];情报杂志;2002年11期
5 曹桂宏,何丕廉,吴光远,聂颂;中文分词对中文信息检索系统性能的影响[J];计算机工程与应用;2003年19期
6 林珊,宁国宁,赵之霖;中文分词在邮件过滤系统中的应用[J];华南理工大学学报(自然科学版);2004年S1期
7 黄建中,王肖雷;Katz平滑算法在中文分词系统中的应用[J];计算机工程;2004年S1期
8 张茂元,卢正鼎,邹春燕;一种基于语境的中文分词方法研究[J];小型微型计算机系统;2005年01期
9 费洪晓,康松林,朱小娟,谢文彪;基于词频统计的中文分词的研究[J];计算机工程与应用;2005年07期
10 王坚,赵恒永;专业搜索引擎中文分词算法的实现与研究[J];福建电脑;2005年07期
相关会议论文 前10条
1 徐志明;揭春雨;Jonathan ebster;;一种自适应概率语言模型的训练方法及其应用于中文分词[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 陶晓鹏;周水庚;;无辅助数据的中文分词方法(英文)[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
3 陈丽江;;ACL-SIGHAN第一届国际中文分词竞赛评述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 苏贵洋 ;李建华 ;马颖华;;XML统一文本自动处理描述接口[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 王晔;黄上腾;;基于n-gram相邻字的中文文本特征提取算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 周国民;丘耘;郑彦妍;曾枝连;樊景超;;基于SDD算法的特定网页采集技术[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 马辉民;李卫华;;Web文档聚类系统的实现方法探析[A];第10届计算机模拟与信息技术会议论文集[C];2005年
8 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
9 汪洋;张磊;章毅;;基于短语匹配的中文Web文档聚类算法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
10 任飞亮;石磊;姚天顺;;应用支持向量机进行中文分词[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
相关重要报纸文章 前10条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
3 丁鸿;百度掀起财富浪潮 中国互联网不再“青涩”[N];中国工业报;2005年
4 王翌;互联网2005:个性化生存[N];计算机世界;2005年
5 清华大学IT可用性实验室;2005中文搜索引擎质量对比[N];计算机世界;2005年
6 王宾;加速争夺中国搜索市场[N];北京商报;2006年
7 贺俊;汇聚亿万草根智慧 奇虎发布经验搜索[N];证券日报;2006年
8 高雪娟;企业搜索要为决策服务[N];中国计算机报;2006年
9 姜蕊;过半用户难辨百度雅虎[N];中国商报;2006年
10 张磊;雅虎加速争夺在华市场[N];中华工商时报;2006年
相关博士学位论文 前3条
1 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
2 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
3 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
相关硕士学位论文 前10条
1 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
2 刘琨;搜索引擎的研究与实现[D];西安电子科技大学;2004年
3 许彦彬;基于Java技术的生物资源专业搜索引擎的研究与开发[D];昆明理工大学;2004年
4 刘卓;基于KNN算法的中文文本自动分类[D];吉林大学;2004年
5 于爱军;NERMS中基于Internet的搜索引擎研究与实现[D];吉林大学;2004年
6 杨凤芹;建立层次结构用户兴趣模型的方法[D];东北师范大学;2004年
7 陈波;中文WEB文档自动分类的研究与实现[D];武汉理工大学;2005年
8 全海金;基于用户行为及语义相关实时更新的用户兴趣模型[D];西南师范大学;2005年
9 程越;基于统计的中文姓名识别的研究与实现[D];吉林大学;2005年
10 翟凤文;统计与字典相结合的中文分词[D];吉林大学;2005年
本文编号:1935146
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1935146.html