基于字表的中文搜索引擎分词系统的设计与实现
[Abstract]:This paper analyzes the shortcomings of the commonly used Chinese word segmentation methods based on dictionaries in the development of Chinese search engines, puts forward a word segmentation system of Chinese search engines based on word tables, and designs and implements them in the aspects of index, query, ambiguity elimination and so on.
【作者单位】: 华东理工大学计算机科学与工程系!上海
【分类号】:TP393
【参考文献】
相关期刊论文 前3条
1 苏新宁;汉语词切分标引算法的改进[J];情报学报;1996年06期
2 梁南元;汉语计算机自动分词知识[J];中文信息学报;1990年02期
3 杨文清,黄宜华,张福炎;中文Web文档库全文检索技术研究与实现[J];中文信息学报;1999年04期
【共引文献】
相关期刊论文 前10条
1 曹元大,贺海军,涂哲明;中文Web文档全文检索系统的设计及实现[J];北京理工大学学报;2002年01期
2 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
3 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 裘江南,金玉玲;试论Internet环境下OPAC系统的发展趋势[J];大学图书馆学报;2000年01期
6 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报;2003年02期
7 吴应良,韦岗,李海洲;一种基于N-gram模型和机器学习的汉语分词算法[J];电子与信息学报;2001年11期
8 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
9 韩化雪;康鲲鹏;;基于WEB搜索引擎的发展[J];福建电脑;2006年09期
10 周前,肖建华;全文检索中的文本学习技术研究[J];湖南工程学院学报(自然科学版);2001年02期
相关会议论文 前1条
1 Luning Ji, Qin Lu, Wenjie Li, YiRong Chen The Department of Computing, The Hong Kong Polytechnic University, Hong Kong, China;A Comparative Study of the Effect of Word Segmentation On Chinese Terminology Extraction[A];第20届亚太地区语言、信息和计算国际会议论文集[C];2006年
相关博士学位论文 前10条
1 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
2 杜亚军;搜索引擎智能行为的研究及实现[D];西南交通大学;2005年
3 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
4 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
5 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年
6 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
7 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
8 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
9 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
10 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
相关硕士学位论文 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
3 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
4 黄素珍;并行多元搜索引擎的研究与设计[D];广西大学;2001年
5 付哲;数字图书馆系统的设计与实现[D];中国科学院软件研究所;2001年
6 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
7 黄艳;面向数字化产品的自然语言查询技术的研究与开发[D];浙江大学;2002年
8 缪晓阳;WebCM:一种基于搜索引擎的网络内容监控系统的研究[D];浙江大学;2002年
9 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
10 马东坡;Internet中文智能搜索引擎汉语自动分词系统设计[D];广西师范大学;2002年
【二级参考文献】
相关期刊论文 前2条
1 顾春庆,于玉,顾永立,胡运发;汉字全文检索的实现与探讨[J];计算机工程;1998年02期
2 梁南元;书面汉语自动分词综述[J];计算机应用与软件;1987年03期
【相似文献】
相关期刊论文 前10条
1 ;网络小喇叭[J];电脑迷;2011年16期
2 蒙太奇;;最佳在线翻译也雷人[J];黄金时代(学生族);2009年12期
3 王勇;;看美剧,练听力[J];电脑迷;2011年14期
4 清风慕缘;;QQ消息没空看 咱让美女读出来[J];电脑爱好者;2011年09期
5 贺拴运;;一次切换终生有效[J];电脑爱好者;2011年04期
6 李正;吕坚;付荣国;;浅谈基于Nagios的故障告警系统[J];江西通信科技;2011年01期
7 张敬;;浅谈web服务器从配置到建站的各种问题及解决方法[J];才智;2011年23期
8 汪萍;;QQ影音教你如何将字幕马赛克[J];电脑知识与技术(经验技巧);2011年07期
9 大江东去;;Google搜索也要双语建议[J];电脑迷;2011年16期
10 ;[J];;年期
相关会议论文 前10条
1 周学广;张焕国;;一种柔性中文字符串匹配算法[A];第二十七届中国控制会议论文集[C];2008年
2 毛劲松;;在Internet上检索中文毛纺信息[A];第七届北京青年科技论文评选获奖论文集[C];2003年
3 侯整风;张谷原;;一种基于中文的多模式匹配算法[A];2011中国仪器仪表与测控技术大会论文集[C];2011年
4 宋洪鑫;李蕾;刘冬雪;;中文博客标签调查分析及标签推荐模型的研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
6 汪云凤;李心科;;云服务环境下的服务聚合方法研究[A];2011中国仪器仪表与测控技术大会论文集[C];2011年
7 陈书炫;熊孟英;;一种基于Rough集的中文LINGO算法[A];中国企业运筹学[2010(1)][C];2010年
8 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
9 孔维泽;刘奕群;张敏;马少平;;问答社区中回答质量的评价方法研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
相关重要报纸文章 前2条
1 丁襄;印度专家鼓动黑客学中文反击中国[N];国防时报;2010年
2 奇虎360安全专家 石晓虹;上网本对网络安全构成挑战 传统安全软件应“瘦身”[N];中国电子报;2009年
相关博士学位论文 前4条
1 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
2 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
3 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
4 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
相关硕士学位论文 前10条
1 石振梁;中文新闻情感分类系统的研究与实现[D];北京邮电大学;2011年
2 马砚忠;中文知识工程和知识服务平台的设计与实现[D];北方工业大学;2012年
3 庞俊;基于确定话题和情感极性的博客文本聚类研究[D];武汉理工大学;2010年
4 刘恒文;基于网络语义挖掘的舆情监测预警研究[D];武汉理工大学;2010年
5 徐东亮;基于聚类分析的网络论坛舆情信息挖掘技术研究[D];哈尔滨工业大学;2010年
6 游建平;基于语义情感空间模型的微博情感倾向性研究[D];暨南大学;2012年
7 妥晓娜;基于内容的中文垃圾邮件过滤系统的研究与实现[D];内蒙古大学;2010年
8 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年
9 屠辉;中文重复网页的检测算法研究[D];北京邮电大学;2010年
10 徐丽平;基于内容挖掘的中文垃圾邮件过滤技术研究[D];东北财经大学;2010年
本文编号:2521304
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2521304.html