具有概念联想功能的特定领域分词词典的自动构建
本文选题:语义词典 + 未登录词 ; 参考:《计算机工程》2004年20期
【摘要】:提出了一种基于PAT树型结构的高频字串提取的改进算法,并以此用来获得特定领域网页中的未登录词集合,利用基于语义距离的概念相似度计算公式来获得任一概念的相关概念,从而给出了用于特定领域搜索引擎的语义词典完整的自动构建方法。将生成的语义词典用于搜索引擎FlyingSender中。实验结果证明新的词典比原有的手工构建的词典分词效果要理想得多,而且提供了概念联想的功能。
[Abstract]:In this paper, an improved algorithm of high frequency string extraction based on Pat tree structure is proposed. The concept similarity calculation formula based on semantic distance is used to obtain the related concepts of any concept, and a complete automatic construction method of semantic dictionary for specific search engine is presented. The generated semantic dictionary is used in the FlyingSender search engine. The experimental results show that the new dictionary is much more effective than the original dictionary constructed by hand, and provides the function of concept association.
【作者单位】: 华东理工大学计算机科学与工程系 华东理工大学计算机科学与工程系
【基金】:上海市青年科技启明星计划(99QD14038)
【分类号】:TP391.2
【相似文献】
相关期刊论文 前10条
1 张小龙,姚天顺;用于理解的语义词典的构造和设计[J];中文信息学报;1987年02期
2 姚天顺,马黎环;汉英机器翻译系统的概念分析模型[J];中文信息学报;1988年03期
3 万建成;可分隔动词及其在拼音-汉字输入中同音词识别的应用[J];中文信息学报;1992年04期
4 陈祖舜;;信息语义学:一个新计算语义学的构想[J];计算机科学;1995年06期
5 郑泽芝,张永奎;《现代汉语语义词典》管理系统的设计与实现[J];计算机工程;2001年06期
6 侯国峰;一个自然语言理解系统的设计和实现[J];计算机应用研究;2001年02期
7 于江生 ,俞士汶;中文概念词典的结构[J];中文信息学报;2002年04期
8 于水源,杜利民;GL理论与汉语词意网络[J];黑龙江大学自然科学学报;2002年04期
9 晋薇;黄河燕;夏云庆;;基于语义相似度并运用语言学知识进行双语语句词对齐[J];计算机科学;2002年11期
10 尹荣,郑兆瑞,郭海儒;一种基于图元的多级图像检索系统[J];太原理工大学学报;2004年03期
相关会议论文 前10条
1 王惠;;汉英机器翻译中基于大型语义词典的汉语词义消歧[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
2 王惠;俞士汶;詹卫东;;现代汉语语义词典(SKCC)的新进展[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 王惠;李康年;;大型语义词典的计算机辅助开发与管理[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
4 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 邱立坤;;现代汉语动名语串结构关系的判定[A];第六届汉语词汇语义学研讨会论文集[C];2005年
7 苏新春;王惠;卢伟清;秦少康;;语言知识库的内化与细化——完善词义知识库之设想[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 周强;陈祖舜;梅立军;;情境描述的构建方法研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 姚爱钢;武斌;易绵竹;;基于语义词典的俄语语义自动分析研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 邹文科;孟祥武;;基于语义Web的商品语义检索系统[A];2006年全国理论计算机科学学术年会论文集[C];2006年
相关硕士学位论文 前3条
1 巢文涵;基于CFM的汉语小句语义分析[D];中国人民解放军国防科学技术大学;2002年
2 曹晶;同义词挖掘及其在概念信息检索系统中的应用研究[D];东北师范大学;2006年
3 刘恒;支持语义的图像检索系统研究与实现[D];上海海事大学;2006年
,本文编号:2063181
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2063181.html