唐宋诗中词汇语义相似度的统计分析及应用
本文选题:词义相似度 + 词义联想 ; 参考:《中文信息学报》2002年04期
【摘要】:基于上下文的词汇向量空间模型可以用来近似地描述词汇的语义。在此基础上定义的词汇相似关系或聚类关系可以应用于词典编纂、智能搜索引擎的开发等许多领域。本研究 基于 6 40万字的唐宋诗语料。在进行多字词计算机辅助提取的基础上 ,定义了相应的词汇语义的统计表达。建立了词汇相似关系的语义网络。开发了具有词义联想功能的面向概念的唐宋诗搜索引擎。实验表明 ,达到了接近实用的水平
[Abstract]:Context-based lexical vector space model can be used to describe lexical semantics approximately. On this basis, the lexical similarity relation or clustering relation can be used in many fields such as dictionary compilation, intelligent search engine development and so on. This study is based on 6 400000 characters of Tang and Song poetry corpus. Based on the computer-aided extraction of multi-words, the corresponding statistical expressions of lexical semantics are defined. The semantic network of lexical similarity relation is established. The concept-oriented search engine of Tang and Song poetry with the function of word meaning association is developed. The experimental results show that it is close to practical level.
【基金】:国家社会科学基金项目 (98BYY0 2 2 ) 北京大学 985项目
【分类号】:TP391.1
【参考文献】
相关期刊论文 前2条
1 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
2 黄昌宁,李涓子;词义排歧的一种语言模型[J];语言文字应用;2000年03期
【共引文献】
相关期刊论文 前10条
1 毛建军;;古籍数字化研究的回顾与思考[J];国家图书馆学刊;2007年03期
2 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
3 李朝虹,陆建湖;现代汉语自动分析研究现状综述[J];广西教育学院学报;2003年01期
4 王川;张小红;韩采华;;古汉语句子切分与句读标记方法研究[J];河南大学学报(自然科学版);2009年05期
5 范海虹;刘大勇;;论计算语言学的学科交叉性[J];廊坊师范学院学报(自然科学版);2012年03期
6 何婷婷;基于HNC理论的一种词汇歧义消解规则[J];华中师范大学学报(自然科学版);2002年01期
7 雒自清;几种汉语移位现象的HNC研究[J];晋东南师范专科学校学报;2004年04期
8 王美艳,赵伟;基于唐诗语料库“词”的提取及深入研究[J];长春工业大学学报(自然科学版);2005年03期
9 王红玲;吕强;徐瑞;;中文语义相关度计算模型研究[J];计算机工程与应用;2009年07期
10 陈丽江;陈小荷;;VN结构识别的一种概率分布模型[J];计算机工程与应用;2009年17期
相关会议论文 前6条
1 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 唐兴全;;现代汉语复杂句蜕块研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 章成志;;词语的语义相似度计算及其应用研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 周强;赵颖泽;;汉语功能块自动分析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 王红玲;吕强;徐瑞;;一种基于知网的中文语义相关度计算模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 李国臣;王瑞波;李济洪;;基于基本块的汉语功能块自动标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
相关博士学位论文 前10条
1 何因;排序学习中基于直接优化信息检索评价准则算法的理论分析[D];中国科学技术大学;2010年
2 叶黛莹;从阅读到创作的诗学历程[D];武汉大学;2011年
3 范冬梅;基于统计学习的词义识别方法研究[D];哈尔滨工程大学;2011年
4 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
5 何婷婷;语料库研究[D];华中师范大学;2003年
6 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
7 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
8 曹玲;农业古籍数字化整理研究[D];南京农业大学;2006年
9 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
10 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
相关硕士学位论文 前10条
1 程国斌;基于指示词语义扩展的词义识别方法的研究[D];哈尔滨工程大学;2010年
2 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
3 马东;基于Nutch搜索引擎的中文分词算法研究与实现[D];内蒙古农业大学;2011年
4 唐兴全;现代汉语复杂句蜕块研究[D];北京语言文化大学;2002年
5 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
6 李盛;面向真实文本的汉语词义排歧系统[D];山西大学;2003年
7 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
8 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
9 许超;汉英双语网页资源中相同事件文本对的提取[D];南京师范大学;2005年
10 罗慧慧;基于语义神经网络的深层语义的计算[D];湘潭大学;2005年
【二级参考文献】
相关期刊论文 前1条
1 穗志方,俞士汶,罗凤珠;宋代名家诗自动注音研究及系统实现[J];中文信息学报;1998年02期
【相似文献】
相关期刊论文 前10条
1 张伟利;;探求唐宋诗内在嬗变轨迹——《唐宋诗宏观结构论》读后[J];中国出版;2007年03期
2 韩骏伟;禅思诗语——读张晶《禅与唐宋诗学》[J];中国出版;2004年04期
3 熊益沙;;唐宋诗人对理想人居环境的探索[J];湖南大众传媒职业技术学院学报;2010年01期
4 蔡科;史晓东;陈毅东;黄哲煌;;基于层次聚类的中文词义归纳(英文)[J];心智与计算;2010年03期
5 阮堂明;诗学本位与当代意识——读陶文鹏《唐宋诗美学与艺术论》[J];苏州大学学报(哲学社会科学版);2004年02期
6 张德建;读陶文鹏《唐宋诗美学与艺术论》有感[J];中国文化研究;2004年02期
7 索红光;刘玉树;曹淑英;;一种基于词汇链的关键词抽取方法[J];中文信息学报;2006年06期
8 宋巍;秦兵;郎君;刘挺;;句法与词义相结合的中文代词消解[J];中文信息学报;2008年06期
9 游维;周昌乐;;基于统计的汉语隐喻生成模型及其系统实现[J];心智与计算;2007年01期
10 毛翰;;“一切好诗到唐已被做完”了吗?[J];中国图书评论;2010年03期
相关会议论文 前10条
1 郭鹏;;“以文为诗”辨——关于唐宋诗变中一个文学观念的检讨[A];中国语言文学资料信息(1999.2)[C];1999年
2 敬永谅;;《送友人》别考[A];中国李白研究(2005年集)——中国李白研究会第十一次学术研讨会论文集[C];2005年
3 胡曼妮;;英语词义联想与英语学习词典编纂[A];中国辞书学会双语词典专业委员会第七届年会论文集[C];2007年
4 吉灵娟;;论文化翻译与文学翻译的意境传达[A];福建省首届外事翻译研讨会论文集[C];2007年
5 尹楚彬;;《李白全集校注汇释集评》求疵[A];中国李白研究(2000年集)[C];2000年
6 房日晰;;论李白诗的飘逸风格及其成因[A];李白学刊(第一辑)——纪念李白逝世1225周年[C];1987年
7 崔仲平;;《元日》屠苏考[A];中华中医药学会医古文分会成立30周年暨第二十次学术交流会论文集[C];2011年
8 杨明;;读李琐记[A];中国李白研究(一九九零年集·下)[C];1990年
9 康怀远;;论李白诗歌的法度(中)[A];中国李白研究(1995-1996年集)[C];1995年
10 姜光斗;;论李白对韩愈奇险诗风的影响[A];中国李白研究(一九九零年集·上)——中国李白学会第二届年会纪事[C];1989年
相关重要报纸文章 前10条
1 周月亮;恢复直觉的“活法”[N];人民政协报;2003年
2 郭锋;唐宋诗学对词学的影响[N];光明日报;2007年
3 白振奎;诗笔禅心[N];人民政协报;2003年
4 金丹霞;历经沧桑 重见天日[N];温州日报;2006年
5 董耀章;古今人文精神的对接[N];太原日报;2010年
6 杜寒风;禅与诗学[N];光明日报;2004年
7 张剑;感悟、学理与情采的结合[N];中华读书报;2003年
8 魏运亨;正月十五“闹”元宵,“全民狂欢”两千年[N];新华每日电讯;2008年
9 程大利;书印相合 雅正委婉[N];中国艺术报;2008年
10 李金玉;略谈论诗唱和[N];山西政协报;2009年
相关博士学位论文 前9条
1 张仲谋;清代宋诗师承论[D];苏州大学;1997年
2 周薇;陈衍诗学研究[D];华东师范大学;2006年
3 侯长生;同光体派的宋诗学[D];复旦大学;2007年
4 张毅;陆游诗传播、阅读专题研究[D];复旦大学;2008年
5 韩胜;清代唐诗选本研究[D];南开大学;2005年
6 刘磊;朱彝尊诗学理论研究[D];辽宁大学;2007年
7 郑永晓;江西诗派研究史[D];中国社会科学院研究生院;2003年
8 陈晓红;方东树诗学研究[D];复旦大学;2010年
9 史宏云;古代花鸟画题画诗的意象研究[D];山西大学;2011年
相关硕士学位论文 前10条
1 胡玉平;唐宋剑门诗文化研究[D];西南大学;2011年
2 李秋霞;袁枚与唐宋诗关系研究[D];江西师范大学;2009年
3 宋巍;基于句法特征的代词消解方法研究[D];哈尔滨工业大学;2008年
4 李迪;基于文本聚类和语料库的信誉维度发现研究[D];华中科技大学;2010年
5 李囡囡;从《瀛奎律髓》看方回论宋诗[D];东北师范大学;2008年
6 胡爽;朝鲜诗家对明诗的批评[D];延边大学;2010年
7 岳永;钱谦益宗唐祢宋的诗学思想[D];新疆师范大学;2006年
8 华德勇;唐宋山水诗境界与山水画意境比较研究[D];西北民族大学;2011年
9 张在杰;论杜甫和韩愈诗歌的“警策”[D];广西师范大学;2008年
10 王品;基于加权语法依存度的查询模型研究[D];河南科技大学;2011年
,本文编号:1800336
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1800336.html