基于话题分布相似度的无监督评论词消歧方法
发布时间:2017-11-16 19:03
本文关键词:基于话题分布相似度的无监督评论词消歧方法
【摘要】:基于话题信息、词的位置关系和互信息等特征,提出一种无监督的跨语言词义消歧算法。该算法仅利用在线词典和web搜索引擎,通过上下文信息选择评论句中多义评论词的词义。实验结果表明,所提出的词义消歧算法具有较高准确率,对于具有较多候选词义的评论词仍能表现出较好的性能。
【作者单位】: 厦门大学信息科学与技术学院;
【基金】:国家自然科学基金(60573189,61005052) 国家科技支撑计划(2012BAH14F03) 福建省自然科学基金(2006J0043)资助
【分类号】:TP391.1
【正文快照】: 互联网已成为人们发布和获取信息的重要平台。在购买商品、选择服务之前,网络上的评论文章对使用者做出决策有重要的指导作用。然而,若评论文章不是用母语所写,则需要对其中重要的评论词进行跨语言词义消歧(选择)。评论词经常具有较多词义,虽然目前的机器翻译软件可以处理整句
【相似文献】
中国重要会议论文全文数据库 前3条
1 翟海军;郭嘉丰;王小磊;许洪波;;基于用户查询日志的命名实体挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 贺亮;李芳;;基于话题模型的科技文献话题发现和趋势分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 单斌;李芳;;基于种子文档和话题模型的话题演化研究[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前1条
1 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前4条
1 王峰;同名排歧方法研究及其应用[D];清华大学;2009年
2 贺亮;基于话题模型的科技文献话题发现与趋势分析[D];上海交通大学;2012年
3 苗亚杰;基于话题模型的社区问题聚类算法研究[D];清华大学;2011年
4 廖秀玲;基于文本的网络舆情话题跟踪的研究[D];昆明理工大学;2012年
,本文编号:1193335
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1193335.html