面向养老保险领域的问答系统关键技术研究
发布时间:2021-09-23 20:21
养老保险与社会民生息息相关,广大参保群众在参保过程中常常会遇到各式各样的问题。研究问答系统关键技术,并将其应用到养老保险领域中,用自然语言快速准确地回答用户的问题,具有深远的研究意义和现实意义。本文针对面向养老保险领域的问答技术进行了一些探讨,主要完成了以下几方面的工作:首先,对从问答服务类网站汇集的14万个养老保险主题相关的真实问句进行详细的特点分析,按领域主题制定类别体系。在问句分析阶段结合养老保险领域词库对查询问句进行分词、语义标注、关键词提取、命名实体识别、句法依存关系分析。其次,提出了适用于养老保险领域的KNN主动学习的问句分类算法。从汇集的养老保险领域问答对中抽取一小部分进行人工标注,使用启发式的方法从待标注样本集中选择对分类模型更有益的数据进行标注,扩充已标注样本集,缩减待标注样本集,在此基础上迭代学习,训练得到的新模型分类精度更高。解决标注样本集较小情况下问句分类器准确率低下的问题。然后,提出了新的问句检索模型MFISC。该模型对词汇特征相似度、问句词汇语义相似度、句法结构相似度进行加权运算,求得的值作为查询问句和历史问句的相似度,提高检索精度,最终将相似度最高的历史问...
【文章来源】:哈尔滨工程大学黑龙江省 211工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
论文的组织结构图
汉语问题理解处理流程
领域问句理解基本处理流程图
【参考文献】:
期刊论文
[1]问答系统研究综述[J]. 毛先领,李晓明. 计算机科学与探索. 2012(03)
[2]基于同义词词林的词语相似度计算方法[J]. 田久乐,赵蔚. 吉林大学学报(信息科学版). 2010(06)
[3]基于语法分析和统计方法的答案排序模型[J]. 李波,高文君,邱锡鹏. 中文信息学报. 2009(02)
[4]面向事实性问题的答案选择技术研究综述[J]. 董燕举,蔡东风,白宇. 中文信息学报. 2009(01)
[5]基于模式学习的形式化答案抽取技术与置信度评价方法[J]. 李鹏,乔佩利,王晓龙,王宝勋. 电子学报. 2008(12)
[6]基于句法结构特征分析及分类技术的答案提取算法[J]. 胡宝顺,王大玲,于戈,马婷. 计算机学报. 2008(04)
[7]基于模式学习的中文问答系统答案抽取方法[J]. 余正涛,毛存礼,邓锦辉,章程,郭剑毅. 吉林大学学报(工学版). 2008(01)
[8]基于无监督学习的问答模式抽取技术[J]. 吴友政,赵军,徐波. 中文信息学报. 2007(02)
[9]段落检索技术的综述[J]. 黄水清,黄文昕,金洁琴. 情报探索. 2007(03)
[10]基于知网的中文问题自动分类[J]. 孙景广,蔡东风,吕德新,董燕举. 中文信息学报. 2007(01)
本文编号:3406351
【文章来源】:哈尔滨工程大学黑龙江省 211工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
论文的组织结构图
汉语问题理解处理流程
领域问句理解基本处理流程图
【参考文献】:
期刊论文
[1]问答系统研究综述[J]. 毛先领,李晓明. 计算机科学与探索. 2012(03)
[2]基于同义词词林的词语相似度计算方法[J]. 田久乐,赵蔚. 吉林大学学报(信息科学版). 2010(06)
[3]基于语法分析和统计方法的答案排序模型[J]. 李波,高文君,邱锡鹏. 中文信息学报. 2009(02)
[4]面向事实性问题的答案选择技术研究综述[J]. 董燕举,蔡东风,白宇. 中文信息学报. 2009(01)
[5]基于模式学习的形式化答案抽取技术与置信度评价方法[J]. 李鹏,乔佩利,王晓龙,王宝勋. 电子学报. 2008(12)
[6]基于句法结构特征分析及分类技术的答案提取算法[J]. 胡宝顺,王大玲,于戈,马婷. 计算机学报. 2008(04)
[7]基于模式学习的中文问答系统答案抽取方法[J]. 余正涛,毛存礼,邓锦辉,章程,郭剑毅. 吉林大学学报(工学版). 2008(01)
[8]基于无监督学习的问答模式抽取技术[J]. 吴友政,赵军,徐波. 中文信息学报. 2007(02)
[9]段落检索技术的综述[J]. 黄水清,黄文昕,金洁琴. 情报探索. 2007(03)
[10]基于知网的中文问题自动分类[J]. 孙景广,蔡东风,吕德新,董燕举. 中文信息学报. 2007(01)
本文编号:3406351
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3406351.html