健康保险智能问答问句理解和答案检索的研究与实现
发布时间:2021-12-31 03:51
健康保险作为一个专业性较强、知识复杂的领域,大部分民众对于保险领域相关知识了解甚少。参保人常常对保障条件、险种选择等方面的专业词汇产生理解上的困难。智能问答技术能够准确理解用户的查询意图,并准确定位查询结果。成为了人工智能领域的重要研究方向之一。本文主要针对健康保险智能问答系统展开研究,对健康保险问答系统存在的问题和实现技术进行了深入分析。从用户查询语句的理解出发,基于结构化的健康保险知识库,设计一个健康保险智能问答系统。同时对深度学习技术进行了深入研究,并将深度学习的相关算法应用在智能问答系统中,以提高系统的准确率。本文的主要研究内容和贡献如下:(1)构建保险文档采集与质量控制模块在保险条款的采集过程中存在的大量“异名同款”、“一款多名”等数据质量不高的问题。本文基于字符串相似度匹配,结合人工筛选搭建保险条款采集和质量控制模块。一定程度上的避免了数据冗余,提高了结构化保险数据的质量。(2)设计并实现了保险领域智能问答的问句理解和答案检索查找相似问句答案的智能问答方法无法更好的理解用户查询意图,且需要大量的人力构建FAQ库。针对这一问题,本文通过自然语言技术理解用户问句,基于结构化的保...
【文章来源】:东华大学上海市 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
检索结果
健康保险智能问答问句理解和答案检索的研究与实根据图 1-1 所示的搜索结果来看,检索结果内包含了广告信息。且前 10索结果中有一半的结果返回的是该保险的保险条款,存在大量的重复信息。 1-2 的保险条款所示,用户需要阅读大量的条款信息,再从保险条款中找到索的答案:“投保年龄在 28 天到 65 岁之间”。这个过程需要花费用户的大间从保险条款进行结果筛选,对于用户的保险领域知识水平也有一定程度上求。其次,检索的前 10 条查询结果中还存在有少量无关信息,这些无关信排除也会花费用户一定的时间,而实际相关程度最高的搜索结果排在最后一
即第一字的标注的概率;A 表示状态转移概率,即从一个标记的概率;B 表示给定状态下的观察值概率矩阵,这个概HMM 还有三个假设,有限历史性假设、状态与时间无关假设无关假设。具体公式表达如下公式(2-1)所示。p s s , s , … s = p s s P s s = p(s , s ) P o , … o s , … s = P(o |q )M 完成实体识别时,需要依次解决三个问题。首先做基于已知π),计算所有概率的乘积,求得某个观察序列的概率值。再通过观察序列最可能的标记状态。Viterbi 算法是一个动态规划算法 上的最短路径,也就是概率值最大的标记状态序列。第三个是标注好的语料下,如何通过学习这些语料,学习 HMM 网络中π),提高 HMM 模型的识别效率。北京理工大学的乐娟通过隐MM)对切分的文本进行词性标注。再根据人工定制的规则模边界,提取新词。在京剧机构名的识别中取得了 99%的正确率
【参考文献】:
期刊论文
[1]基于RNN的网络安全态势预测方法[J]. 胡昕. 现代计算机(专业版). 2017(06)
[2]编辑距离算法在中文文本相似度计算中的优化与实现[J]. 陈正铭,霍英. 韶关学院学报. 2015(12)
[3]基于HMM的京剧机构命名实体识别算法[J]. 乐娟,赵玺. 计算机工程. 2013(06)
[4]问答系统研究综述[J]. 毛先领,李晓明. 计算机科学与探索. 2012(03)
[5]命名实体识别研究进展综述[J]. 孙镇,王惠临. 现代图书情报技术. 2010(06)
[6]基于概率统计技术和规则方法的新词发现[J]. 贾自艳,史忠植. 计算机工程. 2004(20)
[7]校园导航系统Easy Nav的设计与实现[J]. 黄寅飞,郑方,燕鹏举,徐明星,吴文虎. 中文信息学报. 2001(04)
硕士论文
[1]健康中国视角的商业健康保险发展研究[D]. 梁新雨.广西大学 2017
[2]受限领域内基于中文问句语义相关度计算的智能问答系统研究[D]. 王新磊.山东财经大学 2014
[3]面向养老保险领域的问答系统关键技术研究[D]. 隗梦夕.哈尔滨工程大学 2013
[4]基于编辑距离的近似字符串匹配及其优化技术[D]. 王业.东北大学 2012
[5]传统搜索引擎与智能搜索引擎比较研究[D]. 张骞.郑州大学 2012
[6]基于规则的命名实体识别研究[D]. 周昆.合肥工业大学 2010
[7]限定领域内智能问答系统的研究与实现[D]. 王银丽.内蒙古大学 2008
[8]基于支持向量机的中文组织机构名识别[D]. 陈霄.上海交通大学 2007
本文编号:3559566
【文章来源】:东华大学上海市 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
检索结果
健康保险智能问答问句理解和答案检索的研究与实根据图 1-1 所示的搜索结果来看,检索结果内包含了广告信息。且前 10索结果中有一半的结果返回的是该保险的保险条款,存在大量的重复信息。 1-2 的保险条款所示,用户需要阅读大量的条款信息,再从保险条款中找到索的答案:“投保年龄在 28 天到 65 岁之间”。这个过程需要花费用户的大间从保险条款进行结果筛选,对于用户的保险领域知识水平也有一定程度上求。其次,检索的前 10 条查询结果中还存在有少量无关信息,这些无关信排除也会花费用户一定的时间,而实际相关程度最高的搜索结果排在最后一
即第一字的标注的概率;A 表示状态转移概率,即从一个标记的概率;B 表示给定状态下的观察值概率矩阵,这个概HMM 还有三个假设,有限历史性假设、状态与时间无关假设无关假设。具体公式表达如下公式(2-1)所示。p s s , s , … s = p s s P s s = p(s , s ) P o , … o s , … s = P(o |q )M 完成实体识别时,需要依次解决三个问题。首先做基于已知π),计算所有概率的乘积,求得某个观察序列的概率值。再通过观察序列最可能的标记状态。Viterbi 算法是一个动态规划算法 上的最短路径,也就是概率值最大的标记状态序列。第三个是标注好的语料下,如何通过学习这些语料,学习 HMM 网络中π),提高 HMM 模型的识别效率。北京理工大学的乐娟通过隐MM)对切分的文本进行词性标注。再根据人工定制的规则模边界,提取新词。在京剧机构名的识别中取得了 99%的正确率
【参考文献】:
期刊论文
[1]基于RNN的网络安全态势预测方法[J]. 胡昕. 现代计算机(专业版). 2017(06)
[2]编辑距离算法在中文文本相似度计算中的优化与实现[J]. 陈正铭,霍英. 韶关学院学报. 2015(12)
[3]基于HMM的京剧机构命名实体识别算法[J]. 乐娟,赵玺. 计算机工程. 2013(06)
[4]问答系统研究综述[J]. 毛先领,李晓明. 计算机科学与探索. 2012(03)
[5]命名实体识别研究进展综述[J]. 孙镇,王惠临. 现代图书情报技术. 2010(06)
[6]基于概率统计技术和规则方法的新词发现[J]. 贾自艳,史忠植. 计算机工程. 2004(20)
[7]校园导航系统Easy Nav的设计与实现[J]. 黄寅飞,郑方,燕鹏举,徐明星,吴文虎. 中文信息学报. 2001(04)
硕士论文
[1]健康中国视角的商业健康保险发展研究[D]. 梁新雨.广西大学 2017
[2]受限领域内基于中文问句语义相关度计算的智能问答系统研究[D]. 王新磊.山东财经大学 2014
[3]面向养老保险领域的问答系统关键技术研究[D]. 隗梦夕.哈尔滨工程大学 2013
[4]基于编辑距离的近似字符串匹配及其优化技术[D]. 王业.东北大学 2012
[5]传统搜索引擎与智能搜索引擎比较研究[D]. 张骞.郑州大学 2012
[6]基于规则的命名实体识别研究[D]. 周昆.合肥工业大学 2010
[7]限定领域内智能问答系统的研究与实现[D]. 王银丽.内蒙古大学 2008
[8]基于支持向量机的中文组织机构名识别[D]. 陈霄.上海交通大学 2007
本文编号:3559566
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3559566.html