保险条款文本结构化系统设计与实现

发布时间:2022-08-09 18:30
  近年来,自然语言处理技术的不断发展使得文本结构化系统在不同知识领域得到了广泛应用。诸如医疗、新闻等领域的文本结构化研究已经取得了较大突破,而在保险领域尚未出现较成熟的文本结构化系统。由于专业知识的不同以及文本内容描述形式的不同,目前还不具备一个通用的文本结构化系统满足各个领域信息抽取的需求。保险文本独特的语言风格,使得面向保险领域的文本结构化系统研究仍存在着新的挑战。保险条款是保险购买人以及保险公司双方确立的有关权利与义务的条文,其核心内容保障责任描述了保险公司承担的责任范围,以及被保险人发生保险事故时保险公司应负的赔偿责任。将该非结构化的文本进行结构化处理有助于实现用户对保障责任内容的快速阅读以及有效理解。本文提出了面向保险领域的保险条款文本结构化方法,并以此作为支撑构建了保险条款文本结构化原型系统,模拟提出的算法在实际的保障责任条件查询过程中系统的应用场景。本文主要内容包括以下几个部分:(1)通过网络爬虫采集各个保险公司的保险条款原始PDF文件,并针对不同文本格式的PDF文件设计不同的文件解析策略以获取保险条款中保障责任文本内容;(2)本文提出了应用于非结构化的保障责任文本数据的结... 

【文章页数】:70 页

【学位级别】:硕士

【部分图文】:

保险条款文本结构化系统设计与实现


新闻领域的文本结构化系统

保险条款文本结构化系统设计与实现


保险条款PDF文件文本结构1

保险条款文本结构化系统设计与实现


保险条款PDF文件文本结构2对于两种保险条款PDF文件的文本结构,都先使用python的PDFMiner包将其转换为XML文件

【参考文献】:
期刊论文
[1]自然语言处理概述及应用[J]. 王泽宇.  通讯世界. 2019(04)
[2]一种健康医疗保险格式条款的结构化处理方法[J]. 张晶晶,杜明.  智能计算机与应用. 2018(03)
[3]计算机人工智能技术的应用与发展[J]. 张储祺.  电子世界. 2017(02)
[4]信息抽取研究综述[J]. 郭喜跃,何婷婷.  计算机科学. 2015(02)
[5]基于GATE的油田信息抽取技术研究[J]. 文必龙,李云静,王琪超,金宗泽,高快.  计算机与数字工程. 2014(07)

博士论文
[1]基于深度置信网络的中文信息抽取方法[D]. 陈宇.哈尔滨工业大学 2014

硕士论文
[1]医学CT报告文本结构化处理研究[D]. 刘清星.湖南大学 2018
[2]我国互联网保险发展研究[D]. 王宁.广西大学 2017
[3]中文电子病历信息抽取关键技术研究[D]. 于楠.北京工业大学 2017



本文编号:3673062

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3673062.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户55885***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com