当前位置:主页 > 科技论文 > 搜索引擎论文 >

财经问答系统问句解析子系统的设计与实现

发布时间:2017-04-13 07:08

  本文关键词:财经问答系统问句解析子系统的设计与实现,由笔耕文化传播整理发布。


【摘要】:近年来,越来越多的投资者进入了财经领域进行股票和基金的投资。为了更加理性地进行投资并获取报酬,投资者们希望获得更多的市场信息。然而,现有的炒股软件和传统的搜索引擎并不能满足投资者们精确高效的搜索需求。因此,财经问答系统应运而生,它使得用户可以通过在搜索框中输入自然语言问句的形式方便地获取相关信息。 财经问答系统是一个针对财经领域的问答系统,而问句解析用于理解用户的搜索意图,是系统实现的关键。本文利用自然语言处理相关技术设计并实现了问句解析子系统,其主要分为四个模块:配置文件的解析、词语解析、句法分析和语义分析。其中,XML格式配置文件的解析是整个问句解析流程的基础,该部分主要描述了指标属性和句式规则等是如何定义及存取的,同时还描述了配置文件解析结果在内存中的表示形式。词语解析则主要描述如何结合数值、时间等命名实体中文表述的特点,运用正则表达式匹配等方法,从分词结果构建语义节点列表,包括数值、时间、指标、关键字以及股票简称等各种命名实体节点的生成、合并和解析,同时保留词语的歧义。句法分析作为连接单个节点与语义树的桥梁,是问句解析子系统的关键步骤,该部分主要描述了如何利用基于语义的句法分析方法,以谓语中心词为起点进行句式匹配的具体过程,该过程运用了句法结构消歧和省略语句补全的相关策略。语义分析是对句法分析结果的进一步处理,其通过指标歧义消除、指标属性绑定、指标属性补全等步骤,更深入地理解用户的检索意图,同时,该部分构建得到的语义树是问句解析子系统的输出结果,是用户检索意图的语义表征,是结构化查询子系统的有效输入,真正实现了语义搜索。同时,在开发过程中,引入Spring框架,以简化对问句解析处理流程的管理。 系统在测试上线运行后性能良好,稳定性强,,问句解析的正确率达到了92%左右,并且平均响应时间在70毫秒左右,很好地承担了财经问答系统问句解析的任务,满足了投资者精确高效的搜索需求。
【关键词】:问答系统 问句解析 句法分析 语义分析 Spring框架
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.52
【目录】:
  • 摘要4-5
  • Abstract5-10
  • 第1章 绪论10-16
  • 1.1 课题来源及研究的目的和意义10-11
  • 1.1.1 课题来源10
  • 1.1.2 课题研究的目的和意义10-11
  • 1.2 国内外相关领域研究现状11-14
  • 1.2.1 自动问答系统研究现状11-13
  • 1.2.2 句法分析研究现状13-14
  • 1.3 本文的主要研究内容14
  • 1.4 本论文的组织结构14-16
  • 第2章 问句解析子系统需求分析16-21
  • 2.1 财经问答系统业务需求16-17
  • 2.2 问句解析子系统功能需求17-20
  • 2.2.1 问句类型分析17-18
  • 2.2.2 词语解析模块需求分析18
  • 2.2.3 句法分析模块需求分析18-19
  • 2.2.4 语义分析模块需求分析19-20
  • 2.3 问句解析子系统非功能需求20
  • 2.4 本章小结20-21
  • 第3章 问句解析子系统设计21-50
  • 3.1 财经问答系统整体设计21-22
  • 3.2 问句解析子系统整体设计22-23
  • 3.3 问句解析流程管理23-25
  • 3.4 配置文件解析模块设计25-32
  • 3.4.1 指标配置文件解析的设计25-28
  • 3.4.2 语义及句式等配置文件解析的设计28-31
  • 3.4.3 冗余节点删除配置文件解析的设计31-32
  • 3.5 词语解析模块设计32-39
  • 3.5.1 语义节点生成的设计34
  • 3.5.2 数值解析的设计34-36
  • 3.5.3 时间解析的设计36-37
  • 3.5.4 指标及关键词解析的设计37-38
  • 3.5.5 冗余节点删除的设计38-39
  • 3.6 句法分析模块设计39-42
  • 3.6.1 句法分析的主要过程39-40
  • 3.6.2 句法结构歧义消解方式40-41
  • 3.6.3 单个句式匹配过程的设计41-42
  • 3.6.4 固定值参数构建的设计42
  • 3.7 语义分析模块设计42-49
  • 3.7.1 指标歧义消除的设计43-45
  • 3.7.2 指标属性绑定的设计45-46
  • 3.7.3 指标属性补全的设计46-47
  • 3.7.4 解析结果评价的设计47
  • 3.7.5 语义树构建的设计47-49
  • 3.8 本章小结49-50
  • 第4章 问句解析子系统实现50-78
  • 4.1 配置文件解析模块的实现50-53
  • 4.2 词语解析模块的实现53-62
  • 4.2.1 语义节点生成的实现53-55
  • 4.2.2 数值解析的实现55-58
  • 4.2.3 时间解析的实现58-60
  • 4.2.4 指标及关键词解析的实现60-62
  • 4.2.5 冗余节点删除的实现62
  • 4.3 句法分析模块的实现62-68
  • 4.3.1 句式匹配整体流程的实现63-65
  • 4.3.2 单个句式匹配过程的实现65-67
  • 4.3.3 固定值参数构建的实现67
  • 4.3.4 句式匹配结果去重的实现67-68
  • 4.4 语义分析模块的实现68-77
  • 4.4.1 指标歧义消除的实现68-70
  • 4.4.2 指标属性绑定的实现70-72
  • 4.4.3 指标属性补全的实现72-73
  • 4.4.4 解析结果评价的实现73
  • 4.4.5 语义树构建的实现73-77
  • 4.5 本章小结77-78
  • 第5章 问句解析子系统测试78-92
  • 5.1 问句解析子系统测试方案78
  • 5.1.1 功能测试方案78
  • 5.1.2 性能测试方案78
  • 5.2 问句解析子系统测试环境与工具78-79
  • 5.3 问句解析子系统测试结果79-91
  • 5.3.1 功能测试结果79-90
  • 5.3.2 性能测试结果90-91
  • 5.4 问句解析子系统测试结果分析91
  • 5.4.1 功能测试结果分析91
  • 5.4.2 性能测试结果分析91
  • 5.5 本章小结91-92
  • 结论92-94
  • 参考文献94-99
  • 致谢99-100
  • 个人简历100

【参考文献】

中国期刊全文数据库 前2条

1 蒋昌金;彭宏;马千里;林正春;王成;;受限领域中文问答系统问句分析研究[J];计算机工程与设计;2010年11期

2 蒙柳;;基于计算的知识搜索引擎Wolfram Alpha研究[J];图书馆学研究;2010年04期

中国博士学位论文全文数据库 前1条

1 李正华;汉语依存句法分析关键技术研究[D];哈尔滨工业大学;2013年


  本文关键词:财经问答系统问句解析子系统的设计与实现,由笔耕文化传播整理发布。



本文编号:303059

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/303059.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2d065***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com