当前位置:主页 > 科技论文 > 自动化论文 >

双结构网络中基于实体的UCL知识空间研究

发布时间:2021-01-11 13:48
  双结构网络是一种以互联网为主结构而以播存网络为次结构的新型网络架构,其能够充分利用物理广播向用户一侧分发互联网热门内容,以便有效地降低内容分发路由跳数。而统一内容标签(Uniform Content Label,UCL)用来解决异步广播通信缺乏交互的弊端,且有助于理顺互联网杂乱无章的非结构化内容,使用户能够快速获取互联网内容中的丰富语义信息。然而,目前关于双结构网络的研究主要集中在缓存策略和信息推荐方面,这导致用户能够获取的UCL信息仅局限于自身兴趣和本地缓存,且缺乏对全局UCL信息的感知。因此,研究如何将散乱的UCL进行有效地语义组织为双结构网络用户提供可靠的UCL知识发现服务具有重要的前瞻研究意义。为此,本文提出了一种基于命名实体(Named Entity,NE)的UCL语义关联模型,设计了UCL知识空间(UCL Knowledge Space,UCLKS),用以实现基于实体的海量UCL的知识表达、组织和发现。在UCLKS的基础之上提出了面向自然语言问句的UCL内容解析服务的解决方案,以便双结构网络用户能够轻易获取UCL全局知识。具体而言,本文的研究工作主要包括以下三个方面:1)针... 

【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

双结构网络中基于实体的UCL知识空间研究


研究目标与研究内容对应关系图

流程图,实体,流程,统计机


期的实体抽取也称为命名实体学习(Named Entity Learning, NEL)或命名实体识别,自动化提取出语料库中的命名实体。知识库或者知识图谱的基本构成要素是命名实体的质量受到命名实体识别的精确度和完整性的直接影响。故实体识别是知识库构建过骤。用实体抽取的方法一般分为三类:词典与规则相结合的方法、利用统计机器学习的方放域的实体识别方法。词典与规则相结合的方法在构建的目标实体模板和实体指称词匹配的方式提取语料中的实体;利用统计机器学习的方法首先在训练集上训练出机器后利用该模型提取语料中的实体;针对开放域的实体识别适用于多领域的、异构的海-15]。规则与词典的实体识别算法期的实体识别工作一般都限定了文本领域或语义单元,因此往往使用词典与规则相结如利用编写的特定规则,识别出语料库中的人物、时间、地点或机构组织等命名实体结合了自定义的模板规则和启发式算法,实现了对公司名称的自动实体识别功能。如基于规则与词典的实体识别流程。

结构图,智能搜索,结构图,问句


第二章 研究现状等相关技术已经相当成熟,例如目前使用较为普遍的中文分词与词性标注的工具有中科院出的 ICTCALAS[43]以及哈工大信息检索研究中心研发的语言技术平台(LTP)[44]。因此,理方面的基础工作往往不是语义分析过程中的研究重心。用户查询问句的语义分析主要目的是理解查询问句的语义信息,只有在确切理解查询问句前提下,才可能找到知识库中包含的用户真正需要的知识。合理的查询问句分析不仅需要的主题信息,还需要明确问句的类型信息和约束条件等。由于汉语是弱语法结构的自然语查询问句的分析需要很多语言学相关的知识,因而针对中文自然语言问句的语义分析一直点。查询问句的语义分析往往是对预处理的结果进行序列化标注,从而理解问句的语义信问句的序列化标注工作实现了将自然语言问句映射为结构化的语义空间向量,以便于计算。通常使用基于统计机器学习的方法来解决自然语言的序列化标注问题,比较典型的处理条件随机场模型和隐马尔科夫模型等。图 2-2 所示是智能搜索的搜索结构流图。

【参考文献】:
期刊论文
[1]双结构网络内容共享能力研究[J]. 刘旋,杨鹏,董永强.  电子学报. 2018(04)
[2]互联网DNS安全研究现状与挑战[J]. 胡宁,邓文平,姚苏.  网络与信息安全学报. 2017(03)
[3]知识图谱构建技术综述[J]. 刘峤,李杨,段宏,刘瑶,秦志光.  计算机研究与发展. 2016(03)
[4]基于图的中文集成实体链接算法[J]. 刘峤,钟云,李杨,刘瑶,秦志光.  计算机研究与发展. 2016(02)
[5]未来网络的第三种思路[J]. 李幼平.  电信科学. 2015(12)
[6]基于播存思想的未来互联网次结构[J]. 杨鹏,李幼平.  复杂系统与复杂性科学. 2015(02)
[7]播存网络体系结构普适模型及实现模式[J]. 杨鹏,李幼平.  电子学报. 2015(05)
[8]电子病历命名实体识别和实体关系抽取研究综述[J]. 杨锦锋,于秋滨,关毅,蒋志鹏.  自动化学报. 2014(08)
[9]信息中心网络发展研究综述[J]. 吴超,张尧学,周悦芝,傅晓明.  计算机学报. 2015(03)
[10]开放式信息抽取研究进展[J]. 杨博,蔡东风,杨华.  中文信息学报. 2014(04)



本文编号:2970879

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2970879.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户48eb8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com