Web环境下基于语义关联的文本理解
本文关键词:Web环境下基于语义关联的文本理解 出处:《华中科技大学》2016年博士论文 论文类型:学位论文
更多相关文章: 文本分析 语义相关性 维基百科 自动摘要 语义模式匹配 词向量 情感分析
【摘要】:在互联网的环境下,为了更好的处理网络中的各种文本,提出基于文本语义关联关系的文本理解。主要研究文本语义关联的获取和度量,以及将语义关联关系运用到各种文本分析中。为了获取并度量词汇间语义关联信息,提出基于维基百科的文本语义关联的获取。当前对维基百科的使用大多集中在扩展概念的相关概念,而不能够定量的分析概念间的语义相关度。针对这一问题,考虑维基网页文本的半结构化特点,使用概念页面的链接关系构造概念的语义关联网络,并利用各概念页面构造维基百科的词条-概念映射结构。使用马尔科夫随机游走算法在概念网络上获取概念间语义关联强度,通过词条概念映射结构将这种关联关系映射到词汇间。实验结果显示加入维基百科的语义信息,无论是文本主题的获取能力,还是文本的分类和聚类的精度,都有了提高。对于网络特定领域的短文本的语义理解,提出通过对查询接口标签文本进行语义关联分析,研究了网络查询接口的模式匹配这一典型应用。在查询接口的模式匹配上,当前研究主要使用接口表单布局视觉信息,将表单表达成树状结构,进而将接口模式匹配转化到树的匹配。这种方式没有充分利用表单元素的语义信息,特别是标签文本的语义信息。针对这个问题,提出一个基于语义关联的接口模式匹配算法。同时配合链表型的查询接口模型,该算法可以很好的处理接口的模式匹配,进而快速的进行查询接口的集成。实验结果显示了加入语义信息后接口的模式匹配精度和匹配速度都有提高。对于网络中跨领域的长文本的语义理解,提出使用语义关联三层网络结构对文本进行语义关联分析,研究网络新闻、博客等网络长文本的自动摘要。之前的研究大多只能考虑文本中句子的相似度,或考虑句子中单词的重要度,而很少考虑其中的短语语义关联信息。针对这一问题,我们对自动摘要的图模型基于文本语义关联关系进行了优化和改进。在图模型中,普遍的做法是使用句子作为图的顶点,句子间的相似性作为图的带权边。改进后的模型,不仅考虑文本中句子的相关性,而且考虑更低一级的短语级别的相关性。两层语义关联图模型作为文本自动摘要模型在单文本和多文本摘要上的表现,显示了该模型的有效性。对于网络中由用户交互产生的文本的语义理解,提出使用词语向量基于社交网络中海量交互式文本自身进行语义关联分析,研究社交网络中评论的情感倾向性。用户在与互联网的交互中产生大量数据,这些数据中有很多是承载着用户情感的。无论是在微博的热门事件上,还是在网上商城的商品买卖上,用户的评论都是很有价值的,尤其是这些评论的情感倾向。这些情感倾向表达了人们对热门事件的态度和对商品服务的满意程度。对网络评论的情感进行分析,无疑是很有必要的。当前普遍的做法是使用传统的主题分类算法进行或者基于情感词典进行情感分类。这些方式没有考虑到大数据时代的网络环境,对评论的情感分类并不理想。基于词向量的词语特征表达方式,使用Skip-gram模型对评论进行词向量的训练,可以获取词汇间的语义关联。再通过句子生成模型能在不借助外部情感词典的基础上进行情感倾向性分析。实验的结果显示该算法的有效性。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 杨现民;余胜泉;张芳;;学习资源动态语义关联的设计与实现[J];中国电化教育;2013年01期
2 张辉;;基于语义关联技术的信息检索策略[J];计算机工程与设计;2011年12期
3 于杰;朱庆;徐冠宇;;面向真正射影像处理的对象定义及其语义关联[J];地理信息世界;2013年05期
4 郭正明;张素芳;;基于语义关联分析的战略技术信息分析方法[J];图书情报工作;2011年20期
5 明均仁;何超;;基于语义关联挖掘的数字图书馆跨媒体检索方法研究[J];图书情报工作;2013年07期
6 何伟;杨小平;;基于词间语义关联性的本体扩展[J];计算机应用与软件;2011年11期
7 李超;王兰成;;基于主题语义关联的扩展参照检索[J];情报理论与实践;2006年05期
8 马雨萌;祝忠明;;数字对象语义关联组织的典型模型研究[J];现代图书情报技术;2013年01期
9 任永功;范丹;武佳林;;基于语义关联树的分类查询扩展算法[J];计算机科学;2009年09期
10 徐晓文;陈维斌;李海波;;基于本体的农业数据语义关联发现技术[J];微型机与应用;2012年19期
相关会议论文 前3条
1 杨云升;宋强莉;;语义关联对干扰效果以及干扰效果评估的影响分析[A];2011'中国西部声学学术交流会论文集[C];2011年
2 王慧媛;张明;;语义关联对注意捕获的影响[A];第十二届全国心理学学术大会论文摘要集[C];2009年
3 王慧媛;隋洁;;语义关联注意捕获的右视野优势——来自ERP的证据[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
相关博士学位论文 前3条
1 陈恒;Web环境下基于语义关联的文本理解[D];华中科技大学;2016年
2 鲜国建;农业科技多维语义关联数据构建研究[D];中国农业科学院;2013年
3 宁小敏;语义关联数据模型及其检索机制的研究[D];华中科技大学;2008年
相关硕士学位论文 前10条
1 李星;基于虚拟文档的语义关联检索系统[D];东南大学;2015年
2 袁芳;基于语义分析的文本检索模型技术研究[D];华中师范大学;2016年
3 郑清照;基于Linked Open Data的语义关联发现及其应用[D];浙江大学;2010年
4 张惠清;汉语方言“被动施事”及相关功能的语义关联[D];北京大学;2012年
5 徐晓文;基于本体的农业数据语义关联发现技术[D];华侨大学;2012年
6 毕光伟;“S+V_j+什么+O”构式研究[D];南京师范大学;2011年
7 戴幸;焦点副词语义功能研究[D];华东师范大学;2007年
8 李芳芳;个人数据空间管理系统中数据抽取及语义关联构建[D];北京交通大学;2011年
9 马阳;基于题元角色和句法论元的英语“-(a)tion型”名物化词语的语义关联研究[D];武汉科技大学;2015年
10 Nattapong Wuwong(吴大鹏);基于Linked Open Data语义关联的医疗信息在线查询系统的设计与实现[D];云南大学;2012年
,本文编号:1328922
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1328922.html