当前位置:主页 > 管理论文 > 移动网络论文 >

基于特征词条本体进化的微博话题跟踪研究

发布时间:2017-05-21 11:24

  本文关键词:基于特征词条本体进化的微博话题跟踪研究,由笔耕文化传播整理发布。


【摘要】:微博作为一种新的在线社交媒体平台,近年来发展十分迅速,参与人数越来越多,已成为广大民众获取信息、发表观点的重要平台,并日益成为社会舆论中最重要的信息来源,快速及时的获取微博热点信息成为了人们的迫切需要。因此需要在微博中引入话题跟踪技术,让用户能够快速准确的掌握微博中的热点话题信息。传统的话题跟踪主要采用特征词的模型,数据维度很大且噪音很多,因此本文通过抽取话题最相关的本体信息来对话题进行跟踪,同时针对独立的特征词对话题语义表示上的缺陷,本文提出了特征词条本体的概念,并应用于话题跟踪之中。本文首先介绍了话题跟踪的相关基础理论,详述了话题跟踪过程及涉及的关键技术,分析了现有话题跟踪方法的不足,同时介绍本体的知识,并分析了本体的特点和本体进化的概念;接下来针对现有话题跟踪方法的不足,分析了微博报道的语义特征,提出了基于本体的话题表示方法,并自动构建出初始话题本体;初始本体中单一的特征项仍不能充分表达话题的语义信息,因此本体提出了特征词条本体的概念,通过自动抽取出的话题相关特征词条来描述话题中的事件信息,并且通过本体的不断进化来进行微博话题的跟踪;最后,本文设计了相应的实验系统,对本文提出的方法进行实验验证。本文的主要贡献在于:①针对微博的语义特征,提出了微博话题的特征词条本体表示方法,能够自动构建特征词条本体并实现本体的进化。②提出了基于本体进化的微博话题跟踪算法,根据微博话题的特征设计了相应的权重和相似度计算方法。
【关键词】:话题跟踪 特征词条本体 本体进化 信息抽取
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1;TP393.092
【目录】:
  • 摘要4-5
  • ABSTRACT5-10
  • 第一章 绪论10-17
  • 1.1 选题背景及意义10-11
  • 1.1.1 选题背景10
  • 1.1.2 研究意义10-11
  • 1.2 国内外研究现状11-14
  • 1.2.1 国外研究现状11-12
  • 1.2.2 国内研究现状12-13
  • 1.2.3 存在的问题13-14
  • 1.3 研究内容和技术路线14-16
  • 1.3.1 研究内容14-15
  • 1.3.2 技术路线15-16
  • 1.4 主要工作及创新点16-17
  • 第二章 相关基础理论研究17-27
  • 2.1 话题跟踪技术17-18
  • 2.1.1 相关概念17-18
  • 2.1.2 话题跟踪特点18
  • 2.2 话题跟踪关键技术18-23
  • 2.2.1 话题跟踪一般流程18-19
  • 2.2.2 建立话题/报道模型19-20
  • 2.2.3 特征项提取20
  • 2.2.4 权重计算20-22
  • 2.2.5 计算模型相似度22
  • 2.2.6 阈值比较22-23
  • 2.3 本体及本体进化23-26
  • 2.3.1 本体简介23-24
  • 2.3.2 本体的构建24-25
  • 2.3.3 本体的进化25-26
  • 2.4 本章小结26-27
  • 第三章 微博初始本体构建27-38
  • 3.1 微博数据获取与处理27-32
  • 3.1.1 确定数据来源27-28
  • 3.1.2 微博数据采集28-30
  • 3.1.3 微博数据预处理30-32
  • 3.2 话题本体的自动构建32-37
  • 3.2.1 话题本体自动构建流程32-33
  • 3.2.2 时间本体的获取33-34
  • 3.2.3 地点本体的获取34-36
  • 3.2.4 对象本体的获取36-37
  • 3.3 本章小结37-38
  • 第四章 特征词条本体的自动构建及进化38-45
  • 4.1 特征词条本体的提出38-39
  • 4.2 特征词条本体的自动构建39-42
  • 4.2.1 特征词的获取39-40
  • 4.2.2 特征词点互信息计算40
  • 4.2.3 初始特征词条抽取算法40
  • 4.2.4 特征词条本体获取40-42
  • 4.3 特征词条本体的进化42-44
  • 4.4 本章小结44-45
  • 第五章 基于特征词条本体的微博话题跟踪算法45-49
  • 5.1 话题跟踪流程45-46
  • 5.2 本体权重的计算46-47
  • 5.3 话题本体与报道相似度计算47-48
  • 5.4 报道相关性判定48
  • 5.5 微博热度计算48
  • 5.6 本章小结48-49
  • 第六章 实验设计及分析49-59
  • 6.1 实验系统设计49-56
  • 6.1.1 实验系统功能49-50
  • 6.1.2 实验数据50
  • 6.1.3 实验过程展示50-56
  • 6.2 实验结果分析与比较56-58
  • 6.2.1 评价标准56-57
  • 6.2.2 实验结果及分析57-58
  • 6.3 本章小结58-59
  • 第七章 总结与展望59-60
  • 7.1 总结59
  • 7.2 展望59-60
  • 参考文献60-63
  • 致谢63-64
  • 攻读硕士期间发表的论文及科研成果64

【相似文献】

中国期刊全文数据库 前3条

1 刘宗田;黄美丽;周文;仲兆满;付剑锋;单建芳;智慧来;;面向事件的本体研究[J];计算机科学;2009年11期

2 范宽;吴朝晖;陈华钧;;基于本体的网络数据工作平台NetData[J];计算机科学;2006年09期

3 ;[J];;年期

中国重要会议论文全文数据库 前4条

1 杨保军;;关于新闻本体的几个基本问题[A];新闻学论集(第22辑)[C];2009年

2 王连诚;马强;;基于概念权重的本体相似度计算[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 王文晶;李茹;宋小香;;基于汉语框架知识库的旅游信息问答系统设计[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

4 汪政;晓华;;批评的本体相位[A];这就是我们的文学生活——《当代文坛》三十年评论精选(下)[C];2012年

中国重要报纸全文数据库 前1条

1 清华大学计算机系知识工程组 仲茜邋李涓子;语义Web中的本体建立技术[N];计算机世界;2007年

中国博士学位论文全文数据库 前1条

1 林松涛;模块化本体建设研究[D];北京邮电大学;2006年

中国硕士学位论文全文数据库 前3条

1 简旭文;基于特征词条本体进化的微博话题跟踪研究[D];南京航空航天大学;2015年

2 蒋璐;基于变化管理的本体协同开发方法研究[D];江苏科技大学;2013年

3 张志慧;UML类图转换到OWL DL本体的一种形式化方法的研究[D];东北大学;2008年


  本文关键词:基于特征词条本体进化的微博话题跟踪研究,由笔耕文化传播整理发布。



本文编号:383524

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/383524.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户151b4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com