基于特征词条本体进化的微博话题跟踪研究
本文关键词:基于特征词条本体进化的微博话题跟踪研究,由笔耕文化传播整理发布。
【摘要】:微博作为一种新的在线社交媒体平台,近年来发展十分迅速,参与人数越来越多,已成为广大民众获取信息、发表观点的重要平台,并日益成为社会舆论中最重要的信息来源,快速及时的获取微博热点信息成为了人们的迫切需要。因此需要在微博中引入话题跟踪技术,让用户能够快速准确的掌握微博中的热点话题信息。传统的话题跟踪主要采用特征词的模型,数据维度很大且噪音很多,因此本文通过抽取话题最相关的本体信息来对话题进行跟踪,同时针对独立的特征词对话题语义表示上的缺陷,本文提出了特征词条本体的概念,并应用于话题跟踪之中。本文首先介绍了话题跟踪的相关基础理论,详述了话题跟踪过程及涉及的关键技术,分析了现有话题跟踪方法的不足,同时介绍本体的知识,并分析了本体的特点和本体进化的概念;接下来针对现有话题跟踪方法的不足,分析了微博报道的语义特征,提出了基于本体的话题表示方法,并自动构建出初始话题本体;初始本体中单一的特征项仍不能充分表达话题的语义信息,因此本体提出了特征词条本体的概念,通过自动抽取出的话题相关特征词条来描述话题中的事件信息,并且通过本体的不断进化来进行微博话题的跟踪;最后,本文设计了相应的实验系统,对本文提出的方法进行实验验证。本文的主要贡献在于:①针对微博的语义特征,提出了微博话题的特征词条本体表示方法,能够自动构建特征词条本体并实现本体的进化。②提出了基于本体进化的微博话题跟踪算法,根据微博话题的特征设计了相应的权重和相似度计算方法。
【关键词】:话题跟踪 特征词条本体 本体进化 信息抽取
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1;TP393.092
【目录】:
- 摘要4-5
- ABSTRACT5-10
- 第一章 绪论10-17
- 1.1 选题背景及意义10-11
- 1.1.1 选题背景10
- 1.1.2 研究意义10-11
- 1.2 国内外研究现状11-14
- 1.2.1 国外研究现状11-12
- 1.2.2 国内研究现状12-13
- 1.2.3 存在的问题13-14
- 1.3 研究内容和技术路线14-16
- 1.3.1 研究内容14-15
- 1.3.2 技术路线15-16
- 1.4 主要工作及创新点16-17
- 第二章 相关基础理论研究17-27
- 2.1 话题跟踪技术17-18
- 2.1.1 相关概念17-18
- 2.1.2 话题跟踪特点18
- 2.2 话题跟踪关键技术18-23
- 2.2.1 话题跟踪一般流程18-19
- 2.2.2 建立话题/报道模型19-20
- 2.2.3 特征项提取20
- 2.2.4 权重计算20-22
- 2.2.5 计算模型相似度22
- 2.2.6 阈值比较22-23
- 2.3 本体及本体进化23-26
- 2.3.1 本体简介23-24
- 2.3.2 本体的构建24-25
- 2.3.3 本体的进化25-26
- 2.4 本章小结26-27
- 第三章 微博初始本体构建27-38
- 3.1 微博数据获取与处理27-32
- 3.1.1 确定数据来源27-28
- 3.1.2 微博数据采集28-30
- 3.1.3 微博数据预处理30-32
- 3.2 话题本体的自动构建32-37
- 3.2.1 话题本体自动构建流程32-33
- 3.2.2 时间本体的获取33-34
- 3.2.3 地点本体的获取34-36
- 3.2.4 对象本体的获取36-37
- 3.3 本章小结37-38
- 第四章 特征词条本体的自动构建及进化38-45
- 4.1 特征词条本体的提出38-39
- 4.2 特征词条本体的自动构建39-42
- 4.2.1 特征词的获取39-40
- 4.2.2 特征词点互信息计算40
- 4.2.3 初始特征词条抽取算法40
- 4.2.4 特征词条本体获取40-42
- 4.3 特征词条本体的进化42-44
- 4.4 本章小结44-45
- 第五章 基于特征词条本体的微博话题跟踪算法45-49
- 5.1 话题跟踪流程45-46
- 5.2 本体权重的计算46-47
- 5.3 话题本体与报道相似度计算47-48
- 5.4 报道相关性判定48
- 5.5 微博热度计算48
- 5.6 本章小结48-49
- 第六章 实验设计及分析49-59
- 6.1 实验系统设计49-56
- 6.1.1 实验系统功能49-50
- 6.1.2 实验数据50
- 6.1.3 实验过程展示50-56
- 6.2 实验结果分析与比较56-58
- 6.2.1 评价标准56-57
- 6.2.2 实验结果及分析57-58
- 6.3 本章小结58-59
- 第七章 总结与展望59-60
- 7.1 总结59
- 7.2 展望59-60
- 参考文献60-63
- 致谢63-64
- 攻读硕士期间发表的论文及科研成果64
【相似文献】
中国期刊全文数据库 前3条
1 刘宗田;黄美丽;周文;仲兆满;付剑锋;单建芳;智慧来;;面向事件的本体研究[J];计算机科学;2009年11期
2 范宽;吴朝晖;陈华钧;;基于本体的网络数据工作平台NetData[J];计算机科学;2006年09期
3 ;[J];;年期
中国重要会议论文全文数据库 前4条
1 杨保军;;关于新闻本体的几个基本问题[A];新闻学论集(第22辑)[C];2009年
2 王连诚;马强;;基于概念权重的本体相似度计算[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
3 王文晶;李茹;宋小香;;基于汉语框架知识库的旅游信息问答系统设计[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 汪政;晓华;;批评的本体相位[A];这就是我们的文学生活——《当代文坛》三十年评论精选(下)[C];2012年
中国重要报纸全文数据库 前1条
1 清华大学计算机系知识工程组 仲茜邋李涓子;语义Web中的本体建立技术[N];计算机世界;2007年
中国博士学位论文全文数据库 前1条
1 林松涛;模块化本体建设研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前3条
1 简旭文;基于特征词条本体进化的微博话题跟踪研究[D];南京航空航天大学;2015年
2 蒋璐;基于变化管理的本体协同开发方法研究[D];江苏科技大学;2013年
3 张志慧;UML类图转换到OWL DL本体的一种形式化方法的研究[D];东北大学;2008年
本文关键词:基于特征词条本体进化的微博话题跟踪研究,由笔耕文化传播整理发布。
,本文编号:383524
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/383524.html