当前位置:主页 > 社科论文 > 一带一路论文 >

基于概率模型的细粒度话题演化分析技术研究与实现

发布时间:2020-08-20 19:03
【摘要】:近年来,微博、推特和脸书等在线社交平台迅猛发展,用户量激增,正在冲击传统新闻媒体,成为当今社会人们最重要的一个方便快捷的信息获取来源和传播渠道。人们也研究和依靠在线社交网络分析的理论和方法,发现并分析隐含在社交媒体中的话题及其演化规律。随着数以亿计、来自不同领域方向,具有不同背景的人群,持续地在社交媒体上分享自己对于成千上万社会热点事件的观点与思想,上述话题的演化分析需求也被迫向着精准化和更细粒度的方向发展。基于用户感兴趣信息内容的发现并追踪社交网络中出现的事件的细粒度话题演化过程,成为当前话题演化分析研究的重要问题之一。本文在研究话题发现与演化的基础上,对基于在线社交网络的文本流中细粒度话题演化模型进行了深入的研究。主要关注如何从高度动态化的在线短文本数据流中,挖掘出用户感兴趣的高质量细粒度话题,并对其演化过程进行追踪和研究。帮助用户在高速变化的网络时代及时有效地了解和掌握其所关注的方面最前沿、最敏感的话题,并根据这些话题的演化规律和发展趋势做出相应的判断和决策。本文的主要研究内容,包括以下三个部分:第一,对当前主流的话题发现与演化技术进行研究,再结合新浪微博等在线社交网络中短文本的特点以及文档集合自带的时间信息,针对用户对于话题演化分析更聚焦、更细节的需求,分析了现有方法在解决这个问题中可能存在的不足与局限性,在TTM模型(targeted topic model)的基础上改进扩展成可对在线文本流进行话题演化分析的细粒度话题演化模型FG-TEM(fine-grained topic evolution model)。第二,定义了子话题间的五种关系。通过对文档集合按照固定尺寸的时间窗口进行划分,再通过细粒度话题演化模型获取不同时间窗口内的文档-话题概率分布和话题-词概率分布。通过计算不同时间窗口内子话题间的KL散度来判断子话题间的相似度,从而获得子话题间的演化路径,再计算不同时间窗口内各个子话题的话题强度。基于这一系列子话题间演化路径以及强度变化过程,绘制出用户感兴趣方面的细粒度话题在整个时间域上的细粒度话题内容和强度演化图。第三,针对在线社交网络文本的特点,提出了一种新的话题一致性度量指标EPMI。基于E-PMI对上述提出的细粒度话题演化模型进行评估,实验结果验证了FG-TEM生成的话题一致性高,质量好,更贴近用户需求,因此模型的效果也更好。
【学位授予单位】:国防科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.1
【图文】:

模型图,模型,多项式分布,概率分布


国防科技大学研究生院专业学位硕士学位论文主题都是固定词表上的一个多项式分布;每篇文档中的词与词之,每一个词都独立存在,交换彼此的顺序并不影响文档本身;每篇个话题,有一个固定的主题混合比例,从狄利克雷分布中抽样得到词都由其中一个话题生成。经典的 LDA 模型将文档集合中每一篇话题词的概率分布的形式表示。同时它是一种无监督学习算法,训注好的训练集,仅仅需要给定一个文档集合以及一个确定的话题数vidM.Blei 在 2003 年发表的论文中提出的 LDA 模型的原始模型,概率分布θ加上了狄利克雷先验,而对话题-词的概率分布φ并没有。而后 T.L.Giffiths 对原始 LDA 模型进行了改进,给话题-词概率分克雷先验,因为多项式分布和狄利克雷分布满足共轭分布特性,样算法来进行相应的参数推导。因为 Gibbs 采样推导简单,且效大多数的应用中,基本采用 Gibbs 采样算法来进行相关的参数估计型如图 2.1,其中阴影部分表示可观测变量,空心部分表示隐含变

模型图,模型图,模型,主题


国防科技大学研究生院专业学位硕士学位论文想。同时由于主题模型是无监督学习,所以即使在应用于大数据时,仍然可能产无法令人满意的结果。近年来,一种基于知识的主题模型被提了出来,这种模型要用户提供一些现有的领域知识来指导模型产生更好的话题。基于知识的主题模型同样也可以应用于聚焦式话题发现,在[20]中,作者利狄利克雷森林先验(DirichletForestPriors),将用户对于各种话题应该具有的各高概率或者低概率话题词的组成的了解和知识整合进主题模型中。ArjunMukherj等人则提出了一种基于用户提供的作为一些方面类别的种子词汇来准确发现用所需信息的方法,并设计了两种基于现有知识的主题模型 SAS 和 ME-SAS[21],图 2.2。这两种模型将种子词汇作为反映用户感兴趣类别的关键词来自动提取并用户所需的信息。

模型图,模型图


图 2.3 TTM 模型图2.2话题演化模型分析分析主要是衡量分析同一个话,题随着时间的推移,话的动态性、发展性和差异性。话题演化分为两个方面:表示内容随着时间所产生的变化,而这个变化反过程,而发生的变化。例如,在国际会议开幕前夕,大家的关备工作,而在会议闭幕之后,大家的关注点就转移到了生活所带来的影响。则表示话题强度,随着时间的推移而经历的一个低潮到程,而这个变化的过程,反应了随着时间的推移,用户。例如,对于每年举办一次的全国人民代表大会,只有户关注,在非会议期间受到的关注程度较低。介绍在一些在线社交网络中最常用的且适用范围广泛

【相似文献】

相关期刊论文 前10条

1 宋凤义;胡太;杨明;;基于外观的复合属性学习的细粒度识别[J];数据采集与处理;2016年06期

2 陈自岩;黄宇;王洋;傅兴玉;付琨;;一种利用语义相似特征提升细粒度情感分析方法[J];计算机应用与软件;2017年03期

3 张洁;董辉;;普适环境中细粒度可信管理框架的研究[J];测控技术;2017年05期

4 钟竞德;;超细粒度氧化钇生产的新工艺分析[J];科技创新与应用;2016年06期

5 罗清红;;大数据与灵魂[J];当代教育家;2016年12期

6 李涛;刘明耀;闫宁;;超细粒度砂轮制备技术研究现状[J];金刚石与磨料磨具工程;2013年02期

7 谭光华,袁廉灼;从Na_2WO_4溶液制取中、细粒度WO_3[J];稀有金属;1989年05期

8 徐德华;张未央;;基于深度记忆网络的在线评论细粒度情感分类[J];电子制作;2020年01期

9 朱阳光;刘瑞敏;王震;王枭;;基于联合优化多任务学习的细粒度图像识别[J];陕西理工大学学报(自然科学版);2019年06期

10 敦欣卉;张云秋;杨铠西;;基于微博的细粒度情感分析[J];数据分析与知识发现;2017年07期

相关会议论文 前10条

1 李小庆;曾庆凯;;细粒度可信恢复文件系统[A];2011年全国通信安全学术会议论文集[C];2011年

2 刘电霆;周德俭;余强;;虚拟企业中细粒度协同设计任务的不确定调度及GA求解[A];先进制造技术高层论坛暨第六届制造业自动化与信息化技术研讨会论文集[C];2007年

3 叶蕴芳;杨榆;罗鑫;徐国爱;;Appfuse系统中细粒度权限控制的研究与实现[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年

4 朱虹;舒鹏;;扩展SQL实现DBMS细粒度访问控制[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

5 郭磊;唐玉华;周杰;董亚卓;;基于FPGA的Cholesky分解细粒度并行结构与实现[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

6 吴舜;苏丹;吴佳;李坤;许大卫;刘昀;魏征;;基于Tilera平台的网络细粒度应用行为识别系统[A];2013电力行业信息化年会论文集[C];2013年

7 李祖德;占国强;叶晓俊;;FG-RBAC:基于RBAC的FGAC模型实现[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

8 王运成;任年民;张建平;结凤克;柴常谦;;基于角色的XML细粒度访问控制模型[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年

9 刘伟峰;王智广;;细粒度并行计算编程模型研究[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年

10 江伟玉;高能;刘泽艺;林雪燕;;一种云计算中的多重身份认证与授权方案[A];第27次全国计算机安全学术交流会论文集[C];2012年

相关重要报纸文章 前10条

1 ;修正SDH:承载细粒度IP业务[N];中国计算机报;2002年

2 ;细粒度的访问控制和日志管理[N];中国计算机报;2003年

3 ;三项措施保护服务器[N];网络世界;2004年

4 侯丽坤;思达展示新概念QoS产品[N];计算机世界;2001年

5 《网络世界》记者 蒙克;D-Link应用层流控网关细粒度管理全网流量[N];网络世界;2015年

6 吕明;网络安全审计需细粒度报告[N];计算机世界;2008年

7 胡英;F5最新SSL VPN[N];计算机世界;2006年

8 侯闯 综合编译;部署SOA需慎重[N];计算机世界;2004年

9 卜叶 整理;新型美颜技术让你变明星[N];中国科学报;2020年

10 ;Allot加入开放式IP服务创建计划[N];人民邮电;2007年

相关博士学位论文 前10条

1 余少勇;基于深度学习的车辆检测及其细粒度分类关键技术研究[D];厦门大学;2017年

2 赵毅力;基于深度学习的云南野生鸟类图像细粒度识别[D];云南大学;2018年

3 庞程;基于部件的图像细粒度视觉分析方法研究[D];哈尔滨工业大学;2018年

4 韩婷婷;视频理解中人体动作的细粒度表示与应用[D];哈尔滨工业大学;2019年

5 杨骏;细粒度文本情感分析问题研究[D];南京大学;2019年

6 赵波;细粒度图像分类、分割、生成与检索关键技术研究[D];西南交通大学;2017年

7 洪佳楠;半可信云中基于属性加密扩展的访问控制研究[D];中国科学技术大学;2018年

8 魏秀参;深度学习下细粒度级别图像的视觉分析研究[D];南京大学;2018年

9 时杰;关系数据库细粒度访问控制研究[D];华中科技大学;2010年

10 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年

相关硕士学位论文 前10条

1 熊俊;基于细粒度情感分析的票房预测研究[D];重庆邮电大学;2019年

2 聂自闯;基于SDN的IoT设备细粒度访问控制研究与实现[D];重庆邮电大学;2019年

3 邓敏娜;基于序列生成模型的细粒度情感分析研究[D];湘潭大学;2019年

4 郑颖;面向用户评论的细粒度情感分析系统设计与实现[D];山东师范大学;2019年

5 张腾;基于卷积神经网络的细粒度车型识别系统研究与实现[D];上海交通大学;2018年

6 陈仿雄;弱监督显著性细粒度图像分类算法的研究与实现[D];广东工业大学;2019年

7 周晋虹;基于异构嵌入式的细粒度图像自动分类系统研究[D];成都理工大学;2019年

8 麻凯利;基于深度学习的细粒度目标检测算法研究[D];国防科技大学;2017年

9 刘心;基于概率模型的细粒度话题演化分析技术研究与实现[D];国防科技大学;2018年

10 胡飞菊;基于文本挖掘的民宿评论细粒度情感分析[D];江西农业大学;2019年



本文编号:2798329

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/ydyl/2798329.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户abaf1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com