当前位置:主页 > 社科论文 > 图书档案论文 >

网络用户偏好分析及话题趋势预测方法研究

发布时间:2020-06-22 23:24
【摘要】:网络技术的快速发展使得互联网对社会生活的影响越来越大,网民作为互联网上信息传播的主体,其行为模式对于互联网上信息的传播过程有着直接影响,用户对于话题的偏好是影响话题发展趋势的因素之一,分析用户对话题的偏好可以促进互联网话题发展趋势预测技术的发展。互联网信息的爆发性增长增加了网民在互联网上获取信息的难度,要提高网民互联网检索信息的效率,需要在信息索引的基础上,分析网民对于信息的偏好,根据其偏好为网民提供个性化的信息服务。 本文结合了交叉学科的相关研究方法和思想,从用户行为模式的分析入手,分析互联网用户的偏好以及互联网信息的传播过程,建立了一个有效的互联网话题趋势预测模型;同时从用户偏好的角度出发,研究了互联网的信息推荐机制,为用户提供一种更加方便快捷的信息检索方式。论文的研究工作得到了国家自然科学基金资助项目(No.61172072)“在线社交网络舆论传播演化模式及热点预测方法研究”,国家自然科学基金项目“互联网用户偏好描述方法、形成机制与演化模式研究”(No.61271308),北京市自然科学基金资助项目(No.4112045)“网络社区舆论趋势预测与观点演化机制研究”,高等学校博士学科点专项科研基金(No.20100009110002)“个体交互与舆论引导对网络舆情传播影响的研究”项目的支持。论文的主要工作和创新点包括以下几个方面: 1)以微博为例,分析了用户行为的统计特性,为用户偏好的分析以及话题演化趋势的预测奠定基础。用户传播信息的能力可以通过用户关注者的数量(传播的广度)、用户状态的回复和转发数量(信息的重要程度)以及用户状态回复中的关注者的比例(传播的深度)等表现出来;随着用户发表状态数量的不断增多,新发表的状态中所包含新词语的比例不断减少,用户所使用的词语大部分包含在了一个相对稳定的习惯词语集合中,而好友用户之间习惯词语集合的交集比随机选择用户的交集大得多,使用习惯词语集合的交集数量就可以大体上表现两个用户之间的相似程度;微博中话题生成的时间序列与滞后周期为1的时间序列之间具有比较显著的相关关系,利用时间序列前后之间的相关性可以预测话题的发展趋势。 2)分析了微博用户对于内容的偏好,用户偏好是话题发展趋势的影响因素之一,也是微博推荐系统的重要因素,分析用户偏好能够促进以上两个问题的研究。用户对于内容的偏好通过内容之间的相似度表现出来,而内容之间相似度则是通过内容包含的词语集合计算得到的。分别分析了用户之间的相似度,话题之间的相似度以及话题和状态之间的相似度,用来表示用户对其他用户、话题和状态的偏好程度,并且定义了用户对于新的用户、话题以及状态的偏好判定流程,判断一个用户对这些对象是否存在偏好,判定的结果可以用于推荐模型和话题趋势预测模型。 3)提出了一种改进的基于对象固有属性相似度的推荐算法,并结合用户的偏好将算法应用于微博系统的推荐。改进算法以协同过滤算法为基础,利用对象固有属性的相似程度,改进初始评分和用户相似度的计算过程,使得不同对象有着不一样的初始评分、两个用户之间针对不同对象的相似度也不同,改进的算法在一定程度上解决了数据稀疏性带来的推荐准确率较低的问题,相较于经典的算法准确率有了提高。微博推荐系统结合了用户的偏好、话题之间的相似度、状态之间的相似度,在微博系统中具有良好的推荐效果。 4)提出了一种互联网话题趋势预测算法,并根据用户对于内容的偏好对微博话题的预测进行了改进。根据话题时间序列前后之间的相关性,借鉴经济学中的ARIMA模型,对话题在未来一段时间内的发展趋势进行了预测,实验结果表明,这个模型能够有效地预测互联网中不同类型媒体中的话题趋势。通过对微博话题的分析表明,用户对于内容的偏好能够影响话题传播过程,偏好用户的状态对于话题传播过程的促进作用要强于非偏好用户的状态。根据这个特性,提出了一种新的时间序列生成方法,在生成时间序列的过程中,根据用户对于话题的偏好,对用户发表状态的回复赋予不同的权值,以表征其对话题传播过程的影响能力。实验结果表明,采用新时间序列的预测模型,其预测的误差水平要小于使用原时间序列的模型,新时间序列能够更好地表现话题的发展趋势,更适合用来对微博话题进行趋势预测。
【学位授予单位】:北京交通大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:G252;TP391.3

【相似文献】

相关期刊论文 前10条

1 张森,徐小力;基于全息人工神经网络的建模与预测方法[J];北京机械工业学院学报;1999年03期

2 刘震;王厚军;龙兵;张治国;;一种基于加权隐马尔可夫的自回归状态预测模型[J];电子学报;2009年10期

3 徐小力;左云波;吴国新;;量子神经网络在旋转机组状态趋势预测中的应用[J];机械强度;2010年04期

4 黄坤;李洪儒;;采用RBF神经网络的状态监测数据趋势预测[J];兵工自动化;2006年08期

5 ;中国电子工业运行分析及2007趋势预测[J];财经界;2007年06期

6 崔秀伶;李晓白;郎荣玲;;机载设备性能趋势预测系统研究[J];微计算机信息;2008年24期

7 李梅琴;刘刚;;新疆兵团流动人口犯罪趋势预测[J];金卡工程(经济与法);2009年05期

8 胡宏伟;周晓军;庞茂;;基于LS-SVM的火电厂给水泵组状态趋势预测研究[J];传感技术学报;2007年05期

9 李钢;周东华;;一类设备故障过程的故障趋势预测方法研究[J];空军工程大学学报(自然科学版);2007年04期

10 蔡芝蔚;;计算机技术发展研究[J];电脑与电信;2008年02期

相关会议论文 前10条

1 柏文阳;何瑗;马耀华;肖建华;徐洁磐;;基于消息的汇率趋势预测方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

2 冯岑;房莉;;机织物的叠层与透气量变化关系的趋势预测[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年

3 刘占生;王晓伟;府东明;;ARMA模型用于机组振动趋势预测的研究[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年

4 方亚;施侣元;;乳腺癌危险因素综合评价及其趋势预测[A];新世纪预防医学面临的挑战——中华预防医学会首届学术年会论文摘要集[C];2002年

5 吴炎;杜栋;;改进BP神经网络及其对江苏省粮食产量的仿真预测[A];决策科学与评价——中国系统工程学会决策科学专业委员会第八届学术年会论文集[C];2009年

6 张玉峰;贾成刚;张文喜;;应用时间序列评估人工增雨效果[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年

7 杜淑菊;;宣武区1993—2000年糖尿病死亡分析及趋势预测[A];新世纪预防医学面临的挑战——中华预防医学会首届学术年会论文摘要集[C];2002年

8 王永忠;曾昭磐;;混沌时间序列点预测方法研究[A];1999中国控制与决策学术年会论文集[C];1999年

9 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年

10 王有良;周文国;;基于时间序列的基坑水平变形预测模型[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年

相关重要报纸文章 前10条

1 编译 黄梦 ;2005年五大技术与趋势预测(上)[N];电脑商报;2005年

2 史芬;2000年全国装饰装修趋势预测[N];中华合作时报;2000年

3 记者 范俊;2005年IT行业趋势预测[N];国际金融报;2004年

4 ;台式PC趋势预测[N];中国计算机报;2004年

5 王松群;2005年职业发展趋势预测[N];中国旅游报;2004年

6 仇威;今后20年的出版与印刷趋势预测(12)[N];中国包装报;2002年

7 牟鑫;亦庄地产今后什么样?[N];华夏时报;2002年

8 记者 黄智军;Gartner发布十大趋势预测 云和虚拟化最热门[N];计算机世界;2011年

9 记者王晴颖;趋势预测引导产品战略型开发[N];中国服饰报;2009年

10 钟实;2005年冷饮行业现状及市场趋势预测[N];经理日报;2005年

相关博士学位论文 前10条

1 程辉;网络用户偏好分析及话题趋势预测方法研究[D];北京交通大学;2013年

2 潘罗平;基于健康评估和劣化趋势预测的水电机组故障诊断系统研究[D];中国水利水电科学研究院;2013年

3 张文斌;汽轮发电机组状态趋势预测及故障诊断方法研究[D];浙江大学;2009年

4 杨正瓴;时间序列中的混沌判定、预报及其在电力系统中的应用[D];天津大学;2003年

5 张晓伟;水文动力系统自记忆特性及其应用研究[D];西安理工大学;2009年

6 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年

7 刘大同;基于Online SVR的在线时间序列预测方法及其应用研究[D];哈尔滨工业大学;2010年

8 张永林;车辆道路数值模拟与仿真研究[D];华中科技大学;2010年

9 崔亚强;沪深300股指内在复杂性分析及预测研究[D];天津大学;2010年

10 杨谈;网络混沌行为及其控制的研究[D];北京邮电大学;2009年

相关硕士学位论文 前10条

1 马玉峰;风电机组齿轮箱故障趋势预测方法研究[D];华北电力大学;2013年

2 林祈元;基于HMM的回转窑喂煤量趋势预测[D];湖南大学;2011年

3 姚海波;微博热点话题检测与趋势预测研究[D];华南理工大学;2013年

4 曹元元;某省梅毒和淋病流行特征及趋势预测研究[D];山西医科大学;2012年

5 王沙沙;基于类模型的Web舆情趋势预测[D];电子科技大学;2011年

6 陈卓;基于时间序列的设备缺陷预测的研究[D];辽宁工程技术大学;2005年

7 毛文晋;重庆市城乡居民收入差距问题研究[D];西南大学;2006年

8 吾喻明;水文时间序列趋势分析的研究与应用[D];河海大学;2007年

9 侯效永;多尺度时间序列预测[D];苏州大学;2013年

10 高亮;安徽省旱涝监测综合分析系统的设计与实现[D];西安电子科技大学;2011年



本文编号:2726413

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2726413.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4f16a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com