当前位置:主页 > 科技论文 > 软件论文 >

基于k-means文本聚类的新浪微博个性化博文推荐研究

发布时间:2018-05-11 18:13

  本文选题:个性化博文推荐 + k-means文本聚类 ; 参考:《情报科学》2016年04期


【摘要】:随着社交网络的发展,人们在这个"信息爆炸"的时代,却有了"信息饥渴"的困惑。新浪微博用户目前面临的主要问题有两个:一是若不及时查看微博,则用户想看的有关话题的博文将被排到了最后,很可能被忽略;二是若用户对其中的某一博文所讨论的话题感兴趣,则会想得到更多关于该话题的信息。文章首先使用K-means文本聚类算法提取出用户关注的话题,使用因子分析法进行指标分析,构建用户影响力和博文影响力模型,再通过RS分值排名法和线性回归法确定用于博文影响力和用户影响力的参数值,最后提出了基于K-means文本聚类算法的个性化新浪博文及时推荐模型。通过实验验证,文章提出的方法能很有效地解决个性化博文及时推荐问题。
[Abstract]:With the development of social network, people in this "information explosion" era, but have "information hunger" confusion. Sina Weibo users are currently facing two main problems: first, if you do not view the Weibo in time, the user would like to see the topic of blog will be ranked at the end of the list, is likely to be ignored; Second, if users are interested in a topic discussed in a blog post, they will want more information about the topic. Firstly, the K-means text clustering algorithm is used to extract the topics concerned by the user, and the factor analysis method is used to analyze the index, and the model of user influence and blog influence is constructed. Then the parameter values used for the influence of blog and user are determined by RS ranking method and linear regression method. Finally, a personalized Sina blog timely recommendation model based on K-means text clustering algorithm is proposed. The experimental results show that the proposed method can effectively solve the problem of timely recommendation of personalized blog posts.
【作者单位】: 四川大学商学院;
【基金】:国家自然科学基金项目(71372189) 四川大学中央高校基本科研业务费项目(skqy201406)
【分类号】:TP391.1;G206

【相似文献】

相关期刊论文 前10条

1 丁X;许侃;;基于文本聚类方法的我国科技管理研究领域的计量研究[J];科学学研究;2007年S1期

2 丘志宏;宫雷光;;利用上下文提高文本聚类的效果[J];中文信息学报;2007年06期

3 马娜;;文本聚类研究[J];电脑知识与技术;2009年20期

4 王崇国;;以事件为特征的文本聚类方法[J];计算机应用与软件;2010年08期

5 王利峰;;动态索引树文本聚类方法中节点阀值的优化[J];电脑开发与应用;2010年09期

6 高松;冯志伟;;基于依存树库的文本聚类研究[J];中文信息学报;2011年03期

7 曲超;潘晓衡;朱君;蔡少仲;胡天明;;基于单词超团的文本聚类方法[J];计算机工程;2011年11期

8 周扬;屈武斌;卢一鸣;张成岗;杨毅;;基于文本频谱的中文文本聚类方法[J];四川大学学报(自然科学版);2012年06期

9 明均仁;;基于本体图的文本聚类模型研究[J];情报科学;2013年02期

10 赵世奇;刘挺;李生;;一种基于主题的文本聚类方法[J];中文信息学报;2007年02期

相关会议论文 前10条

1 赵世奇;刘挺;李生;;一种基于主题的文本聚类方法[A];第三届学生计算语言学研讨会论文集[C];2006年

2 王洪俊;俞士汶;苏祺;施水才;肖诗斌;;中文文本聚类的特征单元比较[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

3 胡吉祥;许洪波;刘悦;王斌;程学旗;;基于重复串的短文本聚类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

4 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

5 王明文;付剑波;罗远胜;陆旭;;基于协同聚类的两阶段文本聚类方法研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

6 张猛;王大玲;于戈;;一种基于自动阈值发现的文本聚类方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

7 王乐;田李;贾焰;韩伟红;;一个并行的文本聚类混合算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

8 王莹;刘杨;;维基百科的文本聚类方法分析[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

9 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年

10 章成志;;基于多语文本聚类的主题层次体系生成研究1)[A];国家自然科学基金委员会管理科学部宏观管理与政策学科青年基金获得者交流研讨会论文集[C];2010年

相关博士学位论文 前3条

1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年

2 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年

3 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年



本文编号:1875030

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1875030.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2cde9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com