大数据环境下面向邻域粗糙计算流式并行化研究与应用

发布时间:2022-02-14 19:52
  随着技术和科技的发展,数据量有了爆炸式的增长,在海量数据中用户无法及时获得自己感兴趣的信息,推荐系统能有效解决这个问题。它根据用户的历史数据,将用户感兴趣的信息推荐给用户。但是传统推荐系统中大部分使用的是离线数据集,它按照一定时间(一般是以天为周期)来对数据进行分析,无法保证推荐系统的实时有效性。现今实时数据流越来越多,这也造成在推荐系统中需要处理的实时数据需求越来越多。同时传统的推荐系统还存在冷启动问题,提供给新用户的推荐内容准确性较低,导致用户的体验较差。本文将双论域邻域粗糙集理论运用在推荐系统中,提高推荐系统冷启动准确性;通过构建实时推荐系统,实时处理数据,来解决传统推荐系统实时性低的问题。论文具体的研究工作情况如下:(1)论文为了解决推荐系统的冷启动问题,采用双论域邻域粗糙模型进行偏好挖掘,提高推荐准确性。在双论域邻域粗糙集模型中,推荐系统的数据集是由用户和商品两个数据域所构成的,而通过用户对商品的评分这种映射关系来提高冷启动问题的准确性。(2)论文在面对评分映射具有不同含义的情况,运用矩阵分解模型构建基础评分线,通过基础评分线来表达实际情况中喜欢和不喜欢两种情绪。同时将评分映... 

【文章来源】:电子科技大学四川省211工程院校985工程院校教育部直属院校

【文章页数】:80 页

【学位级别】:硕士

【部分图文】:

大数据环境下面向邻域粗糙计算流式并行化研究与应用


Storm计算任务拓扑图

大数据环境下面向邻域粗糙计算流式并行化研究与应用


Spark流计算框架

大数据环境下面向邻域粗糙计算流式并行化研究与应用


Flink并行度数据流图

【参考文献】:
期刊论文
[1]基于Apache Storm的大规模网络流量实时监控系统研究[J]. 姚欣,王劲松.  天津理工大学学报. 2016(06)
[2]基于Storm的实时计算框架的研究与应用[J]. 李川,鄂海红,宋美娜.  软件. 2014(10)
[3]基于邻域模型的K-means初始聚类中心选择算法[J]. 曹付元,梁吉业,姜广.  计算机科学. 2008(11)
[4]基于邻域粗糙集与支持向量机的油层识别研究[J]. 孙涵,诸克军.  计算机工程与应用. 2008(30)
[5]一种基于并行遗传算法的粗糙集属性约简[J]. 吕跃进,刘南星,陈磊.  计算机科学. 2008(03)
[6]属性序下的快速约简算法[J]. 胡峰,王国胤.  计算机学报. 2007(08)
[7]一种基于垂直分布的多决策表全局属性核求解算法[J]. 杨明,杨萍.  控制与决策. 2006(09)

博士论文
[1]邻域粒化粗糙计算的关键技术研究与应用[D]. 曾凯.电子科技大学 2015
[2]混合数据知识发现的粗糙计算模型和算法[D]. 胡清华.哈尔滨工业大学 2008

硕士论文
[1]大数据流的实时处理研究[D]. 徐飞.江南大学 2015



本文编号:3625169

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3625169.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d67dd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com