大数据环境下面向邻域粗糙计算流式并行化研究与应用
发布时间:2022-02-14 19:52
随着技术和科技的发展,数据量有了爆炸式的增长,在海量数据中用户无法及时获得自己感兴趣的信息,推荐系统能有效解决这个问题。它根据用户的历史数据,将用户感兴趣的信息推荐给用户。但是传统推荐系统中大部分使用的是离线数据集,它按照一定时间(一般是以天为周期)来对数据进行分析,无法保证推荐系统的实时有效性。现今实时数据流越来越多,这也造成在推荐系统中需要处理的实时数据需求越来越多。同时传统的推荐系统还存在冷启动问题,提供给新用户的推荐内容准确性较低,导致用户的体验较差。本文将双论域邻域粗糙集理论运用在推荐系统中,提高推荐系统冷启动准确性;通过构建实时推荐系统,实时处理数据,来解决传统推荐系统实时性低的问题。论文具体的研究工作情况如下:(1)论文为了解决推荐系统的冷启动问题,采用双论域邻域粗糙模型进行偏好挖掘,提高推荐准确性。在双论域邻域粗糙集模型中,推荐系统的数据集是由用户和商品两个数据域所构成的,而通过用户对商品的评分这种映射关系来提高冷启动问题的准确性。(2)论文在面对评分映射具有不同含义的情况,运用矩阵分解模型构建基础评分线,通过基础评分线来表达实际情况中喜欢和不喜欢两种情绪。同时将评分映...
【文章来源】:电子科技大学四川省211工程院校985工程院校教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
Storm计算任务拓扑图
Spark流计算框架
Flink并行度数据流图
【参考文献】:
期刊论文
[1]基于Apache Storm的大规模网络流量实时监控系统研究[J]. 姚欣,王劲松. 天津理工大学学报. 2016(06)
[2]基于Storm的实时计算框架的研究与应用[J]. 李川,鄂海红,宋美娜. 软件. 2014(10)
[3]基于邻域模型的K-means初始聚类中心选择算法[J]. 曹付元,梁吉业,姜广. 计算机科学. 2008(11)
[4]基于邻域粗糙集与支持向量机的油层识别研究[J]. 孙涵,诸克军. 计算机工程与应用. 2008(30)
[5]一种基于并行遗传算法的粗糙集属性约简[J]. 吕跃进,刘南星,陈磊. 计算机科学. 2008(03)
[6]属性序下的快速约简算法[J]. 胡峰,王国胤. 计算机学报. 2007(08)
[7]一种基于垂直分布的多决策表全局属性核求解算法[J]. 杨明,杨萍. 控制与决策. 2006(09)
博士论文
[1]邻域粒化粗糙计算的关键技术研究与应用[D]. 曾凯.电子科技大学 2015
[2]混合数据知识发现的粗糙计算模型和算法[D]. 胡清华.哈尔滨工业大学 2008
硕士论文
[1]大数据流的实时处理研究[D]. 徐飞.江南大学 2015
本文编号:3625169
【文章来源】:电子科技大学四川省211工程院校985工程院校教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
Storm计算任务拓扑图
Spark流计算框架
Flink并行度数据流图
【参考文献】:
期刊论文
[1]基于Apache Storm的大规模网络流量实时监控系统研究[J]. 姚欣,王劲松. 天津理工大学学报. 2016(06)
[2]基于Storm的实时计算框架的研究与应用[J]. 李川,鄂海红,宋美娜. 软件. 2014(10)
[3]基于邻域模型的K-means初始聚类中心选择算法[J]. 曹付元,梁吉业,姜广. 计算机科学. 2008(11)
[4]基于邻域粗糙集与支持向量机的油层识别研究[J]. 孙涵,诸克军. 计算机工程与应用. 2008(30)
[5]一种基于并行遗传算法的粗糙集属性约简[J]. 吕跃进,刘南星,陈磊. 计算机科学. 2008(03)
[6]属性序下的快速约简算法[J]. 胡峰,王国胤. 计算机学报. 2007(08)
[7]一种基于垂直分布的多决策表全局属性核求解算法[J]. 杨明,杨萍. 控制与决策. 2006(09)
博士论文
[1]邻域粒化粗糙计算的关键技术研究与应用[D]. 曾凯.电子科技大学 2015
[2]混合数据知识发现的粗糙计算模型和算法[D]. 胡清华.哈尔滨工业大学 2008
硕士论文
[1]大数据流的实时处理研究[D]. 徐飞.江南大学 2015
本文编号:3625169
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3625169.html
最近更新
教材专著