基于地理情境的用户实时兴趣适配模型及个性化推荐方法研究
发布时间:2021-11-20 01:24
互联网的快速发展使得网络信息迅速增长,一方面海量的信息为用户提供了多样的信息选择的依据,另一方面互联网信息数量庞大、种类繁多,使得用户难以在海量的数据中快速找到自己实际需要的信息。个性化推荐系统的出现较好的解决了这类问题,协同过滤算法作为个性化推荐的核心,目前许多专家学者仍在进行持续的探索研究,本文考虑到协同过滤算法存在的冷启动和数据稀疏等问题,以及情境感知与协同过滤算法独立进行个性化推荐的特点,从用户角度出发,建立基于地理情境的用户兴趣模型,并提出一种混合协同过滤和关联规则的个性化推荐算法,以期提高个性化信息推荐服务的全面性和精准性。本文主要研究以下几个方面的内容:(1)通过对国内外情境感知、用户兴趣模型和个性化推荐系统的研究发现,用户的兴趣偏好跟用户当前行为、用户所处的地理情境有着密切关系。通过情境定义、情境分类以及情境感知的计算服务框架等研究,实现对情境的认知,在此基础上提出地理情境的概念、抽象表达等相关知识,最后阐述基于地理情境感知的三种个性化推荐技术模式,选择适合本文研究内容的推荐模式进行阐述说明。(2)用户兴趣偏好和用户行为每时每刻都处在变化的过程中,具有较强的动态性和实时...
【文章来源】:桂林理工大学广西壮族自治区
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
最近邻居生成
桂林理工大学硕士学位论文36表4.5传统CF和MT-UICF算法在各个邻居数目下的Precision值5101520253035404550传统CF0.43100.42980.43800.43950.39600.44030.46200.48800.40200.4198MT-UICF0.61060.53990.51200.50880.52030.53770.53830.55230.55300.5558表4.6传统CF、MT-UICF算法在各个邻居数目下Recall值5101520253035404550传统CF0.38200.40130.45000.48320.51030.55100.57460.60050.62300.6549MT-UICF0.47990.49300.51200.57200.60030.65100.68330.69050.70200.7132为了直观表示在不同邻居数目下两种算法的评价指标,将表4.3、4.4、4.5、4.6表示为图4.3的形式。图4.3两种算法在不同邻居数目下的RMSE、MAE、Precision、Recall值在(a)图中,随着近邻数目的增加,两种算法的RMSE的值一直趋于平缓的状态,但改进的MT-UICF算法的RMSE值均小于传统推荐算法的RMSE值,这说明基于MT-UICF的推荐算法相比较于传统推荐算法而言,改进的算法推荐效果更佳。在(b)图中,随着近邻数量的递增,改进的MT-UICF算法的MAE值均小于传统推荐算法的MAE值,这说明基于MT-UICF的推荐算法相比较于传统推荐算法而言,改进的算法具(a)(b)(d)(c)邻居方法Pre邻居方法Recall
桂林理工大学硕士学位论文38{f、g},{f、i},{g、i}。继续连接生成候选频繁3项集,包括{e、f、g},{e、f、i},{e、g、i},{f、g、i}共4组。此时第2轮迭代结束。图4.5地理场景-用户兴趣第二轮迭代③进入第3轮迭代,扫描数据集然后计算候选频繁3项集对应的支持度,然后进行剪枝,由于{e、f、g}、{e、f、i}和{e、g、i}的支持度只有0.25故被筛除,得到真正的频繁3项集为{f、g、i}。由于此时再无法继续进行数据连接,故迭代结束。图4.6地理场景-用户兴趣频繁项集结果④得到最终结果为频繁3项集{f、g、i}。4.2.2验证分析利用Python爬取阳朔县的POI数据,并根据POI签到数据获取微博用户行为数据并对爬取的数据进行预处理,利用R调包的方法进行关联分析,选取1w条数据进行训练。图4.7阳朔县部分POI数据C3{fgi}2{egi}1}e}{efi}1{efg}1interestsetsupportsupport{fgi}2interestset{fgi}interestsetC4L3C2L2{gi}2{fi}3{fg}2{ei}1{eg}2support{ef}1interestset{gi}3{fi}3{fg}3support{eg}2interestset{fgi}{efg}interestset{egi}{efi}C3
本文编号:3506284
【文章来源】:桂林理工大学广西壮族自治区
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
最近邻居生成
桂林理工大学硕士学位论文36表4.5传统CF和MT-UICF算法在各个邻居数目下的Precision值5101520253035404550传统CF0.43100.42980.43800.43950.39600.44030.46200.48800.40200.4198MT-UICF0.61060.53990.51200.50880.52030.53770.53830.55230.55300.5558表4.6传统CF、MT-UICF算法在各个邻居数目下Recall值5101520253035404550传统CF0.38200.40130.45000.48320.51030.55100.57460.60050.62300.6549MT-UICF0.47990.49300.51200.57200.60030.65100.68330.69050.70200.7132为了直观表示在不同邻居数目下两种算法的评价指标,将表4.3、4.4、4.5、4.6表示为图4.3的形式。图4.3两种算法在不同邻居数目下的RMSE、MAE、Precision、Recall值在(a)图中,随着近邻数目的增加,两种算法的RMSE的值一直趋于平缓的状态,但改进的MT-UICF算法的RMSE值均小于传统推荐算法的RMSE值,这说明基于MT-UICF的推荐算法相比较于传统推荐算法而言,改进的算法推荐效果更佳。在(b)图中,随着近邻数量的递增,改进的MT-UICF算法的MAE值均小于传统推荐算法的MAE值,这说明基于MT-UICF的推荐算法相比较于传统推荐算法而言,改进的算法具(a)(b)(d)(c)邻居方法Pre邻居方法Recall
桂林理工大学硕士学位论文38{f、g},{f、i},{g、i}。继续连接生成候选频繁3项集,包括{e、f、g},{e、f、i},{e、g、i},{f、g、i}共4组。此时第2轮迭代结束。图4.5地理场景-用户兴趣第二轮迭代③进入第3轮迭代,扫描数据集然后计算候选频繁3项集对应的支持度,然后进行剪枝,由于{e、f、g}、{e、f、i}和{e、g、i}的支持度只有0.25故被筛除,得到真正的频繁3项集为{f、g、i}。由于此时再无法继续进行数据连接,故迭代结束。图4.6地理场景-用户兴趣频繁项集结果④得到最终结果为频繁3项集{f、g、i}。4.2.2验证分析利用Python爬取阳朔县的POI数据,并根据POI签到数据获取微博用户行为数据并对爬取的数据进行预处理,利用R调包的方法进行关联分析,选取1w条数据进行训练。图4.7阳朔县部分POI数据C3{fgi}2{egi}1}e}{efi}1{efg}1interestsetsupportsupport{fgi}2interestset{fgi}interestsetC4L3C2L2{gi}2{fi}3{fg}2{ei}1{eg}2support{ef}1interestset{gi}3{fi}3{fg}3support{eg}2interestset{fgi}{efg}interestset{egi}{efi}C3
本文编号:3506284
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3506284.html