评论类网站的用户欺诈行为检测
发布时间:2022-01-22 09:16
评论类网站为用户提供了交流意见和分享观点的平台,群体评论意见往往反映物品的真实情况,这些功能帮助用户获取更多有价值的信息。例如在电子商务平台上,用户对购买的商品进行的评分或是文字评论可以帮助其他用户了解商家没有告知的商品信息,辅助用户做出选择。然而,部分商家为了商业目的让部分用户发表不实评论信息,夸大商品优点或是诋毁竞争对手的商品,甚至有商家通过众包平台,雇佣大量用户进行虚假评论,给评论类网站上的公平环境带来负面影响。因此,有必要对评论行为进行欺诈分析和检测。评论类网站上的欺诈行为检测存在几个困难:首先,用户对商品的认同感通常是个性化的,不同用户评分受个体因素影响较大;其次,个体用户的偏好也存在波动性,对相同质量的物品或服务的评价可能会因所处环境的差异而变化,并非每次评论行为均是客观公正的;再者,数据中缺少对评论行为的欺诈标记。理论上欺诈行为应该依据客观的标准和事实进行判定,而评论行为的主观性和随机性、以及动态性和数据量巨大等特点给欺诈行为的判定带来困难。针对这些问题,本文工作分别针对个体用户、用户群组和单次评论进行不同粒度的欺诈检测。针对欺诈用户的检测问题,本文提出了基于统计的异常行...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
整体框架图
定义2-2?(文本评论):是指用户对于特定商品以文字方式进行的功能描述以??及使用感受。??图2-2为Amazon数据集中用户单次文本评论长度分布,横轴表示文本长度,??纵轴表示对应长度的文本评论次数。可以看出在评论类网站中,单次文本评论长??度一般呈现长尾分布。??考衣X)0?!?!'?j?■;?t??SCfX??-??5C50C?iL??■?II:龜,??:、丨麗__'揉《??——?—????0?5DG?1000?1500?KXX)?21^-?SQ0G?4〇〇〇?-:500?SOOC??文本长度??图2-2?Amazon数据集中用户单次文本评论长度分布??定义2-3?(评论):是指用户对商品情况的总体反馈,一般可由多元组??表不,其中用户u属于用户集合[/,商品i属于商品集合/,w对i给??出的评分ruie?(0,5],tx代表文本评论,tm为此次评论产生的时间点。??从参与人数的表现形式上讲,欺诈行为可以分为异常与共谋两个特性。所谓??异常一般是指单个用户呈现出与他人甚至自身历史不同的行为。
(a)MovieLens数据集中用户评分分布?(b)Amazon数据集中用户评分分布??图2-1不同平台用户评分分布区别??定义2-2?(文本评论):是指用户对于特定商品以文字方式进行的功能描述以??及使用感受。??图2-2为Amazon数据集中用户单次文本评论长度分布,横轴表示文本长度,??纵轴表示对应长度的文本评论次数。可以看出在评论类网站中,单次文本评论长??度一般呈现长尾分布。??考衣X)0?!?!'?j?■;?t??SCfX??-??5C50C?iL??■?II:龜,??:、丨麗__'揉《??——?—????0?5DG?1000?1500?KXX)?21^-?SQ0G?4〇〇〇?-:500?SOOC??文本长度??图2-2?Amazon数据集中用户单次文本评论长度分布??定义2-3?(评论):是指用户对商品情况的总体反馈,一般可由多元组??表不,其中用户u属于用户集合[/,商品i属于商品集合/,w对i给??出的评分ruie?(0,5],tx代表文本评论,tm为此次评论产生的时间点。??从参与人数的表现形式上讲
【参考文献】:
期刊论文
[1]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
[2]聚类算法研究[J]. 孙吉贵,刘杰,赵连宇. 软件学报. 2008(01)
本文编号:3601935
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
整体框架图
定义2-2?(文本评论):是指用户对于特定商品以文字方式进行的功能描述以??及使用感受。??图2-2为Amazon数据集中用户单次文本评论长度分布,横轴表示文本长度,??纵轴表示对应长度的文本评论次数。可以看出在评论类网站中,单次文本评论长??度一般呈现长尾分布。??考衣X)0?!?!'?j?■;?t??SCfX??-??5C50C?iL??■?II:龜,??:、丨麗__'揉《??——?—????0?5DG?1000?1500?KXX)?21^-?SQ0G?4〇〇〇?-:500?SOOC??文本长度??图2-2?Amazon数据集中用户单次文本评论长度分布??定义2-3?(评论):是指用户对商品情况的总体反馈,一般可由多元组??表不,其中用户u属于用户集合[/,商品i属于商品集合/,w对i给??出的评分ruie?(0,5],tx代表文本评论,tm为此次评论产生的时间点。??从参与人数的表现形式上讲,欺诈行为可以分为异常与共谋两个特性。所谓??异常一般是指单个用户呈现出与他人甚至自身历史不同的行为。
(a)MovieLens数据集中用户评分分布?(b)Amazon数据集中用户评分分布??图2-1不同平台用户评分分布区别??定义2-2?(文本评论):是指用户对于特定商品以文字方式进行的功能描述以??及使用感受。??图2-2为Amazon数据集中用户单次文本评论长度分布,横轴表示文本长度,??纵轴表示对应长度的文本评论次数。可以看出在评论类网站中,单次文本评论长??度一般呈现长尾分布。??考衣X)0?!?!'?j?■;?t??SCfX??-??5C50C?iL??■?II:龜,??:、丨麗__'揉《??——?—????0?5DG?1000?1500?KXX)?21^-?SQ0G?4〇〇〇?-:500?SOOC??文本长度??图2-2?Amazon数据集中用户单次文本评论长度分布??定义2-3?(评论):是指用户对商品情况的总体反馈,一般可由多元组??表不,其中用户u属于用户集合[/,商品i属于商品集合/,w对i给??出的评分ruie?(0,5],tx代表文本评论,tm为此次评论产生的时间点。??从参与人数的表现形式上讲
【参考文献】:
期刊论文
[1]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
[2]聚类算法研究[J]. 孙吉贵,刘杰,赵连宇. 软件学报. 2008(01)
本文编号:3601935
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3601935.html