当前位置:主页 > 科技论文 > 搜索引擎论文 >

短文本相似性的改进及其在电商评论推荐中的应用

发布时间:2021-11-22 20:47
  在常用评论特征的基础上,提出了一种基于搜索引擎(如百度)的文本相似性方法获取评论与产品标题之间的相似性,并作为新的评论特征建立评论推荐模型。实验证明,引入评论与产品相似性特征可明显改进评论推荐机制的有效性,同时文本相似性评价的准确性可以借助搜索引擎得到较大提升。 

【文章来源】:工业工程与管理. 2019,24(05)北大核心CSSCI

【文章页数】:7 页

【部分图文】:

短文本相似性的改进及其在电商评论推荐中的应用


图3主题数目与对数似然率关系图

关系图,特征词,主题,标题


应用3.3获取特征向量(1)评论主题特征采用TF-IDF方法获取评论关键词后,应用LDA[15]方法,对整个评论集进行主题分析。本文以对数似然率为纵轴,得到其与评论集主题数量的关系如图3所示,由此确定当前语料库最佳主题数量为8。对每个主题下的特征词进行总结并命名,依次为:服务、功能、声音、使用、外观、物流、性价比、质量,LDA得到的词语交叉较为严重,借助word2vec[16]修正后结果如图4所示。图3主题数目与对数似然率关系图图4主题及部分特征词图(2)评论与产品标题相似性选择SimSE、Simhash[17]、基于《现代汉语分类词典》的相似性评价(SimilarityMeasurebasedonCidian,CD_Sim)[18]三种方法分别求解评论与产品标题相似性特征值,以作对比。(3)其余特征值选用汉语词法分析系统对文本进行分析,统计词性相关特征变量6个(名词数量、动词数量、形容词数量、副词数量、副形词数量、词性复杂度)。获取情感极性分值变量2个(积极情感分值、消极情感分值)。(4)向量归一化获取评论的各维度特征后,选择“最大值-最小值”归一化,消除量纲的影响。加入评论的获赞数作为预测变量,所得数据集示例如表2所示,示例中的相似性计算方法为SimSE方法。表2归一化后数据集示例特征评论1评论2评论3评论长度0.2310.2250.0

变量,实验结果


工业工程与管理第5期率、功能、图片数量、形容词数量、副形词数量、词性复杂度、评论长度、与产品标题相似性、性价比均对评论有效性有显著的正向作用,表明评论内容越丰富深刻,获赞数可能越高。评论时间对评论的有效性有显著的负向作用,意味着评论时间越早,获赞数具备越高的可能。图5LASSO变量压缩结果3.5实验结果对比以是否加入三种方法所得评论与产品标题相似性特征为变量,随机多次选取单个产品相关评论的80%(向下取整)作为训练集,其余评论作为预测集。对评论集中11个产品分别建立4种支持向量机模型,模型含义如表3所示。对于每个产品的评论集,将点赞数去重后降序排列,选择第10个值为边界将评论集分为两个子集,记为高赞评论集和其他评论集。由于点赞数与评论并非一一对应,因此,高赞评论集的元素个数一般大于10。表3四种模型的含义模型是否有相似性特征计算相似性的方法SVM否/SimSE-SVM是SimSESimhash-SVM是SimhashCD_Sim-SVM是CD_Sim选择平均绝对误差(MAE)、均方根误差(RMSE)、模型对高赞评论的预测查准率(P)及召回率(R)作为评价指标,取每种模型对11个产品相关评论多次K-折交叉验证的最优结果的均值,对比如表4所示。P=TPTP+FP(17)R=TPTP+FN(18)其中,TP表示“预测为高赞评论,实际为高赞评论”,FP表示“

【参考文献】:
期刊论文
[1]用户评论信息特征与信息采纳——产品涉入与社区涉入的不同调节作用[J]. 李雪,刘益,高伟.  情报科学. 2018(11)
[2]在线产品评论有用性识别方法研究[J]. 单晓红,张晓月,刘晓燕,贾盼盼.  北京工业大学学报(社会科学版). 2018(05)
[3]服务型产品在线评论信息特征对评论感知有用性与购买意愿的影响[J]. 李启庚,赵晓虹,余明阳.  工业工程与管理. 2017(06)
[4]基于分类词典的文本相似性度量方法[J]. 李海林,邹金串.  智能系统学报. 2017(04)
[5]基于奇异值分解的个性化评论推荐[J]. 余刚,王知衍,邵璐,胡舒悦,蔡毅.  电子科技大学学报. 2015(04)
[6]考虑观点多样性的评论选择问题[J]. 余文喆,沙朝锋,何晓丰,张蓉.  计算机研究与发展. 2015(05)
[7]供应商与客户智能协同决策规则识别研究[J]. 刘翔,范娇娇.  中国商贸. 2013(06)
[8]图像-文本相关性挖掘的Web图像聚类方法[J]. 吴飞,韩亚洪,庄越挺,邵健.  软件学报. 2010(07)

博士论文
[1]基于语义理解的意见挖掘研究[D]. 曹高辉.武汉大学 2010

硕士论文
[1]基于语义分析的文本相似性度量研究及应用[D]. 周萍.武汉工程大学 2017
[2]基于大数据平台的在线评论有效性模型的研究与实现[D]. 李凯.北京邮电大学 2017



本文编号:3512416

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3512416.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f3a6d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com