基于影评数据的在线评论有用性影响因素研究
本文关键词:基于影评数据的在线评论有用性影响因素研究,由笔耕文化传播整理发布。
第13卷第8期 2010年8月
管理科学学报
JOURNAL OF MANAGEMENT SCIENCES IN CmNA
V01.13 No.8 Aug.2010
基于影评数据的在线评论有用性影响因素研究①
郝媛媛,叶强,李一军
(哈尔滨工业大学管理学院,哈尔滨150001)
摘要:面对互联网上海量的在线客户评论,如何能快速有效地进行识别和选择从而发现和利 用其中有用的评论,已经成为人们关注的重要问题.以体验型商品电影的在线评论为研究对 象,结合文本挖掘技术和实证研究方法,从文本特征出发探索影响在线评论有用性的因素,建 立在线评论有用性影响因素模型,并利用该模型对评论有用性进行分类预测.与现有相关研究 相比,提出的模型总体拟合效果显著提高,并发现在线影评中积极的情感倾向、较高的正负情 感混杂度、较高的主客观表达混杂度以及较长的平均各句长度,对评论的有用性具有显著的正 面影响.最后预测结果表明,该模型对在线影评的有用性具有较强的判别能力. 关键词:口碑;在线评论;有用性;文本特征;正负情感;主客观表达形式;文本挖掘
中图分类号:F713.55 文献标识码:A 文章编号:1007—9807(2010)08—0078一ll
0
引
言
息搜索成本.尽管如此,评论文本信息仍然是人们 决策的重要参考源,很多评论阅读者仍需通过查 看评论文本来了解产品好坏的具体方面,如对
Yahoo!Movies网站(movies.yahoo.eom)上影评
口碑(word-of-mouth)是个体间关于产品或服 务看法的非正式传播方式….消费者行为及营销 领域的众多研究u一1均表明,口碑传播对消除购 买者的不确定性,辅助其做出有效决策具有重要 作用(特别是在体验型商品购买决策过程中).现 今,互联网强大的信息存储和搜索功能为口碑的 交流提供了极大的方便,更多人在网上论坛、聊天 室、博客和专门的商品评论网站等网络空间发表 和共享有关商品的评论,为消费者提供了丰富的 决策参考信息(特别是专门的商品评论网站上展
示了更为集中和全面的商品评论,本文的研究即
有用性评价信息的统计结果显示:对于多数电影, 其所有评论中平均至少有52%的评论的文本被 阅读过.在线评论的文本内容可长期存储并累积 下来,可为人们提供海量的信息资源,但并非所有 评论都有价值,由于网络的匿名性、非面对面地接 触、沟通成本低廉等特征¨J,评论的质量往往良 莠不齐,一些评论者会不负责地随意发表评论.评 论信息的过载及其质量的参差不齐严重干扰了评 论阅读者对商品质量的有效判断,增加了信息搜 索成本,降低了决策效率.因此,及时有效地识别 在线评论文本中有价值的信息对提高消费者的决 策效率和效果至关重要.目前,一些网站提供评论 的有用性评价信息来帮助评论阅读者识别评论的 价值.但该指标需要长时间累积,无法及时提供最 新发布的评论的有用性信息,应用效果欠佳[6].
主要针对这类在线评论).但与此同时,也带来了 信息大爆炸时代的普遍问题:面对海量评论,评论 阅读者可能“迷失”其中,无法有效识别和利用其 中有价值的信息来判断商品的真实质量.
针对这个问题,一些评论网站提供评论者对
商品总体评分的信息,以帮助人们无需阅读评论 文本即可了解评论者对商品的总体评价,降低信
①收稿日期:2008—10—13;修订日期:2009—07—15.
基金项目:国家自然科学基金资助项目(70771032;70890080—70890082)
作者简介:郝媛媛(198l一),女,黑龙江哈尔滨人,博士生.Email:haoyy0112@163.咖
万方数据
第8期
郝媛嫒等:基于影评数据的在线评论有用性影响因素研究
一79一
因此,有必要从评论的文本特征出发,挖掘影响在
指出,人们更倾向于发表或关注极端评论而不是 中间评论,因为对产品极端正向或负向的体验更 容易引发口碑交流行为.Ghose和Ipeirotis¨1在研
究中设置了哑变量来考察极端评论与中间评论对 评论有用性影响的差异,结果发现极端评论的有 用性评价高于中间评论.另外一些学者进一步认 为极端评论中正向评论与负向评论的影响亦存在
线评论有用性的重要特征,以实现在评论发布后 即能自动识别评论有用性.
目前,尽管文本挖掘技术的重大进展使文本
中情感特征的自动识别成为可能,但将文本挖掘 技术和基于理论的实证研究相结合,从文本特征 角度探索在线评论有用性影响因素的研究较为缺 乏.国内研究的重点主要集中在对网络口碑的研 究现状进行综述(如文献[7—8]),或研究网络口 碑文本挖掘技术(如文献[9]),或探讨口碑传播 的内在机制及传播意愿(如文献[10—13]),或从
商家视角探索网络口碑与口碑效应或购买意愿的
差异.在传统口碑传播的研究中,很多学者曾指出
负向口碑比正向口碑更影响人们的决策,并运用
不同理论解释人们更关注负向口碑的原因:如心 理学领域有关印象形成的研究¨列发现,人们在对
某一对象进行评价的心理过程中,会对有关被评
关系(如文献[14—17]),而从客户角度探讨什么 样的评论对消费者决策更有帮助的研究基本空白.
而国外这类研究刚刚起步,Ghose和Ipeirotis【6J初探 性的研究主要针对搜索型商品(如视听播放器、
价对象的负面信息赋予高于正面信息的权重,这 是因为人们在面对正面和负面消息或事件时的反
应强度是不同的,负面消息给人们的心理唤醒、注
意、情绪、评价、归因以及社会行动等反应所造成 的刺激都要强于正面信息.在营销领域,Ahluwalia 等啪1发现,消费者通常会认为负面信息比正面 信息更具诊断价值,因而在购买决策时更多地依 赖负面信息.而近年,比较不同类别商品正负面口
碑影响的一些研究则得出相反的结论,如Sen和
数码相机等),分析评论的主客观倾向及主客观 混杂度对商品评论有用性的影响.尽管Ghose等 做出了有益尝试,但仍存在以下问题:1)仍有影 响评论有用性的重要因素未纳入到模型中,这影 响了模型预测力的提高.2)模型中仅将评论正负 情感倾向分为极端评论与中间评论两类进行考 察,而未进一步分离并考察极端评论中正面和负 面情感对评论有用性的影响是否存在差异.3)仅
研究了搜索型商品在线评论的有用性,研究成果
Lerman¨川对体验享乐型和实用性两类商品的实 证结果表明在线评论的不同情感倾向对评论有用
性的影响确实存在差异,不过是正向评论的影响
更大,且对于体验享乐型商品,其负向评论的有用 性要低于实用型商品.一些理论支持了体验型商
品负向评论影响不大的结论:如Adaval瞄。提出了
是否可推广至体验型商品有待验证.
因此,基于现实中对及时有效地识别在线评
论有用性的迫切需要,在Ghose等已有研究基础 上,本文以体验型商品——电影为研究对象,进一 步考察正面和负面情感对评论有用性影响的差 异,并发掘影响评论有用性的其他重要文本特征 因素,建立拟合度更高的评论有用性影响因素模
型,帮助消费者更准确及时地识别评论有用性,提
情感一致性理论,他发现,当潜在消费者评判商品 的体验属性时,往往对与自己心情一致的属性信
息给予更大权重.当消费者阅读体验型商品的评
论时往往怀着正向的预期和心情(希望选择一种 使其心情愉悦的商品),而负向评论与消费者当
时正向的心理预期恰恰相反,因此负向信息对消
高决策效率和效果.
费者决策的影响被降低.另一种从决策过程角度
出发的解释是,实用型商品购买的主要目标是效
理论基础及假设的提出
1.1评论的正负情感与评论有用性 一些学者的研究表明评论的正负情感影响着
用最大化旧J,而用于效用判断的商品属性标准都
是明确、可感知、客观的,因此人们可以依赖已消
费者的口碑反馈来了解商品的这些属性;而对体 验型商品的评价则复杂得多,消费者追求的目标 是对获得某种更高层次价值的预期的最大化ⅢJ, 实现何种价值以及对价值的预期在个体消费者之 间存在重大差异,很难有公认的判别标准.既然一
消费者对评论价值的感知,不同正负情感的评论 发表的比例和受关注的程度均可能存在差异,从
而导致评论有用性存在差异.如Dellarocas等…1
万方数据
一80一
管理科学学报
2010年8月
些人对体验型商品的负向评价不一定被其他阅读 者认可,而评论阅读者对这类商品的预期往往又 倾向于正面,因此,对于体验型商品,负向评论对 人们决策的参考价值被减弱.Sen和Lerman悼刈基
于归因理论(attribution theory),从评论者发表评
Duhan等的定义,将评论的观点句中客观表达形 式的句子(简称objective expression)定义为:一般 以陈述的语句,采用第3人称语气,客观地评述商 品总体或其各属性特征,这类评论句的表达通常 与影评专家影评的表达形式相近,例如,“The
animation has improved quite lady realistic to
were
a
论的动机的角度解释和验证了关于体验型商品的 负向评论影响减弱的原因:对于体验型商品,消费 者更倾向于把评论者发表负向评论的动机归因于 与个人相关而非与商品本质相关,因而认为负向 评论缺乏可信性.借鉴Ghose和Ipeirotis旧。对所研 究的评论文本特征选择了平均值(反映特征倾向 的集中趋势)和标准差(反映特征的混杂程度)两 个指标,本文也同时考察各文本特征的均值及标 准差对有用性的影响,其中,评论正负情感混杂度 可能正向反映评论的客观性,因此预期该指标对 评论有用性的影响为正.综合以上理论阐述,提出
假设H1.
lot and is spectacu—
watch.The
music and sound effects
also buzzing with delightful
energy.”.而评论
的观点句中主观形式表达的句子(简称subjective expression)定义为:除客观表达形式之外的通常 采用第1人称语气,带有很强个人主观色彩的观 点评述,例如“For
We
children with
no
US,ICE AGE2 is
a
greatest film.
love Sid with big eyes!”。“terrible.even small understanding of what poor acting is if poorly
will think this movie
acted.”.如前所述,
特别是对于体验型商品,每个人的观点可能千差 万别,个人观点不一定被其他评论阅读者接受.而 如果以较为中立的口气来客观评述电影各个方面
的好坏,要比试图将主观情感好恶强加于人要更
H1在线评论内容的正负情感对评论有用 性存在影响.其中: H1—1评论内容的平均正向情感倾向对评 论有用性存在正向影响.(即评论的正向情感倾 向越大,评论的有用性越高). HI一2评论内容的正负情感混杂度对评论 有用性存在正向影响.
1.2评论中观点的表达形式与评论有用性 对采集的在线影评数据的文本特征进一步分 析发现,在评论中,观点评价的内容在表达形式上
具有说服力.另外,评论表达形式的混杂度同样可 能正向反映评论的客观性.因此,本文提出以下假 设H2.
H2在线评论内容中观点句的主观与客观
表达形式对评论有用性存在影响.其中: 112—1评论内容中观点句的平均主观表达 倾向对评论有用性存在负向影响.(即评论主观 表达的倾向越大,评论有用性越低). H2-2评论内容中观点句的主客观表达形 式的混杂度对评论有用性存在正向影响.
1.3评论的体裁与评论有用性
也存在很大差别,有用性较高的评论中采用客观 形式表达的句子更多,观点句的主观与客观表达 形式对评论的有用性的影响可能存在差异.营销 领域中,Duhan等Ⅲ1曾对口碑的主客观表达形式 相关概念做过相应的界定,他们将口碑分为“小
fective
在机器语言学习研究领域,Pang和LeeⅢo从 评论文本体裁的角度将文本内容分为客观 (objectivity)和主观(subjectivity)两类,并提出了 识别这两类文本内容的机器自动分类技术.其中, 客观的文本内容被定义为:评论者对商品特征或 属性做出的与商家描述一致或不一致的描述;而 主观的文本内容被定义为:评论者对商品的主观 态度或情感的表达,这类文本内容不会出现在商 家的商品描述信息中.为与前面提出的主客观表 达形式文本特征相区别,对从文本体裁角度将文 本内容分成的两类内容称为“观点评价”和“客观 描述”.Ghose和Ipeirotis∞o进一步研究了这两类
cues”和“instrumental cues”两类内容,其中
“affective
cues”定义为基于购买者内在主观标准
(如美感、艺术效果等)的评价;“instrumental
cues”定义为基于产品属性的客观评述.Duhan等
揭示了主客观表达形式的重要区别,即客观表达 形式的口碑中包含更多的评述产品属性的内容. 而在分析中发现,文本评论的表达方式(如语气 和用词等)都会影响评论者的主客观表达效果.
如评论“a
see
must
see
film.”在表达上要比“you
must
it!”更客观,更容易让人接受.因此,借鉴
万方数据
第8期
郝媛媛等:基于影评数据的在线评论有用性影响因素研究
一81一
文本体裁对视听产品和数码相机两种商品在线评
论有用性的影响,结果发现这些商品评论中平均
有用性存在正向影响. H5在线评论标题的观点评价倾向对评论
有用性存在正向影响.
观点评价倾向越大(即观点评价的内容越多),评 论有用性越低,而既有观点评价又有对商品的客 观描述,两类信息越混杂,评论的有用性越高.对 于体验型商品来说,Nelson曙¨指出这类商品的主 要属性通常不易判断,需要通过体验才能获知.这 样,对于体验型商品,商品客观描述不足以帮助人 们判断其真实质量,而其他用户的主观感受和评 价对其决策的影响增大.另外,无论对于什么类型 的商品,既包含观点评价又包含客观描述的评论 更全面地反映了商品的质量,对消费者决策的影 响更大.因此,本文提出假设H3.
I-13在线评论内容中客观描述和观点评价
H6在线评论标题中观点句的主观表达倾 向对评论有用性存在负向影响.
1.5其他控制变量与评论有用性
Ghose和Ipeirotisl61在其研究中加入了评论
发布天数和评论可读性两个控制变量.实际上,评 论发布天数越长,对电影关注的热度可能会逐渐 减弱,因此电影的评论被关注并被评价的可能性
就会降低,因此本文初步认为评论发布天数对评 论有用性存在负向影响.对于评论可读性,Ghose 等认为阅读评论的认知成本(评论的可读性)会 影响评论有用性,并以评论中平均每句长度作为 可读性代理指标,结果发现评论可读性对评论有 用性存在正向影响,与其初始理论解释相反,两者 的关系有待进一步检验.因此,本文提出假设H7
和H8.
两类体裁对评论有用性存在影响.其中:
H3-1
评论内容的平均观点评价倾向对评
论有用性存在正向影响(即评论的观点评价倾向 越大,评论有用性越高).
H3-2评论内容中观点评价与客观描述的
I'I'/在线评论发布天数对评论有用性存在 负向影响.
H8在线评论内容中平均句子长度对评论 有用性存在影响.
混杂度对评论有用性存在正向影响.
1.4评论标题与评论有用性
对于在线评论,文本内容可细分为评论标题 和评论内容(即正文)两部分.在Ghose和Ipeirotis
的研究№1中,评论标题并未被列为评论文本来加
2在线评论有用性影响因素模型
基于以上理论假设,建立在线评论有用性影
响因素模型(见公式(1)).以在线评论的文本特
以考察.而评论标题也可能对评论总体有用性存 在影响,因为:网上评论与网下口碑传播的显著差 异是网下口碑往往是被动接受,而网上评论必须 经过消费者主动搜索才能获得,这种主动获取信
息的方式使消费者可以自主挑选感兴趣的评论而
征——评论内容的正向情感倾向、观点评价倾向 概率及观点句中主观表达倾向概率的平均值和标 准差,以及评论标题的正向情感倾向概率、观点评 价倾向概率、主观表达倾向概率的平均值作为自 变量,对评论有用性进行回归.其中,采用网站上
提供的认为该评论有用的投票数和总投票数相除
有选择地进行阅读.帮助其初步判断评论是否值
得进一步阅读的重要工具就是评论的标题,标题
是正文内容的概括和宣传广告,评论标题具有吸 引力,才有可能进一步引发消费者阅读评论内容 的行为.基于以上经验总结,本文认为,不被关注
即无法产生影响,评论标题影响着评论内容被阅 读并产生影响的可能性,因而影响着消费者对评
得到的比例值作为评论有用性的代理指标.而对 于评论对特定商品的正向情感倾向,采用网站上 该条评论对商品的打分作为代理指标,而不采用
机器挖掘方法得到的概率值,主要考虑是:评论者
论有用性的评价.对于标题文本特征的影响方向, 我们预期与评论正文文本特征的影响方向一致.
因此,提出假设H4一H6.(评论标题通常较短,仅
打分是最为原始的数据,比由机器学习估算出的
概率更准确客观.参考Ghose和Ipeirotis的研 究[6 J,评论有用性、评论发布天数以及可读性均
有一句的标题占多数,故不考虑混杂度指标.) H4在线评论标题的正负情感倾向对评论
采用常用对数形式.各变量的符号及解释见表1.
万方数据
一82一
管理科学学报
2010年8月
Log(Helpful)kr=a+口l(Rating)kr+岛(DevPos)kr+卢3(AvgSub)h+角(DevSub)h+ 卢5(AugSubExp)h+卢6(DevSubExp)kr+JB7(title_AvgP05)kr+卢8(title_AvgSub)h+ 岛(title_AvgSubExp)h+卢10Log(Elapseddays)kr+卢11Log(Read)h+占kr
表1
Table
1
(1)
模型中各变量代表符号及解释
Explanations
for variables in the model
变量
解释 评论有用性比例(有用的投票数/总投票数)(常 用对数形式)
变量
解释
LoS(Hetpfq)h
(DevSubgxp)h
商品k评论r观点句中主观表达倾向概率的
标准差
(Rating)h (DevPos)h (AvgSub)h (DevSub)h
商品k评论r内容的正负情感倾向打分 商品k评论r内容的正向情感倾向概率的标准差 商品&评论r内容的观点评价倾向概率 商品k评论r内容的观点评价倾向概率的标准差 商品k评论r平均句子长度(评论中单词总数/句
(AvgSubExp)kr (title_AvgPos)h (tige.AvgSub)kr (title_,4vgSubExp)h Log(Elapseddays)kr
商品k评论r观点句中主观表达倾向概率
商品k评论r标题的正向情感倾向概率
商品k评论r标题的观点评价倾向概率
商品k评论r标胚的主观表达倾向概率 商品k评论r发表时间距商品发布日的天数 (常用对数形式)
Log(Read)h
子个数)(常用对数形式)
表电影从其发布至影院放映结束这段时间的影评 3
3.1
研究数据及文本特征识别方法
研究对象
数据,包括各个评论的正负情感倾向打分、发布时 间、有用性评价、标题、正文内容.其中,评论的有 用性评价指由一些消费者在阅读评论后对该评论
是否有用做出投票,然后评论网站将累计的有用
通过对本校市场营销学科教授的访谈,形成 包括小说、音箱、化妆品、电影等8种体验型商品
的候选商品列表.然后,根据Nelson的量表旧7 o设
性评价信息以投票总人数中多少人认为有用的形
式呈现给后来的评论阅读者.
计了一道反映商品体验性需求的测项(“您认为 在购买前无需试体验,仅根据网上对该商品的描 述性信息(非买家评论)容易评估其品质吗?l非 常容易……5非常难),并随机邀请本校的10名 在校大学生对列表中所有候选商品进行打分.结 果显示,被试者对化妆品及电影的体验性需求最 强.最后,选取电影作为体验型商品进行下一步的
实证分析,主要原因是:电影是人们公认的受口碑
通常情况下,电影发布后1个月内影评发布 密集,人们对评论的关注度和评价也较为集中.鉴 于后期的一些评论未被评价可能是由电影受关注 程度降低导致的,后期有用性评价的数据实际上 无法客观地反映评论本身的质量,本文主要考察 14个样本电影发布后1个月内的评论.另外,一些 评论的有用性评价总票数为1(即仅有1人评 价),考虑到这些评论的评价人数过少,得到的有 用性评价指标值的代表性差,因此,剔除有用性评 价总票数为l的评论.最后,共得到1 686个影评
样本用于模型检验.
3.3
影响较大的商品;另外,电影是典型的体验型商 品,目前研究体验型商品的文献大多选取电影为 研究对象,本文以同一种商品进行研究,有利于研
究结果的比较和验证. 3.2研究数据
文本特征识别方法
模型中,多数评论文本特征的识别均采用机 器文本挖掘分类工具LingPipe(可在WWW.alias。i. com/lingpipe下载)来实现,应用步骤如下:利用 Java编程使用其动态语言模型构造相应的分类 器,用人工标注好类别的文本语料进行训练,然后 选用其他测试样本对分类效果进行评估,最后利 用训练好的分类器对未知类别的文本进行情感分 类和倾向概率的计算.
本研究所需的数据均通过Java程序自动抓 取和解析网页获得.在线影评数据来自美国著名
的Yahoo!Movies影评网站(movies.yahoo.
eom):首先在2006年度票房排行前500名电影 中,对动画、喜剧、恐怖、惊悚、战争、冒险、科幻7 类主要题材分别随机抽取了2部电影作为代表电 影,然后在Yahoo!Movies网站上抓取这14个代
万方数据
第8期
郝嫒嫒等:基于影评数据的在线评论有用性影响因素研究
一83一
本文中文本特征识别所需的训练及测试样 本主要有两个来源:一是研究者提供的语料库,
Yahoo!Movies网站上除用于14个电影样本外的其
他电影评论中,选取正向和负向评价语句各400个作 为正负情感的训练及测试语料.
基于相应的训练语料,对本研究构造的观点
二是Yahoo!Movies网站上除14个电影样本外
其他电影的评论数据.具体的选取过程如下:1) 对于评论文本观点评价/客观描述的分类,根据 前述的定义,采用Pang和Lee提供的电影剧情
评价/客观描述、正负向情感、观点句中主客观表
达3个分类器分别进行训练,然后利用相应测试
描述训练语料库(http://www.cs.cornell. edu/people/pabo/movie—review-data/)中800个
电影剧情介绍文本作为本研究中电影评论客观描述
语料评估分类器的分类准确率,所得准确率分别 为:85.15%,83.34%,78.71%,说明3个分类器 的分类效果良好.
4
信息的训练及测试语料(其中2/3的数据用作训练, 其余1/3用作测试,以下其他文本特征的训练样本和 测试样本的分配与此相同);从Yahoo!Movies网站 上除14个电影样本外的其他电影评论中,剔除其中 剧情描述及主客观模糊的句子,筛选出765个观点评 价句作为电影观点评价信息的训练及测试语料.2) 对于评论观点句的主客观表达形式的分类,根据前
述的定义,从Yahoo!Movies网站提供的大型影评机 构的影评中,随机选取500个专家评论文本作为影评 客观表达信息的训练及测试语料;从Yahoo!Movies 4.1初步统计分析 模型中各变量基本均可被视为连续变量,描 述性统计分析结果见表2.
模型结果分析
为在初步分析中更为清晰地呈现评论情感倾 向与评论有用性的关系,将连续变量——评论有 用性评价指标及电影正负情感打分进行离散化分 类:对评论有用性评价以0.5为分界值将评论分
为“有用”、“没用”两类;另外,Yahoo!Movies网
网站上除14个电影样本外的其他电影评论中筛选出 500个带有强烈个人色彩的主观表达句作为电影主 观表达信息的训练及测试语料.3)对于影评的正负
情感分类,由于Yahoo!Movies网站对于每个影评都 有正负情感倾向的打分,因此不用采用文本挖掘方
站评论中的电影正负情感评分采用A—F 5个大等 级,除F等级外,每个大等级下又分为3个小等 级,我们将13个等级合并为3类,即好评(A+
.B.)、中评(C+.C-)、差评(D+-F),对样本中3
法对影评的正负情感倾向概率进行计算,但影评的 正负情感混杂度仍需借助文本挖掘方法来求得,从
表2
Table 2
Descriptive statistics
类情感倾向的评论有用性评价数量及比例情况进
行初步统计,结果见表3.
of variables
in the
模型中各变量的描述性统计
model
变量 (Helpful)ix (Rating)kr (DevPos)h (AvgSub)h (DevSub)b (AvgSubExp)h (DevSubExp)kr (title_AvgSub)h (title AvgSubExp)h (title AvgPos)h (Read)h (Elapseddays)kr
有效观测值
l 1 1
均值
0.64 9.07 O.32 0.87
O.17
标准差
O.26
最小值
0.03
最大值
1
686 686
67l
4.29
l O
13
O.50
0.17
O.17
1 1
680 680
O O 0 0
0
l
O.19 0.3l 0.19 0.22 0.47 0.44 9.41 15.62
0.57 l O.50
l
l l
668 668
686
0.45 O.3l 0.94 0.46 O.56 15.56
l l
686 686 671 686
O O O 1
l
1
l l 1
92 30
7.64
万方数据
一84一
裹3
Table 3
管理科学学报
三类情感倾向评论的有用性评价统计
usefolness for three attitude
orientations reviews
2010年8月
Statistics of
评论情感倾向 总观测样本 差评(F—D+) 评论有用 性评价 没用 有用 246(70.90%) 101(29.I%) 347(100%) 中评(C~C+) 118(68.6%) 54(31.4%) 172(100%)
1
好评(B—A+) 41I(35.2%) 756(64.8%) 167(100%)
1
775(46%) 911(54%) 686(100%)
总观测样本
注:括号中的比例值为有用或没用的相应评论情感倾向类的评论数量与所有这类评论情感倾向的评论数量的比值.
由表3可见,对于样本中带有有用性评价的
l
一1合理,即在线影评对电影情感评分越趋于正
向,越会被认为有用. 模型结果分析
686个评论,电影好评的数量(1 167个)远远超
过差评(347个)和中评(172个),反映了不同情4.2
感倾向评论分布呈J形偏态结构,这与以往多数 研究的分析结果一致.其中,被评为有用的评论在 好评中所占的比例为64.8%,在差评中占比 29.1%,在中评中占比31.4%.可初步判断,对倾
向于好评的评论更可能被评为有用.
评论内容的平均观点评价倾向(AvgSub)和 观点评价混杂度(DevSub)存在较高的负相关关 系(一0.875),同时将这两个变量放人模型中存
在多重共线性问题.采用逐步回归法回归模型,剔
除不显著变量之后得到最终的在线评论有用性影 响因素模型,模型整体拟合以及标准化参数估计
结果见表4.为检验本文模型的拟合效果是否有
考虑电影问的差异,对14个样本电影分别进 行了同样的统计,均得到类似结果.另外,考虑评 论有用性分类界值可能对结果存在影响,还以 0.6为分界值分类评论有用性,,同样得到类似结
果.由此,从样本数据初步统计分析来看,假设H1
表4
Table
4
所提高,采用本文使用的影评样本数据对Ghose 和Ipeirotis‘61提出的模型进行拟合(结果见表
4),对照比较两者的估计结果.
results
本文模型和Ghose等研究模型的整体拟合以及标准化参数估计结果
for
the
Model fitness and standard eoe侬eients
studied model and Ghose’s model
本文模型:(F=103.193,,谚=0.001;R2=0.272,Adj.R2=0.269) Log(netpfl工1)h=口+卢1(Rating)kr+JB2(DevPos)kr+岛(AvgSub)kr I风(DevSub)kr+ 岛(AugSubExp)kr+风(DevSubExp)kr+岛(title_AvgPos)kr+卢8(title AvgSub)h+ 岛(title_AvgSubExp)kr+/3loLog(Elapseddays)kr+卢11Log(Read)kr+占b 标准化系数 估计值 t值
bl 0.46“ 20.622 b2 0.07“ 3.2 b3
I以
b5
b‘ 0.058’ 2.591
b7 0.089’’
4.Ol
bI
矗,
blo O.115”
611 0.122” 5.618
一I一
一l一
5.463
Ghose和ipeirotis模型:(F=20.189,s垃.=0.001;R2=0.035,adj.R2=0.033) Log(netpfut)b=const+卢12(Moderate)h+卢13(AvgSub)kr I卢14(DevSub)h+ 卢15Log(Elapseddays)kr+卢16Log(Read)kr+占h 标准化系数 估计值 t值
612 一0.130.. 一5.408 bn b¨ b坫 O.106” 4.393 bl‘ 0.090’’ 3.724
一I— 一l一
注:系数bi为原模型中晟的标准化系数;’、”分别表不系数估计值在0.05、0.01水平上显著;“l”表不其附近的两个变量不能I司时 放入模型,需要分别代入模型进行估计;“一”对应的变量为系数不显著变量.
对于本文提出的假设模型,F检验显著,表 标——校正的决定系数(A办R2)为0.269;而 利用本文的影评样本数据拟合Ghose等的研究
模型,其校正的决定系数仍然很低,仅为O. 种商品的模型总体拟合度分别为0.07和0.1). 对于体验型商品——电影的在线评论,与Ghose
明模型线性回归关系成立,总体拟合指033(Ghose等研究中对视听商品及数码相机两
万方数据
第8期
郝媛嫒等:基于影评数据的在线评论有用性影响因素研究
一85一
等人研究模型相比,本文模型的总体拟合度提 高了23.6%,说明本模型对在线影评有用性的 总体解释力明显好于Ghose等的研究模型;另
外,两个模型均显示电影评论内容的平均观点
表5
Table
5
评价倾向概率(均值)和观点评价与客观描述两
种体裁的混杂度(标准差)对评论有用性的影响 不显著.本文模型的回归结果对前述假设的支 持情况见表5.
模型估计结果对研究假设的支持情况
validation
results
Hypothesis
according
to
model
estimation
研究假设 Ill:在线评论内容的正负情感对评论有用性存在 影响 Hl—l:评论内容的平均正向情感倾向对评论有用 性存在正向影响. H1—2:评论内容的正负情感混杂度对评论有用性 存在正向影响 I-12:在线评论内容中观点句的主观与客观表达形 式对评论有用性存在影响
支持情况 、/
研究假设 H3:在线评论内容的客观描述和观点评价两类体
支持情况
X
裁对评论有用性存在影响 H3—1:评论内容的平均观点评价倾向对评论有用
×
、/
性存在正向影响 H3—2:评论内容中观点评价与客观描述的混杂度
×
、/
对评论有用性存在正向影响 114:评论标题的正负情感倾向对评论有用性存在 部分支持 正向影响 H5:评论标题的观点评价倾向对评论有用性存在
× ×
、/
m—l:评论内容中观点句的平均主观表达倾向对
评论有用性存在负向影响 H2—2:评论内容中观点句的主客观表达形式的混 杂度对评论有用性存在正向影响 V
正向影响 116:评论标题的平均主观表达倾向对评论有用性
×
存在负向影响
I-F/:评沦发布天数对评论有用性存在负向影响
X
I'18:评论平均句子长度对评论有用性存在影响
、/
注:“、/”表示假设关系显著成立,假设成立;“×”表示假设不成立,包括假设关系不显著或关系相反
在显著影响在线影评有用性的因素中,评论 内容的平均正负情感倾向打分(rating)影响最大
且为正向(100‘46=2.884),即评论对相应电影的 打分越倾向于正面,该评论越可能被评为有用.这 一结果与初步分析中得到的统计结果一致.其次 是评论标题的正面情感倾向对评论有用性存在正
电影总体或其中一些属性的客观评述,两种表达
形式混杂度越高的评论有用性越高.对于模型中
控制变量,评论中平均句子长度(Read)对评论有
用性也存在正向影响(0.122),这一指标在Ghose 等的研究中用来反映评论可读性或认知成本,与
有用性应呈反向关系,但Ghose等对视听播放器
和数码相机的研究结果则与其理论假设相反,本 文同样发现评论中平均各句长度(Read)对评论 有用性的影响为正向.这个结果虽然从认知成本
向影响(10n嗍=1.253),即评论标题越倾向于正
面肯定的态度,评论越可能被评为有用,评论标题
往往反映了评论的整个内容,因此评论标题正负
情感的影响与评论内容正负情感的影响保持一致 符合实际情况.再次,评论内容的正负情感混杂度
及可读性角度无法解释,但该指标同时可以反映 评论信息量的丰富性,平均各句较长的评论通常
为正负情感、观点评价与客观描述或主观客观表 达形式混合的评论,因此其有用性更高,从这个角
对评论有用性也存在显著正向影响(10仉们= 1.175),即既有正面评价又有负面评价,且正负
评价混杂度越高的评论越有用,这类评论往往反
度看结果合理.评论发布天数也显著正向影响评
论有用性(0.1 15),评论发布天数越长,评论越可
映了评论者观点的客观性,因此更会被评论阅读
者赋予更高权重.另外,评论中观点句的主观与客
能是有用的,与假设相反.这一结果的可能的解释 是:在电影发布初期,一些电影发烧友凭借很少的 参考信息和自己的经验判断选择观看该电影,结
果因为质量确实不好或者不符合自己的口味,很
观表达形式的混杂度也对评论有用性存在显著正
向影响(10n嘲=1.143),即评论内容中观点句的 表达方式既有个人主观色彩较浓的评价,又有对
万方数据
一86一
管理科学学报
裹6
Table 6
2010年8月
预测效果评估列联表
Forecasting
多人不满而归,并向他人传播负向口碑;而后来跟 进者往往较为理性,会根据网上或其他来源迅速 积累起来的丰富内容的评论等信息来做出是否观 看的决策,因此,后来跟进者看电影后好评率可能 更高.对于评论发布天数与评论有用性的关系还 有待进一步证实.
5
预测为有用 的评论数 预测为无用
result evaluation
实际被评为有用 的评论数
实际被评为没用 的评论数
403(A)
32(剐
基于影响因素模型的评论有用性 分类预测
为测试上述提出的模型对在线影评有用性的
的评论数
316(C)
57(D)
其中,有用评论的查准率
PM醛加n
分类预测能力,在Yahoo!Movies网站上随机选取
除14个电影样本之外其他电影的808个在线影评
..
2丁而
^
A
有用评论的查全率
舰以b南
综合指数
数据用于评论是否有用的预测.分类预测主要步
骤为:
首先,对待预测评论样本的有用性进行人工 标注.参考Ghose和Ipeirotis【6 o的方法,我们雇用 两名编码员对这808个电影评论预测样本进行有 用/没用的分类.然后,采用kappa统计指标衡量 两个编码员分类结果的内部评论者一致性
(inter-rater agreement).算得Kappa系数Ⅲ】=
,一胱∞岍2—T———T—
一
2
p—reci—sion+忑孤
为查准率及查全率的调和平均数. 根据以上公式计算出:有用评论的查准率= 92.“%,查全率=56.05%,综合指数= 69.84%.这3个指标值说明,本文模型尽管对评 论有用性比例的总体拟合较低,但对在线影评是
否有用的二分类预测仍具有较强的判别能力.
(实际一致率一理论一致率)/(1一理论一致率)
=0.76,表明两个编码员对评论样本的感知和理 解一致性良好.
其次,确定评论有用性比例与评论是否有用 的对应关系,即需要确定一个合适的分界值按评 论有用性比例将评论分为有用/没用两类.结果 显示,如果确定分界值为O.5,则分类错误率最
小.因此,有用性比例>=0.5的评论被分类为
6
结束语
互联网上日益丰富的商品评论信息为人们的
决策提供了更多参考,然而其中充斥的大量良莠 不齐的评论也给消费者带来了困惑,降低了决策 效率和效果.评论有用性评价信息需要长期积累 才能真正发挥作用限制了其实际应用效果,因此, 在评论发布后挖掘文本特征,并通过这些文本特
征帮助评论阅读者及时地识别评论有用性成为迫 切需要解决的问题.而目前,旨在解决此问题的研
“有用”,而有用性<0.5的评论被分类为“无
用”.
最后,分类预测评论有用性及评估预测效果.
预测过程如下:将808个预测评论样本利用本文
提出的模型求得评论有用性比例,并根据上面确 定的有用性分界值将预测结果分为“有用”和“没 用”两类,然后将模型分类预测的结果与人工分 类结果做比较.此部分的预测任务为判断在线评 论是否有用,为二值分类,借助二维列联表
(contingency table)计算查准率、查全率及两者
究仍很缺乏.本文以体验型商品——电影的在线 评论为研究对象,从消费者角度出发,以为评论阅 读者及时提供评论有用性信息为目标,结合文本 挖掘技术与实证研究方法,建立了在线评论有用
性的影响因素模型,并用于评论有用性的分类 预测.
合成的综合指数,以此来评估模型的预测效果
(见表6).
本文将评论有用性的研究扩展到体验型商
万方数据
第8期
郝媛嫒等:基于影评数据的在线评论有用性影响因素研究
一87一
品领域;另外,除借鉴其他相关研究中涉及的文
本主客观体裁等特征之外,本文还考察了评论
对在线影评是否有用具有较强的判别能力.从实 际应用的角度,本研究可帮助评论网站设计者根 据评论文本特征对评论是否有用进行及时和自动
文本的平均正负情感倾向及混杂度、平均评论
文本观点句中主客观表达倾向及混杂度等文本 特征对评论有用性的影响,并区分了评论文本 中评论标题和评论内容对评论有用性的影响. 对体验型商品电影数据的实证检验结果表明, 与现有相关研究相比,本文提出的在线评论有
的识别,将有用评论靠前放置,方便消费者阅读, 从而帮助其提高决策效率和效果. 本文尚有一些不足有待改进:1)由于数据收 集和处理的限制,本文仅选取了一种体验型商品 电影作为研究对象,文中结论对其他体验型商品
的适用性还有待进一步检验,这将是作者未来研
用性影响因素模型总体解释力有较大提高.本
文得到的重要结论有:对于电影,1)评论的正 负情感倾向这个文本特征对评论有用性影响较
究的重要内容.2)对于体验型和搜索型两类商 品,评论文本特征对评论有用性的影响可能存在
很大差异,进一步研究两者间影响的差异性,并进
大,其中,标题和内容的情感倾向趋于正面的评 论的有用性更高;另外,评论内容中既有正向评 价又有负向评价,正负情感混杂度越高的评论
有用性越高.2)在线评论观点句中既有主观表 达形式又有客观表达形式,主客观表达形式混 杂度越高的评论有用性越高. 另外,本文还应用所提出的在线评论有用性 影响因素模型,对在线影评有用性的分类预测能
一步扩展两类商品评论文本特征对消费者认知影 响的理论,具有更大价值;3)尽管本文模型的总 体拟合度有所提高,但仍低于0.5,说明还有一些
影响评论有用性的重要变量未纳入到模型中,比 如除评论文本特征之外,反映评论者质量的一些
特征因素可能也会影响评论有用性,需要进一步 挖掘影响评论有用性的其他重要因素,以提高预
测的准确性.
力做了进一步的测试.结果表明,本文提出的模型
参考文献:
[1]Anderson [2]Katz
E
W.Customer satisfaction and word ofmouth[J].Journal ofService Research,1998,l(1):5一17. F.Lazarsfeld,Personal Influence:The Part Played by People in the Flow of Mass Communications[M].New
E,Paul
York:Free Press,1955.
[3]Arndt J.Role ofproduct—related (3):291—295. [4]Chevalier J
A,Mayzlin
conversations in
the diffusion ofa
new
product[J].Journal of
Marketing
Research,1967,4
D.The effect of word of mouth
on
sales:Online book reviews[J].Journal of Marketing Research
(JMR),2006,43(3):345—354. [5]Harrison.Walker
commitment
a8
L
J.The
measurement of
word—of-mouth communication and an investigation of service qualit),and customer
of
potential
antecedents[J].Journal
Service Research,2001,4(1):60.
[6]Ghose
A,Ipeirotis P
G.Designing Novel Review Ranking Systems:Predicting the Usefulness and Impact of Reviews[C].
on
Proceedings
of the ninth international conference
Electronic commerce,New
York,NY,USA:Association Computing Ma-
chinery(ACM)。2007:303—310. [7]张强,李乃和.网络口碑研究现状及未来发展初探[J].江西农业学报,2008,20(4):147—149.
Zhang
Qiang.Li Nai-he.The
initial exploration on the present
and future of studies about online word-of-mouth[J].Journal
of Jiang Xi A咖culture,2008,20(4):147—149.(in Chinese)
[8]张莹,孙明贵.西方网络口碑传播效应研究进展[J].财贸研究,2008,(05):109—115.
Zhang Ying,Sun
Ming—gni.Review
of online
word?of-mouth communication[J].Financial and Trade research,2008,19
(05):109一115.(in Chinese) [9]李实,叶强,李一军,等.挖掘中文网络客户评论中的产品特征方法研究[J].管理科学学报,2009,12(2):
142—152. Li Shi,Ye
Qiang,Li Yi-jun,et a1.Mining features
ofproducts from Chinese customer online
reviews[J].Journal of Man-
agement Sciences in
China,2009,12(2):142—152.(in Cllinese)
万方数据
一88一
管理科学学报
2010年8月
[10]刘建新,陈雪阳.口碑传播的形成机理与口碑营销[J].财经论丛,2007,(05):96—102.
Liu
on
Jian-xin,Chen Xue—yang.The mechanism of word?of-mouth
Finance
communication
and WOM marketing[J].Collected Essays
and Economics,2007,(05):96—102.(in Chinese)
[11]陈明亮,章晶晶.网络口碑再传播意愿影响因素的实证研究[J].浙江大学学报(人文社会科学版),2008,38(5):
127—135.
Chen Ming—liang,Zhang Jing-jing.An experimental regeal'ch
on
the
determinants of re?diffusion iIntention of online word?of-
mouth[J].Journal ofZhejiang Univemity(Humanities
and
Social Sciences),2008,38(5):127—135.(in Chinese)
[12]李纯青,赵平,马军平.零售业回报计划感知价值对客户忠诚的影响[J],管理科学学报,2007,10(4):90
—97. Li
Chum-qing,Zhan
Ping,Ma
Jun-ping.Impact of the value perception of the reward programs
on
customer
loyalty[J].
Journal of Management Sciences in China,2007,10(4):90—97.(in Chinese)
[13]陈蓓蕾.基于网络和信任理论的消费者在线口碑传播实证研究[D].杭州:浙江大学,2008.
Chen Bei?lei.An Empirical Study
on
Consumer
Online Word—of-Mouth Communication based
on
Web and Trust
Theory
[D].Hangzhou:Zhejiang University,2008.(in Chinese) [14]郭国庆,杨学成,张杨.口碑传播对消费者态度的影响:一个理论模型[J].管理评论,2007,19(3):20—26.
Guo Guo-qing,Yang Xue?eheng,Zhang Yang.The impact of word-of-mouth
on
consumer’s attitude:A theoretical
model
[J].Management Review,2007,19(3):20一26.(in Chinese) [15]金立印.网络口碑信息对消费者购买决策的影响:一个实验研究[J].经济管理,2007,29(22):36—42.
Jin
Li-yin.The
effects of online
WOM information
on
consumer purchase decision:An
experimental study[J].Economic
Management,2007,29(22):36—42.(in Chinese) [16]郑小平.在线评论对网络消费者购买决策影响的实证研究[D].北京:中国人民大学,2008. Zheng
Xiao—ping.An Empirical Study About the Effect of Online of
Reviews
on
Online Consumer Decision Making[D].Bei-
jing:Renmin University
China,2008.(in Chinese)
[17]郭小钗,陈蓓蕾.在线口碑效应的影响因素实证研究[J].北京理工大学学报(社会科学版),2009,ll(2):31
—35. Guo
Xiac-thai,Chen Bei?lei.Determinants ofwom effects in virtual community:An empirical analysis[J].Journal of Bei-
Institute of
jing
Technology(Social Sciences Edition),2009,11(2):31—35.(in Chinese)
reviews in forecasting sales?The
case
[18]Dellarocas
F.Exploring the value of online product pictures[J].Journal of Interactive Marketing,2007,21(4):23-45.
and
C,zllang X Q,Awad N
of motion
[19]Skowronskij,Carlston D.Negativity
ical
extremity biases in impression formation:A review of explanations[J].Psycholog-
Bulletin,1989,105(I):131—142.
R,Burnkrant R E,Unnava H of Marketing
[20]Ahluwalia
R.Consumer response
to
negative
publicity:The
moderating role of commitment
[J].Journal
[21]Sen S,Leman
D.脚are
of
Research,2000,37(2):203—214.
you telling me
this?An examination into negative consumer reviews
on
the
web[J].Journal
of
Interactive Marketing,2007,21(4):76—94.
[22]Adaval
R.Sometimes it
jnst feels fight:The
differential
weighting
of
affect—consistent and affect?inconsistent product infor-
mation[J].Journal [23]Strahilevitz
trying
to
Consumer Research,2001,28(1):1—17. J G.Donations
ofConsumer
to
M,Myers
charity鹪purchase incentives:Row well they work may depend
on
what you
are
sell[J].Journal
Research,1998,24(4):434—446.
on
[24]Mort
G S,Rose of
T.The
effect of product type
value
linkages in the means?end chain:Implications for theory and method
[J].Journal [25]Duhan
D
Consumer Behaviour,2004,3(3):221—234.
on
F,Johnson S D,Wilcox J B,et a1.influences
consumer
use
of
word—of-mouth recommendation 80nrce8[J].
Journal of the Academy of Marketing Science,1997,25(4):283—295.
[26]Pang
B,Lee L.A
Sentimental Education:Sentiment Analysis Using Subjectivity Summarization Based
of
Oil
Minimum Cuts
[c].Proceedings
the 42nd Annual Meeting of the Association for Computational Linguistics(ACL),Morristown,NJ, Linguistics,2004,271—278.
USA:Association for Computational
[27]Nelson P.Advertising
as
information[J].Journal ofPolitical Economy,1974,82(4):729—754. (下转第96页)
万方数据
一96一
[9]Armington P.A theory of
159—178. demand for products
管理科学学报
2010年8月
distinguished by place of production[J].IMF Staff Paper,1969,(16):
[10]Krugman
P.Increasing
returns
and economic geography[J].Journal of Political Economics,1991,(99):483—499.
returns to
[1 1]Ethier W.National
and international
scale in
the modem theory of international trade[J].American Economic
Review,1982,(72):950—959.
Analysis of economic development trend of labor interregional migration
YANG Zhong—zhi,YAO Lin—m,LI Li
Antai School of Economics and Management,Shanghai Jiaotong University,Shanghai 200052,China
Abstract:With yearly large—scale labor interregional migration,the regional disparity between the coastal area
and hinterland is enlarging in China.In order to analyze this phenomenon,this paper analyzes the effect of la- bor
interregional
migration by applying
a
general model based
on
discussion of the mechanism of industry ag-
glomeration.The results of model simulation show that,when considering the friction factors of labor interre- gional migration,both the industrial agglomeration effect and labor interregional migration increasing. Key words:labor migration;industrial agglomeration tion
regional
disparity would enlarge with the rate of
effect;regional disparity;equilibrium
model;simula—
(上接第88页) [28]SAS
Institute Inc.sAs/STAT
Software:Changes and Enhancements.Through Release 6.11[C].North Carolina:SAS In.
stitute
Inc,1996,221—230.
Research
on
online impact factors of customer reviews usefulness based
on
movie reviews data
HAO Yuan—yuan,YE
Qiang,LI甄乒n
School of Management,Harbin Institute of Technology,Harbin 150001,China
Abstract:Taking movie’S online customer reviews
as
the
subject,using
text
mining and empirical research
a
methods,from the viewpoint of text features of online reviews,this paper establishes
model of the online
re一
、riews impact factors and forecast reviews usefulness using this model.Compared with related researches.the
explanation
power of
our
model increases significantly,and we find
that,positive
attitude,high mixture of
positive and negative attitudes,high mixture of
tences
our
subjective
and
objective
expression forms and
average
sen—
length have
a
significantly positive
impact
on
reviews usefulness.Finally,our forecasting result shows that
model has
strong power to discriminate usefulness of online movie reviews. reviews;usefulness;text features;positive expression;text mining
key
words:word—of-mouth;online tude;subjective
and
and
negative sentimental atti-
objective
万方数据
本文关键词:基于影评数据的在线评论有用性影响因素研究,由笔耕文化传播整理发布。
本文编号:205516
本文链接:https://www.wllwen.com/jingjilunwen/xxjj/205516.html