当前位置:主页 > 社科论文 > 社会学论文 >

社会化问答社区回答内容质量影响特征研究——以“知乎”为例

发布时间:2021-06-14 10:24
  [目的/意义]社会化问答社区回答内容的严谨性、专业性和严肃性急剧下降,探究具有哪些特征的回答内容更有可能成为一个高质量的回答,对引导用户提供更高质量的回答内容具有重要意义。[方法/过程]以"知乎"社区为例,通过对回答内容的分析和相关研究文献的总结,确定了10个潜在的影响回答内容质量的基本特征。基于"计算机科学"话题下的87 670条回答内容数据,运用数据挖掘方法确定回答内容质量的最佳二分类模型,并进一步挖掘出对回答内容质量具有重要影响的特征。[结果/结论]回答内容的标注数量越多,重点内容及结构就越清晰,回答内容质量越高;回答内容文本长度分布于100~700字之间更为合理;情感倾向更为积极的回答内容更能获得其他用户的认可。 

【文章来源】:情报杂志. 2020,39(10)北大核心CSSCI

【文章页数】:8 页

【部分图文】:

社会化问答社区回答内容质量影响特征研究——以“知乎”为例


情感值计算核心代码片段

长度分布,树结构,内容


分类模型中两种较为常用的方法是线性逻辑斯蒂回归和树归纳法,这两种方法各有优缺点。逻辑斯蒂回归拟合过程稳定,方差较低但偏差较大;树归纳法会导致方差较大但偏差较小。LMT模型就是将这两种方法结合起来,生成一个叶子节点上带有逻辑斯蒂回归函数的标准树结构。具体而言,LMT采用LogitBoost算法在叶子节点上建立逻辑斯蒂回归函数,并采用CART算法进行剪枝[21]。剪枝的具体操作是选择具有最小基尼数值的属性作为测试属性,并采用二分递归分割法,使得每个分叶节点都有两个分支,形成一个结构简洁的二叉树[22]。在LMT模型最终生成的树结构里,叶子节点离根节点越近,特征贡献度越大。本研究中生成的LMT树结构如图2所示,因此,可以确定对回答内容质量产生重要影响的3个特征是文本标注数量(a_marked)、文本长度(a_length)和回答内容的情感值(a_score)。上述3个对回答内容质量具有重要影响的特征中,标注数量是指回答内容中具有标粗或者斜体的标记数据量。从树结构中来看,此特征的贡献度最大。对比表3中标注数量特征的统计值发现,高质量回答内容的平均标注个数有2.14个,而普通回答内容的平均标注个数只有0.19个。结合具体回答的内容分析,发现标注的内容主要有以下两种情况:第一,用于标注回答内容的重点,如核心观点、核心数据等;第二,标注文字用作回答内容结构的区分,类似于标题。由此可见,充分的标注可以使回答内容的要点更突出,有利于用户迅速获取关键信息,提升了用户获取知识的效率。标注用于回答内容的结构时,可以使回答内容结构更清晰,逻辑更合理,便于其他用户理解回答者的意图。文本长度是指回答内容中的所有文字数量的总计,结合表3中的统计值发现,普通回答内容的文本长度平均值为163,高质量回答内容的文本长度平均值为673。然而,单纯以平均值来判断并不十分科学,因为极值的影响较大,如普通回答中文本长度最高达到90 426。笔者认为中位值更能反应文本长度的真实分布。普通回答内容文本长度的中位值为62,高质量回答内容文本长度中位值为249,表明在一定程度上,文本长度越长,回答内容越详细,更有可能得到其他用户的认可。但是,文本长度并非越长越好,过于冗长的文本也会让用户无法快速抓住知识要点。本研究根据统计数据中的四分位数的分析,认为文本长度分布在100~700之间最为合理。情感值可以反应回答内容的情感倾向,对比高质量回答内容和普通质量回答内容的情感值均值发现,高质量回答内容的情感均值为2.14,远大于普通回答内容的情感均值为0.12。此外,统计数据显示高质量回答内容中情感值为正的比例为44%,普通回答内容中情感值为正的比例仅为33%,也表明情感倾向积极的内容更能获得其他用户的认同,质量也更高。

【参考文献】:
期刊论文
[1]国内网络问答社区研究现状、热点及趋势分析——基于文献计量与内容归纳分析[J]. 章小童.  情报科学. 2020(01)
[2]社会化问答社区中用户研究的述评与展望[J]. 方陈承,张建同.  情报杂志. 2018(09)
[3]社会化问答知识分享用户感知有用性影响因素研究——以知乎为例[J]. 李进华,张婷婷.  现代情报. 2018(04)
[4]逻辑模型树算法性能分析与改进研究[J]. 张艺梅,丁香乾,贺英,王丽丽,徐硕.  微型机与应用. 2014(23)



本文编号:3229632

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/3229632.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d7d95***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com