当前位置:主页 > 管理论文 > 移动网络论文 >

Web2.0环境下用户创作内容信任分析

发布时间:2019-11-20 04:20
【摘要】:当今的社会正处于互联网的时代,技术飞速发展。随着互联网进入Web2.0时代,普通的用户获得了网络中的话语权。Web2.0网站中信息的时效性与多样性,更使得很多人将互联网,特别是Web2.0网站,作为自己获取信息的首要途径。 然而,话语权的放开也带来了一系列的问题。由于Web2.0网站中,信息的发布没有人把关或监管,造成了Web2.0网站中的信息具有不确定性。这种不确定性表现在两个方面,第一个方面是用户身份的不确定性,用户的虚拟身份与用户的现实身份难以对应。第二个方面是信息的不确定性,微博等Web2.0网站中存在着一些谣言和不实信息,信息的可信度难以判断。而不实信息的传播,又会带来不良的影响。 面对Web2.0网站中信息的不确定性,本文针对用户创作内容进行信任分析,主要成果包括: 1.数据的采集。本研究针对在线论坛和微博这两种Web2.0时代的代表网站,.进行了相关的数据采集。根据研究的需要,从采集到的页面中,抽取了需要的信息。根据后续分析的需要,采取了合适的方式进行了数据的组织与存储。 2.针对一个用户在Web2.0网站中可能使用多个虚拟账户的情况,提出了一种基于多维相似度的用户多虚拟身份识别算法。利用在线论坛数据集,对提出算法的效果进行了实验。实验结果表明,本研究提出的算法能够有效的识别出用户的多个虚拟身份。 3.针对Web2.0网站中存在的虚假、不实的信息,提出了针对用户创作内容的信任分析方法。首先,利用采集到的微博数据,针对正常微博与不实微博,进行特征对比分析,得到了差异较大的几种特征。随后,利用多种分类算法,对微博是否可信进行了识别。经过实验的验证,得到了较好的结果。随后,在基于分类算法的用户创作内容信任分析方法的基础上,利用基于情感分析的方法对实验的效果进行了进一步改进,实验的准确率得到了进一步提升。
【图文】:

网页,代码,示例,楼层


33 </body> </htmi>图2-2 北邮人论坛网页代码例.不足以满足需求,需要多次的数据采集。然而,若每次都采集所有的数据,会造成大量重复的工作,造成T 间和资源的浪费。因此,需要一种增量式的数据采集方法。在经典版页面中,帖子中的每一个楼层都具有一个ID。利用这个ID,我们可以判断一个楼层是否己经被抓取过。将所有已经被抓取的页面放入一个SET中,每次获S蔚铰ゲ鉏D时进行判断,如果该楼层已经被抓取过,则不获取具体的楼层页面,以节省时间。每次抓取过程完成后,将该SET写入磁盘之中,以便下次抓取过程使jjj。然而

身份识别,马甲,账户,效果


图3.2(a)展示了真灰“马甲”账户与人工“马甲”账户共78个待检测账户的实验结果随阈值的变化。.图中的横轴代表了阈值/。观察准确率、召回率等值的变化,当阈值在0.7左右时,,F1-measure能够取得较好的值,表示该阈值时准确率,召回率能够取得比较平均的结果。.具体观察寻找到的相似度最高的候选账户之后发现,对于28个真实.“马甲”账户与50个人:r. “马甲”账户,与其相似度最高的候选账户均是实际的“马甲”账户,并不存在非“马甲”账户具有最高的相似度的情况。准确率的变化完全由于阈值的变化造成的。阈值过低时,可能误将没有“马甲”的账户判断为存在“马甲”。而阈值过高时,有可能误将存在“马甲”的账户判断为没有“马甲”。这从一定程度上说明了算法的有效性。随后,.纤对72个无“马甲”账户的识别效果进行实验。从图3.2(b)中可以看出,其准确率与召回率的走势与“马甲”账户相反。在_值为0.8上下时,能取得最高的F1-measure 值 d图3-3展示了整体准确率随曊值的变化,总体准确率在阈值为0.7到0.8的范围
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092

【参考文献】

相关期刊论文 前10条

1 李淑领;;网络社区中的虚拟身份挖掘[J];沧州师范专科学校学报;2008年03期

2 李楠楠;张宁;周涛;;人类通信模式中基于时间统计的实证研究[J];复杂系统与复杂性科学;2008年03期

3 叶枫;吴善滨;;基于评价者过滤的个性化信任模型[J];管理工程学报;2012年03期

4 吴强;梁继民;杨万海;;Web日志挖掘预处理中的用户识别技术[J];计算机科学;2002年04期

5 李利,王秀峰;Web应用中识别用户身份的一种方式[J];计算技术与自动化;2004年03期

6 周茜,赵明生,扈e

本文编号:2563395


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2563395.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a49d0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com