面向社交网络的文本可视化技术研究与实现
发布时间:2019-11-09 09:27
【摘要】:随着互联网技术的发展,社交网络在人们的日常生活中扮演着越来越重要的角色。与传统网络应用如论坛、贴吧、博客等相比,社交网络中的用户数量更多,用户间交流更频繁,信息传播速度更快。社交网络数据具有用户数量庞大,信息类型丰富多样且冗杂的特点,使得人们很难直接从海量的数据中得到有价值的信息。而可视化技术能够生动直观地向用户展示信息,且其可交互的特点使得用户能够在观察可视化展示后根据自己的理解进一步地获取信息。然而目前基于社交网络数据的可视化分析工具多是面向情感分析、水军识别、传播分析、文本分类为主,缺乏为用户提供以主题为主线的社交网络数据的可视化工具,用户难以根据感兴趣的领域获得社交网络中的相关信息,以主题为线索的社交网络数据可视化成为当前研究热点之一。基于以上背景,本文对社交网络数据的文本可视化技术进行研究,并在以下几个方面展开了工作:1.深入研究了网络数据爬取技术,分析了目标社交网站的网页元素,针对数据采集过程中遇到的问题,设计网络爬取方案,采用Requests技术、Selenium-Driver技术与Python多线程技术threading相结合的方式,实现对动态网页与静态网页的高效爬取。根据数据特征设计表结构,将爬虫得到的数据实时存入MySQL数据库。2.提出了一种交互式的主题河流可视化方法。首先对主题河流进行基于离散系数的初始排序优化,提出了歧义点的概念,对容易产生歧义的点进行计算与可视化设计,并提供了交互功能,使用户能够在局部根据歧义点标识对主题河流进行重排序,达到消除歧义的效果。实验结果表明交互式的主题河流能有效展现时序文本数据,并能有效解决传统主题河流的局部展现歧义问题。3.提出了一种分组排序数据的可视化方法,实现了具有分组与组内排序特征的数据的可视化设计。其思路是采用基于扇形图的分区方法对实体的分组信息进行展示,采用分层的布局方法对实体组内信息进行展示,同时结合实体的颜色、大小、形状等设计。实验验证了该可视化方法能有效地对分组排序数据进行直观展示,而且能够实现对空间的充分利用。4.针对取得的社交网络文本数据进行分析与预处理,设计并实现了社交网络文本数据可视化工具,共包括六个功能模块:话题结构模块、主题河流模块、词云模块、用户可视化模块、问题展示模块,回答展示模块。并对各模块之间进行交互设计,实现了以主题为线索的文本可视化展现。
【图文】:
逦西南交通大学硕士研究生学位论文逦第3页逡逑(2)基于逻辑的文本可视化方法逡逑基于逻辑的文本可视化的目的在于展现文本中上下文之间的逻辑关系,提取出文逡逑本的发展线索,使用户能够快速地理解文本内容。基于逻辑的可视化之前的分词工作逡逑与基于内容的文本可视化之前的分词工作有所不同,非实体词汇往往在上下文的逻辑逡逑中起着关键作用。逡逑Wattenberg和ViSgas提出/邋Word邋Tree文本可视化方法Word邋Tree是对传统文逡逑本关键词的一种图形化展示,能够实现文本梗概的快速查找和探索。后缀树的结构展逡逑示文本中上下文的层次关系,可读性极强。如图1-1所示的实例是对马丁路德金的演讲逡逑文本可视化的效果图,用户输入关键词“Ihaveadream”,从图中可以看出树图的层次逡逑结构能够直观、清晰地展现文本的上下文逻辑。逡逑
图1-4邋OpiniatiFlow用户观点传播展示图丨2°J逡逑众所周知,农村的社群结构与城市的社群结构有很大不同,在如今的社交网络时逡逑代,人们对农村社群使用社交网络的情况知之甚少。Gilbert等研宄了农村与城市使用逡逑社交网络的差异情况[22L对超过3000的城市与农村社交网络用户数据进行可视化,结逡逑果如图1-5所示。结果发现相较于城市用户,农村用户的线上好友更少,并且其好友也逡逑大多与其距离很近,,同时发现不同性别的社交网络用户对隐私具有不同需求。逡逑上述社交网络数据可视化工作的研究重点是情感分析、传播分析与地理信息分析逡逑等,目前缺乏以主题为线索的社交网络数据可视化分析工具,普通用户难以根据感兴逡逑趣的主题对社交网络数据进行浏览与分析。本文研宄面向社交网络的文本可视化技术,逡逑设计并实现一个以主题为线索的社交网络可视化工具。逡逑
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09;TP391.1
本文编号:2558375
【图文】:
逦西南交通大学硕士研究生学位论文逦第3页逡逑(2)基于逻辑的文本可视化方法逡逑基于逻辑的文本可视化的目的在于展现文本中上下文之间的逻辑关系,提取出文逡逑本的发展线索,使用户能够快速地理解文本内容。基于逻辑的可视化之前的分词工作逡逑与基于内容的文本可视化之前的分词工作有所不同,非实体词汇往往在上下文的逻辑逡逑中起着关键作用。逡逑Wattenberg和ViSgas提出/邋Word邋Tree文本可视化方法Word邋Tree是对传统文逡逑本关键词的一种图形化展示,能够实现文本梗概的快速查找和探索。后缀树的结构展逡逑示文本中上下文的层次关系,可读性极强。如图1-1所示的实例是对马丁路德金的演讲逡逑文本可视化的效果图,用户输入关键词“Ihaveadream”,从图中可以看出树图的层次逡逑结构能够直观、清晰地展现文本的上下文逻辑。逡逑
图1-4邋OpiniatiFlow用户观点传播展示图丨2°J逡逑众所周知,农村的社群结构与城市的社群结构有很大不同,在如今的社交网络时逡逑代,人们对农村社群使用社交网络的情况知之甚少。Gilbert等研宄了农村与城市使用逡逑社交网络的差异情况[22L对超过3000的城市与农村社交网络用户数据进行可视化,结逡逑果如图1-5所示。结果发现相较于城市用户,农村用户的线上好友更少,并且其好友也逡逑大多与其距离很近,,同时发现不同性别的社交网络用户对隐私具有不同需求。逡逑上述社交网络数据可视化工作的研究重点是情感分析、传播分析与地理信息分析逡逑等,目前缺乏以主题为线索的社交网络数据可视化分析工具,普通用户难以根据感兴逡逑趣的主题对社交网络数据进行浏览与分析。本文研宄面向社交网络的文本可视化技术,逡逑设计并实现一个以主题为线索的社交网络可视化工具。逡逑
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09;TP391.1
【参考文献】
相关期刊论文 前3条
1 任磊;杜一;马帅;张小龙;戴国忠;;大数据可视分析综述[J];软件学报;2014年09期
2 Hong Zhou;Panpan Xu;Xiaoru Yuan;Huamin Qu;;Edge Bundling in Information Visualization[J];Tsinghua Science and Technology;2013年02期
3 唐家渝;刘知远;孙茂松;;文本可视化研究综述[J];计算机辅助设计与图形学学报;2013年03期
相关博士学位论文 前2条
1 廉捷;基于用户特征的社交网络数据挖掘研究[D];北京交通大学;2014年
2 刘芳;信息可视化技术及应用研究[D];浙江大学;2013年
本文编号:2558375
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2558375.html