用户行为数据的交互式可视挖掘方法研究

发布时间:2020-11-14 01:35
   不同地区的成百上千万用户在不断地消费、生产和传播海量且高度多样化的异构数据,大至涉及全球范围的虚拟社交媒体数据,小至单一城市中的居民出行数据。随着技术的快速发展,人们所生产的数据将持续增长,数据格式愈加的多样化,数据也将愈加的开放和容易获取。分析和洞察用户行为数据,并深入地理解用户行为在时间和空间上的模式和规律,给众多领域如商业、媒体、政务以及学术研究均带来了新的机遇和挑战。用户行为数据的分析存在诸多挑战和困难,首先用户行为数据是多维度且多层次的,其往往涉及多个维度如时间、空间以及其他数值型或文本形式内容等,且因时、因地和因人而异。不同的空间和时间粒度/跨度的分析往往会得到不同的结果。其次,用户行为的规律和模式不是一成不变的,而是会随着时间而动态变化;此外,用户行为在演化过程中不仅仅是独立的,行为之间会存在不同程度上的交互和影响。再次,用户行为数据往往涉及海量用户以及海量行为记录,如何高效地、实时地、稳定地存储、处理以及分析上述数据显得尤为重要。最后,上述复杂的、多维度、多层次动态变化的用户行为,往往难以进行及时实时有效的跟踪、分析和理解。可视分析作为一门跨学科的领域,其采用了交互式可视化,并将用户的专业知识和推理能力与传统的数值化数据挖掘模型分析结合起来,实现复杂海量数据的有效分析,帮助用户发现隐藏在数据中有价值的信息。本学位论文旨在利用数据可视分析方法,以数据挖掘和数据交互式可视化为研究主线,通过研究用户行为数据在时间、空间和时空维度下的特征,围绕用户行为数据建模、可视化、交互式可视分析系统设计和评估等问题展开了相关研究。本文的主要研究内容和贡献概括如下:提出了一新颖的话题竞合模型,其可以定量地描述用户在社交媒体上所发表话题之间的时序竞合交互作用以及话题领袖对这一相互作用的贡献。该模型将话题交互这一过程视为话题的延续性效应、竞合吸引效应和竞合转移效应的结合。在可视化方面,提出了一新颖的时序可视化方法EvoRiver,其可将时变、多维的话题交互数据转换为可交互的可视化形式,帮助分析师研究社交媒体上话题竞合过程中的动态变化。提出了用于定量衡量社交媒体上用户所发表信息在大规模时空维度上传播过程的数学模型(动态SGM),该模型同时考虑了信息在大规模时空维度上传播的重要因素即地理距离、文化相似性和语言相似性,以及时序近因效应,帮助我们更全面了解信息时空传播过程中的复杂动态变化。在可视化方面,提出了一新颖的时空数据可视化方法SocialFlow,用于展示和探索社交媒体上信息时空传播的复杂动态过程。提出了直观的、“就地”无遮挡的嵌入可视化方法,允许空间上下文在被保留的前提下探索城市尺度上的用户时空行为数据模式,本方法无缝地将时序图和地图集成于同一显示空间中,实现时空数据的无遮挡可视探索。此外,我们实施了一系列系统性的工作以研究与该方法息息相关的多种设计问题如时间方向编码;针对上述方法,完成了基于真实社交媒体大数据和城市交通大数据的案例分析,从中挖掘了有关社交媒体上话题竞合动态变化、信息时空传播以及城市居民出行规律等深刻洞察;实施了完善的用户研究和专家调研以评估和验证上述所提出方法的可用性和有效性,并提供了相应的实证研究结果。
【学位单位】:浙江工业大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:TP311.13
【部分图文】:

原始数据处理,数据可视化,可视,模型分析


精简数据,提取有价值的信息,通过交互界面和可视化,融合机器的智能处理和人的智慧推理,分析复杂的数据以洞察其中的规律[16]。此外,可视分析还通过支持人与可视化结果的直接交互,使得用户可以利用他们已有的知识、经验和推理,进行直观的数据分析[19],并可进一步地改善数据挖掘和统计分析过程中的模型构建。因此说,可视分析非常适合复杂数据的探索式分析、推理和复杂结果的解读和验证。与其他学科相比,可视分析充分利用用户的知识、经验、推理能力和高带宽视觉感知通道,结合计算机强大的分析和处理能力,提供交互的数据分析和探索,使得用户以视觉理解的方式获取数据中蕴含的信息[7]。包括反恐情报分析、智慧城市、金融分析、生物基因分析等在内的诸多成功的案例表明,可视分析可以有效地用于探索式的问题研究,分析复杂的海量异构数据[15]。通过形象的可视化和交互手段,可视分析不仅可以让用户直观地解读和理解分析的结果,还可以帮助专家用户进行有效地分析和检验[20]。图 1-1 展示了数据可视分析的基本过程。因此,本文将研究如何有效地设计和运用可视分析技术和方法,解决用户行为数据挖掘中的关键问题。

竞合,研究方法,逻辑关系,研究对象


浙江工业大学博士学位论文的竞争合作(竞合)情况的可视分析方法。首先,我们建立一数学模型以定量分析话题之间的竞合作用,该模型将话题交互这一过程视为话题的延续性效应、竞合吸引效应和竞合转移效应的结合。此外,我们引入从话题领袖(topicleaders)这一概念,以帮助全面捕捉话题竞合过程中的特征,并能显式地计算出每个话题领袖对话题随时间时间维度上的模型构建

螺旋图,堆栈,可视化,示例


(a) (b)图 2-1 堆栈图和螺旋图可视化示例当屏幕显示空间有限的时候,不同的可视化方式也被不断地提出来以方便时序数据的灵活探索。CloudLines[66]采用了一紧凑的可视化隐喻,以显示时序数据于有限的屏幕空间内,如图 2-2(a)所示。ChronoLenses[67]提供了不同类型的“透镜”视图,以探索不同尺度的时序数据。用户可以与“透镜”交互,一步步地展开探索式分析。高维时序数据,如高维的经济、环境数据,同样是我们日常生活中常见的时序数据之一,但是对其的分析仍然具有诸多挑战。TimeSeer[68]是用于高维时序数据可视化分析的工具之一,其采用了一系列的衡量方式如数据密度、偏斜度和异常度(总称为 Scagnostics)等帮助刻画数据特征。如图 2-2 (b)所示,TimeSeer 使用了散点图、时序图以及一系列的small multiples 以展示 Scagnostics,且支持各式各样的交互如过滤、刷涂、和细节查看。
【相似文献】

相关期刊论文 前10条

1 童卡娜;黄东军;徐鸣;;音乐可视化及其研究进展[J];计算机仿真;2008年01期

2 黄明峰;;预案可视化与推演技术[J];办公自动化;2010年16期

3 朱良学;;学习可视化的意义与内涵研究[J];软件导刊(教育技术);2013年05期

4 张蕾磊;郭蔚臻;;可视化借你一双慧眼[J];大学生;2013年05期

5 孙敏,马蔼乃,毛善君;3DGIS中树的表达与可视化研究[J];计算机辅助设计与图形学学报;2001年10期

6 刘有源,黄新民,陈定方;知识的可视化获取[J];湖北工学院学报;2002年02期

7 廖通逵,姚静,王平,姚谦;基于GIS的水流信息可视化表达[J];遥感信息;2004年04期

8 张宝一;郑坤;刘修国;吴信才;;自适应可视化研究综述[J];地理信息世界;2007年02期

9 刘爱利;张宏;邱新法;刘二年;;环境信息科学可视化表达与交互研究[J];地域研究与开发;2007年05期

10 李大林;李秀冰;李英玉;贺欢;彭晓东;;地球空间环境要素可视化技术研究[J];计算机与数字工程;2008年08期



本文编号:2882903

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2882903.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户162d7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com