可感知形状的词云生成方法
发布时间:2021-02-06 22:38
随着大数据时代的来临,大量文本信息涌入了人们的生活中,如何更简洁高效地表达文本数据中所蕴含的信息成为了信息可视化领域的一个重要问题。词云是人们进行文本可视化的重要手段,近年来,具有形状边界约束的词云在社交媒体上受到人们越来越多的关注。然而,现有的生成形状词云的技术虽然达到了较高的词云填充率,却强行改变了单词之间原来成比例的大小关系,导致人们无法正确地获取词云中蕴含的词频大小信息。我们提出了一种新的技术,它可以高效地创建具有形状约束的词云,我们将其命名为ShapeWordle。运用这种技术,我们可以对单词进行调节从而使其能够组合成指定的任意形状,并在满足词云高填充率的同时保持词云中的数据真实性。为了指导单词在形状边界约束下的放置,我们运用形状的距离场信息,将传统的阿基米德螺旋线以微分的形式表达,使其可感知任意形状。进一步地,为了处理非凸形状,我们引入了一种多中心的词云布局算法。该方法将形状分为多个分区,对每个分区均应用可感知形状的阿基米德螺旋线自适应地生成单词放置策略,并混合多种单词表现方式对空隙处进行有效填充。为帮助用户生成更加具有语义的形状词云,我们还提供了丰富的编辑交互操作。此外,...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图2-1地理信息词云,示例中以英国地图作为地理信息输入??时序词云揭示了一组时序单词随时间发展的变化,同时保留了它们的时间顺??
?山东大学硕士学位论文???S^)?(^)??(a)?(b)??图3-1?(a)图示了?Wordle算法工作原理:沿着从橙色点(单词起始位置)开始的阿基米德??螺旋线搜索一个位置以放置当前单词(白色点处的蓝色矩形),以使该单词不与任何现有己??放置单词产生重叠。(b)图示了传统阿基米德螺旋线上一点(白色)处的运动方向U以及法??线方向N和切线方向T。半径为r的蓝色圆圈为当前以橙色点为原点的标量场的等值线,其??中右侧的颜色栏显示了标量场的大校??上述的两个步骤可以快速生成一个紧凑而美观的词云。但是,这两个步骤都??严重限制了?Wordle创建形状词云的灵活性。首先,Wordle算法所采用的螺旋线??为传统的阿基米德螺旋线,它始终以圆形方式搜索单词的新位置,因此生成的词??云无法很好地契合目标形状,如图1-1?(c)所示。其次,选择围绕画布中心的初始??位置会生成单中心的词云,阻碍了多主题多中心词云[37】的创建。总体而言,这两??个因素在很大程度上导致了?Wordle所生成的词云大多为单中心的椭圆形布局。??而受到人们偏爱的语义性强的故事词云往往通过将单词组成复杂的多中心的形??状来进一步传达语义。这使得原始Wordle提供的功能无法满足不断提升的用户??需求。??3.1.2阿基米德螺旋线??阿基米德螺旋线是最广泛使用的欧几里得螺旋线之一,可以很容易地在极坐??标中定义:??r(0)?=?md?+?b?(3-1)??式中0为极角,r是距离原点的径向距离,6?=?r(0)是起点到原点的初始距离,??m控制螺旋线之间的间距。拥有均匀的线间距(2m7r)是阿基米德螺旋线重要而有??用的特征。阿基米德螺旋线在
??山东大学硕士学位论文???距离场对形状而言是一种高效的表示形式,己被用广泛运用于边缘捆绑??(edgebundling)和轨迹数据可视化。它是一种标量场,显示通过距离变换R2?—R+??后形状内每个点到形状轮廓的最短距离:??(^(p?G?R2,D.)?=?min||p-?q||?(3-5)??qGii??式中p是2D空间上一点,n是形状轮廓,q是n上任一点。注意在形状轮廓上是??零,并朝形状中心或中间轴逐渐增加,我们使用具有时间复杂度〇(n)的线性算法??阳计算形状距离场,其中点n是2D空间中的点。??一->?:T?—??:?N?〇?:?origin??貞’,〇H稱????…_?_夕??(a)?(b)?(c)??秦-霸」??(e)?(d)??图3-2可感知形状的阿基米德螺旋线的生成。(a)图示了由圣诞树形状生成的距离场,螺旋??线由橙色点起始,当前停顿在白色点处;(a)中的局部放大视图(b)显示了点A处的曲率圆’??其中R是在点A处的局部曲率圆半径,红色点表示相应的圆心,我们用弧长估算从点??A到点B的移动距离,表示为ds。其中dj?是用户定义的角速度参数。(c)用另一个弧长??近似心可得d0。(d)点B沿法线方向(红色)移动md0?(基于公式(3-6))得到点C,至此完??成螺旋线的一步迭代。(e)重复迭代后可得到圣诞树形状的阿基米德螺旋线。??将阿基米德螺旋线扩展至任意形状,其中最主要的问题是如何引导螺旋线的??运动,或者如何在给定形状的任一点P处定义螺旋线的运动方向。无需显示构造??13??
本文编号:3021206
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图2-1地理信息词云,示例中以英国地图作为地理信息输入??时序词云揭示了一组时序单词随时间发展的变化,同时保留了它们的时间顺??
?山东大学硕士学位论文???S^)?(^)??(a)?(b)??图3-1?(a)图示了?Wordle算法工作原理:沿着从橙色点(单词起始位置)开始的阿基米德??螺旋线搜索一个位置以放置当前单词(白色点处的蓝色矩形),以使该单词不与任何现有己??放置单词产生重叠。(b)图示了传统阿基米德螺旋线上一点(白色)处的运动方向U以及法??线方向N和切线方向T。半径为r的蓝色圆圈为当前以橙色点为原点的标量场的等值线,其??中右侧的颜色栏显示了标量场的大校??上述的两个步骤可以快速生成一个紧凑而美观的词云。但是,这两个步骤都??严重限制了?Wordle创建形状词云的灵活性。首先,Wordle算法所采用的螺旋线??为传统的阿基米德螺旋线,它始终以圆形方式搜索单词的新位置,因此生成的词??云无法很好地契合目标形状,如图1-1?(c)所示。其次,选择围绕画布中心的初始??位置会生成单中心的词云,阻碍了多主题多中心词云[37】的创建。总体而言,这两??个因素在很大程度上导致了?Wordle所生成的词云大多为单中心的椭圆形布局。??而受到人们偏爱的语义性强的故事词云往往通过将单词组成复杂的多中心的形??状来进一步传达语义。这使得原始Wordle提供的功能无法满足不断提升的用户??需求。??3.1.2阿基米德螺旋线??阿基米德螺旋线是最广泛使用的欧几里得螺旋线之一,可以很容易地在极坐??标中定义:??r(0)?=?md?+?b?(3-1)??式中0为极角,r是距离原点的径向距离,6?=?r(0)是起点到原点的初始距离,??m控制螺旋线之间的间距。拥有均匀的线间距(2m7r)是阿基米德螺旋线重要而有??用的特征。阿基米德螺旋线在
??山东大学硕士学位论文???距离场对形状而言是一种高效的表示形式,己被用广泛运用于边缘捆绑??(edgebundling)和轨迹数据可视化。它是一种标量场,显示通过距离变换R2?—R+??后形状内每个点到形状轮廓的最短距离:??(^(p?G?R2,D.)?=?min||p-?q||?(3-5)??qGii??式中p是2D空间上一点,n是形状轮廓,q是n上任一点。注意在形状轮廓上是??零,并朝形状中心或中间轴逐渐增加,我们使用具有时间复杂度〇(n)的线性算法??阳计算形状距离场,其中点n是2D空间中的点。??一->?:T?—??:?N?〇?:?origin??貞’,〇H稱????…_?_夕??(a)?(b)?(c)??秦-霸」??(e)?(d)??图3-2可感知形状的阿基米德螺旋线的生成。(a)图示了由圣诞树形状生成的距离场,螺旋??线由橙色点起始,当前停顿在白色点处;(a)中的局部放大视图(b)显示了点A处的曲率圆’??其中R是在点A处的局部曲率圆半径,红色点表示相应的圆心,我们用弧长估算从点??A到点B的移动距离,表示为ds。其中dj?是用户定义的角速度参数。(c)用另一个弧长??近似心可得d0。(d)点B沿法线方向(红色)移动md0?(基于公式(3-6))得到点C,至此完??成螺旋线的一步迭代。(e)重复迭代后可得到圣诞树形状的阿基米德螺旋线。??将阿基米德螺旋线扩展至任意形状,其中最主要的问题是如何引导螺旋线的??运动,或者如何在给定形状的任一点P处定义螺旋线的运动方向。无需显示构造??13??
本文编号:3021206
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3021206.html