司法纠纷数据的语义理解及可视分析系统的设计与实现
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1-1PLSA模型和LDA模型的盘子表示法比较
题的先验分布(每个训练文本的主题分布相对独立),它的参数随训练文本的个数呈线性增长,且无法应用于测试文本。一个更加完善的主题模型为LDA模型[15](LatentDirichletAllocationModel)被提出并得到应用。LDA模型从贝叶斯的角度为两个多项式分布添加了狄利....
图1-2由IBMWCG绘制的词云WordCloudFigure1-2.ExampleofaWordCloudgeneratedbyIBMWCG
司法纠纷数据的语义理解及可视分析系统的设计与实现5(1)基于词频的文本可视化作为最常见的基于词频的可视化,词云自然不可能被忽视。词云WordCloud是一种关键词的直观视觉描述,用于聚合用户生成的网站标签或者文本内容。标签内容通常是单独的词语,排列顺序灵活多变,取决于用户想表达的....
图2-1脱敏后的原始数据
司法纠纷数据的语义理解及可视分析系统的设计与实现11中找到最大概率路径,并基于该路径基于单词频率找到最大分割组合。图2-1脱敏后的原始数据Figure2-1.Theoriginaldatawithmasking同时,由于汉语的表达习惯,在分词中需要注意停用词的干扰。停用词指的是样....
图2-2基于滚雪球的关键词提取模型
启动;第二部分为知识挖掘部分,用于持续统计滚雪球模型迭代循环的过程,不停进行抽取和模板之间自我引导式子的迭代,直到达到阈值,人工停止或者无法产生新的信息为止。第三部分为后续处理部分,即将得到的结果用于之后的工作中。在本文的工作中,输出及后处理部分负责将输出转变为可以使用的知识或者....
本文编号:3996699
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3996699.html