司法纠纷数据的语义理解及可视分析系统的设计与实现

发布时间:2024-06-28 21:39
  随着信息化时代的发展,现有的传统司法纠纷处理系统没有办法满足时代的要求,其数据繁杂,且无法得到有效利用。以往的大量有效数据堆积,不能对未来的司法纠纷处理以及政府的决策问题产生正面影响。为了解决这一难题,本文通过技术手段将埋藏于海量数据当中的社会难点热点问题从繁杂冗余的信息中分离出来,具体分析某一时间某一地点的民众纠纷问题,以实现社会问题的深度挖掘。同时,本文运用可视分析技术,将上述数据以交互式可视图表的方式进行呈现,让市政相关工作人员可以直观迅速地从中得到有效的参考信息。为了实现上述目标,本文设计了一个基于加权TF-IDF算法实现司法纠纷文本数据分类的方法,并实现了基于该方法的一套司法纠纷数据可视分析系统。该系统旨在实现对纠纷调解记录这类司法短文本数据实现自动分类,并运用可视分析技术进行呈现,在保证数据准确性的同时帮助用户直观准确地了解到当前社会的纠纷态势,从而可以发现隐藏的社会热点问题。该系统从原始的纠纷调解数据入手,通过数据标注,模型训练,自动分类,最后进行可视化展示。本文将上述步骤分为三个部分。(1)自然语言处理。通过某市真实的纠纷数据的语料数据,经过数据清洗,中文分词,半自动文...

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

图1-1PLSA模型和LDA模型的盘子表示法比较

图1-1PLSA模型和LDA模型的盘子表示法比较

题的先验分布(每个训练文本的主题分布相对独立),它的参数随训练文本的个数呈线性增长,且无法应用于测试文本。一个更加完善的主题模型为LDA模型[15](LatentDirichletAllocationModel)被提出并得到应用。LDA模型从贝叶斯的角度为两个多项式分布添加了狄利....


图1-2由IBMWCG绘制的词云WordCloudFigure1-2.ExampleofaWordCloudgeneratedbyIBMWCG

图1-2由IBMWCG绘制的词云WordCloudFigure1-2.ExampleofaWordCloudgeneratedbyIBMWCG

司法纠纷数据的语义理解及可视分析系统的设计与实现5(1)基于词频的文本可视化作为最常见的基于词频的可视化,词云自然不可能被忽视。词云WordCloud是一种关键词的直观视觉描述,用于聚合用户生成的网站标签或者文本内容。标签内容通常是单独的词语,排列顺序灵活多变,取决于用户想表达的....


图2-1脱敏后的原始数据

图2-1脱敏后的原始数据

司法纠纷数据的语义理解及可视分析系统的设计与实现11中找到最大概率路径,并基于该路径基于单词频率找到最大分割组合。图2-1脱敏后的原始数据Figure2-1.Theoriginaldatawithmasking同时,由于汉语的表达习惯,在分词中需要注意停用词的干扰。停用词指的是样....


图2-2基于滚雪球的关键词提取模型

图2-2基于滚雪球的关键词提取模型

启动;第二部分为知识挖掘部分,用于持续统计滚雪球模型迭代循环的过程,不停进行抽取和模板之间自我引导式子的迭代,直到达到阈值,人工停止或者无法产生新的信息为止。第三部分为后续处理部分,即将得到的结果用于之后的工作中。在本文的工作中,输出及后处理部分负责将输出转变为可以使用的知识或者....



本文编号:3996699

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3996699.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户77b86***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com