基于舆情大数据的突发事件实时检测算法与系统
【文章页数】:111 页
【学位级别】:硕士
【部分图文】:
图2-2无限状态Kleinberg状态机模型
第二章相关背景知识10图2-2无限状态Kleinberg状态机模型2.1.2文本表示方法在自然语言处理技术中,需要将文本表示为计算机能够计算的结构化数据,才能通过计算机进行下一步的文本处理。从不同的角度出发,已经有大量研究者提出了不同的文本表示方法。目前常用的几种文本表示方法主要....
图2-3LDA概率图模型
第二章相关背景知识11LDA是一种三层次的贝叶斯概率模型,作为一种生成式概率主题模型,其基本思想是将文档表示为潜在主题的概率分布,将每个潜在主题表示为对应词的概率分布。LDA的生成过程如图2-3所示:图2-3LDA概率图模型图中M为文档集合总数量,K为潜在主题个数,R为第m篇文档....
图2-4CBOW模型与Skip-gram模型
第二章相关背景知识12型收敛之后,就可以得到该文档对应的主题分布与各主题下的词分布。(3)基于神经网络的分布式表示基于神经网络的分布式表示(DistributedRepresentation)又称为词嵌入,它们将每一个词映射成定长的密集向量。Bengio等人在2003年提出了最经....
图2-5Spark生态系统组件(1)SparkSQL组件可以处理结构化数据,提供了统一的数据访问借口,可
第二章相关背景知识17图2-5Spark生态系统组件(1)SparkSQL组件可以处理结构化数据,提供了统一的数据访问借口,可以将分布式SQL查询与Spark程序无缝对接,实现高效的数据查询与读取;(2)SparkStreaming提供了流计算组件,具有高吞吐、容错能力强的特点,....
本文编号:3912521
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3912521.html