山西旅游微博热点话题发现及应用研究
【学位单位】:山西财经大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:F592.7
【部分图文】:
图 2.1 向量空间模型图 表示,特征项用 t 表示,特征项指出现在文档 d 中单词征项的集合,如图 2.1 所示。对于一个包含 n 个特征项w2,…,wn),其中 wk是特征项 tk的权重,满足 1≤k≤ 模型中,假设文档长度对查询没有影响,则两个文档d1,d2)表示为向量之间的余弦距离,公式如(2.1)6LP d , FRV∑k*knk√ ∑k∑kQNnk1k、w2k分别表示文档 d1和 d2的第 k 个特征项的权重,型分析模型(Latent Sematic Analysis,LSA)模型是由
尤其当单词和文本数非常大时,很难k 值的选取对结果有很大影响,具有一定主观随意模型,缺乏统计基础,结果难以直观的解释。型 的不足, Hofmann 在 1999 年提出了概率隐atent Semantic Analysis,PLSA)[3],PLSA 融合了看作是主题的多项概率分布,将每个主题看做是的推导一般采用 EM 算法,能够更好地刻画一词多图 2.1 所示:P(z|d) P(w|z)d zw
DA 模型弥补 PLSA 模型关于数量参数随文档和特征项增加而线性增长的后的语料库之外的新文档分配概率的困难,Blei 在“词袋”假设之利克雷分配模型(Latent Dirichlet Allocation,LDA)[4],被定义为语模型,每篇文档都包含若干主题,表格 2.1 为流程图中各符号的具表 2.1 LDA 模型符号解释表表示 含义 参数对应分布ultinomial( ) 文档-主题多项分布 ~Dirichlet( ultinomial( ) 主题-词语多项分布 ~Dirichlet(A 模型基本流程图如图 2.2 所示:1.给文档集合中的每个文档 d,赋予文档-主题的多项分布参数
【相似文献】
相关期刊论文 前10条
1 张颖强;;从沿黄采访记看山西旅游新发展[J];新闻研究导刊;2018年16期
2 李鑫;孟秀珍;苏令军;;山西旅游形象媒介策略研究[J];山西青年职业学院学报;2016年01期
3 王伦;;提升山西旅游品牌,助力山西经济发展[J];企业导报;2016年19期
4 张雯;;山西旅游景点翻译中文化内涵的缺失及原因分析——以晋祠的翻译文本为例[J];当代旅游;2019年03期
5 ;适应新常态 发展新旅游——国旅和顺旅行分社争做实现山西旅游产业发展战略的排头兵[J];山西省人民政府公报;2016年22期
6 王飞;;山西旅游纪念品设计在新形势下的思考[J];缤纷;2016年11期
7 庄晓莹;;大美吕梁之吃在吕梁[J];青少年日记(小学版);2017年03期
8 赵鑫;;山西旅游产业发展现状研究[J];城市地理;2017年02期
9 张津;;表里山河 人文祖地——山西旅游胜地[J];现代职业教育;2017年03期
10 化春光;马慧英;;山西旅游的光荣与梦想——推动转型升级 促进富民强省[J];旅游时代;2015年03期
相关硕士学位论文 前10条
1 常彤;山西旅游微博热点话题发现及应用研究[D];山西财经大学;2019年
2 曹暄雅;舞蹈在山西旅游开发中的艺术价值研究[D];山西大学;2019年
3 胡锦蓉;山西旅游形象的传播与提升[D];河北师范大学;2019年
4 冀敏;《发现最美古中国 山西秘境》(节译)翻译实践报告[D];重庆师范大学;2019年
5 武雷霞;基于旅游消费升级的山西旅游产业发展研究[D];山西财经大学;2018年
6 唐淼;基于游客视角的山西旅游目的地品牌建设评价及提升策略研究[D];湘潭大学;2018年
7 牛豪玲;《山西旅游风景名胜丛书·晋祠》翻译实践报告[D];山西大学;2018年
8 刘佳;电视旅游节目中山西旅游形象呈现研究[D];山西大学;2018年
9 董礼;2017山西旅游发展大会领导人致辞口译实践报告[D];首都经济贸易大学;2018年
10 郭花;山西旅游形象的媒体报道分析[D];山西大学;2015年
本文编号:2847274
本文链接:https://www.wllwen.com/guanlilunwen/lvyoujiudianguanlilunwen/2847274.html