当前位置:主页 > 管理论文 > 旅游管理论文 >

山西旅游微博热点话题发现及应用研究

发布时间:2020-10-19 13:34
   在新媒体时代,微博已成为网民发表个人观点,共享外界信息的重要平台,其中对于平台中发表的旅游类微博来说,不论对景区管理人员,还是用户,都具有重大意义:对于热爱旅游的普通用户,可以让他们快速了解关于旅游方面的消息,而对于旅游景点官方微博来说,通过查看其他用户通过微博发表自己游玩某地后的游记感受以及和其他用户之间相互交流,可以了解用户对于景点的感受及需求,有助于改善和提升景区服务。山西省旅游资源十分丰富,且拥有着很多独特的资源,但相对于丰富的旅游资源来说,山西省旅游行业在经营管理、宣传推广等方面还有很大发展空间,通过对旅游微博热点话题发现及相关微博返回的研究,可以充分了解用户日趋多样化、个性化的旅游需求,才能有针对性地发展具有独特卖点的市场竞争优势。本文就山西旅游微博的应用做了如下研究:第一,针对现有关于山西旅游微博研究数据集较少的问题,根据研究内容需要,确定爬取数据的指标,使用数据爬取软件自主爬取数据集,并进行分词、去停用词、文本建模的数据预处理过程,将数据集处理成计算机可以识别处理的形式,为后续进行话题发现的聚类过程奠定基础。第二,在充分分析国内外相关研究现状以及目前已有的微博热点话题榜的应用基础上,提出了一种基于改进K-means聚类算法的旅游微博话题发现方法,利用层次型聚类算法AGNES(Agglomerative Nesting)得到聚类中心,作为K-means算法聚类的初始类中心点,解决了K-means算法初始聚类中心点选择随意的问题,提高了聚类结果的稳定性。在此基础上利用K-means算法再次聚类,以克服层次聚类得到结果无法修正的问题,通过以上两步结合,可以对旅游微博文本中相似的话题进行聚类从而得到微博话题。第三,提出利用文档-主题概率分布来计算旅游话题热度的方法,在此基础上,进一步提出一种包含三层筛选过程的相关微博返回方法,综合微博内容与热点话题的相关性、用户价值、微博受关注度等因素,对旅游热点话题相关微博完成合理筛选排序,以便进行有效返回;最后结合研究结果,分析了山西旅游官博和旅游行业自身发展的现状及其隐藏的一些问题,并针对问题给出一些参考建议。通过在实际数据上的应用,证明了本文提出的改进K-means算法在文本聚类方面的性能优于其他单一聚类算法,而且使用本文提出的相关微博返回方法返回的微博其准确率也高于现有平台的准确率,即使微博用户不具有相关先验知识,也不需要全部浏览所有相关微博就可以大致了解话题的来龙去脉,以较小的阅读代价获得较好的阅读体验。
【学位单位】:山西财经大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:F592.7
【部分图文】:

向量空间模型,特征项,文档


图 2.1 向量空间模型图 表示,特征项用 t 表示,特征项指出现在文档 d 中单词征项的集合,如图 2.1 所示。对于一个包含 n 个特征项w2,…,wn),其中 wk是特征项 tk的权重,满足 1≤k≤ 模型中,假设文档长度对查询没有影响,则两个文档d1,d2)表示为向量之间的余弦距离,公式如(2.1)6LP d , FRV∑k*knk√ ∑k∑kQNnk1k、w2k分别表示文档 d1和 d2的第 k 个特征项的权重,型分析模型(Latent Sematic Analysis,LSA)模型是由

概率分布,概率模型


尤其当单词和文本数非常大时,很难k 值的选取对结果有很大影响,具有一定主观随意模型,缺乏统计基础,结果难以直观的解释。型 的不足, Hofmann 在 1999 年提出了概率隐atent Semantic Analysis,PLSA)[3],PLSA 融合了看作是主题的多项概率分布,将每个主题看做是的推导一般采用 EM 算法,能够更好地刻画一词多图 2.1 所示:P(z|d) P(w|z)d zw

流程图,模型流,多项分布,文档


DA 模型弥补 PLSA 模型关于数量参数随文档和特征项增加而线性增长的后的语料库之外的新文档分配概率的困难,Blei 在“词袋”假设之利克雷分配模型(Latent Dirichlet Allocation,LDA)[4],被定义为语模型,每篇文档都包含若干主题,表格 2.1 为流程图中各符号的具表 2.1 LDA 模型符号解释表表示 含义 参数对应分布ultinomial( ) 文档-主题多项分布 ~Dirichlet( ultinomial( ) 主题-词语多项分布 ~Dirichlet(A 模型基本流程图如图 2.2 所示:1.给文档集合中的每个文档 d,赋予文档-主题的多项分布参数
【相似文献】

相关期刊论文 前10条

1 张颖强;;从沿黄采访记看山西旅游新发展[J];新闻研究导刊;2018年16期

2 李鑫;孟秀珍;苏令军;;山西旅游形象媒介策略研究[J];山西青年职业学院学报;2016年01期

3 王伦;;提升山西旅游品牌,助力山西经济发展[J];企业导报;2016年19期

4 张雯;;山西旅游景点翻译中文化内涵的缺失及原因分析——以晋祠的翻译文本为例[J];当代旅游;2019年03期

5 ;适应新常态 发展新旅游——国旅和顺旅行分社争做实现山西旅游产业发展战略的排头兵[J];山西省人民政府公报;2016年22期

6 王飞;;山西旅游纪念品设计在新形势下的思考[J];缤纷;2016年11期

7 庄晓莹;;大美吕梁之吃在吕梁[J];青少年日记(小学版);2017年03期

8 赵鑫;;山西旅游产业发展现状研究[J];城市地理;2017年02期

9 张津;;表里山河 人文祖地——山西旅游胜地[J];现代职业教育;2017年03期

10 化春光;马慧英;;山西旅游的光荣与梦想——推动转型升级 促进富民强省[J];旅游时代;2015年03期


相关硕士学位论文 前10条

1 常彤;山西旅游微博热点话题发现及应用研究[D];山西财经大学;2019年

2 曹暄雅;舞蹈在山西旅游开发中的艺术价值研究[D];山西大学;2019年

3 胡锦蓉;山西旅游形象的传播与提升[D];河北师范大学;2019年

4 冀敏;《发现最美古中国 山西秘境》(节译)翻译实践报告[D];重庆师范大学;2019年

5 武雷霞;基于旅游消费升级的山西旅游产业发展研究[D];山西财经大学;2018年

6 唐淼;基于游客视角的山西旅游目的地品牌建设评价及提升策略研究[D];湘潭大学;2018年

7 牛豪玲;《山西旅游风景名胜丛书·晋祠》翻译实践报告[D];山西大学;2018年

8 刘佳;电视旅游节目中山西旅游形象呈现研究[D];山西大学;2018年

9 董礼;2017山西旅游发展大会领导人致辞口译实践报告[D];首都经济贸易大学;2018年

10 郭花;山西旅游形象的媒体报道分析[D];山西大学;2015年



本文编号:2847274

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lvyoujiudianguanlilunwen/2847274.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户85600***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com