当前位置:主页 > 科技论文 > 软件论文 >

跨媒体旅游大数据中时空信息的获

发布时间:2018-06-25 21:57

  本文选题:旅游时空信息 + 地理标签 ; 参考:《北京邮电大学》2016年硕士论文


【摘要】:来自互联网的文本、图像、视频等跨媒体大数据中隐含了丰富的、非结构化的时空信息,它们对于感知旅游环境和游客状态,按需提供个性化服务具有重要意义。为了更好地获取并利用这些时空信息,本文结合旅游时空信息的特点,对跨媒体旅游大数据中时空信息的获取、表达与挖掘进行研究。论文完成的主要工作如下:(1)提出了一种基于地理标签的旅游时空信息获取算法(GT-STA)。构建了时空数据爬取模型,从地理标签中抽取地名、时间、位置等信息,并对数据进行筛选处理,实现了地理标签中旅游时空信息的获取。提出了一种基于地理标记照片的旅游景点多地理特征获取算法(GTP-MFA)。应用Mean Shift聚类算法对复杂景点进行内部划分,并引入用户特征计算地理特征权重值,实现了复杂景点的多地理特征获取。实验结果表明,相比基于命名实体识别筛选的时空信息获取算法(NER-STA)和基于地名数据库的时空信息获取算法(TD-STA),本文提出的GT-STA算法在时空信息获取的准确率指标方面分别平均提升了 54.9%、26.7%;相比基于统计方法的多地理特征获取算法(SM-MFA)和基于Mean Shift聚类的多地理特征获取算法(MS-MFA),本文提出的GTP-MFA算法在旅游景点地理特征获取的准确率指标方面分别平均提升了 20.0%、23.3%,在召回率指标方面分别平均提升了 59.8%、9.9%。(2)提出了一种基于跨媒体信息摘要的时空信息表达算法(CMS-STE)。将旅游景点跨媒体数据中的图像间相似度、文本标签间相似度、图像与文本标签间相似度融合为跨媒体相似度矩阵,使用候选图文质量评分机制提升摘要质量,经近邻传播(AP)聚类获得图文簇集合,从中选取图像摘要和文本标签摘要,最终以跨媒体摘要形式实现了景点时空信息的表达。实验结果表明,相比基于K-means聚类的图文摘要算法和基于AP聚类的图文摘要算法,本文提出的CMS-STE算法在图像查准率指标方面分别平均提升了 27.7%、14.7%,在文本标签查准率指标方面分别平均提升了 16.9%、9.1%;在图像跨媒体相关率指标方面分别平均提升了 40.1%、33.8%,在文本标签跨媒体查全率指标方面分别平均提升了 14.8%、11.0%。(3)提出了 一种基于MapReduce的游客活动模式挖掘算法(MR-TPM)。对地理标签数据进行Mean Shift聚类处理,获得游客兴趣点。进行游客频繁活动模式挖掘,对局部频繁项集剪枝处理以减少节点的负荷,挖掘得到游客在兴趣点间活动轨迹的频繁项集,实现了旅游时空大数据中游客活动模式的并行挖掘。实验结果表明。相比基于K次MapReduce的Apriori并行算法(MRKA)和基于两次MapReduce的Apriori并行算法(MRA),本文提出的MR-TPM算法在运行时间指标方面分别平均降低了 57.1%、35.9%。采用提出的MR-TPM算法挖掘得到了游客在北京市内的频繁活动模式集合。(4)设计并实现了一个跨媒体旅游大数据中时空信息获取、表达与挖掘系统,对本文所提出的基于地理标签的旅游时空信息获取算法、基于地理标记照片的旅游景点多地理特征获取算法、基于跨媒体信息摘要的时空信息表达算法以及基于MapReduce的游客活动模式挖掘算法进行验证。验证结果表明,本文所提出的上述算法能够较好地满足跨媒体旅游大数据中时空信息获取、表达与挖掘的需要,系统具有较好的容错性,能基本满足游客应用需求。
[Abstract]:In order to get and utilize the space - time information acquisition algorithm based on geographical label , this paper proposes a multi - geographical feature acquisition algorithm based on geographical label . This paper presents an algorithm of spatial and temporal information acquisition based on MapReduce . The results show that the proposed algorithm can better meet the time - space information acquisition , expression and mining in the large data of cross - media tourism . The results show that the proposed algorithm can better meet the needs of spatial and temporal information acquisition , expression and mining in the large data of cross - media tourism .
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13

【参考文献】

相关期刊论文 前10条

1 马雷雷;李宏伟;梁汝鹏;连世伟;龚竞;;基于地名本体的地名知识表达方法[J];测绘科学技术学报;2015年03期

2 余丽;陆锋;张恒才;;网络文本蕴涵地理信息抽取:研究进展与展望[J];地球信息科学学报;2015年02期

3 袁烨城;刘海江;裴韬;高锡章;;基于语义知识的空间关系识别研究[J];地球信息科学学报;2014年05期

4 李照航;傅学庆;郭风华;李仁杰;;旅游地文本中的细粒度地名可视化方法[J];测绘科学;2015年01期

5 李德仁;姚远;邵振峰;;智慧城市中的大数据[J];武汉大学学报(信息科学版);2014年06期

6 吉根林;赵斌;;面向大数据的时空数据挖掘综述[J];南京师大学报(自然科学版);2014年01期

7 黄思思;;国内智慧旅游研究综述[J];地理与地理信息科学;2014年02期

8 黄勋;游宏梁;于洋;;关系抽取技术研究综述[J];现代图书情报技术;2013年11期

9 刘大有;陈慧灵;齐红;杨博;;时空数据挖掘研究进展[J];计算机研究与发展;2013年02期

10 李玲玲;金泰松;李翠华;;基于局部特征和隐条件随机场的场景分类方法[J];北京理工大学学报;2012年07期

相关博士学位论文 前1条

1 张春菊;中文文本中事件时空与属性信息解析方法研究[D];南京师范大学;2013年

相关硕士学位论文 前2条

1 郭佳;场景图像分类的相关技术研究[D];西安电子科技大学;2013年

2 王宇;基于网络文本的地名空间模糊建模[D];南京师范大学;2012年



本文编号:2067670

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2067670.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6cb27***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com