含地理位置信息的社交媒体挖掘及应用
本文选题:基于地理位置的服务 + 社交媒体挖掘 ; 参考:《中国科学技术大学》2014年博士论文
【摘要】:近年来,随着移动互联网技术的发展和智能移动终端的普及,人们越来越习惯于通过智能移动终端上的应用随时随地获取或分享信息。在用于信息获取和分享的移动应用中,基于用户地理位置的服务已成为主流。人们在使用此类应用的过程中,产生了海量的含有地理位置信息的社交媒体数据,并且此类数据的规模呈爆炸性增长。这一类新型的海量媒体数据的出现,为许多研究领域带来了新的机遇和挑战,吸引了研究人员的兴趣和广泛关注。 与传统的媒体数据相比,含地理位置信息的社交媒体数据具有独特性质,主要表现在以下三个方面:异构的地理信息表达和组成方式;强调移动性、时效性和交互性;包含空间、时间、社交等丰富上下文信息和多模态媒体内容。本论文针对含地理位置信息的社交媒体的上述三个特性所带来的科学问题,研究此类媒体的挖掘和推荐算法,包括:异构地理信息社交媒体融合挖掘算法;面向移动应用的高效在线推荐算法;以及融合多种上下文信息的个性化推荐算法。 论文的主要研究工作和创新成果如下: 1.提出了一种异构地理信息社交媒体融合挖掘算法以及基于二部图结构的重排序算法。 论文针对点评网站等基于地理位置的服务中,结构化数据缺乏语义信息而难以应对特定信息需求的问题,提出了结构化和非结构化社交媒体数据的融合挖掘算法,用来对结构化数据的语义信息进行补充。在此基础上,又提出了一种基于二部图的排序算法对基于地理位置的服务中的商户进行重排序。实验结果表明:与仅使用点评网站中结构化信息的挖掘算法相比,论文所提出的融合挖掘算法的平均准确率均值相对提升了73%;相比于仅使用点评网站中结构信息的排序算法,以及仅使用商户在点评网站中原始评分的排序算法,论文提出的基于二部图结构并融合多种因素对商户进行重排序的算法更能满足用户的特定信息需求。 2.提出了一种面向移动应用的高效在线推荐算法。 论文针对移动应用场景中的在线地点推荐问题,提出了一种基于前缀树结构的可变记忆马尔科夫模型。论文所提出的算法从用户的历史地点序列中挖掘频繁序列模式,并以此构建前缀树结构,从而能够根据用户当前的地点高效地向用户推荐下一个地点,并根据用户的反馈动态调整模型。对于长度为l的地点序列,论文所提出的算法相比于传统的可变记忆马尔科夫模型:概率后缀树算法,将时间复杂度从O(Dl)降低至O(l),因此可以满足推荐的实时性要求。在提升算法效率的同时,实验结果表明,论文所提出的带有平滑模型的可变记忆马尔科夫模型能获得更高的推荐准确率。与固定阶数马尔科夫模型所能取得的最好结果相比,论文所提出的算法的平均准确率均值相对提升了69%;与概率后缀树算法相比,论文所提出的算法的平均准确率均值相对提升了36%。此外,论文所提出的在线地点推荐算法仅依赖于用户当前地点信息,所以该算法能够以很少的代价嵌入现有的各类基于地理位置服务的移动应用中。另外如果将“地点”的概念进行推广,该算法可以应用于地点推荐以外的其它问题,例如网页中用户点击行为预测、搜索引擎查询词推荐等。 3.提出了一种融合多种上下文信息的个性化推荐算法。 论文针对照片分享网站中海量社交媒体数据及其包含的丰富上下文信息,研究个性化的地点推荐算法。论文所提出的算法首先充分挖掘了照片分享网站中各种上下文信息,包括GPS位置信息、照片拍摄时间、用户信息、文本信息、照片视觉信息。在此基础上,该算法从多个方面计算地点与用户兴趣的匹配程度,并把融合多种上下文信息进行个性化推荐的问题建模为排序学习的问题,从而融合多种地点与用户兴趣度评分进行个性化的地点推荐。实验结果表明,论文所提出的算法能有效提高推荐的准确率,特别是在用户的历史信息比较稀少的情况下有显著提升。例如,实验数据集里42.7%的用户的历史地点序列中仅包含4个地点,论文所提出的算法在这种情况下平均准确率均值相对现有典型算法提升了27.5%。此外,论文提出的利用排序学习框架进行推荐的算法不仅限于个性化地点推荐问题,也可以应用于其它需要融合多种上下文信息进行推荐的问题。 论文的最后对全文的研究工作进行了总结,并对未来的研究方向做出了展望。
[Abstract]:In recent years , with the development of mobile internet technology and the popularization of intelligent mobile terminals , people become more and more accustomed to acquiring or sharing information anytime and anywhere through the application of intelligent mobile terminals .
Compared with the traditional media data , the social media data with geographical position information is unique in nature , mainly in the following three aspects : heterogeneous geographic information expression and composition mode ;
Emphasis on mobility , timeliness and interactivity ;
This paper focuses on the scientific problems brought by the three characteristics of social media with geo - location information , and studies the mining and recommendation algorithms of such media , including : heterogeneous geographic information social media fusion mining algorithm ;
Efficient online recommendation algorithm for mobile applications
and a personalized recommendation algorithm for fusing various contextual information .
The main research and innovation results of the thesis are as follows :
1 . A heterogeneous geographic information social media fusion mining algorithm and a re - ordering algorithm based on two - part graph structure are proposed .
Aiming at the problem that the structured data lacks the semantic information and it is difficult to deal with the specific information needs in the service of the location - based service such as the website evaluation website , this paper puts forward a fusion mining algorithm of structured and unstructured social media data , which is used to supplement the semantic information of structured data .
Compared with the ranking algorithm using only the structure information in the website evaluation website , and only using the sorting algorithm of the original score of the merchant in the evaluation website , the algorithm based on the two - part graph structure and integrating various factors to reorder the merchant can meet the specific information requirement of the user more .
2 . An efficient online recommendation algorithm for mobile applications is proposed .
This paper proposes a variable memory Markov model based on prefix tree structure aiming at the online location recommendation problem in mobile application scenario . The proposed algorithm can be used to mine frequent sequence patterns from the user ' s historical site sequence and construct the prefix tree structure . The proposed algorithm can efficiently recommend the next place from O ( Dl ) to O ( l ) according to the current location of the user .
Compared with the probabilistic suffix tree algorithm , the mean accuracy of the proposed algorithm is relatively improved by 36 % . In addition , the proposed online location recommendation algorithm relies only on the user ' s current location information , so the algorithm can be embedded in the existing mobile applications based on geographic location services at a very low cost .
3 . A personalized recommendation algorithm combining multiple contextual information is proposed .
In this paper , the author puts forward that the proposed algorithm can effectively improve the accuracy of the recommendation , including GPS position information , photograph shooting time , user information , text information and photo visual information . The results show that the proposed algorithm can improve the accuracy of the recommendation effectively , especially if the user ' s history information is scarce .
Finally , the thesis summarizes the research work of the full text , and looks forward to the future research direction .
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:TP393.09
【共引文献】
相关期刊论文 前10条
1 韩强;;基于广义Hough变换的手写文档整词定位[J];安徽电子信息职业技术学院学报;2011年05期
2 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
3 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
4 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
5 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
6 程刚;郑小华;阳锋;徐祖舰;;三维全景视觉技术在农业机器人中的应用[J];安徽农业科学;2010年34期
7 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
8 何海燕;施培蓓;;基于改进AdaBoost算法的行人检测方法[J];安庆师范学院学报(自然科学版);2009年03期
9 吴慧兰;刘国栋;刘炳国;胡涛;浦昭邦;;ICF实验靶定位技术研究[J];半导体光电;2008年05期
10 邹心遥;姚若河;;基于LSSVM的威布尔分布形状参数估计(英文)[J];半导体技术;2008年06期
相关会议论文 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 刘善磊;张亮;;基于相位相关和SURF算法的关键帧实时匹配研究[A];江苏省测绘学会2011年学术年会论文集[C];2011年
3 隋树林;孙立宏;姚文龙;袁健;;融合改进UKF/SIFT信息的自主光学导航方法[A];第二十六届中国控制会议论文集[C];2007年
4 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
5 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
6 汪力;叶桦;夏良正;;利用特征点定位嘴巴[A];第二十六届中国控制会议论文集[C];2007年
7 ;Loop-closing By Using SIFT Features for Mobile Robots[A];第二十六届中国控制会议论文集[C];2007年
8 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
9 周凯;范瑞霞;李位星;;一种基于SIFT的MeanShift-粒子滤波融合跟踪算法[A];第二十九届中国控制会议论文集[C];2010年
10 ;Rapid Target Recognition and Tracking under Large Scale Variation Using Semi-Naive Bayesian[A];第二十九届中国控制会议论文集[C];2010年
相关博士学位论文 前10条
1 王玉全;基于全景视觉的移动机器人同时定位与地图创建方法研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
5 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
6 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年
7 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
8 肖洁;视觉注意模型及其在目标感知中的应用研究[D];华中科技大学;2010年
9 朱清波;序列图像三维重建方法研究[D];华中科技大学;2010年
10 田文;多视图图像的快速三维场景重建[D];华中科技大学;2010年
相关硕士学位论文 前10条
1 宋抗;压缩机活塞圆度误差数字检测系统研究[D];河南理工大学;2010年
2 陈忠翔;基于立体视觉的三维重建方法研究[D];南昌航空大学;2010年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 雒燕飞;地质灾害应急地理信息数据库设计及其应用[D];山东科技大学;2010年
5 唐红梅;基于辐射与空间信息的遥感图像检索[D];山东科技大学;2010年
6 倪希亮;基于尺度不变特征的多源遥感影像配准[D];山东科技大学;2010年
7 贾伟洁;SAR影像与光学影像配准研究[D];山东科技大学;2010年
8 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
9 任天宇;自稳定航拍系统算法与设计[D];长春理工大学;2010年
10 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
,本文编号:1858067
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1858067.html