社交网络中用户生成内容隐含位置的推测方法研究
发布时间:2023-01-29 17:50
随着社交网络兴起,用户在社交网络上产生了大量的用户生成内容,其中基于位置的用户生成内容可为个性化推荐、事件检测、舆情监控等智能应用提供服务。然而社交网络中仅有极少数的用户生成内容被标记了位置,而且已有面向用户生成内容的位置推测方法多是城市级粗粒度的,不利于为用户提供更精准的个性化服务。为此,本文提出了一种推测社交网络中用户生成内容隐含的细粒度位置的方法,该方法包括以下三部分。首先,解决用户生成内容中的实体识别问题。本文提出一种根据知识库和自然语言处理技术构建的实体识别模型,用自然语言处理技术识别句子成分,根据知识库识别不同句子成分中的实体,对拼写错误的实体通过词干提取获得实体。在一定程度上解决了社交网络中用户生成内容具有的口语话、拼写错误、不规则书写等问题。其次,解决用户生成内容的过滤问题。社交网络中的用户生成内容涵盖面非常广泛,不是所有的用户生成内容都适合于位置推测。因此本文提出一种用户生成内容过滤模型,该模型根据地名库和实体位置相关性函数判断用户生成内容是否可用于位置推测。最后,构建用于用户生成内容中隐含位置推测的实体位置模型。该模型以基于地理位置的社交网络中的数据为数据集,抽取数...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状分析
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文研究内容
1.4 论文结构安排
2 用户生成内容的实体识别
2.1 实体识别背景知识
2.1.1 Probase介绍
2.1.2 自然语言处理技术
2.2 实体识别现有方法研究
2.2.1 基于Probase的实体识别
2.2.2 基于自然语言处理的实体识别
2.3 FG_UGC的用户生成内容实体识别
2.3.1 FG_UGC的实体识别方案设计
2.3.2 FG_UGC的实体识别具体过程
2.4 本章小结
3 用户生成内容的过滤
3.1 用户生成内容过滤原则
3.2 用户生成内容过滤模型
3.3 地名实体的识别
3.3.1 地理数据库
3.3.2 地名实体的识别
3.4 位置相关实体的识别
3.4.1 TFIDF简介
3.4.2 实体的位置相关性函数
3.4.3 基于实体的位置相关性函数过滤
3.5 本章小结
4 用户生成内容的位置推测
4.1 位置推测理论
4.2 实体-位置模型
4.2.1 实体-位置模型框架
4.2.2 实体-位置模型的建立
4.3 用户生成内容的位置推测
4.3.1 待推测UGC的实体加权
4.3.2 UGC的候选位置的排序
4.4 本章小结
5 实验结果与分析
5.1 实验数据的采集
5.2 实验说明
5.3 实验分析
5.3.1 PoI的 tip数目的影响
5.3.2 过滤参数?的影响
5.3.3 参数topn的影响
5.3.4 与现有方法的比较
5.3.5 松弛条件下的准确率
5.4 本章小结
6 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
附录
【参考文献】:
期刊论文
[1]基于改进的TF-IDF算法及共现词的主题词抽取算法[J]. 公冶小燕,林培光,任威隆,张晨,张春云. 南京大学学报(自然科学). 2017(06)
[2]基于短文本情感分析的敏感信息识别[J]. 李扬,潘泉,杨涛. 西安交通大学学报. 2016(09)
[3]基于语料库的英语文章语法错误检查及纠正方法[J]. 谭咏梅,王晓辉,杨一枭. 北京邮电大学学报. 2016(04)
[4]基于迁移的微博分词和文本规范化联合模型[J]. 钱涛,姬东鸿,戴文华. 华南理工大学学报(自然科学版). 2015(11)
[5]一种大数据环境下的在线社交媒体位置推断方法[J]. 王凯,余伟,杨莎,吴敏,胡亚慧,李石君. 软件学报. 2015(11)
[6]相关实体发现中基于Wikipedia的实体排序[J]. 张俊三,瞿有利,税仪冬,田盛丰. 计算机研究与发展. 2014(06)
[7]基于改进Trie树结构的正向最大匹配算法[J]. 熊志斌,朱剑锋. 计算机应用与软件. 2014(05)
[8]知识共享许可协议的兼容性研究[J]. 傅蓉. 图书情报工作. 2013(21)
[9]基于后缀树的带有通配符的模式匹配研究[J]. 侯宝剑,谢飞,胡学钢,刘应玲,王海平. 计算机科学. 2012(12)
[10]空间数据上Top-k关键词模糊查询算法[J]. 胡骏,范举,李国良,陈姗姗. 计算机学报. 2012(11)
博士论文
[1]社会化电子商务用户信息采纳过程及影响因素研究[D]. 耿荣娜.吉林大学 2017
[2]实体搜索与实体解析方法研究[D]. 姜丽丽.兰州大学 2012
硕士论文
[1]移动社交网络中的位置预测方法研究[D]. 吴琪.重庆邮电大学 2016
[2]支持多语义层次的短文本特征提取及其分类技术[D]. 贾霞光.东北大学 2014
[3]基于位置社交网络的个性化地点推荐算法研究[D]. 王静金.厦门大学 2014
本文编号:3732735
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状分析
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文研究内容
1.4 论文结构安排
2 用户生成内容的实体识别
2.1 实体识别背景知识
2.1.1 Probase介绍
2.1.2 自然语言处理技术
2.2 实体识别现有方法研究
2.2.1 基于Probase的实体识别
2.2.2 基于自然语言处理的实体识别
2.3 FG_UGC的用户生成内容实体识别
2.3.1 FG_UGC的实体识别方案设计
2.3.2 FG_UGC的实体识别具体过程
2.4 本章小结
3 用户生成内容的过滤
3.1 用户生成内容过滤原则
3.2 用户生成内容过滤模型
3.3 地名实体的识别
3.3.1 地理数据库
3.3.2 地名实体的识别
3.4 位置相关实体的识别
3.4.1 TFIDF简介
3.4.2 实体的位置相关性函数
3.4.3 基于实体的位置相关性函数过滤
3.5 本章小结
4 用户生成内容的位置推测
4.1 位置推测理论
4.2 实体-位置模型
4.2.1 实体-位置模型框架
4.2.2 实体-位置模型的建立
4.3 用户生成内容的位置推测
4.3.1 待推测UGC的实体加权
4.3.2 UGC的候选位置的排序
4.4 本章小结
5 实验结果与分析
5.1 实验数据的采集
5.2 实验说明
5.3 实验分析
5.3.1 PoI的 tip数目的影响
5.3.2 过滤参数?的影响
5.3.3 参数topn的影响
5.3.4 与现有方法的比较
5.3.5 松弛条件下的准确率
5.4 本章小结
6 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
附录
【参考文献】:
期刊论文
[1]基于改进的TF-IDF算法及共现词的主题词抽取算法[J]. 公冶小燕,林培光,任威隆,张晨,张春云. 南京大学学报(自然科学). 2017(06)
[2]基于短文本情感分析的敏感信息识别[J]. 李扬,潘泉,杨涛. 西安交通大学学报. 2016(09)
[3]基于语料库的英语文章语法错误检查及纠正方法[J]. 谭咏梅,王晓辉,杨一枭. 北京邮电大学学报. 2016(04)
[4]基于迁移的微博分词和文本规范化联合模型[J]. 钱涛,姬东鸿,戴文华. 华南理工大学学报(自然科学版). 2015(11)
[5]一种大数据环境下的在线社交媒体位置推断方法[J]. 王凯,余伟,杨莎,吴敏,胡亚慧,李石君. 软件学报. 2015(11)
[6]相关实体发现中基于Wikipedia的实体排序[J]. 张俊三,瞿有利,税仪冬,田盛丰. 计算机研究与发展. 2014(06)
[7]基于改进Trie树结构的正向最大匹配算法[J]. 熊志斌,朱剑锋. 计算机应用与软件. 2014(05)
[8]知识共享许可协议的兼容性研究[J]. 傅蓉. 图书情报工作. 2013(21)
[9]基于后缀树的带有通配符的模式匹配研究[J]. 侯宝剑,谢飞,胡学钢,刘应玲,王海平. 计算机科学. 2012(12)
[10]空间数据上Top-k关键词模糊查询算法[J]. 胡骏,范举,李国良,陈姗姗. 计算机学报. 2012(11)
博士论文
[1]社会化电子商务用户信息采纳过程及影响因素研究[D]. 耿荣娜.吉林大学 2017
[2]实体搜索与实体解析方法研究[D]. 姜丽丽.兰州大学 2012
硕士论文
[1]移动社交网络中的位置预测方法研究[D]. 吴琪.重庆邮电大学 2016
[2]支持多语义层次的短文本特征提取及其分类技术[D]. 贾霞光.东北大学 2014
[3]基于位置社交网络的个性化地点推荐算法研究[D]. 王静金.厦门大学 2014
本文编号:3732735
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3732735.html