文本表示方法对微博Hashtag推荐影响研究——以Twitter上H7N9微博为例
本文关键词:文本表示方法对微博Hashtag推荐影响研究——以Twitter上H7N9微博为例
更多相关文章: Hashtag推荐 K最近邻 文本表示 深度学习
【摘要】:在总结国内外Hashtag推荐方法和短文本表示方法的基础上,文章利用基于K最近邻(KNN)的Hashtag推荐方法,将微博文本表示为向量然后计算相似度,从语料中选出与目标微博最相似的微博文本,然后抽取候选Hashtag。文章比较了向量空间模型(VSM)、潜在语义分析模型(LSA)、隐含狄利克雷分布模型(LDA)、深度学习(DL)等四种文本表示方法对基于KNN的Hashtag推荐效果的影响。以Twitter上H7N9微博为测试数据,实验结果表明深度学习的文本表示方法在基于KNN的Hashtag推荐中取得最好的效果。
【作者单位】: 南京理工大学信息管理系;江苏省数据工程与知识服务重点实验室(南京大学);
【关键词】: Hashtag推荐 K最近邻 文本表示 深度学习
【基金】:国家社会科学基金重大项目“面向突发事件应急决策的快速响应情报体系研究”(项目编号:13&ZD174);国家社会科学基金项目“在线社交网络中基于用户的知识组织模式研究”(项目编号:14BTQ033) 江苏省数据工程与知识服务重点实验室开放课题“在线社交网络上交叉学科用户知识结构发现及其兴趣演变研究”(项目编号:DEKS2014KT006)研究成果之一
【分类号】:TP391.1;TP393.092
【正文快照】: 1引言当前,各种主流微博平台都提供Hashtag标注功能,如关于马航坠机事件的Hashtag在Twitter中为“#MH370”,在新浪微博中为“#MH370#”,虽然不同微博平台中Hashtag的具体标记形式可能不同,但功能基本相同,都具有主题标注和话题参与的功能[1-3]。主题标注功能指Hashtag能够表达
【参考文献】
中国期刊全文数据库 前1条
1 邸亮;杜永萍;;LDA模型在微博用户推荐中的应用[J];计算机工程;2014年05期
【共引文献】
中国期刊全文数据库 前10条
1 马宁;刘怡君;;基于超网络中超边排序算法的网络舆论领袖识别[J];系统工程;2013年09期
2 马宝君;张楠;孙涛;;智慧城市背景下公众反馈大数据分析:概率主题建模的视角[J];电子政务;2013年12期
3 易军凯;田立康;;基于类别区分度的文本特征选择算法研究[J];北京化工大学学报(自然科学版);2013年S1期
4 代宽;赵辉;韩冬;宋天勇;;基于向量空间模型的中文网页主题特征项抽取[J];吉林大学学报(信息科学版);2014年01期
5 吴瑞红;吕学强;;基于互联网的术语定义辨析[J];北京大学学报(自然科学版);2014年01期
6 罗琦;;一种最大分类间隔SVDD的多类文本分类算法[J];电讯技术;2014年04期
7 方跃胜;姚宏亮;;基于电力公司的多格式文档智能信息检索系统的设计与实现[J];重庆科技学院学报(自然科学版);2014年04期
8 李超;李昂;朱耿良;;基于限制性玻尔兹曼机的微博主题分类[J];电信网技术;2014年07期
9 黄永锋;李奇;;基于特征项聚合的古典诗歌分类模型[J];东华大学学报(自然科学版);2014年05期
10 徐晓彤;胡松筠;;社交网站用户兴趣模型研究[J];科技和产业;2014年11期
中国重要会议论文全文数据库 前1条
1 刘权;郭武;;基于核主成分分析的话题跟踪系统[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 王宝勋;面向网络社区问答对的语义挖掘研究[D];哈尔滨工业大学;2013年
2 张俊三;Web中相关实体发现研究[D];北京交通大学;2013年
3 张乃静;基于林业科学数据的语义检索研究[D];中国林业科学研究院;2013年
4 刘浏;基于内容的重排列视频检索技术研究[D];上海交通大学;2013年
5 吕英杰;网络健康社区中的文本挖掘方法研究[D];上海交通大学;2013年
6 张琦;基于聚合场模型的数据竞争算法及其应用研究[D];哈尔滨工程大学;2013年
7 谭琦;面向跨领域文档分类的异构迁移学习算法研究[D];华南理工大学;2013年
8 张琳;基于引用聚类的多文档自动文摘技术研究[D];大连海事大学;2013年
9 萧筝;客户需求信息处理理论和方法研究[D];武汉理工大学;2013年
10 张莹;在线新闻评论的情感分析研究[D];南开大学;2013年
中国硕士学位论文全文数据库 前10条
1 谢娜娜;基于不均衡数据集的文本分类算法研究[D];重庆大学;2013年
2 王强;非均衡文本分类的特征选择研究[D];南京师范大学;2013年
3 项峻求;文本分类在电子政务平台中的应用与研究[D];南昌大学;2013年
4 余峰;项目评审专家推荐方法研究[D];昆明理工大学;2013年
5 张睿;基于SVM的中文文本分类相关算法研究与实现[D];昆明理工大学;2013年
6 张健飞;子空间分类算法研究及应用[D];福建师范大学;2013年
7 杜娟娟;主题爬虫算法的研究与实现[D];兰州交通大学;2013年
8 许钰;基于半监督SVM主动学习的文本分类算法研究[D];兰州交通大学;2013年
9 陈华城;基于本体的文档敏感信息检测关键技术研究[D];解放军信息工程大学;2013年
10 陈永光;基于OPAC的高校图书馆个性化图书推荐算法研究[D];南京理工大学;2013年
【二级参考文献】
中国期刊全文数据库 前3条
1 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期
2 张晓艳;王挺;梁晓波;;LDA模型在话题追踪中的应用[J];计算机科学;2011年S1期
3 孙昌年;郑诚;夏青松;;基于LDA的中文文本相似度计算[J];计算机技术与发展;2013年01期
,本文编号:600999
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/600999.html