面向在线社交网络用户生成内容的饮食话题发现研究
本文关键词:面向在线社交网络用户生成内容的饮食话题发现研究
更多相关文章: 话题检测 用户生成内容 主题覆盖率 饮食挖掘
【摘要】:【目的】通过大规模文本聚类技术进行话题检测,并自动拣选优质话题。【方法】以新浪微博上与饮食相关的微博内容为数据源,结合文本聚类与深度学习知识进行话题检测。通过匹配微博发布的月份,将微博划分为四季微博;使用向量空间模型和文本聚类方法,对不同季节的微博进行话题检测,获得候选话题;结合深度学习知识,提出主题覆盖率概念,用以自动评价话题质量,去除低质量话题。【结果】基于主题覆盖率的话题筛选结果符合人工拣选预期,抽取获得主题覆盖率高于0.5的优质话题。【局限】话题检测质量的评价主要以定性评价为主。【结论】通过计算主题覆盖率来自动选择优质话题,该方法效率高,通用性强,获得的话题便于理解,较好地揭示了四季中饮食微博的话题分布。
【作者单位】: 南京理工大学经济管理学院;杭州师范大学阿里巴巴复杂科学研究中心;江苏省数据工程与知识服务重点实验室(南京大学);
【关键词】: 话题检测 用户生成内容 主题覆盖率 饮食挖掘
【基金】:国家社会科学基金项目“在线社交网络中基于用户的知识组织模式研究”(项目编号:14BTQ033);国家社会科学基金重点项目“大数据环境下社会舆情与决策支持方法体系研究”(项目编号:14AZD084) 江苏省普通高校研究生科研创新(实践)计划项目“基于社交媒体的多粒度电影评论挖掘研究”(项目编号:SJLX15_0166)的研究成果之一
【分类号】:TP391.1;G206
【正文快照】: 1引言 Web2.0理念和技术的发展,带动了社交媒体的迅速发展。多种多样的社交平台,为用户之间的交流提供了极大的便捷。越来越多的人通过社交网络分享自己对事物的观点。与此同时,随着生活水平的提高,人们对饮食的关注日益增加,人们在社交网络上分享美食、推荐菜谱、探讨饮食功
【相似文献】
中国期刊全文数据库 前10条
1 赵亚琴;周献中;;一种基于小生境遗传算法的中文文本聚类新方法[J];计算机工程;2006年06期
2 刘务华;罗铁坚;王文杰;;文本聚类技术的有效性验证[J];计算机工程;2007年01期
3 丁X;许侃;;基于文本聚类方法的我国科技管理研究领域的计量研究[J];科学学研究;2007年S1期
4 孙爱香;杨鑫华;;关于文本聚类有效性评价的研究[J];山东理工大学学报(自然科学版);2007年05期
5 丘志宏;宫雷光;;利用上下文提高文本聚类的效果[J];中文信息学报;2007年06期
6 吴启明;易云飞;;文本聚类综述[J];河池学院学报;2008年02期
7 李江华;杨书新;刘利峰;;基于概念格的文本聚类[J];计算机应用;2008年09期
8 赵文鹏;;浅谈文本聚类研究[J];企业家天地下半月刊(理论版);2009年02期
9 章成志;;文本聚类结果描述研究综述[J];现代图书情报技术;2009年02期
10 马娜;;文本聚类研究[J];电脑知识与技术;2009年20期
中国重要会议论文全文数据库 前10条
1 赵世奇;刘挺;李生;;一种基于主题的文本聚类方法[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王洪俊;俞士汶;苏祺;施水才;肖诗斌;;中文文本聚类的特征单元比较[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 胡吉祥;许洪波;刘悦;王斌;程学旗;;基于重复串的短文本聚类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 张猛;王大玲;于戈;;一种基于自动阈值发现的文本聚类方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 王乐;田李;贾焰;韩伟红;;一个并行的文本聚类混合算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
7 章成志;;基于多语文本聚类的主题层次体系生成研究1)[A];国家自然科学基金委员会管理科学部宏观管理与政策学科青年基金获得者交流研讨会论文集[C];2010年
8 邱立坤;程葳;龙志yN;孙娇华;;面向BBS的话题挖掘初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 罗娜;左万利;袁福宇;张靖波;张慧杰;;使用本体语义提高文本聚类(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
10 孙承杰;朱文焕;林磊;刘远超;;BBS短文本聚类技术研究[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前3条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
3 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 康健;基于Multi-agent和群体智能的藏文网络舆情管理研究[D];西南交通大学;2015年
2 李伟;基于频繁词集词共现网络的短文本聚类方法[D];北京交通大学;2016年
3 庞卫巍;微博热点话题检测研究与分析[D];浙江工业大学;2012年
4 朱德超;基于词嵌入文本聚类技术的研究与实现[D];东华大学;2016年
5 张虎;文本聚类在IT运维系统中的应用研究[D];西安工程大学;2016年
6 魏彦婧;基于AP算法的文本聚类研究与实现[D];东北大学;2014年
7 华珍;文本聚类中特征选择方法研究[D];湖北工业大学;2016年
8 张海涛;基于文本降维和蚁群算法的文本聚类研究[D];安徽大学;2016年
9 张丽;一种中文文本聚类方法的研究[D];哈尔滨工程大学;2009年
10 李伯阳;文本聚类方法研究及其应用[D];厦门大学;2008年
,本文编号:577304
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/577304.html