基于集成学习的短文本聚类
【图文】:
科 技 大 学 硕 士 学 位 5 联想评论文本的集成聚类分析本的采集是网购产品评论用户的聚类分析,在进行数据即确定网购平台与产品。目前互联网上的网购宁易购等;且平台上的产品种类也繁多,,若研与可行性来看,不太实际。因此考虑到数据的的是天猫商城与该商城内联想官方旗舰店的,如下图所示。
华 中 科 技 大 学 硕 士 学 位 论 文新款笔记本电脑产品的特征,挖掘使用该产品的不同类型用户的重要特进产品或制定营销优惠策略。据爬取何获取天猫商城上该款联想笔记本电脑的所有用户评论?本文使用 Py结合 requests 库,采用网络爬虫的方法,从天猫商城上爬取了小新 700联想笔记本电脑的用户评论数,截止到 2019 年 2 月 20 日,该商城平台上论数共计 3840 条。下图为爬取的部分评论文本。
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F724.6;F274
【相似文献】
相关期刊论文 前10条
1 熊康平;;机器学习方法在文本聚类中的应用[J];电子世界;2018年22期
2 杨婉霞;孙理和;黄永峰;;结合语义与统计的特征降维短文本聚类[J];计算机工程;2012年22期
3 马娜;;文本聚类研究[J];电脑知识与技术;2009年20期
4 张毓;陈军清;;基于深度特征语义学习模型的垃圾短信文本聚类研究[J];现代计算机(专业版);2018年07期
5 毕强;刘健;鲍玉来;;基于语义相似度的文本聚类研究[J];现代图书情报技术;2016年12期
6 李向东;刘晓斌;武利平;常洪梅;;面向路线图编制的模糊均值文本聚类挖掘方法研究[J];河北工业大学学报;2011年03期
7 赵世奇;刘挺;李生;;一种基于主题的文本聚类方法[J];中文信息学报;2007年02期
8 杨彩莲;谢福鼎;;基于主题概念聚类的中文文本聚类[J];现代电子技术;2007年22期
9 李泉;李萌;成洪权;蒋林秀;肖舒婷;王iu可;;基于文本聚类与情感分析的群租房微博舆情量化研究[J];图书情报研究;2019年01期
10 徐秀芳;徐森;花小朋;徐静;皋军;安晶;;一种基于t-分布随机近邻嵌入的文本聚类方法[J];南京大学学报(自然科学);2019年02期
相关会议论文 前10条
1 赵世奇;刘挺;李生;;一种基于主题的文本聚类方法[A];第三届学生计算语言学研讨会论文集[C];2006年
2 张越今;丁丁;;敏感话题发现中的增量型文本聚类模型[A];第30次全国计算机安全学术交流会论文集[C];2015年
3 章成志;;基于多语文本聚类的主题层次体系生成研究1)[A];国家自然科学基金委员会管理科学部宏观管理与政策学科青年基金获得者交流研讨会论文集[C];2010年
4 王洪俊;俞士汶;苏祺;施水才;肖诗斌;;中文文本聚类的特征单元比较[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 胡吉祥;许洪波;刘悦;王斌;程学旗;;基于重复串的短文本聚类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 王乐;田李;贾焰;韩伟红;;一个并行的文本聚类混合算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
7 林灵;张百霞;李彦文;王耘;李志勇;;基于文本挖掘与计算机辅助药物设计的中药候选新药发现方法[A];第十二次全国中西医结合实验医学专业委员会暨第七次湖南省中西医结合神经科专业委员会学术年会论文集[C];2015年
8 孙承杰;朱文焕;林磊;刘远超;;BBS短文本聚类技术研究[A];第五届全国信息检索学术会议论文集[C];2009年
9 任海平;李伟忠;姚诚伟;;基于深度学习的智能写稿辅助服务设计[A];中国新闻技术工作者联合会2017年学术年会论文集(学术论文篇)[C];2017年
10 颜端武;李晓鹏;王磊;成晓;;文本聚类中基于本体的相似性测度(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
相关重要报纸文章 前1条
1 周晓慷;大数据时代,别当数据的“搬运工”[N];人民邮电;2018年
相关博士学位论文 前10条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
3 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
4 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
5 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
6 陈远浩;非监督的结构学习及其应用[D];中国科学技术大学;2008年
7 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
8 王纵虎;聚类分析优化关键技术研究[D];西安电子科技大学;2012年
9 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
10 袁锋;中医医案文本挖掘的若干关键技术研究[D];山东师范大学;2016年
相关硕士学位论文 前10条
1 王涛;新浪微博用户评论情感分析及聚类研究[D];黑龙江大学;2019年
2 张国锋;在文章聚类中话题热度排序的研究与实现[D];东华大学;2019年
3 王小静;基于集成学习的短文本聚类[D];华中科技大学;2019年
4 刘宇鹏;新闻实时话题分析系统的研究与实现[D];辽宁大学;2019年
5 徐露;基于GloVe的文本聚类研究与改进[D];华南理工大学;2019年
6 唐镇;基于语义对偶模型的双语文本聚类研究[D];电子科技大学;2019年
7 房孟春;基于在线评论的民宿服务质量评价体系研究[D];海南大学;2019年
8 卜秋瑾;基于密度峰值的聚类算法研究及其在文本聚类中的应用[D];南昌大学;2019年
9 崔壮壮;基于Word Embedding的短文本聚类算法研究及应用[D];哈尔滨工业大学;2019年
10 许振豪;基于词嵌入的流形主题模型的文本聚类研究[D];广东工业大学;2019年
本文编号:2605653
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2605653.html