基于文本挖掘的家具用户潜在需求可视化研究
发布时间:2021-07-19 10:29
家具行业作为支柱性产业关乎国民生活,传统家具行业的萧条使得家具电商崛起。家具电商受限于家具产品自身的特殊性,在激烈的竞争环境下面临着诸多挑战和困境。大数据时代和电商平台蓬勃发展的背景下,用户在电商平台购买家具后,会在该平台上发布网购评论,评论的内容包括产品属性、服务、物流等方面,里面都暗含着用户对产品的改进需求。家具电商如果能快速掌握网购评论中的用户需求,就能及时改进现有的产品和服务,并找到产品的未来发展方向,为快速迭代找到灵感,从而牢牢把握用户黏性,提高核心竞争力。本文在文本挖掘和用户需求等理论与关键技术研究的基础上,提出了一套适用于线上家具网购评论的文本挖掘的流程,初步构建了家具网购评论的评价指标,并通过实际案例来验证了本文方法的可用性且得到了有价值的结论。通过实证分析,结合网购行为过程的分析及用户群体研究对线上家具产品的网购评论进行深入挖掘,分析得出用户的潜在需求并提出改进建议,验证了线上家具用户需求分析的可行性。本文主要研究工作具体如下:第一,构建基于家具网购评论的评价指标。通过对家具的行业背景和产品种类及特点进行相关调研来确定研究对象,构建二级评价指标体系,提出评论内容、评论...
【文章来源】:南京林业大学江苏省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
本课题的文本挖掘流程
20第四章数据获取及预处理4.1数据获取方法4.1.1网络爬虫网络爬虫作为一个程序或脚本,能够依据算法来自动采集网页数据信息,可分为通用网络爬虫和聚焦网络爬虫这两类。前者的工作原理是从初始网页的URL中,不间断的提取所需的URL组成新的队列,直到达到某一条件时就会自行终止运行。后者的工作原理是借助网页分析算法,连续不断的过滤无用的URL,在待抓取队列中只保留与主题相关的URL,然后按照预先制定好的搜索策略,读取接下来要抓取的网页URL,直到达到某一条件时就会自行终止运行,具体流程如图4-1所示。图4-1网络爬虫的一般流程Fig.4-1Generalflowofwebcrawler图片来源:作者自制网络爬虫是搜索引擎和垂直搜索引擎的重要组成部分。其中,搜索引擎的代表应用有谷歌浏览器、百度浏览器等;垂直搜索引擎的代表应用有豆丁网、豆瓣电影等。网络爬虫作为信息采集的利器,是文本挖掘技术中的首要环节。任何需要采集数据的领域如数据挖掘、复杂网络、在线人类行为、在线社群演化、人类动力学研究、计量社会学[123]等,都离不开网络爬虫。4.1.2爬虫工具网络的发达使得数据喷薄式的爆发,因为也出现了很多爬虫技术,根据研究,本文将现有的网络爬虫技术概括为两种,一种是工具类型,另一种是语言类型。具体如下:(1)工具类型此种爬虫基本都是傻瓜式的操作方法,通过单击操作就能完成信息采集,无需编写代码,也没有学习成本,因而非常适合零编程基础的用户进行,常见的工具有八爪鱼等其他
22图4-2Alexa国内总排行榜Fig.4-2Alexa’soveralldomesticranking图片来源:Alexa微信公众号截取图4-3天猫网的全球排名与UV&PV值Fig.4-3Tmall’sglobalrankingandits’UV&PVvalues图片来源:Alexa微信公众号截取
【参考文献】:
期刊论文
[1]基于结构主题模型的用户功能需求挖掘研究[J]. 苗红,王艳,黄鲁成,吴菲菲,李欣. 情报杂志. 2020(07)
[2]敬畏感的情绪成分分析:基于社交网络的文本挖掘[J]. 王影,库婷婷,许书萍,李伟强,袁博. 心理技术与应用. 2020(04)
[3]先行示范区的改革发展逻辑——基于Smart Analyze的文本可视化分析[J]. 谢攀琳. 深圳社会科学. 2020(01)
[4]基于网络爬虫的就业数据分析[J]. 项博良,唐淳淳,钱前,曹健东. 智能计算机与应用. 2020(01)
[5]基于数据挖掘的电商家具产品共词聚类算法研究[J]. 向嘉链. 经济研究导刊. 2019(31)
[6]家具类电商平台的发展现状[J]. 陈星艳,向仕龙,陶涛. 林产工业. 2019(10)
[7]面向用户需求的家具个性化设计研究[J]. 谢蓝. 福建茶叶. 2019(07)
[8]基于多视图协同的政策文本可视化研究[J]. 杨亚楠,赵文辉,张健,谭珅,张贝贝. 数据分析与知识发现. 2019(06)
[9]个性化推荐中基于认知的用户兴趣建模研究[J]. 石宇,胡昌平,时颖惠. 情报科学. 2019(06)
[10]我国大数据时代数字图书馆研究前沿分析——基于共词分析的视角[J]. 赵丽梅,张花. 情报科学. 2019(03)
博士论文
[1]森林病虫害数据可视分析方法研究[D]. 杨波.北京林业大学 2019
[2]面向评论数据的可视分析方法研究[D]. 徐进.浙江大学 2018
[3]文本分类中特征加权算法和文本表示策略研究[D]. 贾隆嘉.东北师范大学 2016
[4]多专业领域本体的构建及语义检索研究[D]. 刘紫玉.北京交通大学 2010
[5]知识管理和文本挖掘的若干问题研究[D]. 徐建锁.天津大学 2004
[6]多指标综合评价理论与方法问题研究[D]. 苏为华.厦门大学 2000
硕士论文
[1]基于文本挖掘的笔记本电脑网评分析[D]. 李清镇.兰州财经大学 2019
[2]基于机器学习的老年手机用户中文评论情感分析[D]. 高思梦.兰州财经大学 2019
[3]基于内容和word2vec的慕课推荐算法研究[D]. 黄冉.山东师范大学 2019
[4]基于网络文本挖掘的冰雪旅游形象感知研究[D]. 李凤佼.东北农业大学 2019
[5]出租车GPS数据的信息挖掘研究[D]. 陈玲燕.北京交通大学 2018
[6]面向中文短文本的情感分析关键技术研究[D]. 张子睿.长春理工大学 2018
[7]基于主题的文本挖掘及可视化系统研究与实现[D]. 郭英杰.西安电子科技大学 2018
[8]微博用户对同性恋的态度研究[D]. 郑铨.四川师范大学 2018
[9]基于集成学习的DDoS攻击检测[D]. 姚洪磊.天津理工大学 2018
[10]深度学习与SVM相融合的新闻分类技术研究[D]. 袁志辉.华北理工大学 2018
本文编号:3290535
【文章来源】:南京林业大学江苏省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
本课题的文本挖掘流程
20第四章数据获取及预处理4.1数据获取方法4.1.1网络爬虫网络爬虫作为一个程序或脚本,能够依据算法来自动采集网页数据信息,可分为通用网络爬虫和聚焦网络爬虫这两类。前者的工作原理是从初始网页的URL中,不间断的提取所需的URL组成新的队列,直到达到某一条件时就会自行终止运行。后者的工作原理是借助网页分析算法,连续不断的过滤无用的URL,在待抓取队列中只保留与主题相关的URL,然后按照预先制定好的搜索策略,读取接下来要抓取的网页URL,直到达到某一条件时就会自行终止运行,具体流程如图4-1所示。图4-1网络爬虫的一般流程Fig.4-1Generalflowofwebcrawler图片来源:作者自制网络爬虫是搜索引擎和垂直搜索引擎的重要组成部分。其中,搜索引擎的代表应用有谷歌浏览器、百度浏览器等;垂直搜索引擎的代表应用有豆丁网、豆瓣电影等。网络爬虫作为信息采集的利器,是文本挖掘技术中的首要环节。任何需要采集数据的领域如数据挖掘、复杂网络、在线人类行为、在线社群演化、人类动力学研究、计量社会学[123]等,都离不开网络爬虫。4.1.2爬虫工具网络的发达使得数据喷薄式的爆发,因为也出现了很多爬虫技术,根据研究,本文将现有的网络爬虫技术概括为两种,一种是工具类型,另一种是语言类型。具体如下:(1)工具类型此种爬虫基本都是傻瓜式的操作方法,通过单击操作就能完成信息采集,无需编写代码,也没有学习成本,因而非常适合零编程基础的用户进行,常见的工具有八爪鱼等其他
22图4-2Alexa国内总排行榜Fig.4-2Alexa’soveralldomesticranking图片来源:Alexa微信公众号截取图4-3天猫网的全球排名与UV&PV值Fig.4-3Tmall’sglobalrankingandits’UV&PVvalues图片来源:Alexa微信公众号截取
【参考文献】:
期刊论文
[1]基于结构主题模型的用户功能需求挖掘研究[J]. 苗红,王艳,黄鲁成,吴菲菲,李欣. 情报杂志. 2020(07)
[2]敬畏感的情绪成分分析:基于社交网络的文本挖掘[J]. 王影,库婷婷,许书萍,李伟强,袁博. 心理技术与应用. 2020(04)
[3]先行示范区的改革发展逻辑——基于Smart Analyze的文本可视化分析[J]. 谢攀琳. 深圳社会科学. 2020(01)
[4]基于网络爬虫的就业数据分析[J]. 项博良,唐淳淳,钱前,曹健东. 智能计算机与应用. 2020(01)
[5]基于数据挖掘的电商家具产品共词聚类算法研究[J]. 向嘉链. 经济研究导刊. 2019(31)
[6]家具类电商平台的发展现状[J]. 陈星艳,向仕龙,陶涛. 林产工业. 2019(10)
[7]面向用户需求的家具个性化设计研究[J]. 谢蓝. 福建茶叶. 2019(07)
[8]基于多视图协同的政策文本可视化研究[J]. 杨亚楠,赵文辉,张健,谭珅,张贝贝. 数据分析与知识发现. 2019(06)
[9]个性化推荐中基于认知的用户兴趣建模研究[J]. 石宇,胡昌平,时颖惠. 情报科学. 2019(06)
[10]我国大数据时代数字图书馆研究前沿分析——基于共词分析的视角[J]. 赵丽梅,张花. 情报科学. 2019(03)
博士论文
[1]森林病虫害数据可视分析方法研究[D]. 杨波.北京林业大学 2019
[2]面向评论数据的可视分析方法研究[D]. 徐进.浙江大学 2018
[3]文本分类中特征加权算法和文本表示策略研究[D]. 贾隆嘉.东北师范大学 2016
[4]多专业领域本体的构建及语义检索研究[D]. 刘紫玉.北京交通大学 2010
[5]知识管理和文本挖掘的若干问题研究[D]. 徐建锁.天津大学 2004
[6]多指标综合评价理论与方法问题研究[D]. 苏为华.厦门大学 2000
硕士论文
[1]基于文本挖掘的笔记本电脑网评分析[D]. 李清镇.兰州财经大学 2019
[2]基于机器学习的老年手机用户中文评论情感分析[D]. 高思梦.兰州财经大学 2019
[3]基于内容和word2vec的慕课推荐算法研究[D]. 黄冉.山东师范大学 2019
[4]基于网络文本挖掘的冰雪旅游形象感知研究[D]. 李凤佼.东北农业大学 2019
[5]出租车GPS数据的信息挖掘研究[D]. 陈玲燕.北京交通大学 2018
[6]面向中文短文本的情感分析关键技术研究[D]. 张子睿.长春理工大学 2018
[7]基于主题的文本挖掘及可视化系统研究与实现[D]. 郭英杰.西安电子科技大学 2018
[8]微博用户对同性恋的态度研究[D]. 郑铨.四川师范大学 2018
[9]基于集成学习的DDoS攻击检测[D]. 姚洪磊.天津理工大学 2018
[10]深度学习与SVM相融合的新闻分类技术研究[D]. 袁志辉.华北理工大学 2018
本文编号:3290535
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3290535.html
最近更新
教材专著