基于机器学习的租房软件评论情感分析研究
发布时间:2024-03-16 22:52
随着城镇化的发展,房价水涨船高,越来越多的人选择租房来解决自己的住房问题。互联网的发展和智能手机的普及,越来越多的租房软件出现在人们的视野中,房屋租赁业务也开始由线下转为线上。各大应用商店都汇集着大量软件的用户评论,这些评论文本包含着众多的情感和信息,对这些情感和信息进行分析,具有丰富的商业价值和现实意义。本文基于租房软件评论文本进行情感分析,首先对用户评论数据进行预处理,包括数据清洗、文本分词以及去停用词,基于情感词典和人工标注结合的方法对评论文本进行标注,通过word2vec获取评论文本的词向量表示。其次,对预处理之后的数据构建情感倾向分类模型,分别构建基于传统机器学习算法的分类模型以及基于深度学习方法的分类模型。先后采用支持向量机、随机森林、卷积神经网络、双向长短时记忆网络、BERT模型构建情感分类模型并进行模型评价,最终选择基于BERT的情感分类模型,其准确率达到了89.6%,F1-socre为0.9034,AUC值为0.8783,能够很好地完成对租房软件用户评论文本情感倾向的识别。最后,采用LDA主题模型对租房软件用户评论进行文本挖掘,将数据集分为正面情感数据集和负面情感数据...
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
本文编号:3930212
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
图1-1研究框架
本文的研究框架如图1-1所示。2.1传统机器学习相关算法
图2-1支持向量机示意图
其中w为法向量,b为截距,用(w,b)来表示划分超平面,划分超平面将特征空间划分为两侧,一侧为正例,另一侧为负例。当训练样本集线性可分时,为了求解,使间隔最大化,则
图2-2随机森林算法流程图
(4)随机森林模型对测试集上的数据进行预测,最后凭借“少数服从多数”的投票法得到最终的分类结果。2.2深度学习相关算法
图2-3CBOW模型结构示意图
word2vec的模型训练有两种方式,分别是连续词袋模型(ContinuousBag-of-Words,CBOW)和Skip-Gram模型。CBOW模型的基本思想是向神经网络传入上下文词汇,然后预测目标词汇。CBOW模型结构示意图如图2-3所示。图中的Inputlayer表示....
本文编号:3930212
本文链接:https://www.wllwen.com/jingjifazhanlunwen/3930212.html