当前位置:主页 > 管理论文 > 酒店管理论文 >

基于主题模型的Airbnb短住房房源画像分析

发布时间:2023-02-13 18:03
  Airbnb作为世界范围内最大的C2C短住房在线预订平台具有海量房源和庞大的消费群体,其内部庞大的流量也代表着极高的商业价值,成为各类闲置资源共享人员及投资商进行资源共享、创造收入的重要阵地,如何利用其中的房源数据对在线住宿平台提供管理决策的依据成为企业关注的重点。本文利用Airbnb平台上的短住房房源数据构建房源画像,可以对房源数据进行挖掘和分析,将房源表达成一类多维的标签系统,帮助企业精准定位房源特征,是改进房源产品和房源推荐的基础,对住宿预订平台及房源供给方都具有很高的参考意义。在这一背景下,本文研究了基于主题模型的Airbnb短住房房源画像的构建及分析,目的是精确描述房源特征,并将其进行类别细分及描述分析。使用的Airbnb房源数据包括房源的基础属性数据及动态的房源评论数据,由于基础属性数据均为房源供给方填写,因而数据的处理重点在于房源评论。本文的主要工作如下:(1)针对获取到的房源评论数据进行预处理。将所有房源按照人均价位划分为经济型、品质型和高档型,在房源评论文本的预处理过程中去除无用词后使用了效果较好的Jieba分词器,并进行了词性筛选及停用词处理。(2)使用主题模型进行...

【文章页数】:80 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 引言
    1.1 研究背景和意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外文献综述
        1.2.1 共享经济背景下短住房企业的研究现状
        1.2.2 房源画像研究现状
        1.2.3 主题模型研究现状
    1.3 研究内容与方法
    1.4 主要工作和创新
    1.5 论文的基本结构
第2章 相关技术介绍
    2.1 房源画像技术
        2.1.1 房源画像概述
        2.1.2 房源画像标签体系结构
    2.2 主题模型
        2.2.1 LDA模型
        2.2.2 DTM模型
        2.2.3 主题模型算法的参数推断方法
    2.3 聚类算法
        2.3.1 K-means聚类算法
        2.3.2 Canopy聚类算法
    2.4 本章小结
第3章 基于主题模型的房源画像特征工程
    3.1 房源画像建模整体框架
    3.2 数据来源与文本预处理
        3.2.1 数据集介绍及划分
        3.2.2 文本预处理
    3.3 基于主题模型的房源特征工程
        3.3.1 基于LDA模型的房源特征提取
        3.3.2 基于DTM模型的房源特征提取
        3.3.3 房源评论特征的分析
        3.3.4 主题模型的评价
    3.4 基于DTM模型的DTM2vec融合算法
        3.4.1 Word2vec
        3.4.2 融合DTM模型与Word2Vec的 DTM2vec房源特征工程
    3.5 本章小结
第4章 基于DTM2vec模型的房源画像构建与结果分析
    4.1 实验框架
    4.2 实验设计及结果分析
        4.2.1 Canopy+K-means聚类
        4.2.2 评价标准的选择
        4.2.3 房源聚类实验及效果评估
    4.3 短住房房源的画像描述及建议
        4.3.1 房源的画像描述
        4.3.2 房源的发展建议
    4.4 本章小结
结论与展望
    1、结论
    2、展望
参考文献
致谢
攻读硕士学位期间的科研情况



本文编号:3742048

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/jiudianguanli/3742048.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eeb56***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com