当前位置:主页 > 经济论文 > 房地产论文 >

面向垂直行业的特征提取与态势分析

发布时间:2017-06-12 15:03

  本文关键词:面向垂直行业的特征提取与态势分析,,由笔耕文化传播整理发布。


【摘要】:改革开放三十多年来,我国经济发展取得了举世瞩目的成就,各行各业得到了空前的发展,然而,当经济发展进入深水区,许多行业的发展出现瓶颈,发展前景很不明朗,这不仅影响消费者的消费行为、投资商的投资决策,更影响政府对经济的宏观调控。因此,了解行业发展现状,明确行业发展未来,已经成为一个需要迫切解决的利国利民的重大课题。本文面向垂直行业进行特征提取和态势分析不仅可以了解行业历史、现状并可以一定程度上反映出行业未来发展趋势,很好的弥补了传统行业分析方法的不足,最终为相关决策者提供决策参考。本文首先对有关学者关于特征发现和行业分析的相关理论进行综述,对于垂直行业的态势分析采用基于行业特征词发现的时空分析方法,包括候选行业特征词的确定、候选行业特征词的迭代扩展、行业特征词的筛选等。然后,根据发现的行业特征词,基于时间和空间两个维度,利用行业特征词的相对权重及其变化,对行业发展的主题演化以及地区行业发展态势进行分析并可视化展示。最后,本文以房地产行业为例,基于Apache开源项目Nutch进行行业信息采集,并用本文所提出的行业特征词发现算法进行行业特征词识别,然后基于行业特征词具体对我国上海和北京两地房地产行业发展状况进行时空分析。实验结果表明,本文方法可以高效、准确的识别出行业特征,并可以清晰的描述行业发展历史、现状以及未来发展趋势。
【关键词】:垂直行业 特征发现 时空分析 行业态势
【学位授予单位】:北京理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F299.23
【目录】:
  • 摘要5-6
  • Abstract6-9
  • 第1章 绪论9-17
  • 1.1 本论文研究的背景和意义9-10
  • 1.2 国内外研究现状及发展趋势10-12
  • 1.3 本文的主要研究内容和创新12-16
  • 1.4 本章小结16-17
  • 第2章 相关理论综述17-25
  • 2.1 信息采集与搜索17-20
  • 2.1.1 信息采集(网络爬虫)17-18
  • 2.1.2 信息搜索(搜索引擎)18-19
  • 2.1.3 Nutch项目简介19-20
  • 2.2 行业特征发现20-21
  • 2.3 时空数据挖掘21-24
  • 2.4 本章小结24-25
  • 第3章 行业特征词的发现算法25-34
  • 3.1 确定候选行业特征词25-27
  • 3.1.1 文本预处理25
  • 3.1.2 TF-IDF和TextRank算法25-27
  • 3.2 对候选行业特征词进行扩展27-31
  • 3.2.1 左右邻信息理论27-30
  • 3.2.2 特征词迭代扩展30-31
  • 3.3 筛选扩展之后的行业特征词31-33
  • 3.3.1 语用灵活度31
  • 3.3.2 行业特征词精选31-33
  • 3.4 本章小结33-34
  • 第4章 基于时空挖掘的行业态势分析34-40
  • 4.1 时间态势分析34-37
  • 4.1.1 行业话题热度变化35
  • 4.1.2 行业热点话题转移35-36
  • 4.1.3 行业新兴和持久话题发现36-37
  • 4.2 空间对比分析37-39
  • 4.2.1 地区行业发展热点对比分析38
  • 4.2.2 地区行业发展整体特色分析38-39
  • 4.3 本章小结39-40
  • 第5章 以房地产行业为例进行实证分析40-58
  • 5.1 自动采集房地产行业数据40-43
  • 5.2 房地产行业特征词发现43-49
  • 5.2.1 确定候选行业特征词43-45
  • 5.2.2 扩展候选行业特征词45-47
  • 5.2.3 精选行业特征词47-49
  • 5.3 基于时空挖掘的房地产行业态势分析49-57
  • 5.3.1 时间态势分析52-55
  • 5.3.2 空间对比分析55-57
  • 5.4 本章小结57-58
  • 结论58-60
  • 参考文献60-66
  • 附录66-69
  • 致谢69

【相似文献】

中国重要会议论文全文数据库 前6条

1 苏祺;孙斌;;面向观点挖掘的产品评价特征词识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

2 李政泽;韩毅;周斌;贾焰;;微博用户分类的特征词权重优化及推荐策略[A];第27次全国计算机安全学术交流会论文集[C];2012年

3 王俞霖;孙乐;李文波;;基于“VASE”特征词的网络查询分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 朱海军;张桂平;蔡东风;王炜华;;科技论文的标题识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

5 王孟;白清源;谢丽聪;谢伙生;张莹;;一种含有负项的关联文本分类[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

6 张刚;刘挺;秦兵;车万翔;李生;;面向信息内容安全的文本过滤系统研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年

中国硕士学位论文全文数据库 前10条

1 罗熹;基于评论信息的内容感知方法研究[D];电子科技大学;2015年

2 李康;基于特征的机械设计方案分类方法的研究[D];西安电子科技大学;2014年

3 申剑博;基于Hadoop面向社交网络的好友推荐系统的研究与应用[D];西安工程大学;2015年

4 张凌云;兰州方言特征词研究[D];西北师范大学;2015年

5 杨晓s

本文编号:444284


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/fangdichanjingjilunwen/444284.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d5d2d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com