当前位置:主页 > 经济论文 > 国际贸易论文 >

AP聚类算法在商圈挖掘中的应用研究

发布时间:2020-05-15 15:23
【摘要】:城市商圈是现实世界中经济网络的一种基本结构。通过挖掘城市中的商圈数据,扩展新的应用场景,可以使终端用户受益。用户在访问商圈后产生的基于位置的签到数据可以被用于挖掘商圈,并提供数据支持。然而,基于签到数据的商圈挖掘工作面临几方面的问题。(1)在传统的商圈挖掘模型和方法中,存在参数难以设置的问题;(2)标准AP聚类算法的计算复杂度较高且只能发现球形状商圈,不适合用于大规模数据聚类问题和挖掘商圈呈非球形状的情况。针对以上问题,为了有效地挖掘城市商圈,本文提出了改进的AP聚类商圈挖掘算法,主要研究内容如下:首先,提出并设计了基于签到数据的AP聚类商圈挖掘算法。将标准AP聚类算法引入城市商圈挖掘领域中,并通过利用位置签到数据中的签到量特征来合理地设置AP算法的偏向参数值,使得在聚类实施的信息更新过程中,增加了类代表点的约束条件。通过使用Yelp数据集为实验数据,对比标准的AP聚类算法以及贪心搜索算法,实验结果证明了所提出的算法的有效性。其次,提出并设计了改进的AP聚类商圈挖掘算法。首先通过分析标准AP聚类算法的信息传播过程,利用密度最大值聚类算法挖掘出潜在商圈中心,从而压缩了算法的输入相似度矩阵,进而提升了算法计算效率;然后对经过标准AP聚类算法处理而得到的初始商圈集合,分析其内部的距离属性,设计了与类内距离和类间距离相关的合并策略,提高了挖掘结果的准确性;最后使用Yelp数据集为实验数据,对比标准的AP聚类算法,所得实验结果证明了算法在基本保留全部信息的基础上,提升了算法执行效率。本研究具有重要的应用价值:(1)通过对标准AP聚类算法的改进,使其具有有效分析、处理数据的能力,为数据科学的发展提供了新的工具;(2)从给定的签到数据中挖掘出城市商圈的分布,可以为探测商圈内的热点、分析商圈的动态变化提供数据支持。
【图文】:

示意图,商圈,示意图,商业网点


因素干扰挖掘准确性的缺陷。采用商圈的签到数据作为数据基础,并利用签到数据的签逡逑到量特征更加合理地来设置输入矩阵的偏好度,避免了数据信息缺失,进而完成挖掘任逡逑务,图3.2展示了模拟数据的挖掘结果。逡逑逦[逦:逡逑图3.2商圈挖掘结果示意图逡逑接下来的内容,本章节首先提出基于AP聚类的商圈挖掘问题的相关定义。然后介逡逑绍标准AP聚类算法的理论与算法实现过程。最后设计对比实验来验证该算法的有效性。逡逑3.2相关定义与问题描述逡逑本节主要涉及的知识有:城市商圈相关概念的定义以及城市商圈挖掘需要解决的问逡逑题和AP算法的理论基础描述。逡逑3.2.1商圈相关定义逡逑定义3.1商业网点(Venue)商业网点?般是指代进行商业经营交易、城市居民进行逡逑消费活动,提供产品或者服务的场所,记作商业网点组成的集合记为T/。一般来说,逡逑城币主城IX里的商业网点呈现聚集的状态,向城K外的方向辐射扩散。逡逑定义3.2商圈(Business邋District)商圈是由商业网点所组成的集合,记为A,它是逡逑整个城市商圈的子集/)=丨丛,认,...,^丨,其中iV表示城市商圈的个数。如图3.3所示,逡逑圈内分布的商业网点构成了一个商业圈。商业网点构成商业圈的形状会根据现实情况的逡逑交通路况和政府规划呈现不同的形状,如规则状的圆形或不规则的形状。逡逑19逡逑

示意图,商圈,示意图,商业网点


定义3.4城市商圈挖掘问题(Business邋Districts邋Mining邋Problem)给定商业网点集合逡逑F,使用标准AP聚类算法从集合中挖掘出城市商圈中心点,然后将归属于该商圈中逡逑心点的商业网点聚集在一起得到城市商圈A,完成城市商圈挖掘任务。如图3.2所示,给逡逑定模拟的商业网点集合,经过对集合使用AP聚类算法聚类后,找到了聚类中心(中间的逡逑大点),然后将周围的点中分配给所属的聚类中心点,类中心点与所属的点组成了族,即逡逑城市商圈。逡逑3.2.2问题描述与分析逡逑在对城市商圈分布测定的传统方法中,,一般由下面几个方面组成[53]:逡逑(1)预测分析逡逑首先对城市商圈这一对象附近的消费者环境、经济环境、公共交通设施、以及政府逡逑对该商业区域的未来规划等信息进行收集,再对商圈内的商业网点的经营范围、经营品逡逑20逡逑
【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F713;TP311.13

【参考文献】

相关期刊论文 前6条

1 江颉;王卓芳;陈铁明;朱陈晨;陈波;;自适应AP聚类算法及其在入侵检测中的应用[J];通信学报;2015年11期

2 王士君;冯章献;张石磊;;经济地域系统理论视角下的中心地及其扩散域[J];地理科学;2010年06期

3 王磊;汪西莉;刘高霞;赵琳;;一种结合半监督的改进自适应亲和传播聚类[J];计算机应用研究;2010年12期

4 张宇;吴t

本文编号:2665246


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2665246.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3b7ea***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com