基于聚类算法和特征提取改进的室内定位系统
发布时间:2020-03-23 12:41
【摘要】:随着物联网和人工智能的发展,人们对基于位置的服务需求逐渐提升。基于位置的服务是指用户通过移动终端向服务端发送位置信息,服务端根据用户的位置信息提供与实际位置相对应的服务。由于WiFi技术在近十年来的迅速发展,大部分室内环境中都有WiFi热点的部署。而且WiFi热点部署简单,价格低廉等,这些特性都非常适合用于室内定位。近年来,基于WiFi热点的室内定位成为研究热点,其中,基于位置指纹信息的定位方法成为主流。然而目前基于位置指纹信息的定位方法仍然只停留在理论层面,实际应用中却非常少见。主要原因是需要室内定位系统的场景中通常会有非常大的定位区域,这种场景下AP部署多、环境复杂多变,对定位系统的定位效果和运行效率都有非常大的挑战。本文针对这种大型定位场景,进行了对传统的指纹定位技术进行了改进,提出了一种基于聚类算法和特征提取的分布式定位方案。主要工作如下:首先,本文研究了如何对数据量较大的指纹数据集进行改进。指纹数据集中每条数据对应每个参考点接收到的所有AP的RSS数值,在行方向上,本文考虑使用聚类算法,以分割指纹数据集中的参考点,映射到实际定位场景中,即把定位区域划分为一个个小区域;完成划分后,每个参考点接收到的AP的RSS数值并不都是具有定位价值的,有些AP对位置的识别能力很低,在不同参考点该AP的RSS差别并不是很大,体现不出RSS和位置之间的映射关系,需要提取RSS信息中的特征,所以在列方向上的处理,考虑使用特征提取方法,减少数据维度。从这两个方向进行优化,就可以减少待定位点数据进行匹配的数量,同时降低计算的复杂度,提高定位精度。其次,选取聚类算法和特征提取算法。分析了K-means算法和模糊C均值算法这两类应用最广泛的聚类算法,但是它们都存在明显的缺陷,即需要预先对类别个数进行设定,并且对聚类结果受聚类个数以及初始聚类中心的影响非常大,对类别外的孤立点敏感度较高。本文提出使用密度峰值和距离聚类算法(CFSFDP),并使用MapReduce计算框架进行改进;在选择特征提取算法部分,提出基于MapReduce改进的主成分分析法。最后在在线定位阶段,针对K近邻算法和加权K近邻算法的需要手动设置K值的缺陷,提出使用改进的加权K近邻算法(EWKNN)。相比于K近邻算法和加权K近邻算法,该算法设定了一个阈值,动态选择k值,避免了固定k值会引入实际距离偏离待定位点较远的参考点的问题,从而提高定位精度。基于MapReduce对EWKNN进行改进,实现算法并行化,提升运行效率。实验证明,本文提出的基于聚类算法和特征提取的室内定位系统在定位效果和运行效率上相比于传统室内定位系统有很大的改善。
【图文】:
eless fidelity 的缩写,中文是无线保真。WiFi 和 IEEE802.1代表,其规定了物理层需要在 2.4GHz 频段上进行工作,且有:跳频扩频、直接扩频以及红外线。载波侦听多路访问/冲突链路层[20]。主要特点为高速、高带宽、高覆盖率,受较少到非视距的限。络基本结构节点由 IEEE802.11 的定义决定,其主要由接入点、基本服式系统、扩展服务集等原始组件组成[10,11]。如图 2.1。
8图 2.2 RSS 样本直方图图 2.2 中的直方图为所测某一 AP 的 WiFi 信号强度数据全部样本的概率分布,根据上图分析,在-70dBm 处,,信号强度的出现概率最大,以-70dBm 为中心,无论信号强度增大或者减小,其出现概率都会逐渐递减,样本总体以 72.75%的概率出现在-65 到-74 之间,这样的概率分布类似正态分布。在图 2.2 中,红色的曲线为根据样本均值和标准差计算得出的该样本高斯概率密度曲线
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN92;TP311.13
本文编号:2596738
【图文】:
eless fidelity 的缩写,中文是无线保真。WiFi 和 IEEE802.1代表,其规定了物理层需要在 2.4GHz 频段上进行工作,且有:跳频扩频、直接扩频以及红外线。载波侦听多路访问/冲突链路层[20]。主要特点为高速、高带宽、高覆盖率,受较少到非视距的限。络基本结构节点由 IEEE802.11 的定义决定,其主要由接入点、基本服式系统、扩展服务集等原始组件组成[10,11]。如图 2.1。
8图 2.2 RSS 样本直方图图 2.2 中的直方图为所测某一 AP 的 WiFi 信号强度数据全部样本的概率分布,根据上图分析,在-70dBm 处,,信号强度的出现概率最大,以-70dBm 为中心,无论信号强度增大或者减小,其出现概率都会逐渐递减,样本总体以 72.75%的概率出现在-65 到-74 之间,这样的概率分布类似正态分布。在图 2.2 中,红色的曲线为根据样本均值和标准差计算得出的该样本高斯概率密度曲线
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN92;TP311.13
【参考文献】
相关期刊论文 前10条
1 熊志斌;朱剑锋;王冬;;K-means聚类算法的研究和应用[J];电脑编程技巧与维护;2014年08期
2 苗浩轩;王景成;李创;费灵;刘正峰;;一种基于模糊逻辑的室内定位方法[J];化工自动化及仪表;2014年04期
3 谢代军;胡捍英;孔范增;;基于分布重叠和特征加权的无线局域网室内定位算法[J];计算机科学;2013年11期
4 廖飞;黄晟;龚德俊;安乐;;基于Hadoop的城市道路交通流量数据分布式存储与挖掘分析研究[J];公路与汽运;2013年05期
5 刘师语;周渊平;杜江;;基于HADOOP分布式系统的数据处理分析[J];通信技术;2013年09期
6 郝树魁;;Hadoop HDFS和MapReduce架构浅析[J];邮电设计技术;2012年07期
7 刘广孚;田冀;陶凤阳;姚诚;;基于样本内主成分分析的潜油电泵偏磨诊断[J];仪器仪表学报;2012年07期
8 李玲俐;;数据挖掘中分类算法综述[J];重庆师范大学学报(自然科学版);2011年04期
9 张小平;周雪忠;黄厚宽;冯奇;陈世波;焦宏官;;一种改进的LDA主题模型[J];北京交通大学学报;2010年02期
10 陈康;郑纬民;;云计算:系统实例与研究现状[J];软件学报;2009年05期
本文编号:2596738
本文链接:https://www.wllwen.com/kejilunwen/wltx/2596738.html