基于多源数据关联分析的关键技术应用研究
发布时间:2021-06-26 08:21
关联分析作为一门发现大量数据之间有趣的关联关系的重要技术。目前已经被应用到商业、电信、金融、农业、医疗等领域,并取得了良好的效果。而当前机动车数量的增加已经导致各类交通事故的频繁发生,针对已发生事故的关联分析并根据关联规则进行事故预测可以为相关部门提供信息来更大程度的避免交通事故的发生。本文工作的目的是研究一种效率更高的关联规则挖掘算法,建立一个在不平衡数据集下也能保证其准确率的关联分析预测模型,并将模型应用于交通事故预测中。论文的主要工作内容包括如下几点:(1)提出一种改进的关联分类规则挖掘算法。本文提出了一种改进的等价类规则树结构来进行关联规则挖掘,基于等价类规则树利用先验思想和diffset策略实现对规则的深度剪枝,从而缩短算法的运行时间。(2)提出了一种基于多源数据的关联分析预测模型。本文采用多种度量与多准则决策算法(ELECTRE TRI)结合的方法进行规则筛选,提出一种改进的Laplace度量进行规则排序,采用数据库覆盖法进行数据覆盖,获取强关联规则,从而构建一种能应用于不平衡数据的关联分析预测模型。(3)将模型应用于实际的交通事故预测中并设计实现交通事故预测系统,对预测结...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
010年-2018年我国民用汽车保有
电子科技大学硕士学位论文4图1-12010年-2018年我国民用汽车保有在调查中,据估计每年全世界范围内估计有120万人死亡和5000万人受伤。道路基础设施不佳造成的因果关系和伤害的近似估计是人类面临的巨大挑战。为了解决该问题,在计算科学中,可以针对不同场景采用数据挖掘模型。在任何车辆事故中,都会研究驾驶员的行为,道路基础设施以及天气情况的可能性,这些因素可能与不同的事故事件有关。研究和分析事故数据的主要问题是混合异构环境和数据分段,使其广泛用于解决事故问题。图1-22008年-2018年我国汽车和机动车驾驶人数趋势图
第一章绪论5图1-3影响事故发生的因素数据挖掘是一种用于处理大型和复杂数据集的计算技术,在科学和管理的各个领域中应用非常广泛。它可以用于欺诈识别和更多科学案例以及事故严重性问题中。数据挖掘技术被认为是分析交通事故严重性问题并找出其背后因素的可靠技术。道路交通事故造成的后果是很严重的,很多时候,在某些因素的影响下发生交通事故事件更为常见,而关联规则挖掘有助于确定交通事故背后的因素,为预防交通事故提供决策支持。G.Janani提出了一种K-means算法的扩展[28]。这种扩展的基于k均值的算法包括具有数值和分类值的分类域。k均值算法使用简单的匹配相异性度量来处理分类对象,其中扩展的k均值算法使用模式替换聚类方法,并在聚类过程中使用基于频率的方法更新模式以最小化聚类成本函数。Sachin等人通过使用K-模式聚类技术和关联规则挖掘,为2009年和2014年发生的印度德拉敦道路交通事故提出了一个框架。结合使用这些技术对结果进行分析,得出的结论是,如果不进行细分,结果将更加有效的生成关联规则[29]。S.Krishnaven使用一些分类模型来预测尼日利亚交通事故中的伤害,并比较了朴素贝叶斯贝叶斯分类器[30]。这项研究使用了基于人工神经网络的方法和决策树方法进行数据分析来减少高速公路上的交通事故。在论文中将数据分类为连续和分类数据,其中使用人工神经网络技术分析连续数据,并使用决策树技术分析分类数据。结果表明,决策树方法以较低的错误率和较高的准确率优于人工神经网络。这项研究基于轮胎爆裂,失控和超速导致事故的三个最重要原因。该研究使用了1995年至2000年的交通事故记录,共417670例。他们将其应用于从美
【参考文献】:
期刊论文
[1]A data mining approach to characterize road accident locations[J]. Sachin Kumar,Durga Toshniwal. Journal of Modern Transportation. 2016(01)
[2]增量关联规则挖掘研究综述[J]. 张步忠,江克勤,张玉州. 小型微型计算机系统. 2016(01)
[3]基于项权值变化和SCCI框架的加权正负关联规则挖掘[J]. 黄名选,黄发良,严小卫,兰慧红. 控制与决策. 2015(10)
硕士论文
[1]基于关联规则和用户喜好程度的综合电子商务推荐系统的研究[D]. 张同启.北京邮电大学 2015
本文编号:3250991
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
010年-2018年我国民用汽车保有
电子科技大学硕士学位论文4图1-12010年-2018年我国民用汽车保有在调查中,据估计每年全世界范围内估计有120万人死亡和5000万人受伤。道路基础设施不佳造成的因果关系和伤害的近似估计是人类面临的巨大挑战。为了解决该问题,在计算科学中,可以针对不同场景采用数据挖掘模型。在任何车辆事故中,都会研究驾驶员的行为,道路基础设施以及天气情况的可能性,这些因素可能与不同的事故事件有关。研究和分析事故数据的主要问题是混合异构环境和数据分段,使其广泛用于解决事故问题。图1-22008年-2018年我国汽车和机动车驾驶人数趋势图
第一章绪论5图1-3影响事故发生的因素数据挖掘是一种用于处理大型和复杂数据集的计算技术,在科学和管理的各个领域中应用非常广泛。它可以用于欺诈识别和更多科学案例以及事故严重性问题中。数据挖掘技术被认为是分析交通事故严重性问题并找出其背后因素的可靠技术。道路交通事故造成的后果是很严重的,很多时候,在某些因素的影响下发生交通事故事件更为常见,而关联规则挖掘有助于确定交通事故背后的因素,为预防交通事故提供决策支持。G.Janani提出了一种K-means算法的扩展[28]。这种扩展的基于k均值的算法包括具有数值和分类值的分类域。k均值算法使用简单的匹配相异性度量来处理分类对象,其中扩展的k均值算法使用模式替换聚类方法,并在聚类过程中使用基于频率的方法更新模式以最小化聚类成本函数。Sachin等人通过使用K-模式聚类技术和关联规则挖掘,为2009年和2014年发生的印度德拉敦道路交通事故提出了一个框架。结合使用这些技术对结果进行分析,得出的结论是,如果不进行细分,结果将更加有效的生成关联规则[29]。S.Krishnaven使用一些分类模型来预测尼日利亚交通事故中的伤害,并比较了朴素贝叶斯贝叶斯分类器[30]。这项研究使用了基于人工神经网络的方法和决策树方法进行数据分析来减少高速公路上的交通事故。在论文中将数据分类为连续和分类数据,其中使用人工神经网络技术分析连续数据,并使用决策树技术分析分类数据。结果表明,决策树方法以较低的错误率和较高的准确率优于人工神经网络。这项研究基于轮胎爆裂,失控和超速导致事故的三个最重要原因。该研究使用了1995年至2000年的交通事故记录,共417670例。他们将其应用于从美
【参考文献】:
期刊论文
[1]A data mining approach to characterize road accident locations[J]. Sachin Kumar,Durga Toshniwal. Journal of Modern Transportation. 2016(01)
[2]增量关联规则挖掘研究综述[J]. 张步忠,江克勤,张玉州. 小型微型计算机系统. 2016(01)
[3]基于项权值变化和SCCI框架的加权正负关联规则挖掘[J]. 黄名选,黄发良,严小卫,兰慧红. 控制与决策. 2015(10)
硕士论文
[1]基于关联规则和用户喜好程度的综合电子商务推荐系统的研究[D]. 张同启.北京邮电大学 2015
本文编号:3250991
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3250991.html
最近更新
教材专著