效用挖掘技术及其应用

发布时间:2021-01-25 18:03
  在数字经济时代,数据型态丰富、复杂而量大,如何挖掘出数据中蕴含着的“效用特征”,是数据科学领域中关键而有挑战性的问题。基于效用驱动的数据挖掘比传统的数据挖掘有着更广泛的应用前景和需求,对于理论研究与工程应用都具有重要意义。在大数据时代,基于效用驱动的模式挖掘理论与技术是数据挖掘领域中的前沿研究课题。基于效用驱动的挖掘理论与技术,其相关研究对社会学、经济学、计算机科学、数据挖掘以及数据库等学科有着重要的科学意义,同时在购物篮分析、风险分析与预测、行为分析、推荐系统等领域有着许多应用前景。效用挖掘受到了广泛的关注与研究,但是诸多关键技术与难点有待深入研究,目前存在的问题包括:第一、效用模式的衡量准则单一。如何定义模式的效用函数,提高效用挖掘结果的可用性,让挖掘得到的结果更好?这是一个关键的基本科学问题。第二、适用处理的数据型态比较单一,应用性不够广。现有的效用挖掘模型和算法大多数针对各式各样的事务型数据,部分针对序列数据。第三、效用挖掘研究的理论与技术不够成熟。如何定义适用于不同型态数据的通用化效用挖掘模型,如何定义其效用计算模型,如何求解通用化的基于效用值的高估上界值,是重要的科学问题。... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:160 页

【学位级别】:博士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景
        1.1.1 数据挖掘
        1.1.2 效用挖掘
    1.2 研究目的与意义
    1.3 研究现状及分析
        1.3.1 传统的模式挖掘技术
        1.3.2 效用驱动的模式挖掘
        1.3.3 研究现状总结
    1.4 主要研究内容及创新点
    1.5 论文组织结构
第2章 基于事务数据的效用挖掘
    2.1 引言
    2.2 相关研究工作
    2.3 预备知识与问题定义
    2.4 HUOPM算法
        2.4.1 搜索空间与挑战
        2.4.2 UO-List和 FU-Table
        2.4.3 效用占有度上界
        2.4.4 修剪策略
        2.4.5 HUOPM算法
    2.5 实验分析
        2.5.1 数据描述和实验设置
        2.5.2 模式分析
        2.5.3 效率分析
        2.5.4 修剪策略的效果
        2.5.5 数据项处理顺序的效果
    2.6 本章小结
第3章 基于序列数据的效用挖掘
    3.1 引言
    3.2 相关研究工作
    3.3 预备知识与问题定义
    3.4 ProUM算法
        3.4.1 词典量化序列树
        3.4.2 效用阵列和投影机制
        3.4.3 效用上界和剪枝策略
        3.4.4 ProUM算法
    3.5 实验分析
        3.5.1 数据描述和实验设置
        3.5.2 效率分析
        3.5.3 候选模式分析
        3.5.4 内存消耗分析
        3.5.5 可伸缩性测试
    3.6 本章小结
第4章 基于复杂事件序列的效用挖掘
    4.1 引言
    4.2 相关研究工作
    4.3 预备知识与问题定义
    4.4 UMEpi算法
        4.4.1 EWU高估上界值
        4.4.2 搜索空间中的修剪策略
        4.4.3 UMEpi算法
    4.5 实验分析
        4.5.1 数据描述和实验设置
        4.5.2 有效性分析
        4.5.3 运行时间分析
        4.5.4 内存消耗分析
        4.5.5 可伸缩性测试
    4.6 本章小结
第5章 基于相关性的效用挖掘
    5.1 引言
    5.2 预备知识与问题定义
    5.3 基于阶层组合的Co HUIM算法
        5.3.1 数据库的投影操作
        5.3.2 基于排序的向下封闭特性
        5.3.3 Co HUIM算法
    5.4 基于效用列表的CoUPM算法
        5.4.1 融合相关性的效用列表
        5.4.2 CoUPM算法
    5.5 实验分析
        5.5.1 数据描述和环境设置
        5.5.2 有效性分析
        5.5.3 效率分析
        5.5.4 内存消耗分析
    5.6 本章小结
结论
参考文献
攻读博士学位期间发表的论文及其他成果
致谢
个人简历


【参考文献】:
博士论文
[1]高效用项集挖掘算法的关键技术研究[D]. 郭世明.哈尔滨工业大学 2017
[2]数据流模式挖掘算法及应用研究[D]. 王乐.大连理工大学 2013
[3]频繁项集与高可用项集挖掘算法及其性能研究[D]. 屈俊峰.武汉大学 2013
[4]高效用关联规则的挖掘[D]. 余光柱.东华大学 2008

硕士论文
[1]基于不同数据型态、约束和应用的高效用项集挖掘[D]. 甘文生.哈尔滨工业大学 2016



本文编号:2999646

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2999646.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2d8f4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com