不确定图下的稠密子图挖掘研究
发布时间:2021-02-25 16:32
随着互联网与信息技术的高速发展,各行各业产生的数据也随之增多,这些数据往往能产生巨大的价值,如何挖掘其背后隐藏的核心数据成为了信息技术圈的核心议题。图作为一个经典的数据结构,由于其在描述数据及结构特性等方面的显著优势,被广泛使用在社交网络、本文检索、生物信息等领域。使用图来描述的数据信息被称为图数据,而挖掘图数据中有价值的、隐藏不为人所知的信息则称为图挖掘。在实际应用中,由于数据来源的差异及技术手段的限制,会导致图数据的不精确甚至缺失,不确定图被提出用来表示这种含有不精确信息的图数据,在针对种类数据进行分析处理时必须兼顾不确定性,因此针对不确定图的挖掘问题称为了图挖掘领域的新难题。稠密子图作为一个图中内部边相对密集的子区域一般被视为图的核心部分,如何从不确定图中挖掘出稠密子图具有重要的应用价值和理论意义。本文主要工作内容和研究成果如下:1.本文首先对传统图挖掘中的稠密子图挖掘进行了介绍,其中包括稠密子图的定义,稠密子图挖掘算法的研究背景现状等;接着介绍不确定图的研究背景及数学表达方式;最后介绍了基于不确定图的稠密子图定义及挖掘算法研究现状。2.利用目前的不确定图的稠密挖掘算法所发现的子...
【文章来源】:浙江工业大学浙江省
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究的背景和意义
1.2 国内外研究现状
1.2.1 确定图稠密子图研究现状
1.2.2 不确定图稠密子图研究现状
1.3 论文的主要工作和贡献
1.4 论文组织结构
第2章 稠密子图挖掘算法
2.1 引言
2.2 确定图的稠密子图挖掘典型算法
2.2.1 Goldberg算法
2.2.2 Charikar算法
2.3 不确定图的稠密子图挖掘典型算法
2.3.1 极大团
2.3.2 最大密度子图
2.4 本章小结
第3章 不确定图上的高可靠稠密子图挖掘算法
3.1 引言
3.2 相关定义
3.3 最佳β-子图
3.3.1 问题分析
3.3.2 GreedyOβS 算法
3.3.3 算法精度
3.4 实验与结果
3.4.1 模型比较
3.4.2 参数选择
3.5 本章小结
第4章 词间关系的不确定图模型与关键词自动抽取方法
4.1 引言
4.2 相关工作
4.2.1 词的向量化
4.2.2 不确定图
4.3 基于不确定图的关键词抽取
4.3.1 构建不确定图
4.3.2 顶点密度及候选关键词评价指标
4.3.3 自适应候选关键词抽取算法
4.3.4 带权重的 DEN-IDF
4.4 实验
4.4.1 实验数据及评价指标
4.4.2 DEN-IDF权重选择
4.4.3 关键词抽取实验
4.5 本章小结
第5章 总结和展望
5.1 总结
5.2 展望
参考文献
致谢
攻读硕士学位期间参加的科研项目及成果
【参考文献】:
期刊论文
[1]自动关键词抽取研究综述[J]. 赵京胜,朱巧明,周国栋,张丽. 软件学报. 2017(09)
[2]不确定图上的Top-k稠密子图挖掘算法[J]. 朱鎔,邹兆年,李建中. 计算机学报. 2016(08)
[3]TF-IDF与规则相结合的中文关键词自动抽取研究[J]. 牛萍,黄德根. 小型微型计算机系统. 2016(04)
[4]大规模不确定图上的Top-k极大团挖掘算法[J]. 邹兆年,朱鎔. 计算机学报. 2013(10)
[5]基于TFIDF和词语关联度的中文关键词提取方法[J]. 张建娥. 情报科学. 2012(10)
[6]从不确定图中挖掘频繁子图模式[J]. 邹兆年,李建中,高宏,张硕. 软件学报. 2009(11)
[7]网络最大流问题研究进展[J]. 张宪超,陈国良,万颖瑜. 计算机研究与发展. 2003(09)
博士论文
[1]不确定图与不确定网络[D]. 高原.清华大学 2013
本文编号:3051243
【文章来源】:浙江工业大学浙江省
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究的背景和意义
1.2 国内外研究现状
1.2.1 确定图稠密子图研究现状
1.2.2 不确定图稠密子图研究现状
1.3 论文的主要工作和贡献
1.4 论文组织结构
第2章 稠密子图挖掘算法
2.1 引言
2.2 确定图的稠密子图挖掘典型算法
2.2.1 Goldberg算法
2.2.2 Charikar算法
2.3 不确定图的稠密子图挖掘典型算法
2.3.1 极大团
2.3.2 最大密度子图
2.4 本章小结
第3章 不确定图上的高可靠稠密子图挖掘算法
3.1 引言
3.2 相关定义
3.3 最佳β-子图
3.3.1 问题分析
3.3.2 GreedyOβS 算法
3.3.3 算法精度
3.4 实验与结果
3.4.1 模型比较
3.4.2 参数选择
3.5 本章小结
第4章 词间关系的不确定图模型与关键词自动抽取方法
4.1 引言
4.2 相关工作
4.2.1 词的向量化
4.2.2 不确定图
4.3 基于不确定图的关键词抽取
4.3.1 构建不确定图
4.3.2 顶点密度及候选关键词评价指标
4.3.3 自适应候选关键词抽取算法
4.3.4 带权重的 DEN-IDF
4.4 实验
4.4.1 实验数据及评价指标
4.4.2 DEN-IDF权重选择
4.4.3 关键词抽取实验
4.5 本章小结
第5章 总结和展望
5.1 总结
5.2 展望
参考文献
致谢
攻读硕士学位期间参加的科研项目及成果
【参考文献】:
期刊论文
[1]自动关键词抽取研究综述[J]. 赵京胜,朱巧明,周国栋,张丽. 软件学报. 2017(09)
[2]不确定图上的Top-k稠密子图挖掘算法[J]. 朱鎔,邹兆年,李建中. 计算机学报. 2016(08)
[3]TF-IDF与规则相结合的中文关键词自动抽取研究[J]. 牛萍,黄德根. 小型微型计算机系统. 2016(04)
[4]大规模不确定图上的Top-k极大团挖掘算法[J]. 邹兆年,朱鎔. 计算机学报. 2013(10)
[5]基于TFIDF和词语关联度的中文关键词提取方法[J]. 张建娥. 情报科学. 2012(10)
[6]从不确定图中挖掘频繁子图模式[J]. 邹兆年,李建中,高宏,张硕. 软件学报. 2009(11)
[7]网络最大流问题研究进展[J]. 张宪超,陈国良,万颖瑜. 计算机研究与发展. 2003(09)
博士论文
[1]不确定图与不确定网络[D]. 高原.清华大学 2013
本文编号:3051243
本文链接:https://www.wllwen.com/kejilunwen/yysx/3051243.html