ProBench:一种评估流程相似性查询算法的基准数据集
本文选题:基准数据集 + 业务流程 ; 参考:《计算机集成制造系统》2017年05期
【摘要】:针对目前缺乏评估现有流程相似性算法性能的基准数据集问题,在IBM公开的数据集基础上,用Petri网建模流程模型,提出一种评估流程相似性查询算法的基准数据集。该数据集由100个流程模型组成,其中标记出了10个检索流程与其各自的9个相关流程,以及相关流程的排序顺序。对于每个检索流程,其9个相关流程与该检索流程的相关性排序顺序由一个用户调查的结果确定,将该结果作为一个基准对算法的结果进行评估。选取3个基于结构的和1个基于行为的流程相似性查询算法,对它们在准确率和效率两个方面进行了评估,实验结果展示了这些算法各自的适用场景。所提出的基准数据集和相关的算法代码已经公开发布在网上,可供研究人员下载使用。
[Abstract]:In view of the lack of a benchmark data set for evaluating the performance of existing process similarity algorithms, a benchmark data set for evaluating process similarity query algorithm is proposed based on IBM published data sets and process model modeling using Petri nets. The data set consists of 100 process models, in which 10 retrieval processes and their 9 related processes are marked, as well as the ranking order of the related processes. For each retrieval process, the ranking order of the correlation between the nine related processes and the retrieval process is determined by the result of a user survey, and the results are evaluated as a benchmark. Three structure-based and one behavior-based process similarity query algorithms are selected to evaluate their accuracy and efficiency. The experimental results show their respective applicable scenarios. The proposed benchmark data set and related algorithm codes have been published online and can be downloaded by researchers.
【作者单位】: 浙江工业大学计算机科学与技术学院;
【基金】:国家自然科学基金资助项目(61602411,61272308) 浙江省自然科学基金资助项目(LY15F020030) 浙江省重大科技专项重点工业资助项目(2015C01034,2015C01029) 杭州市重大科技创新资助项目(20152011A03)~~
【分类号】:TP301.1;TP391.3
【相似文献】
相关期刊论文 前10条
1 ;数据集N鄽2[J];航空材料;1959年09期
2 江海洪 ,罗长坤;首套中国数字化可视人体数据集在第三军医大学研制成功[J];中华医学杂志;2003年09期
3 陈相颖;数据集记录快速定位与筛选方法之探讨[J];计量与测试技术;2005年06期
4 王宏鼎;唐世渭;董国田;;数据集成中数据集特征的检测方法[J];中国金融电脑;2006年03期
5 张华;郁书好;;时空数据集的连接处理和优化方法研究[J];皖西学院学报;2006年02期
6 苗卿;单立新;裘昱;;信息熵在数据集分割中的应用研究[J];电脑知识与技术(学术交流);2007年05期
7 陈德诚;丘平珠;唐炳莉;;广西气象数据集设计与制作[J];气象研究与应用;2007年04期
8 赵凤英;王崇骏;陈世福;;用于不均衡数据集的挖掘方法[J];计算机科学;2007年09期
9 冯璐;冷伏海;;基于领域分析需求和目标的领域分析数据集界域研究[J];图书情报工作;2009年24期
10 宋金玲;赵威;刘欣;黄立明;李金才;刘国华;;k-匿名数据集的增量更新算法[J];计算机科学;2010年04期
相关会议论文 前7条
1 田捷;;三维医学影像数据集处理的集成化平台[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
2 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 段磊;唐常杰;左R,
本文编号:1881745
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1881745.html