当前位置:主页 > 社科论文 > 图书档案论文 >

基于案例-规则检索的特征阈值选择模型

发布时间:2019-11-12 00:21
【摘要】:基于案例规则的信息检索模型因知识不确定性或推理不可靠性而存在匹配效率不高的问题,因此制定合理高效的匹配策略来增强信息检索的准确性显得非常重要。本文提出融合酉空间的概念,并通过归一化处理将异构的案例和规则知识在空间中统一表示,定义检索模型的效能解;其次利用酉空间奇异值分解定理得到检索模型的阈值向量,引入融合推理传递函数矩阵的能量泛函的基础上证明了阈值的有效性;再次采用特征阈值向量界定了知识源的元数据与决策目标解集之间的关联性;最后根据特征阈值向量制定融合检索策略并提出了采用特征阈值的案例-规则融合方法实现知识融合,使用基准数据验证本方法的有效性。
【图文】:

心电图,平均时间,检索结果,准确度


检索的特征阈值选择模型逦265逡逑灰的取值Yes、No分别映射为1,邋0。安静时心电图逦平滑而其他的在6000次左右才趋于平缓,表明本模逡逑数值化映射结果为:0邋(正常)、1邋(邋ST-T波异常)逦型的收敛速度更快。总体时间较普通“案例-规则”逡逑和2(按Estes标准出现可能或明确的左心室肥厚)。逦检索方法节省约5%。同时,本模型对比单纯的规则逡逑将心脏病诊断的结果出现P和不出现N,分别表示逦检索方法时间节省约2%,比单纯的案例检索方法节逡逑为类别信息G和C/。逦省1邋%左右。如图1所示。逡逑在性能评价上,使用的准确度公式为:Aruraqy:逦2A逦.逡逑rP邋,邋r4.邋VA邋’邋其中,7'尸、W邋表7^为实际邋C|逦23逦^S-RBR逡逑TP邋+邋TA邋4-邋FP邋-f邋FA逦cbr逡逑分别被推理为c,和c2的样本数;FP、77V分别表示逦_邋Z2邋y逦11011逡逑为c2而分别被推理为Cl和C2的样本数。逦£邋2.1邋.逡逑5逦:逡逑5.2检索过程逦|2.0逡逑''供逡逑实验使用十字交叉法,将数据集分为十组,每逦n'逡逑一循环随机抽取其中一组作为测试集,其余九组为逦18逦一^逡逑训练集,以仿真样本空间的不确定性。对样本空间逦…n.逦…10逡逑采用正交线性判别方法,提取其特征值集合为,并逦S代次数/HP逡逑获得特征4与候选方案;C,.在融合酉空间映射的数据逦图1本模型与相近方法检索的平均时间比较逡逑wa.邋0j^逦从检索结果准确度上,本模型的准献约为逡逑行解jc,,+的数据集合融合矩阵实例’如表2所示。逦90.774%,与单纯的案例检索或规则检索方法栛提逡逑表2特征

模块图,平均准确度,定性控制,相关方法


邋最近邻(Nearest邋Neighbor,逦0邋84邋.邋.....0邋v逦、、逡逑NN)数据处理。而对于单纯规则数据,应用C4.5逦'、逦+本i型逡逑a邋09邋4逦逦a__.邋CBR-RBR逡逑方法[29],通过决策树形成的规则进行推理,按照信逦.逦0邋RBR逡逑CBR逡逑息增益比统一给出每个规则的条件属性的置信度的逦0.801?………i逡逑1zJ4j0/0v1U逡逑取值0.72。在“案例-规则”检索的算法中,通过阈值逦组别逡逑设计方法得到的特征阈值向量为图2本模型与相关方法的平均准确度比较图逡逑[0.7721邋0.6539邋0.5762lT逦综上所述,与其他使用定性控制模块调节检索逡逑'逦'逦°逦策略方法相比,本模型提出的特征阈值选择方法更逡逑5.3实验结果与比较分析逦具优势。逡逑从检索时间上,本模型的每个目标解方案所用逦6邋g逦胃逡逑的平均时间随着实验迭代次数增加而逐渐减少且呈逡逑现逐渐平缓的趋势,且其初始值为1.9邋s,比其他方法逦在案例-规则融合检索中,提高检索效率一直是逡逑的初始值约低10%,在迭代4000次左右的时候就趋于逦重要研究方向。本文使用融合酉空间的奇异值准确逡逑


本文编号:2559494

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2559494.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户699cf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com