基于犹豫模糊权重的数学表达式检索
发布时间:2022-01-09 20:57
【目的】从大量数学表达式中检索出与查询表达式相似的表达式,并对检索结果排序。【方法】提取单个数学表达式的特征子式,利用犹豫模糊集理论计算每个特征子式的权重值;将属于同一表达式的子式权重值进行累加,计算表达式间的相似度得分,按照分数从高到低的顺序排列检索结果。【结果】从时间和相似度的角度进行分析,本文方法检索效率较高,检索结果较准确,本文排序方法的NDCG值最高为0.88,表明该排序方法较合理。【局限】本文排序方法并非完全面向数学表达式语义检索。【结论】引入犹豫模糊集计算子式权重能够更准确地检索出具有相同结构特征的数学表达式。
【文章来源】:数据分析与知识发现. 2020,4(07)北大核心CSSCICSCD
【文章页数】:9 页
【部分图文】:
数学表达式检索总体流程
除倒排表以外,还有数学表达式索引表,设置三个字段,分别记录表达式编号、表达式LaTeX码、所有子式特征码及权重值。该表采用顺序索引方式构建,在此不再赘述。3.3 犹豫模糊权重子式检索与相似度计算方法
以一个包含两个子式的数学表达式f(md5-subf1,md5-subf2)为例,展示检索过程,如图3所示。表达式l和m均包含两个子式,表达式n只包含第二个子式,则score(l)和score(m)均为两个加权权重值的累加,score(n)仅等于第二个子式的加权权重值。4 实验与分析
【参考文献】:
期刊论文
[1]基于文本和公式的科技文档相似度计算[J]. 徐建民,许彩云. 数据分析与知识发现. 2018(10)
[2]基于消息摘要算法第五版和IDEA的混合加密算法[J]. 李夏梦,潘广贞. 科学技术与工程. 2017(09)
[3]LaTeX数学表达式解析与索引方法[J]. 周南,田学东. 计算机应用. 2016(03)
硕士论文
[1]基于犹豫模糊集的数学检索结果排序研究[D]. 张凯歌.河北大学 2017
[2]基于层次结构特征的数学表达式检索模型[D]. 周南.河北大学 2016
[3]面向语义的数学公式N-grams索引结构研究[D]. 徐月霞.兰州大学 2015
[4]基于本体的数学表达式检索技术研究[D]. 王小龙.重庆大学 2014
[5]网络数学搜索中的数学查询语言与索引的研究[D]. 景珂.兰州大学 2009
本文编号:3579430
【文章来源】:数据分析与知识发现. 2020,4(07)北大核心CSSCICSCD
【文章页数】:9 页
【部分图文】:
数学表达式检索总体流程
除倒排表以外,还有数学表达式索引表,设置三个字段,分别记录表达式编号、表达式LaTeX码、所有子式特征码及权重值。该表采用顺序索引方式构建,在此不再赘述。3.3 犹豫模糊权重子式检索与相似度计算方法
以一个包含两个子式的数学表达式f(md5-subf1,md5-subf2)为例,展示检索过程,如图3所示。表达式l和m均包含两个子式,表达式n只包含第二个子式,则score(l)和score(m)均为两个加权权重值的累加,score(n)仅等于第二个子式的加权权重值。4 实验与分析
【参考文献】:
期刊论文
[1]基于文本和公式的科技文档相似度计算[J]. 徐建民,许彩云. 数据分析与知识发现. 2018(10)
[2]基于消息摘要算法第五版和IDEA的混合加密算法[J]. 李夏梦,潘广贞. 科学技术与工程. 2017(09)
[3]LaTeX数学表达式解析与索引方法[J]. 周南,田学东. 计算机应用. 2016(03)
硕士论文
[1]基于犹豫模糊集的数学检索结果排序研究[D]. 张凯歌.河北大学 2017
[2]基于层次结构特征的数学表达式检索模型[D]. 周南.河北大学 2016
[3]面向语义的数学公式N-grams索引结构研究[D]. 徐月霞.兰州大学 2015
[4]基于本体的数学表达式检索技术研究[D]. 王小龙.重庆大学 2014
[5]网络数学搜索中的数学查询语言与索引的研究[D]. 景珂.兰州大学 2009
本文编号:3579430
本文链接:https://www.wllwen.com/kejilunwen/yysx/3579430.html