基于流程引擎的网上服务平台的研究与实现
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图3-2?Lucene系统架构??
ir*〇〇x??图3-2?Lucene系统架构??从图3-1中可以清楚看到,Lucene主要由三大部分组成:基础结构封装、索引核心、对外??接口。其中,索引核心是整个系统的重点部分,它可以直接操作索引文件。Lucene在被设计时??所应用的一条基本思想是:引入额外的抽象层,降低耦....
图3心子,扭助k关健词提职效果
图3-6?Lucene关键词提取效果??在上面实验中,利用TextRank算法提取的关键词为:“父亲,收入,经济,稳定,且不,??返家,约,一个月,需要,微薄”,Lucene方法提取的关键词为:“收入,父亲,卧病在床,照??顾,返家,稳定,常常,奶奶,承担,且不”,通过对比发现其....
图3-8余弦相似度??两个向量的余弦值的点积公式为公式3-3所示:??
值越趋近于1,代表两个向量越趋近于重合,他们的方向更加一致,相应的相似度也??越高。在文本相似度判定中,由于文本特征向量在定义上的特殊性,其余弦值范围为[0,1],即??向量夹角越趋向于90°,则两向量越不相似[39]。如图3-8所示。??1?I??-??x?I??图3-8余弦相....
图3-9?SimHash值的生成图解??假设输出的fingerprint为f位,算法的步骤如下[42]:??
离由二者的海明距离(Hamming?Distance)来确定,这样就可以将两篇文章的相似度计算转换成文??本的海明距离计算了。通常我们可以通过比较两篇文章的f-bit的指纹的海明距离是不是小于3,??来确定两篇文章是否相似。SimHash值的生成图解如图3-9所示。??featu....
本文编号:3957131
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3957131.html