高相似度英语词语自主选取系统设计
本文选题:高相似度英语词语 + 数据挖掘 ; 参考:《现代电子技术》2017年23期
【摘要】:针对传统的基于支持向量机的高相似度英语词语自主选取系统一直存在选取效果差、精度低的问题,提出一种基于数据挖掘的高相似度英语词语自主选取系统设计方法。首先根据英语词语的相似度概念,计算出两个英语词语义项的最短路径与其距离最近的公共父节点之间的深度。利用数据挖掘法将英语词语文本特征选择转换为一个多目标优化问题;然后以英语词语特征维数最少、分类正确率相对最高为选取标准,采用蚁群算法找到英语词语的最优特征子集;最后通过建立神经网络分类器完成高相似度英语词语自主选取系统设计。实验结果证明,所提方法可以精确地选取出高相似度英语词语,且选取时间较短,实用性广泛。
[Abstract]:Aiming at the problems of poor selection effect and low precision in the traditional high similarity English word autonomous selection system based on support vector machine, a design method of high similarity English word autonomous selection system based on data mining is proposed. Firstly, according to the concept of English word similarity, the depth between the shortest path of the meaning of two English words and the nearest common parent node is calculated. The method of data mining is used to transform the feature selection of English words into a multi-objective optimization problem, and then the feature dimension of English words is the least, and the classification accuracy is the highest. Ant colony algorithm is used to find the optimal feature subset of English words. Finally, a neural network classifier is established to design the autonomous selection system for English words with high similarity. The experimental results show that the proposed method can accurately select English words with high similarity, and the selection time is shorter, and the method has wide practicability.
【作者单位】: 西安建筑科技大学;
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 黄柳柳;黄河燕;史树敏;;面向代码相似度检测的指纹选取方法[J];计算机工程与应用;2010年27期
2 郑炜冬;;试卷相似度自动评估技术的研究[J];智能计算机与应用;2011年06期
3 李桂林,陈晓云;关于聚类分析中相似度的讨论[J];计算机工程与应用;2004年31期
4 秦玉平;杨兴凯;;基于案例推理的区间属性相似度研究[J];辽宁师范大学学报(自然科学版);2006年04期
5 蒋鹏;;基于本体的应急案例相似度算法研究[J];南昌高专学报;2009年03期
6 何亚;;词语相似度算法的分析与改进[J];硅谷;2011年24期
7 仇丽青;陈卓艳;;基于共同邻居相似度的社区发现算法[J];信息系统工程;2014年05期
8 焦鹏;唐见兵;查亚兵;;仿真可信度评估中相似度方法的改进及其应用[J];系统仿真学报;2007年12期
9 姜毅;乐庆玲;;一种基于兴趣相似度的学习社区算法[J];电脑知识与技术(学术交流);2007年16期
10 刘晓平;陆劲挺;唐益明;;基于可拓学的对比相似功能树扩展方法[J];工程图学学报;2009年01期
相关会议论文 前2条
1 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陆劲挺;路强;刘晓平;;对比相似度计算方法及其在功能树扩展中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
相关博士学位论文 前4条
1 程亮;基于本体的疾病数据整合与挖掘方法研究[D];哈尔滨工业大学;2014年
2 曹,
本文编号:2096027
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2096027.html