当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于遗传算法的语义特征提取研究

发布时间:2017-04-11 15:05

  本文关键词:基于遗传算法的语义特征提取研究,由笔耕文化传播整理发布。


【摘要】:互联网上庞大的信息量使得人们很难从中找到所需的信息并进行有效的利用。目前基于关键字以及文本内容的搜索引擎已经成为了人们从互联网获取信息的一种十分重要的途径,但是利用这种工具得到的搜索结果往往相关度较低,列出了很多无关的信息。对一个搜索引擎进行评价主要有搜索结果的精确度以及排序正确率两个指标。其中搜索结果的准确率指的是搜索结果中与用户的需求相符的信息的数量,这个数量越大则搜索结果的准确率越高,反之则较低。而搜索结果排序的正确率则指的是搜索结果的排序与用户的需求程度是否呈正相关关系。为了使得搜索结果排序的正确率得到优化,本文提出了一种基于遗传算法的语义特征提取方法。本课题在介绍研究了语义搜索技术的基础上,讨论了传统搜索技术的缺点和不足。从研究和设计的角度出发,研究了一种基于遗传算法的语义搜索算法。本文首先以二进制编码作为本文的编码方式生成种群的初始化特征值;然后采用降维作为语义特征分类的预处理方式,对种群里面的每个染色体适应度进行计算,本文的适应度函数采用分类准确率来评价单个个体值;最后对前面初始化种群采取种群中个体进行选择算子、交叉算子、变异算子之后得到下一个优化后的种群,终止判断条件,输出种群中适应度值最优的染色体作为问题的满意解或最优解。通过对语义搜索的用户行为模式研究,基于GA对SVM参数进行优化的语义特征提取方法,构建出基于遗传算法的语义搜索用户交互模型,通过理论模型构建实验方法来检验研究成果。
【关键词】:遗传算法 语义特征 特征提取 语义关联 语义分析
【学位授予单位】:河北科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3;TP18
【目录】:
  • 摘要4-5
  • Abstract5-8
  • 第1章 绪论8-10
  • 1.1 研究的目的及意义8
  • 1.2 国内外现状8-9
  • 1.3 本文研究的主要内容9
  • 1.4 论文组织结构9-10
  • 第2章 数据挖掘技术10-22
  • 2.1 数据挖掘技术的产生10-11
  • 2.2 数据挖掘的概念11-12
  • 2.3 相关理论与算法简介12-20
  • 2.3.1 SVM12-17
  • 2.3.2 遗传算法17-18
  • 2.3.3 其他算法18-20
  • 2.4 本章小结20-22
  • 第3章 语义特征提取研究22-28
  • 3.1 语义特征分析相关介绍22-23
  • 3.2 语义特征提取23-25
  • 3.3 语义特征提取相关算法分析25-27
  • 3.4 本章小结27-28
  • 第4章 基于遗传算法的语义特征提取方法28-33
  • 4.1 算法的主要问题28-29
  • 4.2 算法过程29-32
  • 4.3 本章小结32-33
  • 第5章 基于遗传算法的语义特征提取设计与实现33-55
  • 5.1 设计思想33-37
  • 5.1.1 开发工具33-35
  • 5.1.2 特征提取与表达方法的设计35-37
  • 5.2 实现过程37-54
  • 5.2.1 文本分类语料库的采集39-40
  • 5.2.2 数据预处理40-42
  • 5.2.3 特征提取和表达42-47
  • 5.2.4 训练过程47-48
  • 5.2.5 测试过程48-49
  • 5.2.6 实验结果和性能评估49-54
  • 5.3 本章小结54-55
  • 结论55-57
  • 附录57-58
  • 参考文献58-61
  • 致谢61-62
  • 个人简历62

【参考文献】

中国期刊全文数据库 前9条

1 宋涛;施水才;房祥;吕学强;;基于改进的潜在语义分析的文本聚类[J];北京信息科技大学学报(自然科学版);2012年03期

2 牛东晓;刘达;陈广娟;冯义;;基于遗传优化的支持向量机小时负荷滚动预测[J];电工技术学报;2007年06期

3 柳佳佳;葛文;;基于本体语义的地理信息服务发现[J];测绘工程;2013年06期

4 王立霞;淮晓永;;基于语义的中文文本关键词提取算法[J];计算机工程;2012年01期

5 马元良;裴生雷;;基于改进遗传算法的SVM参数优化研究[J];计算机仿真;2010年08期

6 赵文娟;刘忠宝;;基于语义理解的智能搜索引擎的研究[J];计算机与网络;2012年01期

7 王亚辉;;基于遗传算法的语义搜索结果排序算法[J];晋城职业技术学院学报;2013年01期

8 王晋;孙涌;王璁玮;;基于领域本体的文本相似度算法[J];苏州大学学报(工科版);2011年03期

9 何超;张玉峰;;融合领域本体的中文文本语义特征提取算法研究[J];情报理论与实践;2013年09期

中国博士学位论文全文数据库 前3条

1 梅翔;语义检索中若干关键问题的研究[D];北京邮电大学;2007年

2 何嘉;基于遗传算法优化的中文分词研究[D];电子科技大学;2012年

3 李朋杰;面向三维模型检索的特征提取算法研究[D];北京邮电大学;2013年

中国硕士学位论文全文数据库 前1条

1 曹道友;基于改进遗传算法的应用研究[D];安徽大学;2010年


  本文关键词:基于遗传算法的语义特征提取研究,,由笔耕文化传播整理发布。



本文编号:299329

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/299329.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f9411***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com