当前位置:主页 > 管理论文 > 移动网络论文 >

基于遗传算法优化综合启发式的中文网页特征提取

发布时间:2017-10-26 17:02

  本文关键词:基于遗传算法优化综合启发式的中文网页特征提取


  更多相关文章: 特征提取 遗传算法 文本分类 文本聚类 词频 关联度


【摘要】:特征提取是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。针对传统的特征提取方法不能全面有效地考查待选特征词的缺点,提出了一种基于遗传算法优化综合启发式的中文网页特征提取方法。该方法通过词频、关联度、词性以及位置等多种启发式来综合考查待选特征,并利用遗传算法来优化各启发式的权重参数。通过在不同测试集上进行对比,实验结果表明,与传统方法相比,该方法能够有效避免传统特征提取方法产生的偏差,获得具有代表性的特征集,从而使得该方法具有一定的实用价值。
【作者单位】: 郑州轻工业学院计算机与通信工程学院;中原工学院信息商务学院基础学科部;
【关键词】特征提取 遗传算法 文本分类 文本聚类 词频 关联度
【基金】:河南省基础与前沿技术研究计划项目(102300410266) 郑州轻工业学院博士科研基金资助项目
【分类号】:TP393.092;TP391.1
【正文快照】: 特征提取在自然语言处理领域有着非常广泛的应用,是信息检索、文本分类、文本聚类以及自动文摘生成等技术的关键。由于互联网资源时刻都在不断更新,中文文本呈现出“爆炸式”增长。然而,采用传统人工方式进行特征提取的方法耗时较长,且 具有一定的主观性,因此快速准确地实现

【相似文献】

中国期刊全文数据库 前10条

1 李平,蒋振刚;神经网络对手写字符识别特征的提取[J];长春光学精密机械学院学报;2000年02期

2 孟国强;基于车辆牌照识别系统字符的特征提取方法研究[J];河南科学;2003年06期

3 崔晨e,

本文编号:1099585


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1099585.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5782e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com