当前位置:主页 > 科技论文 > 软件论文 >

基于语义的文档特征提取研究方法

发布时间:2017-10-14 18:10

  本文关键词:基于语义的文档特征提取研究方法


  更多相关文章: 特征词 语义距离 信息增益 文本分类


【摘要】:中文文本特征词选取是文本处理的重要方面,对文本分类有重要影响。现有的文本特征提取方法存在生成特征向量维数高、依赖训练集、忽略低频关键词等不足。利用《同义词词林》计算词语之间的语义距离,通过聚类算法筛选类别的主题相关词,最后通过信息增益算法从主题相关词中选取特征词。以宏F值和微F值为评价指标,通过有效性实验和对比实验表明,该方法的文本特征选取效果优于其他经典算法。
【作者单位】: 中国石油大学(北京)地球物理与信息工程学院;中国石油大学(北京)油气数据挖掘北京市重点实验室;中海油研究总院信息数据中心;
【关键词】特征词 语义距离 信息增益 文本分类
【基金】:国家高新技术研究发展计划(2009AA062802) 国家自然科学基金(60473125) 中国石油(CNPC)石油科技中青年创新基金(05E7013) 国家重大专项子课题(G5800-08-ZS-WX)资助
【分类号】:TP391.1
【正文快照】: 1引言为了提高中文信息处理的效率,帮助人们全面地掌握自己所需要的信息,特征提取成为研究热点。本文主要介绍基于文档的特征提取,文档特征可以代表相应文档,在区分文档类别时能减少处理词语数量、降低向量空间维度、简化计算、提高速度和效率,并且能够清晰、直接地代表文档主

【参考文献】

中国期刊全文数据库 前1条

1 周海芳;杜云飞;杨学军;李思昆;;基于互信息的遥感图像区域配准并行算法的研究与实现[J];中国图象图形学报;2010年01期

【共引文献】

中国期刊全文数据库 前9条

1 孙少杰;杨晓东;任继昌;;基于互信息的亚像素级立体视觉点匹配方法研究[J];电光与控制;2015年04期

2 蔡国榕;李绍滋;陈水利;吴云东;苏松志;;基于模糊控制的ASIFT图像特征优化算法[J];模糊系统与数学;2012年05期

3 崔丹丹;张耀南;赵国辉;;基于MPI和OpenCV遥感植被指数产品的并行计算[J];科研信息化技术与应用;2013年05期

4 张兴国;王正勇;吴晓红;姚权;;基于岩心扫描仪的多物距岩心图像的配准[J];计算机与数字工程;2014年03期

5 张永宏;阚希;;基于SURF的抗重复特征干扰图像配准方法[J];计算机工程与设计;2013年03期

6 沈荣;;自适应层次B样条弹性图像配准方法[J];计算机工程与设计;2014年07期

7 李爱农;蒋锦刚;边金虎;雷光斌;黄成全;;基于AROP程序包的类Landsat遥感影像配准与正射纠正试验和精度分析[J];遥感技术与应用;2012年01期

8 欧阳能钧;李伟彤;韦蔚;潘晴;;基于SIFT与Contourlet变换的高分辨遥感图像配准[J];遥感技术与应用;2013年01期

9 赵颖辉;蒋从锋;;遥感影像的高性能并行处理技术研究[J];计算机技术与发展;2014年07期

中国博士学位论文全文数据库 前1条

1 方雷;基于云计算的土地资源服务高效处理平台关键技术探索与研究[D];浙江大学;2011年

中国硕士学位论文全文数据库 前7条

1 郭茂银;基于四阶偏微分方程的并行图像去噪研究[D];重庆邮电大学;2011年

2 欧阳能钧;基于点特征的遥感图像配准算法研究[D];广东工业大学;2012年

3 万义萍;基于Treelet变换的遥感图像变化检测方法研究[D];西安电子科技大学;2012年

4 姜海英;基于互信息的医学图像配准技术研究[D];江西理工大学;2012年

5 阚希;基于机器视觉的印刷品缺陷在线检测系统关键技术研究[D];南京信息工程大学;2013年

6 王修林;异构并行计算在娄底地区水土流失分析处理中的应用研究[D];湖南大学;2013年

7 张伟;遥感震害信息智能提取优化方法研究[D];中国地震局地震预测研究所;2014年

【二级参考文献】

中国期刊全文数据库 前1条

1 曹洁;戴峻峰;;基于互信息和改进PV插值算法的医学图像配准[J];科学技术与工程;2007年23期

【相似文献】

中国期刊全文数据库 前10条

1 马少华,高峰,李敏,吴成东;神经网络分类器的特征提取和优选[J];基础自动化;2000年06期

2 管聪慧,宣国荣;多类问题中的特征提取[J];计算机工程;2002年01期

3 胡威;李建华;陈波;;入侵检测建模过程中特征提取最优化评估[J];计算机工程;2006年12期

4 朱玉莲;陈松灿;赵国安;;推广的矩阵模式特征提取方法及其在人脸识别中的应用[J];小型微型计算机系统;2007年04期

5 赵振勇;王保华;王力;崔磊;;人脸图像的特征提取[J];计算机技术与发展;2007年05期

6 冯海亮;王丽;李见为;;一种新的用于人脸识别的特征提取方法[J];计算机科学;2009年06期

7 朱笑荣;杨德运;;基于入侵检测的特征提取方法[J];计算机应用与软件;2010年06期

8 王菲;白洁;;一种基于非线性特征提取的被动声纳目标识别方法研究[J];软件导刊;2010年05期

9 陈伟;瞿晓;葛丁飞;;主观引导特征提取法在光谱识别中的应用[J];科技通报;2011年04期

10 王华,李介谷;人脸斜视图象的特征提取与恢复[J];上海交通大学学报;1997年01期

中国重要会议论文全文数据库 前10条

1 尚修刚;蒋慰孙;;模糊特征提取新算法[A];1997中国控制与决策学术年会论文集[C];1997年

2 潘荣江;孟祥旭;杨承磊;王锐;;旋转体的几何特征提取方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

3 薛燕;李建良;朱学芳;;人脸识别中特征提取的一种改进方法[A];第十三届全国图象图形学学术会议论文集[C];2006年

4 杜栓平;曹正良;;时间—频率域特征提取及其应用[A];2005年全国水声学学术会议论文集[C];2005年

5 黄先锋;韩传久;陈旭;周剑军;;运动目标的分割与特征提取[A];全国第二届信号处理与应用学术会议专刊[C];2008年

6 魏明果;;方言比较的特征提取与矩阵分析[A];2009系统仿真技术及其应用学术会议论文集[C];2009年

7 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

8 秦建玲;李军;;基于核的主成分分析的特征提取方法与样本筛选[A];2005年中国机械工程学会年会论文集[C];2005年

9 刘红;陈光,

本文编号:1032427


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1032427.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户339ea***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com