当前位置:主页 > 科技论文 > 软件论文 >

基于主题扩展的领域问题分类方法

发布时间:2017-08-05 02:20

  本文关键词:基于主题扩展的领域问题分类方法


  更多相关文章: 领域问题分类 数据稀疏 特征选择 主题模型 优质主题 特征扩展


【摘要】:领域问题分类在问答系统中占有重要地位,但目前面向特定领域的研究较少。针对领域问题文本篇幅较短、数据稀疏的特点,提出基于主题扩展的领域问题分类方法。该方法主要包括特征选择和特征扩展2个部分。利用卡方统计量特征选择方法,将问题文本选择的特征词作为特征扩展的依据。通过潜在狄利克雷分配主题模型对外部知识库进行分析,得到对应的主题分布。为避免引入噪声主题,采用主题熵的方法得到优质主题。将优质主题下所覆盖的词扩充到问题文本中,最后利用支持向量机分类器对问题文本进行分类。实验结果表明,与传统TFIDF文本分类方法相比,该方法分类效果较好,可提高问答系统的性能。
【作者单位】: 华东师范大学计算机科学技术系;
【关键词】领域问题分类 数据稀疏 特征选择 主题模型 优质主题 特征扩展
【基金】:上海市科学技术委员会科研计划基金资助项目(1451110700,14511106803) 上海张江国家自主创新示范区专项发展基金资助项目(201411-JA-B108-002)
【分类号】:TP391.1
【正文快照】: 中文引用格式:张青,吕钊.基于主题扩展的领域问题分类方法[J].计算机工程,2016,42(9):202-207,213.英文引用格式:Zhang Qing,LüZhao.Domain Question Classification Method Based on Topic Expansion[J].ComputerEngineering,2016,42(9):202-207,213.1概述随着社交媒体的兴

【参考文献】

中国期刊全文数据库 前2条

1 冶忠林;杨燕;贾真;尹红风;;基于语义扩展的短问题分类[J];计算机应用;2015年03期

2 刘丽珍,宋瀚涛;文本分类中的特征选取[J];计算机工程;2004年04期

【共引文献】

中国期刊全文数据库 前10条

1 渠新峰;;海量数据机器单词中关键语义筛选方法研究[J];现代电子技术;2017年06期

2 武振国;李艳翠;;植物病虫害智能问答系统设计与实现[J];农业网络信息;2017年01期

3 韩戟;何成浩;苏星;施成云;刘东映;;一种基于SVM的电力行业物资需求预测方法[J];电气技术;2016年12期

4 张青;吕钊;;基于主题扩展的领域问题分类方法[J];计算机工程;2016年09期

5 何小利;;路由冲突下语义特征信息优化查准算法[J];科学技术与工程;2016年17期

6 杨小梅;黎斌;;海量数据下的特定语义数据检索优化方法研究[J];计算机仿真;2016年05期

7 王格;吴钊;李向;;基于全文检索的文本相似度算法应用研究[J];计算机与数字工程;2016年04期

8 马丽菲;莫倩;杜辉;;面向中文短影评的分类技术研究[J];山东大学学报(理学版);2016年01期

9 孙曰昕;马慧芳;姚伟;张志昌;;结合互信息和主题模型的微博话题发现方法[J];计算机工程与应用;2016年06期

10 文必龙;李乃峰;任秀英;冯翔;吕鹏全;;基于概念关系的文本特征提取方法[J];计算机与数字工程;2014年11期

【二级参考文献】

中国期刊全文数据库 前4条

1 ;Short text classification based on strong feature thesaurus[J];Journal of Zhejiang University-Science C(Computers & Electronics);2012年09期

2 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[J];中文信息学报;2012年03期

3 李峰;李芳;;中文词语语义相似度计算——基于《知网》2000[J];中文信息学报;2007年03期

4 孟遥,李生,赵铁军,曹海龙;四种基本统计句法分析模型在汉语句法分析中的性能比较[J];中文信息学报;2003年03期

【相似文献】

中国期刊全文数据库 前10条

1 槰起;;不一定,

本文编号:622785


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/622785.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dbb1e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com