文本主题识别关键技术研究综述
本文关键词:文本主题识别关键技术研究综述
更多相关文章: 主题识别 文本分析 主题挖掘 语义分析 多元关系融合
【摘要】:【目的/意义】文本主题自动识别是多种情报分析,如文献分类、检索以及领域前沿识别的基础,因此对文本主题自动识别方法的研究意义显著。【方法/过程】系统调研了当前文本主题识别的关键技术,包括主题词获取方法、知识单元的关联强度计算以及面向多元关系融合的主题分析方法及实践。【结果/结论】在总结当前文本主题识别方法的不足之处的基础上,本文提出综合全面的主题词获取方法,并在抽取范围以及语法、语义层面结合运用;在主题词关联计算中,充分利用已有语义词典和领域本体,将基于语义词典相似度和知识单元共现分析结合,并考虑主题关联的多元关系融合。
【作者单位】: 中国科学技术信息研究所;中国科学院成都文献情报中心;中国科学院大学;
【关键词】: 主题识别 文本分析 主题挖掘 语义分析 多元关系融合
【基金】:中国博士后基金的研究成果之一 中国科学院青年创新促进会资助
【分类号】:G254
【正文快照】: 随着科技文献的数量呈超指数增长,文献类型也日益丰富,文本主题识别日益演变为大数据科技文本识别。此情形下,文本主题自动识别在面临更高的数据维度和更复杂的数据类型时,传统的文本识别方法可能会失效,不能有效识别交叉主题。鉴于此,主题词识别过程中需要考虑更多的主题词抽
【相似文献】
中国期刊全文数据库 前10条
1 高玮军;马栋林;张其文;;一种基于本体的文本主题提取方法研究[J];计算机应用与软件;2012年02期
2 麻志毅,姚天顺;基于情境的文本主题求解[J];计算机研究与发展;1998年04期
3 王小华;徐宁;谌志群;;基于共词分析的文本主题词聚类与主题发现[J];情报科学;2011年11期
4 张其文;李明;;文本主题的自动提取方法研究与实现[J];计算机工程与设计;2006年15期
5 侯风巍;郭东军;李世磊;徐钊峰;;基于信息反馈的文本主题分类过滤方法[J];通信学报;2009年S1期
6 刘兴林;彭宏;马千里;;基于增量词集频率的文本主题词提取算法研究[J];计算机应用研究;2010年09期
7 康恺;林坤辉;周昌乐;;基于主题词频数特征的文本主题划分[J];计算机应用;2006年08期
8 王科,刘渊,罗万伯,高行宇,高常波;基于中文文本主题跟踪的网络信息分析[J];四川大学学报(工程科学版);2004年01期
9 刘菲;黄萱菁;吴立德;;利用关联规则挖掘文本主题词的方法[J];计算机工程;2008年07期
10 禹龙;田生伟;黄俊;;维吾尔语评论文本主题抽取研究[J];中文信息学报;2013年04期
中国重要会议论文全文数据库 前1条
1 丁秉公;黄昌宁;黄德根;;文本主题识别研究及应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前1条
1 常鹏;基于词共现的文本主题挖掘模型和算法研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 张文跃;基于改进shark-search算法的主题爬虫的研究与实现[D];内蒙古大学;2015年
2 梁剑;基于LDA文本主题挖掘的个性化推送及其在Spark平台的实现[D];华南理工大学;2016年
3 梁文婷;汉语文本主题分析技术的研究与实现[D];重庆大学;2008年
4 蒋建慧;文本主题段落内部概念关系抽取技术研究[D];上海交通大学;2009年
5 郭剑飞;基于LDA多模型中文短文本主题分类体系构建与分类[D];哈尔滨工业大学;2014年
6 田钰琨;基于主题链的海量投诉文本主题抽取方法研究[D];东北师范大学;2012年
7 李宇坤;短文本主题分析的相关问题研究[D];北京邮电大学;2014年
8 李振;基于LDA和图割的文本主题分割研究[D];山东大学;2013年
9 施乾坤;基于LDA模型的文本主题挖掘和文本静态可视化的研究[D];广西大学;2013年
10 徐云飞;基于分词技术的文本主题关键词处理系统设计与实现[D];中国科学院大学(工程管理与信息技术学院);2014年
,本文编号:599745
本文链接:https://www.wllwen.com/tushudanganlunwen/599745.html