基于关联规则的文本主题深度挖掘应用研究
本文关键词:基于关联规则的文本主题深度挖掘应用研究
【摘要】:【目的】准确理解文本信息中潜在的知识关联,丰富文本知识挖掘的方法。【方法】将主题模型和关联规则相结合,运用LDA主题模型抽取文本中的主题集合,在实现文本降维的同时,实现文本在语义空间的表达;通过关联规则进一步挖掘文本中主题的语义关联。【结果】设置合理的支持度和置信度阈值,可以有效地挖掘文本中潜在知识的关联,实现对文本的深入"理解"。【局限】数据预处理过程中,用户自定义词典的设计会对实验结果产生一定的影响。【结论】提出一种非结构化文本信息潜在语义关联挖掘的新思路,改善了针对文本信息知识发现的效果。
【作者单位】: 华东师范大学信息管理系;上海图书馆;
【关键词】: 关联规则 主题模型 文本主题
【基金】:上海哲学社会科学一般项目“基于主题模型的学科交叉知识发现研究”(项目编号:2016BTQ002)的研究成果之一
【分类号】:TP391.1
【正文快照】: 1引言随着信息技术和互联网通信技术的发展与普及,产生了大量的文本信息,文本信息的快速增长使得人们在信息处理和检索中面临前所未有的挑战。对文本的理解,不仅有助于信息检索、内容发现等情报工作的开展,同时对信息的有效分类、组织也提供了借鉴。然而文本信息的组织形式是
【相似文献】
中国期刊全文数据库 前10条
1 高玮军;马栋林;张其文;;一种基于本体的文本主题提取方法研究[J];计算机应用与软件;2012年02期
2 麻志毅,姚天顺;基于情境的文本主题求解[J];计算机研究与发展;1998年04期
3 王小华;徐宁;谌志群;;基于共词分析的文本主题词聚类与主题发现[J];情报科学;2011年11期
4 张其文;李明;;文本主题的自动提取方法研究与实现[J];计算机工程与设计;2006年15期
5 侯风巍;郭东军;李世磊;徐钊峰;;基于信息反馈的文本主题分类过滤方法[J];通信学报;2009年S1期
6 刘兴林;彭宏;马千里;;基于增量词集频率的文本主题词提取算法研究[J];计算机应用研究;2010年09期
7 康恺;林坤辉;周昌乐;;基于主题词频数特征的文本主题划分[J];计算机应用;2006年08期
8 王科,刘渊,罗万伯,高行宇,高常波;基于中文文本主题跟踪的网络信息分析[J];四川大学学报(工程科学版);2004年01期
9 刘菲;黄萱菁;吴立德;;利用关联规则挖掘文本主题词的方法[J];计算机工程;2008年07期
10 禹龙;田生伟;黄俊;;维吾尔语评论文本主题抽取研究[J];中文信息学报;2013年04期
中国重要会议论文全文数据库 前1条
1 丁秉公;黄昌宁;黄德根;;文本主题识别研究及应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前1条
1 常鹏;基于词共现的文本主题挖掘模型和算法研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 张文跃;基于改进shark-search算法的主题爬虫的研究与实现[D];内蒙古大学;2015年
2 梁剑;基于LDA文本主题挖掘的个性化推送及其在Spark平台的实现[D];华南理工大学;2016年
3 梁文婷;汉语文本主题分析技术的研究与实现[D];重庆大学;2008年
4 蒋建慧;文本主题段落内部概念关系抽取技术研究[D];上海交通大学;2009年
5 郭剑飞;基于LDA多模型中文短文本主题分类体系构建与分类[D];哈尔滨工业大学;2014年
6 田钰琨;基于主题链的海量投诉文本主题抽取方法研究[D];东北师范大学;2012年
7 李宇坤;短文本主题分析的相关问题研究[D];北京邮电大学;2014年
8 李振;基于LDA和图割的文本主题分割研究[D];山东大学;2013年
9 施乾坤;基于LDA模型的文本主题挖掘和文本静态可视化的研究[D];广西大学;2013年
10 徐云飞;基于分词技术的文本主题关键词处理系统设计与实现[D];中国科学院大学(工程管理与信息技术学院);2014年
,本文编号:851597
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/851597.html