多特征融合文本聚类的新闻话题发现模型
本文选题:新闻话题 + 多特征融合 ; 参考:《国防科技大学学报》2017年03期
【摘要】:融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量空间模型及相似度算法,基于潜在狄利克雷分配模型构建主题空间模型及相似度算法,针对命名实体构建命名实体模型及相似度算法,并将三种相似度算法形成最优融合。基于多特征融合文本聚类方法,模型改进了用于新闻话题发现的Single-Pass算法。实验是在真实新闻数据集上开展的,实验结果表明:该模型有效地提高了新闻话题发现的准确率、召回率和综合评价指标,并具有一定的自适应能力。
[Abstract]:A news topic discovery model based on multi-feature fusion text clustering is proposed, which combines the effects of news naming entities, news headlines, important paragraphs of news, text semantics, and so on. Based on the multi-feature influence of news, the model proposes a text clustering method based on multi-feature fusion. This method constructs vector space model and similarity algorithm for the feature factors such as news title, news important paragraph, and topic space model and similarity algorithm based on potential Delikley assignment model. The named entity model and similarity algorithm are constructed for named entities, and the three similarity algorithms are fused optimally. Based on the multi-feature fusion text clustering method, the model improves the Single-Pass algorithm for news topic discovery. The experiment is carried out on the real news data set. The experimental results show that the model can effectively improve the accuracy of news topic discovery, recall rate and comprehensive evaluation index, and has a certain adaptive ability.
【作者单位】: 中国人民大学信息学院;北京信息科技大学信息管理学院;
【基金】:国家自然科学基金资助项目(61272513) 北京市教育委员会科技计划面上资助项目(KM201511232016,SM201511232004) 北京高等学校青年英才计划资助项目(YETP1503)
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 初红霞;王科俊;王希凤;郭庆昌;韩晶;;多特征融合的退火粒子滤波目标跟踪[J];计算机工程与应用;2011年06期
2 顾鑫;王海涛;汪凌峰;王颖;陈如冰;潘春洪;;基于不确定性度量的多特征融合跟踪[J];自动化学报;2011年05期
3 姚红革;杜亚勤;;基于多模式多特征融合粒子滤波视频目标跟踪[J];西安工业大学学报;2012年11期
4 王兰;;基于多特征融合的票据分类技术及应用[J];计算机光盘软件与应用;2013年13期
5 陈增照;何秀玲;杨扬;董才林;;基于多特征融合的票据分类技术及应用[J];计算机工程与应用;2006年09期
6 周斌;林喜荣;贾惠波;宋榕;;多特征融合的手背血管识别算法[J];清华大学学报(自然科学版);2007年02期
7 刘贵喜;范春宇;高恩克;;基于粒子滤波与多特征融合的视频目标跟踪[J];光电子.激光;2007年09期
8 胡全;邱兆文;王霓虹;;基于多特征融合的图像语义标注[J];东北林业大学学报;2008年10期
9 周静;黄心汉;彭刚;;基于多特征融合的飞机目标识别[J];华中科技大学学报(自然科学版);2009年01期
10 沈才梁;许雪贵;许方恒;龙丹;;多特征融合的人脸检测[J];计算机系统应用;2009年11期
相关会议论文 前3条
1 叶锋;蔡光东;郑子华;亓晓旭;尹鹏;;基于多特征融合的药用植物标本识别[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
2 段其昌;季长有;;基于多特征融合的快速人脸检测[A];第十七届全国测控计量仪器仪表学术年会(MCMI'2007)论文集(上册)[C];2007年
3 李玉峰;郑德权;赵铁军;;基于SVM和多特征融合的图像分类[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
相关博士学位论文 前5条
1 刘明华;复杂环境下基于多特征融合的目标跟踪关键技术研究[D];青岛科技大学;2016年
2 田纲;基于多特征融合的Mean shift目标跟踪技术研究[D];武汉大学;2011年
3 徐志刚;基于多特征融合的路面破损图像自动识别技术研究[D];长安大学;2012年
4 陈秀新;多特征融合视频复制检测关键技术研究[D];北京工业大学;2013年
5 初红霞;基于均值移动和粒子滤波的目标跟踪关键技术研究[D];哈尔滨工程大学;2012年
相关硕士学位论文 前10条
1 张岩;基于多特征融合及二部图匹配的3D目标检索技术研究[D];哈尔滨工业大学;2015年
2 计明明;基于多特征融合的三维模型检索技术[D];浙江大学;2015年
3 王庆;基于多特征融合的人体动作识别方法研究[D];上海大学;2015年
4 刘婕;复杂场景多特征融合粒子滤波目标跟踪[D];重庆理工大学;2015年
5 崔剑;基于多特征融合的分级行人检测方法研究[D];电子科技大学;2015年
6 王珊珊;基于极化SAR非监督分类的油膜厚度估算方法研究[D];大连海事大学;2015年
7 肖冠;基于多特征融合的异类传感器中段目标关联算法研究[D];国防科学技术大学;2013年
8 王建荣;基于多特征融合的无人机航拍图像识别研究[D];成都理工大学;2015年
9 高爽;基于多特征融合的粒子滤波跟踪算法研究[D];西安电子科技大学;2014年
10 坎启娇;基于多特征融合的多目标跟踪算法[D];河北工业大学;2015年
,本文编号:1875090
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1875090.html