动态话题追踪中的误报检测
本文关键词:动态话题追踪中的误报检测 出处:《计算机应用研究》2015年02期 论文类型:期刊论文
【摘要】:针对动态话题追踪模型高误报率的现象,提出了动态追踪中的误报检测来判断追踪到的相关报道是否误报,进而降低动态模型的误报率。考虑到新报道是否和话题相关,除了依据两者的相似度外,还涉及时间距离、差值关系、分布关系、追踪到的报道和话题核心报道的相似度四方面内容,给出了误报检测因子计算式。实验采用TDT4测试集合和DET曲线进行评测,通过反复实验获得了误报检测因子δ的阈值,与基于信念网络的动态话题追踪模型相比,使用误报检测后模型的最优(Cdet)norm降低了5.032%。
[Abstract]:In view of the phenomenon of high false alarm rate in dynamic topic tracking model, the false positives detection in dynamic tracking model is proposed to judge whether the tracking reports are false positives or not. And then reduce the false alarm rate of dynamic model. Considering whether the new report is related to the topic, in addition to the similarity between the two, it also involves time distance, difference relationship, distribution relationship. Four aspects of similarity between the tracking report and the topic core report are given, and the calculation formula of false positive detection factor is given. The TDT4 test set and DET curve are used to evaluate the experiment. Through repeated experiments, the threshold of false positive detection factor 未 is obtained, which is compared with the dynamic topic tracking model based on belief network. The optimal Cdetn norm using false positive detection model reduced 5.032.
【作者单位】: 河北大学管理学院;河北软件职业技术学院信息工程系;河北大学数学与计算机学院;
【基金】:中国博士后科学基金资助项目(20070420700) 河北省自然科学基金资助项目(F2011201146)
【分类号】:TP393.0
【正文快照】: 0引言随着网络信息的飞速发展,收集并组织相关信息变得越来越困难,话题识别与追踪(TDT)就是为解决该问题提出的研究方向。它能够帮助人们把分散的信息有效地汇总组织起来,从整体上了解一个事件全部的细节及与其他事件的关系[1]。话题追踪是TDT中重要的研究任务之一,是一项直接
【参考文献】
相关期刊论文 前6条
1 张晓艳;王挺;梁晓波;;LDA模型在话题追踪中的应用[J];计算机科学;2011年S1期
2 洪娜;钱庆;李亚子;吴思竹;侯丽;;网络内容演化趋势影响因素分析——从词的生命周期和背景词簇环境中挖掘演化线索[J];情报理论与实践;2012年06期
3 洪宇;张宇;范基礼;刘挺;李生;;基于语义域语言模型的中文话题关联检测[J];软件学报;2008年09期
4 洪宇;仓玉;姚建民;周国栋;朱巧明;;话题跟踪中静态和动态话题模型的核捕捉衰减[J];软件学报;2012年05期
5 姚长青;杜永萍;;基于主题的舆情跟踪方法研究及性能评价[J];图书情报工作;2012年18期
6 廖君华;孙克迎;钟丽霞;;一种基于时序主题模型的网络热点话题演化分析系统[J];图书情报工作;2013年09期
相关博士学位论文 前1条
1 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
【共引文献】
相关期刊论文 前10条
1 施侃晟;刘海涛;白英彩;宋文涛;周书勇;;便于快速信息融合的主题检测算法[J];电子科技大学学报;2012年06期
2 潘大庆;;基于层次聚类的微博敏感话题检测算法研究[J];广西民族大学学报(自然科学版);2012年04期
3 张辉;李国辉;徐新文;贾立;孙博良;;词网络的新闻事件关联建模[J];国防科技大学学报;2014年04期
4 王凤玲;;基于缩略语分析的中文报道关系识别研究[J];计算机工程;2011年18期
5 庞海杰;;面向文本情感分析的商品评价信息检测[J];计算机应用;2012年07期
6 庞海杰;;基于动态共现的中文话题关联检测[J];计算机应用与软件;2012年03期
7 李忠俊;;基于话题检测与聚类的内部舆情监测系统[J];计算机科学;2012年12期
8 吴陈鹤;杜友田;苏畅;;有限节点驱动的微博社会网络话题推荐方法[J];计算机工程与应用;2013年15期
9 罗文超;刘国栋;杨海燕;;SIFT和改进的RANSAC算法在图像配准中的应用[J];计算机工程与应用;2013年15期
10 徐建民;孙晓磊;吴树芳;;结合时间信息的事件追踪的动态模型[J];计算机应用;2013年10期
相关博士学位论文 前10条
1 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
2 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
3 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
4 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
5 彭菲菲;网络热点话题发现的关键技术研究[D];中国矿业大学(北京);2012年
6 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年
7 陆前;英、汉跨语言话题检测与跟踪技术研究[D];中央民族大学;2013年
8 王婵;基于Dirichlet过程混合模型的话题识别与追踪[D];北京邮电大学;2013年
9 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年
10 肖智博;排序主题模型及其应用研究[D];大连海事大学;2014年
相关硕士学位论文 前10条
1 张彬;客观知识体系中的语义传递推理模型研究[D];大连理工大学;2012年
2 邹鸿程;微博话题检测与追踪技术研究[D];解放军信息工程大学;2012年
3 赵爱华;面向网络新闻的话题检测技术研究[D];山东师范大学;2013年
4 李佳玲;基于社交网络的推荐系统研究[D];西南大学;2013年
5 毛文娟;话题跟踪和可视化技术在涉农网络舆情系统中的应用研究[D];南京农业大学;2012年
6 史仁仁;网络舆情话题识别与跟踪系统的研究与实现[D];电子科技大学;2013年
7 张思龙;微博热点话题预判技术研究[D];解放军信息工程大学;2013年
8 郭珊珊;基于LDA算法的旅游企业微博营销研究[D];哈尔滨工业大学;2013年
9 陈智敏;中文报道关系识别与话题跟踪研究[D];广西大学;2013年
10 郑磊;微博客话题检测的研究与实现[D];哈尔滨工业大学;2013年
【二级参考文献】
相关期刊论文 前10条
1 胡艳丽;白亮;张维明;;网络舆情中一种基于OLDA的在线话题演化方法[J];国防科技大学学报;2012年01期
2 邱立坤;龙志yN;钟华;程葳;;层次化话题发现与跟踪方法及系统实现[J];广西师范大学学报(自然科学版);2007年02期
3 张铁男;张亚娟;才华;;基于遗传算法的企业种群进化能力评价[J];哈尔滨工业大学学报;2006年12期
4 于满泉;骆卫华;许洪波;白硕;;话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;2006年03期
5 赵华;赵铁军;于浩;郑德权;;基于查询向量的英语话题跟踪研究[J];计算机研究与发展;2007年08期
6 李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;2003年17期
7 洪宇;张宇;范基礼;刘挺;李生;;基于子话题分治匹配的新事件检测[J];计算机学报;2008年04期
8 曹娟;张勇东;李锦涛;唐胜;;一种基于密度的自适应最优LDA模型选择方法[J];计算机学报;2008年10期
9 张晓艳;王挺;;话题发现与追踪技术研究[J];计算机科学与探索;2009年04期
10 周昭涛,卜东波,程学旗;文本的图表示初探[J];中文信息学报;2005年02期
相关会议论文 前1条
1 王会珍;朱靖波;季铎;张斌;;基于多向量模型的中文话题追踪[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
相关博士学位论文 前1条
1 赵旭剑;中文新闻话题动态演化及其关键技术研究[D];中国科学技术大学;2012年
,本文编号:1416067
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1416067.html