基于旋转森林集成学习的涉恐实体挖掘研究
本文关键词:基于旋转森林集成学习的涉恐实体挖掘研究 出处:《情报杂志》2015年05期 论文类型:期刊论文
更多相关文章: 反恐 非结构化文本 数据挖掘 旋转森林 集成学习
【摘要】:近期,我国出现了一系列暴力恐怖袭击事件,面临的反恐形势日趋严峻。传统的被动警务防范模型弊端日益凸显,亟需有效应对恐怖袭击的智能化防范策略。作为近年来的研究热点,数据挖掘技术和应用发展迅速。文章充分利用数据挖掘的前沿技术和成果,提出了一个相对完整的涉恐实体挖掘模型,以期为反恐实战工作服务。其中,简要介绍针对中文和维吾尔文非结构化文本数据的挖掘流程,提出一个有效应用于识别和预测涉恐实体的基于旋转森林的集成分类模型,并用实验证明这一模型较之一般的分类器会有更优越的分类性能。
[Abstract]:Recently, there have been a series of violent terrorist attacks in our country, and the situation of anti-terrorism is becoming more and more serious. The disadvantages of the traditional passive policing prevention model are becoming increasingly prominent. As a research hotspot in recent years, data mining technology and application are developing rapidly. This paper makes full use of the advanced technology and achievements of data mining. A relatively complete model of terrorist entity mining is proposed in order to serve the actual combat against terrorism. Among them, the mining process for Chinese and Uygur unstructured text data is briefly introduced. An integrated classification model based on rotating forest is proposed to identify and predict terrorist entities. Experiments show that this model has better classification performance than the general classifier.
【作者单位】: 中国人民公安大学反恐怖学院;中国人民公安大学犯罪学院;
【分类号】:D631.4;G350
【正文快照】: Sun Feifei1Lin Ping1Cao Zhuo2(People's Public Security University of China,Beijing 100038)0引言近年来,社会安全和反恐形势日趋复杂。警方不仅要加强对犯罪分子的控制,还要竭力识别出对国家和人民生命财产安全产生(潜在)威胁的危险分子,防患于未然。传统上,情报部门对
【参考文献】
相关期刊论文 前3条
1 陈松峰;范明;;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[J];计算机科学;2010年08期
2 刘敏;谢伙生;;一种基于旋转森林的集成协同训练算法[J];计算机工程与应用;2011年30期
3 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
【共引文献】
相关期刊论文 前10条
1 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
2 文翰;肖南峰;;基于特征分布的半监督分类[J];北京工业大学学报;2012年01期
3 周世斌;白敬华;刘玉树;;统计流形上基于核近邻算法的文本分类研究[J];北京理工大学学报;2010年03期
4 陈爽;陈福;杜天苍;;一种启发式网络信息采集系统设计与实现[J];北京石油化工学院学报;2007年04期
5 黄文良;李石坚;刘菊新;徐从富;;一个大规模垃圾短信实时过滤系统[J];北京邮电大学学报;2008年03期
6 柯丽;王明文;何世柱;黎佳;罗远胜;;基于频率共现熵的跨语言网页自动分类研究[J];江西师范大学学报(自然科学版);2011年03期
7 曾立梅;;基于文本数据挖掘的硕士论文分类技术[J];重庆邮电大学学报(自然科学版);2010年05期
8 陈可华;;文本自动分类新探究[J];赤峰学院学报(自然科学版);2011年04期
9 殷宏威;赵伟;杨志伟;;蚁群算法在KNN文本分类中的应用[J];长春理工大学学报(自然科学版);2010年01期
10 沈竞;蒋侨;;DSTFA分布式短文本过滤算法[J];四川兵工学报;2011年10期
相关会议论文 前10条
1 黄文良;李石坚;刘菊新;徐从富;;大规模垃圾短信实时过滤系统的设计与实现[A];中国通信学会第五届学术年会论文集[C];2008年
2 李文波;孙乐;黄瑞红;冯元勇;张大鲲;;基于Labeled-LDA模型的文本分类新算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 王辉;左万利;;利用质心向量构建增量式分类器(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 刘健;张维明;;基于文本概念序列的非线性分析方法初探[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 黄云平;孙乐;李文波;;基于上下文图模型文本表示的文本分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 ;Text Feature Automatic Selection Algorithm Based on Cloud Model[A];第五届全国信息检索学术会议论文集[C];2009年
7 张爱华;靖红芳;王斌;徐燕;;文本分类中特征权重因子的作用研究[A];第五届全国信息检索学术会议论文集[C];2009年
8 朱振方;刘培玉;;求解中文文本信息过滤的自适应遗传算法及收敛性分析[A];第六届全国信息检索学术会议论文集[C];2010年
9 张爱华;王斌;徐燕;;非均衡文本分类中基于特征分布的抽样技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 李月伦;李湘;常宝宝;袁毓林;;一种基于认知情景框架的文本分类方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
相关博士学位论文 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
5 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
6 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
7 孙珂;大规模文档标签自动标注技术研究[D];哈尔滨工业大学;2011年
8 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
9 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
10 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
相关硕士学位论文 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 刘国峰;数据模板匹配研究及在社保审计中的应用[D];哈尔滨工程大学;2010年
4 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
5 徐旭;基于决策树的Web应用系统个性化身份验证研究[D];合肥工业大学;2010年
6 李琼琼;网络文本自动分类器的设计与实现[D];电子科技大学;2010年
7 赵素娟;基于互联网的人物简历问答系统的研究与设计[D];东北财经大学;2010年
8 袁路妍;钨层文本自动分类技术的研究与应用[D];东华大学;2011年
9 李一磊;服装设计风格决策模型的研究与实现[D];东华大学;2011年
10 刘继勇;网络舆情预警辅助决策支持系统模型及关键技术研究[D];石家庄经济学院;2010年
【二级参考文献】
相关期刊论文 前3条
1 王建会,王洪伟,申展,胡运发;一种实用高效的文本分类算法[J];计算机研究与发展;2005年01期
2 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
3 陈毅松,汪国平,董士海;基于支持向量机的渐进直推式分类学习算法[J];软件学报;2003年03期
【相似文献】
相关会议论文 前4条
1 关菁华;刘大有;贾海洋;;自适应多分类器集成学习算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 李烨;蔡云泽;许晓鸣;;基于支持向量机集成的故障诊断[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
相关博士学位论文 前10条
1 张春霞;集成学习中有关算法的研究[D];西安交通大学;2010年
2 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
3 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年
4 王清;集成学习中若干关键问题的研究[D];复旦大学;2011年
5 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年
6 李烨;基于支持向量机的集成学习研究[D];上海交通大学;2007年
7 程丽丽;支持向量机集成学习算法研究[D];哈尔滨工程大学;2009年
8 林智勇;基于核方法的不平衡数据学习[D];华南理工大学;2009年
9 李磊军;基于间隔和置信度的选择性集成学习算法研究[D];哈尔滨工业大学;2014年
10 夏俊士;基于集成学习的高光谱遥感影像分类[D];中国矿业大学;2013年
相关硕士学位论文 前10条
1 张妤;支持向量机集成学习方法研究[D];山西大学;2008年
2 李涛;基于条件互信息的集成学习的研究与应用[D];中国海洋大学;2009年
3 杨长盛;基于成对差异性度量的选择性集成学习方法研究[D];安徽大学;2010年
4 曹振田;基于Q统计量的选择性集成学习研究[D];安徽大学;2010年
5 王丽丽;集成学习算法研究[D];广西大学;2006年
6 马冉冉;集成学习算法研究[D];山东科技大学;2010年
7 张新东;集成学习及其应用研究[D];石家庄经济学院;2010年
8 吴科主;基于多任务的多层次选择性集成学习的研究[D];安徽工业大学;2010年
9 李平;集成学习中差异性控制方法研究[D];大连海事大学;2012年
10 田智辉;基于集成学习的故障诊断方法研究[D];西安石油大学;2013年
,本文编号:1367011
本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/1367011.html