当前位置:主页 > 科技论文 > 软件论文 >

一种面向不完全标记的文本数据流自适应分类方法

发布时间:2018-04-22 05:31

  本文选题:不完全标记 + 自适应 ; 参考:《计算机科学》2016年12期


【摘要】:现实生活中网络监控、网络评论以及微博等应用领域涌现了大量文本数据流,这些数据的不完全标记和频繁概念漂移给已有的数据流分类方法带来了挑战。为此,面向不完全标记的文本数据流提出了一种自适应的数据流分类算法。该算法以一个标记数据块作为起始数据块,对未标记数据块首先提取标记数据块与未标记数据块之间的特征集,并利用特征在两个数据块间的相似度进行概念漂移检测,最后计算未标记数据中特征的极性并对数据进行预测。实验表明了算法在分类精度上的优越性,尤其在标记信息较少和概念漂移较为频繁时。
[Abstract]:In real life, a large number of text data streams have emerged in the application fields such as network monitoring, network review and Weibo. The incomplete marking and frequent concept drift of these data have brought challenges to the existing data stream classification methods. For this reason, an adaptive data stream classification algorithm for incomplete tagged text data streams is proposed. The algorithm takes a tagged data block as the starting data block, firstly extracts the feature set between the labeled data block and the unlabeled data block, and uses the similarity between the two data blocks to detect the concept drift. Finally, the polarity of the features in the unlabeled data is calculated and the data is predicted. Experiments show the superiority of the algorithm in classification accuracy, especially when the marking information is less and the concept drift is more frequent.
【作者单位】: 合肥工业大学计算机与信息学院;
【基金】:教育部创新团队(IRT13059) 国家自然科学基金(61305063,61273292) 博士点项目基金(20130111110011)资助
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 侯勇严,孙瑜,郭文强;一种自适应模糊PID控制器的仿真研究[J];陕西科技大学学报;2004年02期

2 王华;应晶;蒋涛;;基于审查不确定性的预见式软件自适应[J];浙江大学学报(工学版);2010年01期

3 高新建;李艳玲;张明强;栾玉环;孙丰荣;姚桂华;;实时心肌声学造影图像的自适应时空滤波[J];计算机工程;2011年S1期

4 黄河笑,郭俊文;计算机自适应考试的若干研究[J];微型电脑应用;1999年11期

5 潘柏松,刘红,冯晓斐;基于功能单元的产品自适应设计系统研究[J];机械;2001年03期

6 谢毓湘,栾悉道,吴玲达,老松杨,朱小俊;一种自适应的镜头探测模型[J];计算机工程;2004年12期

7 朱晓娟;常朝稳;;移动商务的自适应资源调用动态平衡策略[J];微计算机信息;2006年06期

8 刘晶;;自适应聚类在相关反馈检索中的应用研究[J];电脑知识与技术;2008年11期

9 高超;杜景林;杨乐;;自适应心跳机制在气象作业指挥系统中的应用[J];福建电脑;2009年12期

10 刘伟;李宇;;分布式空频码自适应联合编译码方案性能研究[J];电视技术;2014年03期

相关会议论文 前10条

1 王蓬;宋明玉;张林芳;王新远;;广义自适应相干累积算法改进及其在线谱增强中的应用[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年

2 陈博;方滨兴;云晓春;;一种自适应的蠕虫检测和遏制方法的研究[A];全国网络与信息安全技术研讨会'2005论文集(上册)[C];2005年

3 李国;张心珂;杨国庆;高庆吉;;一种自适应的运动目标实时跟踪算法[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

4 杨寒光;;电子地图中的自适应注记[A];工程设计与计算机技术:第十五届全国工程设计计算机应用学术会议论文集[C];2010年

5 孟宏;刘玉;;基于复调制的自适应细化谱算法[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅰ)[C];2008年

6 唐文彬;郝重阳;;目标成像识别的自适应融合系统和方法[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年

7 贾棋;于玉龙;郭禾;李豪杰;;基于自适应模板的快速人脸检测[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年

8 覃雄派;曹巍;王珊;;数据库锁资源的自适应管理[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

9 梁韵基;周兴社;於志文;;面向老年人的自适应提醒服务系统[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年

10 洪榛;俞立;张贵军;;一种基于N阶最短近邻自适应确定聚类数量的方法[A];第二十九届中国控制会议论文集[C];2010年

相关博士学位论文 前6条

1 王蓉芳;基于协同进化优化和图像先验的分块自适应压缩感知[D];西安电子科技大学;2014年

2 梁凌宇;人脸图像的自适应美化与渲染研究[D];华南理工大学;2014年

3 朱磊;基于自适应邻域概念的视频图像处理技术研究[D];中国科学技术大学;2007年

4 杨洋;三维人体动作分析及其在智能舞蹈教学系统中的应用[D];中国科学技术大学;2012年

5 江泽涛;从序列图象重建三维物体形状方法研究[D];西北工业大学;2006年

6 洪宇;基于语义结构和时序特征的话题检测与跟踪技术研究[D];哈尔滨工业大学;2009年

相关硕士学位论文 前10条

1 查志远;自适应范数约束图像正则化重建研究[D];昆明理工大学;2015年

2 包震坤;最小失真自适应隐写模型及嵌入编码研究[D];解放军信息工程大学;2014年

3 李旭;自适应光强变化的齿轮视觉测量技术研究[D];中北大学;2016年

4 朱沛;星上自适应、软件化调制技术研究[D];西安电子科技大学;2006年

5 马海瑛;计算机自适应考试系统研究与实现[D];东北师范大学;2011年

6 仇s,

本文编号:1785830


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1785830.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8190f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com