当前位置:主页 > 科技论文 > 软件论文 >

基于改进的softmax回归模型的话题跟踪算法

发布时间:2017-08-02 04:09

  本文关键词:基于改进的softmax回归模型的话题跟踪算法


  更多相关文章: 类别信息 特征权重 softmax回归 话题跟踪


【摘要】:话题跟踪的目的是将新的新闻数据分配到已知话题中,对把握新闻发展趋势和进行舆情分析具有重要作用。本文深入分析了几种基于向量空间模型的特征项权重算法,发现传统算法没有充分体现特征项中类别信息的作用,在此基础上引入了类别区分度因子对卡方统计量进行改进,给出了加入类别信息的卡方统计量算法,该算法能够更准确地提取出对新闻区分度较大的特征项。同时,在特征项权重的框架内对常用的softmax线性模型进行了基于余弦假设的改进。基于标准数据集TDT4的实验表明,本文给出的权重算法和分类算法均能够提高话题跟踪的查全率和查准率。
【作者单位】: 河北大学计算机科学与技术学院;河北大学计算机教学部;河北大学数学与信息科学学院;
【关键词】类别信息 特征权重 softmax回归 话题跟踪
【基金】:河北省科技计划项目(13455317D,12457206D-11)
【分类号】:TP391.1
【正文快照】: 0引言近年来,互联网日益成为传媒的主要手段,各大新闻网站都对国内外的新闻给予及时报道,极大地方便了人们的生活,同时新闻的数据量也呈现出迅猛增长的态势。在此互联网时代背景下,人们需要一种能够自动跟踪并组织已有话题的方法。话题跟踪技术可以使人们更准确地对已知话题进

【参考文献】

中国期刊全文数据库 前5条

1 徐冬冬;吴韶波;;一种基于类别描述的TF-IDF特征选择方法的改进[J];现代图书情报技术;2015年03期

2 谌志群;徐宁;王荣波;;基于主题演化图的网络论坛热点跟踪[J];情报科学;2013年03期

3 洪宇;仓玉;姚建民;周国栋;朱巧明;;话题跟踪中静态和动态话题模型的核捕捉衰减[J];软件学报;2012年05期

4 洪宇;张宇;刘挺;李生;;话题检测与跟踪的评测及研究综述[J];中文信息学报;2007年06期

5 许建华 ,张学工 ,李衍达;一种基于核函数的非线性感知器算法[J];计算机学报;2002年07期

中国硕士学位论文全文数据库 前4条

1 罗杰;基于SVM的微博话题跟踪方法及其应用[D];北京理工大学;2015年

2 姚海波;微博热点话题检测与趋势预测研究[D];华南理工大学;2013年

3 侯晓冲;话题检测与跟踪算法改进研究[D];华中科技大学;2013年

4 刘佳;面向微博的热点话题发现及跟踪[D];华南理工大学;2012年

【共引文献】

中国期刊全文数据库 前10条

1 马静;何雪枫;简旭文;;动态热门话题的“特征词条本体”自动构建与进化研究[J];现代图书情报技术;2016年10期

2 张晓勇;周清清;章成志;;面向在线社交网络用户生成内容的饮食话题发现研究[J];现代图书情报技术;2016年10期

3 姚冬冬;袁方;王煜;刘宇;;基于半监督DPMM的新闻话题检测[J];郑州大学学报(理学版);2016年03期

4 朴乘锴;袁方;刘宇;王煜;;基于改进的softmax回归模型的话题跟踪算法[J];燕山大学学报;2016年05期

5 笱程成;杜攀;刘悦;程学旗;;在线社交网络中的新兴话题检测技术综述[J];中文信息学报;2016年05期

6 仇丽青;陈卓艳;丁长青;刘海燕;;基于改进LDA主题模型的社会网络话题发现算法iMLDA[J];情报科学;2016年09期

7 姚兆旭;马静;;面向微博话题的“主题+观点”词条抽取算法研究[J];现代图书情报技术;2016年Z1期

8 刘嘉琪;齐佳音;;基于社会系统响应函数的在线群体分类研究[J];电子与信息学报;2016年09期

9 田伟;韩海涛;;发挥档案元数据核心集作用 推进“互联网+档案”建设[J];档案;2016年06期

10 李欣雨;袁方;刘宇;李琮;;面向中文新闻话题检测的多向量文本聚类方法[J];郑州大学学报(理学版);2016年02期

中国硕士学位论文全文数据库 前10条

1 马莹莹;微博用户转发行为及情感预测研究[D];哈尔滨工业大学;2015年

2 谢黎黎;基于主题模型的微博话题检测与跟踪研究[D];中南林业科技大学;2015年

3 赵俊;社交网络的数据采集与分析方法研究[D];郑州大学;2015年

4 公荣涛;基于演化聚类的微博热点事件动态观点树构建方法研究[D];华南理工大学;2015年

5 陈红阳;中文微博话题发现技术研究[D];重庆理工大学;2015年

6 奚浩瀚;微博热点话题感知关键技术的研究[D];北京交通大学;2015年

7 罗杰;基于SVM的微博话题跟踪方法及其应用[D];北京理工大学;2015年

8 张华;基于优化BP神经网络的微博舆情预测模型研究[D];华中师范大学;2014年

9 李楚贞;中文微博主题层次识别方法研究[D];广东技术师范学院;2014年

10 丁晓庆;微博热点话题发现研究与实现[D];郑州大学;2014年

【二级参考文献】

中国期刊全文数据库 前10条

1 覃世安;李法运;;文本分类中TF-IDF方法的改进研究[J];现代图书情报技术;2013年10期

2 刘海峰;于利军;刘守生;;一种基于类别分布信息的文本特征选择模型[J];图书情报工作;2013年15期

3 雷军程;黄同成;柳小文;;一种基于权重的文本特征选择方法[J];计算机科学;2012年07期

4 李学明;李海瑞;薛亮;何光军;;基于信息增益与信息熵的TFIDF算法[J];计算机工程;2012年08期

5 王小华;徐宁;谌志群;;基于共词分析的文本主题词聚类与主题发现[J];情报科学;2011年11期

6 张保富;施化吉;马素琴;;基于TFIDF文本特征加权方法的改进研究[J];计算机应用与软件;2011年02期

7 陈友;程学旗;杨森;;面向网络论坛的高质量主题发现[J];软件学报;2011年08期

8 唐果;陈宏刚;;基于BBS热点主题发现的文本聚类方法[J];计算机工程;2010年07期

9 鲁明羽;姚晓娜;魏善岭;;基于模糊聚类的网络论坛热点话题挖掘[J];大连海事大学学报;2008年04期

10 洪宇;张宇;范基礼;刘挺;李生;;基于子话题分治匹配的新事件检测[J];计算机学报;2008年04期

中国硕士学位论文全文数据库 前10条

1 王慧;微博话题追踪方法研究与设计[D];北京交通大学;2014年

2 王来涛;网络短文本话题发现与趋势预测研究[D];北京工业大学;2013年

3 苏其龙;微博新词发现研究[D];哈尔滨工业大学;2013年

4 邱洋;微博数据提取及话题检测方法研究[D];大连理工大学;2013年

5 詹勇;基于主题模型和混合模型的微博客交叉话题发现研究[D];西南交通大学;2013年

6 马雯雯;基于隐含语义分析的微博热点话题发现策略[D];重庆大学;2013年

7 刘彦伟;微博话题追踪系统的研究与实现[D];北京交通大学;2013年

8 孙励;基于微博的热点话题发现[D];北京邮电大学;2013年

9 刘佳;面向微博的热点话题发现及跟踪[D];华南理工大学;2012年

10 黄波;基于向量空间模型和LDA模型相结合的微博客话题发现算法研究[D];西南交通大学;2012年

【相似文献】

中国期刊全文数据库 前4条

1 李晓曼;王靖;;基于类别信息的监督局部保持投影方法[J];计算机应用;2012年02期

2 徐倩;邓伟;;融合类别信息的二维主成分分析人脸识别算法[J];计算机工程与设计;2008年22期

3 刘海峰;刘守生;张学仁;苏展;;一种基于类别信息的文本自动分类模型[J];现代图书情报技术;2010年04期

4 ;[J];;年期

中国重要会议论文全文数据库 前1条

1 李超;王会珍;朱慕华;张俐;朱靖波;;基于领域类别信息C-value的多词串自动抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

中国硕士学位论文全文数据库 前1条

1 杨金华;视觉感觉记忆中的类别信息研究[D];西南大学;2012年



本文编号:607541

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/607541.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1eb97***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com