太原市教育局政务大数据平台的新闻分类和推荐方法研究
发布时间:2021-06-03 18:28
大数据、云计算和人工智能的快速发展,使得传统的电子政务已难以适应当今的新形势,建设一个融合大数据、数字化和智能化的政务平台已成为当今政府寻求发展的新思路。自2017年以来太原市教育局政务大数据平台建设不断取得成就,但是与发达国家和我国先进省市的政务平台相比仍然有较大差距。目前该平台采用的新闻分类方法的分类粒度较粗且分类的准确率较低,对于新闻推荐来说目前该平台使用的推荐方法存在着不能及时反映用户兴趣变化,推荐结果准确率较低和推荐个性化程度较低等问题,本文针对其政务大数据平台存在的这些问题进行了研究。本文对传统的TF-IDF特征提取方法进行了改进,提出一种结合教育政务词库(GE)和特征词位置信息(LF)的教育政务新闻特征提取方法,即ETF-IDF-L特征提取方法,然后分别通过朴素贝叶斯和卷积神经网络对教育政务新闻进行分类,通过实验发现对于一些拥有较少数据量的新闻类别来说基于ETF-IDF-L的特征提取和向量空间模型文本表示方法结合多项式朴素贝叶斯分类模型得到的分类效果较好,对于拥有较多数据量的新闻类别来说基于Word2vec的卷积神经网络分类模型得到的分类效果较好,这两种分类模型的准确度和...
【文章来源】:中北大学山西省
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
文教育文本网页文本……去除停用词……特征
文本分类过程图
中北大学学位论文192.3推荐系统现在互联网的大面积普及使得信息量呈现爆炸性增长的态势,给用户及时获取高质量信息造成了障碍,形成了信息过载。我们日常经常用到的一些搜索引擎,如百度、搜狗等信息检索系统的目的就是让使用者可以在最短的时间找到自己需要的信息,从而帮助我们更好的解决信息过载这一问题,但这只是一种初级阶段,在此阶段不能实现理想的个性化推荐。基于此基础之上诞生的推荐系统[41,42]便是一种信息过滤系统,它的工作原理是通过收集系统用户对某些物品的偏好程度、兴趣度以及相关的访问行为等,依据这些信息和系统用户的兴趣进行匹配,根据此原理来为用户进行推荐,其推荐的个性化和准确率较之前的搜索引擎有很大程度的提升。2.3.1推荐系统构成推荐系统是借助后台的方式向使用者提供服务的,它通过采集用户和物品的信息以及用户的相关行为之后,根据所要进行推荐的对象的特点结合相应的推荐算法,得到一个需要的推荐模型,然后再根据得到的推荐模型进行决策分析,最终得到推荐结果。其工作过程可分为七个阶段,将这七个阶段组合到一起便形成了我们的推荐系统的工作过程,如图2-5所示。图2-5推荐系统工作过程Fig.2-5Recommendationsystemworkingprocess用户、商品相关行为及特征信息处理训练模型决策分析推荐模型最终结果应用场景
【参考文献】:
期刊论文
[1]机器学习方法在文本分类中的应用[J]. 陶林润德. 中国战略新兴产业. 2017(40)
[2]一种改进的文本分类算法[J]. 任朋启,王芳,黄树成. 电子设计工程. 2017(18)
[3]基于机器学习的专利文本分类算法研究综述[J]. 刘红光,马双刚,刘桂锋. 图书情报研究. 2016(03)
[4]社会化推荐系统研究[J]. 孟祥武,刘树栋,张玉洁,胡勋. 软件学报. 2015(06)
[5]基于知识的推荐系统用户交互模型研究[J]. 艾磊,赵辉. 软件导刊. 2015(03)
[6]云计算环境下基于协同过滤的个性化推荐机制[J]. 朱夏,宋爱波,东方,罗军舟. 计算机研究与发展. 2014(10)
[7]协同过滤推荐技术综述[J]. 冷亚军,陆青,梁昌勇. 模式识别与人工智能. 2014(08)
[8]基于用户相似度的协同过滤推荐算法[J]. 荣辉桂,火生旭,胡春华,莫进侠. 通信学报. 2014(02)
[9]个性化推荐系统综述[J]. 王国霞,刘贺平. 计算机工程与应用. 2012(07)
[10]基于特征类别属性分析的文本分类器分类噪声裁剪方法[J]. 王强,关毅,王晓龙. 自动化学报. 2007(08)
博士论文
[1]国家治理中大数据应用问题研究[D]. 卢洪.中共中央党校 2018
[2]文本分类及其相关技术研究[D]. 李荣陆.复旦大学 2005
硕士论文
[1]基于机器学习的文本分类研究与实现[D]. 王振.南京邮电大学 2018
[2]基于分词频的特征选择算法在文本分类中的研究[D]. 刘艺彬.西安理工大学 2018
[3]基于深度学习的文本分类技术的研究[D]. 庞丹丹.北方工业大学 2018
[4]混合推荐算法的研究[D]. 宋瑞平.兰州大学 2014
本文编号:3211021
【文章来源】:中北大学山西省
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
文教育文本网页文本……去除停用词……特征
文本分类过程图
中北大学学位论文192.3推荐系统现在互联网的大面积普及使得信息量呈现爆炸性增长的态势,给用户及时获取高质量信息造成了障碍,形成了信息过载。我们日常经常用到的一些搜索引擎,如百度、搜狗等信息检索系统的目的就是让使用者可以在最短的时间找到自己需要的信息,从而帮助我们更好的解决信息过载这一问题,但这只是一种初级阶段,在此阶段不能实现理想的个性化推荐。基于此基础之上诞生的推荐系统[41,42]便是一种信息过滤系统,它的工作原理是通过收集系统用户对某些物品的偏好程度、兴趣度以及相关的访问行为等,依据这些信息和系统用户的兴趣进行匹配,根据此原理来为用户进行推荐,其推荐的个性化和准确率较之前的搜索引擎有很大程度的提升。2.3.1推荐系统构成推荐系统是借助后台的方式向使用者提供服务的,它通过采集用户和物品的信息以及用户的相关行为之后,根据所要进行推荐的对象的特点结合相应的推荐算法,得到一个需要的推荐模型,然后再根据得到的推荐模型进行决策分析,最终得到推荐结果。其工作过程可分为七个阶段,将这七个阶段组合到一起便形成了我们的推荐系统的工作过程,如图2-5所示。图2-5推荐系统工作过程Fig.2-5Recommendationsystemworkingprocess用户、商品相关行为及特征信息处理训练模型决策分析推荐模型最终结果应用场景
【参考文献】:
期刊论文
[1]机器学习方法在文本分类中的应用[J]. 陶林润德. 中国战略新兴产业. 2017(40)
[2]一种改进的文本分类算法[J]. 任朋启,王芳,黄树成. 电子设计工程. 2017(18)
[3]基于机器学习的专利文本分类算法研究综述[J]. 刘红光,马双刚,刘桂锋. 图书情报研究. 2016(03)
[4]社会化推荐系统研究[J]. 孟祥武,刘树栋,张玉洁,胡勋. 软件学报. 2015(06)
[5]基于知识的推荐系统用户交互模型研究[J]. 艾磊,赵辉. 软件导刊. 2015(03)
[6]云计算环境下基于协同过滤的个性化推荐机制[J]. 朱夏,宋爱波,东方,罗军舟. 计算机研究与发展. 2014(10)
[7]协同过滤推荐技术综述[J]. 冷亚军,陆青,梁昌勇. 模式识别与人工智能. 2014(08)
[8]基于用户相似度的协同过滤推荐算法[J]. 荣辉桂,火生旭,胡春华,莫进侠. 通信学报. 2014(02)
[9]个性化推荐系统综述[J]. 王国霞,刘贺平. 计算机工程与应用. 2012(07)
[10]基于特征类别属性分析的文本分类器分类噪声裁剪方法[J]. 王强,关毅,王晓龙. 自动化学报. 2007(08)
博士论文
[1]国家治理中大数据应用问题研究[D]. 卢洪.中共中央党校 2018
[2]文本分类及其相关技术研究[D]. 李荣陆.复旦大学 2005
硕士论文
[1]基于机器学习的文本分类研究与实现[D]. 王振.南京邮电大学 2018
[2]基于分词频的特征选择算法在文本分类中的研究[D]. 刘艺彬.西安理工大学 2018
[3]基于深度学习的文本分类技术的研究[D]. 庞丹丹.北方工业大学 2018
[4]混合推荐算法的研究[D]. 宋瑞平.兰州大学 2014
本文编号:3211021
本文链接:https://www.wllwen.com/jiaoyulunwen/ktjx/3211021.html