基于关键词和支持向量机的财务大数据爬虫
本文关键词:基于关键词和支持向量机的财务大数据爬虫
更多相关文章: 大数据 主题爬虫 关键词 支持向量机 寻优算法
【摘要】:从互联网上获取信息进行分析,已经成为人们进行决策的重要手段。有效地从海量数据中获取正确的目标信息是当前的重点和难点问题。通用搜索引擎检索的结果由于主题相关性不强,无法满足特定用户的需求。文章在改进SVM参数寻优算法的基础上,提出了结合关键词过滤算法和适用于大数据分类的支持向量机算法,并利用设计的财务管理相关主题信息分类算法,构建了财务管理相关主题爬虫系统。实验结果表明,基于关键词与改进支持向量机的财务管理主题相关爬虫能有效地采集目标信息,能够较好地适用于财务管理舆情管理和财务管理危机管理等相关领域。
【作者单位】: 内蒙古财经大学会计学院;
【关键词】: 大数据 主题爬虫 关键词 支持向量机 寻优算法
【基金】:内蒙古自治区高校创新平台“会计信息化实验实训创新教育实验室”培育项目
【分类号】:F275
【正文快照】: 一、研究综述由于网络技术的发展以及互联网服务的提升,大数据的容量得以爆发增长。据国际数据公司(IDC)公司统计,2011年全球被创建和被复制的数据总量为1.8ZB(1021)。远远超过人类有史以来所有印刷材料的数据总量(200PB)[1]。比较通用的搜索引擎如谷歌、百度等,强调搜索覆盖
【相似文献】
中国期刊全文数据库 前10条
1 贾凝;;支持向量机模型在统计学上的应用研究[J];统计与决策;2010年13期
2 吕向阳;高尚;;基于支持向量机的品牌特色专业评价[J];价值工程;2011年24期
3 黄胜忠;;遗传支持向量机在股市趋向的预测[J];计算机与数字工程;2012年01期
4 胡奎;朱成文;;基于支持向量机的雷达信号分类[J];统计与决策;2008年23期
5 许建萍;;基于支持向量机的工程索赔合理工效研究[J];科技创新导报;2009年07期
6 张明;刘念祖;;电子商务信用管理的支持向量机应用[J];中国管理信息化(综合版);2007年09期
7 高尚;梅亮;;基于支持向量机的电价组合预测模型[J];电力自动化设备;2008年11期
8 王毅;;支持向量机技术及其应用研究[J];中国高新技术企业;2008年15期
9 吕月英;;基于支持向量机工程施工风险预警研究[J];科技创新导报;2009年07期
10 芮丽梅;;改进支持向量机的商业银行评级算法[J];企业导报;2011年03期
中国重要会议论文全文数据库 前10条
1 余乐安;姚潇;;基于中心化支持向量机的信用风险评估模型[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
2 刘希玉;徐志敏;段会川;;基于支持向量机的创新分类器[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
3 史晓涛;刘建丽;骆玉荣;;一种抗噪音的支持向量机学习方法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
4 何琴淑;刘信恩;肖世富;;基于支持向量机的系统辨识方法研究及应用[A];中国力学大会——2013论文摘要集[C];2013年
5 刘骏;;基于支持向量机方法的衢州降雪模型[A];第五届长三角气象科技论坛论文集[C];2008年
6 王婷;胡秀珍;;基于组合向量的支持向量机方法预测膜蛋白类型[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
7 赵晶;高隽;张旭东;谢昭;;支持向量机综述[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
8 周星宇;王思元;;智能数学与支持向量机[A];2005年中国智能自动化会议论文集[C];2005年
9 颜根廷;马广富;朱良宽;宋斌;;一种鲁棒支持向量机算法[A];2006中国控制与决策学术年会论文集[C];2006年
10 侯澍e,
本文编号:1097719
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1097719.html