一种企业画像系统的设计与实现
发布时间:2021-01-18 08:02
随着市场经济的髙速发展,越来越多的企业注册成立,由此产生了海量的企业运营数据。与此同时,无处不在的商业风险,企业在挑选项目、寻求合作伙伴时需要了解合作方的背景信息、风险信息、经营信息、对外投资信息、知识产权信息等信息作为合作的参考指标,政府需要时刻监管企业,同时,各行各业的网民也有了解企业信息的需要。针对上述问题,依托于河北省科学院应用数学研究所的企业征信信用服务平台,本文提出设计一种企业画像系统。展示企业的背景信息、企业风险信息、企业经营信息、对外投资信息、知识产权信息。针对海量的企业运营数据,使用数据挖掘技术对企业信息进行分析和研究,对企业信息进行维度分解,从每一维度对企业信息进行标签提取,为每个企业绘制企业画像标签图。将企业和企业间的投资关系,人物和企业间的任职关系和股东关系进行可视化的展示。具体工作如下:(1)需求分析。分析企业画像的研究现状,对企业信息进行维度分解,针对每一维度进行标签的定义。制定了系统的功能性需求分析,绘制了基于后台管理员和普通用户两种角色的用例图,并进行了详细的用例描述。(2)使用数据挖掘技术进行企业画像的标签提取。通过对标签相关概念和标签化技术难点的理解...
【文章来源】:河北师范大学河北省
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
专有名词字典截图
这一小节设计了行业标签的提取过程,如图4.5 所示。输入某企业的“经营范围”,对经营范围进行预处理:分词、去停用词。对降噪后的数据进行特征工程,然后构造分类模型,最后输出预测行业。图 4.5 行业标签提取流程图
程中必不可少的一个操作,词汇是我们对把完整的文本分解成粒度更细的词。因为文本。目前文本分词已经有很多比较成熟a)、THULAC、SnowNLP、pynlpir、CoreN文分词工具。典过程中不可缺少的一步,因为并不是文本这个”、“的”、“一二三四”、“我你他”等。本文从网络下载整理了中文常规停用词智能实验室停用词库、百度停用词表等,
【参考文献】:
期刊论文
[1]基于大数据的电子商务用户画像构建研究[J]. 李佳慧,赵刚. 电子商务. 2019(01)
[2]基于大数据平台的企业画像研究综述[J]. 田娟,朱定局,杨文翰. 计算机科学. 2018(S2)
[3]构建Windows环境下Python GUI网络编程实验环境[J]. 刘海燕,马振涛. 北华航天工业学院学报. 2018(04)
[4]基于上下文语义的朴素贝叶斯文本分类算法[J]. 郑开雨,竹翠. 计算机与现代化. 2018(06)
[5]百度Echarts在数据可视化分析中的应用[J]. 黄宇栋. 金融科技时代. 2018(06)
[6]大数据时代下数据挖掘技术的应用[J]. 刘铭,吕丹,安永灿. 科技导报. 2018(09)
[7]质监大数据企业画像的研究及应用[J]. 吴行惠,王光昕,虞海江,张东,孙呈梅,王剑. 数字通信世界. 2018(02)
[8]基于混合卡方统计量与逻辑回归的文本情感分析[J]. 李平,戴月明,王艳. 计算机工程. 2017(12)
[9]基于数据源向图的数据库设计中数据关系的表示工具[J]. 陈冰川,陈蔼祥,吴向军,李磊. 计算机科学. 2017(S1)
[10]基于MySQL的数据管理系统设计与实现[J]. 苟文博,于强. 电子设计工程. 2017(06)
硕士论文
[1]基于MVC模式的车载服务平台监控管理系统研究[D]. 梅本祥.广东工业大学 2018
[2]基于搜索引擎的用户画像构建方法研究[D]. 李雅坤.山西财经大学 2018
[3]文本分类中特征提取及分类算法的研究[D]. 李惠富.东北林业大学 2018
[4]基于Python科学计算包的金融应用实现[D]. 黎爽.江西财经大学 2017
[5]资本市场企业信息系统人物和企业关系图谱的设计与实现[D]. 张巍.哈尔滨工业大学 2017
[6]常用文本分类算法的分析与研究[D]. 杨康.重庆大学 2017
[7]基于大数据平台的中文文本分析系统研究与实现[D]. 袁佳露.北京邮电大学 2017
[8]基于企业画像的公示数据查询系统设计与实现[D]. 王雪.大连海事大学 2017
[9]基于PageRank算法的Web数据挖掘的研究[D]. 郑普亨.天津理工大学 2017
[10]基于机器学习的汉语短文本分类方法研究与实现[D]. 黄旭.黑龙江大学 2016
本文编号:2984592
【文章来源】:河北师范大学河北省
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
专有名词字典截图
这一小节设计了行业标签的提取过程,如图4.5 所示。输入某企业的“经营范围”,对经营范围进行预处理:分词、去停用词。对降噪后的数据进行特征工程,然后构造分类模型,最后输出预测行业。图 4.5 行业标签提取流程图
程中必不可少的一个操作,词汇是我们对把完整的文本分解成粒度更细的词。因为文本。目前文本分词已经有很多比较成熟a)、THULAC、SnowNLP、pynlpir、CoreN文分词工具。典过程中不可缺少的一步,因为并不是文本这个”、“的”、“一二三四”、“我你他”等。本文从网络下载整理了中文常规停用词智能实验室停用词库、百度停用词表等,
【参考文献】:
期刊论文
[1]基于大数据的电子商务用户画像构建研究[J]. 李佳慧,赵刚. 电子商务. 2019(01)
[2]基于大数据平台的企业画像研究综述[J]. 田娟,朱定局,杨文翰. 计算机科学. 2018(S2)
[3]构建Windows环境下Python GUI网络编程实验环境[J]. 刘海燕,马振涛. 北华航天工业学院学报. 2018(04)
[4]基于上下文语义的朴素贝叶斯文本分类算法[J]. 郑开雨,竹翠. 计算机与现代化. 2018(06)
[5]百度Echarts在数据可视化分析中的应用[J]. 黄宇栋. 金融科技时代. 2018(06)
[6]大数据时代下数据挖掘技术的应用[J]. 刘铭,吕丹,安永灿. 科技导报. 2018(09)
[7]质监大数据企业画像的研究及应用[J]. 吴行惠,王光昕,虞海江,张东,孙呈梅,王剑. 数字通信世界. 2018(02)
[8]基于混合卡方统计量与逻辑回归的文本情感分析[J]. 李平,戴月明,王艳. 计算机工程. 2017(12)
[9]基于数据源向图的数据库设计中数据关系的表示工具[J]. 陈冰川,陈蔼祥,吴向军,李磊. 计算机科学. 2017(S1)
[10]基于MySQL的数据管理系统设计与实现[J]. 苟文博,于强. 电子设计工程. 2017(06)
硕士论文
[1]基于MVC模式的车载服务平台监控管理系统研究[D]. 梅本祥.广东工业大学 2018
[2]基于搜索引擎的用户画像构建方法研究[D]. 李雅坤.山西财经大学 2018
[3]文本分类中特征提取及分类算法的研究[D]. 李惠富.东北林业大学 2018
[4]基于Python科学计算包的金融应用实现[D]. 黎爽.江西财经大学 2017
[5]资本市场企业信息系统人物和企业关系图谱的设计与实现[D]. 张巍.哈尔滨工业大学 2017
[6]常用文本分类算法的分析与研究[D]. 杨康.重庆大学 2017
[7]基于大数据平台的中文文本分析系统研究与实现[D]. 袁佳露.北京邮电大学 2017
[8]基于企业画像的公示数据查询系统设计与实现[D]. 王雪.大连海事大学 2017
[9]基于PageRank算法的Web数据挖掘的研究[D]. 郑普亨.天津理工大学 2017
[10]基于机器学习的汉语短文本分类方法研究与实现[D]. 黄旭.黑龙江大学 2016
本文编号:2984592
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2984592.html