基于文本挖掘的数据分析岗位人才需求分析
发布时间:2021-09-08 18:35
随着大数据时代的到来,数据分析岗位一跃成为当今备受关注冉冉升起的新星,各行各业都需要具备数据分析技能的人才,然而就在数据分析岗位需求量日益增加的同时,还是有很多专业十分对口的应届毕业生存在就业困难的情况。因此本文旨在探究就业市场上数据分析人才的招聘情况,挖掘出企业方对于数据分析人才的要求,从而为学校的人才培养以及想从事数据分析岗位的求职者提供一些参考。本文从前程无忧招聘网站中爬取了11224条数据分析岗位招聘信息,首先,采用描述性统计,根据公司所有权性质、公司规模、行业分布三方面刻画需要数据分析岗位的公司,从公司、行业、地区三个角度比较数据分析岗位的需求量差异,从学历、工作经验、技能要求三方面看公司对数据分析岗位的具体要求,并探究不同地区、行业、公司的薪资差异;其次,对各个地区的岗位要求进行主题词提取,构建LDA主题模型,输出各地区对数据分析岗位的特征词,探究地区间的差异;最后,对岗位要求进行文本聚类,利用预训练的Word2vec模型对文本进行向量化,再使用Single-pass聚类,最后将各个类别的数据分析岗位从技能要求、地区分布、行业分布、薪资水平四方面进行比较。最后得出民营企业、...
【文章来源】:江西财经大学江西省
【文章页数】:87 页
【学位级别】:硕士
【部分图文】:
前程无忧详细信息网页
讲煌骋唬?薹ń?泻嵯蜃菹蛞约扒?虻确矫嫘阶识员龋??此在预处理阶段需要解决薪资格式不统一。所使用的工具有access、python。解决思路如下,首先,需要知道这11224个样本中,薪资的格式和单位共有多少种不同的形式。下一步就是根据不同形式,在python中使用正则表达式和条件语句结构,生成薪资统一的新变量,并将新数据框存储到CSV文件中。在access中进行去重操作及LIKE近似匹配,发现薪资共有四种格式:1.x-y万/月;2.x-y万/年;3.x-y千/月;4.x元/天;目的是将这些全都统一成“千/月”的单位,因此转化的逻辑框架如下图。图2-3薪资预处理思路图
基于文本挖掘的数据分析岗位人才需求分析163数据分析岗的主要特征3.1样本公司画像根据爬取到的发布招聘广告的公司信息,可以分析得到对数据分析人才有所需求的公司画像。根据数据情况,可以从三方面刻画需要数据分析人才的公司,分别是公司所有权性质,人数规模以及所属行业。(1)公司所有权性质图3-1发布招聘信息的公司其属性分布图在11224个样本中,发布数据分析人才招聘信息最多的公司是民营公司,共计8413家,占比75.04%;其次是外资企业,共计851家,占比7.59%;发布量排名第三的是合资公司跟上市公司,分别有653、657家,均占比约5.8%;国企跟创业公司也对数据分析类人才有所需求,在样本中共有368家(3.28%)国企以及198家(1.77%)创业公司发布了数据分析招聘信息;外企代表处,事业单位,非盈利机构对数据分析人才的招聘发布量较少。(2)公司规模从图3-2中可以看出,发布招聘数据分析岗位的公司规模集中在50-150人及150-500人的中小型企业,分别是3491家及2795家,共占据数据分析需求市场56%的份额;员工数量少于50人的小企业紧随其后,共有1779家,占比约16%;规模上千的企业对数据分析人才招聘信息的发布量较多,规模为1000-5000人的企业有1377家(12.27%),规模为500-1000人的企业有1188家(10.58%);规模近万的大型规模企业由于人员较为饱和,招聘数据分析人才的需求较少,因此发布数据分析招聘信息且规模在10000人以上的企业仅有352家,规模为5000-10000人的企业仅242家。
【参考文献】:
期刊论文
[1]面向社交媒体评论的子话题挖掘研究[J]. 夏丽华,韩冬梅. 情报杂志. 2020(04)
[2]基于词向量和增量聚类的短文本聚类算法[J]. 杨波,杨文忠,殷亚博,何雪琴,袁婷婷,刘泽洋. 计算机工程与设计. 2019(10)
[3]基于灰色模型的网络招聘信息人才趋势预测[J]. 李赵兴. 榆林学院学报. 2019(02)
[4]中美高校图书馆岗位招聘对比分析[J]. 曾伟忠,胡惠芳. 图书馆学研究. 2018(23)
[5]基于模糊匹配的招聘网页技能术语抽取研究[J]. 孙瑜,莫凌飞. 信息技术与信息化. 2018(11)
[6]一种具有新主题偏向性的短文本动态聚类方法[J]. 朱映雪,黄瑞章,马灿. 山东大学学报(工学版). 2018(06)
[7]基于数据挖掘的互联网行业岗位类型分析[J]. 詹翠芬. 计算机产品与流通. 2018(07)
[8]基于深度学习的数据科学招聘实体自动抽取及分析研究[J]. 王东波,胡昊天,周鑫,朱丹浩. 图书情报工作. 2018(13)
[9]国内招聘类网站的数据类岗位人才需求特征挖掘[J]. 张俊峰,魏瑞斌. 情报杂志. 2018(06)
[10]会计人才需求问题研究——基于会计人才的市场调查[J]. 罗玉波,张冬霞. 广东石油化工学院学报. 2018(02)
博士论文
[1]基于内容的互联网舆情信息挖掘关键技术研究[D]. 刘玉国.山东大学 2011
硕士论文
[1]基于Web招聘信息的文本挖掘系统研究[D]. 钟晓旭.合肥工业大学 2010
本文编号:3391285
【文章来源】:江西财经大学江西省
【文章页数】:87 页
【学位级别】:硕士
【部分图文】:
前程无忧详细信息网页
讲煌骋唬?薹ń?泻嵯蜃菹蛞约扒?虻确矫嫘阶识员龋??此在预处理阶段需要解决薪资格式不统一。所使用的工具有access、python。解决思路如下,首先,需要知道这11224个样本中,薪资的格式和单位共有多少种不同的形式。下一步就是根据不同形式,在python中使用正则表达式和条件语句结构,生成薪资统一的新变量,并将新数据框存储到CSV文件中。在access中进行去重操作及LIKE近似匹配,发现薪资共有四种格式:1.x-y万/月;2.x-y万/年;3.x-y千/月;4.x元/天;目的是将这些全都统一成“千/月”的单位,因此转化的逻辑框架如下图。图2-3薪资预处理思路图
基于文本挖掘的数据分析岗位人才需求分析163数据分析岗的主要特征3.1样本公司画像根据爬取到的发布招聘广告的公司信息,可以分析得到对数据分析人才有所需求的公司画像。根据数据情况,可以从三方面刻画需要数据分析人才的公司,分别是公司所有权性质,人数规模以及所属行业。(1)公司所有权性质图3-1发布招聘信息的公司其属性分布图在11224个样本中,发布数据分析人才招聘信息最多的公司是民营公司,共计8413家,占比75.04%;其次是外资企业,共计851家,占比7.59%;发布量排名第三的是合资公司跟上市公司,分别有653、657家,均占比约5.8%;国企跟创业公司也对数据分析类人才有所需求,在样本中共有368家(3.28%)国企以及198家(1.77%)创业公司发布了数据分析招聘信息;外企代表处,事业单位,非盈利机构对数据分析人才的招聘发布量较少。(2)公司规模从图3-2中可以看出,发布招聘数据分析岗位的公司规模集中在50-150人及150-500人的中小型企业,分别是3491家及2795家,共占据数据分析需求市场56%的份额;员工数量少于50人的小企业紧随其后,共有1779家,占比约16%;规模上千的企业对数据分析人才招聘信息的发布量较多,规模为1000-5000人的企业有1377家(12.27%),规模为500-1000人的企业有1188家(10.58%);规模近万的大型规模企业由于人员较为饱和,招聘数据分析人才的需求较少,因此发布数据分析招聘信息且规模在10000人以上的企业仅有352家,规模为5000-10000人的企业仅242家。
【参考文献】:
期刊论文
[1]面向社交媒体评论的子话题挖掘研究[J]. 夏丽华,韩冬梅. 情报杂志. 2020(04)
[2]基于词向量和增量聚类的短文本聚类算法[J]. 杨波,杨文忠,殷亚博,何雪琴,袁婷婷,刘泽洋. 计算机工程与设计. 2019(10)
[3]基于灰色模型的网络招聘信息人才趋势预测[J]. 李赵兴. 榆林学院学报. 2019(02)
[4]中美高校图书馆岗位招聘对比分析[J]. 曾伟忠,胡惠芳. 图书馆学研究. 2018(23)
[5]基于模糊匹配的招聘网页技能术语抽取研究[J]. 孙瑜,莫凌飞. 信息技术与信息化. 2018(11)
[6]一种具有新主题偏向性的短文本动态聚类方法[J]. 朱映雪,黄瑞章,马灿. 山东大学学报(工学版). 2018(06)
[7]基于数据挖掘的互联网行业岗位类型分析[J]. 詹翠芬. 计算机产品与流通. 2018(07)
[8]基于深度学习的数据科学招聘实体自动抽取及分析研究[J]. 王东波,胡昊天,周鑫,朱丹浩. 图书情报工作. 2018(13)
[9]国内招聘类网站的数据类岗位人才需求特征挖掘[J]. 张俊峰,魏瑞斌. 情报杂志. 2018(06)
[10]会计人才需求问题研究——基于会计人才的市场调查[J]. 罗玉波,张冬霞. 广东石油化工学院学报. 2018(02)
博士论文
[1]基于内容的互联网舆情信息挖掘关键技术研究[D]. 刘玉国.山东大学 2011
硕士论文
[1]基于Web招聘信息的文本挖掘系统研究[D]. 钟晓旭.合肥工业大学 2010
本文编号:3391285
本文链接:https://www.wllwen.com/shoufeilunwen/shuoshibiyelunwen/3391285.html