基于网络爬虫的我国健康医疗大数据政策文献量化研究
发布时间:2021-10-14 09:47
目的:“十三五”期间,国家卫生健康委员会将全面推进“互联网+健康医疗”服务,促进健康医疗大数据的发展是实现“健康中国”战略和国家创新发展战略的重要途径,推进健康医疗大数据的应用是深化医疗改革、完善卫生与健康治理模式的重要支撑。近年来,我国颁布了一系列健康医疗大数据政策,政策文献是国家政府处理日常公共事务的切实反映和行为印迹,科学有效的政策文献分析对于准确掌握政策目标、完善政策体系以及提升政策信息的质量和信息传达的有效性都具有重要意义。基于此,本文构建了健康医疗文本政策库,在此基础上多维度分析了我国国家层面健康医疗大数据政策文献,从整体上把握我国健康医疗大数据政策的基本特征与政策目标,并针对发现的问题提出一些参考性的对策建议,以期为我国健康医疗大数据政策的制定和完善提供切实参考。方法:利用Python自编程序和网络爬虫技术对国家卫生健康委员会官方网站中的所有卫生政策文本进行批量抓取,总计55826件政策文件,并在My SQL数据库中构建健康医疗文本政策库。在此基础上以179篇健康医疗大数据相关政策为研究对象,检索截止日期为2017年12月31日。运用统计分析方法和VOSviewer工具,...
【文章来源】:山西医科大学山西省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
国家卫生健康委员会(原国家卫生部)官方网站政策文件模块布局
图 3-2 国家卫生健康委员会(原国家卫生和计划生育委员会)官方网站政策文件模块布局3.3 网络爬虫的的设计与实现3.3.1 网络爬虫的总体设计图 3-3 网络爬虫总体结构链接抽取初始 URL国家卫生健康委员会官方网站URL 模块网页下载模块网页解析模块数据存储模 块
如图 3-4 所示,对国家卫生健康委员会官方网站中的各个栏目下的政策文件逐一运行代码,代码运行结束后,会得到该栏目下每一条政策文本对应的 URL,形成一个政策文本信息的 URL 集。2: print("downloading page %d"%page)3: driver=webdriver.Chrome(chrome_options=chrome_options)4: driver.get("http://www.nhc.gov.cn/sps/zcwj2/zcwj_%d.shtml"%page)5: titles=driver.find_elements_by_xpath('//ul[@class="zxxx_list"]/li/a')6: for title in titles:7: outputFile.write('%d\t%s\n'%(page,title.get_attribute('href')))8: outputFile.flush()9: driver.close()11:driver.quit()
【参考文献】:
期刊论文
[1]基于Python对网络爬虫系统的设计与实现[J]. 陆树芬. 电脑编程技巧与维护. 2019(02)
[2]健康医疗大数据国内外发展及在卫生决策支持中的应用展望[J]. 吴敏,甄天民,谷景亮,何有琴,牟燕,宋奎勐,宋燕,窦伟洁. 卫生软科学. 2019(02)
[3]基于Python的淘宝评论爬取技术研究[J]. 杨帆,董俊,唐宏亮,张昊. 中国管理信息化. 2019(04)
[4]基于知识图谱的国际健康大数据研究可视化分析[J]. 吕红. 图书情报导刊. 2019(01)
[5]健康医疗大数据研究进展[J]. 舒影岚,陈艳萍,吉臻宇,赵凯,王春安. 中国医学装备. 2019(01)
[6]国内外政府政策文件内容分析研究综述——基于CNKI及WoS核刊数据库[J]. 杨金龙,吴震,刘千里. 宜宾学院学报. 2019(07)
[7]习近平国家治理现代化思想的大数据观及其现实意义[J]. 吴韬. 云南行政学院学报. 2018(05)
[8]生物医学大数据发展的新挑战与趋势[J]. 张国庆,李亦学,王泽峰,赵国屏. 中国科学院院刊. 2018(08)
[9]国务院政府工作报告(1954—2017)文本挖掘及社会变迁研究[J]. 魏伟,郭崇慧,陈静锋. 情报学报. 2018(04)
[10]地方政府大数据发展政策的文献量化研究——基于政策“目标-工具”匹配的视角[J]. 范梓腾,谭海波. 中国行政管理. 2017(12)
博士论文
[1]可视化数字病人关键技术与系统研究[D]. 施烈航.中国科学院研究生院(上海技术物理研究所) 2016
硕士论文
[1]我国政府电子政务服务能力与电子政务政策相关性研究[D]. 黄锋利.南京大学 2018
[2]面向Web文本挖掘的主题网络爬虫研究[D]. 陈晨.电子科技大学 2017
本文编号:3435923
【文章来源】:山西医科大学山西省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
国家卫生健康委员会(原国家卫生部)官方网站政策文件模块布局
图 3-2 国家卫生健康委员会(原国家卫生和计划生育委员会)官方网站政策文件模块布局3.3 网络爬虫的的设计与实现3.3.1 网络爬虫的总体设计图 3-3 网络爬虫总体结构链接抽取初始 URL国家卫生健康委员会官方网站URL 模块网页下载模块网页解析模块数据存储模 块
如图 3-4 所示,对国家卫生健康委员会官方网站中的各个栏目下的政策文件逐一运行代码,代码运行结束后,会得到该栏目下每一条政策文本对应的 URL,形成一个政策文本信息的 URL 集。2: print("downloading page %d"%page)3: driver=webdriver.Chrome(chrome_options=chrome_options)4: driver.get("http://www.nhc.gov.cn/sps/zcwj2/zcwj_%d.shtml"%page)5: titles=driver.find_elements_by_xpath('//ul[@class="zxxx_list"]/li/a')6: for title in titles:7: outputFile.write('%d\t%s\n'%(page,title.get_attribute('href')))8: outputFile.flush()9: driver.close()11:driver.quit()
【参考文献】:
期刊论文
[1]基于Python对网络爬虫系统的设计与实现[J]. 陆树芬. 电脑编程技巧与维护. 2019(02)
[2]健康医疗大数据国内外发展及在卫生决策支持中的应用展望[J]. 吴敏,甄天民,谷景亮,何有琴,牟燕,宋奎勐,宋燕,窦伟洁. 卫生软科学. 2019(02)
[3]基于Python的淘宝评论爬取技术研究[J]. 杨帆,董俊,唐宏亮,张昊. 中国管理信息化. 2019(04)
[4]基于知识图谱的国际健康大数据研究可视化分析[J]. 吕红. 图书情报导刊. 2019(01)
[5]健康医疗大数据研究进展[J]. 舒影岚,陈艳萍,吉臻宇,赵凯,王春安. 中国医学装备. 2019(01)
[6]国内外政府政策文件内容分析研究综述——基于CNKI及WoS核刊数据库[J]. 杨金龙,吴震,刘千里. 宜宾学院学报. 2019(07)
[7]习近平国家治理现代化思想的大数据观及其现实意义[J]. 吴韬. 云南行政学院学报. 2018(05)
[8]生物医学大数据发展的新挑战与趋势[J]. 张国庆,李亦学,王泽峰,赵国屏. 中国科学院院刊. 2018(08)
[9]国务院政府工作报告(1954—2017)文本挖掘及社会变迁研究[J]. 魏伟,郭崇慧,陈静锋. 情报学报. 2018(04)
[10]地方政府大数据发展政策的文献量化研究——基于政策“目标-工具”匹配的视角[J]. 范梓腾,谭海波. 中国行政管理. 2017(12)
博士论文
[1]可视化数字病人关键技术与系统研究[D]. 施烈航.中国科学院研究生院(上海技术物理研究所) 2016
硕士论文
[1]我国政府电子政务服务能力与电子政务政策相关性研究[D]. 黄锋利.南京大学 2018
[2]面向Web文本挖掘的主题网络爬虫研究[D]. 陈晨.电子科技大学 2017
本文编号:3435923
本文链接:https://www.wllwen.com/tushudanganlunwen/3435923.html