网页自杀数据挖掘系统的开发与基于该系统的自杀流行病学调查
发布时间:2017-10-18 18:42
本文关键词:网页自杀数据挖掘系统的开发与基于该系统的自杀流行病学调查
【摘要】:目的自杀是全世界面临的一个重大的公共卫生问题,但目前关于自杀的人群研究多基于局部地区且其数据来源单一,尚不能很好地反映自杀的全貌。随着网络的日益普及,网民队伍和网络媒体迅速扩大,网络自杀报道和博文的覆盖面和影响面迅速增加。本研究旨在设计开发出网页自杀数据挖掘系统,通过该系统进行自杀的流行病学研究,描述网页新闻报道自杀者的自杀行为特征,为该系统能作为人群自杀研究数据的重要补充来源提供论证支持,为借助因特网开展自杀相关研究及预防干预提供线索。 方法(1)以微软公司的Visual Studio2008为开发平台,以SQL2008为后台数据库,设计出网页自杀数据挖掘系统;(2)在对网页上自杀相关新闻与博文等做较为深入分析的基础上,综合选择或设计多种数据挖掘技术与算法;(3)采用“快速原型”法设计初步的网络数据挖掘系统,并通过反复试用不断完善以形成具有较高针对性和一定智能识别与自学能力的实用监测与预警工具;(4)利用最终产出的网页自杀数据挖掘系统收集国内流行搜索引擎(新浪、百度和搜搜等)中可得数据,揭示自杀的流行特征、趋势、影响因素并发现网络中可能存在的具有较高自杀意向的个体等;(5)把提取转化的数据导入到Excel2007中以对自杀的流行病学特征进行一般的统计描述。 结果设计出集数据采集、清洗、提取及分析与表现功能于一身的网页自杀数据挖掘系统。数据采集功能—用于根据用户输入的搜索引擎网址收集网上自杀相关新闻及博文并将它们存贮在后台数据库中。数据清洗功能—用于识别并剔除已收集新闻报道或博文中相互重复或与自杀不相关的内容。信息提取功能—用于帮助用户从所收集的大量文本数据中提取有用的信息。而数据分析与表现功能—则帮助用户依据已收集的数据发掘自杀的流行形势、流行特征、趋势、影响因素及识别网上高危自杀个体等。 通过对上述设计开发系统的初步应用发现:利用该系统2012年7月-2013年1月共搜集到来源于各大网站的自杀新闻事件1554起,,网站来源以搜狐网为最多。基于该系统的自杀数据流行病学分析显示:报道的自杀事件单人自杀1478起(95.1%),多人自杀76起(4.9%);针对单人自杀事件,(1)自杀发生的性别比为1.6:1;(2)自杀者以15-34岁的年轻人为最多;(3)自杀行为主要发生在春夏季及一天当中的上午和晚上;(4)以华东、华南和华中为自杀的主要发生地区;(5)自杀地点以在家中为最多;(6)自杀原因主要滴感情问题和家庭矛盾;(7)自杀方式以服毒为主。 结论本研究设计开发出的网页自杀数据挖掘系统能够较为经济而有效地帮助用户从海量的网络信息中提取、清理并分析与自杀相关的信息。随着网络的日益普及,通过该系统能在一定程度上揭示出潜在的自杀现象的流行特征、趋势及因果联系等,进而为预防和控制这一严重危害人类生命与健康的行为提供有价值的线索与手段。但该系统的开发不可避免地存在一些缺陷,还需进一步的修复和完善。
【关键词】:自杀 分布特征 网络 数据挖掘 辅助系统
【学位授予单位】:安徽医科大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:B846
【目录】:
- 中文摘要6-8
- ABSTRACT8-11
- 1 前言11-13
- 2 对象和方法13-17
- 2.1 资料来源13
- 2.2 研究内容13-14
- 2.3 研究方法14-17
- 3 结果17-31
- 3.1 网络数据挖掘系统的架构与功能17-19
- 3.1.1 整体架构17
- 3.1.2 结构特点与功能整体架构17-19
- 3.2 网络数据挖掘系统的关键页面描述19-22
- 3.2.1 自杀新闻报道/博客言论的采集界面19-20
- 3.2.2 初始数据的清洗与筛选界面20
- 3.2.3 自杀信息的提取与转化界面20-21
- 3.2.4 终末结果的分析与展现界面21-22
- 3.3 网络数据挖掘系统的初步应用发现22-31
- 3.3.1 中国新闻网页的数量与报道来源23
- 3.3.2 自杀者的性别和年龄分布23-25
- 3.3.3 自杀行为发生的时间分布25
- 3.3.4 自杀行为发生的地域分布25-26
- 3.3.5 自杀方式的分布26-28
- 3.3.6 自杀行为发生的场所分布28-30
- 3.3.7 自杀原因的分布30-31
- 4 讨论31-36
- 4.1 基于网络数据挖掘系统的自杀行为数量及结局31
- 4.2 网络数据挖掘系统呈现的自杀特征与人群调查结果的吻合度31-34
- 4.3 网络资源可以成为未来自杀行为监测与干预的重要途径34-36
- 4.4 网页自杀数据挖掘系统的局限性36
- 5 结论36-37
- 参考文献37-41
- 附录41-43
- 个人简历41-43
- 致谢43-44
- 综述44-52
- 参考文献49-52
【参考文献】
中国期刊全文数据库 前10条
1 俞琼;付颖利;冯佳;谢冰;寇长贵;于雅琴;;5-羟色胺1A受体基因多态性与自杀关联性的Meta分析[J];吉林大学学报(医学版);2010年06期
2 周海滨;彭绩;;深圳市居民自杀流行病学研究[J];中华疾病控制杂志;2011年03期
3 刘淑英,赵敏,王玉芝;616例急性中毒患者流行病学调查[J];中华急诊医学杂志;2004年06期
4 郑红;李研;张娜;;保定市2004-2008年自杀行为流行病学分析[J];中国健康心理学杂志;2011年02期
5 梁瑛楠;杨丽珠;;大学生自杀意念的流行病学特征[J];中国健康心理学杂志;2011年08期
6 赵梅,季建林;自杀的国内外研究现状[J];上海精神医学;2000年04期
7 徐慧兰,肖水源,陈继萍,谌吉洪,刘桂英;城市居民自杀流行学研究[J];临床精神医学杂志;1999年04期
8 吴鹏强;史小玲;陈梅;韩丽英;;抑郁症患者5-羟色胺2A受体基因T102C多态性与服毒自杀行为的相关研究[J];泸州医学院学报;2011年05期
9 景军;吴学雅;张杰;;农村女性的迁移与中国自杀率的下降[J];中国农业大学学报(社会科学版);2010年04期
10 王淑合;谈谈自杀及其预防[J];求实;2005年S1期
本文编号:1056520
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/1056520.html
最近更新
教材专著