当前位置:主页 > 管理论文 > 移动网络论文 >

中文微博隐私挖掘系统设计与实现

发布时间:2019-05-07 17:03
【摘要】:纵观近年来中文微博发展的趋势,随着用户数量不断增加,用户在微博中的关系网络逐步完善,微博中潜在的隐私泄露问题也日益成为人们关注的焦点,其中蕴含的巨大商机亦待爆发。本文的工作围绕中文微博的隐私泄露问题展开,提出了一套中文微博隐私挖掘方案。主要工作包括以下几个方面: (1)针对中文微博隐私挖掘对数据的特殊需求,设计并实现了一套基于Web技术的数据挖掘系统。提出了基于开放平台接口与页面解析技术相结合的微博数据获取方案:通过线性控制开放平台接口的访问频率,解决了访问受限问题;配合网络爬虫技术,弥补了开放平台获取数据信息不完全等问题。 (2)将基于模块度优化的启发式算法应用到微博网络的社区检测中,并对其邻接矩阵的构造提出了针对微博特性的改进方案。利用D3可视化引擎将微博网络抽象成无向图,在强关系网络的基础上,提出了结合微博关系有向性、二度人脉特性的邻接矩阵边权重算法,实现了微博网络关系从有向性到无向性的转换。经检验,该方案在保证算法效率的前提下,使得社区检测的成功率从80.32%提高到了90.16%。 (3)通过基于社区检测的隐私分析方法,利用社区中相同的公开信息来推断目标用户未公开的隐私信息,以不低于50%的置信度获得用户的地理位置信息、职业信息、教育信息。 (4)采用借助SAE分词服务的自建词库的中文关键字提取方法,,帮助实现对用户兴趣等信息的挖掘。根据中文微博关键字提取与传统关键字提取工作的区别进行方案的设计,设计了处理中文微博嘈杂信息的启发式噪声过滤规则。利用社区检测结合关键字提取的方法,实现了对更深层隐私信息的挖掘。
[Abstract]:......
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP309;TP393.092

【共引文献】

相关期刊论文 前10条

1 田卉;;用数据挖掘技术构建政府智能化网络投诉平台[J];办公自动化;2009年18期

2 钟晓旭;;层次聚类方法在关键词提取上的研究应用[J];电脑知识与技术;2009年06期

3 高学东;吴玲玉;;基于高维聚类技术的中文关键词提取算法[J];中国管理信息化;2011年09期

4 尹倩;胡学钢;谢飞;吴信东;;基于密度聚类模式的中文新闻网页关键词提取[J];广西师范大学学报(自然科学版);2009年01期

5 宋艳;何嘉;舒红平;郑皎凌;梁繁荣;任玉兰;文立玉;;基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研究[J];成都信息工程学院学报;2014年01期

6 张岳;;面向中文短信的三维动画情节规划[J];计算机工程与应用;2012年10期

7 刘金岭;;基于主题的中文短信文本分类研究[J];计算机工程;2010年04期

8 施聪莺;徐朝军;杨晓江;;TFIDF算法研究综述[J];计算机应用;2009年S1期

9 张靖;;网络个性化服务资源综合推荐研究[J];计算机仿真;2009年11期

10 李静月;李培峰;朱巧明;;一种改进的TFIDF网页关键词提取方法[J];计算机应用与软件;2011年05期

相关会议论文 前1条

1 薛征;廖闻剑;;基于位置权重和实体识别的关键词提取[A];中国电子学会第十六届信息论学术年会论文集[C];2009年

相关博士学位论文 前9条

1 蒋玲;面向学科的知识元标引关键技术研究[D];华中师范大学;2011年

2 朱朝勇;基于本体的知识库分类研究[D];中国科学技术大学;2013年

3 吴宏伟;社会网络数据发布中的隐私匿名技术研究[D];哈尔滨工程大学;2013年

4 王波;数据发布中的个性化隐私匿名技术研究[D];哈尔滨工程大学;2012年

5 叶明全;基于粗糙集理论的隐私保护数据挖掘研究[D];合肥工业大学;2013年

6 任向民;基于K-匿名的隐私保护方法研究[D];哈尔滨工程大学;2012年

7 刘华玲;基于完备空间数据扰动的隐私保护理论方法研究及应用[D];东华大学;2013年

8 朱泽德;网络双语语料挖掘关键技术研究[D];中国科学技术大学;2014年

9 张浩;基于位置服务的信息隐私保护技术研究[D];中国科学技术大学;2014年

相关硕士学位论文 前10条

1 赵莲;大规模中英可比较语料库构建[D];大连理工大学;2010年

2 谢凤宏;基于复杂网络理论的文本聚类和关键词提取方法研究[D];辽宁师范大学;2011年

3 王驰;基于海量网络舆情信息的热点发现[D];电子科技大学;2011年

4 刘成帅;中文领域术语自动获取方法的研究[D];南京邮电大学;2011年

5 姜舟;关键短语抽取及相关技术研究[D];哈尔滨工业大学;2010年

6 王浩成;基于细菌觅食优化的k-medoids文本聚类方法[D];河北大学;2011年

7 宋宇峰;一种基于DB&IR的融合查询机制的研究与实现[D];南京农业大学;2010年

8 谢晋;基于词跨度的中文文本关键词提取及在文本分类中的应用[D];浙江工业大学;2011年

9 贾洪强;面向海量短文本的舆情系统实现[D];北京邮电大学;2012年

10 徐文海;文本单元向知识单元转化的模型与映射算法[D];西安电子科技大学;2008年



本文编号:2471245

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2471245.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cd11e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com