当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Web和Email的多元社会网络抽取与分析关键技术研究

发布时间:2018-10-09 08:31
【摘要】:随着信息技术和网络通信技术的发展,利用互联网组织的违法行为和活动越来越多。如何从多种网络数据中准确抽取人物的属性和社会关系等信息,进而挖掘潜在的关键人物和社团组织等网情信息,已成为一个备受关注的问题。目前,基于单一网络数据的社会网络抽取与分析技术已比较成熟,但相关技术还无法解决基于多种网络数据的社会网络抽取与分析问题。本文对基于网络数据的社会网络抽取与分析相关技术的应用和研究现状进行了分析,在此基础上,针对Web页面和Email消息这两种数据,围绕基于多种网络数据的社会网络抽取与分析中的几个关键技术,包括社会网络模型、人物属性抽取、社会关系评估及社团发现等,开展了深入研究。主要工作和研究成果包括以下几个方面: (1)社会网络模型方面。针对现有社会网络模型不能充分描述人物在多种网络数据中的属性及社会关系信息,提出了多元社会网络的概念与模型,并给出了基于Web和Email的多元社会网络实例的具体描述方法;该模型为基于多种网络数据的人物的属性抽取、社会关系评估和社团发现等社会网络抽取与分析技术提供了研究基础。基于此模型,提出了多元社会网络抽取分析技术框架,并对其中的关键技术进行了分析,该框架对面向多元社会网络的相关研究和系统设计具有较好的指导意义。 (2)基于Web页面的人物属性抽取方面。针对现有Web人物属性抽取的概念和方法不能适用于Web页面中不同类型的人物属性自动抽取问题,提出了广义Web人物属性抽取的概念,并对其进行了形式化描述。为解决广义Web人物属性抽取问题,提出了基于多特征自动推理的Web人物属性抽取方法(MFAR)。在MFAR方法的关联规则定义问题上,提出了多种具有通用性的关联特征,建立了基于单一特征和多特征的属性关联规则,对关联特征和关联规则进行了逻辑表示。提出了利用Markov逻辑网来解决MFAR方法中的关联规则自动训练与推理问题,并给出了基于Markov逻辑网的关联规则自动训练与推理框架。实验结果表明:面对不同类型的Web人物属性抽取问题,,与现有基于单一规则的Web人物属性抽取方法相比,该算法可以更准确地从Web页面中自动抽取出人物属性。 (3)基于Email数据的人物属性抽取方面。提出了基于邮件数据的人物属性抽取框架;针对框架中邮件正文称呼块和签名块内的候选人名属性抽取问题,提出了基于统计和规则的块定位算法;针对框架中候选人名可信度评估问题,提出了基于聚类和通信重要度的候选人名可信度评估算法,算法通过对候选人名聚类并分析人名在邮件通信中体现的重要度,评估候选人名类的可信度,进而抽取出人物的可信人名。在Enron邮件数据集上的实验结果表明利用提出的块定位算法可以较为准确地抽取出邮件正文中的称呼块和签名块,提出的候选人名可信度评估算法可以准确地抽取出人物的正式人名及其别名。 (4)基于Web页面的社会关系评估方面。针对现有Web社会关系评估方法的评估结果准确度不高、稳定性不好等问题,提出了一个基于搜索引擎和文本分析的Web社会关系评估模型;在该模型的基础上,设计了两种关系评估函数,并构建了相应的关系评估方法。实验结果表明:与现有基于搜索引擎和基于文本分析的典型方法相比,基于SETARM模型设计的两种关系评估方法计算出的关系权重更准确、稳定性更好;模型中两类基本方法以线性方式融合且基于文本分析的方法其贡献更大时模型的性能更好。 (5)社团发现算法方面。针对现有社团发现算法不能很好地解决多元社会网络中的社团发现问题,提出了多元社会网络中社团发现的基本思想。基于该思想,针对多元社会网络向有权网络的转换问题,提出了综合多元信息的关系紧密度评估方法(MICE);针对有权网络中的社团发现问题,提出了两阶段局部贪婪扩展算法(TSLGE),算法在种子的选择、扩展评价函数的定义和相似社团合并等关键问题的处理上提出了改进方法。在基于Enron邮件集构建的多元社会网络实例上的实验结果,验证了利用MICE方法评估出的节点之间的关系紧密度与真实社会关系更接近;在仿真网络和基于Enron邮件集构建的多元社会网络实例上进行的社团发现实验结果表明,TSLGE算法具有较好的时间性能,且与现有基于局部扩展的典型社团发现算法相比,TSLGE算法在无权网络和有权网络上均可以比较准确地发现网络中的社团。 最后,对全文工作进行了总结,并对多元社会网络抽取和分析技术进行了展望,提出了下一步的研究方向。
[Abstract]:......
【学位授予单位】:解放军信息工程大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP393.09

【相似文献】

相关期刊论文 前10条

1 李方敏;CGI的安全编程[J];计算机工程与应用;1999年06期

2 宋如顺,姜乃松;基于Web的远程考试系统设计与实现[J];计算机工程;1999年06期

3 王红霞,姚家亮;利用ASP构建新型信息系统的方法与实现[J];计算机应用;1999年09期

4 邓劲生,张银福;面向对象的多媒体信息WEB发布[J];计算机应用研究;1999年09期

5 刁兴春,李赤红;Intranet环境下事务处理的理论研究和实现[J];小型微型计算机系统;1999年06期

6 高昆;基于ASP的WEB站点开发技术分析[J];北华大学学报(社会科学版);1999年05期

7 王清心,胡建华;经贸数据库的WEB集成发布[J];昆明理工大学学报;1999年02期

8 李晶,朱秋萍;Web页制作中的动态表现技术[J];计算机工程;2000年06期

9 刘波,代亚非,杜跃进;远程协同教学系统中课程搜索子系统设计[J];计算机应用;2000年06期

10 武庄,刘友丹;基于Web的企业内部质量审核系统设计与实现[J];计算机应用研究;2000年05期

相关会议论文 前10条

1 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

2 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年

3 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年

4 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

5 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

7 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年

8 胡建强;周斌;尹刚;邹鹏;;基于角色的Web服务访问控制技术研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

9 黄建波;丁扬;方芳;;基于代理服务器的Web加速的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年

10 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年

相关重要报纸文章 前10条

1 ;Web 2.0数据分析工具正流行[N];网络世界;2008年

2 赵晓涛;Web安全 服务为王[N];网络世界;2008年

3 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年

4 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年

5 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年

6 闫冰;“推”出Web交付新天地[N];网络世界;2009年

7 赵晓涛;中国成全球Web安全新看点[N];网络世界;2009年

8 边歆;动态阻断Web2.0威胁[N];网络世界;2009年

9 泰乐公司首席技术官兼执行副总裁Vikram Saksena;学习Web 3.0 做聪明的“管道工”[N];通信产业报;2009年

10 ;Web2.0工具使用须谨慎[N];网络世界;2009年

相关博士学位论文 前10条

1 王洋;社会网络视角下的危机传播机理与治理[D];哈尔滨工业大学;2011年

2 倪顺江;基于复杂网络理论的传染病动力学建模与研究[D];清华大学;2009年

3 尹美娟;基于Web和Email的多元社会网络抽取与分析关键技术研究[D];解放军信息工程大学;2012年

4 袁晓婷;企业R&D团队内部社会网络与团队知识创造关系研究[D];华南理工大学;2010年

5 张淑娟;吴景濂与民国政治:1916~1923[D];复旦大学;2007年

6 徐峰;互联网宏观拓扑结构中社团特征演化分析及应用[D];东北大学;2009年

7 苏春艳;社会网络与职业获得[D];上海大学;2005年

8 王小明;社会资本的经济分析[D];复旦大学;2008年

9 邓学军;企业家社会网络对企业绩效的影响研究[D];暨南大学;2009年

10 林琛;WEB环境下的社会网络挖掘研究[D];复旦大学;2009年

相关硕士学位论文 前10条

1 庞永杰;基于Web的社会网络搜索中人名同一性判断方法研究[D];华中科技大学;2011年

2 唐黎;Deep Web页面结构分析与核心内容提取研究[D];重庆大学;2011年

3 吴新勇;基于需求群组的Web服务调度模型研究[D];上海交通大学;2011年

4 徐卫;Web新闻热点发现系统的设计与实现[D];华中科技大学;2011年

5 姜本臣;基于嵌入式Web服务器应用技术的研究[D];沈阳工业大学;2012年

6 温梨梨;基于零拷贝的Web服务器技术研究[D];中国海洋大学;2011年

7 焦燕廷;一种基于领域本体的语义Web服务匹配和组合方法[D];山东科技大学;2011年

8 黄亮;Web漏洞扫描系统中的智能爬虫技术研究[D];杭州电子科技大学;2012年

9 赵春娟;Web服务组合方法的研究与实现[D];天津理工大学;2011年

10 任强;基于谓词抽象与精化技术的Web服务验证研究[D];苏州大学;2011年



本文编号:2258667

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2258667.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2f769***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com