当前位置:主页 > 管理论文 > 移动网络论文 >

隐藏服务内容分类研究

发布时间:2021-08-01 22:49
  随着网络用户对隐私保护要求的不断提高,匿名通信技术与隐藏服务机制(又名暗网)得到快速发展。然而隐藏服务强匿名性和难以追踪的特点为非法活动提供了庇护场所,非法服务层出不穷,给网络空间安全带来了严重威胁。因此,研究隐藏服务非法活动的分类,对防止和打击违法犯罪行为,具有重要意义。由于隐藏服务域名发布方式隐蔽,非法网站数量分布不均衡,且内容迁移更新频繁,大规模数据采集与标记具有一定难度,因此当前隐藏服务非法内容分类研究中存在数据集规模小、目标类别少、难以分类新型非法活动等难点。针对这些问题,本文以Tor隐藏服务为研究对象,提出了基于法律规制的隐藏服务非法活动分类方法,利用相关法律法规判定非法隐藏服务,结合TF-IDF特征权重计算和机器学习分类算法,实现了对隐藏服务非法网页的有效分类。本文主要工作与贡献如下:(1)在数据采集阶段,通过研究Tor隐藏服务发布与访问机制,设计了 Tor隐藏服务发现与收集系统,使用爬虫框架实现了从Tor隐藏服务目录类网站和明网搜索引擎关键字检索两种渠道发现和收集Tor隐藏服务域名的功能,构造了基于Tor隐藏服务的非法活动网页数据集,为后续分类研究提供测试数据。(2)提... 

【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校

【文章页数】:77 页

【学位级别】:硕士

【部分图文】:

隐藏服务内容分类研究


图2-1?Tor网络不意图??Figure?2-1?Tor?network?structure??

运行机制,服务协议,关键节点,数据流量


服务请求方客户端和隐藏服务分别与约会节点RP建立Tor的三跳链路,??通信过程的所有数据流量都经过约会节点转发。??图2-2展示了一个带有上述关键节点的Tor网络结构,本文将从Tor隐藏服务??的发布和用户访问两部分介绍隐藏服务协议的具体流程。??(1)

流程图,文本分类,网页,流程图


了一些必要的关键技术,对文本分类技术提出了更高的要求。??现有研究中网页文本分类的一般过程包括原始网页去噪、预处理、特征工程、??训练与分类以及对分类结果的评价与反馈等步骤,如图2-3所示:??网页文本分类过程可以划分为训练模块和分类模块。在预处理部分,首先根据??分类需求对原始网页进行去格式化操作,删掉与分类无关的标签、超链接等数据,??提取文本数据,然后对得到的文本进行去停用词、还原词形等操作,得到原始的特??征词集合。特征工程部分,通过特征选择和特征权重计算完成特征的降维和向量构??造。对于训练与分类部分,一般使用机器学习分类器对训练集的特征向量进行训练??后得到该批次数据的分类模型,然后输入测试集的训练向量,得到分类模型对测试??数据的分类结果。在最后的模型评价与反馈部分,通常使用基于混淆矩阵的评价指??标以及ROC图等方式对模型进行评估。??下文将介绍网页文本分类中使用的主要技术。??—???训练集一—文本分词^ ̄?特征选择??丫丨丄丨r?

【参考文献】:
期刊论文
[1]匿名通信与暗网研究综述[J]. 罗军舟,杨明,凌振,吴文甲,顾晓丹.  计算机研究与发展. 2019(01)
[2]A Survey about Algorithms Utilized by Focused Web Crawler[J]. Yong-Bin Yu,Shi-Lei Huang,Nyima Tashi,Huan Zhang,Fei Lei,Lin-Yang Wu.  Journal of Electronic Science and Technology. 2018(02)

博士论文
[1]匿名网络追踪溯源关键技术研究[D]. 卓中流.电子科技大学 2018
[2]基于深度学习的文本表示与分类方法研究[D]. 闫琰.北京科技大学 2016

硕士论文
[1]基于节点注入的暗网扫描系统的设计与实现[D]. 殷帅.北京邮电大学 2018
[2]Tor匿名追踪技术研究[D]. 刘源.西安电子科技大学 2017
[3]网页分类中特征选择方法的研究[D]. 刘路阔.华中科技大学 2017
[4]基于统计的Web网页分类算法研究[D]. 孟庆飞.中国地质大学(北京) 2016
[5]基于Tor的暗网脆弱性分析研究[D]. 鲍凯.电子科技大学 2016



本文编号:3316384

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3316384.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户59e38***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com