当前位置:主页 > 科技论文 > 软件论文 >

基于主题模型的安全搜索过滤技术研究

发布时间:2024-11-03 05:04
  网络安全作为国家信息安全的重要组成部分,相关信息的安全检查与评估工作自然而然地成为了一项迫切的需求,并在维护国家安全和社会稳定方面发挥了巨大的作用。在经受网络诈骗、低俗信息、谣言泛滥等网络危害之后,众多国家不再接受互联网无政府式的自由发展,而是不约而同地将互联网纳入政府管理,开始了网络审查,与网络审查相关的信息过滤技术也因此成为了一个越来越重要的研究方向。目前网络审查主要用到了网址屏蔽、关键词过滤、文本分类、深度包检测等技术,通常应用在垃圾邮件与文件管控上,对于搜索引擎过滤的相关应用研究较少。但相较于其他的网络服务而言,搜索引擎在信息提供的深度、广度方面拥有更加强大的信息控制力。搜索引擎服务作为网络信息流的重要节点,在其基础上实现信息过滤的相关技术有重要的研究意义及应用价值。论文以实现搜索引擎中敏感信息的在线过滤为主要目的,对HTTPS代理中的网络页面解析技术以及基于搜索内容的文本过滤技术进行了相关研究。针对搜索引擎返回的词条内容在HTML源文本中相对独立的特点,提出了一种基于TCP数据流的报文处理方法,有效地提高代理到客户端的报文响应速度,并降低了代理对内存的依赖,实现资源的均衡利用。...

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

基于主题模型的安全搜索过滤技术研究



一个完整的HTTP会话过程如图2-2所示,包括了建立TCP连接、向服务器发送请求报文、服务器应答并响应数据、服务器关闭TCP连接几个步骤。首先通过TCP的三次握手确认链路通信无障碍,然后向服务器发送用户请求,等待服务器响应,服务器接收到具体的请求之后,根据自己的实际情况返回相应的....


基于主题模型的安全搜索过滤技术研究



CA证书结构如下图2-3所示。一般情况下可信任的根CA都会预先安装在系统或浏览器的证书信任列表中(如Comodo、Symantec、GoDaddy和GlobalSign等)。通过各级证书的验证,逐步上溯到证书链的终点,也就是可信任的CA,则说明网站安全,可以进行数据的加密传输。如....


基于主题模型的安全搜索过滤技术研究



(6)客户端接收确认信息后,利用会话密钥加密通信内容。2.1.2Web代理


基于主题模型的安全搜索过滤技术研究



HTTP协议之间的通信主要通过HTTP报文实现,其中又分为HTTP请求报文和HTTP响应报文。发送的请求报文主要包括了请求行、请求头、请求正文3个部分,返回的响应报文主要包括了状态行、响应头、响应正文3个部分,格式如图2-1所示。一个完整的HTTP会话过程如图2-2所示,包括了建....



本文编号:4010726

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4010726.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e5065***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com