基于用户行为的色情网站识别
发布时间:2017-06-25 21:15
本文关键词:基于用户行为的色情网站识别,由笔耕文化传播整理发布。
【摘要】:以色情网站为代表的万维网非法资源已经成为互联网应用普及过程中的重大挑战.由于色情网站与普通网站的内容特征、结构形式和访问者群体都有显著的差异,这造成了用户对色情网站和普通网站的访问行为的差异.在某商业搜索引擎的协助下,收集了海量规模互联网用户访问日志,基于对日志中所记载用户行为的挖掘,验证了用户访问色情网站与普通网站时的行为确实具有明显的差异.基于此类差异设计了一系列用户行为特征,并结合机器学习方法,设计了基于用户行为的色情网站识别方法.实验表明,该方法可以较准确、高效地从网站中识别色情网站.
【作者单位】: 智能技术与系统国家重点实验室(清华大学);清华信息科学与技术国家实验室(筹);清华大学计算机科学与技术系;
【关键词】: 色情网站 网络非法资源 用户行为分析 搜索引擎 网络浏览
【基金】:国家“八六三”高技术研究发展计划基金项目(2011AA01A205) 国家自然科学基金项目(60903107,61073071) 高等学校博士学科点专项科研基金项目(20090002120005)
【分类号】:TP391.3
【正文快照】: 我国正处于互联网高速发展的浪潮之中,一方面,截止2011年底,中国网民规模达到4.85亿,位居世界首位,网页数量达到600亿以上,自2003年以来已经保持了多年的快速增长;另一方面,我国人口中的互联网普及率目前为36.2%,仅略高于世界平均水平,远低于西方发达国家的水平.互联网普及率
【相似文献】
中国期刊全文数据库 前10条
1 江婕;李建民;曾R挽,
本文编号:483587
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/483587.html