一种区分索引与信息的网页分类数学模型及证明
本文关键词:一种区分索引与信息的网页分类数学模型及证明
更多相关文章: 网页分类 索引页面 信息页面 网络传销 网络传销国家监控中心
【摘要】:综述了网页分类的国内外研究现状,分析了网页分类的核心技术,包括思想、算法、公式、评测标准。为了打击非法网络传销,必须对传销网页进行准确识别与分类。根据网页中"最大内容段"的长度,计算出这个网页为"信息网页"的概率,通过严格的数学公式推导得到数学模型。本数学模型已经得到应用,"网络传销国家监控中心"用这个模型有效地对网络传销网页集合进行了分类。
【作者单位】: 对外经济贸易大学信息学院;北京邮电大学民族教育学院;
【关键词】: 网页分类 索引页面 信息页面 网络传销 网络传销国家监控中心
【基金】:对外经济贸易大学“信息学院基金”(13YBLG02,X12511)资助
【分类号】:TP393.092
【正文快照】: 本文受对外经济贸易大学“信息学院基金”(13YBLG02,X12511)资助。1引言分类问题是一个很有意义的问题。将事物正确地进行分类,使杂乱无章的现实世界变得井井有条,这有助于人们正确地认识世界。互联网的迅猛发展和网页数量的剧增,使得人们对于网页分类的要求越来越迫切。简而
【参考文献】
中国期刊全文数据库 前10条
1 鲁明羽;沈抖;郭崇慧;陆玉昌;;面向网页分类的网页摘要方法[J];电子学报;2006年08期
2 侯翠琴;焦李成;;基于图的Co-Training网页分类[J];电子学报;2009年10期
3 张婕;山岚;;CBC算法在网页分类中的应用研究[J];北京化工大学学报(自然科学版);2013年S1期
4 张青;;移动互联网场景中客户特征分类技术研究[J];电信科学;2014年01期
5 殷贤亮;李猛;;基于分块的网页主题信息自动提取算法[J];华中科技大学学报(自然科学版);2007年10期
6 张茂元;邹春燕;卢正鼎;;一种基于变调整学习规则的模糊网页分类方法研究[J];计算机研究与发展;2007年01期
7 李宇峰;黄圣君;周志华;;一种基于正则化的半监督多标记学习方法[J];计算机研究与发展;2012年06期
8 单松巍,冯是聪,李晓明;几种典型特征选取方法在中文网页分类上的效果比较[J];计算机工程与应用;2003年22期
9 王天江;孔华武;;一种基于定性推理的网页分类方法[J];计算机工程与应用;2007年09期
10 宋军涛;周铜;杜庆灵;;支持向量机和蚁群算法的网页分类研究[J];计算机工程与应用;2009年17期
【共引文献】
中国期刊全文数据库 前10条
1 高博;朱东华;韩士雄;;一种智能化的信息采集系统的研究与实现[J];兵工学报;2009年S1期
2 李玉擰;周兰珍;操卫平;;基于DF和CHI的联合特征提取方法及其应用[J];北京工业大学学报;2008年09期
3 付雪峰;刘邱云;;不确定性推理在文本分类上的应用研究[J];江西师范大学学报(自然科学版);2007年04期
4 胡迪;陈运;杨义先;陈悦;;基于支持向量机与余弦夹角法的中文网页过滤的研究与设计[J];成都信息工程学院学报;2011年05期
5 高波,眭莉;基于粗糙集的网页训练样本集的分类属性的选择[J];常州工学院学报;2004年02期
6 陈子军;王鑫昱;;基于网页特征的会话识别方法[J];燕山大学学报;2008年01期
7 丁志勇;杨苹;杨曦;张臻;;基于连续时间段聚类的支持向量机风电功率预测方法[J];电力系统自动化;2012年14期
8 江祥奎,原思聪;中文网页分类中的网页特征提取方法[J];电脑开发与应用;2005年10期
9 张东娜;刘博;;一个基于加权和组合降维的web文本分类系统[J];电脑知识与技术;2008年07期
10 朱坤红;邓蓉;;基于知识树的文本自动分类方法探索[J];电脑知识与技术;2010年22期
中国重要会议论文全文数据库 前5条
1 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
3 王世卫;李爱国;;报税欺诈检测研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年
4 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 程静;邱玉辉;;Web Mining中的网页分类[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国博士学位论文全文数据库 前10条
1 韩晓明;基于符号有向图和支持向量机的故障诊断方法的研究[D];太原理工大学;2011年
2 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
3 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
4 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
5 王飞;入侵检测分类器设计及其融合技术研究[D];南京理工大学;2011年
6 刘松华;核矩阵低秩分解与核空间信息能度量研究及应用[D];西安电子科技大学;2011年
7 刘笑嶂;核方法的若干关键问题研究及其在人脸图像分析中的应用[D];中山大学;2010年
8 杨旭;基于核方法的模式分类研究与应用[D];上海交通大学;2011年
9 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
10 吴涛;核函数的性质、方法及其在障碍检测中的应用[D];中国人民解放军国防科学技术大学;2003年
中国硕士学位论文全文数据库 前10条
1 张磊;基于支持向量机的反垃圾电话技术研究[D];哈尔滨工程大学;2010年
2 张峰;基于支持向量机的网站发布系统设计与实现[D];大连理工大学;2010年
3 徐晓丹;支持向量机在矿区遥感监测图像分类中的应用研究[D];辽宁工程技术大学;2009年
4 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
5 王林平;基于内容的电子邮件过滤系统的研究[D];电子科技大学;2010年
6 陶小波;电子就业文本挖掘系统关键技术研究与应用[D];浙江工商大学;2011年
7 石华;基于系统文件特征属性分析的计算机取证研究[D];大连交通大学;2010年
8 曹亚辉;非结构文本最佳近似匹配系统的研究与实现[D];东华大学;2011年
9 曹云生;基于支持向量机(SVM)的森林生态系统健康评价及预警[D];河北农业大学;2011年
10 许世明;中文网页分类技术研究及预分类算法实现[D];西安电子科技大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 宋军涛;杜庆灵;;基于改进蚁群算法和支持向量机的网页分类研究[J];电脑知识与技术;2009年35期
2 陈霖;宋燕辉;;数据挖掘技术在电信集团客户管理系统中的应用[J];电信快报;2008年03期
3 张葛祥,李娜,金炜东,胡来招;一种新量子遗传算法及其应用[J];电子学报;2004年03期
4 邢焕来;潘炜;邹喜华;;一种解决组合优化问题的改进型量子遗传算法[J];电子学报;2007年10期
5 刘禹;李德毅;张光卫;陈桂生;;云模型雾化特性及在进化算法中的应用[J];电子学报;2009年08期
6 张启蕊;董守斌;张凌;;文本分类的性能评估指标[J];广西师范大学学报(自然科学版);2007年02期
7 李晓黎,史忠植;用数据采掘方法获取汉语词性标注规则[J];计算机研究与发展;2000年12期
8 袁家政;须德;鲍泓;;基于结构与文本关键词相关度的XML网页分类研究[J];计算机研究与发展;2006年08期
9 孔祥南;黎铭;姜远;周志华;;一种针对弱标记的直推式多标记分类方法[J];计算机研究与发展;2010年08期
10 唐凯;;基于内容和分层结构的XML文件自动分类方法[J];计算机工程与应用;2007年03期
中国博士学位论文全文数据库 前1条
1 于澝;基于一维SOM神经网络的聚类及数据分析方法研究[D];天津大学;2009年
中国硕士学位论文全文数据库 前4条
1 沈抖;万维网上数据处理方法的研究[D];清华大学;2004年
2 任函;大规模中文网页的自动分类研究[D];华中师范大学;2006年
3 董静;中文网页形式自动分类[D];大连理工大学;2006年
4 李跃光;量子蚁群算法的研究及应用[D];兰州理工大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 高波,张忠能,查志琴;基于文字链接比的网页分类的研究[J];计算机工程与应用;2004年27期
2 鲁明羽;沈抖;郭崇慧;陆玉昌;;面向网页分类的网页摘要方法[J];电子学报;2006年08期
3 张茂元;邹春燕;卢正鼎;;一种基于变调整学习规则的模糊网页分类方法研究[J];计算机研究与发展;2007年01期
4 刘蓉;周建中;;一种网页分类中基于图的半指导学习算法[J];计算机应用研究;2008年03期
5 肖靖;唐宁九;;网络监控系统中的实用网页分类技术[J];软件导刊;2009年01期
6 刘思含;贾美娟;;树匹配算法在网页分类中的应用[J];电脑学习;2010年04期
7 薛永大;;网页分类技术研究综述[J];电脑知识与技术;2012年25期
8 黄科,马少平;基于统计分词的中文网页分类[J];中文信息学报;2002年06期
9 孙建涛,沈抖,陆玉昌,石纯一;网页分类技术[J];清华大学学报(自然科学版);2004年01期
10 程传鹏;;中文网页分类的研究与实现[J];中原工学院学报;2007年01期
中国重要会议论文全文数据库 前7条
1 李立宇;唐世渭;杨冬青;叶恒强;王腾蛟;;COMMIX-Classifier—自动网页分类系统[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 万中英;王明文;廖海波;左家莉;;维数约简在网页分类中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 彭涛;左万利;赫枫龄;张长利;;基于粒子群优化算法的网页分类技术[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
4 刘艳民;;中文网页分类方法的研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
5 张迪;郑德权;赵铁军;于浩;;Blog网页分类与识别技术研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
6 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
7 米晓芳;秦洋;王立宏;宋宜斌;;基于潜在语义差异的医学网页分类[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国硕士学位论文全文数据库 前10条
1 王晶;面向通信管理的电子政务系统及其网页分类的研究与实现[D];上海交通大学;2009年
2 韩培培;网页分类及存储查询系统的设计及实现[D];燕山大学;2010年
3 张祥;一个网页分类系统的研究与实现[D];北京邮电大学;2013年
4 伍菲;面向主题型的网页分类技术的研究与实现[D];华中科技大学;2011年
5 段昕;基于视觉特征中文网页分类方法的研究[D];山东大学;2007年
6 汪雷;基于文本挖掘的网页分类系统研究与实现[D];武汉理工大学;2013年
7 许世明;中文网页分类技术研究及预分类算法实现[D];西安电子科技大学;2009年
8 刘康炜;基于支持向量机的网页分类技术研究[D];中国石油大学;2009年
9 吴成刚;基于半监督的支持向量机网页分类方法[D];中国石油大学;2010年
10 于成龙;中文网页分类及存储系统设计与实现[D];哈尔滨工业大学;2007年
,本文编号:846702
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/846702.html