CBC算法在网页分类中的应用研究
[Abstract]:In view of the existing problems in web page classification, this paper chooses the method of synonym clustering, applies CBC algorithm to web page clustering, and adds search terms as the main reference data. The CBC algorithm is improved by adding limited parameters to the clustering algorithm. The results of the improved CBC algorithm and the traditional k-means algorithm are compared with the data set experiment. The results show that the improved algorithm is superior to the traditional k-means algorithm in accuracy and efficiency.
【作者单位】: 北京化工大学信息科学与技术学院;
【分类号】:TP393.092
【参考文献】
相关期刊论文 前2条
1 陈建超;胡桂武;杨志华;严桂夺;;基于全局性确定聚类中心的文本聚类[J];计算机工程与应用;2011年10期
2 孔继利;顾傜;孙欣;冯爱兰;;系统聚类和重心法在多节点配送中心选址中的研究[J];物流技术;2010年05期
相关博士学位论文 前1条
1 于澝;基于一维SOM神经网络的聚类及数据分析方法研究[D];天津大学;2009年
【共引文献】
相关期刊论文 前10条
1 李小平;任恩恩;;异构数据库相似语义属性聚类过程研究[J];铁道科学与工程学报;2012年02期
2 张彩庆;赵璐;谢萍;;电网检修公司分部选址模型及算法研究[J];工业工程;2013年03期
3 王邑;肖明清;周越文;;面向自主保障的航空电子设备在线测试系统[J];计算机测量与控制;2012年01期
4 孔继利;冯爱兰;马立坤;龚艳茹;;企业物流管理优秀课程的教学内容与方法研究[J];物流工程与管理;2011年10期
5 余伟;马健霄;薛亮;;基于改进重心法的甩挂场站选址研究[J];森林工程;2012年01期
6 孔继利;贾智;;基于模糊聚类的最大树算法和重心法的区域航空中转站选址研究[J];物流技术;2011年17期
7 刘满芝;马燕燕;王兆密;;基于空间聚类方法的煤炭应急储备布局研究[J];中国煤炭;2012年09期
8 赵培忻;张存铨;赵炳新;;基于新型图论聚类法的物流系统多设施选址策略研究[J];中国管理科学;2012年06期
9 李洪磊;董亮;;基于遗传算法的改进多重心选址方法[J];现代商贸工业;2013年04期
10 杨震;王成军;郭梨;;巨灾救援链系统中的灾区聚类与排序问题研究——以汶川地震为例[J];灾害学;2013年04期
相关博士学位论文 前3条
1 刘满芝;国家煤炭应急储备规模和布局研究[D];中国矿业大学;2012年
2 彭菲菲;网络热点话题发现的关键技术研究[D];中国矿业大学(北京);2012年
3 徐兴;无标度供应网格簇及其在汽车产业中应用研究[D];浙江理工大学;2013年
相关硕士学位论文 前9条
1 张大圣;琳克橱柜配送中心选址研究[D];南京理工大学;2010年
2 刘庆杰;数控机床加工精度评估技术研究[D];西南交通大学;2012年
3 宗国庆;A公司全球战略中制造中心项目选址的影响因素研究[D];苏州大学;2012年
4 吴新丽;无标度供应网格簇及其管理系统开发与应用[D];浙江理工大学;2012年
5 夏江雪;城市家具物流配送中心布局研究[D];中南林业科技大学;2012年
6 张婕;聚类算法在网页分类中的应用研究[D];北京化工大学;2013年
7 任园园;X公司配送节点选址问题研究[D];北京交通大学;2013年
8 王慧娟;景芝酒业在胶东半岛的配送中心选址研究[D];中国海洋大学;2013年
9 王涛;连锁超市冷鲜肉供应链配送中心选址分析与配送策略优化[D];山东农业大学;2013年
【二级参考文献】
相关期刊论文 前10条
1 赵艳厂,谢帆,宋俊德;一种新的聚类算法:等密度线算法[J];北京邮电大学学报;2002年02期
2 叶茂,陈勇;基于分布模型的层次聚类算法[J];电子科技大学学报;2004年02期
3 郑晓鸣;吕士颖;王晓东;;免疫接种粒子群的聚类算法[J];电子科技大学学报;2007年06期
4 曾翎;王美玲;陈华富;;遗传模糊C-均值聚类算法应用于MRI分割[J];电子科技大学学报;2008年04期
5 刘静,钟伟才,刘芳,焦李成;免疫进化聚类算法[J];电子学报;2001年S1期
6 陈金山,韦岗;遗传+模糊C-均值混合聚类算法[J];电子与信息学报;2002年02期
7 王莉,王正欧;TGSOM:一种用于数据聚类的动态自组织映射神经网络[J];电子与信息学报;2003年03期
8 吴艳;刘重阳;廖桂生;;一种新的像素级多聚焦图像融合算法[J];电子与信息学报;2007年12期
9 赵霞;王佳;孔涛;张伟;王燕华;潘国运;;SOM人工神经网络与阻抗谱方法结合研究涂层的失效过程[J];腐蚀科学与防护技术;2008年04期
10 李强利;杨茂盛;;改进的重心法在多节点物流配送中心选址中的应用[J];消费导刊;2009年17期
【相似文献】
相关期刊论文 前10条
1 童亚拉;;结合链接结构聚类的混沌粒子群网页分类规则抽取[J];华中师范大学学报(自然科学版);2008年04期
2 李明杰;;特征抽取方法在网页分类中的应用[J];常熟理工学院学报;2005年04期
3 齐宏卓;;浅谈网页模糊归类的应用[J];价值工程;2010年27期
4 王立建;尹四清;;基于Web页面有效信息抽取的分类方法[J];电脑开发与应用;2010年06期
5 韩培培;付博;;基于有限状态机的URL解析[J];微处理机;2010年05期
6 高波,张忠能,查志琴;基于文字链接比的网页分类的研究[J];计算机工程与应用;2004年27期
7 程传鹏;李钜;;中文网页分类中特征提取的研究[J];中原工学院学报;2005年06期
8 刘丽珍;贺海军;陆玉昌;宋瀚涛;;支持向量机在网页信息分类中的应用研究[J];小型微型计算机系统;2007年02期
9 陈笑筑;王东;陈笑蓉;;基于页面标签的网页分类研究[J];商场现代化;2009年19期
10 段昕;马军;宋玲;;利用分块重要度进行中文网页分类的研究[J];山东大学学报(理学版);2006年03期
相关会议论文 前10条
1 彭涛;左万利;赫枫龄;张长利;;基于粒子群优化算法的网页分类技术[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 刘建伟;于守健;乐嘉锦;;基于分裂-凝聚的Web新闻主题聚类算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 万中英;王明文;廖海波;左家莉;;维数约简在网页分类中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 张迪;郑德权;赵铁军;于浩;;Blog网页分类与识别技术研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
5 刘晓勇;;基于GA与SVM融合的网页分类算法[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
6 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
7 高学东;周磊;;Web点击流数据聚类算法[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
8 李剑;李俊;;改进的K-means聚类算法在入侵检测系统中的应用研究[A];2011年全国通信安全学术会议论文集[C];2011年
9 牟廉明;;基于均匀度和相对密度的网格聚类算法[A];第二届中国智能计算大会论文集[C];2008年
10 曹明;李剑;杨义先;;一种基于模糊连接聚类的入侵防御算法[A];全国网络与信息安全技术研讨会'2005论文集(上册)[C];2005年
相关重要报纸文章 前1条
1 陈洪强;管理网页好帮手[N];中国电脑教育报;2002年
相关博士学位论文 前10条
1 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
2 李志华;语义属性数据聚类/分类算法及其在异常检测中的应用研究[D];江南大学;2009年
3 窦伊男;根据多维特征的网络用户分类研究[D];北京邮电大学;2010年
4 刘雪飞;数据挖掘技术在入侵检测中的应用研究[D];南京理工大学;2005年
5 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
6 李丹;基于流聚类的网络业务识别关键技术研究[D];北京邮电大学;2013年
7 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
8 李东胜;基于兴趣与保护隐私的在线社区推荐技术研究[D];复旦大学;2012年
9 卓莹;基于拓扑·流量挖掘的网络态势感知技术研究[D];国防科学技术大学;2010年
10 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
相关硕士学位论文 前10条
1 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
2 王忠强;基于K-medoids聚类算法Web信息集成方法的研究与实现[D];沈阳建筑大学;2011年
3 买买提依明·哈斯木;基于后缀树的维吾尔文网页聚类算法的设计与实现[D];新疆大学;2011年
4 崔月婷;基于分类算法与聚类算法流量识别系统的研究[D];北京邮电大学;2010年
5 阳建平;聚类算法在入侵检测中的应用[D];电子科技大学;2009年
6 郑仁毅;基于数据挖掘技术的入侵检测系统研究与设计[D];厦门大学;2007年
7 田野;基于复杂网络聚类算法的互联网内容分发策略研究[D];吉林大学;2010年
8 赖立;聚类算法在IDS特征分析中的应用[D];电子科技大学;2007年
9 张甜;免疫原理和移动代理技术在网络故障诊断中的应用研究[D];电子科技大学;2008年
10 赵玉;聚类算法在中俄经贸合作网的应用[D];对外经济贸易大学;2007年
,本文编号:2430721
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2430721.html