Web站点层次结构抽取算法的分析和实现
本文选题:Web + 结构挖掘 ; 参考:《浙江大学学报(工学版)》2005年10期
【摘要】:为了提高搜索引擎、网站管理及推荐系统的运行效率,提出了一种重构网站层次结构的方法,该方法以人工智能及图论为基础,通过对标记信息、网站的目录信息以及链接信息等的分析,定义和建立了网站的数据模型:结构标记图,并采用最短路径算法(Dijkstral),完成Web站点的层次结构抽取.算法体系由5层构成:显示层、网站层、页面分析层、预处理层和连接层.实验结果证明该方法能正确地建立网站的层次结构,并具有较快的运行时间.
[Abstract]:In order to improve the efficiency of search engine, website management and recommendation system, a method of reconstructing website hierarchy is proposed. The method is based on artificial intelligence and graph theory. Based on the analysis of the directory information and the link information of the website, the paper defines and establishes the data model of the website: the structure marking graph, and uses the shortest path algorithm (Dijkstral) to extract the hierarchical structure of the Web site. The algorithm consists of five layers: display layer, website layer, page analysis layer, preprocessing layer and connection layer. The experimental results show that the method can correctly build the hierarchical structure of the website and has a faster running time.
【作者单位】: 浙江大学计算机学院 浙江大学计算机学院
【分类号】:TP393.092;
【相似文献】
相关期刊论文 前10条
1 赵刚;建设邮电部北京设计院的Intranet网络[J];电信工程技术与标准化;1997年03期
2 莫继红;构造企业Intranet模式[J];电脑与信息技术;1997年03期
3 潘启澍,邓凯,刘国安,姜兵;基于WEB技术的决策支持系统(WBDSS)的新框架结构研究[J];哈尔滨工业大学学报;1998年06期
4 袁道华;基于Web的事务处理和信息系统构建[J];计算机工程与应用;1998年04期
5 罗娟,方锐,朱秋萍;Web与数据库技术[J];计算机工程;1998年08期
6 潘善亮,董金祥;一个基于Web的信息系统设计及实现[J];计算机应用;1998年12期
7 徐东晖,蔡希尧;扩展ISAPI支持基于Web应用系统的开发[J];西安电子科技大学学报;1998年05期
8 罗辉;Web商业系统的设计与实现[J];电脑与信息技术;1998年01期
9 张正霞,汪厚祥;虚拟现实建模语言(VRML)的概况与展望[J];工程图学学报;1998年02期
10 姚明焰;构造一个实用经济的企业内部网[J];计算机辅助工程;1998年03期
相关会议论文 前10条
1 陈智健;肖庆文;沈达阳;林作铨;;Agent技术在Web与数据库集成中的应用[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
2 周庆根;;煤矿经营管理信息系统的规划设计[A];第十届全国煤矿自动化学术年会论文集[C];2000年
3 卢正才;高勤;;ASP技术在现代管理信息系统中的应用[A];2000中国控制与决策学术年会论文集[C];2000年
4 刘人杰;夏志忠;柳晓鸣;王俊;;WEB技术与VTS信息网络的集成[A];全国飞机与船舶通信导航学术研讨会论文集(下)[C];2000年
5 叶良;左广斌;;基于WEB的值班查询系统[A];第十一届全国煤矿自动化学术年会论文集[C];2001年
6 杨晋辉;粟君;王辉;钱建生;高建民;张超;陈志平;;煤炭企业网络办公自动化系统[A];第十一届全国煤矿自动化学术年会论文集[C];2001年
7 凌祥;孙宙;邹群彩;涂善东;;基于Internet/Web的板翅式换热器报价系统的研究[A];第五届全国压力容器学术会议论文集[C];2001年
8 李宇中;;广西"十五"气象信息网络系统业务建设和管理[A];2002年广西气象电子专业技术交流会论文集[C];2002年
9 叶良;刘富强;邓戈;赵忠;;基于WEB的数字视频监控系统开发[A];第十二届全国煤矿自动化学术年会论文集[C];2002年
10 黄兴;顾军;李靖;王献伟;吴致真;杨润全;戴磊;;基于Web的安全生产信息采集系统的设计[A];第十二届全国煤矿自动化学术年会论文集[C];2002年
相关重要报纸文章 前10条
1 记者 伏男;摩托罗拉全球推介企业新形象[N];天津工商报;2000年
2 谢晓华 谢小林;电子商务呼唤数字企业和网络财务[N];中国财经报;2000年
3 本报记者 琪儿;拉斯维加斯永不谢幕[N];中国电子报;2000年
4 佳师;志杰结盟WebMethods[N];中国电子报;2000年
5 记者 吴茂林;电子商务迎来“黎明”[N];财经时报;2000年
6 田娜;财经网站:中国互联网的先锋[N];财经时报;2000年
7 贾鹤鹏;美国人圣诞猛花钱[N];中国旅游报;2000年
8 王璐;自学英语如何选择和使用词典(未完待续)[N];中国成人教育信息报;2000年
9 王府;赴美留学奖学金申请技巧指南[N];中国成人教育信息报;2000年
10 李正;GoTrade.com的在线证券服务[N];中国证券报;2000年
相关博士学位论文 前5条
1 李向阳;水文模型参数优选及不确定性分析方法研究[D];大连理工大学;2006年
2 张圃;数字化颌面骨整形重建外科的初步研究[D];中国人民解放军军医进修学院;2004年
3 李光荣;面向虚拟企业的零件工艺信息系统关键技术研究[D];南京理工大学;2005年
4 张大江;基于Web的Intranet服务管理及访问控制的研究[D];中国科学院研究生院(计算技术研究所);2000年
5 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
相关硕士学位论文 前10条
1 崔成磊;基于Web、J2EE技术的工作流系统[D];电子科技大学;2005年
2 杨自勇;基于Web的机舱监测系统研究[D];大连海事大学;2005年
3 陈爱平;基于Web的故障诊断系统的软件技术研究[D];武汉科技大学;2005年
4 李遇贤;基于Web的人力资源招聘管理系统的研究和实现[D];昆明理工大学;2005年
5 郭建昌;嵌入式Web研究[D];哈尔滨工程大学;2005年
6 汤彦近;基于Web的注塑模报价系统研究[D];江苏大学;2005年
7 赵京;基于Web的化工塔设备CAD系统的研究[D];四川大学;2005年
8 周晔;一种增量式并行Web信息采集系统[D];暨南大学;2005年
9 陈少云;基于Web的高职学院教务管理系统的设计与实现[D];四川大学;2005年
10 于洪雷;基于Web的工艺知识管理系统研究与开发[D];大连交通大学;2005年
,本文编号:2052353
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2052353.html