web超链分析应用研究
发布时间:2024-12-11 05:39
随着互联网的不断发展,网络已成为人们发布和获取信息的主要平台。由于互联网是一个高速增长、完全不受控制的异构信息集合,因而无论是web信息资源的利用,还是web拓扑建模,经典的信息挖掘技术和数据建模方法都很难得到有效应用,而超链分析的引入和应用为这些问题的解决提供了一条崭新的思路。本论文在对超链分析思想进行初步分析的基础上,着重就超链分析在web信息资源检索、web资源发现以及web拓扑结构建模等方面的应用进行了详细的研究。 由于超链接关系和引文关系在形式和功能上极其相似,因而引文分析的方法和思路被广泛应用于超链分析之中,但互联网动态、异构分布、无序增长等特点使得超链分析所需解决的问题更为复杂。因而,超链分析方法不仅仅只是简单的从算法上进行实现,还需要融合社会网络分析方法、复杂系统理论以及拓扑建模等技术,系统地对web超链接结构和web信息实体行为之间的关系进行研究。 对于一个特定的信息检索系统,影响检索效率的因素主要是系统对特定信息的覆盖率和对信息相关性判定的准确性。而在web环境下,信息检索的主要问题已不是覆盖率,而是如何能够滤出与查...
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
本文编号:4016273
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
图5小世界网络模型
其总节点数N可以很大),其中左图为规则网络,右图为随机网是一个典型的小世界网络,是在左图的规则网络基础上通过边的重连得每一条边的重连概率为p,当p二o时,为规则网络,p二1时为随机网络。
图6小世界网络特征
图5小世界网络模型s模型的聚集系数C(P)和平均最短距离LP()都是概率p的函数,规的聚集系数为C(0),平均最短距离为L(o)。实验发现,如果p值很小,则网络的局部特性就会保留,聚集系数不会发生明显的改变,C(P)一C同时平均最短距离的值下降的很快L(P)<<L(0),具有了随....
本文编号:4016273
本文链接:https://www.wllwen.com/tushudanganlunwen/4016273.html