基于广播/通信混合架构的高效数据分发技术研究
发布时间:2021-06-09 02:39
随着互联网的飞速发展,流媒体业务逐渐占据主流,据思科预测,到2021年,流媒体业务将占据80%90%的互联网流量。流媒体数据量大,且对实时性要求较高。然而,无线网络带宽资源有限,且无线信道的物理特点决定其带宽稳定性差。因此,在无线条件下实现流媒体内容的高效分发面临巨大挑战。目前,通常采用两种方式实现高效分发。一是利用广播技术将有共性需求的热门内容进行分发,以此节约带宽资源。二是在网络边缘部署缓存,由此产生内容分发网络(Content Delivery Network,CDN)和对等网络(Peer-to-Peer,P2P)。CDN利用请求重定向、负载均衡等技术减轻骨干网的流量压力。P2P通过分布式架构高效利用终端单元的计算、存储资源。近年来,自媒体业务逐渐兴起。在常见的自媒体平台上,用户可以不受限制的上传音视频,使得网络上传输的流媒体规模呈现爆发式增长。同时,自媒体平台用户参与度高、交互性强,一些话题性内容在短时间内得以吸引大量关注成为热门新闻,进一步加重了网络的流量负载,使得有限的无线带宽资源和日益增长的流媒体业务规模之间的矛盾日益凸显。本文针对高效分发的常见两种...
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:105 页
【学位级别】:硕士
【部分图文】:
论文架构
图 2-1 前 100 名新闻及其访问数目Fig.2-1 Illustration of top 100 news and their request numbers由图 2-1 可见,阅读量较高的新闻主要集中在排名前 10 位的新闻。其中,排名第一的新闻平均有 13007818 的访问量。随着排名数的增加,访问数目迅速降低,排名第 32 位的新闻访问数目已经低至 9327,二者之间相差 1394 倍。因此,在用户访问模式模型选择上,需要一种能够刻画较大值主要集中于少部分数据特点的模型。2.1.2 齐普夫模型由文献[42]-[45]可知,大规模用户对大量互联网数据的访问请求与信息排名间服从齐普夫(Zipf)分布。Zipf 定律由哈佛大学语言学专家 Zipf 在 1935 年提出[46]。通过将《哈姆雷特》中英文词语逐个计数,并按将序排列,他发现英文单词的出现频率和其排名的常数次幂成反比[47],用公式表示为:p ( r )Cr (2-1)
在公式 2-1 中,1NrC r ,N 为排名总数, 为偏斜因子,决定出现的不均匀程度。 越大,不同排名的单词出现概率差异越大。由 Zipf 定律可英文单词中,只有极少数的单词经常出现,而大多数单词出现频率较低。在单词分布中, 取值约为 1。故由公式 2-1 可知,排名第二的单词出现的频率名第一的单词出现频率的12,排名第三的单词出现的频率是排名第一的单词频率的13。以 Brown 语料库为例,最常见的单词 the 在 100 万单词中出现 69,频率约为 7%。第二常见的单词 of 出现 36411 次,频率约为 3.5%。统计整料库可以发现,仅 135 个单词出现的总数就超过了所有词汇的一半[48]。对式 2-1 两边同时取对数可知:ln( p ( r )) ln C lnr(2-亦即 Zipf 分布在双对数坐标下呈现为斜率为负的一条直线,这也是判断 布的依据。其中,直线的斜率为偏斜因子。图 2-2 在双对数坐标系下展示了 布的概率密度:
本文编号:3219744
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:105 页
【学位级别】:硕士
【部分图文】:
论文架构
图 2-1 前 100 名新闻及其访问数目Fig.2-1 Illustration of top 100 news and their request numbers由图 2-1 可见,阅读量较高的新闻主要集中在排名前 10 位的新闻。其中,排名第一的新闻平均有 13007818 的访问量。随着排名数的增加,访问数目迅速降低,排名第 32 位的新闻访问数目已经低至 9327,二者之间相差 1394 倍。因此,在用户访问模式模型选择上,需要一种能够刻画较大值主要集中于少部分数据特点的模型。2.1.2 齐普夫模型由文献[42]-[45]可知,大规模用户对大量互联网数据的访问请求与信息排名间服从齐普夫(Zipf)分布。Zipf 定律由哈佛大学语言学专家 Zipf 在 1935 年提出[46]。通过将《哈姆雷特》中英文词语逐个计数,并按将序排列,他发现英文单词的出现频率和其排名的常数次幂成反比[47],用公式表示为:p ( r )Cr (2-1)
在公式 2-1 中,1NrC r ,N 为排名总数, 为偏斜因子,决定出现的不均匀程度。 越大,不同排名的单词出现概率差异越大。由 Zipf 定律可英文单词中,只有极少数的单词经常出现,而大多数单词出现频率较低。在单词分布中, 取值约为 1。故由公式 2-1 可知,排名第二的单词出现的频率名第一的单词出现频率的12,排名第三的单词出现的频率是排名第一的单词频率的13。以 Brown 语料库为例,最常见的单词 the 在 100 万单词中出现 69,频率约为 7%。第二常见的单词 of 出现 36411 次,频率约为 3.5%。统计整料库可以发现,仅 135 个单词出现的总数就超过了所有词汇的一半[48]。对式 2-1 两边同时取对数可知:ln( p ( r )) ln C lnr(2-亦即 Zipf 分布在双对数坐标下呈现为斜率为负的一条直线,这也是判断 布的依据。其中,直线的斜率为偏斜因子。图 2-2 在双对数坐标系下展示了 布的概率密度:
本文编号:3219744
本文链接:https://www.wllwen.com/kejilunwen/wltx/3219744.html