基于运营商管道大数据的智能电商推荐系统
发布时间:2020-03-18 22:03
【摘要】:随着现代互联网技术的飞速发展和不断完善,以及家庭固定宽带越来越高的稳定性和越来越快的网络速度,越来越多的用户通过各种电子终端(电脑、平板、电视盒子,尤其是移动手机)接入家庭固定宽带来获得各种丰富的互联网内容。基于互联网技术、信息网络技术等基础之上的电子商务展现出了巨大的发展潜力,尤其是网络购物受到了极大用户的青睐。而当下正是大数据飞速发展的时候,通过收集累积家庭固定宽带下用户的电子商务平台上的网络购物数据和行为,对未来电子商务平台企业的用户挖掘、广告投放、商品推荐等方面提供巨大的数据支持,也为未来大数据发展提供了长远的开发和利用价值。运营商在拥有相较于其他电子商务平台更完整的用户网络购物流量的独特优势的基础之上,对家庭宽带用户进行网络购物更精准的个性化推荐,不但为运营商提供流量变现的可靠方式,更为家庭宽带用户提供高质量的大数据服务,在电子商务领域中是具有十分深远的意义与价值。据此,本文提出了一种基于运营商管道大数据的智能电商推荐系统。由于大多数电商网站不是全网加密,本文推荐系统采用DPI技术对非加密数据包进行数据采集,感知用户身份信息和用户行为,即可描绘家庭画像。同时,推荐系统通过预先建立的统一标签融合信息库对用户行为进行标签提取。最终,推荐系统通过混合推荐算法针对用户提取的标签进行用户兴趣的预测。针对此推荐系统,本文的主要创新如下:1、利用特征关键字自动提取技术挖掘HTTP数据包内容的关键字集合,通过大数据平台进行清洗去噪以提升关键字集合的准确度,取代传统的人工肉眼挖掘关键字的方式。2、基于改进的TF-IDF算法计算词条相关度,利用词条相关度所组成的特征向量进行K-means聚类,依据向量间余弦相似度融合各电商近义标签形成统一标签库。3、根据用户的以往兴趣商品以及提取的得到商品分类,利用加权融合基于改进SVD的协同过滤算法和引入用户兴趣热度因子、日期热门度因子的改进梯度提升预测算法为用户产生推荐。
【图文】:
Hyperscan 以自动机理论为基础,其工作流程主要分成两个部分:编译期(compile-time)和运行期(run-time)。Hyperscan 自带 C++编写的正则表达式编译器。如图 2.1 所示,它将正则表达式作为输入,,
图 2.1 Hyperscan 编译流程Hyperscan 的运行期是通过 C 语言来开发的。图 2.2 展示了 Hyperscan 在运行期的主要。用户需要预先分配一段内存来存储临时匹配状态信息,之后利用编译生成的数据库调yperscan 内部的匹配引擎(NFA, DFA 等)来对输入进行模式匹配。Hyperscan 在引擎中使tel 处理器所具有的 SIMD 指令进行加速。同时,用户可以通过回调函数来自定义匹配发采取的行为。由于生成的数据库是只读的,用户可以在多个 CPU 核或多线程场景下共享库来提升匹配扩展性。
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.3
本文编号:2589250
【图文】:
Hyperscan 以自动机理论为基础,其工作流程主要分成两个部分:编译期(compile-time)和运行期(run-time)。Hyperscan 自带 C++编写的正则表达式编译器。如图 2.1 所示,它将正则表达式作为输入,,
图 2.1 Hyperscan 编译流程Hyperscan 的运行期是通过 C 语言来开发的。图 2.2 展示了 Hyperscan 在运行期的主要。用户需要预先分配一段内存来存储临时匹配状态信息,之后利用编译生成的数据库调yperscan 内部的匹配引擎(NFA, DFA 等)来对输入进行模式匹配。Hyperscan 在引擎中使tel 处理器所具有的 SIMD 指令进行加速。同时,用户可以通过回调函数来自定义匹配发采取的行为。由于生成的数据库是只读的,用户可以在多个 CPU 核或多线程场景下共享库来提升匹配扩展性。
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.3
【参考文献】
相关期刊论文 前2条
1 陈晓天;陈望都;王攀;张顺颐;;基于用户行为分析的移动互联网流量经营研究[J];电信快报;2013年04期
2 王亚;;分析Libpcap-mmap机制改进之处[J];数字技术与应用;2012年04期
本文编号:2589250
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/2589250.html