比较购物搜索引擎的研究与应用
发布时间:2021-01-15 17:32
在网上购物领域,随着电子商务网站的服务商数量和产品数量的迅速增加,广大消费者面临着更多的困惑:在如此众多的商品中,如何才能找到适合自己需要的网站和物品呢?哪儿的商品更便宜?如何获得性价比最高的商品和服务?这些问题都让用户感到茫然。比较购物是一种采取信息获取技术开发的购物代理软件。这种软件通过收集众多的网上商家信息,对各种商品的价格、性能、配送方式以及服务等进行比较,向用户提供不同在线销售商的商品信息。因此是一个省时省力又省钱的购物途径,得到了大多数电子商务用户的好评。本文主要研究网页数据的抓取和解析,网页数据的抓取是由网络蜘蛛Spider完成的,而网页数据的解析是指从抓取到的网页中提取出结构化的信息。在网页数据抓取部分,本文对通用搜索引擎中的Spider抓取网页数据的一般传统框架进行了改进,根据专业搜索引擎的特点,提出了一种优化的网页数据抓取框架,即在Spider抓取URL链接时,增加了“URL提取干预”,从而提高了专业搜索引擎抓取网页数据的效率。在网页数据解析部分,本文实现了一个扩展性良好的WEB信息抽取模块。为了解决网页数据的抓取和数据处理之间的速度矛盾,本文设计了一种生产者-消费...
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 选题背景
1.2 国内外的研究现状
1.2.1 电子商务
1.2.2 专业搜索引擎
1.2.3 WEB信息抽取
1.2.4 比较购物
1.3 本文的主要工作
1.4 论文的组织结构
第2章 搜索引擎的相关理论与关键技术
2.1 搜索引擎分类
2.1.1 按搜索引擎的工作方式分类
2.1.2 按搜索引擎信息覆盖的领域和范围分类
2.2 搜索引擎的一般结构
2.3 网络蜘蛛简介
2.4 基于网页结构分析的WEB信息抽取技术
2.5 SPIDER抓取网页数据的一般框架及改进
2.6 生产者-消费者模型
2.6.1 网页数据缓存机制分析
2.6.2 生产者-消费者模型
第3章 比较购物搜索引擎的概要设计
3.1 功能分析
3.2 电子购物网站的特点分析
3.3 基本数据结构设计
3.3.1 缓存表
buf"> 3.3.2 pagebuf
3.3.3 list free
busy"> 3.3.4 listbusy
3.3.5 这些基本数据结构之间的联系
3.3.6 其他的数据结构设计
3.4 比较购物搜索引擎原型的数据流图
3.4.1 顶层数据流图
3.4.2 零层数据流图
3.4.3 一层数据流图
3.5 较购物搜索引擎原型的数据库设计
第4章 比较购物搜索引擎的详细设计和实现
4.1 总体流程图
4.2 初始化缓存表
4.3 连接数据库
4.4 数据更新
4.4.1 WEB信息抽取模块算法描述
4.4.2 生产者模块
4.4.3 消费者模块
4.5 前台设计
第5章 总结与展望
5.1 回顾和总结
5.2 工作的展望
参考文献
致谢
攻读硕士学位期间参加科研项目情况
【参考文献】:
期刊论文
[1]比较购物,Google做不到[J]. 刘春辉. 中国电子商务. 2008(05)
[2]搜索引擎综合分析[J]. 方志坚,张瑞林,童小素. 计算机工程与设计. 2007(16)
[3]我国比较购物模式发展面临的问题及对策研究[J]. 田真平. 商场现代化. 2006(29)
[4]比较购物现状之研究[J]. 王煜,王光明. 计算机时代. 2005(08)
[5]基于遗传算法的搜索引擎调度[J]. 张卫丰,徐宝文,周晓宇,管宇,许蕾. 微电子学与计算机. 2001(04)
硕士论文
[1]主题搜索引擎的关键技术研究与实现[D]. 孙轩.武汉理工大学 2010
[2]垂直搜索引擎数据分析技术的研究与实现[D]. 江娟.华北电力大学(北京) 2008
[3]新闻垂直搜索引擎的设计[D]. 文斌.华中科技大学 2007
[4]垂直搜索中自动信息抽取关键技术的研究与实践[D]. 陈意.浙江大学 2008
[5]Internet智能比较购物的研究与实现[D]. 王煜.浙江工商大学 2006
本文编号:2979225
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 选题背景
1.2 国内外的研究现状
1.2.1 电子商务
1.2.2 专业搜索引擎
1.2.3 WEB信息抽取
1.2.4 比较购物
1.3 本文的主要工作
1.4 论文的组织结构
第2章 搜索引擎的相关理论与关键技术
2.1 搜索引擎分类
2.1.1 按搜索引擎的工作方式分类
2.1.2 按搜索引擎信息覆盖的领域和范围分类
2.2 搜索引擎的一般结构
2.3 网络蜘蛛简介
2.4 基于网页结构分析的WEB信息抽取技术
2.5 SPIDER抓取网页数据的一般框架及改进
2.6 生产者-消费者模型
2.6.1 网页数据缓存机制分析
2.6.2 生产者-消费者模型
第3章 比较购物搜索引擎的概要设计
3.1 功能分析
3.2 电子购物网站的特点分析
3.3 基本数据结构设计
3.3.1 缓存表
buf"> 3.3.2 pagebuf
3.3.3 list free
busy"> 3.3.4 listbusy
3.3.5 这些基本数据结构之间的联系
3.3.6 其他的数据结构设计
3.4 比较购物搜索引擎原型的数据流图
3.4.1 顶层数据流图
3.4.2 零层数据流图
3.4.3 一层数据流图
3.5 较购物搜索引擎原型的数据库设计
第4章 比较购物搜索引擎的详细设计和实现
4.1 总体流程图
4.2 初始化缓存表
4.3 连接数据库
4.4 数据更新
4.4.1 WEB信息抽取模块算法描述
4.4.2 生产者模块
4.4.3 消费者模块
4.5 前台设计
第5章 总结与展望
5.1 回顾和总结
5.2 工作的展望
参考文献
致谢
攻读硕士学位期间参加科研项目情况
【参考文献】:
期刊论文
[1]比较购物,Google做不到[J]. 刘春辉. 中国电子商务. 2008(05)
[2]搜索引擎综合分析[J]. 方志坚,张瑞林,童小素. 计算机工程与设计. 2007(16)
[3]我国比较购物模式发展面临的问题及对策研究[J]. 田真平. 商场现代化. 2006(29)
[4]比较购物现状之研究[J]. 王煜,王光明. 计算机时代. 2005(08)
[5]基于遗传算法的搜索引擎调度[J]. 张卫丰,徐宝文,周晓宇,管宇,许蕾. 微电子学与计算机. 2001(04)
硕士论文
[1]主题搜索引擎的关键技术研究与实现[D]. 孙轩.武汉理工大学 2010
[2]垂直搜索引擎数据分析技术的研究与实现[D]. 江娟.华北电力大学(北京) 2008
[3]新闻垂直搜索引擎的设计[D]. 文斌.华中科技大学 2007
[4]垂直搜索中自动信息抽取关键技术的研究与实践[D]. 陈意.浙江大学 2008
[5]Internet智能比较购物的研究与实现[D]. 王煜.浙江工商大学 2006
本文编号:2979225
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2979225.html