当前位置:主页 > 科技论文 > 信息工程论文 >

电子商务Web数据库不精确查询方法研究

发布时间:2016-07-07 11:00

  本文关键词:电子商务Web数据库不精确查询方法研究,,由笔耕文化传播整理发布。


《辽宁工程技术大学》 2010年

电子商务Web数据库不精确查询方法研究

李昕  

【摘要】: 近年来,随着World Wide Web的迅速膨胀,电子商务也随之得到迅速发展,以Web站点形式展示公司产品信息已成为电子商务交易的一个重要环节,这些Web站点通常由一个后台在线数据库支持,这些数据库称为电子商务Web数据库,电子商务Web数据库中的内容只能通过基于Web表单形式的查询接口来访问。目前,随着Internet的普遍应用和电子商务Web数据库所蕴含信息量的快速增长,访问电子商务Web数据库已成为大量普通用户获取商品信息的重要手段。 现有的电子商务Web数据库查询处理模式通常假定用户明确自己的查询意图并且仅支持严格查询匹配,但随着查询电子商务Web数据库的用户群从熟悉领域知识的专业人员逐渐扩展到需要即时满足的普通用户,这种精确查询处理模式已经不再适用于普通用户的查询习惯。这是因为,大量普通用户对电子商务Web数据库的结构和内容并不很了解,并且他们的查询意图本身可能就是模糊或不精确的,因此查询条件仅是他们查询意图的部分或近似描述,相应地,除了与查询要求完全匹配的查询结果之外,一些与查询要求相近的查询结果也可能是他们所需要的。在现有的电子商务Web数据库查询处理模式下,为获得更多与查询要求相近的信息,用户将不得不多次修改查询条件,直到获得满意的查询结果或丧失耐心放弃尝试为止。由此可见,对于那些希望不用手工多次调整查询条件就能从大规模电子商务Web数据库中一次性获取更多满足查询要求的大量普通用户来说,电子商务Web数据库不精确查询方法的研究具有非常重要的意义。 本文针对当前电子商务Web数据库查询中亟待解决的不精确查询问题进行了研究,从满足普通用户不精确查询需求的角度出发,按照不精确查询、不精确查询下的查询结果排序和查询结果top-k检索的研究顺序,提出一套行之有效的电子商务Web数据库不精确查询解决方案并给出具体的实现技术。本文的创新性研究成果主要有: (1)为了解决电子商务Web数据库不精确查询问题,提出了基于近似函数依赖的不精确查询方法。对于一个Web数据库关系表,基于一致集的概念导出最大集,生成最小平凡函数依赖集,从而找出属性之间的近似函数依赖关系,进而提出了属性权重评估方法,最不重要属性上的基本查询条件最先放松并且放松程度最大;基于关联规则思想,提出了文本型属性值之间的相似度评估方法;根据属性权重、属性值之间的相似度和松弛阈值,提出了查询松弛重写算法。实验结果表明,提出的属性权重评估和文本型值之间的相似度评估算法是合理、稳定的;用户调查结果表明,提出的查询松弛方法具有较高的召回率,能够有效地处理电子商务Web数据库查询中的不精确查询问题。 (2)为了解决由不精确查询导致的电子商务Web数据库多查询结果问题,提出了基于概率信息检索(Probability Information Retrieval, PIR)模型的不精确查询结果排序方法。该方法在原始数据和查询日志基础上,利用概率信息检索模型评估查询未指定的属性值与指定的属性值以及用户偏好之间关联关系,进而构建查询结果元组打分函数并以此对查询结果进行排序。实验结果表明,提出的排序方法能够较好地满足用户需求和偏好,从而提高了电子商务Web数据库不精确查询结果排序的有效性。 (3)针对查询结果排序算法执行效率的高效性要求,提出了基于阈值(Threshould Algorithm, TA)算法的top-k检索方法。该方法利用PIR模型构建对应于数据库中每个不同属性值的单调打分函数,在此基础上提出了基于TA算法的top-k检索解决方法,给出了相应的元组列表创建、聚类和top-k元组检索算法。实验结果表明,元组列表聚类算法能够准确发现聚类中心,top-k检索算法具有较高的准确性并且在很大程度上缩短了执行时间,从而提高了大规模数据环境下top-k查询结果的检索效率。

【关键词】:
【学位授予单位】:辽宁工程技术大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP311.13
【目录】:

  • 致谢4-5
  • 摘要5-7
  • Abstract7-14
  • 1 绪论14-27
  • 1.1 研究背景与动机14-17
  • 1.2 国内外相关研究的现状与分析17-23
  • 1.2.1 查询松弛技术的研究17-19
  • 1.2.2 查询结果排序技术的研究19-22
  • 1.2.3 Top-k 检索技术的研究22-23
  • 1.3 研究目标与意义23-24
  • 1.4 本文工作24-27
  • 1.4.1 研究内容24-25
  • 1.4.2 论文的组织结构25-27
  • 2 相关理论和技术27-40
  • 2.1 电子商务Web 数据库27-31
  • 2.1.1 电子商务Web 数据库定义27
  • 2.1.2 查询处理模式27-28
  • 2.1.3 查询接口28-30
  • 2.1.4 查询日志30-31
  • 2.2 关系数据模型31-34
  • 2.2.1 基本概念31-32
  • 2.2.2 函数依赖32-34
  • 2.2.3 多值依赖34
  • 2.3 相关算法和技术34-37
  • 2.3.1 关联规则挖掘算法35-37
  • 2.3.2 直方图技术37
  • 2.4 整体解决方案37-38
  • 2.5 测试数据集38-39
  • 2.6 本章小结39-40
  • 3 基于近似函数依赖关系的不精确查询方法40-69
  • 3.1 引言40-41
  • 3.2 不精确查询基本思想和定义41-42
  • 3.2.1 不精确查询基本思想41-42
  • 3.2.2 不精确查询及相关定义42
  • 3.3 近似函数依赖关系提取、属性松弛排序与重要程度评估42-56
  • 3.3.1 基本概念42-43
  • 3.3.2 近似函数依赖关系提取43-49
  • 3.3.3 求近似候选码49-54
  • 3.3.4 属性松弛顺序排序与重要程度分配54-56
  • 3.4 文本型属性值之间的相似度评估56-59
  • 3.5 查询松弛与结果排序59-61
  • 3.5.1 查询松弛重写59-61
  • 3.5.2 查询结果排序61
  • 3.6 性能实验分析61-68
  • 3.6.1 实验环境61-62
  • 3.6.2 属性松弛顺序排序算法性能测试62-64
  • 3.6.3 相似度评估算法鲁棒性测试64-65
  • 3.6.4 查询松弛和结果排序效果测试65-68
  • 3.7 本章小结68-69
  • 4 基于概率信息检索模型的查询结果排序方法69-87
  • 4.1 引言69-70
  • 4.2 概率信息检索模型70-71
  • 4.3 基于PIR 模型的结构化元组相关性评估71-74
  • 4.3.1 结构化数据下的PIR 模型71-72
  • 4.3.2 有限独立模型72
  • 4.3.3 消除独立性假设72-74
  • 4.4 不精确查询下的查询结果排序方法74-81
  • 4.4.1 相关性评估74-76
  • 4.4.2 特殊情形76-80
  • 4.4.3 实现方法80-81
  • 4.5 性能实验分析81-86
  • 4.5.1 实验环境81-82
  • 4.5.2 查询结果准确率测试82-84
  • 4.5.3 查询日志大小对排序准确率的影响测试84
  • 4.5.4 查询指定属性个数对排序准确率的影响测试84-85
  • 4.5.5 响应时间测试85-86
  • 4.6 本章小结86-87
  • 5 基于TA 算法的查询结果 TOP-K 检索方法87-108
  • 5.1 引言87-88
  • 5.2 Top-k 检索与 TA 算法88-90
  • 5.2.1 Top-k 检索88
  • 5.2.2 TA 算法88-90
  • 5.3 基于TA 算法的top-k 检索方法90-95
  • 5.3.1 相关性评估90-92
  • 5.3.2 解决方案92-95
  • 5.4 实现算法95-102
  • 5.4.1 元组列表创建95-96
  • 5.4.2 元组列表聚类96-98
  • 5.4.3 Top-k 检索98-101
  • 5.4.4 无关元组处理101-102
  • 5.5 性能实验分析102-107
  • 5.5.1 实验环境102
  • 5.5.2 元组列表聚类算法测试102-103
  • 5.5.3 检索到的top-k 个元组的准确性测试103-105
  • 5.5.4 Top-k 检索算法的性能测试105-107
  • 5.6 本章小结107-108
  • 6 结论108-112
  • 6.1 本文的主要贡献与结论108-109
  • 6.2 未来的工作109-112
  • 参考文献112-122
  • 作者简历122-124
  • 学位论文数据集124-125
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【引证文献】

    中国硕士学位论文全文数据库 前2条

    1 程绪琦;大学英语成绩分析系统设计与应用[D];北京工业大学;2012年

    2 于晓;Deep Web查询松弛和实体识别研究[D];辽宁大学;2012年

    【参考文献】

    中国期刊全文数据库 前5条

    1 张守志,施伯乐;一种发现函数依赖集的方法及应用[J];软件学报;2003年10期

    2 李昕;刘建辉;;一种电子商务信息安全保障机制[J];商场现代化;2007年05期

    3 李昕;刘建辉;;基于模糊综合评判的电子商务系统安全评估[J];计算机工程与设计;2009年17期

    4 李昕;孟祥福;刘玥;;基于WLAN的酒店餐饮管理系统的实现[J];微计算机信息;2007年06期

    5 李昕;张军;;基于嵌入式的温湿度模糊控制系统的实现[J];微计算机信息;2008年20期

    【共引文献】

    中国期刊全文数据库 前10条

    1 樊爱京,潘中强;基于.NET的学费管理系统的设计与实现[J];平顶山学院学报;2005年02期

    2 何永强,文颖;基于Web的求职招聘系统的设计与实现[J];平顶山学院学报;2005年05期

    3 孙泽军;孙亚南;;基于.NET的新闻管理系统[J];平顶山学院学报;2006年05期

    4 胡耀群;;校园网学生毕业设计(论文)题目选题系统的分析与设计[J];江西化工;2009年01期

    5 傅冬绵;医疗设备管理系统功能设计与开发[J];莆田高等专科学校学报;2001年04期

    6 苑文建;钟明耀;;基于B/S模式的网上销售系统设计[J];萍乡高等专科学校学报;2009年06期

    7 贺新闻;论管理信息系统中的关联与继承[J];攀枝花大学学报;2000年01期

    8 孙扬德,陈冬来,张于松,孙东华;建筑预(结)算系统的随机开发方法[J];情报科学;1994年06期

    9 顾潇华;郝杰;;关于数据库知识和信息组织知识两者关系的思考[J];情报科学;2006年07期

    10 王友彭 ,龙守谌;数据库字典法──实现多库系统的一种方法[J];情报理论与实践;1988年03期

    中国重要会议论文全文数据库 前10条

    1 兰彬;张燕;;数据库系统原理课程教学改革及思考[A];都市型高等农业教育教学改革论文专辑[C];2007年

    2 邓淑丹;江文浦;;幼儿园查询系统研究与实现[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年

    3 赵攀;田宜平;;基于GIS的城镇土地定级信息系统的数据库设计[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年

    4 赵会兵;李朝奎;;基于ASP.NET的CET考务管理系统[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年

    5 刘福江;吴信才;杨兆武;孙华山;郭艳;;黑龙江省矿产地WEBGIS系统的研究与设计[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年

    6 张红梅;欧歌;陈刚;卢宇;屈进禄;;HXMT科学运行中心数据平台建设[A];第十四届全国核电子学与核探测技术学术年会论文集(下册)[C];2008年

    7 麦华韬;;小灵通网络信令监测的探讨与实现[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年

    8 张红梅;欧歌;陈刚;卢宇;屈进禄;;HXMT科学运行中心数据平台建设[A];第十四届全国核电子学与核探测技术学术年会论文集(2)[C];2008年

    9 杨宁;;石油部门管理信息系统的设计与实现[A];四川省通信学会一九九五年学术年会论文集[C];1995年

    10 胡雪梅;;SYBASE数据库的自动管理[A];四川省通信学会2001年学术年会论文集[C];2001年

    中国硕士学位论文全文数据库 前10条

    1 曹磊;长江上游珍稀特有鱼类基础地理数据库的建立与应用[D];华中农业大学;2010年

    2 赵海峰;基于Epicentre的数据模型投影工具研究与应用[D];南昌航空大学;2010年

    3 宋洪俊;基于OPC的实时数据库接口设计与实现[D];山东科技大学;2010年

    4 姜春晖;基于UML的报刊销售管理系统的设计与实现[D];郑州大学;2010年

    5 王国宾;面向对象的公路空间数据库系统研究[D];郑州大学;2010年

    6 李文君;气垫船模拟器教练员系统开发研究[D];哈尔滨工程大学;2010年

    7 李伟光;基于BP神经网络的数据库模式匹配方法研究[D];哈尔滨工程大学;2010年

    8 赵萍;模型驱动系统中模型转换技术的研究[D];哈尔滨工程大学;2010年

    9 朱春雷;兵员管理系统安全机制研究[D];哈尔滨工程大学;2010年

    10 安建昌;集装箱码头基本业务操作系统的设计与实现[D];大连海事大学;2010年

    【同被引文献】

    中国期刊全文数据库 前7条

    1 刘云枫;柯林;;一种改进的基于粗糙集的数据挖掘方法研究[J];情报杂志;2008年05期

    2 郭志懋,周傲英;数据质量和数据清洗研究综述[J];软件学报;2002年11期

    3 寇月;申德荣;李冬;聂铁铮;;一种基于语义及统计分析的Deep Web实体识别机制[J];软件学报;2008年02期

    4 董彩云,曲守宁;数据挖掘及其在高校教学系统中的应用[J];济南大学学报(自然科学版);2004年01期

    5 田磊;覃征;衡星辰;邵利平;;基于本体的多源异构XML数据近似查询方法[J];西安交通大学学报;2007年06期

    6 周建芳;徐海银;卢正鼎;;信息集成中的实体识别解决方案[J];小型微型计算机系统;2009年09期

    7 孙高尚;申德荣;于戈;聂铁铮;寇月;;一种应用于Deep Web结果页面中分页标签的识别方法[J];小型微型计算机系统;2010年04期

    中国硕士学位论文全文数据库 前7条

    1 李玲;学生成绩管理系统的设计与实现[D];大连海事大学;2010年

    2 陈敏嬿;基于B/S结构的多策略成绩统计分析系统研究与应用[D];华东师范大学;2005年

    3 赵红艳;决策树技术在学生成绩分析中的应用研究[D];山东师范大学;2007年

    4 李玉臣;基于B/S架构的网上学分制管理系统的设计与实现[D];中国海洋大学;2008年

    5 李庆香;数据挖掘技术在高校学生成绩分析中的应用研究[D];西南大学;2009年

    6 李雪;基于决策树算法的成绩分析系统[D];长春理工大学;2010年

    7 李英华;应用于网上图书领域的DeepWeb实体识别[D];河北大学;2010年

    【二级参考文献】

    中国期刊全文数据库 前4条

    1 宣康康;;小谈电子商务中存在的网络安全隐患[J];商场现代化;2006年33期

    2 姜庆臣 ,马润 ,何鹏 ,赵硕;基于XML的嵌入式HTTP服务[J];微计算机信息;2005年04期

    3 李昕;孟祥福;刘玥;;基于WLAN的酒店餐饮管理系统的实现[J];微计算机信息;2007年06期

    4 谭良;佘堃;周明天;;信息安全评估标准研究[J];小型微型计算机系统;2006年04期

    【相似文献】

    中国期刊全文数据库 前10条

    1 陈敏;;农机企业油料管理系统的设计与实现[J];农业技术与装备;2008年12期

    2 赵荣波;张佳林;;基于Web的企业管理信息系统研究[J];中国锰业;2007年02期

    3 郑小蓉;;高职学院学生信息管理系统性能优化问题分析[J];中国新技术新产品;2009年22期

    4 许文丹;刘文哲;冯现永;;基于WEB的图书馆随书光盘发布系统的设计与实现[J];价值工程;2010年22期

    5 陈金刚;舒攀;;基于Web的数字迎新系统设计与实现[J];计算机与数字工程;2007年09期

    6 刘涛;;利用ASP技术访问WEB数据库及其应用[J];科技信息(学术版);2006年03期

    7 柳翠寅;基于WEB的图书管理系统[J];成都大学学报(自然科学版);2005年03期

    8 郭竑晖;;教育信息挖掘的探讨[J];电脑知识与技术(学术交流);2006年29期

    9 岳键;马利;潘锦基;;基于Web的虚拟设计系统开发与应用[J];中国科技信息;2007年19期

    10 黄慧雯;;利用ADO.NET实现图书馆馆藏信息的动态查询[J];图书馆论坛;2007年03期

    中国重要会议论文全文数据库 前10条

    1 赵书城;陆为国;;敦煌学交互式Web数据库[A];第十六届全国数据库学术会议论文集[C];1999年

    2 唐敏;李昭原;;基于XML的Web数据库工具的设计与实现[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

    3 林培光;赵琳;张燕;聂培尧;;基于WDB特征和用户查询请求的Web数据库选择[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

    4 景民;韩志军;杨艳萍;万其明;;一种基于数据库的动态Web权限树快速生成方法[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年

    5 李冬生;王德权;聂晓轶;;基于WEB数控机床刀具寿命管理系统的研究与开发[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年

    6 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

    7 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年

    8 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年

    9 陈敏;张熙锦;刘祖斌;;Web数据库架构自动生成实现研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

    10 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

    中国重要报纸全文数据库 前10条

    1 赵晓涛;[N];网络世界;2008年

    2 本报记者 赵晓涛;[N];网络世界;2008年

    3 彭敏;[N];电脑商报;2009年

    4 本报记者 毛江华;[N];计算机世界;2009年

    5 闫冰;[N];网络世界;2009年

    6 赵晓涛;[N];网络世界;2009年

    7 边歆;[N];网络世界;2009年

    8 泰乐公司首席技术官兼执行副总裁Vikram Saksena;[N];通信产业报;2009年

    9 ;[N];网络世界;2009年

    10 Anchiva中国区总经理 李松;[N];网络世界;2008年

    中国博士学位论文全文数据库 前10条

    1 李昕;电子商务Web数据库不精确查询方法研究[D];辽宁工程技术大学;2010年

    2 孟祥福;Web数据库柔性查询关键技术研究[D];东北大学;2010年

    3 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年

    4 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年

    5 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年

    6 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年

    7 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年

    8 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年

    9 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年

    10 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年

    中国硕士学位论文全文数据库 前10条

    1 胥昌胜;基于Web的科研管理与决策支持系统[D];北方工业大学;2006年

    2 唐黎;Deep Web页面结构分析与核心内容提取研究[D];重庆大学;2011年

    3 吴新勇;基于需求群组的Web服务调度模型研究[D];上海交通大学;2011年

    4 徐卫;Web新闻热点发现系统的设计与实现[D];华中科技大学;2011年

    5 姜本臣;基于嵌入式Web服务器应用技术的研究[D];沈阳工业大学;2012年

    6 温梨梨;基于零拷贝的Web服务器技术研究[D];中国海洋大学;2011年

    7 焦燕廷;一种基于领域本体的语义Web服务匹配和组合方法[D];山东科技大学;2011年

    8 黄亮;Web漏洞扫描系统中的智能爬虫技术研究[D];杭州电子科技大学;2012年

    9 赵春娟;Web服务组合方法的研究与实现[D];天津理工大学;2011年

    10 任强;基于谓词抽象与精化技术的Web服务验证研究[D];苏州大学;2011年


      本文关键词:电子商务Web数据库不精确查询方法研究,由笔耕文化传播整理发布。



    本文编号:66478

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/66478.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户1bbc9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com