当前位置:主页 > 经济论文 > 电子商务论文 >

基于本体的电子商务信息抽取系统研究

发布时间:2017-06-28 08:09

  本文关键词:基于本体的电子商务信息抽取系统研究,由笔耕文化传播整理发布。


【摘要】:在近十年世界互联网呈爆发式发展,据Gartner Dataquest最新调查显示,目前,全球互联网用户在逐渐增多,其中近1/4用户使用了高速互联网服务。由互联网衍生出来的新型产业就是电子商务网络购物。据波士顿咨询公司对中国用户的调查报告显示,在2009年有大约8%的中国网民通过网络进行购物,而这一数据在2006年仅占3%,并且预计到2012年将达到达到19%。中国消费者的网购次数和金额也达到了一定的高度,约有50%的网购者一年的网购次数超过11次,近40%的人消费金额超过294美元。网络购物将会掀起新一轮互联网高潮。 随着电子商务的快速发展,由此也带来了许多问题。在网络购物过程中,网站信息泛滥,用户查询信息的不方便,都在提醒着研究者们需要一种方便快捷的搜索工具。因此一些强大的搜索引擎出现了,Google,Baidu,Bing等,并且也都涉及了购物搜索领域。但是任何事物都不是完美的,由于是基于全文的检索,所以在查询及返回结果时,用户得到的仍然是相关的信息页,如果要得到需要的信息,仍然要从该结果中再次人工查询。而信息抽取可以在一定程度上解决这个问题。 因此本文从电子商务网站入手,详细分析了当今电子商务网站以及目前较强大的网络购物搜索引擎的特点。从目前形式来看,用户需要更加方便快捷的搜索方式,本文将领域本体这一概念用来描述电子商务领域,借助本体描述提高电子商务领域中信息抽取的功能。本文通过Protégé构建电子商务领域中的产品“电影DVD”本体,并且对类似网页的基本结构和内容进行深入分析,构建本体模型,在信息抽取过程中,使用词性标注对web文档和本体建立连接,并且使用RDF对本体以及信息抽取规则进行描述。本文的目的是对电子商务网站产品信息进行抽取,为用户抽取出准确的信息。最后本文在自然语言处理工具GATE平台对其进行实验并得到抽取结果。
【关键词】:信息抽取 本体 电子商务 GATE
【学位授予单位】:河北大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.1
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 第1章 绪论10-16
  • 1.1 信息抽取技术产生的背景10-11
  • 1.2 信息抽取技术的国内外研究现状11-13
  • 1.3 研究目的和意义13-14
  • 1.4 本课题研究的主要内容14-15
  • 1.5 论文结构15-16
  • 第2章 信息抽取技术概述16-22
  • 2.1 信息抽取的概念16-17
  • 2.2 信息抽取系统应用系统比较17-18
  • 2.3 信息抽取技术及其比较18-20
  • 2.4 信息抽取系统存在的主要问题及发展趋势20-22
  • 第3章 基于本体的信息抽取技术分析22-30
  • 3.1 本体基础知识22-23
  • 3.2 领域本体在信息抽取中的语义支持功能23-27
  • 3.2.1 RDF 为信息抽取提供的语义描述24-26
  • 3.2.2 信息抽取WEB文档的语义标注26-27
  • 3.3 基于本体的信息抽取模型描述27-30
  • 第4章 基于本体的电子商务领域产品描述30-37
  • 4.1 电子商务网站特点分析30-32
  • 4.2 购物搜索引擎分析32-34
  • 4.3 电子商务产品(电影DVD)本体描述与表示34-37
  • 第5章 基于本体的电子商务产品信息抽取实验系统37-48
  • 5.1 GATE 平台概述37-38
  • 5.2 基于本体的电子商务信息抽取系统模型38-40
  • 5.3 基于本体的信息抽取实验系统的规则及抽取流程40-44
  • 5.3.1 信息抽取规则描述40-42
  • 5.3.2 实验系统的信息抽取流程42-44
  • 5.4 GATE 平台电子商务产品信息抽取实验44-47
  • 5.5 实验结果分析47-48
  • 结语48-50
  • 参考文献50-52
  • 致谢52

【相似文献】

中国期刊全文数据库 前10条

1 韩洋;;利群集团 零售新径[J];信息方略;2010年01期

2 秦丽;;家具展览创电子商务先河[J];信息方略;2010年14期

3 陈韶霞;;计算机Web数据及其在电子商务中的应用探析[J];现代商贸工业;2011年12期

4 姚天祥;徐运红;刘双霞;;云计算在中小企业的电子商务中的应用研究[J];电脑知识与技术;2011年14期

5 张古明;;基于对电子商务网站建设的分析[J];黑龙江科技信息;2011年17期

6 于成龙;;中文网页信息抽取技术及分类算法研究[J];山东理工大学学报(自然科学版);2011年03期

7 王宇;;基于ASP的电子商务网站中购物车设计与实现[J];电脑知识与技术;2011年21期

8 樊蓉;;从营销角度谈电子商务网站功能[J];现代经济信息;2011年11期

9 丁建勇;徐茜;;国内电子商务网站快递业服务质量评价与提升策略[J];无线互联科技;2011年02期

10 王全剑;李芳;;基于Wikipedia的人名简历信息抽取[J];计算机应用与软件;2011年07期

中国重要会议论文全文数据库 前10条

1 周坤;张军;刘正捷;;电子商务网站商品列表页的眼动研究[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

2 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年

3 周述文;郭晓军;孙爱平;汤海洪;;电子商务网站的分类及评价初探[A];面向复杂系统的管理理论与信息系统技术学术会议专辑[C];2000年

4 岳训;孙忠林;孟小峰;;面向电子商务网站的个性化推荐系统研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

5 覃如贤;;电子商务网站重要功能模块的设计和实现[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年

6 董晏;;河南电子商务的初步探讨[A];中国通信学会第五届学术年会论文集[C];2008年

7 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年

8 杨礼茂;;C2C电子商务网站信任评价研究[A];第六届(2011)中国管理学年会——市场营销分会场论文集[C];2011年

9 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

10 郭星亚;;国际贸易中电子商务的法律问题[A];中国民商法实务论坛论文集[C];2005年

中国重要报纸全文数据库 前10条

1 本报记者 李国敏;电子商务网站该不该收费?[N];科技日报;2005年

2 ;中国已有一千一百多个电子商务网站[N];中国乡镇企业报;2000年

3 李佳路;电子商务网站已超千个[N];中国知识产权报;2000年

4 记者 于士凯;电子商务网站开通“线下网店”[N];北京商报;2008年

5 记者 于士凯;海外网购“抢滩”中国市场[N];北京商报;2009年

6 记者 骆峰;云南大市场电子商务网站昆交会精彩亮相[N];云南政协报;2009年

7 许治飞;邮政电子商务网站发展的初步策略[N];中国邮政报;2009年

8 本报记者 俞悦;P.cn辟买家分红新蹊径[N];中国计算机报;2010年

9 马蕾;电子商务网站“钓鱼”泛滥[N];人民邮电;2010年

10 中国电子商务协会高级专家 电子商务诚信评价中心总监 杨庆星;化点击为购买 电子商务网站如何破局“信用门”[N];中国计算机报;2010年

中国博士学位论文全文数据库 前10条

1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年

2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年

3 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年

4 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年

5 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年

6 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年

7 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年

8 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年

9 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年

10 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年

中国硕士学位论文全文数据库 前10条

1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年

2 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年

3 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年

4 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年

5 郭力;Web正文信息抽取与面向层次结构的分类技术研究[D];华南理工大学;2011年

6 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年

7 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年

8 张静;面向OA期刊检索结果页面的信息抽取方法研究[D];燕山大学;2010年

9 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年

10 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年


  本文关键词:基于本体的电子商务信息抽取系统研究,由笔耕文化传播整理发布。



本文编号:493138

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/493138.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户10d39***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com