面向电影信息的个性化语义查询关键技术研究
发布时间:2021-09-28 16:26
观看电影已经是人们日常生活中重要的娱乐方式之一,由于电影信息分布于各大视频网站且这些网站不能为用户提供足够个性化的查询结果,导致用户难以搜索到自己感兴趣的影视资源。针对该问题,本文将网络上分散的电影信息组织起来,建立电影信息本体知识库,将K-近邻算法和本体查询方式相结合,对用户观看电影的历史记录进行分析,得到用户的兴趣倾向,从而为用户提供他们期望检索到的电影信息。本文的主要工作和贡献如下。首先,针对电影信息分布于不同网站的问题,本文分析了主流网站组织电影信息的方式,对比构建本体的不同方法,采用七步法构建适用于电影领域的本体模型,设计将电影信息数据从来源库映射到本体知识库的方法,为本文后续研究提供电影领域本体知识库。其次,为了获取电影领域的相关知识,本文调研了领域知识获取的四种方式:本体知识重用、权威网站接口获取、中转网站知识获取和爬虫获取知识。在对四种方式进行对比后,最终选择使用爬虫获取知识的方式,在构建好的电影本体模型上,丰富电影本体知识库。再次,本文分析出电影信息本体中主要存在的异构类型,制定本体知识检查的规则,并检查电影本体概念和语法的异构;针对本体属性之间的关系不完整的问题,采...
【文章来源】:燕山大学河北省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
知识图谱技术体系与知识图谱同属于AI(ArtificialIntelligence)研究范畴的还有深度学习,虽然二者
图 2-1 语义 Web 的层次结构图[23]码以及标识是一种编码方式,世界上不同的国家都有自己的语言符进行表示,UNICODE 是其中的一种解决方案,除12、GBK(Chinese Internal Code Specification)、UTormat)等形式[24]。编码的处理格式按照实际操作环境识符(Uniform Resource Identifier,简称 URI)是对互符串,互联网中的资源均通过 URI 获取。URI 具有iformResourceLocator)和 URN(UniformResourceNa URL,URN 尚未被广泛使用。URL 的表现形式为资位置两部分内容组成。而 URN 的路径不依赖域名和的字符串。示数据的结构
图 2-2 RDF 描述电影资源在构建的电影类型结点中,包括了两条三元组。如表 2-1 的三元组展示了本继承关系,表述了“电影类型是电影的孩子”。表 2-1 本体继承关系的 RDF 描述元组 内容 含义语 https://www.80s.tw#电影类型 电影类型,本体中一个概念的唯一标识语 rdfs:subClassOf 是…的孩子语 https://www.80s.tw#电影 电影如表 2-2 的三元组展示了本体的资源类型的定义。表述了“电影类型的结点是一个概念”。表 2-2 本体类型的 RDF 描述元组 内容 含义语 https://www.80s.tw#电影类型 电影类型,本体中一个概念的唯一标
【参考文献】:
期刊论文
[1]基于METHONTOLOGY法的应急预案本体化构建[J]. 杨继星,宋重阳,金龙哲. 安全与环境学报. 2018(04)
[2]知识图谱与知识表示学习[J]. 丁允念. 信息与电脑(理论版). 2018(13)
[3]基于Jena系统的知识融合三元组存储结构研究[J]. 杨夏柏,杨明,杨德强,黄瑜. 价值工程. 2018(08)
[4]Robots Exclusion and Guidance Protocol[J]. Dajie Ge,Zhijun Ding. Tsinghua Science and Technology. 2016(06)
[5]知识图谱技术综述[J]. 徐增林,盛泳潘,贺丽荣,王雅芳. 电子科技大学学报. 2016(04)
[6]HTTP协议头及错误码详解[J]. 赵思远. 计算机与网络. 2016(11)
[7]基于深层网络爬虫的Web地图服务发现方法[J]. 侯东阳,武昊,王军锋,王明山. 地理与地理信息科学. 2015(05)
[8]基于protégé的中医证候本体构建方法研究[J]. 李明,朱邦贤,周强. 数理医药学杂志. 2015(06)
[9]基于Heritrix和Jsoup的信息抽取系统的设计与实现[J]. 刘全志,于治楼. 山东师范大学学报(自然科学版). 2015 (02)
[10]基于跨语本体重用的维语本体构建方法[J]. 李连倍,刘胜全,刘艳,杨倩倩. 计算机工程与应用. 2015(11)
硕士论文
[1]基于语义的本体映射方法及其应用研究[D]. 陈娟.湘潭大学 2017
[2]本体知识中不确定语义关系的表达和非精确推理研究[D]. 张琳.燕山大学 2017
[3]中文网站抓取及编码转换研究[D]. 吴乃宁.新疆农业大学 2013
[4]应用于网上图书领域的DeepWeb实体识别[D]. 李英华.河北大学 2010
[5]面向领域本体的知识建模问题研究[D]. 仇宝艳.山东师范大学 2009
本文编号:3412262
【文章来源】:燕山大学河北省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
知识图谱技术体系与知识图谱同属于AI(ArtificialIntelligence)研究范畴的还有深度学习,虽然二者
图 2-1 语义 Web 的层次结构图[23]码以及标识是一种编码方式,世界上不同的国家都有自己的语言符进行表示,UNICODE 是其中的一种解决方案,除12、GBK(Chinese Internal Code Specification)、UTormat)等形式[24]。编码的处理格式按照实际操作环境识符(Uniform Resource Identifier,简称 URI)是对互符串,互联网中的资源均通过 URI 获取。URI 具有iformResourceLocator)和 URN(UniformResourceNa URL,URN 尚未被广泛使用。URL 的表现形式为资位置两部分内容组成。而 URN 的路径不依赖域名和的字符串。示数据的结构
图 2-2 RDF 描述电影资源在构建的电影类型结点中,包括了两条三元组。如表 2-1 的三元组展示了本继承关系,表述了“电影类型是电影的孩子”。表 2-1 本体继承关系的 RDF 描述元组 内容 含义语 https://www.80s.tw#电影类型 电影类型,本体中一个概念的唯一标识语 rdfs:subClassOf 是…的孩子语 https://www.80s.tw#电影 电影如表 2-2 的三元组展示了本体的资源类型的定义。表述了“电影类型的结点是一个概念”。表 2-2 本体类型的 RDF 描述元组 内容 含义语 https://www.80s.tw#电影类型 电影类型,本体中一个概念的唯一标
【参考文献】:
期刊论文
[1]基于METHONTOLOGY法的应急预案本体化构建[J]. 杨继星,宋重阳,金龙哲. 安全与环境学报. 2018(04)
[2]知识图谱与知识表示学习[J]. 丁允念. 信息与电脑(理论版). 2018(13)
[3]基于Jena系统的知识融合三元组存储结构研究[J]. 杨夏柏,杨明,杨德强,黄瑜. 价值工程. 2018(08)
[4]Robots Exclusion and Guidance Protocol[J]. Dajie Ge,Zhijun Ding. Tsinghua Science and Technology. 2016(06)
[5]知识图谱技术综述[J]. 徐增林,盛泳潘,贺丽荣,王雅芳. 电子科技大学学报. 2016(04)
[6]HTTP协议头及错误码详解[J]. 赵思远. 计算机与网络. 2016(11)
[7]基于深层网络爬虫的Web地图服务发现方法[J]. 侯东阳,武昊,王军锋,王明山. 地理与地理信息科学. 2015(05)
[8]基于protégé的中医证候本体构建方法研究[J]. 李明,朱邦贤,周强. 数理医药学杂志. 2015(06)
[9]基于Heritrix和Jsoup的信息抽取系统的设计与实现[J]. 刘全志,于治楼. 山东师范大学学报(自然科学版). 2015 (02)
[10]基于跨语本体重用的维语本体构建方法[J]. 李连倍,刘胜全,刘艳,杨倩倩. 计算机工程与应用. 2015(11)
硕士论文
[1]基于语义的本体映射方法及其应用研究[D]. 陈娟.湘潭大学 2017
[2]本体知识中不确定语义关系的表达和非精确推理研究[D]. 张琳.燕山大学 2017
[3]中文网站抓取及编码转换研究[D]. 吴乃宁.新疆农业大学 2013
[4]应用于网上图书领域的DeepWeb实体识别[D]. 李英华.河北大学 2010
[5]面向领域本体的知识建模问题研究[D]. 仇宝艳.山东师范大学 2009
本文编号:3412262
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3412262.html
最近更新
教材专著