当前位置:主页 > 社科论文 > 图书档案论文 >

基于关联数据的文本型用户生成内容组织研究

发布时间:2020-04-11 01:54
【摘要】:随着互联网的发展,网络上文本类型的用户生成内容数据量成爆炸式增长。这些信息之间关系错综复杂,通过对这些信息进行有效组织,可以发现其间蕴含的丰富知识。但这些信息内容随意性强,关系复杂,利用传统的信息组织方式难以对其进行有效组织。关联数据作为一种轻量级的语义实现方式,其在实现机器可理解、语义关联以及网络数据共享、互操作等众多方面拥有独特优势。鉴于此,本文提出一种面向文本型用户生成内容的关联数据混搭系统模型,利用数据层、查询层、整合层和应用层功能,将豆瓣网电影评论信息与DBPedia数据集、LinkedMDB数据集以及GeoNames数据集进行实体链接关联,实现混搭展现,从而为用户生成内容组织方式提供一种新的思路。本文主要研究工作如下:(1)构建面向文本型用户生成内容的关联数据混搭系统模型。该模型由数据层、查询层、整合层和应用层四部分组成。利用该模型可以将文本型用户生成内容通过命名实体识别、语种转换、关联数据集查询、数据集整合混搭以及可视化展现等步骤,实现文本型用户生成内容的有效组织,丰富并拓展相关知识。(2)对于模型构建过程中出现的关键问题提出详细的解决方案。模型构建过程中有许多十分关键的问题,如命名实体识别方法、关联数据集查询、数据集整合混搭以及可视化展现等。对于常见类型的命名实体识别问题,本文借助现有自然语言处理工具解决。对于特殊类型的命名实体识别问题,本文利用Apache公司的OpenNLP开源框架,训练特殊类型的命名实体识别模型。在多关联数据集查询、混搭中,利用Mashup思想,关联多个外部数据集以及本地数据集。在可视化呈现上,选择D3.js这一前端可视化技术,实现相关知识网络的可视化呈现。(3)利用豆瓣网影评信息对提出的模型进行验证。本文使用Java语言实现面向文本型用户生成内容的关联数据混搭系统模型。并利用数据采集工具,获取豆瓣网电影基本信息以及其评论信息,并利用实体链接方式关联多个外部数据集,包括DBpedia、LinkedMDB以及GeoNames,实现信息的混搭展现。文章实验表明,本系统能够利用关联开放数据解决文本型用户生成内容组织难题,帮助用户获取丰富的外链数据,拓展相关知识网络。
【图文】:

云图,关联数据,云图


联数据相关规则发布关联数据,扩展关联数据网络。随着关联开放数据项目的逐渐逡逑发展,关联数据集的数量也逐渐增多,截至2017年8月,这一数据网络已经有1.146逡逑个关联数据集。图2.1是2017年8月更新的LOD云图。根据统计,关联数据按照逡逑数据涉及的主题领域可大致分为九大部分,分别为地理数据(Geography)、政府数逡逑据(Government)、生命科学(Life邋Sciences)、语言学(Linguistics)、媒体(Media)、逡逑10逡逑

界面图,界面,数据,服务器端


2.3数据混搭逡逑混搭(mashup)是一种新型的基于Web的资源集成应用程序,指将两个或两个逡逑以上的数据进行整合,并创造出一种新的服务性网页或应用供用户使用它使用逡逑Web2.0技术,通过API、RSS等方式将不同数据集中的数据进行整合,并运用Ajax、逡逑JavaScript等技术增加与用户的交互,具有共享增值、交互性强、个性化等特点。逡逑一般,mashup系统构架包括三层,图2.3为一种典型的mashup系统架构,包逡逑括以下几个方面:逡逑(1)逦API/内容提供者。提供了构建mashup所需的数据,其数据来源包括本地逡逑数据以及互联网数据等。逡逑(2)逦mashup服务器。将来自于不同数据集的数据进行整合,把从外部获得的逡逑或者自有的数据进行封装与处理,同时响应应用程序。实现mashup既可以发生在逡逑客户端,也可以发生在服务器端。在服务器端聚合是用服务器端动态内容生成技术,逡逑而在客户端聚合则是通过使用客户机端脚本语言实现。在客户机端进行聚合能够减逡逑轻mashup服务器所产生的负载,实现与用户的无缝对接。逡逑w。,,
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:G350

【相似文献】

相关期刊论文 前10条

1 刘竟;吴玲玲;;基于关联数据的学科电子档案资源聚合框架的构建[J];图书情报研究;2019年01期

2 阳广元;;基于关联数据的图书馆服务研究现状与展望[J];图书馆理论与实践;2019年06期

3 王燕红;;国内基于关联数据的资源整合研究述评[J];图书馆理论与实践;2018年06期

4 官维;梁艺多;;航运关联数据的发布及查询应用研究[J];价值工程;2018年33期

5 杨敏;;关联数据在图书馆中的应用研究[J];图书馆研究与工作;2016年05期

6 汪淑娴;;国内关联数据领域研究热点分析[J];时代农机;2016年11期

7 杨选辉;龙帆;;关联数据与本体在图书馆资源服务模式中的应用研究[J];图书馆理论与实践;2016年12期

8 高劲松;程娅;梁艳琪;;基于关联数据的图书馆数字资源语义互联研究[J];情报科学;2017年01期

9 赵龙文;莫荔媛;潘卓齐;;基于关联数据的政府数据开放实现方法研究[J];情报资料工作;2016年06期

10 崔家旺;李春旺;;基于关联数据的类簇语义揭示模型研究[J];数据分析与知识发现;2017年04期

相关会议论文 前3条

1 翁丹玉;翟军;;基于关联数据的学位论文系统[A];第十一届(2016)中国管理学年会论文集[C];2016年

2 姚建松;杨胜利;;三级关联数码组合防伪方案在香烟防伪中的应用[A];第十一届全国包装工程学术会议论文集(一)[C];2007年

3 苏伟扬;郝元涛;饶绍奇;;基于进化理论的复杂疾病高维基因互作分析方法[A];2011年中国卫生统计学年会会议论文集[C];2011年

相关重要报纸文章 前7条

1 陆云 编译;语义技术两种途径助力出版[N];中国出版传媒商报;2016年

2 大连市国税局 丁琳 曲直 石乔雅;用税务大数据为企业“画像”[N];中国税务报;2015年

3 ;交易管理保障应用性能[N];网络世界;2006年

4 本报记者 李杨 赵志芸 师巧梅;凝聚共识创未来[N];新疆日报(汉);2014年

5 本报记者 李 平 特约撰稿人 罗时龙;检验检疫新计收费系统4月启用[N];中国国门时报;2004年

6 记者 邝展婷;PDM系统助黄船提升设计效率[N];中国船舶报;2009年

7 本报记者 缪梦羽;数智环境 将以“多兵种”向污染全面开战[N];成都日报;2019年

相关博士学位论文 前8条

1 梁艳琪;基于关联数据的文物数字资源语义融合与服务研究[D];华中师范大学;2017年

2 李楠;基于关联数据的知识发现研究[D];中国农业科学院;2012年

3 伍革新;基于关联数据的数字图书馆资源聚合与服务研究[D];华中师范大学;2013年

4 谢铭;关联数据和知识表示的自动语义标注技术[D];武汉大学;2012年

5 鲜国建;农业科技多维语义关联数据构建研究[D];中国农业科学院;2013年

6 郭晓君;关联课程数据组织及知识管理研究[D];武汉大学;2012年

7 袁远明;智慧城市信息系统关键技术研究[D];武汉大学;2012年

8 黄磊;关联课程数据构建及存储方法研究[D];武汉大学;2013年

相关硕士学位论文 前10条

1 韩雪;基于关联数据的MOOC资源服务模型研究[D];华中师范大学;2018年

2 解迪;SSCMDA:基于间谍刺探策略与超级集群策略的MiRNA与疾病关联预测模型[D];辽宁大学;2018年

3 蒋衍亭;基于关联数据的图书馆知识服务研究[D];华中师范大学;2015年

4 吴红瑶;基于关联数据的科学数据共享模型研究[D];辽宁师范大学;2018年

5 杨东升;基于关联数据的文本型用户生成内容组织研究[D];华中师范大学;2018年

6 莫荔媛;基于关联数据的个性化推荐系统研究[D];华南理工大学;2018年

7 李晓;基于sameAs连接的等同实体网络研究[D];山西大学;2018年

8 冯婕;关联型实体名称数据语义聚合研究[D];山西大学;2018年

9 吴玲玲;基于关联数据的学科电子档案资源聚合研究[D];江苏大学;2018年

10 罗铭文;基于关联数据的信息推荐研究[D];黑龙江大学;2018年



本文编号:2622994

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2622994.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5fed2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com