数据仓库视角下多源异构专利数据集成研究
发布时间:2022-10-08 20:20
遵循数据仓库的架构模式,将分布在不同地点、不同系统的异构专利数据集成到一个数据中心,方便专利数据的统一存储、访问、分析。封装所有数据源的异构专利数据细节,对用户提供统一、透明的访问接口,用户只需关注自身的访问需求,无需过多关注各底层数据源的差异结构。综合采用快照法、触发器法、日志法、时间戳法、影子表法等各类数据提取方法,扬长避短,提高专利数据集成效率。并以时间戳法为例,应用Kettle工具实现增量专利数据提取,对文章提出的理论进行验证。
【文章页数】:4 页
【文章目录】:
0 引言
1 专利数据中心框架
2 增量专利数据集成方法
2.1 快照法
2.2 触发器法
2.3 日志法
2.4 时间戳法
2.5 影子表法
3 应用
4 结语
【参考文献】:
期刊论文
[1]政策引导创新模式下的专利集成失败问题研究[J]. 袁晓东,蔡学辉. 科学学研究. 2018(06)
[2]PATSTAT专利数据库数据集成策略研究[J]. 杨冠灿,张静,望俊成. 数字图书馆论坛. 2015 (09)
[3]多源专利信息资源集成研究——以美国专利数据为例[J]. 刘会景,凌锋,朱新超,齐萍,杨冠灿. 数字图书馆论坛. 2015 (09)
[4]基于多策略融合的专利术语自动抽取[J]. 周绍钧,吕学强,李卓,都云程. 计算机应用与软件. 2015(02)
[5]不同来源的中国专利信息资源整合研究[J]. 朱新超,霍翠婷,刘会景. 情报理论与实践. 2014(11)
[6]面向专利集成的专利技术相关性测度方法研究[J]. 张端阳,肖国华,李文燕. 情报杂志. 2014(11)
[7]专利信息集成服务平台的构建设想[J]. 邓勇,房俊民,文奕. 情报理论与实践. 2007(01)
硕士论文
[1]专利信息集成服务研究与实践[D]. 邓勇.四川大学 2006
本文编号:3688366
【文章页数】:4 页
【文章目录】:
0 引言
1 专利数据中心框架
2 增量专利数据集成方法
2.1 快照法
2.2 触发器法
2.3 日志法
2.4 时间戳法
2.5 影子表法
3 应用
4 结语
【参考文献】:
期刊论文
[1]政策引导创新模式下的专利集成失败问题研究[J]. 袁晓东,蔡学辉. 科学学研究. 2018(06)
[2]PATSTAT专利数据库数据集成策略研究[J]. 杨冠灿,张静,望俊成. 数字图书馆论坛. 2015 (09)
[3]多源专利信息资源集成研究——以美国专利数据为例[J]. 刘会景,凌锋,朱新超,齐萍,杨冠灿. 数字图书馆论坛. 2015 (09)
[4]基于多策略融合的专利术语自动抽取[J]. 周绍钧,吕学强,李卓,都云程. 计算机应用与软件. 2015(02)
[5]不同来源的中国专利信息资源整合研究[J]. 朱新超,霍翠婷,刘会景. 情报理论与实践. 2014(11)
[6]面向专利集成的专利技术相关性测度方法研究[J]. 张端阳,肖国华,李文燕. 情报杂志. 2014(11)
[7]专利信息集成服务平台的构建设想[J]. 邓勇,房俊民,文奕. 情报理论与实践. 2007(01)
硕士论文
[1]专利信息集成服务研究与实践[D]. 邓勇.四川大学 2006
本文编号:3688366
本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/3688366.html