跨语言专利文本分析技术研究
发布时间:2021-11-08 04:19
专利文献是数量巨大的信息源,在科技、经济和法律领域有着非常重要的地位。随着信息及技术全球化成为趋势,利用国外专利、防止国外专利侵权、专利保护等问题日益受到关注,而语言障碍与专利数量巨大是影响国外专利使用的最大壁垒。跨语言专利文本分析可解决准确查询国外相关专利问题并有效分析国外专利信息。目前国内系统地研究跨语言专利文本分析工作尚未展开,本文以中、英文双语专利文本集作为研究对象,研究了跨语言专利文本分析中涉及到的各种技术并给出应用实例。本文建立跨语言专利机读词典并在跨语言专利语料库的基础上研究语义消歧来解决跨语言专利中语言障碍问题。以跨语言专利词典为基础,本文研究了跨语言专利关键词提取、文本表示以及使用多语言同义词词典统一文本和降维、文本相似度计算等文本分析技术。专利文献匹配是解决快速定位相关专利的有效途径,此外专利文本聚类较多应用于专利文本分析和专利无效性检索中,因此本文以跨语言专利文本匹配和聚类为应用实例,研究了跨语言专利文本分析。考虑到专利独有的结构性和其自身具有的分类信息,本文在计算专利文本匹配时将其与文本相似度计算结合,使得匹配相似度更为准确;本文还以专利自身具有的分类信息为基础...
【文章来源】: 浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:76 页
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景
1.2 研究目标与内容
1.3 本文结构
第2章 研究现状
2.1 跨语言信息检索
2.1.1 同源匹配
2.1.2 提问式翻译
2.1.3 文献翻译
2.1.4 中间语言技术
2.2 翻译技术
2.2.1 多语言词典
2.2.2 语料库
2.3 专利多语言问题的解决方案现状
2.4 本章小结
第3章 跨语言专利文本分析技术
3.1 跨语言专利词典建立及语义消歧
3.1.1 专利双语词典
3.1.2 词典排歧义技术
3.2 关键词提取
3.3 文本表示与降维
3.3.1 文本表示
3.3.2 文本降维
3.4 文本相似度计算
3.5 本章小结
第4章 跨语言专利匹配和聚类
4.1 专利匹配
4.1.1 匹配算法
4.1.2 专利结构性
4.1.3 匹配算法实现
4.2 专利聚类
4.2.1 文本聚类算法
4.2.2 聚类算法评价
4.3 本章小结
第5章 系统设计与实现
5.1 专利源文件获取
5.2 专利预处理
5.3 专利文本分析
5.4 专利匹配和聚类
5.5 实例分析
5.6 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间主要的研究成果
致谢
【参考文献】:
期刊论文
[1]基于词典的英汉双向跨语言信息检索方法 [J]. 杨辉,张玥杰,张涛. 计算机工程. 2009(16)
[2]跨语言信息检索翻译消歧技术发展研究 [J]. 孙鹏飞. 医学信息学杂志. 2009(07)
[3]英汉交互式跨语言检索系统设计与实现 [J]. 吴丹. 现代图书情报技术. 2009(02)
[4]跨语言信息检索研究与应用 [J]. 郭华庚,赵英. 现代情报. 2008(09)
[5]多语言本体构建及其在跨语言信息检索中的应用 [J]. 刘伟成,孙吉红. 武汉科技大学学报(社会科学版). 2008(04)
[6]基于段落相似度的论文抄袭判定 [J]. 赵俊杰,谢飞. 电脑与电信. 2008(08)
[7]国外跨语言信息检索的技术研究综述 [J]. 杨丽. 情报杂志. 2008(07)
[8]基于权利要求结构信息的中文专利无效检索模型 [J]. 刘玉琴,汪雪锋,吕琳. 计算机应用研究. 2008(07)
[9]结合本体论和统计方法的跨语言信息检索模型 [J]. 郑德权,李生,赵铁军,于浩. 哈尔滨工业大学学报. 2008(01)
[10]一种基于动态SOM的增量中文文本聚类方法 [J]. 朱红灿,唐毅. 图书情报工作. 2007(06)
博士论文
[1]面向产品概念设计的专利地图技术研究[D]. 孙凌云.浙江大学 2008
硕士论文
[1]专利信息采集及分析系统设计与开发[D]. 王伟琼.浙江大学 2008
[2]同义词挖掘及其在概念信息检索系统中的应用研究[D]. 曹晶.东北师范大学 2006
本文编号:3482990
【文章来源】: 浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:76 页
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景
1.2 研究目标与内容
1.3 本文结构
第2章 研究现状
2.1 跨语言信息检索
2.1.1 同源匹配
2.1.2 提问式翻译
2.1.3 文献翻译
2.1.4 中间语言技术
2.2 翻译技术
2.2.1 多语言词典
2.2.2 语料库
2.3 专利多语言问题的解决方案现状
2.4 本章小结
第3章 跨语言专利文本分析技术
3.1 跨语言专利词典建立及语义消歧
3.1.1 专利双语词典
3.1.2 词典排歧义技术
3.2 关键词提取
3.3 文本表示与降维
3.3.1 文本表示
3.3.2 文本降维
3.4 文本相似度计算
3.5 本章小结
第4章 跨语言专利匹配和聚类
4.1 专利匹配
4.1.1 匹配算法
4.1.2 专利结构性
4.1.3 匹配算法实现
4.2 专利聚类
4.2.1 文本聚类算法
4.2.2 聚类算法评价
4.3 本章小结
第5章 系统设计与实现
5.1 专利源文件获取
5.2 专利预处理
5.3 专利文本分析
5.4 专利匹配和聚类
5.5 实例分析
5.6 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间主要的研究成果
致谢
【参考文献】:
期刊论文
[1]基于词典的英汉双向跨语言信息检索方法 [J]. 杨辉,张玥杰,张涛. 计算机工程. 2009(16)
[2]跨语言信息检索翻译消歧技术发展研究 [J]. 孙鹏飞. 医学信息学杂志. 2009(07)
[3]英汉交互式跨语言检索系统设计与实现 [J]. 吴丹. 现代图书情报技术. 2009(02)
[4]跨语言信息检索研究与应用 [J]. 郭华庚,赵英. 现代情报. 2008(09)
[5]多语言本体构建及其在跨语言信息检索中的应用 [J]. 刘伟成,孙吉红. 武汉科技大学学报(社会科学版). 2008(04)
[6]基于段落相似度的论文抄袭判定 [J]. 赵俊杰,谢飞. 电脑与电信. 2008(08)
[7]国外跨语言信息检索的技术研究综述 [J]. 杨丽. 情报杂志. 2008(07)
[8]基于权利要求结构信息的中文专利无效检索模型 [J]. 刘玉琴,汪雪锋,吕琳. 计算机应用研究. 2008(07)
[9]结合本体论和统计方法的跨语言信息检索模型 [J]. 郑德权,李生,赵铁军,于浩. 哈尔滨工业大学学报. 2008(01)
[10]一种基于动态SOM的增量中文文本聚类方法 [J]. 朱红灿,唐毅. 图书情报工作. 2007(06)
博士论文
[1]面向产品概念设计的专利地图技术研究[D]. 孙凌云.浙江大学 2008
硕士论文
[1]专利信息采集及分析系统设计与开发[D]. 王伟琼.浙江大学 2008
[2]同义词挖掘及其在概念信息检索系统中的应用研究[D]. 曹晶.东北师范大学 2006
本文编号:3482990
本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/3482990.html