专利聚类分析与展示系统的设计与实现
发布时间:2022-02-11 08:18
科技创新在世界的重要程度越来越高,作为科技创新中产出的新的体系,区域创新吸引了国家及相关机构的重视,而在区域创新体系中,极为重要的是相关科技领域中专家的引进。而对于相关科技领域以及专家的详细信息的有效载体就是专利文献,通过对专利文献进行分析可以挖掘出有效的专家信息。专利地图作为一种有效的专利文献分析工具,能够将具有复杂结构的专利文献信息进行抽取,归类,分析。并把结果以可视化图表的形式展示给使用者。本文主要实现了以专利词云,发明人-所在机构关系图,专利聚类散点图组成的系统,对于相关机构分析得到有效的人才信息以及对科技发展现状及之后的发展方向进行科学评估都具有重要作用。本文核心的研究内容及实验成果为:(1)研究了专利文献的信息结构,确定提取的字段。研究了专利信息的信息来源以及利用爬虫进行爬取的方法,并把数据存储到数据库中(2)对专利数据进行预处理,包括分词,停用词过滤,词干化处理,防止提出的词不具备相关科技意义,对聚类结果造成干扰。(3)采用基于N-gram的特征选择方法提取文献的关键词,将tf-idf与Word2Vec相结合进行文本向量的计算,得出专利文献的向量矩阵,为后面聚类算法提供输...
【文章来源】:北京邮电大学北京市211工程院校教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
图1?-2?ThemeScape专利地图??3??
从专利的内容着手,其中比较有代表性的软件有ThemeScape以及Aureka。??ThemeScape^是一款专利地图的分析工具,主要利用文本聚类方法对专利的标题??以及摘要生成相应的专利地图。其大致效果如图1-2:??-?_^8vsT'r?":"??图1?-2?ThemeScape专利地图??3??
件了解到不同技术领域各公司间的竞争关系,对之后的科技发展策略起到辅助作??用。??Arueka主要产出的是专利文献中的专利地形图(图1-3)),与ThemeScape??类似,在词汇地形图中,地图核心词汇以及颜色深浅表示了专利主题以及相关联??的专利文献的数量大小。同时不同地形间的距离表示各个主题间的关联程度。每??个点表示一个专利,且每个专利在地图中的位置唯一,用户可以对需要分析的相??关的字段进行配置更好地了解自己需要的信息。??#?.?U#i!?.?T?mpef树ufft??—,??獅滅?iS?W???纖*?..?-??,?一.?'PS?—.??图1-3?Arueka专利地图??以上两款软件在同行业中较为领先,不过与此同时该软件价格十分昂贵,软??件中也没有中文翻译,同时也存在相关分析算法不够稳定的问题。??我国近年来也逐渐投入到了专利地图软件的开发当中,不过由于起步时间较??晚
【参考文献】:
期刊论文
[1]一种基于类别描述的TF-IDF特征选择方法的改进[J]. 徐冬冬,吴韶波. 现代图书情报技术. 2015(03)
[2]基于K-means聚类的柑橘红蜘蛛图像目标识别[J]. 李震,洪添胜,曾祥业,郑健宝. 农业工程学报. 2012(23)
[3]专利地图设计制作及影响因素分析[J]. 肖国华,熊树明,张娴. 情报理论与实践. 2007(03)
博士论文
[1]AP聚类算法研究及其在电子病历挖掘中的应用[D]. 孙磊磊.大连理工大学 2017
[2]信息可视化技术及应用研究[D]. 刘芳.浙江大学 2013
[3]聚类分析及其在图像处理中的应用[D]. 肖宇.北京交通大学 2012
硕士论文
[1]支持动态网页解析的分布式网络爬虫系统的设计与实现[D]. 欧阳春.东南大学 2017
[2]新中国专利制度演进探究[D]. 梁兵兵.重庆大学 2015
[3]基于专利数据挖掘的技术趋势分析方法[D]. 张超.大连理工大学 2014
本文编号:3619929
【文章来源】:北京邮电大学北京市211工程院校教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
图1?-2?ThemeScape专利地图??3??
从专利的内容着手,其中比较有代表性的软件有ThemeScape以及Aureka。??ThemeScape^是一款专利地图的分析工具,主要利用文本聚类方法对专利的标题??以及摘要生成相应的专利地图。其大致效果如图1-2:??-?_^8vsT'r?":"??图1?-2?ThemeScape专利地图??3??
件了解到不同技术领域各公司间的竞争关系,对之后的科技发展策略起到辅助作??用。??Arueka主要产出的是专利文献中的专利地形图(图1-3)),与ThemeScape??类似,在词汇地形图中,地图核心词汇以及颜色深浅表示了专利主题以及相关联??的专利文献的数量大小。同时不同地形间的距离表示各个主题间的关联程度。每??个点表示一个专利,且每个专利在地图中的位置唯一,用户可以对需要分析的相??关的字段进行配置更好地了解自己需要的信息。??#?.?U#i!?.?T?mpef树ufft??—,??獅滅?iS?W???纖*?..?-??,?一.?'PS?—.??图1-3?Arueka专利地图??以上两款软件在同行业中较为领先,不过与此同时该软件价格十分昂贵,软??件中也没有中文翻译,同时也存在相关分析算法不够稳定的问题。??我国近年来也逐渐投入到了专利地图软件的开发当中,不过由于起步时间较??晚
【参考文献】:
期刊论文
[1]一种基于类别描述的TF-IDF特征选择方法的改进[J]. 徐冬冬,吴韶波. 现代图书情报技术. 2015(03)
[2]基于K-means聚类的柑橘红蜘蛛图像目标识别[J]. 李震,洪添胜,曾祥业,郑健宝. 农业工程学报. 2012(23)
[3]专利地图设计制作及影响因素分析[J]. 肖国华,熊树明,张娴. 情报理论与实践. 2007(03)
博士论文
[1]AP聚类算法研究及其在电子病历挖掘中的应用[D]. 孙磊磊.大连理工大学 2017
[2]信息可视化技术及应用研究[D]. 刘芳.浙江大学 2013
[3]聚类分析及其在图像处理中的应用[D]. 肖宇.北京交通大学 2012
硕士论文
[1]支持动态网页解析的分布式网络爬虫系统的设计与实现[D]. 欧阳春.东南大学 2017
[2]新中国专利制度演进探究[D]. 梁兵兵.重庆大学 2015
[3]基于专利数据挖掘的技术趋势分析方法[D]. 张超.大连理工大学 2014
本文编号:3619929
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3619929.html
最近更新
教材专著