专利技术主题分析:基于SAO结构的LDA主题模型方法
发布时间:2018-11-20 06:15
【摘要】:[目的/意义]改善现有专利技术主题分析方法主题辨识度低、主题词二义性、无法识别技术信息中的"问题"与相应"解决方案"等问题。[方法/过程]本文通过抽取专利文本中的SAO结构,并从SAO结构中识别"问题和解决方案"(PS)模式,基于"bagofPS"假设,构建基于"主语-行为-宾语"(subject-action-object,SAO)结构的LDA主题模型,实现对专利文献主题结构的识别和分析。[结果/结论]案例研究表明,该方法能够有效识别主题分布,并在主题辨识度和语义消岐方面较传统LDA模型具有较大优势。
[Abstract]:[objective / significance] to improve the subject identification degree of the existing patent technology theme analysis method, the ambiguity of the theme words, the inability to identify the "problem" and the corresponding "solution" in the technical information. [methods / process] by extracting the SAO structure from the patent text and identifying the "problem and solution" (PS) pattern from the SAO structure, and based on the "bagofPS" hypothesis, this paper constructs a "subject-behavior-object" (subject-action-object,) model. SAO) structure of the LDA theme model to realize the identification and analysis of the topic structure of patent literature. [results / conclusion] A case study shows that this method can effectively identify the topic distribution, and has a great advantage over the traditional LDA model in terms of topic identification and semantic disambiguation.
【作者单位】: 北京理工大学管理与经济学院;悉尼科技大学量子计算与智能系统研究中心;
【基金】:国家自然科学基金面上项目“基于语义TRIZ的新兴技术创新路径预测研究”(项目编号:71373019) 国家高技术研究发展计划“面向政府管理的大数据智能服务系统及应用示范”(项目编号:2014AA015105)研究成果之一
【分类号】:G254
本文编号:2344027
[Abstract]:[objective / significance] to improve the subject identification degree of the existing patent technology theme analysis method, the ambiguity of the theme words, the inability to identify the "problem" and the corresponding "solution" in the technical information. [methods / process] by extracting the SAO structure from the patent text and identifying the "problem and solution" (PS) pattern from the SAO structure, and based on the "bagofPS" hypothesis, this paper constructs a "subject-behavior-object" (subject-action-object,) model. SAO) structure of the LDA theme model to realize the identification and analysis of the topic structure of patent literature. [results / conclusion] A case study shows that this method can effectively identify the topic distribution, and has a great advantage over the traditional LDA model in terms of topic identification and semantic disambiguation.
【作者单位】: 北京理工大学管理与经济学院;悉尼科技大学量子计算与智能系统研究中心;
【基金】:国家自然科学基金面上项目“基于语义TRIZ的新兴技术创新路径预测研究”(项目编号:71373019) 国家高技术研究发展计划“面向政府管理的大数据智能服务系统及应用示范”(项目编号:2014AA015105)研究成果之一
【分类号】:G254
【相似文献】
相关期刊论文 前10条
1 ;国家社会科学基金“图书馆·情报与文献学”立项主题分析[J];当代图书馆;2007年04期
2 陈晋;;我国开放获取研究文献的主题分析[J];现代情报;2011年06期
3 周亚男;;主题分析是文献标引的基础[J];图书馆学刊;1991年01期
4 姚效秋;主题分析误检透析[J];江西图书馆学刊;1998年S1期
5 陈守福;;谈主题法中的主题分析[J];情报知识;1986年04期
6 叶与煌;应用主题分析研究学科发展动向[J];情报理论与实践;1988年02期
7 李静;;2000~2010年《中华外科杂志》载文的主题分析[J];中国科技期刊研究;2012年02期
8 魏梅;关于标引中的主题分析[J];航天标准化;1995年03期
9 王彦祥;;综合性主题分析年鉴索引的编制——从创编《中国法律年鉴》累积索引谈一种新索引模式的建立[J];法律文献信息与研究;1996年04期
10 胡阿沛;张静;雷孝平;张晓宇;;基于文本挖掘的专利技术主题分析研究综述[J];情报杂志;2013年12期
,本文编号:2344027
本文链接:https://www.wllwen.com/tushudanganlunwen/2344027.html
教材专著