基于多元问题信息的专利聚类推荐方法研究
发布时间:2024-09-17 19:01
专利背景技术包含丰富的技术问题信息,能帮助我们快速了解当前技术的核心问题,在专利推荐方面具有重要价值。目前专利推荐主要是基于专利内容进行推荐,缺乏对技术问题具有针对性的推荐,且专利技术问题的相关研究甚少,无法展示专利多元化的问题信息。本文从专利背景技术中入手,采用先筛选后抽取的两步骤策略抽取出结构化的专利问题信息,并进一步利用问题信息结合专利标题表示专利特征向量,提出了一种基于多元问题信息的专利聚类推荐方法。本文主要工作如下:(1)筛选问题句:专利背景技术包含很多背景信息、原理介绍等冗余信息,影响问题信息抽取的准确性。本文利用问题句含有负面情感倾向的特点,结合情感分类方法进行筛选,提出了融合句法规则的特征融合情感分类模型,将背景技术特征分为局部特征和全局特征进行提取,并引入注意力机制进行权重配置,解决了常规情感分类模型特征表示能力弱的问题。(2)抽取问题信息:为了对问题信息分层次进行表征,构建了<问题源,<问题属性,问题词>>的结构化表征形式;分析问题句中问题源的位置、语义角色特点,提出了多特征融合的CRFs进行抽取;而根据<问题属性,问题词>关联性强...
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
附件
摘要
abstract
第一章 绪论
1.1 课题背景及研究意义
1.2 研究现状
1.2.1 专利推荐研究现状
1.2.2 情感分类研究现状
1.2.3 专利信息抽取研究现状
1.3 本文研究内容
1.4 本文组织结构
第二章 相关技术及理论概述
2.1 文档推荐相关技术
2.2 情感分类相关技术
2.3 信息抽取相关技术
第三章 基于文本筛选的问题信息抽取
3.1 问题表征形式和抽取方法框架
3.1.1 问题表征形式
3.1.2 抽取方法框架
3.2 专利文本筛选
3.2.1 句法规则删除冗余
3.2.2 特征融合情感分类模型CG-ATT
3.3 问题信息抽取
3.3.1 构建问题词词库
3.3.2 识别问题信息
3.4 实验与评估
3.4.1 实验研究
3.4.2 实验结果分析
3.5 本章小结
第四章 融合问题信息的聚类推荐
4.1 专利向量化
4.2 改进K-means的专利聚类方法
4.3 构建三层兴趣模型
4.4 实验与评估
4.4.1 实验数据和评价指标
4.4.2 实验结果分析
4.5 专利推荐的可视化展示
4.6 本章小结
第五章 总结与展望
参考文献
攻读学位期间所取得的相关科研成果
致谢
本文编号:4005905
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
附件
摘要
abstract
第一章 绪论
1.1 课题背景及研究意义
1.2 研究现状
1.2.1 专利推荐研究现状
1.2.2 情感分类研究现状
1.2.3 专利信息抽取研究现状
1.3 本文研究内容
1.4 本文组织结构
第二章 相关技术及理论概述
2.1 文档推荐相关技术
2.2 情感分类相关技术
2.3 信息抽取相关技术
第三章 基于文本筛选的问题信息抽取
3.1 问题表征形式和抽取方法框架
3.1.1 问题表征形式
3.1.2 抽取方法框架
3.2 专利文本筛选
3.2.1 句法规则删除冗余
3.2.2 特征融合情感分类模型CG-ATT
3.3 问题信息抽取
3.3.1 构建问题词词库
3.3.2 识别问题信息
3.4 实验与评估
3.4.1 实验研究
3.4.2 实验结果分析
3.5 本章小结
第四章 融合问题信息的聚类推荐
4.1 专利向量化
4.2 改进K-means的专利聚类方法
4.3 构建三层兴趣模型
4.4 实验与评估
4.4.1 实验数据和评价指标
4.4.2 实验结果分析
4.5 专利推荐的可视化展示
4.6 本章小结
第五章 总结与展望
参考文献
攻读学位期间所取得的相关科研成果
致谢
本文编号:4005905
本文链接:https://www.wllwen.com/tushudanganlunwen/4005905.html
上一篇:信息化管理背景下的军队档案远程服务研究
下一篇:没有了
下一篇:没有了