基于主题模型的中药材专利文本挖掘方法研究及应用

发布时间:2023-02-26 05:08
  专利数据是包含了各个领域技术和应用的专业性极高的文本。相关领域的企业和研究者通常对专利数据进行研究,从中分析得出研究领域的热点技术和发展状况,为产业的发展提供建议。目前对于中药材专利数据的研究比较薄弱,总体表现为,以统计计数方法对专利数据中结构性数据进行分析研究和对文本数据进行聚类分析。以数理统计的方法对中药材专利数据进行分析研究,存在分析结果比较简单,不能为产业发展提供准确有效建议的问题。随着自然语言分析方法的快速发展,通过主题模型对中药材专利数据进行分析挖掘,深入到文本语义层面可以得出中药材领域的技术热点、发展趋势,能为产业发展和技术研发提供思路和方向。本文基于中药材相关专利文本的研究现状,开展了基于主题模型的中药材相关专利文本主题挖掘与应用研究。本文主要完成了以下工作:(1)研究中药材专利摘要文本的预处理方法。解决没有考虑中药材领域专业性词汇对分词的影响,导致中药材专利文本特征不能完全体现的问题。(2)基于中药材专利数据的摘要文本构建基于LDA主题模型的文本挖掘框架,提出基于热点主题和主题强度分析的主题分析方法,根据分析结果提出产业建议。(3)构建基于LDA-SVM的中药材文本分...

【文章页数】:77 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景及意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 专利文本挖掘研究现状
        1.2.2 主题模型和文本分类研究现状
        1.2.3 专利信息分析及挖掘存在的问题
    1.3 研究内容及整体框架
    1.4 论文研究创新点
第二章 相关理论原理介绍
    2.1 文本挖掘
    2.2 主题模型
        2.2.1 主题模型发展背景
        2.2.2 LDA主题模型
        2.2.3 LDA主题模型参数估计
    2.3 SVM简介
    2.4 本章小结
第三章 基于LDA主题模型中药材专利文本挖掘分析
    3.1 中文专利文本分析
        3.1.1 中药材专利文本的LDA应用
        3.1.2 基于中药材专利LDA主题模型分析方法
        3.1.3 基于主题模型分析框架实现
    3.2 实验数据获取
        3.2.1 中药材专利数据特征分析
        3.2.2 数据源
        3.2.3 专利数据检索及数据范围
    3.3 实验
        3.3.1 实验数据处理
        3.3.2 参数设置
        3.3.3 实验结果与分析
    3.4 中药材相关产业发展建议
        3.4.1 优势与劣势分析
        3.4.2 发展对策
    3.5 本章小结
第四章 基于LDA-SVM模型的中药材专利文本主题划分
    4.1 中药材专利文本分类研究
        4.1.1 基于主题特征的文本分类
        4.1.2 基于LDA-SVM模型的专利文本分类模型设计
        4.1.3 分类判定标准
    4.2 分类器训练
        4.2.1 实验平台
        4.2.2 实验数据获取与处理
        4.2.3 实验过程
    4.3 实验结果分析
    4.4 本章小结
第五章 基于主题模型的中药材专利文本挖掘分析系统
    5.1 系统需求分析
        5.1.1 系统实现目标
        5.1.2 需求分析
    5.2 系统架构与模块
        5.2.1 系统架构
        5.2.2 功能模块划分
    5.3 系统实现
        5.3.1 软件开发运行环境
        5.3.2 系统运行结果
    5.4 基于主题分析系统的专利分析测试
    5.5 本章小结
第六章 总结与展望
致谢
参考文献
附录A



本文编号:3749883

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3749883.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f069b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com