领域汉语理解中的智能分词和聚类及其在机械产品设计中的应用
发布时间:2020-11-18 19:55
本文设计并实现了领域汉语理解中的智能分词及聚类模型,并将其应用于机械产品的设计过程,依托整个领域汉语理解系统实现了自然语言形式描述的用户设计要求到计算机能够识别的概念设计要求或设计参数的转化。 首先,分析了现有的分词系统设计的优点及其存在的不足,提出了基于系统论的机械分词和基于语义理解的分词相结合的智能分词模型。将智能分词模块嵌入到整个领域汉语理解系统中,在机械分词阶段提供所有可能的分词结果,并进行词法分析级别的歧义排除,在后续的汉语理解系统的语义分析模块中排除存在语义歧义的分词结果,最后利用体现其智能性的反馈模块将理解结果反馈回分词词库,实现分词系统和整个自然语言理解系统的自我完善及良性互动。其次,将聚类分析应用于领域汉语理解系统的领域划分模块中,完成对分词结果的领域定位。同时将词汇聚类系统运用于领域汉语理解系统的反馈模块中,用理解完毕后,自动建模之前的准分词结果对词汇聚类系统进行训练,使其逐步完善,最终完成对分词词库的词汇聚类,提高分词及领域汉语理解的准确性和效率。最后,结合实际将领域汉语理解及其智能分词和聚类分析系统应用在机械产品设计的用户需求分析领域,通过系统测试,结果比较令人满意。
【学位单位】:西安电子科技大学
【学位级别】:硕士
【学位年份】:2006
【中图分类】:TH122
【部分图文】:
领域汉语理解中的智能分词和聚类及其在机械产品设计中的应用设计,使分词系统获得增量式的良性发展,从而使整个自然语言理解系统随着使用越来越完善。本文在综合分析各种分词方法的优缺点基础上,决定采用一面向语义的并结合领域分词本体知识库的智能分词方法。.2.2 智能分词模型的建立上面介绍了本分词系统的核心设计思想,在此核心思想的指导下,设计了本词系统的具体模块:句段切分模块、机械分词模块、未登录词的处理模块、基聚类的领域辨识模块、领域内的自然语言理解模块、未登录词召回模块、词汇类模块、词库管理系统模块。下面以流程图的形式介绍一下本分词系统的模块计及组织结构,如下图 图 3.2 所示:句段切分模
本领域汉语理解系统的领域划分模块决定采用聚类的汉语语料对象的领域划分和定位问题。进而在后利用所确定的领域的领域知识,提高理解的准确性中的聚类分析模型的建立划分(辨识)模块的位置位于第一阶段分词模块之的分词结果之上的,所以它面向的对象是分词之后出这些词汇对象所隐含的领域特征,将他们定位于一步的领域汉语理解的领域性知识的使用成为可能所示,直观的反映了领域划分模块在整个汉语理解句段切分模
【引证文献】
本文编号:2889133
【学位单位】:西安电子科技大学
【学位级别】:硕士
【学位年份】:2006
【中图分类】:TH122
【部分图文】:
领域汉语理解中的智能分词和聚类及其在机械产品设计中的应用设计,使分词系统获得增量式的良性发展,从而使整个自然语言理解系统随着使用越来越完善。本文在综合分析各种分词方法的优缺点基础上,决定采用一面向语义的并结合领域分词本体知识库的智能分词方法。.2.2 智能分词模型的建立上面介绍了本分词系统的核心设计思想,在此核心思想的指导下,设计了本词系统的具体模块:句段切分模块、机械分词模块、未登录词的处理模块、基聚类的领域辨识模块、领域内的自然语言理解模块、未登录词召回模块、词汇类模块、词库管理系统模块。下面以流程图的形式介绍一下本分词系统的模块计及组织结构,如下图 图 3.2 所示:句段切分模
本领域汉语理解系统的领域划分模块决定采用聚类的汉语语料对象的领域划分和定位问题。进而在后利用所确定的领域的领域知识,提高理解的准确性中的聚类分析模型的建立划分(辨识)模块的位置位于第一阶段分词模块之的分词结果之上的,所以它面向的对象是分词之后出这些词汇对象所隐含的领域特征,将他们定位于一步的领域汉语理解的领域性知识的使用成为可能所示,直观的反映了领域划分模块在整个汉语理解句段切分模
【引证文献】
相关硕士学位论文 前1条
1 周泓;基于统计面向领域的分词研究以及在产品设计中的应用[D];西安电子科技大学;2010年
本文编号:2889133
本文链接:https://www.wllwen.com/kejilunwen/jixiegongcheng/2889133.html