基于汽车故障的用户评价观点研究
发布时间:2017-10-02 02:23
本文关键词:基于汽车故障的用户评价观点研究
更多相关文章: 本体 自然语言处理 信息抽取 Hownet相似度
【摘要】:随着大众对汽车的需求以及汽车普及程度的提高,用户体验汽车并交流汽车故障、缺陷和服务不规范的信息也海量增多,如何从用户对汽车产品的评价信息中进行信息处理,挖掘出有利于汽车厂家改善并提高产品质量信息,维修人员快速、准确定位汽车故障点,实现快捷服务,从而推动汽车产业的健康发展,促进人民生活水平的提高,无疑具有重要的现实意义。为了实现对信息内容的查询、重构和再利用,人们常常采用信息抽取技术。信息抽取的主要任务是从非结构或者半结构化的文档中获取用户所需内容并形成机器可读的形式,通过数据的统计和分析将其应用于需要的领域中。本体技术具有清晰的概念层次结构,通过描述类与类中元素之间的概念和关系,使得计算机能够根据构建模型的表述理解人类的经验知识。本体技术在多领域的实验研究中起到指导对照的作用,可以很好的应用于信息抽取技术中。本文提出一个有效处理文本归类问题的模型,该模型通过将众多涉及汽车故障的用户评价观点进行整合分类的方式,深入探究用户评价观点与汽车故障之间存在的关系。首先,从网络上收集的用户评价观点通过自然语言处理技术,将无结构化的文档转换为结构化的集合,在此过程中,要考虑到中文文本和汽车专业领域的特殊性,对该模型进行词汇扩充,同时使用矩阵降维技术来降低文文本总词汇数目保留核心词汇,在Hownet知识库的基础上引入用户自定义的汽车本体词汇结构作为补充来指导文档分类过程,使得分类结果更加精确。使用Hownet方法将文档词汇与知网知识库、汽车本体词汇库进行相似度计算,从而把文档集合按照投诉问题的相似程度归类。随着自然语言处理和信息抽取的发展,以及语义网技术的广泛应用,我们可以在无监督的归类方法基础上,通过汽车领域本体的指导作用,将大量文档高效正确的进行整合分类,进而追踪汽车部件中存在的故障和安全隐患。该研究在实际中具有一定的实用效果和利用价值。
【关键词】:本体 自然语言处理 信息抽取 Hownet相似度
【学位授予单位】:东北师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:U472;TP391.1
【目录】:
- 摘要4-5
- Abstract5-9
- 第一章 引言9-13
- 1.1 研究背景及意义9-10
- 1.1.1 选题背景9-10
- 1.1.2 选题意义10
- 1.2 国内外研究现状10-12
- 1.2.1 信息抽取的研究现状10-11
- 1.2.2 大数据分析的研究现状11-12
- 1.3 论文组织结构12-13
- 第二章 汽车本体的设计与构建13-17
- 2.1 汽车结构与组成13-14
- 2.2 本体的基本介绍14-15
- 2.2.1 本体的概念14
- 2.2.2 本体的构建方法和开发工具14-15
- 2.3 汽车本体知识库的构建15-16
- 2.4 本章小结16-17
- 第三章 相关技术介绍17-22
- 3.1 文本聚类技术的介绍17-20
- 3.1.1 文档预处理技术17-18
- 3.1.2 向量空间模型18
- 3.1.3 TF-IDF计算18-19
- 3.1.4 文本聚类算法19-20
- 3.2 词汇相似度技术的研究20-21
- 3.3 算法性能评价指标21-22
- 第四章 融合的文本聚类计算与实验22-35
- 4.1 基于K-means的文本聚类算法研究22-29
- 4.1.1 汽车投诉原始文档训练集及其预处理22-25
- 4.1.2 TF-IDF与矩阵降维25-26
- 4.1.3 基于K-means的文本聚类算法实验26-27
- 4.1.4 实验结果与分析27-29
- 4.2 基于Hownet方法的研究及实验29-32
- 4.2.1 基于Hownet的相似度计算介绍29-30
- 4.2.2 基于Hownet相似度计算实验过程30
- 4.2.3 实验结果及分析30-32
- 4.3 基于汽车本体的Hownet算法研究32-33
- 4.3.1 基于汽车本体的Hownet算法实验32-33
- 4.3.2 实验结果及分析33
- 4.4 汽车投诉测试文档集实验及结果33-34
- 4.5 本章小结34-35
- 第五章 结论与分析35-39
- 第六章 总结与展望39-40
- 参考文献40-43
- 致谢43
【参考文献】
中国期刊全文数据库 前5条
1 周由;戴牡红;;语义分析与TF-IDF方法相结合的新闻推荐技术[J];计算机科学;2013年S2期
2 刘萍;陈烨;;词汇相似度研究进展综述[J];现代图书情报技术;2012年Z1期
3 李文清;孙新;张常有;冯烨;;一种本体概念的语义相似度计算方法[J];自动化学报;2012年02期
4 朱会峰;左万利;赫枫龄;彭涛;纪文彦;;一种基于本体的文本聚类方法[J];吉林大学学报(理学版);2010年02期
5 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
,本文编号:957023
本文链接:https://www.wllwen.com/kejilunwen/qiche/957023.html