农业物联网文本数据统计分析
发布时间:2021-10-08 04:21
随着互联网和物联网等信息技术的飞速发展,网络中积累了大量半结构化和非结构化的文本数据,如何从这些海量的文本中获取所需的信息,已经成为了统计分析工作者的一项重要任务。近年来,随着人们物质生活需求的不断增长,农业产品的质量和产量等问题越来越被重视,以信息和软件为中心生产模式的农业物联网得到了广泛的应用,其实时监控、远程控制和查询等功能对现代农业的发展具有重要意义,对农业物联网上的文本进行挖掘是一件非常有价值的事情。目前,国内外对文本挖掘进行了大量的研究,文本挖掘的方法日趋完善,文本挖掘的内容日渐丰富,其主要在相似性检测、文本分类和信息获取等领域,另外,高效直观信息图成为了新型文本内容显示方式,如文字云。本文主要采用农业物联网中的文本数据,从文本相似性和文本文字云两个方面展开探讨和研究。在文本相似性研究方面,本文采用了两种方法对文本进行相似性分析,一种是结合关键词微变的聚类和LD算法的方法,首先约简文本中的低频词,利用LD算法分析词与词之间的相似度,建立文本相似度矩阵,然后用特征词间的相似度及其权重来构建空间向量,最后计算文本间的相似度;另一种是结合阈值优化和e EP模式的方法,在获取文档特...
【文章来源】:安庆师范大学安徽省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
Imagechef文字云
Wordle文字云
Tagxedo文字云
【参考文献】:
期刊论文
[1]数据流分类挖掘中的概念变化研究[J]. 韩法旺,刘耀宗. 计算机科学. 2014(S2)
[2]一种基于向量空间模型的模糊本体映射方法[J]. 张凌宇,陈淑鑫,张光妲,吕洪柱. 计算机应用研究. 2014(05)
[3]基于统计偏好的边界域重构方法[J]. 程玉胜,詹文法,张玉州. 小型微型计算机系统. 2013(11)
[4]基于文本密度模型的Web正文抽取[J]. 朱泽德,李淼,张健,陈雷,曾新华. 模式识别与人工智能. 2013(07)
[5]基于文本空间表示模型的文本相似度计算研究[J]. 张文萍,黎春兰. 现代情报. 2013(02)
[6]面向文本分类的中文文本语义表示方法[J]. 宋胜利,王少龙,陈平. 西安电子科技大学学报. 2013(02)
[7]基于TFIDF和词语关联度的中文关键词提取方法[J]. 张建娥. 情报科学. 2012(10)
[8]文字云图的英语阅读教学设计与实践——以文字云图工具Wordle为例[J]. 杜华. 现代教育技术. 2012(09)
[9]信息可视化在信息表达中的重要性和应用[J]. 徐海波. 信息与电脑(理论版). 2012(09)
[10]基于加权语义网的文本相似度计算的研究[J]. 廖开际,杨彬彬. 情报杂志. 2012(07)
本文编号:3423419
【文章来源】:安庆师范大学安徽省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
Imagechef文字云
Wordle文字云
Tagxedo文字云
【参考文献】:
期刊论文
[1]数据流分类挖掘中的概念变化研究[J]. 韩法旺,刘耀宗. 计算机科学. 2014(S2)
[2]一种基于向量空间模型的模糊本体映射方法[J]. 张凌宇,陈淑鑫,张光妲,吕洪柱. 计算机应用研究. 2014(05)
[3]基于统计偏好的边界域重构方法[J]. 程玉胜,詹文法,张玉州. 小型微型计算机系统. 2013(11)
[4]基于文本密度模型的Web正文抽取[J]. 朱泽德,李淼,张健,陈雷,曾新华. 模式识别与人工智能. 2013(07)
[5]基于文本空间表示模型的文本相似度计算研究[J]. 张文萍,黎春兰. 现代情报. 2013(02)
[6]面向文本分类的中文文本语义表示方法[J]. 宋胜利,王少龙,陈平. 西安电子科技大学学报. 2013(02)
[7]基于TFIDF和词语关联度的中文关键词提取方法[J]. 张建娥. 情报科学. 2012(10)
[8]文字云图的英语阅读教学设计与实践——以文字云图工具Wordle为例[J]. 杜华. 现代教育技术. 2012(09)
[9]信息可视化在信息表达中的重要性和应用[J]. 徐海波. 信息与电脑(理论版). 2012(09)
[10]基于加权语义网的文本相似度计算的研究[J]. 廖开际,杨彬彬. 情报杂志. 2012(07)
本文编号:3423419
本文链接:https://www.wllwen.com/jingjilunwen/nongyejingjilunwen/3423419.html