基于图像与文本特征融合的大米分类研究
发布时间:2025-03-20 04:00
目前,市场上的大米品质检测方法,多是肉眼去区分,耗费大量的时间和人力,而且检测的结果含有人的主观色彩,导致大米的检测结果较低,随着计算机技术的飞速发展,AI时代的到来,越来越多由人完成的工作将会被机器所取代。作为计算机技术一种的机器分析技术,现在已经被广泛的应用到了各个领域,并显示出了较好的效果,我们将机器分析技术应用到大米领域,可以弥补人工区分大米时主观情感强的问题,机器分析技术在分析大米等级时能够更加的公平客观,传统的大米分类主要集中在图像上,并取得了一定的研究进展。大米评论可以反映出其他用户对该大米的评价,但评论中的文本量非常少,出现评论信息的数据稀疏性问题。而基于多模态的大米分类系统研究相对而言比较少,这也使得大米图像、文本和视频等多模态数据分类方法成为研究探索的新方向。针对大米商品的数据的多模态性,本文提出基于典型相关分析图像和文本特征融合的大米分类方法,采用了基于大米图像和文本特征融合的方法对大米商品分类,提高大米分类的准确率。通过对大米图像轮廓特征的提取,得到了大米周长、面积、长和宽四个参数,并使用无监督的K-means聚类算法将提取到的特征聚为三个簇,并求其与训练集中的特...
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
本文编号:4037352
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图2-1大米评论数据集
-10-需要人为的对文本进行类别标注,通常这一过程所消耗的人力、物力开销较大,且对于类别不明确的文本的人为标注可能有误差,会对训练的过程产生影响。情感词典方法相比于机器学习的文本分类来讲,其主要优势在于在构建情感词典时不需要人为对文本数据进行标注,减少了任务的复杂度。情感词典文本....
图3-2有噪声的大
-26-米粒的性态特征,设定一个可区分的大米和大米碎屑的阈值C,分别将每个标记的目标与该阈值进行比较,如果大于等于该阈值的就认为是完整的大米粒,否则被认定为噪声,将其去除。通过上面的三个步骤,大米图片中的完整的大米粒就被保留了下来,而背景中的白色斑点和碎屑就会被去掉。处理结果如图....
图3-3迭代法二值化后的图像
-28-其中,10miiuip==是整体图像的灰度平均值;10miiuip==是阈值为T的灰度平均值,因此全部采样的灰度平均值为:00011u=wu+wu(3-15)两类间的方差可用下式求出:其中,()[][]22222001110101()()()()()()1()uwTuTT....
图3-4大津法二值化后的图像
-28-其中,10miiuip==是整体图像的灰度平均值;10miiuip==是阈值为T的灰度平均值,因此全部采样的灰度平均值为:00011u=wu+wu(3-15)两类间的方差可用下式求出:其中,()[][]22222001110101()()()()()()1()uwTuTT....
本文编号:4037352
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/4037352.html