基于机器学习的植物表型基因的文献分类及其应用
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图2-3?CBOW和skip-gram模型示意图??Fig.?2-3?Schematic?diagram?of?CBOW?and?skip-gram?models??
于其??他神经网络,运行速度更快,而且不需要手工标记标签来创建训练集。CB0W模型??又叫连续词袋模型是根据目标词上下文的词向量对该词的词向量进行预测,而??Skip-gram贝U相反,Skip-gram又叫跳节模型,逆转CBOW的因果关系,通过目标词??的词向量预测上下文的词向....
图3-1文献分类流程图??Fig.?3-1?Document?classification?flow?chart??本章主要介绍的是文献的预处理和特征选择,下文是详细介绍
文献清洗??文献切分??表型数据集?S?词干提取??5特征选择?S?分类器??去除停用词??文献预处理??图3-1文献分类流程图??Fig.?3-1?Document?classification?flow?chart??本章主要介绍的是文献的预处理和特征选择,下文是详细介绍。?....
图3-2株高类别的植物表型文档???
omology?was?observed?between?Bt2?and?L2?in?their?coding?region,?but?homology?was?poor?in?the?3'?noncoding?border.??This?result?demonstrates?....
图3-4?spike词向量??Fig.?3-4?spike?word?vector??
容合并一起过程中,要让文本输出格式符合utf-8编码要求。??植物表型基因语料库共收集到超过100000个单词,嵌入100维的词向量,产生??了庞大的权重矩阵,在神经网络中进行梯度下降速率较慢,由于需要训练数据来调整??权重避免过拟合,为了优化训练过程,避免权重矩阵过大,本实验使....
本文编号:3950859
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3950859.html