当前位置:主页 > 管理论文 > 统计学论文 >

基于欠采样随机森林的Stacking模型研究 ——以半导体良率预测为例

发布时间:2021-09-06 13:02
  当前,半导体芯片通过多层次物理测试来判别芯片的优良性能。半导体芯片测试产生了庞杂的数据,这些数据背后隐藏着大量芯片质量的信息。本文探讨的是将数据挖掘技术应用于半导体行业,以提升半导体产品良率,降低半导体制造业成本。芯片测试产生的数据呈现出高维和不平衡两个特性。一般地,很多研究者分别对高维问题和不平衡问题进行了研究,提出了一系列成熟的算法,但是这些算法对半导体行业这种同时存在高维特性和不平衡特性的数据效果欠佳。本文首先对数据的高维特性和不平衡特性作了介绍,并阐述了当前针对这两个问题的处理方法,描述了数据挖掘的模型评价指标并定义了半导体行业评价指标。接着结合行业实际阐述了半导体良率预测问题的提出和应用场景以及半导体数据的预处理方法。然后分析了随机森林算法的优缺点,并在此基础上优化了随机森林算法,提出了基于欠采样随机森林的Stacking模型算法。最后用行业实际数据进行了验证,证明了该算法的有效性。这为数据科学替代一部分传统芯片测试方案提供可行性基础,为半导体封装测试大幅降低成本提供可能。 

【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:51 页

【学位级别】:硕士

【部分图文】:

基于欠采样随机森林的Stacking模型研究 ——以半导体良率预测为例


ROC曲线示意图

芯片,实物


华东师范大学硕士学位论文芯片来说是必须的,它使得芯片有了生命力,能够与外部设用。封装的主要作用有:护。封装使得芯片内部的集成电路与外界隔离,避免电质的腐蚀,同时便于安装和运输。接。封装使得芯片能够以标准化的通道和接口与外部连、电容等来保证正确的信号传递。规格。封装使得芯片都能够以相同的形状、尺寸进行加合。

ROC曲线,测试集,森林,ROC曲线


图 4-2 单个随机森林测试集的 ROC 曲线下来我们计算行业指标 DieSavingRate,根据 2.3.3 求得:11 12( ) 140843 8 (46 83)=99.2673%140843beforen s a aDieUsagen 12 11 21( ) 140843 8 83 (46 54)=99.140843aftern s a a aDieUsagen s=8,本例为 8 层芯片。模型的收益为:11 21(s-1) (8-1) 46 54ie =0.1903%140843a aD SavingRaten

【参考文献】:
期刊论文
[1]集成学习之随机森林算法综述[J]. 王奕森,夏树涛.  信息通信技术. 2018(01)
[2]不平衡数据的随机平衡采样bagging算法分类研究[J]. 季梦遥,袁磊.  贵州大学学报(自然科学版). 2017(06)
[3]面向不平衡数据集的改进型SMOTE算法[J]. 王超学,张涛,马春森.  计算机科学与探索. 2014(06)
[4]一种新的过采样算法DBSMOTE[J]. 刘余霞,刘三民,刘涛,王忠群.  计算机工程与应用. 2014(06)
[5]基于支持向量机的不平衡数据分类的改进欠采样方法[J]. 赵自翔,王广亮,李晓东.  中山大学学报(自然科学版). 2012(06)
[6]不平衡数据的降采样方法研究[J]. 林舒杨,李翠华,江弋,林琛,邹权.  计算机研究与发展. 2011(S3)
[7]拟自适应分类随机森林算法[J]. 马景义,吴喜之,谢邦昌.  数理统计与管理. 2010(05)
[8]美国经济恶化影响全球半导体业[J]. 莫大康.  电子产品世界. 2008(11)
[9]非平衡数据集Fisher线性判别模型[J]. 谢纪刚,裘正定.  北京交通大学学报. 2006(05)
[10]半导体封装形式介绍[J]. 梅万余.  电子工业专用设备. 2005(05)



本文编号:3387509

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3387509.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户250ff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com