增强型稀疏后缀数组索引的高错误率reads比对
发布时间:2021-08-20 15:54
生物序列比对有助于定位序列之间的相似区域.测序技术的快速发展需要序列比对算法能够灵活地处理更长且错误率更高的reads序列.通过增强型稀疏后缀数组对参考序列建立索引,自适应地调整种子的最小长度,寻找参考序列与reads序列之间的最大精确匹配和超大精确匹配,以此进行种子扩展,提出一种改进的long-read比对算法.与已有代表性的算法相比,模拟和真实数据实验结果表明,本文算法在获得基本相同精确度的前提下,召回率明显提升,敏感度总体上更高,且能够识别更多的reads序列.
【文章来源】:小型微型计算机系统. 2019,40(08)北大核心CSCD
【文章页数】:5 页
【部分图文】:
不同错误率的模拟数据上算法的精确度Fig.1Accuracyofalgorithmsforsimulatedreadswith
和10%(错误率取Wgsim的默认值)时,图3和图4分别给出了Kart与sufKart算法的精确度和召回率.图2不同错误率的模拟数据上算法的召回率Fig.2Recallrateofalgorithmsforsimulatedreadswithdifferenterrorrates由图3和图4可知:当突变率高达8%以上时,不论是精确度还是召回率,sufKart算法几乎均高于Kart算法.图3不同突变率的模拟数据上算法的精确度Fig.3Accuracyofalgorithmsforsimulatedreadswithdifferentmutationrates在实际应用中,各类测序平台产生的reads不仅仅只包含简单的插入删除错误而且还包括比较复杂的结构变异.因此,本文生成不同错误率和突变率的模拟reads数据集进行实验.图4不同突变率的模拟数据上算法的召回率Fig.4Recallrateofalgorithmsforsimulatedreadswithdifferentmutationrates表1给出了长度1000bp,错误率分别为2%、5%、10%和15%,突变率为2%、5%、8%和10%时,Kart和sufKart算法对模拟数据reads进行实验获得的精确度和召回率,其中“E02-R02”表示错误率为2%,突变率为2%的reads数据集,其他类推.从表1可以看出:当每组模拟数据reads的(错误率,突变率)分别为(2%,5%)、(2%,8%)、(5%,2%)和(5%,5%)时,sufKart算法的精确度高于Kart算法,且召回率几乎表1不同错误率和突变率的模拟数据上算法的精确度和召回率Table1Accuracyandrecallrateofalgorithmswithdifferenterrorratesandmutationratesonsimulationdata数据集KartsufKart精确度(%)召回率(%)精确度(%)召回率(%)E02-
和10%(错误率取Wgsim的默认值)时,图3和图4分别给出了Kart与sufKart算法的精确度和召回率.图2不同错误率的模拟数据上算法的召回率Fig.2Recallrateofalgorithmsforsimulatedreadswithdifferenterrorrates由图3和图4可知:当突变率高达8%以上时,不论是精确度还是召回率,sufKart算法几乎均高于Kart算法.图3不同突变率的模拟数据上算法的精确度Fig.3Accuracyofalgorithmsforsimulatedreadswithdifferentmutationrates在实际应用中,各类测序平台产生的reads不仅仅只包含简单的插入删除错误而且还包括比较复杂的结构变异.因此,本文生成不同错误率和突变率的模拟reads数据集进行实验.图4不同突变率的模拟数据上算法的召回率Fig.4Recallrateofalgorithmsforsimulatedreadswithdifferentmutationrates表1给出了长度1000bp,错误率分别为2%、5%、10%和15%,突变率为2%、5%、8%和10%时,Kart和sufKart算法对模拟数据reads进行实验获得的精确度和召回率,其中“E02-R02”表示错误率为2%,突变率为2%的reads数据集,其他类推.从表1可以看出:当每组模拟数据reads的(错误率,突变率)分别为(2%,5%)、(2%,8%)、(5%,2%)和(5%,5%)时,sufKart算法的精确度高于Kart算法,且召回率几乎表1不同错误率和突变率的模拟数据上算法的精确度和召回率Table1Accuracyandrecallrateofalgorithmswithdifferenterrorratesandmutationratesonsimulationdata数据集KartsufKart精确度(%)召回率(%)精确度(%)召回率(%)E02-
【参考文献】:
期刊论文
[1]CPU和GPU协同并行加速多生物序列比对[J]. 杨春燕,钟诚. 小型微型计算机系统. 2016(12)
本文编号:3353788
【文章来源】:小型微型计算机系统. 2019,40(08)北大核心CSCD
【文章页数】:5 页
【部分图文】:
不同错误率的模拟数据上算法的精确度Fig.1Accuracyofalgorithmsforsimulatedreadswith
和10%(错误率取Wgsim的默认值)时,图3和图4分别给出了Kart与sufKart算法的精确度和召回率.图2不同错误率的模拟数据上算法的召回率Fig.2Recallrateofalgorithmsforsimulatedreadswithdifferenterrorrates由图3和图4可知:当突变率高达8%以上时,不论是精确度还是召回率,sufKart算法几乎均高于Kart算法.图3不同突变率的模拟数据上算法的精确度Fig.3Accuracyofalgorithmsforsimulatedreadswithdifferentmutationrates在实际应用中,各类测序平台产生的reads不仅仅只包含简单的插入删除错误而且还包括比较复杂的结构变异.因此,本文生成不同错误率和突变率的模拟reads数据集进行实验.图4不同突变率的模拟数据上算法的召回率Fig.4Recallrateofalgorithmsforsimulatedreadswithdifferentmutationrates表1给出了长度1000bp,错误率分别为2%、5%、10%和15%,突变率为2%、5%、8%和10%时,Kart和sufKart算法对模拟数据reads进行实验获得的精确度和召回率,其中“E02-R02”表示错误率为2%,突变率为2%的reads数据集,其他类推.从表1可以看出:当每组模拟数据reads的(错误率,突变率)分别为(2%,5%)、(2%,8%)、(5%,2%)和(5%,5%)时,sufKart算法的精确度高于Kart算法,且召回率几乎表1不同错误率和突变率的模拟数据上算法的精确度和召回率Table1Accuracyandrecallrateofalgorithmswithdifferenterrorratesandmutationratesonsimulationdata数据集KartsufKart精确度(%)召回率(%)精确度(%)召回率(%)E02-
和10%(错误率取Wgsim的默认值)时,图3和图4分别给出了Kart与sufKart算法的精确度和召回率.图2不同错误率的模拟数据上算法的召回率Fig.2Recallrateofalgorithmsforsimulatedreadswithdifferenterrorrates由图3和图4可知:当突变率高达8%以上时,不论是精确度还是召回率,sufKart算法几乎均高于Kart算法.图3不同突变率的模拟数据上算法的精确度Fig.3Accuracyofalgorithmsforsimulatedreadswithdifferentmutationrates在实际应用中,各类测序平台产生的reads不仅仅只包含简单的插入删除错误而且还包括比较复杂的结构变异.因此,本文生成不同错误率和突变率的模拟reads数据集进行实验.图4不同突变率的模拟数据上算法的召回率Fig.4Recallrateofalgorithmsforsimulatedreadswithdifferentmutationrates表1给出了长度1000bp,错误率分别为2%、5%、10%和15%,突变率为2%、5%、8%和10%时,Kart和sufKart算法对模拟数据reads进行实验获得的精确度和召回率,其中“E02-R02”表示错误率为2%,突变率为2%的reads数据集,其他类推.从表1可以看出:当每组模拟数据reads的(错误率,突变率)分别为(2%,5%)、(2%,8%)、(5%,2%)和(5%,5%)时,sufKart算法的精确度高于Kart算法,且召回率几乎表1不同错误率和突变率的模拟数据上算法的精确度和召回率Table1Accuracyandrecallrateofalgorithmswithdifferenterrorratesandmutationratesonsimulationdata数据集KartsufKart精确度(%)召回率(%)精确度(%)召回率(%)E02-
【参考文献】:
期刊论文
[1]CPU和GPU协同并行加速多生物序列比对[J]. 杨春燕,钟诚. 小型微型计算机系统. 2016(12)
本文编号:3353788
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3353788.html