当前位置:主页 > 科技论文 > 基因论文 >

基于显露子串挖掘的基因序列模体识别算法

发布时间:2018-10-13 18:05
【摘要】:染色质免疫共沉淀技术将模体识别问题拓展到了全基因组范围,但因数据量过大,传统的模体识别算法往往运算过慢从而无法很好地解决此问题。为了解决传统算法的缺点,提出一种用于Ch IP-seq数据的替换显露子串寻找问题的算法Fast ESE,通过测试集和控制集的比对找出显露子串并搜索其(l,d)替换实例组成相应的位置概率矩阵,再使用权重信息量对这些子串进行聚类,最终找出集合中的替换显露子串。使用真实的Ch IP-seq数据对该研究算法进行有效性验证,实验结果表明,Fast ESE可以在合理时间内有效解决Ch IP-seq中的模体识别问题。
[Abstract]:Chromatin immune coprecipitation technology extends motif recognition to the whole genome, but because of the large amount of data, the traditional motif recognition algorithm is often too slow to solve the problem. In order to solve the shortcoming of the traditional algorithm, a new algorithm, Fast ESE, which is used to find the replacement exposure substring of Ch IP-seq data, is proposed. By comparing the test set with the control set, Fast ESE, finds the exposed substring and searches for its (LLD) replacement instance to form the corresponding position probability matrix. Then the weight information is used to cluster these sub-strings, and finally the replacement exposed sub-strings in the set are found. The validity of the algorithm is verified by using real Ch IP-seq data. The experimental results show that, Fast ESE can effectively solve the motif recognition problem in Ch IP-seq within a reasonable time.
【作者单位】: 长安大学电子与控制工程学院;长安大学信息工程学院;
【基金】:国家自然科学青年基金(61501058) 陕西省自然科学青年基金(2016JQ6075) 中央高校基本业务费(310832161008)
【分类号】:Q811.4

【相似文献】

相关期刊论文 前10条

1 王春连;胡秀珍;;用二次判别方法识别蛋白质β-发夹模体[J];生物物理学报;2009年04期

2 李慧敏;胡俊;张静;;果蝇核糖体蛋白基因中潜在转录协同作用模体的统计分析[J];云南大学学报(自然科学版);2010年03期

3 胡秀珍;李前忠;;矩阵打分的方法应用于蛋白质β-发夹模体的识别[J];内蒙古大学学报(自然科学版);2007年06期

4 姜雪;胡秀珍;;打分矩阵方法在β-发夹模体识别中的应用[J];生物信息学;2008年04期

5 岳俊杰;谭明峰;周围;王夏;李北平;王月兰;梁龙;;细菌黏附素序列模体分析[J];生物技术通讯;2008年05期

6 姜雪;;蛋白质βαβ模体序列的统计分析及其识别[J];昆明理工大学学报(理工版);2010年05期

7 贾少春;胡秀珍;;基于添加功能位点信息的组合向量预测β-发夹模体[J];内蒙古工业大学学报(自然科学版);2012年03期

8 陈丹;梁振霞;李慧敏;;组合调控中过表达模体对距离的统计检验[J];基因组学与应用生物学;2013年01期

9 宋航宇;胡秀珍;冯振兴;姜卓;孙利霞;;基于统计特征的酶蛋白质中特殊模体βαβ的预测[J];生物物理学报;2013年09期

10 叶玉珍,解涛,丁达夫;蛋白质功能基团三维模体及其应用[J];科学通报;2000年12期

相关会议论文 前1条

1 李彩艳;胡秀珍;;蛋白质中两种Strand-Loop-Strand模体的判断[A];第十次中国生物物理学术大会论文摘要集[C];2006年

相关博士学位论文 前8条

1 于强;生物序列模体发现算法研究[D];西安电子科技大学;2014年

2 宋涛;基于谱隐马尔可夫模型的蛋白质序列模体识别方法研究[D];大连理工大学;2015年

3 刘丙强;原核生物中的转录调控模体预测研究[D];山东大学;2010年

4 周川;原核生物调控模体和调节子预测算法研究[D];山东大学;2014年

5 周鹏;生物非键模体[D];浙江大学;2011年

6 张凌慧;基因组中顺式调控模体的特征分析与计算预测[D];中国协和医科大学;2005年

7 刘立芳;生物信息学中的多序列比对与模体识别问题研究[D];西安电子科技大学;2006年

8 张懿璞;转录因子结合位点识别问题的算法研究[D];西安电子科技大学;2014年

相关硕士学位论文 前10条

1 马平;基因组序列8-mer模体使用分离与不同序列组成和物种进化的关系[D];内蒙古大学;2015年

2 刘国君;酵母基因组8-mer模体使用的进化分离与功能分析[D];内蒙古大学;2015年

3 王晶;ChIP-Seq中DNA模体挖掘工具的比较[D];苏州大学;2015年

4 苏润梅;DNA序列中模体识别算法研究[D];电子科技大学;2014年

5 杨志枫;原核生物调控模体预测与分析[D];山东大学;2016年

6 余景洪;蛋白质批量同源性搜索及DNA模体识别算法研究[D];大连理工大学;2016年

7 孙玲;基于约束的方法查找细胞周期网络的骨干模体[D];西安电子科技大学;2011年

8 张瀚元;基因转录调控模体预测的研究及其在线服务开发[D];吉林大学;2015年

9 彭佳杰;生物网络中基于模体相关性分析的模体功能预测[D];哈尔滨工业大学;2010年

10 宋航宇;酶蛋白质中β-发夹和βαβ特殊模体的预测[D];内蒙古工业大学;2014年



本文编号:2269473

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2269473.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户794f6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com