加急见刊

基于拟比对CNN方法的人类p53癌症基因二级数据库构建及分析

王丹丹; 李晨鸿; 徐海阳; 蔡蓉; 朱平 江南大学理学院; 江苏无锡214122

摘要:以NCBI维护的一级数据库为数据源建立人类癌症p53核苷酸序列二级数据库,该数据库设计主要包括4个方面:癌症信息、p53序列信息、样本信息和参考文献信息。以XML格式为中间格式保存一级数据库数据,并通过解析提交到二级数据库,初步实现数据的检索、链接和统计分析等功能。本文提出一种拟比对CNN方法对p53癌症基因序列进行比对分析,通过改善传统CNN相似度评估公式,增强两序列全局比对相似度的敏感性和可靠性。结果表明,将改进的序列比对算法应用于乳腺癌和非小细胞肺癌p53外显子基因序列比对,发现外显子5突变后序列比对结果存在较大差异,可以作为区别这两种癌症的参考。此外,通过将一级数据库以XML形式转化成二级数据库,实现了网络数据与本地数据的动态交换。

注: 保护知识产权,如需阅读全文请联系食品与生物技术学报杂志社