基于多重进化矩阵的蛋白质特征向量构造方法

Computer Systems & Applications(2018)

引用 1|浏览2
暂无评分
摘要
特征向量的构造是蛋白质二级结构预测的一个关键间题. 现有的研究方法, 通常只使用BLOSUM62进化矩阵生成PSSM矩阵, 对蛋白质进化过程中存在的氨基酸残基突变现象缺乏考虑. 本文提出利用多重进化矩阵构造蛋白质特征向量, 其融合了不同进化时间的PSSM矩阵, 不仅能够很好地反映序列中氨基酸的位置信息, 而且能够反映序列进化过程中氨基酸位点发生突变产生的影响. 本文通过组合不同进化程度的矩阵来构造特征向量, 选用逻辑回归、随机森林和多分类支持向量机三种分类算法作为预测工具, 利用网格搜索法和交叉实验法优化参数, 在RS126、CB513和25PDB公用数据集上进行了若干组实验. 对比实验结果表明, 本文所提出基于多重进化矩阵的蛋白质特征向量构造方法能够有效提高蛋白质二级结构的预测精度.
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要