一种α螺旋跨膜蛋白质拓扑结构预测方法,根据跨膜α螺旋TMH的定义组织训练集、验证集和测试集;对训练集、验证集和测试集中的序列提取位置特异性打分矩阵PSSM、HMM、水溶性、二级结构、扭转角和亲水指数特征;使用训练集训练基于整条序列的深度残差网络模型和基于滑动窗口的深度残差网络模型。将两种网络的输出取平均值集成后,采用动态阈值算法得到TMH区域;使用训练集训练支持向量机模型。模型的输入是其他区域non‑TMH和TMH区域的交界部分;输出是non‑TMH相对于细胞膜的位置。首先预测蛋白质中的TMH区域,然后预测non‑TMH的位置,结合两部分的预测结果,就可以得到蛋白质最终的拓扑结构。
上海交通大学
沈红斌 | 冯世豪 | 杨静
