乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

一种基于机器学习和氨基酸序列信息的鲜味肽识别阈值预测方法

本发明提供一种基于机器学习和氨基酸序列信息的鲜味肽识别阈值预测方法,包括:获取鲜味肽数据,并对所述鲜味肽数据进行预处理;通过分子指纹、分子描述符和氨基酸矩阵对预处理后的鲜味肽数据进行数字化表征;通过皮尔森相关性、F回归、互信息和包裹式对数字化表征后的鲜味肽数据进行特征筛选,得到筛选后的分子描述符、氨基酸计数和分子指纹;通过筛选后的分子描述符、氨基酸计数和分子指纹进行构建子模型,并通过回归模型评价指标进行评价,选择效果最好的前6个子模型进行集成模型构建,集成模型通过梯度提升机模型进行拟合;通过构建好的集成模型进行鲜味肽识别阈值预测。本发明可以为大量鲜味肽进行定量预测,从而为大批量筛选鲜味肽提供定量参考。
上海交通大学
刘源 | 崔智勇 | 王文利 | 王悦明 | 郑钰倩

More Posts

Send Us A Message