一种全长circRNA上蛋白绑定核苷酸位点的预测方法,将全长circRNA切分成片段后输入至一维CNN网络后,将得到的局部高级抽象特征分别输入至BiGRU网络和Transformer编码器的双分支网络,分别得到输入数据的长依赖表示特征和基于全局注意力的circRNA序列表示,经拼接后输入MLP分类器,最后通过中值滤波根据相邻核苷酸的结合信息去除假结合核苷酸降低假阳率,通过分数二值化策略获得预测的结合核苷酸,通过积分梯度识别关键序列内容,得到预测的全长circRNA与RBP结合基序。本发明能够以核苷酸分辨率探索全长circRNA上RBP结合情况,准确预测RBP结合核苷酸并检测其结合基序。
