本发明提供了一种基于GCNDT‑MacBERT神经网络框架的话语关系识别方法及系统,包括如下步骤:步骤S1:得到文本的词序列和句法依存树;步骤S2:对文本进行分字得到文本的字序列,得到包含上下文信息的字向量序列;步骤S3:根据词序列对字向量序列进行融合,获得词向量序列;步骤S4将句法依存树转化为图结构,得到更多信息的词向量序列;步骤S5:利用卷积神经网络对词向量序列进行向量特征融合并映射为固定长度的向量;步骤S6:将词向量序列输入多层感知机得出分类结果。本发明充分利用了文本内的上下文信息和语法关系,使用预训练模型和图卷积网络极大的促进模型学习文本的内在语义。
上海交通大学
江浩 | 傅洛伊
