基于点互信息和注意力机制的文化元素命名实体识别

2026.05.01点击:

摘要:<正>为了解决传统文化语料数据集匮乏,以及古汉语存在一词多义现象,导致古文表征使用Word2vec难以表示古文丰富语义信息等问题,本文构建了传统文化语料数据集,并提出了一种基于点互信息和注意力机制的文化元素命名实体识别算法。首先,为捕捉词汇间语义关联关系,在嵌入层引入点互信息(Pointwise Mutual Information,PMI)以增强文本向量表示,丰富语义信息;其次,在上下文编码层采用BiLSTM-CRF模型,并在其中引入自注意力机制,聚焦于文本关键信息,增强文化元素识别效果;最后,实验结果表明,本文提出的算法的准确率、

专辑: 信息科技;哲学与人文科学

专题: 中国语言文字;计算机软件及计算机应用

分类号: TP391.1;H13