基于多元信息嵌入与协同神经网络的力学实体识别算法

Computer Engineering(2023)

引用 0|浏览0
暂无评分
摘要
自动抽取力学问题中的关键实体是力学问题自动解答的重要手段.然而,与开放域相比,力学问题具有大量的专业词汇和较长的实体,其识别难度高,准确率低.针对该问题,基于图注意力网络(GAT)和Transformer编码器提出一种用于力学问题关键实体抽取的实体识别算法.针对汉语的特点设计一个包括字符信息、词汇信息和部首信息的多元信息嵌入用于增强中文句子表示.提出结构图和语境图两个图模型对中文句子进行建模,并设计一种协同架构,该架构使用两个独立的GAT整合多元信息并学习句子的上下文信息.为平衡词汇信息与部首信息对中文字符的影响,提出一种协同Transformer架构,该架构由字符-词汇Transformer与字符-部首Transformer构成,并增加词汇-部首注意力偏置,从而增强模型的识别能力.在自建的数据集上进行多组对比实验,结果表明,在力学问题实体识别任务中,相对于WCGCN算法,该算法在精度、召回率和F1值上分别提高1.92、0.99和1.44个百分点,能够有效提取力学问题中的关键信息.
更多
关键词
Named Entity Recognition(NER),Multi-Meta Information Embedding(MMIE),Graph Attention Network(GAT),Transformer architecture,attention mechanism
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要