面向数控机床设计知识图谱构建的实体识别

LIU Hao,ZHANG Jian-ye, Lü Zhang-cheng, CHEN Zhe-yao

Science Technology and Engineering(2023)

引用 0|浏览0
暂无评分
摘要
为解决数控(computer numerical control,CNC)机床设计知识图谱构建过程中关键实体的抽取问题,制定了数控机床领域知识分类标准和标注策略,构建了领域数据集,并提出了一种基于RoBERTa(robustly optimized BERT pretraining approach)的数控机床设计知识实体识别方法.首先,利用数控机床领域数据集对RoBERTa模型进行微调,再利用RoBERTa对文本编码,生成向量表示;其次,采用双向长短期记忆(bidirectional long short-term memory,BiLSTM)网络提取向量特征;最后,利用条件随机场(conditional random field,CRF)推理出最优结果,进而为实体打上标签.实验结果表明:模型在数据集上的F1值为86.139%;对多数关键实体的F1值大于85%;相比其他模型提升2% ~18%.可见该方法在数控机床设计知识实体识别中具有明显优势,能够识别机床设计知识文本包含的关键实体,为数控机床设计知识图谱构建提供了数据基础.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要