基于BERT-BiLSTM-CRF的农产品信息文本命名实体识别研究及应用展望

He Zikang, Yang Yong,Yang Guofeng, Zhang Xinyu

Agricultural Outlook(2022)

引用 0|浏览0
暂无评分
摘要
命名实体识别是从农产品信息文本数据中有效抽取信息的关键一步,旨在从非结构化文本中确定与农产品特性相关的命名实体.农业领域的命名实体识别研究大多集中在农业病虫害领域,关于农产品信息文本的实体识别研究较少,通过采用BMES标注的方式对爬虫获取的农产品信息文本数据进行标注,提出融合BERT的BiLSTM-CRF深度学习模型对该文本数据进行实体抽取.将该模型与多种神经网络模型的实验结果比较发现,融合BERT的BiL-STM-CRF模型对农作物、地区、富含营养成分等3种命名实体识别的准确率和召回率分别为82.25%和84.54%,明显优于IDCNN-CRF等神经网络模型,说明该方法能有效识别抽取农产品信息文本数据命名实体.基于此,命名实体识别作为中文文本信息抽取的关键技术,在农产品信息推荐系统、智能问答等方面将会有广泛的应用前景.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要