Chrome Extension
WeChat Mini Program
Use on ChatGLM

融合词典特征的Bi-LSTM-WCRF中文人名识别

Yusi CHENG, Yuntao SHI

Journal of Chinese Information Processing(2020)

Cited 2|Views4
No score
Abstract
受限于标注语料的领域和规模以及类别不均衡,中文人名识别性能偏低.相比人名识别训练语料,人名词典获取较为容易,利用词典提升人名识别性能有待进一步研究.该文提取人名词典特征,融入到双向长短期记忆(Bi-LSTM)网络模型中,在损失函数中提高人名标签权重,设计加权条件随机场(WCRF).从人名词典中获取姓和名相关的特征信息,Bi-LSTM网络捕获句子中上下文信息,WCRF提高人名识别的召回率.在《人民日报》语料和工程法律领域语料上进行实验,结果表明:在领域测试语料上,与基于隐马尔可夫模型的方法相比,人名识别的F1值提高18.34%,与传统Bi-LSTM-CRF模型相比,召回率提高15.53%,F1提高8.83%.WCRF还可以应用到其他类别不均衡的序列标注或分类问题中.
More
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined