基于特征融合的中文分词研究
Intelligent Computer and Applications(2022)
摘要
中文分词是自然语言处理中一项重要的基础任务.由于中文词汇存在多义词、同音字等特殊性,能够准确地完成分词任务是近年来中文分词研究面临的挑战之一.因此,本文提出了一种融合字符特征、拼音特征、五笔输入特征的共享BiL?STM-CRF模型,通过在训练过程中共享LSTM-网络来有效地融合语言特征.经大量数据集实验表明,特征融合能显著提高标记的准确性.在没有利用任何外部词汇资源的情况下,AS和CityU数据集中准确率可分别达到96.9%和97.3%.
更多AI 理解论文
溯源树
样例
![](https://originalfileserver.aminer.cn/sys/aminer/pubs/mrt_preview.jpeg)
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要