融合字符串特征的维吾尔语形态切分

Computer Simulation(2022)

引用 0|浏览1
暂无评分
摘要
维吾尔语是一种典型的低资源黏着语,在形态方面存在组合性和歧义性等技术处理难点.针对维吾尔语未登录词和低频率语素的识别困难等问题,提出融合字符串特征的形态切分方法.先利用多尺度卷积神经网络提取字符串特征,再利用双向长短期记忆模型对字符和字符串进行上下文编码,最后使用CRF推断.实验结果表明,上述模型优于现有的维吾尔语形态切分模型,充分利用多尺度字符串特征有利于提高F-Score等方面性能.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要