基于LSTM-CRF的中医医案症状命名实体抽取研究

Chinese Journal of Information on Traditional Chinese Medicine(2021)

引用 2|浏览3
暂无评分
摘要
目的 研究中医医案中症状命名实体的抽取方法,为中医临床信息的自动化抽取提供方法学参考.方法 基于已标注过的名老中医诊治肺癌医案构建长短时记忆网络(LSTM)与条件随机场(CRF)混合模型,应用LSTM层结合预训练字向量抽取医案的抽象特征,通过CRF进行序列标注,使用多分类评价指标对抽取结果进行评价.同时设计不同变体的算法,在肺癌数据集上进行测试,分析比较不同模型的优劣.结果 带有Peephole机制的双向LSTM识别效果最好,其症状词的3个评价指标准确率(P)、召回率(R)和F1-测度值(F1)分别为0.844 6±0.022 7、0.840 2±0.019 2、0.842 3±0.019 4,程度词分别为0.813 5±0.028 0、0.833 4±0.045 6、0.822 9±0.032 6,部位词分别为0.766 3±0.082 7、0.720 6±0.078 7、0.740 5±0.068 2.结论 利用带有 Peephole机制的双向LSTM能够有效实现中医医案症状命名实体识别,提高传统CRF模型的召回能力.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要