中医古籍文本术语命名实体识别的研究进展与挑战

China Journal of Traditional Chinese Medicine and Pharmacy(2021)

Cited 0|Views3
No score
Abstract
古籍数字化是文献处理的趋势,如何将命名实体识别技术应用于中医古籍实体提取是本研究的目的 所在.文章分析了中医古籍文本在进行命名实体建模时的难点,提出应抓住古籍术语需置于一定的语义场中才能被准确理解的本质特点,才能建立适用于中医古籍的命名实体识别模型的核心观点,并以《伤寒论》"三阴三阳篇"症状术语为例,将古籍语言特点加入条件随机场模型中,结果显示中医古籍症状术语识别工作若仅使用现代汉语分词与词性标注软件,识别F值为68.48%,加入古籍所属时代的症状语言形式的特点,模型识别州直可最终提升至79.52%.加入越多的语言特点,越可逐渐提高模型识别F值.从而验证了语言环境对建模的重要作用,只有还原古籍术语的语义场,才能真正建立适用于中医的命名实体识别模型.
More
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined