长短答案分类指导的机器阅读理解方法

Journal of Chinese Information Processing(2023)

引用 0|浏览5
暂无评分
摘要
针对现有机器阅读理解模型存在长答案不完整、短答案冗余,即模型对答案的边界信息捕捉能力有待提升问题,该文基于"问题分类+答案预测联合学习"的流水线式策略,提出了一种通过答案长短特征分类指导机器阅读理解的神经网络模型.该方法采用预训练语言模型对问题和文章进行语义表示,并以待预测答案的长短类型对相应问题进行分类,然后将问题分类的结果用于指导阅读理解中的答案预测模块,最终以多任务学习的方式得到全部答案的开始位置和结束位置.实验结果表明,该模型在CMRC2018 数据集上的EM平均值为 67.4%,F1 平均值为 87.6%,相比基线模型,分别提升了 0.9%和 1.1%.在自建的中文桥梁检测问答数据集上的 EM平均值为89.4%、F1 平均值为 94.7%,相比基线模型,分别提升了 1.2%和 0.5%.在更少训练集规模的 CMRC2018 和中文繁体数据集DRCD上,该文方法也优于基线模型.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要