基于正则算法和命名实体识别模型的95598工单结构化信息自动提取

Power Systems and Big Data(2021)

引用 1|浏览1
暂无评分
摘要
在95598客户投诉意见工单的处理过程中,常出现结构化信息提取消耗时间长、信息提取侧重点有偏差、无法精准定位客户诉求热点等问题.目前投诉意见工单的信息皆为人工逐条进行信息提取,解决好结构化信息提取自动化,才能大幅度提升效率,实现资源有效分配.本文主要用正则表达式和命名实体识别模型相结合的方式,针对投诉意见工单信息的提取、客户诉求热点的定位给出一套完整的解决方案.针对用户编号、电能表编号、电话号码等有具体规则的信息采用正则表达式进行提取,而针对用户投诉原因关键点、台区名称等等无法用统一规则来界定的文本信息则采用命名实体识别模型来进行信息提取,实现信息提取流程自动化.并且在结构化信息基础上,利用数理统计方法对客户诉求热点进行定位.该模型对信息结构化提取的准确率在85%-95%左右.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要