面向自然场景文本检测的FPPMAC模型

Communications Technology(2022)

引用 0|浏览4
暂无评分
摘要
为进一步解决自然场景下文本方向多变、形状不规则以及分布密集等分割问题,提出了一个由特征金字塔网络(Feature Pyramid Network,FPN)和并行多空洞卷积(Parallel Multiscale Atrous Convolution,PMAC)模块构成的FPPMAC模型.其中,PMAC模块由4个空洞卷积层组成,可同时提供4种不同大小的感受野.此外,使用循环收缩算法从已知文本区域得到多个形状相同的子文本区域,并将其与FPPMAC模型所生成的多个分割图相匹配,由此可作为分割图的真实标签.利用标准数据集ICDAR2015、CTW1500进行实验,实验结果表明,FPPMAC模型的准确率分别达到了88.49%和89.17%,相较于其他经典模型,能够更准确地定位文本区域.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要