基于门控多头注意力机制的视频摘要

王坤阳, 高伟,滕国伟

wf(2022)

Cited 0|Views1
No score
Abstract
视频摘要技术能降低原始视频冗余程度,减小视频存储空间和浏览时间.现有的视频摘要方法大多采用递归结构,不仅计算复杂而且模型很难并行化运行.为了解决这个问题,提出了一种基于门控多头注意力机制的视频摘要网络模型(GMPAVS),该模型包含两种多头自注意模块,能同时捕获时间帧之间的全局和局部依赖关系,同时引入了相对位置编码和绝对位置编码,用于捕获视频的时间相关性.在两个基准数据集SumMe和TVSum上的实验结果证明了该方法的有效性.
More
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined