|本期目录/Table of Contents|

[1]王金甲,崔琳,杨倩,等.基于注意力门控卷积循环神经网络的通用音频标记 [J].复旦学报(自然科学版),2020,03:360-367.
点击复制

基于注意力门控卷积循环神经网络的通用音频标记
(PDF)

《复旦学报》(自然科学版)[ISSN:/CN:]

期数:
2020年03
页码:
360-367
栏目:
出版日期:
2020-06-25

文章信息/Info

Title:
-
作者:
王金甲崔琳杨倩纪绍男
Author(s):
-
关键词:
-
Keywords:
-
分类号:
-
DOI:
-
文献标识码:
A
摘要:
研究了注意力门控卷积循环神经网络的通用音频标记问题.DCASE 2018挑战任务2的音频样本的数据集过少,容易造成过拟合问题.为了减少过拟合问题,采用数据增强方法,dropout策略.采用可学习的上下文门控模块以帮助选择与音频类最相关的特征.采用时间注意力机制关注音频事件的相关帧并且忽略不相关帧.在DCASE2018任务2的数据集上评估了提出的模型,开发集和测试集的平均准确率(MAP@3得分)分别为96.1%和92.4%,远高于此次竞赛的基线系统的平均准确率.
Abstract:
-

参考文献/References

-

备注/Memo

备注/Memo:
-
更新日期/Last Update: 2020-07-02