近期,国际权威的“声音事件分类与检测学术评测-IEEE AASP Challenge on DCASE 2021”落下帷幕,在其“任务5-少样本生物声学事件检测(Few-shot Bioacoustic Event Detection)”评测任务中,信息与机电工程学院“上海师范大学-云知声 自然人机交互联合实验室” 龙艳花副教授指导的研究生唐甜甜、梁芸浩提交的“SHNU系统”综合性能排名第二,这表明学院自然人机交互研究团队在声音事件检测领域具有较好的研究基础和快速工程系统开发能力,其在该领域的算法与技术积累已处于国际先进水平。
“上海师范大学-云知声 自然人机交互”联合实验室在Task 5中系统性能排名第二
截图来源:DCASE 2021(IEEE AASP Challenge)官方网站:http://网址未加载munity/challenge2021/task-few-shot-bioacoustic-event-detection-results
研究团队参加的“少样本生物声音事件检测”(Task 5),该技术所涉及的领域包括声学、智能感知信息处理、人工智能、深度统计分析等,可广泛应用于“稀有动物保护”“环境保护与监测”“声学照相机”和“工业听诊器”等“A.I.+工业”的应用场景,具有重要的学术及工程应用价值。DCASE Task5-Few-shot Bioacoustic Event Detection的目标是在比赛官方提供的录制音频资料中检测出动物(哺乳动物和鸟类)叫声的时间戳。该任务仅提供5个待测动物叫声的样例。要求参赛者可以从哺乳动物或鸟类的五个声音样例中提取信息,并在录音中检测和分类声音。流程如下:
任务流程
“SHNU3”系统
在“SHNU3”系统中,主要考虑由于训练数据少和训练数据与测试数据不匹配而带来的过拟合问题。针对该问题,提出了基于原型网络的预训练和特征正则化(Embedding Propagation)的一套系统。系统主要分为三个阶段:一是基于AudioSet的预训练,首先将录制的包含生物声音事件的原始音频重采样,然后提取手工特征送入高维特征提取器,利用输出的高维特征向量计算出类原型,接着实现度量分类。预训练系统如下图:
预训练系统
二是微调训练阶段,高维特征提取器输出的高维特征向量先经过Embedding Propagation处理得到嵌入插值向量,再计算类原型来实现度量分类。Embedding Propagation效果图如下:
Embedding Propagation效果图
三是目标声音事件检测阶段,将原始音频经过一系列适应模型的处理后送入训练好的N个模型中进行检测,分别得出相应的正例得分序列,并对同一条音频的N个正例得分序列进行取平均融合,以此来增强模型预测结果的稳定性,其后,为了将间断的声音事件接续起来并剔除干扰,对融合后的正例得分序列进行的中值滤波及峰值挑选的后处理操作,最后输出得到音频时间戳。检测系统设计如下图:
检测系统
该系统设计了两阶段声学模型训练策略和特征正则化方法,在加强模型对高维特征的表征的同时提升了模型鲁棒性和泛化能力。在阶段一学习通用的泛化表征模型,在阶段二有针对性的学习定制化数据的表征方式,有利于提升测试阶段未见过数据的度量分类性能。检测阶段进行得分融合的方案,减小了随机性的干扰,提高了模型的稳定性,同时可调节滤波及峰值挑选的后处理方式提高了模型对事件时间戳检测的准确性。此次参赛结果表明,我校自然人机交互实验室紧跟国际音频研究新领域,不断探索进取并活跃在技术的最前沿。
赛事简介
DCASE(Detection and Classification of Acoustic Scenes and Events)Challenge是由IEEE(Institute of Electrical and Electronics Engineers)举办的声音场景识别和事件检测学术评测,自2013年组织发起以来,至今已举办七届,是国际上声音事件检测领域最权威的学术评测。本届评测共设置了六个任务,吸引了包括英特尔、三星等国际公司和清华大学、北京大学、中国科学技术大学、新加坡南洋理工大学、美国约翰霍普金斯大学等顶级高校在内共127支队伍、394个有效系统参赛。
团队介绍
“上海师范大学-云知声 自然人机交互联合实验室”于2017年正式成立, 该实验室由上海师范大学与语音领域知名企业-云知声(上海)智能科技有限公司联合共建。双方以该实验室作为平台,以工业界实际应用需求为导向,结合自身优势,在科研平台建设、数据资源共享、成果转化等方面开展深入持续性合作,共同研究自然人机交互技术中的一些关键性、综合性问题,为智能语音领域的科学研究与工程实践培养高质量人才。
龙艳花,上海师范大学信息与机电工程学院电气信息系研究生导师。主要从事人工智能、深度学习、智能语音信息处理相关方面的研究,主持并参与过国家自然科学基金、十一五国防预研、英国EPSRC等项目。在语音识别、语音增强与分离、声音事件检测等领域做出了一定的研究成果,在语音领域两大顶级国际会议ICASSP、INTERSPEECH 上发表多篇学术论文,担任“上海师范大学-云知声 自然人机交互”联合实验室负责人,多次带领实验室成员参与国际语音领域学术评测并取得优异成绩。
供稿:科技处、信息与机电工程学院
校对:王章华
编辑:融媒体中心
往期推荐
●“满月日记” 我在上海师大的每一天
●时光留痕 上海师大教苑楼的老故事
●122名“小叶子”服务第四届中国国际进口博览会
●首个!上海师大国家科技创新平台获批建设
点个赞和在看,和上海师大一起加油!
武汉音乐学院2023年校考专业合格分数线公布
1、没有香水,没有首饰,也不涂指甲油。没有香烟,没有钱夹,也不带银行卡。让我们回归最天然的童真,不戴面具,真心的踏实的好好体验一个儿童节吧! 2、微笑,在花枝绽放;童趣,在蝴蝶的翅膀招摇;成长,伸进幸福的土壤,汲取着营养;梦想,像蒲公英蓝天飞翔;童年美好,六一愿你找回童趣,快乐徜徉。 3、可曾记得童年飞舞的风筝,可曾记得童年飞驰的滑轮,可曾记得童
1、 端午到,惊喜到!愿看短信的你,在这个阳光灿烂的日子里:吃粽子,得甜蜜;看龙舟,好运收;饮雄黄,逐小人;转短信,好运势。 2、 端午节,送你一个快乐粽子,先帮你剥掉工作的烦恼,剥掉生活的烦恼,剥掉脸上的沉闷,好了,剩下幸福的内叶裹紧你,幸运的大米任你吃,端午快乐! 3、 因为一筐鸡蛋,所以勾践伐吴了;因为一杯雄黄酒,所以荆轲刺秦了,因为一只龙舟,所
1、我能摸摸你的校徽吗?你竟然把袭胸说得这么清新脱俗! 2、你知道我的缺点吗?缺点你。 3、 我保持年轻方法就是谎报年龄。 4、 你的无情造就了我现在的无义 5、 评论抽一个人跟我谈恋爱没别的让你体会什么是人生不幸什么是情感厄运 6、 我看着满街的情侣啊,想来想去还是不出去伤害他们了,我怕那些男的都后悔已经有对象了。 7、 不笑运气差一笑脸就大。 8、 爱我者必定暴
1.不想承认自己变老,但是越来越抵不得冷了,前几天结冰吃了点冷的就引发肠胃炎,又冷肚子又疼,现在好期待春天快点来临 2.肚子疼,从开学疼到现在,痛到啥都不想干,我太难了。 3.早上买的包子好辣,豆浆又很冰,我现在肚子疼。 4.肠胃炎又闹了小半夜,奇葩的是我一直在饿,就是一直上吐下泻的状态我都还想着吃 5.大姨妈腰酸肚子疼就算了,挤着地铁还要听某些熊孩子
1.浑茫无际的夜晚,铁板一块的夜晚,因为这只小鸟的轻啼而开始破碎。各种属于白昼的声音,从破碎的夜晚的缝隙中迸然而出。 2.宅在家里才是对长假的最大贡献,不难为交警,不难为清洁工,不难为保险公司,不难为汽油资源,更不难为高速不收费了。下次不敢了,我错了!真心不该占国家便宜了。 3.要是有一天我发现我弄丢你了,我会满世界的去找你你一定要站在我看得见的
1.逃避现实的人,未来就会不那么理想。 2.命运总是留给有准备的人。 3.当你爱我的时候,我就拼命的爱你。但如果你不爱我了,我就立刻止损,绝不犯贱。爱情这种事情,是你情我愿的,两个人相爱才叫爱情,只有一个人贴上去,那还不如趁早相忘江湖。平凡人有平凡人的浪漫,不需要惊天动地,而是天长日久因为让你记忆最深刻的不是爱情,陪伴你度过最久时间的,才是爱情
1.有时候喜欢一个人走有时候害怕一个人走出来就能看到一个满眼都是你的人想想也挺期待的今天也是孤独的一天。 2.以后还有很漫长很漫长的路途都要一个人走完。都要靠自己。凭借自己的能力去完成。而不是依靠谁。 3.这么多年自己一个人多大风多大浪都挺过来了以后更要努力做自己想做的想自己所做的。 4.如果不能爱就不要用爱情去破坏对一个人的感觉留个人给以后的自己
1.真诚祝福传递你,愿你开心永如意,生日快乐歌一曲,愿你幸福没问题。 2.还是要长大的可爱不是长久之计。 3.往事不回头,未来不将就,愿眼中总有光芒,愿自己活成想要的模样。 4.大寿星,我祝你所有的希望都能如愿,所有的梦想都能实现,所有的等候都能出现,所有的付出都能兑现。 5.都说流星可以有求必应,如果可以我愿意在夜空下等待,等到一颗星星被我感动,为我
1.一时冲动就回来了,以至于我现在在机场待了一个多小时..蠢死了... 2.在机场等了大半天才坐上大巴~下车后边逛边找住的地方 3.月儿不知何时藏了起来,太阳的光依旧明亮,日光如同礼花照白了天际。 4.飞机起飞和降落前要打开遮光板收起小桌板调直座椅靠背,这些措施都是为了在飞机发生意外时便于机上人员逃生。打开遮光板是为了让营救的人确定机舱内人员的情况,也可
武汉音乐学院2023/4/19
经典句子2023/3/19
经典句子2023/3/19
经典句子2023/3/19
经典句子2023/3/19
经典句子2023/3/19