依图夺得世界级声纹识别竞赛冠军
9月10日消息,今日在全球声纹识别竞赛VoxSRC(VoxCeleb Speaker Recognition Challenge)上,依图以大幅领先的成绩夺得第一名。
本次参赛者来自中、美、法、日本等多个国家的高校与企业,包括中山大学、约翰霍普金斯大学、清华大学、法国国家信息与自动化研究所、平安科技、NEC、君林科技等。
这是依图首次且独立参与这场竞赛,参赛队伍名称为logicworld,比赛成绩大幅领先第二名,依图、第二名和第三名队伍的 EER(等错误率)分别是 0.98% 、1.42%和1.54%。EER是判断声纹识别算法系统的综合指标,EER越小系统性能越好。
VoxCeleb数据集来自YouTube名人采访视频,含有 7000 多个不同说话人超过 100 万段语音,时长总共超过 2000 小时。不仅数据量大,VoxCeleb还充分考虑了数据的多样性,61%的发言者为男性,并且涉及不同的种族、口音、职业和年龄。
本文系作者个人观点,不代表本站立场,转载请注明出处!

