0%

ASVSpoof 2017 笔记

前言

ASV spoof 是目前语音欺骗防御领域最常用的数据集。ASV spoof 在发布数据的同时开展竞赛,选出欺骗防御效果最好的算法。在相关领域的很多论文中都可以看到对 ASV spoof 的引用,乃至最近在读的声纹技术的书籍中都有提到该数据集。

本篇为 ASV spoof 2017 的一些相关笔记。

正文

ASV spoof 似乎是每 2 年举办一次,在 2017 之前分别有 2013, 2015 。而目前最新的是 2019,也许不久后 2021 也会公开。

ASV spoof 2015 针对的是 TTS(Text to speech) 和 VC(Voice Conversion) 的攻击。ASV spoof 2017 针对的是重放攻击。

ASV spoof 2017 的最新版本为 V2,本文通篇以 V2 为准。

ASV spoof 2017 使用了很多 RedDots 数据集的数据,以及相关数据的重放。RedDots 是一个 text dependent 的数据集。

The ASVspoof 2017 database contains large amount of speech data collected from 179 replay sessions in 61 unique replay configurations. Number of speakers is 42. A replay configuration means a unique combination of room, replay device and recording device, while a session refers to a set of source files, which share the same replay configuration.

baseline 使用 CQCC 的 MATLAB 实现,下载地址见下。

http://www.asvspoof.org/data2017/baseline_CM.zip

版权:Creative Commons Attribution-NonCommercial License (CC-BY-NC).

突然发现似乎没有什么了,如果实际使用,读取 protocol_V2 目录下不同数据集(development,train,evaluation)的protocol,这里面包括了每个音频是否为真人语音,还有一些额外的配置参数。