TTS
ASR
TTS mandarin
数据 | 描述 | 链接 | |
1 | baker标贝女声 | 12小时 | Link |
2 | Aishell-3 | 85小时88035句多说话人数据 | Link |
3 | DiDiSpeech | 500人60小时 | Link |
4 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
5 | zhvoice | 3200说话人900小时,用于声音复刻,合成,识别等 | Link |
TTS english
数据 | 描述 | 链接 | |
1 | LibriTTS | multispeakers,大约585小时 | Link |
2 | LJ Speech | 大约24小时 | Link |
3 | VCTK | 109发音人,每人400句 | Link |
4 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
5 | HiFi-TTS | 291.6小时,10发音人 | Link |
6 | open speech corpora | 各类数据搜集 | Link |
7 | RyanSpeech | 10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation | Link |
Link |
TTS emotion
数据 | 描述 | 链接 | |
1 | ESD | 10位英语和10位中文发音人5种情感,主要应用VC,TTS | Link |
2 | IEMOCAP | 12小时音视频情感 | Link |
3 | EmoV_DB | english and french 5种情感 | Link |
4 | Thorsten Müller | single german speaker dataset (Neutral, Disgusted, Angry, Amused, Surprised, Sleepy, Drunk, Whispering) 175分钟 | Link |
5 | TAL_SER | 4541条语音,总时长12.5小时,愉悦度和激情度两个维度。 | Link |
TTS dialect
数据 | 描述 | 链接 | |
1 | RuSLAN | 31小时高质量俄语 | Link |
2 | M-AILABS | 1000小时,German,English,Spanish,Italian,Ukrainian,Russsian,French,Polish | Link |
3 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
4 | css10 | greek,spanish,finish,french,hungarian,japanese,dutch,russian,chinese数据 | Link |
TTS frontend
数据 | 描述 | 链接 | |
1 | polyphone | 14 top多音字 | Link |
ASR mandarin
数据 | 描述 | 链接 | |
1 | WenetSpeech | 10000小时,强烈推荐 | Link |
2 | Aishell-1 | 178小时 | Link |
3 | Aishell-2 | 1000小时 | Link |
4 | mozilla common voice | 提供各种语言的音频,目前14122小时87中语言 | Link |
5 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
6 | open speech corpora | 各类数据搜集 | Link |
7 | AiShell-4 | 211场会议,120小时 | Link |
8 | AliMeeting | 118.75小时会议数据 | Link |
9 | Free ST Chinese Mandarin Corpus | 855发音人102600句手机录制 | Link |
10 | aidatatang_200zh | 200小时600发音人文本准确98% | Link |
11 | magicData-RAMC | 180小时中文spontaneous conversation | Link Link |
12 | TAL_CSASR | 中英混合587小时 | Link |
13 | TAL_ASR | 100小时讲课 | Link |
ASR english
数据 | 描述 | 链接 | |
1 | GigaSpeech | 10000小时,强烈推荐 | Link |
2 | mozilla common voice | 提供各种语言的音频,目前14122小时87中语言 | Link |
3 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
4 | Chime-4 | Link | |
5 | People’s speech | 30000小时英文 | Link |
6 | LibriSpeech | 1000小时audiobooks | Link |
7 | earnings21 | 39小时电话会议 | Link |
8 | MLS | 50000小时多语言语料 | Link |
9 | open speech corpora | 各类数据搜集 | Link |
10 | TED-LIUM 3 | 452小时 | Link |
11 | VoxForge | 讲话转录 | Link |
ASR other language
数据 | 描述 | 链接 | |
1 | M-AILABS | 1000小时,German,English,Spanish,Italian,Ukrainian,Russsian,French,Polish | Link |
2 | mozilla common voice | 提供各种语言的音频,目前14122小时87中语言 | Link |
3 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
4 | CI-AVSR | cantonese粤语车内auido-visual数据.8.3小时 | Link |
5 | open speech corpora | 各类数据搜集 | Link |
6 | Hindi | 1111小时 | Link |
7 | Samrómur Queries 21.12 | Samrómur Icelandic Speech corpus 20小时 | Link |
8 | Samrómur Children 21.09 | Icelandic Speech from children | Link |
9 | Golos | 1240小时Russian | Link |
10 | MediaSpeech | 10小时French, Arabic, Turkish and Spanish media speech | Link |
Link |
Noise
数据 | 描述 | 链接 | |
1 | Demand | 各种各样的噪声 | Link |
2 | Noisex-92 | 噪声 | Link |
3 | MUSAN | music, speech, and noise | Link |
4 | Room Impulse Response and Noisee | Room Impulse Response and Noise Database | Link |
Sing
数据 | 描述 | 链接 | |
1 | Opencpop | 100首专业录制的歌,44khz音频 | Link |
2 | OpenSinger | 93 singers 50小时 | Link |
3 | PopCS | 127首中文歌曲 | Link |
4 | ctmsa | 7000小时音乐 | Link |
Speech2Speech
Speaker diarisation
数据 | 描述 | 链接 | |
1 | AiShell-4 | 211场会议,120小时 | Link |
2 | AliMeeting | 118.75小时会议数据 | Link |
3 | magicData-RAMC | 180小时中文spontaneous conversation | Link |
WakeUp
Speech translation
数据 | 描述 | 链接 | |
1 | Fisher–CALLHOME | Es→En 160hrs | Link |
2 | STC | En↔Jp 22hrs | Link |
3 | How2 | En→Pt 300hrs | Link |
4 | IWSLT 2018 | En→De 273hrs | Link |
5 | LIBRI-TRANS | En→Fr 236hrs | Link |
6 | MuST-C | En→ 14 lang. (237-504hrs) | Link |
7 | CoVoST | En→15 lang. (929hrs), 21 | Link |
8 | Europarl-ST | 9 lang. (72 dir., 10-90hrs) | Link |
9 | LibriVoxDeEn | De→En 100hrs | Link |
10 | MaSS | 8 lang. (56 dir.) 20hrs | Link |
11 | BSTC | Zh→En 50hrs | Link |
12 | Multilingual TEDx | 8 lang.→6 lang. 11-69hrs | Link |
Other