月度归档:2022年10月

分词开源-语音数据集DataSet

TTS mandarin

数据描述链接
1baker标贝女声12小时Link
2Aishell-385小时88035句多说话人数据Link
3DiDiSpeech500人60小时Link
4OpenSLR提供各种语言的合成、识别等语料Link
5zhvoice3200说话人900小时,用于声音复刻,合成,识别等Link

TTS english

数据描述链接
1LibriTTSmultispeakers,大约585小时Link
2LJ Speech大约24小时Link
3VCTK109发音人,每人400句Link
4OpenSLR提供各种语言的合成、识别等语料Link
5HiFi-TTS291.6小时,10发音人Link
6open speech corpora各类数据搜集Link
7RyanSpeech10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversationLink
Link

TTS emotion

数据描述链接
1ESD10位英语和10位中文发音人5种情感,主要应用VC,TTSLink
2IEMOCAP12小时音视频情感Link
3EmoV_DBenglish and french 5种情感Link
4Thorsten Müllersingle german speaker dataset (Neutral, Disgusted, Angry, Amused, Surprised, Sleepy, Drunk, Whispering) 175分钟Link
5TAL_SER4541条语音,总时长12.5小时,愉悦度和激情度两个维度。Link

TTS dialect

数据描述链接
1RuSLAN31小时高质量俄语Link
2M-AILABS1000小时,German,English,Spanish,Italian,Ukrainian,Russsian,French,PolishLink
3OpenSLR提供各种语言的合成、识别等语料Link
4css10greek,spanish,finish,french,hungarian,japanese,dutch,russian,chinese数据Link

TTS frontend

数据描述链接
1polyphone14 top多音字Link

ASR mandarin

数据描述链接
1WenetSpeech10000小时,强烈推荐Link
2Aishell-1178小时Link
3Aishell-21000小时Link
4mozilla common voice提供各种语言的音频,目前14122小时87中语言Link
5OpenSLR提供各种语言的合成、识别等语料Link
6open speech corpora各类数据搜集Link
7AiShell-4211场会议,120小时Link
8AliMeeting118.75小时会议数据Link
9Free ST Chinese Mandarin Corpus855发音人102600句手机录制Link
10aidatatang_200zh200小时600发音人文本准确98%Link
11magicData-RAMC180小时中文spontaneous conversationLink   Link
12TAL_CSASR中英混合587小时Link
13TAL_ASR100小时讲课Link

ASR english

数据描述链接
1GigaSpeech10000小时,强烈推荐Link
2mozilla common voice提供各种语言的音频,目前14122小时87中语言Link
3OpenSLR提供各种语言的合成、识别等语料Link
4Chime-4Link
5People’s speech30000小时英文Link
6LibriSpeech1000小时audiobooksLink
7earnings2139小时电话会议Link
8MLS50000小时多语言语料Link
9open speech corpora各类数据搜集Link
10TED-LIUM 3452小时Link
11VoxForge讲话转录Link

ASR other language

数据描述链接
1M-AILABS1000小时,German,English,Spanish,Italian,Ukrainian,Russsian,French,PolishLink
2mozilla common voice提供各种语言的音频,目前14122小时87中语言Link
3OpenSLR提供各种语言的合成、识别等语料Link
4CI-AVSRcantonese粤语车内auido-visual数据.8.3小时Link
5open speech corpora各类数据搜集Link
6Hindi1111小时Link
7Samrómur Queries 21.12Samrómur Icelandic Speech corpus 20小时Link
8Samrómur Children 21.09Icelandic Speech from childrenLink
9Golos1240小时RussianLink
10MediaSpeech10小时French, Arabic, Turkish and Spanish media speechLink
Link

Noise

数据描述链接
1Demand各种各样的噪声Link
2Noisex-92噪声Link
3MUSANmusic, speech, and noiseLink
4Room Impulse Response and NoiseeRoom Impulse Response and Noise DatabaseLink

Sing

数据描述链接
1Opencpop100首专业录制的歌,44khz音频Link
2OpenSinger93 singers 50小时Link
3PopCS127首中文歌曲Link
4ctmsa7000小时音乐Link

Speech2Speech

数据描述链接
1cvss21种语言转英语Link
Link

Speaker diarisation

数据描述链接
1AiShell-4211场会议,120小时Link
2AliMeeting118.75小时会议数据Link
3magicData-RAMC180小时中文spontaneous conversationLink

WakeUp

数据描述链接
1WakeUp-1中英文1561小时Link
2HI-MIA340说话人,智能家居Link

Speech translation

数据描述链接
1Fisher–CALLHOMEEs→En 160hrsLink
2STCEn↔Jp 22hrsLink
3How2En→Pt 300hrsLink
4IWSLT 2018En→De 273hrsLink
5LIBRI-TRANSEn→Fr 236hrsLink
6MuST-CEn→ 14 lang. (237-504hrs)Link
7CoVoSTEn→15 lang. (929hrs),
21
Link
8Europarl-ST9 lang. (72 dir., 10-90hrs)Link
9LibriVoxDeEnDe→En 100hrsLink
10MaSS8 lang. (56 dir.) 20hrsLink
11BSTCZh→En 50hrsLink
12Multilingual TEDx8 lang.→6 lang. 11-69hrsLink

Other

数据描述链接
1SEP-28k口吃语料Link
2FluencyBank口吃语料Link