作者归档:xinlu

AndroidStudio的代理配置,

Android Studio的代理设置,一定要填写代理的域名,否则就等于没有变化或无效了。

在执行gladle构建时,总提示dl.google.com的443没有连接上,但奇怪的是使用AndroidSDK也是使用dl.google.com进行版本更新的,一直也很流畅。所以一直没有怀疑是防火墙问题,后来也把代理填上了,但没有填写No proxy for:的相关字段,也是无法连接上。

最后实在没有办法了,在no proxy for 都填上了,却发现可以下载了,神奇吧。

现在想想,应该是Android SDK的更新,应该是设置了内部翻墙的能力了。

分词开源-语音数据集DataSet

TTS mandarin

数据描述链接
1baker标贝女声12小时Link
2Aishell-385小时88035句多说话人数据Link
3DiDiSpeech500人60小时Link
4OpenSLR提供各种语言的合成、识别等语料Link
5zhvoice3200说话人900小时,用于声音复刻,合成,识别等Link

TTS english

数据描述链接
1LibriTTSmultispeakers,大约585小时Link
2LJ Speech大约24小时Link
3VCTK109发音人,每人400句Link
4OpenSLR提供各种语言的合成、识别等语料Link
5HiFi-TTS291.6小时,10发音人Link
6open speech corpora各类数据搜集Link
7RyanSpeech10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversationLink
Link

TTS emotion

数据描述链接
1ESD10位英语和10位中文发音人5种情感,主要应用VC,TTSLink
2IEMOCAP12小时音视频情感Link
3EmoV_DBenglish and french 5种情感Link
4Thorsten Müllersingle german speaker dataset (Neutral, Disgusted, Angry, Amused, Surprised, Sleepy, Drunk, Whispering) 175分钟Link
5TAL_SER4541条语音,总时长12.5小时,愉悦度和激情度两个维度。Link

TTS dialect

数据描述链接
1RuSLAN31小时高质量俄语Link
2M-AILABS1000小时,German,English,Spanish,Italian,Ukrainian,Russsian,French,PolishLink
3OpenSLR提供各种语言的合成、识别等语料Link
4css10greek,spanish,finish,french,hungarian,japanese,dutch,russian,chinese数据Link

TTS frontend

数据描述链接
1polyphone14 top多音字Link

ASR mandarin

数据描述链接
1WenetSpeech10000小时,强烈推荐Link
2Aishell-1178小时Link
3Aishell-21000小时Link
4mozilla common voice提供各种语言的音频,目前14122小时87中语言Link
5OpenSLR提供各种语言的合成、识别等语料Link
6open speech corpora各类数据搜集Link
7AiShell-4211场会议,120小时Link
8AliMeeting118.75小时会议数据Link
9Free ST Chinese Mandarin Corpus855发音人102600句手机录制Link
10aidatatang_200zh200小时600发音人文本准确98%Link
11magicData-RAMC180小时中文spontaneous conversationLink   Link
12TAL_CSASR中英混合587小时Link
13TAL_ASR100小时讲课Link

ASR english

数据描述链接
1GigaSpeech10000小时,强烈推荐Link
2mozilla common voice提供各种语言的音频,目前14122小时87中语言Link
3OpenSLR提供各种语言的合成、识别等语料Link
4Chime-4Link
5People’s speech30000小时英文Link
6LibriSpeech1000小时audiobooksLink
7earnings2139小时电话会议Link
8MLS50000小时多语言语料Link
9open speech corpora各类数据搜集Link
10TED-LIUM 3452小时Link
11VoxForge讲话转录Link

ASR other language

数据描述链接
1M-AILABS1000小时,German,English,Spanish,Italian,Ukrainian,Russsian,French,PolishLink
2mozilla common voice提供各种语言的音频,目前14122小时87中语言Link
3OpenSLR提供各种语言的合成、识别等语料Link
4CI-AVSRcantonese粤语车内auido-visual数据.8.3小时Link
5open speech corpora各类数据搜集Link
6Hindi1111小时Link
7Samrómur Queries 21.12Samrómur Icelandic Speech corpus 20小时Link
8Samrómur Children 21.09Icelandic Speech from childrenLink
9Golos1240小时RussianLink
10MediaSpeech10小时French, Arabic, Turkish and Spanish media speechLink
Link

Noise

数据描述链接
1Demand各种各样的噪声Link
2Noisex-92噪声Link
3MUSANmusic, speech, and noiseLink
4Room Impulse Response and NoiseeRoom Impulse Response and Noise DatabaseLink

Sing

数据描述链接
1Opencpop100首专业录制的歌,44khz音频Link
2OpenSinger93 singers 50小时Link
3PopCS127首中文歌曲Link
4ctmsa7000小时音乐Link

Speech2Speech

数据描述链接
1cvss21种语言转英语Link
Link

Speaker diarisation

数据描述链接
1AiShell-4211场会议,120小时Link
2AliMeeting118.75小时会议数据Link
3magicData-RAMC180小时中文spontaneous conversationLink

WakeUp

数据描述链接
1WakeUp-1中英文1561小时Link
2HI-MIA340说话人,智能家居Link

Speech translation

数据描述链接
1Fisher–CALLHOMEEs→En 160hrsLink
2STCEn↔Jp 22hrsLink
3How2En→Pt 300hrsLink
4IWSLT 2018En→De 273hrsLink
5LIBRI-TRANSEn→Fr 236hrsLink
6MuST-CEn→ 14 lang. (237-504hrs)Link
7CoVoSTEn→15 lang. (929hrs),
21
Link
8Europarl-ST9 lang. (72 dir., 10-90hrs)Link
9LibriVoxDeEnDe→En 100hrsLink
10MaSS8 lang. (56 dir.) 20hrsLink
11BSTCZh→En 50hrsLink
12Multilingual TEDx8 lang.→6 lang. 11-69hrsLink

Other

数据描述链接
1SEP-28k口吃语料Link
2FluencyBank口吃语料Link

使用zlib动态库报错

项目本来是使用zlibstatic的,后来改为使用zlib动态库,但不知道何处仍然使用了zlibstatic,导致无法切换为动态库形式。

Qt已经自带的zlib的连接库。qCompress函数,1~9级。

调试模式下:系统库和连接目录下的库同名产生的BUG

调试时报错如下:

16:37:16: Debugging /Users/abc/work/woterm/woterm/bin/woterm.app/Contents/MacOS/woterm ...
dyld: Symbol not found: __cg_jpeg_resync_to_restart
  Referenced from: /System/Library/Frameworks/ImageIO.framework/Versions/A/Resources/libTIFF.dylib
  Expected in: /Users/abc/work/woterm/woterm/third/jpeg/unix/lib/libJPEG.dylib
 in /System/Library/Frameworks/ImageIO.framework/Versions/A/Resources/libTIFF.dylib
16:39:24: Debugging of /Users/abc/work/woterm/woterm/bin/woterm.app/Contents/MacOS/woterm has finished.

当前项目仅使用到该静态库,而该动态库,是没有使用到的,在调试阶段,因为系统图像库也依赖到该文件,从而导致加载了最新版本。但因为函数或参数缺失,直接报错。

解决办法是编译第三方库时,主动删除多余的库文件,避免一些奇怪问题。

代码声明模板

/*******************************************************************************************
*
* Copyright (C) %{CurrentDate:yyyy} Guangzhou AoYiDuo Network Technology Co.,Ltd. All Rights Reserved.
*
* Contact: http://www.aoyiduo.com
*
*   this file is used under the terms of the GPLv3[GNU GENERAL PUBLIC LICENSE v3]
* more information follow the website: https://www.gnu.org/licenses/gpl-3.0.en.html
*
*******************************************************************************************/

批处理中for/call/errorlevel返回值

因为做软件代码签名,在做脚本时,发现批处理脚本真是坑爹货,太多问题,故在以下记录一下。

rem @echo off

rem 必须使用setlocal,否则for()do(call)语句call函数返回值是无法正常返回的,故务必加上此句。
setlocal enabledelayedexpansion
set path_script=%~dp0
echo %path_script%

set myfile=%~1
set "myfile=%myfile:"=%"
for %%i in ("http://sha256timestamp.ws.symantec.com/sha256/","http://tsa.wosign.com/timestamp","http://timestamp.digicert.com") do (
    call :signmain "%%i" "%myfile%"

    rem 因为for语句的影响,必须和setLocal一起使用,才能返回errorlevel.
    rem 因为是延后扩展返回值,不能使用%errorlevel%必须使用双叹号。
    set retval=!errorlevel! 
    echo "retval:!retval!"
rem rem lss equ neq gtr geq leq
    if !retval! neq 0 (
        rem 必须加上/b参数,否则会是脚本退出,而不是call调用返回。
        exit /b 0 
    ) 
)

rem 此处不需要使用双叹号,能直接返回值。
call :signmain "a" "b"
echo "errorlevelLast:%errorlevel%"
exit /b 12

:signmain
set timeserver=%~1
set "timeserver=%timeserver:"=%"
set signfile=%~2
set "signfile=%signfile:"=%"
set /a num=0
:loop
echo "try to do the %num% time"
echo "timeserver:%timeserver%"
echo "signfile:%signfile%"
signtool sign /v /fd sha256 /sha1 8cff6301fbee55b05364e6f11d2e5ed090abcdef /tr "%timeserver%" /td sha256 "%signfile%"
set errcode=%errorlevel%
echo "errorlevel:%errcode%"
if %errcode% == 0 (
    echo "success:%signfile%"
    echo "-------------------------------------------------------------------"
    exit /b 0
) else (
    set /a num+=1
    if %num% lss 2 goto :loop
)
set /a retval=10+%num%
exit /b %retval%

Centos6编译gcc4.8.5

因为项目使用了Open-H264,如果要启用H264,则需要编译gcc4.8.5版本,取代系统的gcc4.47版本。

下载安装及依赖包

https://mirrors.tuna.tsinghua.edu.cn/gnu/gmp/gmp-4.3.2.tar.gz
https://mirrors.tuna.tsinghua.edu.cn/gnu/mpfr/mpfr-2.4.2.tar.gz
https://gcc.gnu.org/pub/gcc/infrastructure/mpc-0.8.1.tar.gz
http://ftp.tsukuba.wide.ad.jp/software/gcc/releases/gcc-4.8.5/gcc-4.8.5.tar.gz
编译指令:
第一步:gmp / mpfr / mpc默认编译安装,相关库会安装至/usr/local/lib目录下
第二步:export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib
第三步:./configure --enable-checking=release --enable-languages=c,c++ --disable-multilib --build=x86_64-redhat-linux