專業(yè)做網(wǎng)站的技術(shù)人員朝陽(yáng)seo排名
??遺憾沒有進(jìn)復(fù)賽,只是第41名。先貼個(gè)A榜的成績(jī)。A榜的前三十名晉級(jí),個(gè)個(gè)都是99分的大佬,但是B榜的成績(jī)就有點(diǎn)低了,應(yīng)該是數(shù)據(jù)不同源的問(wèn)題,第一名0.78分。官網(wǎng)鏈接:語(yǔ)音深度鑒偽識(shí)別
官方baselin:https://github.com/xinyebei/2024_finvcup_baseline
baseline源碼:https://github.com/xieyuankun/Codecfake
實(shí)驗(yàn)的 源碼:https://github.com/Shybert-AI/Codecfake_ResNet
任務(wù)描述:
??簡(jiǎn)單的說(shuō)一下本次比賽方案的想法,首先明確是語(yǔ)音深度鑒偽識(shí)別任務(wù),于是發(fā)動(dòng)互聯(lián)網(wǎng)的強(qiáng)大的搜索功能,盡可能多的搜索到更多的語(yǔ)音深度鑒偽識(shí)別算法。也相應(yīng)的搜索對(duì)應(yīng)的數(shù)據(jù)集,在看到此帖子[深度偽造音頻普遍檢測(cè)的Codecfake數(shù)據(jù)集和對(duì)策],同時(shí)在github上找到相應(yīng)的源碼,因此方案基于Codecfake進(jìn)行。通過(guò)將網(wǎng)絡(luò)結(jié)構(gòu)修改成ResNet等實(shí)驗(yàn),提出Codecfake_ResNet模型,讓語(yǔ)音鑒別模型的分類指標(biāo)達(dá)到0.968961。(https://blog.csdn.net/robinfang2019/article/details/138673202)
模型架構(gòu):
訓(xùn)練步驟:
1.下載finvcup9th_1st_ds5數(shù)據(jù)集,解壓到data目錄下
2.執(zhí)行data_prepare.py 腳本生成訓(xùn)練的csv文件,修改finvcup9th_1st_ds5_valid_data.csv為finvcup9th_1st_ds5_dev_data.csv
python data_prepare.py
3.執(zhí)行提取特征文件
python preprocess.py
4.訓(xùn)練
python main_train.py --path_to_features preprocess_xls-r-5 -f1 preprocess_xls-r-5 --out_fold ./pretrained_model/codec_w2v2aasist_ResNet50_CSAM_xls-r-5_300m/ --CSAM True --train_task codecfake --num_epochs 50 --batch_size 16 --lr 0.001 --gpu 0 --seed 2024 --num_workers 1
5.預(yù)測(cè)
python predict.py
實(shí)驗(yàn)結(jié)果:
通過(guò)實(shí)驗(yàn)分析提升網(wǎng)絡(luò)的層數(shù)和多模型融合可以提升。