自己做的網(wǎng)站怎么設(shè)置文件下載國(guó)外免費(fèi)網(wǎng)站服務(wù)器
8月22日Facebook的母公司Meta Platforms發(fā)布了一種能夠翻譯和轉(zhuǎn)錄數(shù)十種語(yǔ)言的人工智能模型——SeamlessM4T,可以在日常生活中或者商務(wù)交流中為用戶提供更便捷的翻譯和轉(zhuǎn)錄服務(wù)。
相較于傳統(tǒng)的文本翻譯,這項(xiàng)技術(shù)的最大區(qū)別在于它可以實(shí)現(xiàn)端到端的語(yǔ)音翻譯,即將一種語(yǔ)言的語(yǔ)音直接翻譯成另一種語(yǔ)言,使得人們可以直接交流,而無(wú)需經(jīng)過(guò)復(fù)雜的中間轉(zhuǎn)換過(guò)程。
SeamlessM4T支持:
1、近100種語(yǔ)言的語(yǔ)音識(shí)別。
2、近100種輸入和輸出語(yǔ)言的語(yǔ)音到文本翻譯。
3、支持近100種輸入語(yǔ)言和36種輸出語(yǔ)言的語(yǔ)音到語(yǔ)音翻譯。
4、支持近100種語(yǔ)言的文本到文本翻譯。
5、支持近100種輸入語(yǔ)言和35種輸出語(yǔ)言的文本到語(yǔ)音翻譯。
SeamlessM4T支持的語(yǔ)音到語(yǔ)音翻譯模型需要大量高質(zhì)量的端到端數(shù)據(jù)。滿足近100種語(yǔ)言語(yǔ)音翻譯的需求,僅依靠人工轉(zhuǎn)錄和翻譯語(yǔ)音是困難的,因?yàn)闃?gòu)建語(yǔ)音翻譯數(shù)據(jù)集的流程既復(fù)雜又成本高昂。在獲得授權(quán)音頻的前提下,需要進(jìn)行對(duì)應(yīng)的轉(zhuǎn)錄和翻譯,然后將音頻、轉(zhuǎn)錄和翻譯進(jìn)行切分,最后進(jìn)行對(duì)齊和過(guò)濾以獲得有效數(shù)據(jù)。
景聯(lián)文科技擁有豐富的語(yǔ)音數(shù)據(jù)采集標(biāo)注項(xiàng)目經(jīng)驗(yàn),自建專(zhuān)業(yè)語(yǔ)音采集錄音室,有高度還原真實(shí)場(chǎng)景能力,在全國(guó)30多個(gè)省市有近一萬(wàn)人的被采集人員儲(chǔ)備,全球范圍內(nèi)也有采集渠道,支持多語(yǔ)種、多方言語(yǔ)音采集。自有的數(shù)據(jù)管理平臺(tái),打通數(shù)據(jù)閉環(huán),可有序進(jìn)行數(shù)據(jù)分發(fā)、清洗、標(biāo)注、質(zhì)檢、等環(huán)節(jié),交付高質(zhì)量的訓(xùn)練數(shù)據(jù),提高企業(yè)AI數(shù)據(jù)訓(xùn)練效率,加速人工智能相關(guān)應(yīng)用的落地迭代周期。
景聯(lián)文科技|數(shù)據(jù)采集|數(shù)據(jù)標(biāo)注
助力人工智能技術(shù),賦能傳統(tǒng)產(chǎn)業(yè)智能化轉(zhuǎn)型升級(jí)
文章圖文著作權(quán)歸景聯(lián)文科技所有,商業(yè)轉(zhuǎn)載請(qǐng)聯(lián)系景聯(lián)文科技獲得授權(quán),非商業(yè)轉(zhuǎn)載請(qǐng)注明出處。