在AI調(diào)用量最高的場景之一機(jī)器翻譯,阿里國際的AI團(tuán)隊(duì)有了新進(jìn)展。
10月16日,阿里國際副總裁、AI負(fù)責(zé)人張凱夫在接受彭博社專訪時(shí)表示,阿里國際最新研發(fā)的Marco翻譯大模型,支持中、英、日、韓、西、法等15種全球主流語種。目前已在阿里國際AI官網(wǎng)Aidge上發(fā)布,面向全球用戶開放使用。
基于目前廣泛使用的開源評測數(shù)據(jù)集Flores,Marco翻譯大模型在BLEU自動(dòng)評測指標(biāo)上,領(lǐng)先于市面上的標(biāo)桿翻譯產(chǎn)品,如Google翻譯、DeepL、GPT-4等。這意味著,Marco的AI翻譯能力總體已經(jīng)超越全球競爭對手,成為行業(yè)第一。
圖:根據(jù)公開榜單數(shù)據(jù)的測評結(jié)果
Marco的主要優(yōu)勢就是由大語言模型驅(qū)動(dòng),能夠基于語境進(jìn)行精準(zhǔn)翻譯,而不是根據(jù)字面意思,造成哭笑不得的歧義。“你的寶貝正在路上”,不會再被翻譯成“Your baby is on the way”。
以“尊嘟喜歡”這一網(wǎng)絡(luò)用語為例,一些AI翻譯產(chǎn)品會將這句話翻譯為“Zundu likes it”,而在Marco大模型中,這句話非常地道地翻譯為“I really like it”。
如何實(shí)現(xiàn)這一效果呢?據(jù)介紹,Marco翻譯大模型通過面向多語言的數(shù)據(jù)篩選技術(shù),如多語種混合語料甄別、多維度數(shù)據(jù)質(zhì)量評估,獲得高質(zhì)量、大規(guī)模的多語言數(shù)據(jù),再結(jié)合多語言的混合專家、參數(shù)擴(kuò)張方法,從而保證主導(dǎo)語言(如中、英)性能不下降的情況下,提升其他語種的質(zhì)量。
同時(shí),通過模型量化和加速、多模型規(guī)約等優(yōu)化策略,大幅降低大模型的服務(wù)成本,甚至與傳統(tǒng)小模型相比,成本也具有優(yōu)勢。
目前,Marco翻譯大模型已實(shí)現(xiàn)大規(guī)模商用。得益于阿里國際在跨境電商領(lǐng)域多年的積累,Marco在跨境電商領(lǐng)域的表現(xiàn)尤為亮眼。對于個(gè)人用戶來說,Marco能夠根據(jù)上下文提供高質(zhì)量的翻譯和良好的可讀性,甚至支持不同的翻譯風(fēng)格,滿足多樣化的翻譯需求。
根據(jù)媒體公開報(bào)道,阿里國際在去年成立了AI團(tuán)隊(duì),過去一年在40多個(gè)場景里測試了AI能力,幫助50萬中小商家、對1億款商品進(jìn)行優(yōu)化。商家的AI需求也不斷增長,近半年的數(shù)據(jù)顯示,平均每兩個(gè)月,商家對于AI的調(diào)用量就翻1倍,AI的調(diào)用量已經(jīng)突破日均1億次。
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國RPA生態(tài)發(fā)展 | 流 > 阿里國際發(fā)布首個(gè)大規(guī)模商用翻譯大模型,效果超Google、DeepL等
熱門信息
閱讀 (15387)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎(jiǎng)名單公示閱讀 (14590)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國閱讀 (13222)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎(jiǎng)名單公示閱讀 (13100)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (12084)
5 《2022年中國流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國