圖片源自:國(guó)際在線

  6月5-6日,由中國(guó)科學(xué)技術(shù)協(xié)會(huì)、中國(guó)科學(xué)院、中國(guó)工程院、浙江省人民政府指導(dǎo),中國(guó)人工智能學(xué)會(huì)、杭州市人民政府主辦的2021全球人工智能技術(shù)大會(huì)在杭州召開。大會(huì)匯聚了來自世界各地的人工智能領(lǐng)域院士專家,共同為人工智能的發(fā)展建言獻(xiàn)策。本次大會(huì)采用線下線上同步直播方式,線上累計(jì)觀看超過1300萬人次,其中多語種智能信息處理專題論壇在線觀看人數(shù)超過61萬人次。
  6日下午,在多語種智能信息處理專題論壇上,中國(guó)人工智能學(xué)會(huì)(以下簡(jiǎn)稱:CAAI)多語種智能信息處理專業(yè)委員會(huì)正式成立。國(guó)務(wù)院參事、CAAI 理事長(zhǎng)、中國(guó)工程院院士戴瓊海,CAAI 名譽(yù)理事長(zhǎng)、中國(guó)工程院院士李德毅,中國(guó)工程院院士、新疆多語種信息技術(shù)重點(diǎn)實(shí)驗(yàn)室主任吾守爾·斯拉木發(fā)表致辭。來自學(xué)術(shù)界、產(chǎn)業(yè)界的多位重磅嘉賓如百度CTO王海峰、科大訊飛研究院執(zhí)行院長(zhǎng)劉聰、華為諾亞實(shí)驗(yàn)室語音語義首席科學(xué)家劉群等帶來了精彩演講。
國(guó)務(wù)院參事、CAAI 理事長(zhǎng)、中國(guó)工程院院士 戴瓊海(圖片源自:國(guó)際在線)
  愛數(shù)智慧創(chuàng)始人兼CEO張晴晴發(fā)表題為《多語種對(duì)話式AI技術(shù)及語料庫(kù)建設(shè)》的主題演講,介紹對(duì)話式AI技術(shù)的痛點(diǎn),愛數(shù)智慧在多語種語料庫(kù)建設(shè)的應(yīng)用。
愛數(shù)智慧創(chuàng)始人兼CEO張晴晴(圖片源自:國(guó)際在線)
  多語種對(duì)話式AI技術(shù)面臨的痛點(diǎn)
  對(duì)話式AI正在全面普及,在智能車載、智能家居、智能客服、智慧醫(yī)療、智能社交等場(chǎng)景中相繼落地。從技術(shù)角度看,對(duì)話式AI涉及語音識(shí)別、自然語言理解和語音合成等技術(shù),要想通過這些技術(shù)實(shí)現(xiàn)人和機(jī)器更自然的對(duì)話,需要克服哪些難題?
  日常生活中對(duì)話式口語和電腦打字交流最大的區(qū)別是,對(duì)話式口語會(huì)有語序顛倒、猶豫遲疑產(chǎn)生的停頓,多人同時(shí)交流甚至出現(xiàn)語句打斷、搶話、交疊音等復(fù)雜語音場(chǎng)景,這為AI建模帶來很大困難。
  隨著全球文化進(jìn)一步交流與融合,外語詞匯夾雜到母語中現(xiàn)象愈發(fā)頻繁,對(duì)話式口語在車載導(dǎo)航、音樂檢索等場(chǎng)景中存在多語種混合表達(dá)問題,比如“播放Taylor Swift的love story”等對(duì)話語句夾帶個(gè)別英文單詞或英文縮寫。針對(duì)這些技術(shù)難點(diǎn),愛數(shù)智慧從聲學(xué)角度進(jìn)行非母語發(fā)音字典建模和混合雙語聲學(xué)建模等,以此提高雙語識(shí)別系統(tǒng)性能。
  多語種語料庫(kù)建設(shè) 幫助開發(fā)者重建“巴別塔”
  從聲學(xué)建模角度提高雙語混合語音識(shí)別性能上,愛數(shù)智慧在ASR,TTS和發(fā)音字典方面構(gòu)建統(tǒng)一的音素集,就是將中英文,以及其他語言里相似的音素集進(jìn)行一個(gè)聚類。由于人類器官發(fā)出的音素集是一個(gè)有限集,我們找到這些有限集后,能夠涵蓋所有的語言。這種方式能夠在資源受限情況下進(jìn)一步加大數(shù)據(jù)復(fù)用性,同時(shí)也增加了模型構(gòu)建過程中的穩(wěn)定性。
  作為提高雙語識(shí)別系統(tǒng)性能的另一重要模型——混合雙語聲學(xué)建模,我們使用什么樣數(shù)據(jù)來進(jìn)行對(duì)應(yīng)的聲學(xué)模型的訓(xùn)練,便會(huì)涉及到訓(xùn)練數(shù)據(jù)集。
  目前愛數(shù)智慧擁有超過150000小時(shí)數(shù)據(jù)集,其中超過90000小時(shí)對(duì)話式AI訓(xùn)練數(shù)據(jù)集,這些數(shù)據(jù)集經(jīng)過多維度的標(biāo)注,包括語音到文本的轉(zhuǎn)換,以及說話人性別、年齡、情感等標(biāo)簽,這些標(biāo)簽?zāi)軌驇椭_發(fā)者在解決多語言對(duì)話式AI上提供更多的信息,從而幫助優(yōu)化對(duì)應(yīng)的模型。
  此外,愛數(shù)智慧擁有超過60種語言的數(shù)據(jù)集,還有部分針對(duì)外語數(shù)據(jù)構(gòu)建的雙語混合數(shù)據(jù)集,如泰語英語混合數(shù)據(jù)集、馬來語英語混合數(shù)據(jù)集等,從而幫助開發(fā)者解決混合語音識(shí)別的問題。
  最后,多語種對(duì)話式AI研究非常困難也是必然趨勢(shì),要實(shí)現(xiàn)世界語言無縫溝通交流這一終極目標(biāo),張晴晴號(hào)召更多AI開發(fā)者投身多語種對(duì)話式AI的研究領(lǐng)域,推動(dòng)對(duì)話式AI進(jìn)一步發(fā)展,重建巴別塔。
多語種智能信息專題論壇現(xiàn)場(chǎng)合影(圖片源自:國(guó)際在線)
  GAITC大會(huì)同期甄選51家優(yōu)秀企業(yè),參加全球人工智能技術(shù)博覽會(huì),愛數(shù)智慧與科大訊飛、阿里、百度、英偉達(dá)、快手、字節(jié)跳動(dòng)和東風(fēng)汽車等國(guó)內(nèi)外知名企業(yè)悉數(shù)亮相。
GAITC大會(huì)博覽會(huì)(圖片源自:國(guó)際在線)
  吾守爾·斯拉木蒞臨愛數(shù)智慧展臺(tái),了解愛數(shù)智慧核心技術(shù)及產(chǎn)品,并對(duì)MagicHub.io開源社區(qū)非常感興趣,吾守爾鼓勵(lì)愛數(shù)智慧在多語種智能化研究和應(yīng)用上繼續(xù)努力,實(shí)現(xiàn)無縫交流。
愛數(shù)智慧市場(chǎng)總監(jiān)Helen在展臺(tái)介紹愛數(shù)智慧核心技術(shù)及產(chǎn)品(圖片源自:國(guó)際在線)
吾守爾·斯拉木參觀愛數(shù)智慧展位并關(guān)注MagicHub.io開源社區(qū)(圖片源自:國(guó)際在線)