人工智能時代,懂語言者“得天下”,NLP作為人工智能的“掌上明珠”,最新發(fā)展布局和未來發(fā)展趨勢究竟如何?

  8月25日,即七夕當天,以“掌握知識、理解語言、擁有智能”為主題的百度大腦語言與知識技術峰會以直播形式召開,百度CTO王海峰、百度集團副總裁吳甜、百度技術委員會主席吳華等大咖現(xiàn)身大會,向外界全面介紹了百度在語言與知識領域的整體布局、技術創(chuàng)新及產業(yè)實踐,并重磅發(fā)布多項全新產品和技術等,希望攜手學界、產業(yè)界合作伙伴推動語言與知識技術發(fā)展,為產業(yè)智能升級提供原動力。

  在這場面對上百萬人的極客大秀上,百度作為國內乃至全球NLP領域的“佼佼者”,分享了很多重磅內容,可謂AI大佬在線“劃重點”。他們到底說了啥?帶來了哪些技術干貨呢?

  亮點一:百度已打造完整NLP技術布局,持續(xù)落地提升智能化水平

  王海峰表示,“在百度語言與知識技術的布局和發(fā)展中,我們始終在注意把握兩個趨勢,即技術發(fā)展趨勢和產業(yè)發(fā)展趨勢,并力爭引領趨勢。”經過十余年的發(fā)展,百度已構建完整的語言與知識技術布局,包括知識圖譜、語言理解與生成技術,以及上述技術所支持的包含智能搜索、機器翻譯、對話系統(tǒng)、智能寫作、深度問答等在內的應用系統(tǒng),而且百度語言與知識技術碩果正源源不斷地以平臺化的方式對外輸出,在互聯(lián)網、金融、醫(yī)療、教育等諸多領域發(fā)揮作用,提升了產業(yè)智能化水平。

  細品一下,就是說百度語言與知識技術十年發(fā)展技術布局完善,實力硬核,這波秀肌肉值得滿分!

  image.png

  百度語言與知識的技術實力業(yè)界有目共睹,國家科技進步獎等20多個獎項、30多項國內外競賽冠軍、2000多項專利等,成為了百度語言與知識技術實力最好的證明。

  image.png

  技術有多難,就有多重要。語言與知識技術的重要性不容小覷。在回顧完百度語言與知識技術的進程以及最新進展,王海峰引出了峰會中其他三大亮點,首先是百度語言與知識產品的重磅發(fā)布和全新升級,其次是數(shù)據(jù)共建和算力共享計劃,最后是百度NLP“十年十人”的發(fā)布,進一步為技術和社會進步做出更大貢獻!

  亮點二:重磅發(fā)布3大新產品、6項全新升級,覆蓋4大NLP領域重點研究方向

  3、6、4這三個不起眼的數(shù)字,但對廣大開發(fā)者來說,卻一點也不普通。此次峰會,百度為進一步降低開發(fā)者應用語言與知識技術的門檻和成本,將多年來語言與知識技術沉淀凝聚成一系列技術平臺和產品對外發(fā)布。

  image.png

  其中,3大新品包括語言理解方面的語義理解技術與平臺文心ERNIE、一站式TextMind智能文檔分析平臺、以及機器翻譯方面的AI同傳會議解決方案;6項技術全面升級包括智能創(chuàng)作平臺重磅推出的智能策劃、智能采編、智能審校3大媒體場景方案,以及智能對話定制與服務平臺UNIT平臺帶來更智能的任務式對話理解、極致便捷的表格問答、融合通用對話的新引擎三大新能力升級,這些全面覆蓋理解、生成、對話、翻譯4大NLP領域重點研究方向。

  百度語言與知識技術多年深耕、布局全面,核心技術持續(xù)發(fā)展突破,為廣大開發(fā)人員、業(yè)務應用者提供以語言與知識技術為核心驅動的系列產品,發(fā)揮應用價值。對此,吳甜也給出了一組數(shù)據(jù):百度智能對話定制與服務平臺UNIT自發(fā)布以來,已有2.7萬多開發(fā)者積累下2.4億個知識條目,支撐了超過10萬個智能對話應用,與用戶展開超過4200億次交互。

  亮點三:共建開源數(shù)據(jù)+豪擲億元算力,要在世界范圍建設中文信息處理影響力

  數(shù)據(jù)、算力的缺乏,特別是相較英文下標準的中文開源數(shù)據(jù)集的匱乏,成為制約中文信息處理領域發(fā)展的瓶頸。

  對此,王海峰指出,復雜知識表示和快速構建技術,知識與深度學習進一步融合,深度融合感知和認知的跨模態(tài)語義理解技術,模型可解釋性和魯棒性,這四大難題仍需要繼續(xù)研究解決。但對于未來,百度充滿信心。

  會上,百度發(fā)布了“千言”數(shù)據(jù)共建計劃和價值一億元的算力共享計劃。吳華介紹到,“千言”的目標是覆蓋豐富的任務類型,從復雜知識構建、語義理解、知識融合、多模態(tài)融合等角度推動技術進步,同時提供能進行多維度綜合評價的數(shù)據(jù)集從而評價模型的全面性、泛化性、魯棒性。首期千言項目已涵蓋了7大任務、20余個中文開源數(shù)據(jù)集。在未來3年中,百度計劃面向超20個任務,收集和建設不少于100個中文自然語言處理數(shù)據(jù)集。

  image.png

  而語言與知識算力共享計劃,是指百度將通過AI STUDIO平臺,提供價值一億元的算力支持,為語言與知識技術開發(fā)者助力。在未來,百度還計劃邀請“千言”數(shù)據(jù)集的使用者,百度語言與知識開源開放用戶以及更多的中文語言與知識技術開發(fā)者、研究人員免費使用這些算力。

  百度希望通過共建中文自然語言處理開源數(shù)據(jù)及算力支持,與學界、產業(yè)界共同推進技術進步?吹竭@里,百度AI技術的開放共享,確實讓開發(fā)者們感受到滿滿的中國科技實力的自豪感。

  亮點四:十年征程,不忘初心

  2010年,百度在國內最先成立專門的自然語言處理部,在前瞻技術與產業(yè)格局上不斷引領、創(chuàng)新,十年間已成為中國NLP發(fā)展的一面旗幟。

  十年征程,百度語言與知識技術發(fā)展歷程中培養(yǎng)、吸引了大量全球頂尖人才。會上,百度推出以王海峰為代表的百度NLP“十年十人”,十年堅守,不忘初心,秉持“技術信仰”,勇攀技術高峰,矢志不渝致力于讓機器更好地理解世界、更好地服務于人。

  image.png

  此次峰會,匯聚了百度語言與知識的技術積累和產業(yè)實踐。不難看出,百度對整個語言與知識領域的布局是領先,且具有借鑒意義的。其實,百度的語言與知識技術實力不僅領先國內,在國際上也絲毫不遜色。以百度知識增強的語義理解框架ERNIE為例,去年年底ERNIE在國際權威的通用語言理解評估基準 GLUE上首次突破 90大關,超越人類三個點,獲得全球第一。下圖正是全球AI三巨頭,從技術成果、研發(fā)力量、產品與服務三個維度展現(xiàn)了自身的語言與知識技術價值。 

  image.png

  2020年,是百度深耕語言與知識技術的第十年,更是技術成果厚積薄發(fā)的一年,站在十年發(fā)展的新起點上,百度舉辦百度大腦語言與知識技術峰會,與產學研各界同仁分享NLP技術變遷和發(fā)展趨勢,推動技術創(chuàng)新與產業(yè)實踐,加速AI技術發(fā)展及智能社會建設,助力中國產業(yè)智能化轉型。百度AI,實力引領,未來可期。