sponsored links

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


智東西(公眾號:zhidxcom)

作者 | 心緣

編輯 | 漠影

“生薑怎麼儲存?”、“小孩能吃辣條嗎?”、“魚的感覺器官是什麼?”……

知識問答是智慧語音助手最常見的日常互動內容之一。像上面這些難以回答的長尾問題,一個語音助手平均每天會遇到上百萬條,而當前業界的方案,不是拒絕回答,就是跳轉到搜尋引擎。

對於使用者來說,這也就節省了開啟搜尋頁面和輸入問題的步驟,要比直接給出答案費事的多。

面對數量龐雜且發散的問題,業界一直沒有成熟的方案。但最近,在智源研究院1.75億引數超大AI模型“悟道2.0”的基礎上,OPPO小布助手建設了直接給出此類開放域長尾問題答案的能力。

過去三年來,隨著BERT、GPT-3、悟道2.0等國內外超大規模預訓練模型接連出場,“大模型”已成為眾多學術及行業大會熱議的方向,也是代表深度學習前沿水平的標誌性模型。

彙集國內頂尖AI專家及後輩人才的北京智源人工智慧研究院,自2020年10月啟動大模型研究起就一路快馬加鞭地推進研發,今年3月釋出大模型“悟道1.0”,6月推出引數規模高達1.75萬億的全球最大AI模型“悟道2.0”

如今,智源“悟道”又邁向新的節點——讓大模型被廣泛地“用起來”,打破AI開發想象力的邊界

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


智源研究院學術副院長、清華大學教授唐傑

在本週五2021中關村論壇上,智源研究院學術副院長、清華大學教授唐傑一連宣佈主攻低門檻、高效率、高情商的3個悟道大模型技術創新成果,要真正解決AI企業及行業使用者研發的核心痛點。

助力OPPO小布助手升級,是“悟道”在智慧終端落地應用的重要一步,這一應用案例不僅展現了大模型在攻破智慧助手瓶頸的技術優勢,亦蘊藏著驅動智慧終端體驗大變革的潛能。

基於悟道大模型的冬奧手語播報數字人也首次亮相,它將在北京冬奧會期間正式投用,為聽障人士提供全流程智慧化的數字人手語生成服務。該成果將在年底釋出。

一、三大技術創新:讓大模型更好用,秀“雙商線上”聊天技能

悟道2.0大模型有1.75萬億引數,這是什麼概念?

如果用GPU載入到記憶體中,需要512張英偉達A100的卡,成本大約6000多萬人民幣,還不包括電費。這是個相當高的門檻。

智源正在做的,即是將悟道的應用門檻降下來,將AI的效率和情商提起來,給更多人帶來便利。

無論是降低AI大模型開發門檻的悟道開發平臺,還是“一卡頂四卡”的高效推理工具包、4倍提速4倍清晰的AI文圖繪畫、最大中文對話模型等技術創新,都讓悟道大模型變得更加好用、易用。

1、悟道開發平臺:幫企業輕鬆構建自己的AI應用

為了降低中小企業基於大模型開發的門檻,智源打造了悟道開發平臺,讓每個人點點滑鼠就能構建AI,從資料處理、模型微調到API部署一應俱全。

該平臺支撐著10億級別模型的線上訓練與微調,企業可以透過“大模型+少量資料微調”的AI開發模式,解決AI應用開發難以規模化、產業化的問題。

這樣一來,即便你是AI開發新手,也能很快開發出高質量的AI應用,還能將這一應用開放給悟道所有生態夥伴及相關使用者。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


智源實現了一站式研發和一站式應用平臺,前者面向開發者提供資料模型、線上訓練、模型調優、模型評測、線上部署和應用開發等功能,後者為普通使用者提供直接可用的AI應用商城。

整個應用平臺底層實現了悟道大資料的處理,有超過5T資料,還有悟道各種各樣的基礎模型,以及相關多達幾十種演算法和相關的工具集。

使用者可以將資料提交到平臺上,在雲端跑模型。當資料特別大時,也可以將模型下載下來,在本地機器上做微調,這需要有一些GPU做支援。

目前悟道開發平臺已開放API免費體驗,預計10月開放線上訓練等更多能力。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


2、預訓練推理工具包BMInf:低資源高效推理

高效率推理,是實現大模型應用的關鍵。

以前萬億模型進行一次推理,需要512張A100的卡把記憶體裝進去,而現在藉助預訓練推理工具包BMInf,一卡即可頂四卡,該工具包支援最低配置在英偉達GTX 1060單卡機上執行百億大模型。

當然,除了百億模型,你可以根據自己的實際應用需求,線上呼叫從億級到萬億級規模的模型,其能力覆蓋文字補全、文字生成及對話場景。

BMInf及其支援的模型引數已經開源共享,使用者無需訪問原始碼即可呼叫,也可以把它下載下來,進行本地的部署。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


AI文圖繪畫大師CogView2也再度進階,速度和畫面解析度均提升4倍。以前5分鐘畫16張圖,現在 40多秒就能畫出8張,效果比國際領先的DALL·E模型還要更勝一籌。

下圖是針對“海灘上的一群人”這一主題的AI模型繪畫作品。左邊是世界頂尖AI研究機構OpenAI的DALL·E模型所生成繪畫中的優選作品,右邊是CogView隨機生成的繪畫。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


可以看到在畫面生成效果上,右側身體輪廓與邊緣清晰流暢,面部表情可見,既有群像又有個人特寫,主題呈現場景也更為豐富、有生活感。

3、最大中文對話模型EVA:讓機器聊出人情味兒

怎樣讓AI更聰明?舉一反三、學習能力是關鍵。

對此,智源研發了一個基於prompt生成方法以及分類器的資料選擇方法,能對非常少量的樣本進行資料增強,並透過微調把原來大模型迅速適應到小的一個領域或者特定的任務中。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


例如這一次,智源就釋出了一個雙商線上的機器人,它不僅能幫你答疑解惑,還能基於心理諮詢助人理論,對你關懷體貼,實現深度情緒安撫和支援。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


智源最大中文對話模型EVA已經開源上線,除了擁有善解人意的特點外,還能展示大型大模型群聊現場。如下圖所示,語音機器人們互相聊得熱火朝天,PK誰才是高情商聊天小能手。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


“悟道模型中有文匯、文源等,不同的模型構建不同的機器人,用不同方式聊天。”唐傑說,未來要實現讓整個模型、讓所有人參與到群聊中,所有人和機器可以自然聊天。

二、問不倒的智慧語音助手,悟道大模型與OPPO共建高階知識問答

悟道大模型會聊天的能力,已經輸入到OPPO小布助手中。

從2018年12月釋出至今,OPPO小布助手已經成長了近3年,截至當前已覆蓋了2.5億臺智慧手機和IoT裝置。今年2月,小布成為國內首個月活躍使用者數破億的手機語音助手。

現在,小布的月活躍使用者數已達1.3億,月互動次數超過20億次。

這麼大的月活量,使用者主要都聊了什麼?

小布助手技術總監楊振宇分享說,知識問答在小布總互動量中的佔比約為15%,其中許多問題涉及領域廣泛,大量問題每月僅出現1次,樣本很少,每月會累計千萬級無法回答的問題。

與龐雜低機率問題相對的,是低效的人工建設。通常建設高質量的語料庫主要藉助人工標註的方式,標註員每天最多能產出不超過千條,每月成本卻高達數百萬。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


由於提問率超低、回答難度大的問題,這些長尾問題成為問答領域的無人區,需要企業耗費高昂的成本建設。當語音助手無法回答這些問題,通常要麼拒絕回答,給使用者一個設定好的預設回覆,要麼藉助搜尋引擎給出搜尋列表。

融合了悟道大模型能力的生成式知識問答系統“小布問答”,做到了為大量長尾問題即時生成非常流暢、自然的高質量答案,能顯著提升使用者對話互動體驗。

相對於傳統人工標註,基於悟道合作共建的生成式知識問答系統,平均單條長尾問題問答成本降低99%,抽驗準確率超65%並持續提升中,再加上上游增設的質量控制及融合排序,使用者實際體驗到的準確率會更高。

截至當前,該系統已累計已生成百萬級問答量

三、如何高質量回答難解問題?解讀悟道的三大技術硬實力

在小布問答體驗提升的背後,悟道生成式大模型功不可沒。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


在使用者輸入問題後,生成式知識問答系統會先進行意圖識別,將其分為問答意圖或非問答意圖,問答意圖中會存在大量無法回答的開放域問題。

對此,悟道大模型會生成一些高質量的答案,這些答案形成知識語料庫,再透過語義檢索的方式,向用戶提供服務。

針對現有使用者已提出而市面主流問答介面均無法回答的問題,悟道透過其通用語言模型GLM生成問答。

對於當前知識庫中不存在、使用者未來可能問到的問題,悟道則藉助GLM模型的三大能力,結合知識圖譜,形成持續知識預訓練模型,進而大規模生成問答語料庫:

1)文字生成能力:小布提供的無法回答的問題,是已經呼叫了多方資源仍然沒有得到答案的問題。而悟道大模型的文字生成能力能實現低成本快速構建語料庫,每臺機器每天可生成10萬左右的待稽核答案,並避免回答引用時的版權問題。

2)理解能力:利用大模型對於既有知識的理解、推理能力,配合智源“持續知識預訓練”技術,可以讓模型能夠更加理解常識和百科知識,從而使生成的結果更加符合百科常識。

3)小樣本學習能力:透過少量樣本,對生成結果,進行排序,提升文字表達的準確度。

這種新的技術正規化,能以低成本的方式回答現有問答系統無法回答的問題,目前在OPPO小布助手上得到成功驗證,雙方正在持續迭代升級中。

楊振宇透露,未來小布希望能繼續與智源拓展資料開放、模型共建、應用適配等更多合作方向。

四、大模型時代的應用大幕已然拉開

逐漸打磨成熟的一系列平臺及工具,以及更多示範應用案例的出現,正將大模型的應用價值推到歷史前臺。

在商業落地方面成果豐碩的大模型GPT-3,已經有300多個衍生應用,其相關創業公司也有好幾十個,有些公司還拿到了融資。這些商業應用的覆蓋範疇從日常辦公到補寫程式碼、從寫詩作曲到設計遊戲應有盡有。

唐傑希望在未來,悟道用自己的特色,在落地應用方面跟GPT-3對標。

此次悟道與小布助手的合作成果,釋放出未來智慧終端語音助手進化的積極訊號。經悟道大模型助力的小布,不再是隻擅長回答標準固定答案的機械語音機器人,而像人類一樣更靈活地聊天。

在接受媒體採訪時,唐傑提到大模型在問答方面還有進步空間。比如機器不能保證100%答案正確,也做不到引經據典、內涵豐富的複雜邏輯。“所以把大模型到你的應用中,還要做一些工作,讓它變得生產可用。”OPPO數智工程系統總裁劉海鋒補充說。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


智源研究院學術副院長、清華大學教授唐傑與OPPO數智工程系統總裁劉海鋒接受媒體採訪

長遠來看,大模型獨特的技術體系和產業模式,將提供一種更加高效率和低成本的AI開發基礎設施,或為智慧終端體驗的升級帶來新思路。

冬奧手語播報數字人也帶來了更大想象空間,比如未來大模型可以助力智慧製造,每個人都能設計全新的服裝或其他商品,透過智慧製造的車間3D打印出來,讓每個人的物品都變得個性化。

悟道大模型今天應用在終端智慧裝置、新聞手語播報,已經走進人們的日常生活,隨著悟道生態的持續擴張,未來還將在更多產業得到應用。

如今30家企業已經加入智源成立的悟道產業聯盟,更多從發展生態的角度來看待大模型的用途和趨勢,助力未來更大應用場景的發展。悟道還積極推進社群建設,包括大賽、科研基金等。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


自悟道釋出起,智源開始籌備悟道AI創新大賽,目前已有200個參賽隊伍參加,大賽將在11月14日進行決賽的現場路演和頒獎。

悟道也設有2500萬的科研基金池,擬支援50個科研基金,吸引全國各科研機構相關博士、老師、學生加入這裡進行科研研究。

此外,智源成立了悟道科技運營公司,希望在公司中實現開放API和實現端到端的解決方案,並且提供模型授權,以此將悟道大模型的能力對外開放,助力AI發展。

AI大模型時代快來了!未來或重新整理智慧終端體驗想象力


唐傑希望,未來悟道能變得更開放,落地到更大的應用場景。

結語:大模型落地正當時,或催生行業創新機會

在許多人眼中,引數規模驚人的大模型,是AI界的“陽春白雪”。如今智源釋出的多項技術創新及應用成果,昭示著國內圍繞AI大模型的產業模式已經啟航,開始透過生態合作將智慧像水電一樣輸送到人們的身邊。

大模型時代的落地浪潮正在加速湧來。當大模型的技術成果逐漸滲入AI研發和產業應用中,則有望帶來破壁效應,催生新的應用場景及產業模式,驅動AI技術與實體經濟的深度融合。新一輪行業創新的機會,也許正孕育於這股浪潮之中。

分類: 科技
時間: 2021-09-24

相關文章

華為釋出《大交通時代》:開啟未來數字交通宏圖
在華為全聯接2021期間,華為攜手電子工業出版社,日前釋出了國內交通行業數字化轉型專著<大交通時代:行業數字化轉型之道>.本書深度剖析了交通行業數字化轉型之道,詳細闡述瞭如何將5G.AI. ...

華為雲釋出盤古藥物分子大模型,開啟AI藥物研發新模式

華為雲釋出盤古藥物分子大模型,開啟AI藥物研發新模式
[中國,深圳,2021年9月23日]今日,主題為"深耕數字化"的華為全聯接2021隆重開幕.華為高階副總裁.華為雲CEO.消費者雲服務總裁張平安發表"深耕數字化,一切皆服 ...

大變局時代的序幕已經拉開,調控之下的當前樓市,人人都在焦慮

大變局時代的序幕已經拉開,調控之下的當前樓市,人人都在焦慮
01.前言 2021年我們都能感受到,一場深刻的變革正在進行. 不管是行業的陣痛,資本力量遭遇重錘監管,還是在經濟和社會環境中的很多肉眼可見的變化. 大變局時代的序幕,似乎在悄然之間,已經拉開. 對於 ...

買房賺錢的時代過去了,未來如何買房

買房賺錢的時代過去了,未來如何買房
房價上漲的最重要指標-塔吊含金量 先說結論:買房就賺錢的時代過去了,未來買房收益會冰火兩重天,買對了會賺的盆滿缽滿,買錯了會虧的底朝天.怎麼買對呢?不是地段地段還是地段了,是看房價上漲的最重要指標-塔 ...

8大模型搞定高考數學壓軸題: 立體幾何外接球與內切球, 高分不發愁!

8大模型搞定高考數學壓軸題: 立體幾何外接球與內切球, 高分不發愁!
今天給大家分享<8大模型搞定高考數學壓軸題>,喜歡的記得關注+點贊+收藏哦!

深度解析網際網路思維4大模型

深度解析網際網路思維4大模型
網際網路思維早已經成了網際網路中很知名的詞了,雖然大家都在談什麼網際網路思維.網際網路思維營銷等等,好像不知道網際網路思維就很LOW,但是能真正意義上了解.明白並且熟練運用網際網路思維的人是極少的. ...

冬奧手語播報數字人亮相 大模型助力人工智慧升級

冬奧手語播報數字人亮相 大模型助力人工智慧升級
一位冬奧手語播報數字人日前在中關村論壇亮相,可提供全流程智慧化的手語生成服務.這一數字人由北京市科委科技冬奧專項支援,基於智源"悟道"大模型打造,將在北京冬奧會期間正式投入應用. ...

大屏時代,iPod touch承載著遺憾
看見標題,就可以猜到,筆者是一個小屏狂熱愛好者. 是的,筆者目前正在使用的裝置是魅族18,2021年第一批小屏產品,它的效能也還算不錯,效能就不再細說,畢竟同樣外觀的18s已經上市. 今年13mini ...

央視把孩子的227篇課文拍成紀錄片!大語文時代裡甘肅的身影……

央視把孩子的227篇課文拍成紀錄片!大語文時代裡甘肅的身影……
北大中文系教授陳平原認為,"中小學語文課很重要,影響學生一輩子,一點都不誇張."從近年來各省市的中高考改革不難看出,語文的核心地位愈發凸顯,考試範圍不在侷限於書本知識點,大語文時代 ...

全球正處於大變局時代,我國也面臨許多困境,未來五年很關鍵

全球正處於大變局時代,我國也面臨許多困境,未來五年很關鍵
全球的時代開始慢慢地做出了改變,我們和美國的關係也將會進入到一個徹底脫離的狀態,這樣的一個狀態,其實會導致未來5年整個世界的格局變化特別大.其實我們國內也面臨著非常多的困難,未來的5年非常的關鍵.我們 ...

從恆大之困,看房市未來發展趨勢

從恆大之困,看房市未來發展趨勢
恆大最近很難.導致這個困難的最根本原因是銀行.銀行對於購房者的按揭放款卡得很緊,現在基本超過6個月了,這直接導致房產行業資金鍊斷流.年初國家約談了一個又一個城市,透過約談透過銀行所釋放出來的訊號就是房 ...

房地產的分析,恆大華夏幸福萬科保利的未來(原創)
有緣來欣賞的朋友,不妨先點關注,既可以看以前所有的影片和文章,也不會錯過後面源源不斷的有趣內容!為我鼓掌你會更精彩!謝謝! 恆大地產危機! 恆大現在總債務1.9萬億元,相當於我國1年GDP的2%. 恆 ...

AI改變天氣預報!更準確地預測未來1-2小時的降雨量

AI改變天氣預報!更準確地預測未來1-2小時的降雨量
谷歌母公司alphabet旗下的英國頂級人工智慧研究機構Deepmind再次崛起! 這一次,deepmind聚焦天氣預報的主要挑戰,與Met Office合作,將人工智慧應用於降雨預測,可以比現有的預 ...

彩電市場量跌額漲背後:家庭顯示進入大屏時代

彩電市場量跌額漲背後:家庭顯示進入大屏時代
雖然電視機出貨量"一路下跌",但電視面板卻越賣越大,這也直接造成了今年以來中國彩電市場"量跌額漲"的新局面.那麼,大屏就可以拯救低迷的彩電市場了嗎? 喬華||撰 ...

城市通勤比大排還快?寶馬G 310 GS兩萬公里長期測試(三)

城市通勤比大排還快?寶馬G 310 GS兩萬公里長期測試(三)
前兩期已經對車輛基礎情況及提車至今遇到的質量問題做了介紹,這次我來介紹一下G 310 GS在街道騎行場景中的表現. 北京的街頭 作為兩點一線的上班族來說,這臺車90%的時間我都在用來通勤,也就是早晚高 ...

馬自達的榮耀時刻 回顧馬自達的勒芒大進擊時代

馬自達的榮耀時刻 回顧馬自達的勒芒大進擊時代
1991年6月23日下午4點,Johnny Herbert駕駛著一輛馬自達787B賽車透過終點,標記著日本車廠以他們打造的獨特轉子引擎賽車,首次在法國勒芒大賽中拿下廠隊冠軍的榮耀時刻. 對於大部分的馬 ...

從北京灣到大平原時代

從北京灣到大平原時代
北京釋出平原新城發展方案.這個重磅事件在北京房產圈似乎被忽略了,其實頗值得買房人關注.尤其是"首都功能新載體"這一高標準定位,頗值得玩味. 發展平原新城,本質上就是發展大興.亦莊. ...

為何民國時期有些軍人沒啥經驗還能大殺四方 因為大帥時代真的變了

為何民國時期有些軍人沒啥經驗還能大殺四方 因為大帥時代真的變了
從北伐戰爭開始,民國軍事就經常出現沒啥軍事經驗的初生牛犢吊打戰場老油子的現象,一些著名戰將統帥(比如粟裕)甚至根本沒有軍校和舊軍隊經驗卻能大殺四方.這種反差並不奇怪,因為並不是所有的對抗經驗都能增加運 ...

快看:未來科學城這裡要建幼兒園、教育科研用地

快看:未來科學城這裡要建幼兒園、教育科研用地
昌平未來科學城建設不斷加速,今日位於未來科學城區域的沙河鎮傳來了最新進展.在沙河鎮內將建設2座幼兒園和1座教育科研用地.有關部門一次性公佈了這3項工程的規劃,小編今日就和大家一起來看詳情: 1.昌平區 ...