sponsored links

AI再添猛將,全球首個知識增強千億大模型鵬城-百度·文心釋出

AI再添猛將,全球首個知識增強千億大模型鵬城-百度·文心釋出

這兩年AI領域最熱的一個詞就是大模型,全球的科技巨頭紛紛落子。為什麼大模型這麼熱?

我們正在經歷第四次工業革命,核心的驅動力就是人工智慧。但是在產業初期,不同行業、不同場景對AI的需求既複雜且碎片,同時AI人才也相對稀缺,所以很多企業靠人工去開發AI應用,成本高、效率低、落地慢。AI成為真正的驅動力,就需要很強的通用性,這就是大模型的價值所在——大模型已成為AI領域軍備競賽的關鍵。

今天,百度聯合鵬城實驗室重磅釋出雙方共同研發的全球首個知識增強千億大模型——鵬城-百度·文心(模型版本號:ERNIE 3.0 Titan),該模型引數規模達到2600億,相比GPT-3的引數量提升50%,在60多項任務中取得最好效果。

AI再添猛將,全球首個知識增強千億大模型鵬城-百度·文心釋出


鵬城-百度·文心模型結構圖

鵬城-百度·文心大模型的落地,讓中國在AI軍備賽中又增加一枚重要籌碼。

多方優勢打造“核武器”

我們知道,AI取決於算力、演算法、資料三個要素,而鵬城-百度·文心大模型在這三要素上都有著不可替代的領先性。

  • 先看算力優勢。

鵬城-百度·文心由鵬城實驗室提供算力。我們知道,AI對於算力的要求非常高,並不是每個企業都有能力搭建如此強大的算力中心,鵬城實驗室就是在這樣的背景下成立的、為行業提供強大算力的一個平臺。“鵬城雲腦Ⅱ”主要提供人工智慧研究必須的計算力資源、儲存資源、網路資源、資料資源和研究環境,覆蓋人工智慧基礎研究、重大應用、作業系統、資料資源共享、產業服務等專門研究實驗領域。鵬城雲腦Ⅱ算力叢集是我國首個國產E級AI算力平臺,吞吐效能國際領先,蟬聯全系統輸入輸出和10節點規模系統兩項世界冠軍。如此強大的“鵬城雲腦II”成為大模型研發的肥沃土地,文心大模型因為資料量大,對算力要求極高,所以選擇與鵬城實驗室合作。

AI再添猛將,全球首個知識增強千億大模型鵬城-百度·文心釋出


飛槳超大模型訓練與推理

  • 再看架構與演算法優勢。

大模型的訓練和推理對深度學習框架帶來很大的挑戰,而百度自研的飛槳是國內首個自主研發、功能豐富、開源開放的產業級深度學習平臺,在深度學習模型開發、訓練、推理和部署等方面,飛槳已可比肩TensorFlow、PyTorch等國際主流框架。飛槳具備開發便捷的深度學習框架、超大規模深度學習模型訓練技術、多端多平臺部署的高效能推理引擎、產業級開源模型庫四大領先技術。

據最新調研報告顯示,在IDC 2021年上半年深度學習框架平臺市場份額調研中,百度位列中國深度學習平臺市場綜合份額第一。百度飛槳、Google、Facebook形成鼎立格局,其中飛槳是市場三強中唯一國產品牌,並持續穩步增長。市場資料顯示,飛槳企業版EasyDL連續兩年保持市場排名首位,BML百度全功能AI開發平臺顯現強勁增速。

飛槳的端到端自適應分散式框架,實現了資料並行、模型並行、流水線並行、分組引數切片等等,使得超大規模的訓練能夠得以有效實現,鵬城-百度·文心模型並行效率高達90%。

在演算法上,為提升模型語言理解和生成能力,百度提出了可控學習與可信學習演算法。在可控學習方面,透過將模型預測出的文字屬性和原始文字進行拼接,構造從指定屬性生成對應文字的預訓練資料,模型透過對該資料的學習,實現不同型別的零樣本生成能力。在可信學習方面,針對模型生成結果與真實世界的事實一致性問題,透過自監督的對抗訓練,讓模型學習區分資料是真實的還是模型偽造的,使得模型對生成結果真實性具備判斷能力,從而讓模型可以從多個候選中選擇最可靠的生成結果,顯著提升了生成結果的可信度。

  • 最後再看資料優勢。

AI訓練取決於資料量,資料越多訓練出來的AI越聰明。文心大模型與眾不同之處在於除了在海量無結構資料學習以外,還融合了大規模的知識,所以文心被稱為知識增強大模型。我們知道,知識是做搜尋起家的百度的天然優勢。該千億大模型學習了多源異構的大規模資料與知識。百度知識增強大模型能夠從大規模知識和海量無結構資料中融合學習,學習效率更高、效果更好,具有良好的可解釋性。

由此可見,鵬城-百度·文心大模型集合了最強算力----鵬城雲腦II、最強AI架構——百度飛槳、再結合知識增強這樣的核心特色,三方面的優勢相結合,形成了一個重磅“核武器”,為中國AI產業軍備又填了一枚籌碼。

百度知識基因成就“與眾不同”

其實,這兩年在大模型熱下,全球幾大科技巨頭不斷重新整理大模型的資料量上線。2017年Transformer結構的提出,使得深度學習模型引數突破了1億,隨後模型引數一個比一個大,到了BERT網路模型的提出,使得引數量首次超過3億規模,GPT-3模型超過百億,鵬城盤古實現千億稠密的規模,而此次百度文心引數規模達到2600億,相信這個記錄很快也會再次重新整理。

大模型似乎沒有最大、只有更大。事實上,“大”只是一個相對值。AI的價值除了資料量大,還由很多方面的因素構成,不同大模型需要有自己的特色。

在懂懂看來,鵬城-百度·文心大模型眾不同之處就在於資料與知識的結合,這也是百度的獨特優勢所在,所以文心定位是知識增強大模型。

眾所周知,知識是人類智慧的結晶,是人類進步的重要推動力。想讓計算機像人一樣理解和認知世界,也需要讓計算機具備獲取、運用知識的能力。百度提出了知識增強大模型“文心”,突破了多源異構資料難以統一表示與學習的瓶頸。文心如同站在巨人的肩膀上,訓練效率和理解準確率大幅提升,並具備更好的可解釋性。據悉,隨著模型不斷進展,現在不僅能做理解,還能做生成,比如說要做知識推理、小說續寫、歌詞創作、作詩,這些都可以做得很好。

  • 首先看跨語言。

人類歷史長河中曾經有幾萬種語言。從縱向看,一個國家、地區在不同時代有不同的語言。從橫向看,同一時代不同國家甚至不同地區都有不同的官方語言。所以同一語義可能會有很多種不同的表達。為此,百度研製了知識增強跨語言大模型ERNIE-M,可同時從多種語言中學習,提升跨語言理解能力,讓機器有了同時學習和理解多種語言的能力。

比如,做機器翻譯的時候,以前是需要雙語對照的,一句中文對應一句英文的譯文,現在基於文心大模型不必再死板的一一對照,而是非平行語料。

  • 其次是跨模態。

人類是透過語言、語音、視覺等多種模態獲得對真實世界的統一認知。AI如果像人一樣理解真實世界,不僅需要聽懂語音、看懂影象影片、理解語言,這就需要突破不同模態、異構資訊的語義融合統一難題。百度提出知識增強跨模態大模型,包括理解大模型ERNIE-ViL、生成大模型ERNIE-ViLG,實現了複雜場景的多層次、高精度語義理解。其中,理解大模型ERNIE-ViL在視覺常識推理任務榜單獲得第一名;生成大模型ERNIE-ViLG實現文圖雙向生成,是全球規模最大中文跨模態生成模型。

AI的“輪子”駛向千行百業

AI再添猛將,全球首個知識增強千億大模型鵬城-百度·文心釋出

我們在文章的開篇就講過,千行百業對於AI的期待都很高,但AI面臨落地難的問題。大模型堪稱AI的“輪子”,輪子造好了,行業應用也就會越跑越快,加速AI的落地。正如高文院士所說,“預訓練模型對整個科學的發展、社會的發展、創新的發展都是非常重要的工具。運用這個工具,可以幫助做很多人工智慧的賦能,不侷限於某個領域,這對人工智慧的發展都是一個福音。”

文心大模型是百度大腦最新的核心技術突破,能夠做到效果提升、帶來成本降低、實現應用便捷,大幅降低AI應用門檻,滿足各種場景需求,加速產業的智慧化升級。

這一次文心大模型不是一個泛泛的模型,而是帶來了“全景圖”,其中既包含基礎通用的大模型,也包含面向重點領域和重點任務的大模型,比如NLP(自然語言理解)大模型、CV(計算機視覺)大模型和跨模態大模型。同時,還有豐富工具與平臺支撐高效便捷的應用開發,包括EasyDL-大模型零門檻AI開發平臺和BML-大模型全功能AI開發平臺,以及大模型開發工具、大模型輕量化工具和大模型部署工具。這就相當於不僅鋪好了公路,還造好了汽車,具體往哪開就看不同客戶的不同需求了。

AI再添猛將,全球首個知識增強千億大模型鵬城-百度·文心釋出

保險公司合同業務處理是一大難點,任務繁重、人員緊張、工作強度大、準確性和及時性要求高。一份合同需要完成近40個類目的條款解析分類,人工處理一份合同大概需要小半天時間,無論是人力成本、處理效率還是及時性都是行業業務環節中如何提高產能與效率的巨大挑戰。透過百度文心大模型賦能,國內一家大型保險公司定製了保險合同條款智慧解析模型,業務員處理單份合同文字的時長縮短到1分鐘,速度是之前的幾十倍,大大提升了工作效率。

中國聯通作為國內領先的運營商,服務上億使用者,一方面要更好的客戶體驗,另一方面也要不斷降低成本,傳統的服務模式已經不能滿足需求。中國聯通與百度合作,聯手打造了集約化智慧客服,面向場景可定製的對話技術。該技術以文心大模型強大的語義表示能力為基礎,建立了面向對話理解問題的專用預訓練模型。在保持優異應用效果的同時,該模型對資料標註量的需求降低45%以上,顯著提升了智慧客服業務鋪開的效率。

鵬城-百度·文心大模型是融合了自然語言理解和自然語言生成的全能模型,致力於解決傳統AI模型泛化性差、強依賴昂貴人工標註資料、落地成本高等應用問題,滿足真實場景中的應用需求,在各類AI應用場景都具備了極強的泛化能力。也就是說,有了鵬城-百度·文心大模型這個基礎,在面向不同的任務、在不同的應用場景裡做少量任務資料進行遷移學習,就可以應用於很多場景。

經過這幾年發展,百度文心大模型已經應用於很多行業,比如說通訊、金融、醫療、保險、證券、辦公、網際網路、醫療等等行業。隨著這次文心大模型全景圖的釋出,百度AI也將加快滲透,在更多行業中開花結果。

分類: 歷史
時間: 2021-12-07

相關文章

NBA歷史十大最被低估球星:實力遠大於名氣,這些名字不容忽視

NBA歷史十大最被低估球星:實力遠大於名氣,這些名字不容忽視
NBA歷史中,出現了許多不同時期統治力的超級明星,但是同時,也有一些明星球員,在他效力的年代,實力遠大於名氣,被普遍低估,而在球迷們談論歷史地位的時候,很少提到他們,今天小編就為大家盤點下NBA歷史十 ...

重慶中國三峽博物館十大鎮館之寶

重慶中國三峽博物館十大鎮館之寶
2005年7月8日,重慶中國三峽博物館開展了"十大鎮館之寶"評選活動,為此,該館從一萬餘件館藏文物中選出了29件候選文物.通過歷時3個多月的觀眾投票選出十大鎮館之寶(按得票多少排序 ...

中國元朝時期十大名將

中國元朝時期十大名將
元朝是中國歷史上國土面積最大的朝代,元朝時期不僅有許多的名臣,還有許多特別厲害的將軍和將領. 那麼今天小編就來盤點一下,中國元朝時期十大名將,我們一起來看看吧! 注:1.本排名為非正式的排名,僅供參考 ...

中國元朝時期十大戰役

中國元朝時期十大戰役
元朝是中國歷史上國土面積最大的朝代,也是中國歷史上首次由少數民族建立的大一統王朝. 那麼今天小編就來盤點一下,中國元朝時期十大戰役,希望文章對大家有所啟發. 十.海都之亂是指發生於元朝1268年--1 ...

NBA歷史十大身體天賦!詹姆斯僅排第五?

NBA歷史十大身體天賦!詹姆斯僅排第五?
NBA60年曆史中,湧現出一批又一批的魔鬼肌肉人,有的強壯,有的精健.但真正意義上的身體天賦不能只以強壯與否來衡量,應當將身體素質與打球技術相結合所展現出來的統治力,作為重要參考指標. 今天我們就來盤 ...

勇士隊歷史十大球星

勇士隊歷史十大球星
NBA歷史發展了很多年,這支隊伍是第一個總冠軍隊伍,擁有久遠的歷史,在很多年代中有很多位具有統治力的球星,這支隊伍就是勇士隊,一個挺有名氣的隊,近些年的統治力給這支隊伍成就了現在的名氣. 勇士隊十大球 ...

盤點新疆北疆旅遊十大必去景點(3):“人間淨土”喀納斯

盤點新疆北疆旅遊十大必去景點(3):“人間淨土”喀納斯
靜謐的喀納斯湖 新疆阿勒泰地區的喀納斯風景區,有著"中國十大秋景之首"的美譽,九月中旬起,喀納斯又進入到了一年中最美的季節. 喀納斯景區最美的景點"精品三灣"之 ...

NBA歷史十大“小矮人”:濃縮才是精華,小身材蘊含大能量

NBA歷史十大“小矮人”:濃縮才是精華,小身材蘊含大能量
假如我們一提到NBA,首先想到的都是高大的籃球運動,但在NBA從來沒有缺少過小個子球員,並且許多小個子球員也是不可忽視的,在球場之上,小個子球員就像小精靈一樣穿梭於長人如林的賽場中,特別是近年來 NA ...

好飯不怕晚!盤點NBA大器晚成的十大球星:一步一個腳印

好飯不怕晚!盤點NBA大器晚成的十大球星:一步一個腳印
來到NBA後的每個球員都希望自己能夠儘早名利雙收,享受美好的生活,但事情很多時候並不如願,拼搏了幾年也沒有名利雙收,還是一個小角色,很多球員就在這個過程中,被NBA淘汰了,但有些幸運兒,他們的年紀不小 ...

轉瞬即逝!盤點NBA曇花一現的十大球星:巔峰期突然隕落

轉瞬即逝!盤點NBA曇花一現的十大球星:巔峰期突然隕落
在NBA裡,有不少球員在打出幾個賽季的好的表現之後因為受到年齡.傷病和球隊體系的影響,從而突然隕落,再也無法打出曾經巔峰時期的表現,甚至因此而淡出聯盟.由於這些球員的巔峰期實在是過於短暫,因此不少球迷 ...

NBA歷史十大惡意傷人瞬間:有人被直接打暈,有人差點丟了命

NBA歷史十大惡意傷人瞬間:有人被直接打暈,有人差點丟了命
NBA是球迷們心中至高無上的殿堂.為確保比賽的公平進行, NBA一直在努力調整規則.但有規則的地方,就會有人違反規則.當然還有犯規,而且 NBA歷史上也發生過很多令人噁心的犯規事件.這類犯規遠遠超出了 ...

摧枯拉朽!盤點NBA一邊倒的十大總決賽:詹姆斯曾三度飲恨

摧枯拉朽!盤點NBA一邊倒的十大總決賽:詹姆斯曾三度飲恨
從內心講NBA總決賽對於球迷來說定然是一輪火星撞地球的系列賽,畢竟這次系列賽的結果直接事關最終金盃的歸屬,但由於各種各樣的原因,NBA總決賽並不是總是極致的激烈,有時候反而呈現一種一邊倒的狀態,本文就 ...

奧運會歷史十大丑聞:男扮女裝贏得金牌,美國夢之隊被蘇聯秒殺

奧運會歷史十大丑聞:男扮女裝贏得金牌,美國夢之隊被蘇聯秒殺
贏得奧運會金牌是每一個運動員都夢想的榮譽,所以很多運動員不惜冒險,以違反體育道德的方式獲得這一"榮譽",雖然有的人會僥倖地獲得成功,但是最終也會被曝光,甚至身敗名裂,還有很多的奇葩 ...

羽壇封神榜 羽毛球歷史十大最強男雙運動員

羽壇封神榜 羽毛球歷史十大最強男雙運動員
評選規則: 1.只參考1982年國際羽聯和世界羽聯合並後的成績. 2.兼項選手難以界定,故混雙成績不予計分. 3.勝者為王,僅冠軍計分,亞軍不予計分. 4.因為雙打搭檔變化,本排名為個人而非組合排名. ...

盤點新疆北疆旅遊十大必去景點(5):東方小瑞士-那拉提草原

盤點新疆北疆旅遊十大必去景點(5):東方小瑞士-那拉提草原
那拉提草原是世界四大草原之一的亞高山草甸植物區,素有"塞外江南"美譽的伊犁河谷內的著名景區,位於新疆伊犁哈薩克自治州新源縣那拉提鎮. 那拉提草原以其優美的草原風光與當地哈薩克民俗風 ...

中國超凡脫俗的十大仙境,此生不可錯過

中國超凡脫俗的十大仙境,此生不可錯過
1.張家界 奇峰三千,秀水八百 2.屏山大峽谷 雲霧繚繞,壁立千仞 3.梵淨山 梵天淨土,天空之城 4.南迦巴瓦 天上西藏,冰山之父 5.荔波 養了眼,醉了心 6.黃山 水墨丹青,雲海聖境 7.小東江 ...

運籌帷幄,決勝千里!盤點歷史最強十大司令塔

運籌帷幄,決勝千里!盤點歷史最強十大司令塔
名詞解釋:司令塔,旗艦上司令官發號施令的地方,設於艦隻甲板前方最高處. 在足球場上,用"司令塔"來形容的球員,意為"全隊核心.關鍵樞紐".這樣的球員不僅要有出眾 ...

當今中國領先世界的十大技術,堪比歷史上的四大發明(下)
六.急性M3型白血病治療方法 王振義院士 急性M3型白血病是白血病中死亡率最高的型別,被外界稱為"生命收割者",各個國家對該病束手無策.1986年,一位5歲的急性M3型白血病患者家 ...

骨骼驚奇!盤點NBA臂展最驚人的十大球星:倫納德僅排第九名

骨骼驚奇!盤點NBA臂展最驚人的十大球星:倫納德僅排第九名
和身高相比,臂展在NBA賽場上可能並不明顯,但這並不意味臂展的作用不大,在關鍵時刻有著臂展的優勢會在攻防兩端更加具有主動性,而臂展也逐漸成為了球隊考察球員的一項重要指標,本文就來盤點NBA球星當中十大 ...

野遊在大嵛山島——中國十大最美海島

野遊在大嵛山島——中國十大最美海島
作者:脫韁的兔子 說說這次旅行 這次旅行,說來已久. 早在去年,去霞浦看日出.日落,就發現有個半荒島--大嵛山島. 於是做好攻略,打算去一次. 島上,船很少,所以上去,一般都是兩天合適. 其實吸引我的 ...