sponsored links

DeepMind透過擁有2800億個引數的模型來測試大型人工智慧語言系統

DeepMind透過擁有2800億個引數的模型來測試大型人工智慧語言系統的極限

該公司新開發的人工智慧語言模型被命名為Gopher

語言生成是目前人工智慧領域的一大熱門。有一類稱為“大型語言模型”(即LLM)的系統能夠實現各種強大的功能,包括改進谷歌搜尋引擎、打造文字介面的奇幻遊戲等。但這些專案也存在嚴重的缺陷,比如會生搬硬套一些涉及性別歧視和種族主義的語言,以及無法透過邏輯推理測試。這就帶來了一大問題:只靠增加資料和算力能否克服這些弱點?或者說,這種技術正規化是否即將遇到瓶頸?

Alphabet的人工智慧實驗室DeepMind在2021年12月8日發表了三篇研究論文,其中就探討了這個課題。該公司得出的結論是,進一步擴大這些系統的規模應該能帶來長足的改進。DeepMind研究科學家告訴記者:“該論文的一項關鍵發現是,大型語言模型仍在進化,其能力仍在增強,這一領域還沒有進入停滯期。”

DeepMind經常將工作成果運用到谷歌產品中。它建立了一個擁有2800億個引數的語言模型,將其命名為Gopher,用來探究這種LLM的能力。引數的多少是衡量一種語言的模型大小和複雜程度的直觀標準。在這方面來說,Gopher比OpenAI的GPT-3(1750億個引數)更大,但不如一些更具實驗性的系統,比如微軟和英偉達的Megatron模型(5300億個引數)。

在人工智慧領域,一般來說是越大越好的,因為更大的模型通常能提供更高的效能。DeepMind的研究證實了這一趨勢,並表明擴大LLM的規模確實能在一些最常見的基準測試(例如情感分析和彙總)中提供更高的效能。然而,研究人員也提醒,要解決語言模型固有的一些問題,不能只依靠資料和計算。

該研究員說:“我認為目前看來,這個模型肯定會以各種方式失敗。其中一部分因素在於,模型無法充分理解它所讀取的內容,而且我感覺,對於這一類問題,我們只是寄希望於透過更多的資料和更大的規模來改善效能。”

但他又補充說,還存在“其他類別的問題,比如模型沒能擺脫老一套的偏見,或者模型被欺騙而給出不實資訊。而對於這些問題,DeepMind認為擴大規模也不是解決辦法。”他指出,在這些情況下,語言模型將需要“額外的訓練程式”,比如來自真人使用者的反饋。

為了得出這些結論,DeepMind的研究人員針對152項語言任務或基準測試,評估了一系列不同大小的語言模型。他們發現在一般情況下,模型越大,能提供的結果就越好。而在科學家選擇的大約80%的測試中,Gopher具有最先進的效能。

在另一篇論文中,該公司還調查了與部署LLM相關的各種潛在危害。舉例而言,系統可能使用有毒語言、分享錯誤資訊、被用於惡意目的(例如分享垃圾郵件或廣告宣傳)。隨著人工智慧語言模型的部署範圍越發廣泛(例如作為聊天機器人和銷售代理),上述所有問題都會顯得越發重要。

但值得注意的是,在評估機器學習系統時,基準測試的效能並不是終極標準。在最近的一篇論文中,一些人工智慧研究人員(其中兩人來自谷歌)探討了基準測試的侷限性。他們指出,這些資料集的範圍終歸是有限的,無法與現實世界的複雜性相提並論。要測試這些系統,唯一可靠的方法就是看實際應用中的表現——新技術都不外乎如是。而藉助大型語言模型,我們將很快看到更多這樣的應用。

稿件來源:https://www.theverge.com/2021/12/8/22822199/large-language-models-ai-deepmind-scaling-gopher

該公司新開發的人工智慧語言模型被命名為Gopher

語言生成是目前人工智慧領域的一大熱門。有一類稱為“大型語言模型”(即LLM)的系統能夠實現各種強大的功能,包括改進谷歌搜尋引擎、打造文字介面的奇幻遊戲等。但這些專案也存在嚴重的缺陷,比如會生搬硬套一些涉及性別歧視和種族主義的語言,以及無法透過邏輯推理測試。這就帶來了一大問題:只靠增加資料和算力能否克服這些弱點?或者說,這種技術正規化是否即將遇到瓶頸?

Alphabet的人工智慧實驗室DeepMind在2021年12月8日發表了三篇研究論文,其中就探討了這個課題。該公司得出的結論是,進一步擴大這些系統的規模應該能帶來長足的改進。DeepMind研究科學家告訴記者:“該論文的一項關鍵發現是,大型語言模型仍在進化,其能力仍在增強,這一領域還沒有進入停滯期。”

DeepMind經常將工作成果運用到谷歌產品中。它建立了一個擁有2800億個引數的語言模型,將其命名為Gopher,用來探究這種LLM的能力。引數的多少是衡量一種語言的模型大小和複雜程度的直觀標準。在這方面來說,Gopher比OpenAI的GPT-3(1750億個引數)更大,但不如一些更具實驗性的系統,比如微軟和英偉達的Megatron模型(5300億個引數)。

在人工智慧領域,一般來說是越大越好的,因為更大的模型通常能提供更高的效能。DeepMind的研究證實了這一趨勢,並表明擴大LLM的規模確實能在一些最常見的基準測試(例如情感分析和彙總)中提供更高的效能。然而,研究人員也提醒,要解決語言模型固有的一些問題,不能只依靠資料和計算。

該研究員說:“我認為目前看來,這個模型肯定會以各種方式失敗。其中一部分因素在於,模型無法充分理解它所讀取的內容,而且我感覺,對於這一類問題,我們只是寄希望於透過更多的資料和更大的規模來改善效能。”

但他又補充說,還存在“其他類別的問題,比如模型沒能擺脫老一套的偏見,或者模型被欺騙而給出不實資訊。而對於這些問題,DeepMind認為擴大規模也不是解決辦法。”他指出,在這些情況下,語言模型將需要“額外的訓練程式”,比如來自真人使用者的反饋。

為了得出這些結論,DeepMind的研究人員針對152項語言任務或基準測試,評估了一系列不同大小的語言模型。他們發現在一般情況下,模型越大,能提供的結果就越好。而在科學家選擇的大約80%的測試中,Gopher具有最先進的效能。

在另一篇論文中,該公司還調查了與部署LLM相關的各種潛在危害。舉例而言,系統可能使用有毒語言、分享錯誤資訊、被用於惡意目的(例如分享垃圾郵件或廣告宣傳)。隨著人工智慧語言模型的部署範圍越發廣泛(例如作為聊天機器人和銷售代理),上述所有問題都會顯得越發重要。

但值得注意的是,在評估機器學習系統時,基準測試的效能並不是終極標準。在最近的一篇論文中,一些人工智慧研究人員(其中兩人來自谷歌)探討了基準測試的侷限性。他們指出,這些資料集的範圍終歸是有限的,無法與現實世界的複雜性相提並論。要測試這些系統,唯一可靠的方法就是看實際應用中的表現——新技術都不外乎如是。而藉助大型語言模型,我們將很快看到更多這樣的應用。

稿件來源:https://www.theverge.com/2021/12/8/22822199/large-language-models-ai-deepmind-scaling-gopher

分類: 體育
時間: 2022-01-05

相關文章

小學生體質掉隊了怎麼辦?不要慌,不要怕。動起來練起來

小學生體質掉隊了怎麼辦?不要慌,不要怕。動起來練起來
50米跑練習方法 斜坡跑練習 抬腿送髖.後蹬 一組8次,上坡跑在加速跑後練習 高抬腿.擺臂練習 利用6-10秒快速原地高抬腿.擺臂練習,來訓練快速反應和肌肉力量 放鬆練習 變速跑30-50米快,30- ...

後衛過人殺手鐧!幾種行進間運球過人教學

後衛過人殺手鐧!幾種行進間運球過人教學
在籃球場上,控球后衛是球隊的推動機和黏合劑,需要為隊友製造投籃機會,還要能夠攻擊籃筐.控球后衛經常需要持球推進過半場以及在快攻當中擺脫防守球員,所以學會一些快攻中擺脫防守的過人技巧尤其重要.今天籃球國 ...

被惡狗攻擊怎麼辦?注意兩點,不要“站著不動”和“轉身就跑”

被惡狗攻擊怎麼辦?注意兩點,不要“站著不動”和“轉身就跑”
關注[饞不膩天然狗糧],健康科學養寵 原創文章,請勿抄襲. 相信不少人出門都會遇到狗狗吧,那麼如果遇到一隻惡狗,它要準備攻擊你了,你應該怎麼辦呢?要注意兩點,不要"站著不動"和&q ...

墨西哥天氣預報收視第一,女主播一個轉身,網友:怪不得

墨西哥天氣預報收視第一,女主播一個轉身,網友:怪不得
大家好,歡迎來到看世界ba. 在墨西哥,天氣預報是最受歡迎的節目,只因為女主播實在太引人注目,很多宅男每晚守在電視機旁,只為她的一個轉身.就是這個看似普通的轉身,卻讓無數男人為之著迷. 墨西哥天氣預報 ...

民間故事:獵戶遇母鹿生崽,轉身要走,母鹿:把你孩子抱走

民間故事:獵戶遇母鹿生崽,轉身要走,母鹿:把你孩子抱走
清朝乾隆年間有個獵戶,與妻子成親多年無子,倆人尋遍名醫看病皆不見效,一日獵戶到山中打獵,無意遇見母鹿生崽,轉身要走,不料母鹿口吐人言說:"這是你的孩子,快抱走!"究竟咋回事?您往下 ...

汀芷園的華麗轉身,從一身的人間煙火,到滿滿的文化氣息

汀芷園的華麗轉身,從一身的人間煙火,到滿滿的文化氣息
一直在路上,發現美,分享快樂! 汀芷園是位於順峰山公園內的一座嶺南山水園林,這裡有亭臺樓閣.假山噴泉,幾間漂亮的中式閣樓,繞湖而建,中間以迴廊相連,就算是遇到雨天,依然可在此漫步.特別是位於青雲湖畔的 ...

剛說完不要和解放軍開戰,轉身就發射導彈挑釁,美軍為何假裝示弱

剛說完不要和解放軍開戰,轉身就發射導彈挑釁,美軍為何假裝示弱
約翰·海騰上將剛剛說完不要和解放軍開戰,轉身美軍就發射潛射彈道導彈.美海軍USS Wyoming號戰略核潛艇於 9 月 17 日在大西洋成功發射了三叉戟 II D5LE 潛射彈道導彈.這是美軍再次挑釁 ...

54歲徐帆出席活動現場落淚!多次轉身用紙擦淚,穿紅裙膚白不顯老

54歲徐帆出席活動現場落淚!多次轉身用紙擦淚,穿紅裙膚白不顯老
近日,54歲的徐帆在出席某電影的首映禮時在現場被一對母女感動到淚流不止,多次轉身擦眼淚. 當天,徐帆身著一襲紅裙,襯得她的面板白皙,利落乾淨的短髮再搭配上精緻的妝容,露出的脖頸和面板光滑細膩,整個人氣 ...

笑到最後才是贏,相聲行業集體停演,郭德綱的徒弟卻轉身上了央視

笑到最後才是贏,相聲行業集體停演,郭德綱的徒弟卻轉身上了央視
如今的相聲行業真是難,演出市場有了點起色,又集體迎來了停演潮.目前相聲行業的幾個主要團體,像是德雲社,青曲社,相聲新勢力,嘻哈包袱鋪等團體,都相繼宣佈停止演出.對於相聲演員來說,不能演出幾乎意味著事業 ...

朱亞文:拋棄相戀七年的富家女,轉身愛上陳思誠女友,結局如何?

朱亞文:拋棄相戀七年的富家女,轉身愛上陳思誠女友,結局如何?
沈佳妮總覺得,陳思誠不夠愛她,因為他嘴上說著喜歡她,身邊卻從來不缺美女. 她想要一份純粹的愛情,那個男人眼裡只能有她,只愛她一人.這份愛情朱亞文給她了. 朱亞文有一個相戀9年的富家女,為何還會愛上陳思 ...

民間故事:獵戶長出7條尾巴,妻子轉身就走,道士:還債

民間故事:獵戶長出7條尾巴,妻子轉身就走,道士:還債
歡迎來到槐柳樹下,本故事為<民間故事>系列之第294期<獵戶長出7條尾巴,妻子轉身就走,道士:還債>,用故事說明道理,故事教育人,用故事闡述生活百態,希望我的故事給您啟迪.如果 ...

九江大堤決口,朱鎔基看到官兵救災熱淚盈眶,轉身怒罵豆腐渣工程

九江大堤決口,朱鎔基看到官兵救災熱淚盈眶,轉身怒罵豆腐渣工程
有一句話叫水火無情,特別是水,平時看著十分柔弱,一旦形成水災,那帶來的災難是巨大的.人類在大自然面前顯得十分渺小,有時候又十分無助.從遠古時期先民們就和水災作鬥爭,比如傳說中的大禹治水,就反應出人們和 ...

劉徹闖進一農婦家,嚇得農婦轉身就跑,劉徹卻拉住農婦:姐你跑啥

劉徹闖進一農婦家,嚇得農婦轉身就跑,劉徹卻拉住農婦:姐你跑啥
漢武帝劉徹是中國歷史上不可多得的皇帝,他的功勞能和秦始皇媲美,因此也才有了"秦皇漢武".然而漢武帝劉徹能夠成為一代明君卻離不開他母親一一王皇后.而在他的母親王娡家裡居然因為算命才有 ...

游泳比賽中如何做好轉身動作?

游泳比賽中如何做好轉身動作?
游泳技術提高以後,很多人會去參加大大小小的一些比賽.這時,掌握專業的轉身動作就變得重要起來,這項技術能提高的你的游泳成績.而游泳的轉身方式並不少,不同的姿勢有不同的轉身方法和要求.今天就讓我們一起來了 ...

老人上交國寶索要800萬,專家稱最多1萬,老人轉身賣了1980萬
在我國古代宋朝時期,繪畫藝術空前繁榮,由於北宋統一結束了長期的藩鎮割據的局面,使得社會上商業手工業高速發展,國民經濟空前繁榮,藝術水平也隨之提升.從政治角度來看,宋朝在我國數千年的歷史上或許是失敗的, ...

朱元璋喝完老奶奶豆腐湯誇讚不已,轉身離開就下令:處死她

朱元璋喝完老奶奶豆腐湯誇讚不已,轉身離開就下令:處死她
人在一生中可能遇到一道道困難,生活就是跨越這些坎坷的過程,可能遇到貴人在他幫助下成功進步,人類是群居動物通常以家族為單位平時也會結交朋友. 接受他人助力一般都會表示感謝,與人玫瑰手有餘香雙槓都獲得愉悅 ...

舊房的華麗轉身,隨處可閱讀的時髦感現代公寓 | 理居設計

舊房的華麗轉身,隨處可閱讀的時髦感現代公寓 | 理居設計
讓我重新定義"自我" - SUMMER of 2021 愛閱讀愛學習的女孩溫溫 希望自己的家除了實用之外 還可以讓人產生隨時隨地都想坐下來讀書的慾望 這次裝修中 溫溫收回了之前外租 ...

轉身,遇見更好的自己

轉身,遇見更好的自己
憶往昔,風華正茂,用青春汗水捍衛祖國河山:看今朝,戎裝已換,一日為軍人終生鑄軍魂.在陝西檢察隊伍中,有這樣一群"最可愛的人",他們曾經身穿"國防綠", 用青春和 ...

大眾電動車銷量瘋漲,ID.家族8月交付7000+,大象轉身終於成了?

大眾電動車銷量瘋漲,ID.家族8月交付7000+,大象轉身終於成了?
前幾日,大眾公佈了旗下新能源車型的銷量.其中ID.家族的8月交付量達到了7023輛,從6月的3415輛,到7月的5810輛,再到8月份首度破千,大眾系電動車展現出非常強的成長性. 接下來跨界車型ID. ...

愛了王麗坤8年卻分手,喬振宇轉身娶了王倩一,原因可能是這個

愛了王麗坤8年卻分手,喬振宇轉身娶了王倩一,原因可能是這個
一, 2004年,19歲的王麗坤被"導演鬼才"徐克選中,進入電視劇<七劍下天山>劇組,不久之後,就和"天涯四美"之一的喬振宇撞了個滿懷. 兩個同樣舞 ...