sponsored links

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

機器之心報道

編輯:陳萍、杜偉

調參的苦與淚,還有那些「迷信的做法」。

每個機器學習領域的研究者都會面臨調參過程的考驗,當往往說來容易做來難。調參的背後往往是通宵達旦的論文研究與 GitHub 查閱,並需要做大量的實驗,不僅耗時也耗費大量算力,更深深地傷害了廣大工程師的頭髮。

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

有人不禁要問:調參是門玄學嗎?為什麼模型明明調教得很好了,可是效果離我的想象總有些偏差。

近日,reddit 上一則帖子引發了網友熱議,「機器學習調參領域有哪些迷信的看法或做法呢?

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

原貼地址:https://www.reddit.com/r/MachineLearning/comments/rkewa3/d_what_are_your_machine_learning_superstitions/?sort=confidence

關於調參的那些「秘訣」

在機器學習中,超引數調整是一項必備技能,透過觀察在訓練過程中的監測指標如損失 loss 和準確率來判斷當前模型處於什麼樣的訓練狀態,及時調整超引數以更科學地訓練模型能夠提高資源利用率。

每個人都會根據自己的實際經驗進行模型調參,最終,絕大多數研究者可能得出的經驗就是:

  • Random seed = 0 得到壞的結果
  • Random seed = 42 得到好的結果
  • Even-valued k in k-Means = insightful segmentation

有人將這一經驗總結奉為所謂的 ML「迷信做法」,但其實不然,幾乎所有學者都這樣做。

不過,也有網友對這一經驗總結持懷疑態度:網友 @SlashSero 遺憾地表示,這種情況甚至會出現在非常有名的科學出版物上,尤其是在交叉驗證不可行或者易受其他引數選擇影響的機器學習應用中,因此超引數最佳化(HPO)不可行。不妨看看 NeurIPS 會議論文有多少擁有真正透明的程式碼庫和易於復現的交叉驗證研究,以證實他們的工作較去年提升了 0.5-1% 的效能。

另外,很多時候出於對研究者的信任,但其實會導致新的深度學習模型在實踐中並沒有表現出明顯優於傳統模型的效能。我們應該看到,社群存在這樣一種現狀:花費大量時間確保模型真正兌現它所表現出的效能,並且可復現和透明,這是一項吃力不討好的工作。消耗計算資源不說,還有可能失去在一個發展極快的領域發表論文和獲得表彰的機會。

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

為了實現模型最佳效能,各路網友也紛紛曬出自己的煉丹經驗:有網友認為 Random seed 必須是 10 的倍數,最好是 1000(不過該回答遭到了別人的反駁)。

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

除了 Random seed 設定外,有研究者分享了自己的一些科研小技巧。

模型的訓練過程,近乎黑盒,假如期間發生程式錯誤,很難察覺到,有網友建議隨時隨地進行「print」是一個很好的習慣,在程式第一次執行時,一定要列印所有可能的東西,「print」能讓你知道程式進行到哪一步,有沒有陷入死迴圈...... 其實,絕大多數程式設計師都會這樣做。

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

除了「print」外,有人表示日誌記錄也非常有必要,在實驗室做科研,有時為了跑一個程式,需要花費好幾天的時間,但總有那麼不順心的地方,要麼好久不斷電的實驗室突然斷電,要麼伺服器崩了…… 所以隨時隨地儲存日誌也是每個程式設計師必備的,檢視日誌記錄,你能發現程式執行到哪了,粗略估計模型效能,還能檢視錯誤:

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

還有網友曬出了自己的 dropout 經驗,認為超過 20% 的 dropout 將使該模式難以恢復。不過這只是這位網友自己的經驗,也有人表示自己採用 90% 的 dropout,模型效能最好。

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

除此以外,有網友總結了批大小應該是 2 的冪次方。

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

以上就是網友總結的一些 ML 煉丹小技巧。

玄學論文難復現

雖然調參有用,但網友 @ostrich-scalp 犀利地批駁道,「大多數論文的結果都是胡說八道,將我的職業生涯都用來實現這些工作並期望建立像模像樣可用於生產的模型,這是一個極大的錯誤。」

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

上面那位老哥 @SlashSero 接茬說道,「令人難以置信的是,ACM、IEEE、IAAA 和 NeurIPS 上發表的論文有多少完全只是出於對作者的信任。到現在為止,你可能希望所有知名期刊和會議都要求論文作者開源和復現程式碼,但這種情況只是例外。」

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

顯然,機器學習是一門技術。雖然神經網路黑箱的狀態讓可解釋性受限,但我們可以在較高層面上透過經驗解決面臨的問題。我們需要載入資料,建立框架,讓系統執行起來,設定度量標準,調整引數並分析誤差,進行特徵工程,結果視覺化等等步驟。最終經過數次迭代直至推理的準確率不再提升。

那麼為什麼各種玄學現象仍然不斷出現,拷問著我們的心靈?看來,我們對這門學科的瞭解還不夠多。

不過請記住 NIPS 2017 大會上圖靈獎得主 Judea Pearl 演講的最後一頁 Keynote:

深度學習如煉丹,你有哪些迷信做法?網友:Random seed=42結果好

資料科學僅當能促進對資料的合理解讀時才能被稱為科學。

不過也不用怕,深度學習調參總還是有技巧可循的,大致可以總結如下。這些算不得迷信做法,僅供參考。

  • 尋找合適的學習率。作為一個非常重要的引數,學習率面對不同規模、不同 batch-size、不同最佳化方式和不同資料集,它的最合適值都是不確定的。我們唯一可以做的,就是在訓練中不斷尋找最合適當前狀態的學習率;
  • 權重初始化。相比於其他的 trick 來說使用並不是很頻繁。只有那些沒有預訓練模型的領域會自己初始化權重,或者在模型中去初始化神經網路最後那幾個全連線層的權重。常用權重初始化演算法是「kaiming_normal」或「xavier_normal」;
  • 資料集處理,主要有資料篩選和資料增強;
  • 多模型融合,這是論文刷結果的終極核武器,深度學習中一般有幾種方式,比如同樣的引數,不同的初始化方式;不同的引數,透過交叉驗證選取最好的幾組;不同的模型,進行線性融合,例如 RNN 和傳統模型;
  • 餘弦退火和熱重啟的隨機梯度下降。餘弦退火就是學習率類似餘弦函式慢慢下降,熱重啟就是在學習的過程中,學習率慢慢下降然後突然再回彈 (重啟) 然後繼續慢慢下降;
  • 嘗試過擬合一個小資料集。關閉正則化 / 隨機失活 / 資料擴充,使用訓練集的一小部分,讓神經網路訓練幾個週期。確保可以實現零損失,如果沒有,那麼很可能什麼地方出錯了。
  • ……

調參路上各有各的「路數」,適合自己就好。

最後問一句,煉丹的你有哪些獨門秘籍呢?

參考連結:

https://www.jiqizhixin.com/articles/2020-10-21-3

https://picture.iczhiku.com/weixin/message1609136710592.html

分類: 娛樂
時間: 2021-12-19

相關文章

《掃黑風暴》後又一反腐劇來了,郭京飛是男主,女主讓觀眾想棄劇

《掃黑風暴》後又一反腐劇來了,郭京飛是男主,女主讓觀眾想棄劇
導語:娛樂圈是個特別大的平臺,還被分為多個領域,最常見的就是歌壇.影視圈.綜藝圈.相聲圈等.回顧這幾年的成長,發展最快的應該就是影視圈了,從剛開始只有古裝劇.現代劇之分,到現在細化成懸疑劇.偶像劇.都 ...

這劇情逗我玩嗎?全員虎了吧唧,30分鐘就棄劇,佟麗婭新劇你贏了

這劇情逗我玩嗎?全員虎了吧唧,30分鐘就棄劇,佟麗婭新劇你贏了
從現階段的收視率來看,還是央視各臺的電視劇名列前茅,其中有一部劇更是自開播以來收視率全程破1,在低迷的大環境中有點出人意料.這就是<霞光>,它已經連續5天破1,一直非常穩定. 不過口碑似乎 ...

《頂樓3》結局被罵慘!盤點10部爛尾韓劇,玄彬、孫藝珍都上榜

《頂樓3》結局被罵慘!盤點10部爛尾韓劇,玄彬、孫藝珍都上榜
好看的韓劇很多,但人在江湖走,還是會有踩雷的時候,近期<頂樓3>的大結局就被觀眾罵慘,追了三季結果主演全員GG,更從權力鬥爭話鋒一轉變成奇幻劇,讓不少劇迷傻眼. 以下幫大家整理了10部被罵 ...

真不想他們老去,這9位大咖都老了,最大的71歲,最小的也59歲了

真不想他們老去,這9位大咖都老了,最大的71歲,最小的也59歲了
最近的一段時間,娛樂圈的瓜接連不斷. 流量明星頻繁"翻車",讓網友們越來越倚重老戲骨.實力派. 事實上老戲骨們也確實給力,給我們帶來了不少精品. 可不知不覺間,老戲骨的年齡也越來越 ...

年輕人為什麼沉迷經典老劇

年輕人為什麼沉迷經典老劇
#你看過多少比較經典的老劇,好看的那種# "你的童年,我的童年,好像都一樣" 讀這句話時,你是不是忍不住唱起來了? 近些年來,年輕人好像越來越愛刷經典老劇了.<家有兒女> ...

因雷劇成名,還創造過收視神話,穆婷婷為何突然消失在觀眾視野?

因雷劇成名,還創造過收視神話,穆婷婷為何突然消失在觀眾視野?
隨著年齡的增長,很多演員都成了觀眾心中"時代的眼淚",提到穆婷婷的時候,也經常有人這麼形容她,但其實她比唐嫣還小了一歲. 穆婷婷在娛樂圈的境遇跟陳紫函.郭珍霓有點像,她們都美得很有 ...

至今都未走出來的6部虐心劇,你看過幾部?

至今都未走出來的6部虐心劇,你看過幾部?
1.<錯愛>:這部劇真的是我一個很大的陰影,整體基調很壓抑,屬於現在回想起來還有點害怕的程度.雖然內容已經忘得差不多了,但有幾個場景記得很清楚,比如曉濤在女主面前出車禍血流一地,女主痛不欲 ...

國慶追劇指南:優愛騰芒新劇全在這了,V榜豆瓣參考也有了

國慶追劇指南:優愛騰芒新劇全在這了,V榜豆瓣參考也有了
國慶長假,除了回老家和出去玩,追劇也是一項實惠娛樂,只要有網,就可以看盡各大平臺網劇. 因為我本人不開電視,所以給大家推薦網劇. 介於每個人買的會員不同,所以按照不同平臺介紹一下,國慶可以看什麼? 一 ...

娛樂圈小花之爭,85還在演偶像劇,90未成氣候,95顏值花美貌驚人

娛樂圈小花之爭,85還在演偶像劇,90未成氣候,95顏值花美貌驚人
內娛現在挺奇怪的,小花之間的爭鬥竟然全部集中在偶像劇市場,換言之,就是全部都集中在比拼美貌的程度,完全沒有轉實力花的趨勢. 黃金一代的四旦雙冰已經開始淡出影視劇,成功上岸,李冰冰他們已經在培養下一代小 ...

新劇《我真是大明星》太無奈,劇名像綜藝節目,但馬麗卻只是配角

新劇《我真是大明星》太無奈,劇名像綜藝節目,但馬麗卻只是配角
為了能夠獲取流量,能夠有更多人的觀看,不管是綜藝還是影視劇方面,導演組們都下盡了功夫,就是儘可能地提高收視率.網劇在以前是"低廉"的代名詞,製作成本小,演員的名氣小,內容老套,只有 ...

豆瓣9.5分抗戰劇!死都不怕,就怕不安逸

豆瓣9.5分抗戰劇!死都不怕,就怕不安逸
第一次看這部劇已經十年有餘,每年我都會重溫一到二遍,就是喜歡看,喜歡一個人靜靜的看,看他們嬉笑怒罵時我會笑,看他們悲憤無助時我會哭.每一個人物都是那麼的有血有肉,這是一群操著天南海北的口音來自五湖四海 ...

近幾年熱播的五部高分劇,每一部都好評如潮,錯過一部都是遺憾

近幾年熱播的五部高分劇,每一部都好評如潮,錯過一部都是遺憾
第一部<隱秘的角落>豆瓣8.8 一開始自己和小高和媽媽看了幾集,因為大家都覺得劇情太過壓抑十分窒息棄劇了,上課時無聊又拿出來接著看,依舊是這種感覺,黑暗.壓抑.人性之惡.原生家庭父愛的缺失 ...

趙麗穎新劇《野蠻生長》男主改歐豪,網友:把王一博換回來

趙麗穎新劇《野蠻生長》男主改歐豪,網友:把王一博換回來
由於娛樂圈的清朗活動,不少明星都因此受到或多或少的整治.有的人被徹底"驅逐"出娛樂圈,有的人被警告點名. 趙麗穎則是處於這兩者之間,對她的懲罰不說重,但也不能算輕.由於之前她主演的 ...

最近熱播的七部電視劇,你追過哪幾部

最近熱播的七部電視劇,你追過哪幾部
最近好多電視劇開播,有古裝的.探案的.都市甜寵劇.年代劇以及農村改革劇. 這些劇雖然題材不一樣,但是都非常精彩,值得一看. 這裡有為大家盤點一下熱播劇,看看你喜歡哪幾部. 一:君九齡 題材:古裝 推薦 ...

《國子監來了個女弟子》:開播被男主勸退,徐開騁為何被批醜男?

《國子監來了個女弟子》:開播被男主勸退,徐開騁為何被批醜男?
<國子監來了個女弟子>9.22開播,全30集,已更10集,騰訊影片播放量只有6500萬,集均650萬,真的太少了,沒想到還能成為V榜網劇第一? 這大部分的熱度要歸功於對男主徐開騁的吐槽聲吧 ...

“反差”成就了別樣的任嘉倫

“反差”成就了別樣的任嘉倫
我個人感覺,任嘉倫在娛樂圈不是最帥的,不是最亮眼的,條件不是最好的.初次看,我也沒有"驚為天人".<大唐榮耀>當時比較火,我看了一集,還在想為什麼會選這樣的男主角,說實 ...

玄機吊打若森,知名IP改編更易成國漫巔峰?我只能說你太天真

玄機吊打若森,知名IP改編更易成國漫巔峰?我只能說你太天真
最近這些年,國產動漫的發展有目共睹,不管是電影還是動漫系列,可以說都在質的水平上面有了足夠的提升,而作為動漫系列的兩大製作廠商,玄機和若森,也是屢屢被人們所熱議,作為最大的兩家動漫設計公司. 可以說玄 ...

強行裝嫩的7位演員,有的57歲還在演少女,有的演少男被說油膩

強行裝嫩的7位演員,有的57歲還在演少女,有的演少男被說油膩
年齡,一直是娛樂圈的明星們難以逾越的鴻溝,可偏偏很多角色要求出演的標準的就是少男少女. 前段時間孫儷在<安家>裡飾演的房似錦,就因為眼睛外凸,被觀眾吐槽上了年紀. 可還是會有演員,對不符合 ...

如果《橘子紅了》放在2021年,還能紅嗎?

如果《橘子紅了》放在2021年,還能紅嗎?
今天,我把一部老劇--<橘子紅了>看完了. 說實話,這部電視劇比起現在很多特效橫飛.套路滿滿的電視劇來說,算不上抓眼球的,甚至連一個絕對的反面人物都沒有,更不用提讓人有復仇的快感和恨得牙癢 ...

美男子產地還得看山東!10位山東籍男星,個個濃眉大眼,陽剛帥氣

美男子產地還得看山東!10位山東籍男星,個個濃眉大眼,陽剛帥氣
唐國強 如今熒屏上的小鮮肉異軍突起,滿屏的男明星也都畫著眼線.妝發齊全,有的男明星甚至比女星打扮得還過分,不知從何時起,"娘炮"審美的不正之風已經將整個娛樂圈帶跑偏了. 然而曾經的 ...