"以學科交叉的方式
探索人工智慧背後的根本性原理
立志做一名基礎研究的探路人"
從科研到體育
交叉資訊院2018級本科生徐海珂
在一段漫長的歲月裡
走著一條悠長的路
途中既見坎途
又遇風來
這是關於堅持的故事
“紮實沉穩,能踏實追求有深度的關鍵性突破,是難得的、不盲目追求速度和數量的、有定力的、坐得住冷板凳的基礎理論儲備人才。”在徐海珂的特獎推薦理由裡,這樣一段話引人注目。而他“定力”與“紮實沉穩”的養成,或許要從高中時學習資訊競賽的經歷開始。
這段經歷對他的學習起到了很大的幫助,“不僅體現在我掌握的知識,還體現在我接觸的計算機領域的前沿方向和由此培養的思維方式。”並直接影響到了他的專業選擇。
除此之外,這段經歷也讓他養成了一種習慣,“一個人在封閉的環境裡,去做一件很難的事情”。
破舊立新,做基礎研究的探路人
如果說高中時期競賽經歷影響了徐海珂的專業選擇,那大一期間的訪學經歷則影響了他的未來發展和研究方向。
大一暑假,徐海珂在牛津大學進行訪問。期間,他和當地的清華學長進行了交流。儘管他和兩位學長交流的主要是天體物理學相關的內容,與自身專業並沒有很大關聯。但學長們在他鄉異國獨自打拼、默默仰望星空的身影,帶給了他很大觸動。這段經歷給他留下最深刻印象的,是整個訪問過程中的學術氛圍。“在一個清幽美好的地方安靜思考、做研究是一件很美妙的事情,是我理想的狀態。”對於徐海珂來說,這件事播下了他想要從事計算機科學研究的種子。
此後,他提前選修了高年級的“機器學習”課程。在課程中,徐海珂瞭解到,雖然“機器學習”已經在生活中廣泛運用,但基礎理論仍然不夠完善,尤其來自中國的研究在這方面比較薄弱。“CS Rankings的統計資料顯示,中國的計算機學科在大多數方向都發展迅速,唯有理論方向仍和世界一流高校有較大差距。”高中有過資訊競賽經驗的徐海珂對理論計算機並不陌生,瞭解到該學科的重要性以及中國的現狀後,他對“機器學習理論”產生了興趣,他相信完善的基礎理論可以更好地指導“機器學習”在實踐中應用。
科研最大的魅力是什麼?徐海珂用他的一次課題經歷給了我們答案。在進行某個課題的時候,已經完成前90%工作的徐海珂被卡在了最後10%的證明上,“一般來說,這個時候大家都不太捨得放棄之前已經完成的90%,但是這樣恰恰很容易陷入思維定式之中”。但是,他最終選擇推翻了之前的全部理論,併成功解決了問題。“我覺得這個不斷破舊立新的過程就是科研最大的魅力所在。”
在學科交叉的路上,徐海珂也在不斷嘗試著新的思路和方向。在大二暑假研究“強化學習”時,徐海珂偶然發現,該領域中前人猜測的一個不可能突破的技術障礙似乎可以用“線上學習”中的技巧解決,而那個技巧正是他在半年前研究“線上學習”中多臂老虎機問題時,在最初的文獻閱讀中無意瀏覽到的。儘管和自己當時的課題並不直接相關,但他經過大膽嘗試,成功設計出了一種和前人思路完全不同的演算法,最終解決了前人提出的開放性問題。審稿人給出了這樣的評價:“I like the paper. I find the algorithmic approach and the analysis quite creative and I certainly appreciate the use of new techniques and algorithmic approaches.”(我喜歡這篇論文。我發現演算法方法和分析非常有創意,我的確很欣賞新技術和演算法方法的使用。)
在進行“非凸最佳化”的研究過程中,徐海珂也進一步感受到了學科交叉的樂趣與魅力。相比之前側重於機器學習的演算法設計,“非凸最佳化”更側重於分析演算法的執行效率,是幾乎所有機器學習演算法執行的底層基礎,這次經歷讓他以更加數學化的方式去理解“機器學習”,同時也使他堅定在學科交叉的道路上,做一個敢闖、肯鑽的基礎研究探路人。
坐冷板凳,在起落中夯實理論基礎
科研的道路總會有困難,對於徐海珂來說,他覺得自己做科研比較困難的,應該是最開始的部分。“一開始你面對全新的領域,你要先讀別人的論文。那種理論的論文還特別長,50頁100頁,一半以上都是公式,大機率看不懂,大部分人這時候就被勸退了。”徐海珂坦言,就連自己也差點被勸退。但當他花了時間啃下這篇論文,發現文章或許很長,但核心思想可以概括得很簡練,後面接下來就變得簡單了。
而科研中需要花時間去啃的,又何止讀論文。
徐海珂的第一次科研是跟隨李建老師探索“線上研究”中的“多臂老虎機”問題。在當今大資料時代,資訊保安至關重要。徐海珂的研究嘗試設計出安全穩定的線上學習演算法以抵禦惡意資料的攻擊,從而維護安全穩定的網路環境。在研究的開始階段,徐海珂的進展非常順利,他在三個月內便成功改進了之前的演算法。而正當他準備投稿的時候,卻發現這個問題已經被新近發表的論文完成了。
這對第一次參與科研的徐海珂造成了不小的打擊,“第一反應當然是非常沮喪和失落”。但在老師的鼓勵和自我的調整中,他放慢了投稿的速度,仔細分析了自己的演算法和新發演算法的差異,並在這一過程中,對自己演算法的核心思想有了越來越深刻的理解,成功將其擴充套件到了另一個實際生活中的重要場景,展現了自己的獨特優勢。
最終,在一年“冷板凳”的經歷之後,徐海珂成功在人工智慧國際會議UAI 2021發表論文。“這一次經歷也使得我認識到了深入基礎、探索問題本源的重要性。儘管科研的過程中會有很多困難,可能很久都沒有進展,但只要堅持,最後還是會突破的。”
雖然徐海珂覺得自己在這個問題上耗費的幾個學期稍顯拖沓,但回過頭來,他認為,“如果沒有這些波折,我可能不會去思考演算法是否還有最佳化的空間,同時這也反映了我在研究的東西是大家所關注的,這是一件好事,而且我認為在未來的科研道路上我一定還會遇到比這個大得多的困難,也算是提前適應。”
同時他也提到,在科研過程中,如果自己的想法被發現證偽或是出錯的時候,他也會經常出現情緒波動,但他已經學會快速調整自己的心態,保持定力,“我們一開始做科研也許是想多發一些文章、有可以寫進簡歷的產出,但其實漸漸地就會發現有意義的研究未必是立竿見影的,未必一經問世就能產生很大的影響。我覺得如果將來我的研究可以作為漫長研究鏈條上的一環,我的成果在經過多個人的迭代研究之後能有很深遠的影響,這也是一件很有意義、很值得我長久堅持的事情。”
無體育不清華,把“長跑”變成興趣
“我在高中時候就沒有跑過三千米,我當時一千米就要五分鐘,三千米第一次跑完是27分鐘。”徐海珂坦承,自己在高中時期對體育並不感興趣,但一直對清華的體育要求有所耳聞,直到上大學才開始突擊體育鍛煉。“大一為了及格一直不停地練習,最終三千米跑了十三分鐘多。”
相比短跑,徐海珂覺得自己更容易在3000米上有所提高。相比短跑瞬時的力量,“三千米的(需要的)那種耐力和科研很像,我這種性格的人更容易克服。”徐海珂表示,雖然自己50米跑得不是很快,但跑3000米會快過身邊的大部分同學。
每次跑步時,他都會給自己定下目標,跑完之後又會和昨天比較,這樣慢慢就會有所提高。至於每學期練習多少次?“反正每次我比它(學校規定)多好多,我也不太注意。”
而從大二開始,可以自主選擇的體育課則讓培養起了徐海珂對體育的興趣。從跳水、游泳到檯球和定向越野,他逐漸體驗到了體育的樂趣所在。“這都是我自己選的課,而且也很有樂趣,也願意多花時間練習,參加比賽也可以有不錯的成績。”
徐海珂坦言,剛開始跳水課程的時候,自己也害怕高臺的高度,但按照老師的專業講解,自己最終還是克服了對於高度的恐懼,完成了課程的要求。而給他留下最深刻印象的,還是最終結課時站上十米臺的經歷。“那個時候我已經沒有那麼恐高了,我當時覺得可能會有點疼,但這是一次很難得的體驗,所以即使疼痛也一定要跳下去。”
“其實跳完之後是既開心又遺憾的,開心的是終於完成了一直以來的目標,遺憾的是可能不會再有機會站上十米臺了。我會比較在意這些新的體驗,因為可能一生也就只會體驗這一次。”
儘管一開始參與跳水,徐海珂抱著和很多同學一樣“打卡”的心態,但“打卡打得沒意思的時候,就會在意自己的技術水平能不能比上一次更好一點。”徐海珂覺得,自己是比較在意能不能進步的人。在一次跳水課上不小心被同學踢傷,一個月不能上課,而傷愈之後距離參加比賽只有兩週左右的時間,在更加頻繁訓練的同時,他也積極向助教尋求指導,最終在清華的跳水比賽中獲得了冠軍。
徐海珂認為,其實三千米和科研非常相似。“大部分時間其實都是比較平淡的,這時候離目標比較遠,會比較痛苦。但是三千米每過一圈你會知道自己離終點更近一步,科研也是每過一段時間你會得到一點小小的正向反饋。這兩個活動最主要的特點都是大部分時間都是在漫長的等待和忍耐。”
從初探科研的躍躍欲試,到面對難題時的追根溯源,再到無意間開啟學科交叉的大門,科研就像一場長跑,而在這樣漫長的旅途中,徐海珂立志以學科交叉為基礎的道路,做一名基礎研究的探路人。
◐◑◒◓◔◕
徐海珂 / 交叉資訊院
男,計科82班。現任計科82班學習委員。曾獲國家獎學金、清華之友——鄭格如獎學金、新生獎學金、國際大學生程式設計競賽亞洲區域賽冠軍、中國大學生程式設計競賽總決賽亞軍、清華大學第20屆跳水比賽男子單人入水專案冠軍、馬約翰杯學生運動會毽繩比賽180秒三人計數踢毽乙組亞軍等。以第一作者身份在國際會議COLT 2021和UAI 2021發表論文兩篇。
來源|清華小五爺園
編輯|趙姝婧 張馨
排版|張馨