我們每時每刻都在進行著抉擇:早中晚吃什麼?出行工具選什麼?今天要不要點一杯奶茶?但是你想過沒有:我們在面對問題時如何做出準確的選擇?我們如何判斷自己做出的選擇是否符合自身利益?
為了帶大家深入瞭解抉擇及其背後的機制,我們將以決策研究領域的問題進行追問,以多人聯動的方式,帶領大家瞭解抉擇背後的原理以及目前的最新進展。
本次我們採訪了中國科學院神經科學研究所楊天明研究員,他將帶領我們瞭解決策機制的價值估算模型,以及我們在面對意外情況時如何進行決策。按照慣例,楊天明研究員也提出了自己最想知道答案的一個追問,我們將在文末公佈該問題。
以下為具體文字內容:
您好,可以為我們介紹下您目前主要的研究領域和方向嗎?
楊天明:我們目前主要的研究是透過獼猴來研究大腦的高階認知功能,包括認知功能的神經機制和計算原理。比如在決策過程中,大腦如何收集和整合資訊、如何計算決策過程中關鍵的價值資訊等。同時我們也會建立一些神經和人工神經網路模型,來解釋人和動物的抉擇及認知行為以及這些過程中大腦神經元的活動特性。
什麼是決策?我們如何衡量不同選擇的價值?有統一的抉擇模型嗎?
楊天明:抉擇是一個很寬泛的概念,但是我們每時每刻都在進行抉擇——比如你看到這裡決定是否繼續讀下去,早晨選擇穿什麼衣服出門,我們無時無刻不在進行抉擇。目前來說,抉擇是由大腦中不同腦區、不同系統、不同環路以不同的方式進行處理的,目前並沒用統一的模型來解釋各種各樣的抉擇,需要根據具體的問題來決定。
儘管我們進行抉擇的方式多種多樣,但是通常情況下,我們做抉擇都會遵從趨利避害的原則,即在進行選擇的時候我們傾向於做出對自己有利的選擇,儘量避免蒙受損失——在這裡就涉及一個問題:什麼是有利的選擇?
一般來說,有利的抉擇意味著這個抉擇可以為我們帶來更多的價值,因此計算出每個抉擇的價值就十分重要。比如我們判斷某隻股票是否有價值、某個職業是否值得選擇等等,在我們進行抉擇去計算價值的時候,都需要獲取足夠多的資訊,以此判斷抉擇會為我們帶來的價值。
但是相對應的,大多數情況下我們無法獲取和掌握所有的資訊,所以我們的大腦往往會去尋找一個近似解,也就是價值估算能力。我們平時大多數的抉擇都是基於這種價值的估算能力做出的,我們每個人都有著自己的估算能力體系,這可能是人和人之間抉擇能力差異的一個關鍵因素。
價值估算不僅和人的先天資質有關,也和人的後天學習能力有關,比如一個人在一個領域裡面進行了長時間的學習和積累,就可以比從未接觸過這類資訊的人群做出更加準確的抉擇。
所以在大多數情況下,儘管我們沒有統一的模型進行抉擇,但是大腦會透過自己的價值估算體系來判斷每個選擇帶來的價值,並據此做出抉擇。
面對突如其來的意外情況,我們如何進行決策?
楊天明:在回答這個問題之前,我首先需要解釋一下人類的行為模式。通常情況下,我們的行為可以分為兩類,一類叫做習慣性行為,即大腦已經非常熟悉,能夠高效進行的行為模式。比如我每天上下班習慣乘地鐵,那麼我走到地鐵站,上下地鐵等等一整套行為都可以由大腦按照一種固有模式來進行。習慣性行為也包括我們對某些意外情況的應對,比如看到有東西飛來我們會下意識的閉眼等,這類有一套固有行為去應對的模式就叫做習慣性行為。
另一種行為模式則是目標導向性行為。在目標導向性行為這個模式當中,我們的行為是為了解決一個特定的問題或者一個特定的目標,而這個問題通常是我們不太熟悉的、用習慣性行為無法解決的。比方說我上班坐地鐵時,發現地鐵有故障,就需要換另一種交通方式,這時候大腦就會在這種不太熟悉的情景下做出判斷,並做出選擇和規劃。
目標導向性行為顧名思義,它是非常有目標性的,是為了達到某一個目標而進行的一系列行為,我們可能會為了這個目標倒推回來尋找解決方案。同時它非常靈活,可以幫助我們去應對之前我們從來沒有遇到過的問題,但是這也意味著大腦要做更多的計算,消耗更多的腦力。
日常生活中,我們主要依賴習慣性行為,僅僅在必要的時候才切換到目標導向性行為模式。我們的大腦也有對應的兩套系統去處理習慣性行為和目標導向性行為兩種不同的行為模式,並在兩者之間進行平衡,根據當前的場景來選取適合的行為模式。
在某些精神類疾病中,這兩種行為模式的之間平衡和調控可能會出現問題。比如在某些型別的強迫症中,患者可能會非常偏向於習慣性行為,他的固有行為模式非常難改變,甚至他能夠理解他現在不應該這樣做,但是因為他大腦中非常偏向於習慣性行為模式,從而依然選擇按照習慣性行為行動,造成了強迫性行為。
現在研究完成的抉擇機制,是否已經可以透過計算機模擬對人的抉擇進行判斷?
楊天明:神經領域經過多年的研究和發展,對於大腦中處理相對簡單的抉擇的神經環路已經有了相當的瞭解,同時也建立了對應的演算法和模型,來模擬人和動物的抉擇行為。比如比較經典的兩難抉擇。在兩難抉擇中,問題被限定在兩個選項之中,我們在兩者之間做出選擇。神經科學的研究發現,一個經典的模型叫做漂移擴散模型可以對兩難抉擇做出很好的解釋。它不僅可以幫助我們解釋抉擇的正確率,還可以幫助我們去解釋進行抉擇的時候會花費的時間——通常情況下我們花費的時間越多,我們做出抉擇的正確率也會有對應的升高。漂移擴散模型可以解釋我們在抉擇時間和抉擇正確率之間是如何選取一個平衡。不僅僅如此,漂移擴散模型還可以幫助我們推斷出做出抉擇時我們的信心是多少。最重要的是,大腦中與抉擇相關的腦區的神經元的活性也與漂移擴散模型非常吻合。
目前來說,我們也在設計一些人工智慧系統,希望它可以像人一樣做出抉擇。在這裡,“像人一樣”其實可能包含兩層含義。一方面,“像人一樣”需要計算機除了能做出正確的抉擇外,也能模擬人的錯誤抉擇。因為計算機如果要去真正的理解人類,就要理解人類為什麼會犯錯,只有能夠預測人類錯誤的時候,才可以幫助人們在未來減少錯誤發生的機率。另一方面,“像人一樣”需要計算機能夠有人的高度靈活、高度適應性的抉擇能力。計算機雖然有著強大的算力和非常強的儲存能力,但是人有非常強的適應能力,我們可以應付各種突發事件,而計算機往往會在一些人類看上去簡單的問題上出錯。這主要是因為現在計算機還不像人一樣擁有強大的學習和推理能力,計算機很大程度上依賴於程式或者神經網路的學習,如果一個事件沒有被程式設計師考慮到或者沒有出現在訓練場景下,計算機系統在做抉擇時就很可能會出現問題。但是人卻不一樣,人有著極強的適應能力,不管把人放在什麼環境中,人都擁有學習來提升自己的能力。所以,“像人一樣”就需要計算機有這種學習和提升自己來應對未知問題的能力。如果我們可以把計算機和人的決策能力結合在一起,那麼最終就有可能獲得一個具有更加強大和高效的抉擇能力的系統。
如果我們瞭解人類的決策機制,是否可以透過決策機制影響人們的最終決策?
楊天明:這是有可能發生的。人類的想象力是無窮的,這就使得人類可以對技術進行各種改造,從而發揮出不同的作用。比如近幾年出現的Neuromarketing,即神經市場學,就是透過將人類抉擇相關的神經機制的研究成果運用到市場營銷方面,從而更好的設計廣告和營銷來吸引顧客並改變大家的消費抉擇。
除此之外,另一個可能就是腦機介面。很多人對腦機介面的第一印象是透過讀取大腦的訊號來控制一些機器,比方說機械臂等運動系統的技術。但其實腦機介面也可以運用在抉擇過程中。比如現在在動物實驗當中,我們已經完全可以在動物做抉擇的時候去讀取大腦的訊號,來解碼動物的決策過程。我們還可以在動物做抉擇的時候,透過微電流刺激等技術來改變動物大腦神經元活性,去影響動物的抉擇。把類似的技術運用到人上也是完全可能的。但是在科學技術發展的同時,我們也需要去規範實驗的倫理問題,從而使得科學研究邁向對人類有益的方向。
目前很多APP會使用推薦演算法為使用者推薦相關的內容。推薦演算法機制是否會影響人的認知和決策?人是否會成為演算法的囚徒?
楊天明:目前APP推薦演算法是基於對應的大資料系統——根據很多人的資訊去收集人的喜好,並根據對應的資料分析去尋找人群中和你有類似喜好的人,並根據這些人的喜好資料去推薦你可能會喜歡的東西,從而形成一個資訊閉環——在你和你喜好類似的人群中,你們看到的東西也是類似的,而長期的看到類似的東西,又會進一步去增強這方面的喜好。
這樣發展下去的結果就是會逐漸形成人的資訊圈層,資訊圈層內的人們和資訊圈層之外的人溝通會越來越少——並且圈子之外的人可能喜好完全不一樣,而推薦系統並不會給你推薦圈子外面的東西,久而久之,你就只會生活在自己的圈子當中,而對其他的圈子完全沒有了解。這就會使得人的社交越來越侷限,使得人對世界的認知越來越片面。在這種情況下,侷限性的資訊分享和傳播就可能會對人的抉擇產生比較大的影響。
如果我們可以影響人的決策,我們又該如何理解意識和自由意志?這會對未來我們的生活帶來怎樣的影響?
楊天明:即使是現在的生活,我們在做各種各樣的抉擇時候已經很大程度上受到現代科技的一些影響,比如做很多事情前我們會經常掏出的手機去查一些資料,透過地圖導航,買東西前看點評等,這其實已經是一種運用現代科技來輔助我們做抉擇的一種方式,但目前為止,這些技術還沒有直接操縱我們的大腦,主要的抉擇過程還是在我們大腦當中完成,我們的手機或者電腦只是給我們提供了一些抉擇所依賴的資訊。
在未來,如果我們對大腦機制瞭解的更多的話,我們可以直接把這些資訊輸入到我們大腦當中,這就是現在的一些拓展現實或者叫增強現實的概念。在這種情況下,就像我們看到的一些科幻電影中場景,可以透過AI迅速的給東西添加註解,把相關資訊輸入到大腦當中,幫助大腦去做判斷——透過AI技術幫助人腦掌握更多的資訊,這是完全有可能的。
如果再往前進一步,我們可以想象:我們可以將判斷的過程直接省略,由AI系統直接做出判斷,告訴我們什麼是好、什麼是壞,從理論上來說,這也是完全有可能實現的——但是這本身就會涉及一系列的倫理問題:你是不是足夠信任你的AI系統來幫助你做判斷?對於AI的判斷,我們是盲從還是有選擇的接受?
雖然目前來說,我們的技術還沒有達到那個階段,不過關於倫理的討論應該儘早開始討論,以確保未來這些技術可以服務於我們,而不是給我們帶來危害。
此前我們採訪堯德中教授的時候,堯教授給我們留下了一個問題:我們當前實驗中所發現的生物腦中的高效資訊加工與處理機制,往往源於從微觀至介觀和宏觀的不同層次,而每個層次都具有一定的意義和科學價值。如何將不同觀測層次上的資訊處理機制有機整合起來,建立類腦智慧體系與框架?
楊天明:我覺得這個問題也許可以用David Marr的計算理論來回答。這個理論由David Marr於80年代提出:對於一個計算系統,我們可以從3個層次去理解。第一個層次是去理解這個系統要解決什麼問題;第二個層次是去理解為了解決這個問題系統採用何種的計算方法或演算法;第三個層次則是這個系統具體實現這些計算方法是怎樣在物理上實現的。
對於人腦來說,我們的大腦存在著一整套實現計算的高效的生物解決方案,它包括我們的神經細胞、突觸,還有各種分子基因等等,它是屬於David所說的第三層物理實現,這也是很多神經生物學家研究的重點。但是這些研究它一定要結合第二層的研究才有意義。也就是說,我們首先得確定我們大腦系統要實現什麼樣的演算法、做什麼樣的計算,才能真正理解生物上的實現為什麼是這樣的。而在演算法層面的研究還非常依賴於我們對問題的理解,我們首先要理解人的大腦所做的計算是為了解決什麼樣的問題,只有確定了這個問題之後,我們才可能對大腦的演算法有更加深入的理解。
所以我們在各個層次有各個層次需要考慮的不同的問題,只有當我們把三個層次的研究充分結合在一起,才能最終獲得對大腦的完整的理解。
楊天明:中國科學院神經科學研究所、腦科學與智慧技術卓越創新中心研究員,博士生導師。長期進行與高等認知與抉擇相關的各個腦區的功能及其相互作用的神經機制方面的研究。其研究以獼猴作為動物模型,運用神經電生理技術記錄大腦活動,研究大腦神經元在進行抉擇的過程中的神經計算的原理。這些研究包含了腦的許多功能區,如視皮層、前額葉、顳葉、枕葉、海馬等等,為解釋抉擇的神經機制,瞭解大腦各腦區之間的相互聯結和協作做出了貢獻。
嘉賓:楊天明
採訪:Aaron
編輯:EY
新京智庫
新京智庫是依託於新京報平臺成立的新型媒體智庫,我們著眼於自身立足北京的區位優勢,服務北京、面向全國、放眼世界。在國家政策解讀、政商學媒“四維一體”資源對接、城市案例研究和品牌傳播等方面,生產具有高度專業化、全球廣泛影響力的作品與研究成果,為政府、企業和行業機構提供一流的智力支援。