新冠疫情暴發以來,很多人都關注到了一個值得思考的現象:世界各國在應對新冠的方式和政策上存在著明顯的差異。造成這種現象的原因是什麼呢?
如果把範圍縮小到歐洲,這種現象就更讓人困惑。這些歐洲國家在優先事項、主要目標、衛生系統、治理模式以及你能想到的幾乎所有方面都非常相似,但最終選擇的疫情應對政策有著巨大的差異。面對同樣的問題,他們想出了不同的解決方案。有些國家的疫情日增病例數字時不時衝上熱搜,有些國家卻能成為他國借鑑經驗的典範。
這種現象是如何造成的呢?最近,有一種新穎的觀點認為:並非這些國家不想做好防控措施,只是他們在制定決策的過程中受到了干擾,誤判了形勢,導致了決策的失敗。
研究這類現象的學者把這種決策中的干擾因素稱為“噪聲”,提出者是行為心理學家丹尼爾·卡尼曼。今年87歲高齡的丹尼爾·卡尼曼學術成果豐碩,他擅長把心理學研究和經濟學研究結合在一起,並在2002年獲得了諾貝爾經濟學獎。
人們在決策中為什麼會出錯?這一直是卡尼曼研究的主題。很多讀者都讀過他的著作《思考,快與慢》,這本書在2012年上市後長期出現在全球各類暢銷書榜單上。時隔近十年之後,卡尼曼和另外兩位作者共同完成了又一本面向大眾的著作《噪聲:人類判斷的缺陷》。
《噪聲:人類判斷的缺陷》, [以] 丹尼爾·卡尼曼 / [法] 奧利維耶·西博尼 / [美] 卡斯·R.桑斯坦著作,李紓/汪祚軍/魏子晗譯,湛廬文化|浙江教育出版社2021年9月。
《噪聲》在某種意義上可以視作《思考,快與慢》的續作。卡尼曼認為,人類決策中的錯誤是由“偏見”和“噪聲”組成的,《思考,快與慢》回答了“偏見”產生的根源,近期出版的《噪聲》則分析了另一個影響決策的因素。
《噪聲》指出,人們之所以常常會做出糟糕的決策,都源於忽略了“噪聲”對決策的影響,甚至是那些在激烈的競爭中已經勝出的組織也無法做出完全精準的決策。“噪聲”是影響人類判斷的黑洞。決策所在之處,就會有噪聲,噪聲遠比我們預期的要多。
卡尼曼在對談中說道,寫作這本書也想傳遞給讀者一個重要資訊:噪聲的存在告訴我們,人們彼此之間看待世界的方式是如此的迥異,差異之大遠遠超出了我們的預期。如此說來,《噪聲》的價值更在於提出問題。作為一種“人類不完美”的證據,如果噪聲註定是無法被消除的,那麼我們需要知道的,就是如何在適當的情境下減少噪聲,而在另一些情境下理解噪聲存在的必要性。
在下文的對話中,《噪聲》的兩位作者具體分析了為什麼決策中總是夾雜著“噪聲”,為什麼我們又意識不到它的存在。如今火熱的人工智慧與演算法,能否成為減少噪聲的解決方案?
對話《噪聲》作者
丹尼爾·卡尼曼 和 奧利維耶·西博尼
丹尼爾·卡尼曼(Daniel Kahneman),諾貝爾經濟學獎得主,美國總統自由勳章獲得者,《思考,快與慢》作者,普林斯頓大學尤金·希金斯心理學榮休教授,公共和國際事務學院教授,曾榮獲多項獎章,包括美國心理學學會頒贈的心理學終身貢獻獎。他的跨領域研究對經濟學、醫學、政治學、社會學、社會心理學、認知科學等領域都產生了深遠的影響,被譽為“行為經濟學之父”。
奧利維耶·西博尼(Olivier Sibony),巴黎高等商學院教授,牛津大學賽德商學院外籍教授,曾在全球最大的戰略諮詢公司——麥肯錫諮詢公司(McKinsey & Company)擔任資深合夥人長達25年時間。
1
為什麼世界各國應對新冠的方式差異巨大?
用“噪聲”概念來解釋
新京報:卡尼曼教授,很多中國讀者讀過你的熱銷作品《思考,快與慢》。你在這本書中分析了人類大腦下判斷的兩種模式,以此來解釋一個大家都非常關心的問題:決策行為中的偏差(bias)是如何產生的?而這次,你在《噪聲》中探討了另一個影響人類決策的重要因素:噪聲(noise)。你能解釋一下,什麼是“偏差”(bias),什麼又是“噪聲”(noise),兩者的根本區別在哪裡?
卡尼曼:為了解釋決策中的“偏差”與“噪聲”,我們首先要弄清楚這裡所說的“決策”(judgment)究竟指的是什麼。我們在書中把“決策”定義為一種測量方式,透過儀器對人類思維進行測量。這種對人類決策的測量直接借鑑於數學理論,就像我們測量一條線有多長,一件物體有多重一樣。
我們假設一下,如果你用一把精度特別高的尺子測量一條線的長度,重複多次之後,你不會得到完全相同的觀察結果。從這種現象中我們會發現亮點:首先,每次測量產生的誤差不會完全一樣。這種測量誤差的隨機變異現象(variability of errors),我們就稱之為“噪聲”(noise)。
此外,我們還可以發現,儘管每次測量都會產生誤差,但把誤差的正負數字相加在一起,結果是趨近於零的。但也會有些時候,我們會高估或低估了測量結果,就像浴室中一臺沒有校準過的體重秤。於是,我們稱測量誤差的平均值是有偏差的。“偏差”(bias)指的是測量中的平均誤差(average error)。
非常重要的是,我們在測量時,即使在偏差絕對不存在的情況下,測量的結果仍然會出現“噪聲”,也就是隨機變異的現象。多想想我們剛才提到的情景,反覆用高精度的尺測量一條線的長度,在偏差不存在的情況下,每一次測量仍然會產生噪聲。
這種“噪聲”現象不僅存在於物理測量的過程中,而且同樣大量出現在人類思維的決策過程中。這就是我們所說的:哪裡有判斷,哪裡就有噪聲,而且遠遠比你想象的更多。因為我們人類在面對問題時的判斷中永遠不可能達成完全的一致。
我們寫作這本書的初衷,是因為人類在決策中的分歧遠遠超過了他們的預期。然而目前幾乎所有的討論都在致力於消除決策中的偏差,這本書的目的是糾正一下平衡,徹底地探討一下被大家忽略的噪聲。
新京報:測量長度的比方對理解這組概念很有幫助。我們想知道的是,偏差與噪聲在實際決策情境中是如何體現的?比方說,新冠疫情的走勢是大多數人都在關心的重要話題。那麼,在新冠疫情的案例中,哪些是偏差?哪些又是噪聲呢?
西博尼:這場新冠危機中有很多關於“噪聲”和“偏差”的例子。不幸的是,如果你今天問10位專家,請他們預測某個國家在10天內會新增多少新冠病例,你就會得到10個不同的預測結果。當然,10天之後,我們就會知道這個問題的答案。我們取這10位專家預測結果的平均值,並將其與這10天實際發生的情況進行比較,我們就可以發現預測中存在的“偏差”。
這些誤差通常來自於專家們的悲觀性預測。專家預測某個地區在10天內會出現10000個新增病例,而實際結果經常只有8000例。當然也會出現過於樂觀的預測造成的誤差,但通常而言,新冠疫情日增病例的預測數字會比實際情況更多。這種預測中的平均誤差,就是我們所說的決策偏差。
此外,新冠疫情的預測中也存在著大量“噪聲”,也就是隨機變異的現象。我們假設,某個地區疫情防控政策可能依賴於某位專家的判斷,這位專家可能是你信任的人,或者是掌握最高權力的人,又或者是所在國家和地區流行病學部門的負責人。在這些不同的情境下,我們的判斷就會產生噪聲,這是新冠病例預測中比較簡單的例子。
還有一些更加複雜的例子。我們注意到,同時接受到相同疫情資訊的國家,在應對新冠疫情的方式上有著截然不同的反應。顯然,這些國家在做決策時都有相似的優先考慮事項:他們都在努力保護衛生系統,他們都在試圖使盡可能多的人免於生病和死亡,他們也都在想辦法不讓經濟受到新冠疫情的影響。因此,國家在制定新冠疫情政策時會有很多不同的目標,同時這些目標很難同時實現。
有些人會說,不同國家對新冠疫情的反應不同,是因為國家在權衡這些目標時有著不同的傾向。有些人把經濟放在更重要的位置,另一些人則認為拯救更多的生命是第一要務,還有些人更重視其他的目標。
事實上真是這樣的嗎?也許吧。但更有可能的是,這種現象反映了隨機變異的程度,也就是噪聲的大小。我們以歐洲國家為例。你會發現在制定新冠政策時,這些歐洲國家在優先事項、主要目標、衛生系統、治理模式以及你能想到的幾乎所有方面都非常相似,但最終選擇的疫情應對政策有著巨大的差異。面對同樣的問題,他們想出了不同的解決方案。這就是噪聲對決策的影響。這是我觀察到的現象,事實上類似的案例我們可以繼續說下去,因為新冠疫情的防控和預測中存在很多需要下判斷的情境。正如我們剛才所說,哪裡有判斷,哪裡就有噪聲。
新京報:你們在書中就噪聲現象舉了非常多的例子。這些決策跨越了不同的領域,從司法審判、保險理賠、醫學診斷、人事決策、產品預測、專利權授予政策,以及日常生活中的各種情境。造成這些決策失誤的原因都是相似的嗎?比如,法官裁決是否判死刑,以及我們決定投資哪一支股票,我們通常會認為,這兩種決策的思維過程是完全不同的。
西博尼:我們的研究試圖專注於所謂的“專業性判斷”(professional judgment),也就是審慎思考後做出的判斷。你在和朋友打電話時,門鈴突然響了,你會告訴朋友稍等一下。這種情境下的判斷是即時反應,而不是我們所說的專業性判斷。
所有的專業性決策中都會存在錯誤,我們認為它們都有一個共同點,我們把這些決策錯誤視為偏差和噪音的組合(決策錯誤=偏差+噪聲,error=bias + noise)。如你所說,這是否會低估有些領域的決策過程的重要性呢?比如,司法審判是否應該比保險理賠需要更加複雜、更加深思熟慮的決策過程呢?我認為是的。但我們仍然可以發現,經過專業培訓後的人士在各自領域做出的專業性判斷都是經過充分考慮過,就這一點而言,保險理賠、法醫鑑定科學、保釋裁決、精神病學診斷等領域的決策過程都有著共同點,所有的這些判斷中都會存在噪聲。
奧利維耶·西博尼(Olivier Sibony)為讀者錄製的影片。
2
“噪聲”這麼多,為什麼我卻聽不見?
“我們只生活在我們所理解的世界中”
新京報:你們反覆指出,決策中出現的噪聲,遠遠比我們意識到的要多得多。造成這種現象的原因是什麼呢?我們為什麼會對噪聲習以為常呢?
卡尼曼:當我們把某件事情視作習以為常的時候,通常包含了兩個含義:一、這件事是可預期的,二,這件事的發生不會讓我們感到驚訝。
世界上的噪聲比我們預期的要多,這是因為專業性判斷涉及對未來的預測。然而,人類不能在事先做出準確的預測,儘管有些人聲稱某種預測多麼科學嚴謹,這個世界將要發生的事多麼有跡可循,但實際上我們做不到。
人類沒有能力做出準確預測,只能在事情發生後嘗試去理解,並賦予事件以意義。舉例來說,你無法知道我的下一句話會說什麼。當我突然說出“How……”的時候,你可能會感到驚訝,因為你無法預測How後面的語句是什麼。當我說完整句話之後,你透過理解了這句話的意義,就不會再感到驚訝。換句話說,我們只生活在我們所理解的世界中,這是人類生活在這個世界上的方式。
我們會忽視身邊的噪聲,還有另外一個原因。我們總會認為自己對這個世界的判斷和感覺是正確的,因為這就是我們所能感覺和認識到的世界。進而我們也會認為,我們周圍的人也會以非常相似的方式看待這個世界。但事實上並非如此。
這也許是我們這本書最難傳達給讀者的資訊:最重要的問題是,人們看待世界的方式是如此的迥異,差異之大遠遠超出了我們的預期。我們把這種現象稱之為“決策個性”(judgment personality)。這就像世界上的人們彼此有著不同的個性,即使同一個家庭中的孩子,他們的性格差異也很大,甚至很難做出解釋。不同的人在決策過程中會展現出不同的“決策個性”,在面對相同情況時做出不同的反應,這是噪聲的來源之一,而大多數人都沒有意識到。
新京報:我注意到你們把噪聲定義為決策中“不受歡迎”的隨機變異。換句話說,有些決策中的不同聲音是可以容忍的,甚至是值得提倡的。如何做出這種區分呢?減少噪聲的過程是否會損害多元化意見的表達呢?
西博尼:這是一個重要的問題。我們應該清楚地區分需要重視多樣性的情境,以及那些不需要考慮多樣性的專業性判斷。
如果你諮詢同一家醫院中的兩位醫生,你給他們看你的 X光片,其中一位醫生說你得了癌症,另一位說這不是癌症。這和多元主義沒關係,只能說明這是一家糟糕的醫院。如果一個法庭的兩位法官對同一位嫌疑犯做出判決,一位法官的裁決是15天監禁,另一位法官則判15年刑期。這不是多元社會,只是一個由抽獎來實現正義的社會。
噪聲的問題不在於它減少了觀點的多元化,而在於噪聲在事實問題上造成了錯誤。噪聲在我們重視統一性的問題上造成了不公正的現象。你可以支援多元主義,並同時反對事實上的錯誤和不公正現象。
卡尼曼:在一些情境下,我們希望決策中存在著不一致的聲音。創造性工作中應該有多元的觀點,針對電影和書籍的評論最好是百花齊放。在另外一些情境下,我們不想要不一致的決策意見。這通常是我們在做出專業性判斷時,當專業人士代表一個組織機構來發表看法,您希望這個組織機構只用一種聲音來做出決策。
即使在我們明顯不要想噪聲的情境下,為減少噪聲而付出的代價可能會非常高。這種高昂的代價可能是花費大量的資金,打擊專業人士計程車氣,損害人的尊嚴或是一個機構的價值觀。因此有些情境下我們不得不忍受一些噪聲。這些問題都需要提前考慮,所以在降低噪聲的時候需要非常地謹慎。
3
錯的不是演算法,關鍵在於你怎麼用
新京報:我們剛才談到人們在決策中總是會存在各種噪聲,如果我們承認這一事實,就要想辦法解決問題。你們在書中多次指出,總體而言,人工智慧演算法能夠為人類做出更好的決策。這樣的結論是否意味著,用演算法代替人類決策是減少噪聲的辦法呢?
西博尼:演算法可以比人類做出更好的決策嗎?演算法是降低噪聲的解決方案嗎?這是兩個不同的問題,你可以在肯定第一個的同時,不認同第二個的說法。
演算法可以比人類做出更好的決策嗎?這個答案很簡單。如果你把人類做決策的結果與透過演算法、公式、數學模型、簡單的規則等做出的決策結果進行比較,你很快能夠得出結論,演算法總體上會比人類做出更好的決策。我們可以舉很多司法領域的例子,比如是否讓某人獲得保釋。進行對比之後,結果會非常讓人震驚,因為我們認為司法裁決是非常人性化的一件事。
我們有相當多的證據表明,演算法做得比人類更好,這很大程度上是演算法決策有更好的紀律性,演算法做決策的噪聲比較少。當你將同樣的問題交給機器兩次時,你就會得到相同的答案。現在出現的問題是,很多人不認同這一點。人們反對的並不是“演算法總體而言做得比人類更好”,這是一個無可爭辯的事實。人們反對的是“演算法被大量地運用”。
我們可以繼續討論司法審判。你可以相信演算法會在司法裁決中做出比人類更好的決策。但考慮到其他的價值,我們仍然會希望這些司法裁決是由一個活生生的人來做出的。在這個問題上,決策的準確性並不是唯一重要的事情。我們認為在法庭上向人類法官陳述案情,這關乎到人類的尊嚴。同時,基於司法系統的問責制原則,我們也需要有一個人類法官來主持司法審判。
順便提一下,即使最好的演算法有時也會犯一些低階錯誤,一些人類不可能犯的錯誤。這是正確的,但我們從來沒有考慮過人類也會犯各種錯誤,其中一些錯誤是非常愚蠢的,而且比演算法犯的錯誤更多。我們忘記了這些,因為我們只關注演算法犯的錯誤。
我們希望由人類而不是機器來做出決策的原因有很多,因為準確性不是唯一的目標。我們寫這本書的目的,並不是希望消除人類決策,並用演算法來代替它。我們希望讓人類決策在保留原來的所有優點的同時,擁有更好的紀律性,最後在決策結果上接近於演算法的準確度。我們稱之為“決策衛生”(decision hygiene),讓人類的判斷更有紀律,從而在實踐中減少噪聲,而不是在任何領域都用人工智慧演算法取而代之。
新京報:卡尼曼教授在此前採訪中,曾表達過“演算法是人類社會的未來”等類似的觀點。如今越來越多的演算法進入我們的生活,很多人開始擔心演算法帶來的問題,比如有學者提出的“資訊繭房”概念,包括演算法成為了資本剝削的幫兇,等等。你怎麼看待一個演算法社會的潛在風險?
卡尼曼:我想澄清的是,我所採取的立場非常簡單,即演算法將在人類生活中扮演越來越重要的角色。我們積累的資料越多,使用的演算法越多,我們就越有可能做出更好的判斷,提升決策的質量。在人類與演算法的競爭中,人類是大致保持不變的,我們並沒有變得更聰明。演算法每天都在變得更加智慧。所以結果很明顯,演算法正在趕上人類,而在一些領域,它們已經超過了人類。在決策過程的迴圈中,演算法會越來越多,因為它們更快,更準確。最後,人類只負責做出緊急狀態下的決策。
世界將因人工智慧和演算法而改變。其中有一些變化可能是有益的,另外一些幾乎肯定會是災難性的。我們可以很容易想象出一個好概念導致的壞結果。至於利和弊哪個更多一些,我不覺得有人可以做出預測,很顯然我肯定不行。
西博尼:我想補充一點。關於你剛才提到的“資訊繭房”、或者有些人提出的“過濾氣泡”(filter bubble)理論,存在一個很重要的問題。“資訊繭房”、“過濾氣泡”並非揭示了演算法的失敗,相反,它們恰好證明了演算法的成功。演算法推薦被設計出來,就是為了做到這一點。演算法沒有帶來壞處,實際上演算法做得非常好。演算法只是經過程式設計產生的,社交媒體公司利用演算法做一些事,這才產生了問題。問題不在於演算法,而在於社交媒體公司和他們想要實現的目標。
採寫|李永博
編輯|張婷
校對|柳寶慶