記者 | 趙蘊嫻
編輯 | 黃月
今年“雙十一”購物節提前到來,網上掀起了一股“電飯煲測試”熱潮。測試規定,在某網購平臺上搜索“電飯煲”,檢索結果基本在三百元以下的就是“屌絲”,如在三百塊以上則可以脫離此列。檢索推薦結果與過往的消費行為有關,以前看的和買的越貴,現在搜到的電飯煲就越“上檔次”,這幾乎是人人都知道的大資料工作原理,也是電飯煲測試的基礎。
以檢索物品得到的價格高低來定位一個購買者的身份,無非是借用大資料為使用者繪製行為畫像。這種身份判定方式不僅過於武斷狹隘,演算法所生成的畫像也不能等同於一個人的實際購買力以及對電飯煲這一商品的支付意願,比如一個平時在衣飾或運動上有高消費的人,也不一定就想買一件高檔廚具。
當一些網友自嘲該購物平臺完全是高估了自己時,另一些人也在調侃著自己的“屌絲”身份。儘管很少有人嚴肅地對待這個測試,它還是給每個人明碼標價,按照消費潛力把人分為上下兩等。消費者希望借演算法的便利在“雙十一”買點實惠,演算法卻是“看人下菜碟”,早早建起了一條鄙視鏈。
電飯煲測試無傷大雅,但此種劃分人群並區別待之的做法已經對使用者權益以及社會公平造成了傷害,國內國外都有大量的案例可以證明這一點。在國內,新聞報道一些負債者在多款影片和遊戲軟體中收到貸款廣告,最後遭遇詐騙;在美國,一些窮人被營利性大學鎖定,對文憑的渴望將他們拽入債務的深淵。
如果說前兩個案例的受害者麻煩纏身又手頭沒錢,那麼“大資料殺熟”則將刀口對準了更大範圍的消費者。數學在現實生活中的應用刺激了經濟的增長,與此同時,混亂和風險也在倍增。美國數學家凱西·奧尼爾在《演算法霸權》中警告,以效益為首要目標的應用數學是一種“殺傷性武器”,它建立的模型不受噪聲干擾,不受威逼與利誘,自然也對不公和不幸充耳不聞。它事先假設了一套道理,以此來進行計算,再用產出結果去自證合理,不容置疑。
掠奪式廣告:擊中“痛點”,而非量身定造
按照各人的需求、喜好和能力來推薦商品,這不是很好嗎?畢竟,量身定製在過去是富人的特權,今天的演算法卻可以為所有人提供這種服務。這種想法難免顯得有些自作多情,因為演算法看到的是一群有相似行為和背景的人,而不是單獨的、有差別的個體。奧尼爾曾在一家廣告公司擔任資料科學家,她意識到,網際網路時代的廣告營銷與傳統廣告在本質上沒有太大區別——不需要每個受眾都買單,回應率達到1%就算成功;演算法只是提高了效率,它掌握海量資料,能更精準地找到潛在客戶並投放廣告,即便你不點開連結,廣告商也獲得了一條有價值的資料——你對這條廣告不感興趣——從而調整營銷策略。
更糟糕的是,某些廣告針對的不是“需求”,而是“痛點”。這一術語在廣告和網際網路行業中大肆流行,居家需要衛生紙這樣簡單的事情已經不能滿足商業增殖的慾望,一定要擊中痛點,深挖需求,才能獲取更多利益。對身材和容貌的焦慮、對貧困的恐懼以及對好日子的渴望,通通可以被當作痛點加以利用。依賴演算法所建立的強大平臺,掠奪式廣告誕生了。
“在人們既有迫切需求又對具體提資訊很無知的任何地方,你都能看到掠奪式廣告……它們大規模聚焦於社會中最絕望的那群人。”奧尼爾在《演算法霸權》中寫道。營利性大學的營銷即是典型案例之一。以科林斯大學為首的眾多營利性大學將自己的潛在學生鎖定為“孤立”“缺乏耐心”“低自尊”的人,他們可能是領取救濟金的單身媽媽、藥物成癮者、家暴受害者、精神疾病患者等等,美國職業培訓機構翡特羅特學院(Vatterott College)就曾將這些明文寫入發給招生人員的指導手冊。換句話說,如果你曾經在搜尋引擎裡檢索過上大學的相關資訊,或者在社交媒體上留下了脆弱的足跡,你就可能成為那個要被擊中痛點的物件。
破產前,科林斯大學的營銷團隊每年大概有1.2億美元的活動經費,他們把大部分錢投入谷歌和臉書,並運用這兩個網際網路巨頭的海量資料來設計多個相互競爭廣告,最終選定效果最好的那一個。自然語言處理技術的進步也助推了這一過程。花1.2億美元追蹤的240萬個客戶,最終能轉換出6萬名新生,回應率比1%還低,卻足以讓學校把高達6億美元的回報揣入囊中。
販賣焦慮、擊中痛點的做法並不新鮮,但正如奧尼爾所說,演算法覆蓋的人群之大,從根本上改變了這些做法的性質——從前是一小部分人受到欺騙,現在的規模卻足以拉大貧富差異,加劇不平等。她尖銳地指出,掠奪式廣告“以尋找不平等並大肆利用不平等為己任”,它們提供的大多不是享樂,而是關於改變的承諾,承諾一個階層晉升或解決眼前困境的機會,到頭來竹籃打水可能已屬不錯,債務加身更是尋常。商家引導客戶向未來借款,現在才能賺得更多。
在教育之外,掠奪式廣告猖獗的另一個領域是信貸。網際網路時代,個人銀行賬戶資訊就和其他隱私一樣被四處販賣,那些生活拮据、欠債或者急需用錢的人在困窘之時看見螢幕上彈出小廣告,心中也許覺得蹊蹺,但又亟需抓住僅有的救命稻草,最後的結局往往就是被高利貸捆綁或者遭到詐騙。今年3月,經營電器公司的程勇(化名)就抱著這樣的心態點開了手機某新聞客戶端飄出的貸款廣告,此時他剛好有一筆欠賬即將到期,在填寫了各種問卷和個人資訊後,他接到了一個電話,接下來發生的一切就和普通詐騙案類似。
與其責怪受害者輕信,是不是也應該問責登出該詐騙廣告的入口網站。據調查報道,詐騙團伙從經營不善的貸款公司那裡買來了營業執照、銀行對公賬戶等資訊,又從公民隱私販子手上買來私人資訊,找到潛在詐騙物件。為了獲取利益,入口網站廣告代理商們放寬了稽核標準,詐騙廣告就在幾種複雜程度不盡相同的演算法助推下飛了出去。
大資料殺熟:不受噪聲干擾的演算法,更公正還是更無情?
財務狀況差的人遭到演算法歧視,花錢更多也可能成為受鄙視的原因。“千人千價”的大資料殺熟即是如此。“殺熟”的物件一般是消費意願更高的人,可能買了會員,也可能習慣於訂價格相對高的機票或酒店,但系統會因為這些記錄給他推薦更貴的東西,隱藏便宜經濟的選項,或者就同款商品向其收取更高的費用、給定更低的優惠組合。據澎湃新聞統計,今年4-7月,黑貓投訴平臺收到了500多條關於大資料殺熟的投訴,其中有70%的人是在用不同賬號檢視同一物品時才發現了價格差。
上海人工智慧研究院數字化治理中心總監彭家昊與研究院執行院長宋海濤認為,大資料殺熟得以實施,主要是因為平臺與使用者資訊不對稱、政府缺乏有效的監控手段。差異化定價模式極為隱蔽,即使使用者後來有所察覺,往往也會因舉證難度大、維權成本高而放棄訴訟,與之相對應的則是平臺侵權的低成本。中國目前針對此問題的舉措大部分限於事後處罰,2020年12月22日, 國家市場監管總局聯合商務部組織召開規範社群團購秩序行政指導會,明確要求各大網路平臺嚴格遵守“九個不得”,禁止利用資料優勢進行殺熟行為,但很快又有平臺爆出殺熟案例。
若深究其中更根本性的原因,可能在於演算法對目標的執行比人類更堅決、更不受干擾。繼“偏差”之後,諾貝爾經濟學獎得主丹尼爾·卡尼曼與另外兩位決策領域的專家提出了“噪聲”的概念。偏差是思維在判斷時產生的系統性誤差,噪聲則是判斷中“不必要存在的變異”,比如當醫生們對同一位病人的病情各執一詞時,噪聲就產生了。借用這個概念來看大資料殺熟,我們可以發現,演算法有偏差,但不受噪聲影響,它既不真的對貧窮有情感和道德上的鄙視,也不會在富貴面前卑躬屈膝,於它而言,對待二者只不過需要採取不同的策略來謀取錢財,最終完成自己的目標。
卡尼曼等人認為,和偏差一樣,噪聲也可能導致嚴重的不公平問題,但比起既有偏差又有噪聲的人類判斷而言,演算法還是具有獨特的優勢——至少它可以排除噪聲的影響,至於偏差的部分,人類可以重新設計算法規則、找到更好的訓練資料,在理論上都可以讓演算法變得更好,儘管這一做法代價高昂。曾經深度參與金融工程的奧尼爾沒這麼樂觀,2008年的金融危機徹底改變了她對數學應用的看法:演算法促使“有著巨大缺陷的系統加速運轉”,更致命的是,它“像上帝一樣隱晦不明”,無辜的人不知自己錯在了哪裡,又投告無門,因為上帝的存在即自證了其裁判的合理性。在奧尼爾看來,演算法建立之初就假設了一套內建的邏輯來定義所處理的狀況,之後它再用這個定義去證明輸出結果的合理,因而有的模型即便出於好意也可能表現得剛愎自用,結果相當糟糕。
2007年,紐約華盛頓特區開發試用了一個叫做IMPACT的教師評估工具,希望透過處罰機制來刺激教師們提高業務水平,從而保障學生得到更好的教育。但仔細考慮一下,學生成績不夠好是因為教師水平不足,這個假設真的成立嗎?學生的家庭關係、生活狀況不也影響著他們的學習狀態嗎?IMPACT的運算結果基於一項簡化和扭曲了因果關係的假設,執行者卻將之混淆為實際情況,結果是兩個學年後,特區開除了評估排名墊底的206名教師,其中不乏學生和家長公認的好老師。IMPACT只需要開除教師就能證明自己工作的有效性,學生、老師和家長的真實反饋和訴求被當作噪聲遮蔽,這一點頗為諷刺。
我們固然可以像卡曼尼一樣,期待這類演算法不計成本地取得突破,更好地服務於人類,但面對那些目標不那麼善意,甚至不顧正義和群體福祉的演算法,又該怎麼辦呢?畢竟在現實生活中,造成巨大傷害的是那些人力排程系統和消費平臺,如果只考慮如何讓演算法臻於完善,而不正視目標性質及其背後的機制,人類所打造的也不過是一臺效率更高且對準自身的“收割機”。
參考資料:
《噪聲》. [以色列]丹尼爾·卡尼曼 [法]奧利維耶·西博尼 [美]卡斯·R.桑斯坦. 湛廬文化|浙江教育出版社. 2021-9
《演算法霸權》. [美] 凱西·奧尼爾. 中信出版集團. 2018-9
《關於大資料殺熟的法律治理探析 》
《貸款類詐騙網路廣告推廣黑灰產調查:騙子為何能遠端精準施騙 》
《投訴資料告訴你,“大資料殺熟”有哪些套路? 》
《市場監管總局聯合商務部召開規範社群團購秩序行政指導會 》
《網約車玩大資料“殺熟”2.0版:乘客變韭菜 演算法來收割 》