你有沒有過類似的經歷?
剛和朋友聊完想去海南,結果隔天就在app上看到一大堆關於海南旅遊的推送?
剛準備買個東西,結果首頁上全是關於它的推薦廣告......
現在的演算法模型都能已經能實現如此精準的推送了嗎?還是....APP真的在竊聽我們的生活?
關於APP帶來的不安全感,越來越多的人表示感覺壓力很大。
根據國家網路安全宣傳週去年9月釋出的《App安全意識公眾調查問卷報告》顯示,32萬名受訪者中,近三分之一的人表示很反感App的精準推送廣告行為,感覺遭到了窺探或偷聽。
過去,人們常說“你永遠不知道網線的另一端是人是狗”,現在,雖然依然不知道對方是人是狗,但對方知道你最近究竟需要糧食還是狗糧。英劇《黑鏡》裡,一個女孩因為過度思念去世的男友,憑藉著男友在社交網路上留下的全部痕跡,拼湊出了與他幾乎一模一樣的AI模型。目前來看,這彷彿就是現實生活的寫照----網際網路比我更懂我自己。
所以,回到最初的問題,普遍被使用者感知到的App偷拍偷錄現象,真的存在嗎?如果不存在,App又是透過什麼方式實現瞭如此高準確度的智慧推送呢?
事實上,早在兩年前,坊間就已經開始有App偷拍偷錄的傳言。
首當其衝的便是QQ瀏覽器和百度輸入法。當時,vivo Nex手機的前置攝像頭藏於手機內部,只有呼叫時才會升起,而使用者使用QQ瀏覽器時會明顯看到,小小的攝像頭模組被開啟了。同時,在百度輸入法介面沒有進行任何操作時,手機也會提示正在錄音。
隨後,QQ瀏覽器和百度輸入法分別解釋稱,沒有偷偷調取使用者的錄音和拍照功能,而是由於某些網站讀取攝像頭引數、輸入法進行語音麥克風預熱最佳化導致。
雖然QQ和百度官方都對此做了正面回應,但有關APP偷錄偷拍的傳言並沒有因此散去,人們對於產品依舊懷有許多猜疑。
那麼,偷拍偷錄在技術上到底是不是可實現的呢?
相關從事網路安全等領域的專家表示,偷拍偷錄在技術上是有可能實現的,但是,這種方式從經濟效益方面來講,並不划算。因為這不僅成本高昂、效率低下,還有很大的法律風險。
首先,這需要硬體裝置支援語音喚醒,並要求在嘈雜的現實環境下分辨方言、提高識別準確度。
其次,上傳超大的錄音檔案需要耗費大量流量,很難躲過使用者注意。
更現實的因素是,透過監聽來捕捉使用者喜好的成本極其高昂,從投入產出比來看公司沒有必要為此買單。
“通常來說,此類技術都有特定的應用場景,例如,經濟偵察,竊聽等,只會定向應用在重要人物上,這種高精尖的技術是不會大範圍地應用在普通商用領域的”-------周亞金
那麼,如果平臺側真的不曾採用“偷拍偷錄”等手段,如此精準的推送又是如何實現的呢?
如果把以上偷拍偷錄所獲取的資訊用作推薦參考,那麼這種方式獲取的資訊可以被當作直接資料,但其實,除去這一種方式之外,其他直接或間接獲取使用者資料,完善使用者畫像的方式還有很多。
個人資料等
在眾多資料當中,最常見的使用者資料來源就是個人資料、瀏覽資料、搜尋記錄等等,而這多個維度的資料足夠為使用者建立起一套完整的使用者畫像了,例如“男性、本科畢業、30歲、已婚......”
這套標籤體系的形成很可能極為複雜。周亞金舉例說,多個使用者每晚同一時段連線的Wi-Fi是同一個,那麼系統判斷大機率他們是一家人,推送的內容很可能會交叉共享。另外,即便使用者沒有給予一個App定位許可權,透過Wi-Fi同樣可以判斷出他的大致所在地,從而匹配當地的廣告。
嵌入在APP當中的SDK(軟體開發工具包)
SDK 的全稱是Software Development Kit ,翻譯過來就是軟體開發工具包。這是一個覆蓋面相當廣泛的名詞,可以這麼說:輔助開發某一類軟體的相關文件、範例和工具的集合都可以叫做SDK。它是App內提供特定功能或服務的外掛,比如廣告、支付、地圖等。SDK的意義在於,當開發者需要呼叫某項功能時,不需要從頭自行開發,只需要接入SDK即可。
所以,當App A和App B都採取了同一家廣告SDK時,那麼A和B內收集的資料都可能上傳至這一家SDK上,A與B之間天然形成了資料共享。你在A上的搜尋記錄和使用習慣有可能就會被反映在B上。因此,就會出現這樣的場景,你明明從來沒有在這個平臺搜尋過任何關於勞力士手錶的關鍵詞,但它卻反覆出現在這個平臺的首頁,而這背後的原因很可能就是你在另一個與這個平臺共享廣告SDK的平臺上曾經搜尋過。
手機輸入法
許多第三方輸入法會統計使用者詞頻資料,而這些資料理論上都可以賣給其他公司。如此一來,很有可能你前腳剛和朋友說完想買某件商品,後腳購物App上就把這件商品推至前排。即便是原本不屬於個人資訊的資料,在不斷匯聚之後,也可能會被髮掘出事物間不為人知的聯絡,從而分析出使用者的私密資訊。
所以,與其說是App偷拍偷聽,不如說是App‘猜你喜歡’猜得格外精準。很可能演算法你自己更懂你到底想要什麼。
近年來,使用者對於個人資訊保安愈加重視,這其實是個好現象,一方面越來越多人開始有意識地去保護個人資訊,另一方面也能夠倒逼相關法律法規的完善。但另一方面,很多人陷入了一個誤區,似乎一談到收集個人資訊就是完全錯誤的,但事實上App收集個人資訊在很多情況下也是為使用者服務。網際網路跨平臺的廣告推送所基於的資訊其實是針對裝置的使用者畫像,而不是個人具體可識別的資訊,例如手機號、身份證等。俗話說,燕過留痕,凡是隻用過的產品,必然會留下個人的痕跡,如果這些痕跡能夠被正當使用,又何嘗不是件好事兒?那些真正讓我們的個人資訊處於危險之中的其實並不是演算法,而是資料監管不力的商家、倒賣資訊的黑產和從中牟利的中間商。
“我們不是要完全禁止個性化廣告,如果不存在個性化廣告,那就只能回到傳統媒體的廣告時代了。”