我們在搜尋的時候,搜尋引擎會記錄我們的唯一裝置id、搜尋時間、搜尋詞、搜尋點選的結果,甚至當你點選搜尋結果的時候,預設情況下還會把你的搜尋詞作為瀏覽器Referer的一部分分享給第三方站點。這個過程中,你的隱私被收集也被分享給了第三方,這個我們稱之為搜尋隱私洩露,search leakage。
現在某度做了一些調整,當你點選搜尋結果的時候,你其實點選的是百度的一箇中間link:比如
這裡每一個搜尋結果頁的連結均指向:baidu 自己的域名,比如:https://www.baidu.com/link?url=X6vZcKxW7Pc0VrKLDRFBV1GQNQS2xyujeXk0FU8oHuVU0LgAPRjinp-m8UVj7hgutLZeeCWjcgbwaPgyhzWA8K&wd=&eqid=8f721384000f9d2d0000000261acc9a7
url=xxxx 後面的這個引數就是被百度加密之後的url,透過http 302 跳轉得到 最終的網址:https://www.zhihu.com/topic/24774638/hot 在這個跳轉的過程中百度可以將使用者的搜尋詞和點選記錄儲存下來,並且跟使用者的唯一識別id關聯,然後把你的搜尋詞referer做成了百度雲裡面的付費API服務,目前網站想知道 referrer 資訊只能透過百度雲的搜尋關鍵詞 API,呼叫費是 1000 次 1 元。
具體原理如下圖:
所以,百度的無痕搜尋,只是不在你的電腦上留痕跡而已,伺服器端上仍然會收集,並且明碼標價賣給第三方網站,主要是廣告主。