評論員觀察
提到爬蟲,不明所以的朋友可能會有生理上的排斥反應,其實“此蟲非彼蟲”。作為網路早期產物,爬蟲被如今網路上鋪天蓋地的程式設計培訓廣告“新瓶裝舊酒”,搖身一變為新興事物,也吸引不少眼球。然而,這一熱詞也頻頻出現在相關司法案件中,甚至有愈演愈烈之勢。
爬蟲,說白了就是資料抓取。它最早運用於搜尋引擎的資料收集,現已廣泛應用在網際網路產業各大領域,如資料收集整理和挖掘資訊等。同時,因相關程式設計技術不斷最佳化更新,使其技術難度有所降低,爬蟲技術也開始“平民化”,個人只需學習相應的程式碼,即可以運用這一技術。
以技術角度來說,爬蟲技術的優勢在於高效地為使用者從龐雜的資訊中獲取自己最需要的。但需要注意的是,爬蟲的底層邏輯並非單方面地收集,而是資料供給與索取應在你情我願的條件下促成。而當前的爭議在於,透過爬蟲技術來獲取資料時,這一行為是否會冒犯資料主體。從目前來看,不問自取的爬蟲行為仍是常態。
倘若只是收集表層資訊,倒也無傷大雅,但隨著資料價值日益凸顯,一些爬蟲技術開始“爬過界”,伸向底層資料,如企業核心資料、商業秘密等。此時,爬蟲與扒手無異。這不僅有違“互聯互通”的精神實質,損害健康的競爭機制,而且已觸及法律底線。
作為中立性技術,爬蟲本身並無明顯偏向,關鍵在於管好爬蟲技術的使用者。簡單來說,要清楚他怎麼用,用來做什麼,這樣做是否合理合法。其實,早期對此也有一個評價標準。網路爬蟲自發形成的“君子協定”——robots協議(網路爬蟲排除標準),告知了爬蟲者可為可不為。但君子協議難防小人。在利益面前,君子協定如同白紙一般無力。因此,要防止爬蟲“爬過界”,關鍵還在明確邊界與秩序,規制惡意爬蟲。
一方面,要進一步明晰法律邊界。針對當前存在的司法模糊地帶,要儘快研究出臺相應的法律法規,比如,對網路平臺或者個人透過技術手段抓取別的平臺數據時,可從結果導向來判斷其行為是否具有正當性。若存在不正當或惡意爬取行為,應當依法嚴懲,形成震懾。
另一方面,在互聯互通的語境下,也應構建相應的秩序。在提高法律底線的前提下,不妨將“君子協定”進一步最佳化完善,引導爬蟲技術有序運用。比如,允許資料生產者、控制者在一些不涉及核心價值的領域,進一步開放資料,讓爬蟲者基於規定協議,有序獲取;同樣,可透過許可使用、交換、購買等方式,共享相應的資料服務。如此一來,既符合互聯互通的價值導向,也可以減少爬取與反爬之間的惡性迴圈。
眼下,爬蟲技術所觸碰到的資料可能不只是其所有者,同樣會涉及個人使用者的隱私,這類資料集合還會牽涉到社會公共利益,這就更需要我們管好每位使用者,莫讓爬蟲變為“扒手”。 (陳文傑)