如果說Web2.0時代的全球資訊網是依靠關鍵字、頁面許可權、域許可權來識別內容,那麼由全球資訊網創始者Tim Berners-Lee提出的語義網(Semantic Web)則是讓機器能夠試影象人一樣能夠理解網際網路中的內容和語義。這將會是Web3.0與Web2.0一個本質的區別。
簡單舉個例子,在我國古代有個十分知名的典故,名為指鹿為馬,秦朝宦官趙高牽了一隻鹿,稱:“這是馬”。這句話在語法上沒有任何的錯誤,但我們知道,它在語義上是錯誤的,因為鹿不是馬。在全球資訊網中,是無法識別出這個語義上的錯誤的,因此,當這個資訊輸入到網際網路後,當我們檢索時,我們也會檢索的被稱為“馬”的“鹿”了。趙高能指鹿為馬是由於群臣懼怕他的權勢,而全球資訊網中的“指鹿為馬”便來自於機器無法識別語義的錯誤。
Web3.0中的語義網便可以成功識別出“鹿”並非是“馬”,機器能夠了解語義中的意思,並給出正確的答案。
語義網是一個以內容為核心的網際網路結構,這是當前全球資訊網中難以實現的。全球資訊網使用HTML表達內容,並透過控制網頁的顯示讓人們認為機器可以理解我們的意圖。比如當我們覺得網頁字型太小時,便可以控制字型顯示進行放大。這是HTML十分常用的方式,透過對文字內容的展現形式讓我們能夠以符合自己意願的方式瀏覽資訊,但實際上,HTML並不會在意文字本身的內容和含義。語義網對文字內容的注重,就像當我們想要閱讀魯迅的作品時,語義網會精準提供諸如《狂人日記》《阿Q正傳》等作品,而非提供一些對作品的評論等文章。
區塊鏈的出現讓以內容為主的語義網有了實現的契機,這也是區塊鏈被稱之為能夠帶動Web3.0時代到來的另一個重要因素。和傳統網際網路中對於資料檢索時採用的位置定址不同,區塊鏈採用的是被稱之為“內容定址”的檢索方式。
舉例來說,當我們需要找一本書時,位置定址會提供那本書所在的位置:位於市圖書館一樓左側第一排書架第三層左起第一本。這個位置十分精確,但是,那個位置上的書是否被借走,是否被粗心的圖書管理員放錯了位置,我們都不得而知。而內容定址,則會告訴你,那本書的名字叫做《xxx》,作者是xx,國際標準書號是XXX,透過這種指向書本具體內容的指引,我們便不會找到另一本不相干的書,也不會出現找不到的情況。
區塊鏈中的內容定址是透過雜湊演算法實現的,這是一種資料加密方式,它可以將任何資訊,無論是圖片、文字,還是音訊、影片,都編碼為一串隨機生成的256位的雜湊值。這個雜湊值和原始資訊具有唯一對應的關係,這意味著,任何原始資訊的改變,哪怕是一個標點符號,甚至保持內容不變的情況改變了原始資料編碼,最終生成的雜湊值都會發生巨大的變化。
區塊鏈中原始資料和雜湊值的唯一對應關係,只要將生成的雜湊值作為檢索地址,便可以讓內容定址可以十分輕鬆地實現。
Web3.0的語義網便是在區塊鏈的這種特點延伸下,讓機器理解人類的語言語義有了實現的可能。當然,語義網並非僅僅只是依靠區塊鏈便能完整實現的,它涉及的內容也同樣十分多而複雜,比如同樣作為核心的人工智慧演算法等。
語義網是對網際網路的一次革命,同時它也是一種長期發展的過程,並可能將延伸數個網路時代,最終形成一個高度智慧的“智慧網”。